SZ
Siming Zhao
Author with expertise in Genomic Rearrangements and Copy Number Variations
Dartmouth College, University of Chicago, Massachusetts Eye and Ear Infirmary
+ 7 more
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
5
(0% Open Access)
Cited by:
0
h-index:
11
/
i10-index:
11
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Silencing Of Transposable Elements May Not Be A Major Driver Of Regulatory Evolution In Primate Induced Pluripotent Stem Cells

Michelle Ward et al.May 7, 2020
+4
K
S
M
Transposable elements (TEs) comprise a substantial proportion of primate genomes. The regulatory potential of TEs can result in deleterious effects, especially during development. It has been suggested that, in pluripotent stem cells, TEs are targeted for silencing by KRAB-ZNF proteins, which recruit the TRIM28-SETDB1 complex, to deposit the repressive histone modification H3K9me3. TEs, in turn, can acquire mutations that allow them to evade detection by the host, and hence KRAB-ZNF proteins need to rapidly evolve to counteract them. To investigate the short-term evolution of TE silencing, we profiled the genome-wide distribution of H3K9me3 in induced pluripotent stem cells from ten human and seven chimpanzee individuals. We performed chromatin immunoprecipitation followed by high-throughput sequencing (ChIP-seq) for H3K9me3, as well as total RNA sequencing. We focused specifically on cross-species H3K9me3 ChIP-seq data that mapped to four million orthologous TEs. We found that, depending on the TE class, 10-60% of elements are marked by H3K9me3, with SVA, LTR and LINE elements marked most frequently. We found little evidence of inter-species differences in TE silencing, with as many as 80% of orthologous, putatively silenced, TEs marked at similar levels in humans and chimpanzees. Our data suggest limited species-specificity of TE silencing across six million years of primate evolution. Interestingly, the minority of TEs enriched for H3K9me3 in one species are not more likely to be associated with gene expression divergence of nearby orthologous genes. We conclude that orthologous TEs may not play a major role in driving gene regulatory divergence between humans and chimpanzees.
0

Allele-specific open chromatin in human iPSC neurons elucidates functional non-coding disease variants

Siwei Zhang et al.May 7, 2020
+15
M
H
S
Functional interpretation of noncoding disease variants, which likely regulate gene expression, has been challenging. Chromatin accessibility strongly influences gene expression during neurodevelopment; however, to what extent genetic variants can alter chromatin accessibility in the context of brain disorders/traits is unknown. Using human induced pluripotent stem cell (iPSC)-derived neurons as a neurodevelopmental model, we identified abundant open-chromatin regions absent in adult brain samples and thousands of genetic variants exhibiting allele-specific open-chromatin (ASoC). ASoC variants are overrepresented in brain enhancers, transcription-factor-binding sites, and quantitative-trait-loci associated with gene expression, histone modification, and DNA methylation. Notably, compared to open chromatin regions and other commonly used functional annotations, neuronal ASoC variants showed much stronger enrichments of risk variants for various brain disorders/traits. Our study provides the first snapshot of the neuronal ASoC landscape and a powerful framework for prioritizing functional disease variants.
0

A Bayesian method for rare variant analysis using functional annotations and its application to Autism

Shengtong Han et al.May 7, 2020
+6
G
N
S
Rare genetic variants make significant contributions to human diseases. Compared to common variants, rare variants have larger effect sizes and are generally free of linkage disequilibrium (LD), which makes it easier to identify causal variants. Numerous methods have been developed to analyze rare variants in a gene or region in association studies, with the goal of finding risk genes by aggregating information of all variants of a gene. These methods, however, often make unrealistic assumptions, e.g. all rare variants in a risk gene would have non-zero effects. In practice, current methods for gene-based analysis often fail to show any advantage over simple single-variant analysis. In this work, we develop a Bayesian method: MIxture model based Rare variant Analysis on GEnes (MIRAGE). MIRAGE captures the heterogeneity of variant effects by treating all variants of a gene as a mixture of risk and non-risk variants, and models the prior probabilities of being risk variants as function of external information of variants, such as allele frequencies and predicted deleterious effects. MIRAGE uses an empirical Bayes approach to estimate these prior probabilities by combining information across genes. We demonstrate in both simulations and analysis of an exome-sequencing dataset of Autism, that MIRAGE significantly outperforms current methods for rare variant analysis. In particular, the top genes identified by MIRAGE are highly enriched with known or plausible Autism risk genes. Our results highlight several novel Autism genes with high Bayesian posterior probabilities and functional connections with Autism. MIRAGE is available at https://xinhe-lab.github.io/mirage .
0

A statistical framework for mapping risk genes from de novo mutations in whole-genome sequencing studies

Yuwen Liu et al.May 6, 2020
+17
A
Y
Y
Analysis of de novo mutations (DNMs) from sequencing data of nuclear families has identified risk genes for many complex diseases, including multiple neurodevelopmental and psychiatric disorders. Most of these efforts have focused on mutations in protein-coding sequences. Evidence from genome-wide association studies (GWAS) strongly suggests that variants important to human diseases often lie in non-coding regions. Extending DNM-based approaches to non-coding sequences is, however, challenging because the functional significance of non-coding mutations is difficult to predict. We propose a new statistical framework for analyzing DNMs from whole-genome sequencing (WGS) data. This method, TADA-Annotations (TADA-A), is a major advance of the TADA method we developed earlier for DNM analysis in coding regions. TADA-A is able to incorporate many functional annotations such as conservation and enhancer marks, learn from data which annotations are informative of pathogenic mutations and combine both coding and non-coding mutations at the gene level to detect risk genes. It also supports meta-analysis of multiple DNM studies, while adjusting for study-specific technical effects. We applied TADA-A to WGS data of ~300 autism family trios across five studies, and discovered several new autism risk genes. The software is freely available for all research uses.
0
0
Save
0

Model-based analysis of positive selection significantly expands the list of cancer driver genes, including RNA methyltransferases

Siming Zhao et al.May 7, 2020
+6
P
J
S
Identifying driver genes is a central problem in cancer biology and has received great attentions from researchers. However, existing methods for detecting driver genes from somatic mutation data struggle to distinguish positive selection signals from highly heterogeneous background mutational processes. Here, we present a powerful statistical approach, driverMAPS (Model-based Analysis of Positive Selection) for driver gene identification. The key feature of driverMAPS is its modeling of mutation rates at the base-level, reflecting both background mutational processes and positive selection. Its selection model captures elevated mutation rates in functionally important sites using multiple external annotations, as well as spatial clustering of mutations. Its background mutation model accounts for both known covariates and local, gene-specific, variation caused by unknown factors. Applying driverMAPS to TCGA data across 20 tumor types identified 159 new potential driver genes. Cross-referencing this list with data from external sources strongly supports these findings. The novel genes include the mRNA methytransferases METTL3-METTL14, and we experimentally validated the functional importance of somatic mutations in METTL3, confirming it as a potential tumor suppressor gene in bladder cancer.