YJ
Yi Jiang
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
14
(71% Open Access)
Cited by:
2,049
h-index:
33
/
i10-index:
49
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Transcriptome-wide isoform-level dysregulation in ASD, schizophrenia, and bipolar disorder

Michael Gandal et al.Dec 13, 2018
INTRODUCTION Our understanding of the pathophysiology of psychiatric disorders, including autism spectrum disorder (ASD), schizophrenia (SCZ), and bipolar disorder (BD), lags behind other fields of medicine. The diagnosis and study of these disorders currently depend on behavioral, symptomatic characterization. Defining genetic contributions to disease risk allows for biological, mechanistic understanding but is challenged by genetic complexity, polygenicity, and the lack of a cohesive neurobiological model to interpret findings. RATIONALE The transcriptome represents a quantitative phenotype that provides biological context for understanding the molecular pathways disrupted in major psychiatric disorders. RNA sequencing (RNA-seq) in a large cohort of cases and controls can advance our knowledge of the biology disrupted in each disorder and provide a foundational resource for integration with genomic and genetic data. RESULTS Analysis across multiple levels of transcriptomic organization—gene expression, local splicing, transcript isoform expression, and coexpression networks for both protein-coding and noncoding genes—provides an in-depth view of ASD, SCZ, and BD molecular pathology. More than 25% of the transcriptome exhibits differential splicing or expression in at least one disorder, including hundreds of noncoding RNAs (ncRNAs), most of which have unexplored functions but collectively exhibit patterns of selective constraint. Changes at the isoform level, as opposed to the gene level, show the largest effect sizes and genetic enrichment and the greatest disease specificity. We identified coexpression modules associated with each disorder, many with enrichment for cell type–specific markers, and several modules significantly dysregulated across all three disorders. These enabled parsing of down-regulated neuronal and synaptic components into a variety of cell type– and disease-specific signals, including multiple excitatory neuron and distinct interneuron modules with differential patterns of disease association, as well as common and rare genetic risk variant enrichment. The glial-immune signal demonstrates shared disruption of the blood-brain barrier and up-regulation of NFkB-associated genes, as well as disease-specific alterations in microglial-, astrocyte-, and interferon-response modules. A coexpression module associated with psychiatric medication exposure in SCZ and BD was enriched for activity-dependent immediate early gene pathways. To identify causal drivers, we integrated polygenic risk scores and performed a transcriptome-wide association study and summary-data–based Mendelian randomization. Candidate risk genes—5 in ASD, 11 in BD, and 64 in SCZ, including shared genes between SCZ and BD—are supported by multiple methods. These analyses begin to define a mechanistic basis for the composite activity of genetic risk variants. CONCLUSION Integration of RNA-seq and genetic data from ASD, SCZ, and BD provides a quantitative, genome-wide resource for mechanistic insight and therapeutic development at Resource.PsychENCODE.org. These data inform the molecular pathways and cell types involved, emphasizing the importance of splicing and isoform-level gene regulatory mechanisms in defining cell type and disease specificity, and, when integrated with genome-wide association studies, permit the discovery of candidate risk genes. The PsychENCODE cross-disorder transcriptomic resource. Human brain RNA-seq was integrated with genotypes across individuals with ASD, SCZ, BD, and controls, identifying pervasive dysregulation, including protein-coding, noncoding, splicing, and isoform-level changes. Systems-level and integrative genomic analyses prioritize previously unknown neurogenetic mechanisms and provide insight into the molecular neuropathology of these disorders.
0
Citation985
0
Save
0

Transcriptome and epigenome landscape of human cortical development modeled in organoids

Anahita Amiri et al.Dec 14, 2018
INTRODUCTION The human cerebral cortex has undergone an extraordinary increase in size and complexity during mammalian evolution. Cortical cell lineages are specified in the embryo, and genetic and epidemiological evidence implicates early cortical development in the etiology of neuropsychiatric disorders such as autism spectrum disorder (ASD), intellectual disabilities, and schizophrenia. Most of the disease-implicated genomic variants are located outside of genes, and the interpretation of noncoding mutations is lagging behind owing to limited annotation of functional elements in the noncoding genome. RATIONALE We set out to discover gene-regulatory elements and chart their dynamic activity during prenatal human cortical development, focusing on enhancers, which carry most of the weight upon regulation of gene expression. We longitudinally modeled human brain development using human induced pluripotent stem cell (hiPSC)–derived cortical organoids and compared organoids to isogenic fetal brain tissue. RESULTS Fetal fibroblast–derived hiPSC lines were used to generate cortically patterned organoids and to compare oganoids’ epigenome and transcriptome to that of isogenic fetal brains and external datasets. Organoids model cortical development between 5 and 16 postconception weeks, thus enabling us to study transitions from cortical stem cells to progenitors to early neurons. The greatest changes occur at the transition from stem cells to progenitors. The regulatory landscape encompasses a total set of 96,375 enhancers linked to target genes, with 49,640 enhancers being active in organoids but not in mid-fetal brain, suggesting major roles in cortical neuron specification. Enhancers that gained activity in the human lineage are active in the earliest stages of organoid development, when they target genes that regulate the growth of radial glial cells. Parallel weighted gene coexpression network analysis (WGCNA) of transcriptome and enhancer activities defined a number of modules of coexpressed genes and coactive enhancers, following just six and four global temporal patterns that we refer to as supermodules, likely reflecting fundamental programs in embryonic and fetal brain. Correlations between gene expression and enhancer activity allowed stratifying enhancers into two categories: activating regulators (A-regs) and repressive regulators (R-regs). Several enhancer modules converged with gene modules, suggesting that coexpressed genes are regulated by enhancers with correlated patterns of activity. Furthermore, enhancers active in organoids and fetal brains were enriched for ASD de novo variants that disrupt binding sites of homeodomain, Hes1, NR4A2, Sox3, and NFIX transcription factors. CONCLUSION We validated hiPSC-derived cortical organoids as a suitable model system for studying gene regulation in human embryonic brain development, evolution, and disease. Our results suggest that organoids may reveal how noncoding mutations contribute to ASD etiology. Summary of the study, analyses, and main results. Data were generated for iPSC-derived human telencephalic organoids and isogenic fetal cortex. Organoids modeled embryonic and early fetal cortex and show a larger repertoire of enhancers. Enhancers could be divided into activators and repressors of gene expression. We derived networks of modules and supermodules with correlated gene and enhancer activities, some of which were implicated in autism spectrum disorders (ASD).
0
Citation258
0
Save
8

Brain transcriptional regulatory architecture and schizophrenia etiology converge between East Asian and European ancestral populations

Sihan Liu et al.Feb 5, 2021
Abstract Understanding the genetic architecture of gene expression and splicing in human brain is critical to unlocking the mechanisms of complex neuropsychiatric disorders like schizophrenia (SCZ). Large-scale brain transcriptomic studies are based primarily on populations of European (EUR) ancestry. The uniformity of mono-racial resources may limit important insights into the disease etiology. Here, we characterized brain transcriptional regulatory architecture of East Asians (EAS; n=151), identifying 3,278 expression quantitative trait loci (eQTL) and 4,726 spliceQTL (sQTL). Comparing these to PsychENCODE/BrainGVEX confirmed our hypothesis that the transcriptional regulatory architecture in EAS and EUR brains align. Furthermore, distinctive allelic frequency and linkage disequilibrium impede QTL translation and gene-expression prediction accuracy. Integration of eQTL/sQTL with genome-wide association studies reveals common and novel SCZ risk genes. Pathway-based analyses showing shared SCZ biology point to synaptic and GTPase dysfunction as a prospective pathogenesis. This study elucidates the transcriptional landscape of the EAS brain and emphasizes an essential convergence between EAS and EUR populations.
8
Citation2
0
Save
11

SMAP: A pipeline for sample matching in proteogenomics

Ling Li et al.Sep 20, 2021
Abstract Integration of genomics and proteomics (proteogenomics) offers unprecedented promise for in-depth understanding of human diseases. However, sample mix-up is a pervasive, recurring problem, due to complex sample processing in proteogenomics. Here we present a pipeline for S ample Ma tching in P roteogenomics (SMAP) for verifying sample identity to ensure data integrity. SMAP infers sample-dependent protein-coding variants from quantitative mass spectrometry (MS), and aligns the MS-based proteomic samples with genomic samples by two discriminant scores. Theoretical analysis with simulation data indicates that SMAP is capable of uniquely match proteomic and genomic samples, when ≥20% genotypes of individual samples are available. When SMAP was applied to a large-scale proteomics dataset from 288 biological samples generated by the PsychENCODE BrainGVEX project, we identified and corrected 18.8% (54/288) mismatched samples. The correction was further confirmed by ribosome profiling and assay for transposase-accessible chromatin sequencing data from the same set of samples. Thus our results demonstrate that SMAP is an effective tool for sample verification in a large-scale MS-based proteogenomics study. The source code, manual, and sample data of the SMAP are publicly available at https://github.com/UND-Wanglab/SMAP , and a web-based SMAP can be accessed at https://smap.shinyapps.io/smap/ .
0

MethylGenotyper: Accurate Estimation of SNP Genotypes and Genetic Relatedness from DNA Methylation Data

Yi Jiang et al.Jun 1, 2024
Abstract Epigenome-wide association studies (EWAS) are susceptible to widespread confounding caused by population structure and genetic relatedness. Nevertheless, kinship estimation is challenging in EWAS without genotyping data. Here, we proposed MethylGenotyper, a method that for the first time enables accurate genotyping at thousands of single nucleotide polymorphisms (SNPs) directly from commercial DNA methylation microarrays. We modeled the intensities of methylation probes near SNPs with a mixture of three beta distributions corresponding to different genotypes and estimated parameters with an expectation-maximization algorithm. We conducted extensive simulations to demonstrate the performance of the method. When applying MethylGenotyper to the Infinium EPIC array data of 4662 Chinese samples, we obtained genotypes at 4319 SNPs with a concordance rate of 98.26%, enabling the identification of 255 pairs of close relatedness. Furthermore, we showed that MethylGenotyper allows for the estimation of both population structure and cryptic relatedness among 702 Australians of diverse ancestry. We also implemented MethylGenotyper in a publicly available R package (https://github.com/Yi-Jiang/MethylGenotyper) to facilitate future large-scale EWAS.
6

The impact of common variants on gene expression in the human brain: from RNA to protein to schizophrenia risk

Qiuman Liang et al.Jun 5, 2023
The impact of genetic variants on gene expression has been intensely studied at the transcription level, yielding in valuable insights into the association between genes and the risk of complex disorders, such as schizophrenia (SCZ). However, the downstream impact of these variants and the molecular mechanisms connecting transcription variation to disease risk are not well understood.We quantitated ribosome occupancy in prefrontal cortex samples of the BrainGVEX cohort. Together with transcriptomics and proteomics data from the same cohort, we performed cis-Quantitative Trait Locus (QTL) mapping and identified 3,253 expression QTLs (eQTLs), 1,344 ribosome occupancy QTLs (rQTLs), and 657 protein QTLs (pQTLs) out of 7,458 genes quantitated in all three omics types from 185 samples. Of the eQTLs identified, only 34% have their effects propagated to the protein level. Further analysis on the effect size of prefrontal cortex eQTLs identified from an independent dataset showed clear post-transcriptional attenuation of eQTL effects. To investigate the biological relevance of the attenuated eQTLs, we identified 70 expression-specific QTLs (esQTLs), 51 ribosome-occupancy-specific QTLs (rsQTLs), and 107 protein-specific QTLs (psQTLs). Five of these omics-specific QTLs showed strong colocalization with SCZ GWAS signals, three of them are esQTLs. The limited number of GWAS colocalization discoveries from omics-specific QTLs and the apparent prevalence of eQTL attenuation prompted us to take a complementary approach to investigate the functional relevance of attenuated eQTLs. Using S-PrediXcan we identified 74 SCZ risk genes, 34% of which were novel, and 67% of these risk genes were replicated in a MR-Egger test. Notably, 52 out of 74 risk genes were identified using eQTL data and 70% of these SCZ-risk-gene-driving eQTLs show little to no evidence of driving corresponding variations at the protein level.The effect of eQTLs on gene expression in the prefrontal cortex is commonly attenuated post-transcriptionally. Many of the attenuated eQTLs still correlate with SCZ GWAS signal. Further investigation is needed to elucidate a mechanistic link between attenuated eQTLs and SCZ disease risk.
0

Evaluation and optimization of six adsorbents for removal of tetracycline from swine wastewater: Experiments and response surface analysis

Haodong Zhao et al.Sep 1, 2024
The removal of tetracycline antibiotics using adsorbents is becoming an environmentally friendly and cost-effective method. This study systematically analyzed the stability, structure, morphology, and chemical properties of various adsorbents. Batch adsorption experiments (pH, time, temperature, tetracycline concentration, and adsorbent dosage) were conducted to compare the adsorption capacity of the six adsorbents (biochar, activated carbon, montmorillonite, zeolite, chitosan, and polymerized aluminum chloride) for tetracycline removal. The results indicated that montmorillonite had the highest adsorption efficiency, followed by biochar, with chitosan showing the lowest efficiency. At an adsorbent dose of 25 g/L and an initial tetracycline concentration of 120 mg/L, the removal rates of tetracycline by montmorillonite, biochar, and chitosan were 97.6%, 69.3%, and 12.2%, respectively. Furthermore, the removal rate of tetracycline by biochar, following the response surface methodology optimal mode, increased by 5.5%. The Elovich model was better suited to explain the adsorption process of tetracycline compared to the conventional pseudo-first kinetic model and second-order kinetic model. The isothermal adsorption model suggested that both chemisorption and physisorption occurred in all removal processes, in which chemisorption dominated. Tetracycline was efficiently adsorbed through the combined effects of pore filling, electrostatic attraction, π-π interactions, and complexation reactions of surface functional groups. Additionally, montmorillonite demonstrated superior performance as an adsorbent for tetracycline removal from swine wastewater compared to the other adsorbents studied.
Load More