CC
Chao Chen
Author with expertise in Particle Physics and High-Energy Collider Experiments
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
39
(82% Open Access)
Cited by:
9,566
h-index:
52
/
i10-index:
231
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

ClinVar: improving access to variant interpretations and supporting evidence

Melissa Landrum et al.Nov 17, 2017
+19
M
J
M
ClinVar (https://www.ncbi.nlm.nih.gov/clinvar/) is a freely available, public archive of human genetic variants and interpretations of their significance to disease, maintained at the National Institutes of Health. Interpretations of the clinical significance of variants are submitted by clinical testing laboratories, research laboratories, expert panels and other groups. ClinVar aggregates data by variant-disease pairs, and by variant (or set of variants). Data aggregated by variant are accessible on the website, in an improved set of variant call format files and as a new comprehensive XML report. ClinVar recently started accepting submissions that are focused primarily on providing phenotypic information for individuals who have had genetic testing. Submissions may come from clinical providers providing their own interpretation of the variant (‘provider interpretation’) or from groups such as patient registries that primarily provide phenotypic information from patients (‘phenotyping only’). ClinVar continues to make improvements to its search and retrieval functions. Several new fields are now indexed for more precise searching, and filters allow the user to narrow down a large set of search results.
0
Citation3,224
0
Save
0

ClinVar: public archive of interpretations of clinically relevant variants

Melissa Landrum et al.Nov 17, 2015
+16
M
J
M
ClinVar (https://www.ncbi.nlm.nih.gov/clinvar/) at the National Center for Biotechnology Information (NCBI) is a freely available archive for interpretations of clinical significance of variants for reported conditions. The database includes germline and somatic variants of any size, type or genomic location. Interpretations are submitted by clinical testing laboratories, research laboratories, locus-specific databases, OMIM®, GeneReviews™, UniProt, expert panels and practice guidelines. In NCBI's Variation submission portal, submitters upload batch submissions or use the Submission Wizard for single submissions. Each submitted interpretation is assigned an accession number prefixed with SCV. ClinVar staff review validation reports with data types such as HGVS (Human Genome Variation Society) expressions; however, clinical significance is reported directly from submitters. Interpretations are aggregated by variant-condition combination and assigned an accession number prefixed with RCV. Clinical significance is calculated for the aggregate record, indicating consensus or conflict in the submitted interpretations. ClinVar uses data standards, such as HGVS nomenclature for variants and MedGen identifiers for conditions. The data are available on the web as variant-specific views; the entire data set can be downloaded via ftp. Programmatic access for ClinVar records is available through NCBI's E-utilities. Future development includes providing a variant-centric XML archive and a web page for details of SCV submissions.
0
Citation2,362
0
Save
0

Transcriptome-wide isoform-level dysregulation in ASD, schizophrenia, and bipolar disorder

Michael Gandal et al.Dec 13, 2018
+86
E
P
M
INTRODUCTION Our understanding of the pathophysiology of psychiatric disorders, including autism spectrum disorder (ASD), schizophrenia (SCZ), and bipolar disorder (BD), lags behind other fields of medicine. The diagnosis and study of these disorders currently depend on behavioral, symptomatic characterization. Defining genetic contributions to disease risk allows for biological, mechanistic understanding but is challenged by genetic complexity, polygenicity, and the lack of a cohesive neurobiological model to interpret findings. RATIONALE The transcriptome represents a quantitative phenotype that provides biological context for understanding the molecular pathways disrupted in major psychiatric disorders. RNA sequencing (RNA-seq) in a large cohort of cases and controls can advance our knowledge of the biology disrupted in each disorder and provide a foundational resource for integration with genomic and genetic data. RESULTS Analysis across multiple levels of transcriptomic organization—gene expression, local splicing, transcript isoform expression, and coexpression networks for both protein-coding and noncoding genes—provides an in-depth view of ASD, SCZ, and BD molecular pathology. More than 25% of the transcriptome exhibits differential splicing or expression in at least one disorder, including hundreds of noncoding RNAs (ncRNAs), most of which have unexplored functions but collectively exhibit patterns of selective constraint. Changes at the isoform level, as opposed to the gene level, show the largest effect sizes and genetic enrichment and the greatest disease specificity. We identified coexpression modules associated with each disorder, many with enrichment for cell type–specific markers, and several modules significantly dysregulated across all three disorders. These enabled parsing of down-regulated neuronal and synaptic components into a variety of cell type– and disease-specific signals, including multiple excitatory neuron and distinct interneuron modules with differential patterns of disease association, as well as common and rare genetic risk variant enrichment. The glial-immune signal demonstrates shared disruption of the blood-brain barrier and up-regulation of NFkB-associated genes, as well as disease-specific alterations in microglial-, astrocyte-, and interferon-response modules. A coexpression module associated with psychiatric medication exposure in SCZ and BD was enriched for activity-dependent immediate early gene pathways. To identify causal drivers, we integrated polygenic risk scores and performed a transcriptome-wide association study and summary-data–based Mendelian randomization. Candidate risk genes—5 in ASD, 11 in BD, and 64 in SCZ, including shared genes between SCZ and BD—are supported by multiple methods. These analyses begin to define a mechanistic basis for the composite activity of genetic risk variants. CONCLUSION Integration of RNA-seq and genetic data from ASD, SCZ, and BD provides a quantitative, genome-wide resource for mechanistic insight and therapeutic development at Resource.PsychENCODE.org. These data inform the molecular pathways and cell types involved, emphasizing the importance of splicing and isoform-level gene regulatory mechanisms in defining cell type and disease specificity, and, when integrated with genome-wide association studies, permit the discovery of candidate risk genes. The PsychENCODE cross-disorder transcriptomic resource. Human brain RNA-seq was integrated with genotypes across individuals with ASD, SCZ, BD, and controls, identifying pervasive dysregulation, including protein-coding, noncoding, splicing, and isoform-level changes. Systems-level and integrative genomic analyses prioritize previously unknown neurogenetic mechanisms and provide insight into the molecular neuropathology of these disorders.
0
Citation985
0
Save
0

Comprehensive functional genomic resource and integrative model for the human brain

Daifeng Wang et al.Dec 13, 2018
+89
J
S
D
Despite progress in defining genetic risk for psychiatric disorders, their molecular mechanisms remain elusive. Addressing this, the PsychENCODE Consortium has generated a comprehensive online resource for the adult brain across 1866 individuals. The PsychENCODE resource contains ~79,000 brain-active enhancers, sets of Hi-C linkages, and topologically associating domains; single-cell expression profiles for many cell types; expression quantitative-trait loci (QTLs); and further QTLs associated with chromatin, splicing, and cell-type proportions. Integration shows that varying cell-type proportions largely account for the cross-population variation in expression (with >88% reconstruction accuracy). It also allows building of a gene regulatory network, linking genome-wide association study variants to genes (e.g., 321 for schizophrenia). We embed this network into an interpretable deep-learning model, which improves disease prediction by ~6-fold versus polygenic risk scores and identifies key genes and pathways in psychiatric disorders.
0
Citation802
0
Save
0

Integrative functional genomic analysis of human brain development and neuropsychiatric risks

Mingfeng Li et al.Dec 14, 2018
+97
Y
G
M
INTRODUCTION The brain is responsible for cognition, behavior, and much of what makes us uniquely human. The development of the brain is a highly complex process, and this process is reliant on precise regulation of molecular and cellular events grounded in the spatiotemporal regulation of the transcriptome. Disruption of this regulation can lead to neuropsychiatric disorders. RATIONALE The regulatory, epigenomic, and transcriptomic features of the human brain have not been comprehensively compiled across time, regions, or cell types. Understanding the etiology of neuropsychiatric disorders requires knowledge not just of endpoint differences between healthy and diseased brains but also of the developmental and cellular contexts in which these differences arise. Moreover, an emerging body of research indicates that many aspects of the development and physiology of the human brain are not well recapitulated in model organisms, and therefore it is necessary that neuropsychiatric disorders be understood in the broader context of the developing and adult human brain. RESULTS Here we describe the generation and analysis of a variety of genomic data modalities at the tissue and single-cell levels, including transcriptome, DNA methylation, and histone modifications across multiple brain regions ranging in age from embryonic development through adulthood. We observed a widespread transcriptomic transition beginning during late fetal development and consisting of sharply decreased regional differences. This reduction coincided with increases in the transcriptional signatures of mature neurons and the expression of genes associated with dendrite development, synapse development, and neuronal activity, all of which were temporally synchronous across neocortical areas, as well as myelination and oligodendrocytes, which were asynchronous. Moreover, genes including MEF2C , SATB2 , and TCF4 , with genetic associations to multiple brain-related traits and disorders, converged in a small number of modules exhibiting spatial or spatiotemporal specificity. CONCLUSION We generated and applied our dataset to document transcriptomic and epigenetic changes across human development and then related those changes to major neuropsychiatric disorders. These data allowed us to identify genes, cell types, gene coexpression modules, and spatiotemporal loci where disease risk might converge, demonstrating the utility of the dataset and providing new insights into human development and disease. Spatiotemporal dynamics of human brain development and neuropsychiatric risks. Human brain development begins during embryonic development and continues through adulthood (top). Integrating data modalities (bottom left) revealed age- and cell type–specific properties and global patterns of transcriptional dynamics, including a late fetal transition (bottom middle). We related the variation in gene expression (brown, high; purple, low) to regulatory elements in the fetal and adult brains, cell type–specific signatures, and genetic loci associated with neuropsychiatric disorders (bottom right; gray circles indicate enrichment for corresponding features among module genes). Relationships depicted in this panel do not correspond to specific observations. CBC, cerebellar cortex; STR, striatum; HIP, hippocampus; MD, mediodorsal nucleus of thalamus; AMY, amygdala.
0
Citation656
0
Save
0

ClinVar: improvements to accessing data

Melissa Landrum et al.Oct 12, 2019
+19
G
S
M
Abstract ClinVar is a freely available, public archive of human genetic variants and interpretations of their relationships to diseases and other conditions, maintained at the National Institutes of Health (NIH). Submitted interpretations of variants are aggregated and made available on the ClinVar website (https://www.ncbi.nlm.nih.gov/clinvar/), and as downloadable files via FTP and through programmatic tools such as NCBI’s E-utilities. The default view on the ClinVar website, the Variation page, was recently redesigned. The new layout includes several new sections that make it easier to find submitted data as well as summary data such as all diseases and citations reported for the variant. The new design also better represents more complex data such as haplotypes and genotypes, as well as variants that are in ClinVar as part of a haplotype or genotype but have no interpretation for the single variant. ClinVar's variant-centric XML had its production release in April 2019. The ClinVar website and E-utilities both have been updated to support the VCV (variation in ClinVar) accession numbers found in the variant-centric XML file. ClinVar's search engine has been fine-tuned for improved retrieval of search results.
0
Citation655
0
Save
0

Removing Batch Effects in Analysis of Expression Microarray Data: An Evaluation of Six Batch Adjustment Methods

Chao Chen et al.Feb 28, 2011
+4
J
K
C
The expression microarray is a frequently used approach to study gene expression on a genome-wide scale. However, the data produced by the thousands of microarray studies published annually are confounded by “batch effects,” the systematic error introduced when samples are processed in multiple batches. Although batch effects can be reduced by careful experimental design, they cannot be eliminated unless the whole study is done in a single batch. A number of programs are now available to adjust microarray data for batch effects prior to analysis. We systematically evaluated six of these programs using multiple measures of precision, accuracy and overall performance. ComBat, an Empirical Bayes method, outperformed the other five programs by most metrics. We also showed that it is essential to standardize expression data at the probe level when testing for correlation of expression profiles, due to a sizeable probe effect in microarray data that can inflate the correlation among replicates and unrelated samples.
0
Citation488
0
Save
0

Genetic Control of Individual Differences in Gene-Specific Methylation in Human Brain

Dandan Zhang et al.Mar 1, 2010
+7
J
L
D
We have observed extensive interindividual differences in DNA methylation of 8590 CpG sites of 6229 genes in 153 human adult cerebellum samples, enriched in CpG island "shores" and at further distances from CpG islands. To search for genetic factors that regulate this variation, we performed a genome-wide association study (GWAS) mapping of methylation quantitative trait loci (mQTLs) for the 8590 testable CpG sites. cis association refers to correlation of methylation with SNPs within 1 Mb of a CpG site. 736 CpG sites showed phenotype-wide significant cis association with 2878 SNPs (after permutation correction for all tested markers and methylation phenotypes). In trans analysis of methylation, which tests for distant regulation effects, associations of 12 CpG sites and 38 SNPs remained significant after phenotype-wide correction. To examine the functional effects of mQTLs, we analyzed 85 genes that were with genetically regulated methylation we observed and for which we had quality gene expression data. Ten genes showed SNP-methylation-expression three-way associations—the same SNP simultaneously showed significant association with both DNA methylation and gene expression, while DNA methylation was significantly correlated with gene expression. Thus, we demonstrated that DNA methylation is frequently a heritable continuous quantitatively variable trait in human brain. Unlike allele-specific methylation, genetic polymorphisms mark both cis- and trans-regulatory genetic sites at measurable distances from their CpG sites. Some of the genetically regulated DNA methylation is directly connected with genetically regulated gene expression variation. We have observed extensive interindividual differences in DNA methylation of 8590 CpG sites of 6229 genes in 153 human adult cerebellum samples, enriched in CpG island "shores" and at further distances from CpG islands. To search for genetic factors that regulate this variation, we performed a genome-wide association study (GWAS) mapping of methylation quantitative trait loci (mQTLs) for the 8590 testable CpG sites. cis association refers to correlation of methylation with SNPs within 1 Mb of a CpG site. 736 CpG sites showed phenotype-wide significant cis association with 2878 SNPs (after permutation correction for all tested markers and methylation phenotypes). In trans analysis of methylation, which tests for distant regulation effects, associations of 12 CpG sites and 38 SNPs remained significant after phenotype-wide correction. To examine the functional effects of mQTLs, we analyzed 85 genes that were with genetically regulated methylation we observed and for which we had quality gene expression data. Ten genes showed SNP-methylation-expression three-way associations—the same SNP simultaneously showed significant association with both DNA methylation and gene expression, while DNA methylation was significantly correlated with gene expression. Thus, we demonstrated that DNA methylation is frequently a heritable continuous quantitatively variable trait in human brain. Unlike allele-specific methylation, genetic polymorphisms mark both cis- and trans-regulatory genetic sites at measurable distances from their CpG sites. Some of the genetically regulated DNA methylation is directly connected with genetically regulated gene expression variation.
0
Citation373
0
Save
4

Regional and cell type-specific afferent and efferent projections of the mouse claustrum

Quanxin Wang et al.Feb 24, 2022
+18
P
Y
Q
Summary The claustrum (CLA) is a conspicuous subcortical structure interconnected with cortical and subcortical regions. However, its regional anatomy and cell-type-specific connections in the mouse remain largely undetermined. Here, we accurately delineated the boundary of the mouse CLA and quantitatively investigated its inputs and outputs brain-wide using anterograde and retrograde viral tracing and fully reconstructed single claustral principal neurons. At a population level, the CLA reciprocally connects with all isocortical modules. It also receives inputs from at least 35 subcortical structures but sends projections back to only a few of them. We found that cell types projecting to the CLA are differentiated by cortical areas and layers. We classified single CLA principal neurons into at least 9 cell types that innervate the diverse sets of functionally linked cortical targets. Axons of interneurons within the CLA arborize along almost its entire anteroposterior extent. Together, this detailed wiring diagram of the cell-type-specific connections of the mouse CLA lays a foundation for studying its functions.
4
Citation4
0
Save
1

BrainEXP-NPD: a database of transcriptomic profiles of human brains of six neuropsychiatric disorders

Xia Chang-bin et al.May 31, 2021
+3
C
C
X
Abstract Background Spatio-temporal gene expression has been widely used to study gene functions and biological mechanisms in diseases. Numerous microarray and RNA sequencing data focusing on brain transcriptomes in neuropsychiatric disorders have accumulated. However, their consistency, reproducibility has not been properly evaluated. Except for a few psychiatric disorders, like schizophrenia, bipolar disorder and autism, most have not been compared to each other for cross-disorder comparisons. Methods We organized 48 human brain transcriptome datasets from six sources. The original brain donors include patients with schizophrenia (SCZ, N=427), bipolar disorder (BD, N=312), major depressive disorder (MDD, N=219), autism spectrum disorder (ASD, N=53), Alzheimer’s disease (AD, N=765), Parkinson’s disease (PD, N=163) as well as controls as unaffected by such disorders (CTRL, N=6,378), making it a total of 8,317 samples. Raw data included multiple brain regions of both sexes, with ages ranging from embryonic to seniors. After standardization, quality control, filtering and removal of known and unknown covariates, we performed comprehensive meta- and mega-analyses, including gene differential expression and gene co-expression network. Results A total of 6922, 3011, 2703, 4389, 3507, 4279 significantly differentially expressed genes (FDR q < 0.05) were detected in the comparisons of 6 brain regions of SCZ-CTRL, 5 brain regions of BD-CTRL, 6 brain regions of MDD-CTRL, 4 brain regions of ASD-CTRL, 7 brain regions of AD-CTRL, and 6 brain regions of PD-CTRL, respectively. Most differentially expressed genes were brain region-specific and disease-specific. SCZ and BD have a maximal transcriptome similarity in striatum (ρ=0.42) among the four brain regions, as measured by Spearman’s correlation of differential expression log2 FC values. SCZ and MDD have a maximal transcriptome similarity in hippocampus (ρ=0.30) among the five brain regions. BD and MDD have a maximal transcriptome similarity in frontal cortex (ρ=0.45) among the five brain regions. Other disease pairs have a less transcriptome similarity (ρ<0.1) in all brain regions. PD is negatively correlated with SCZ, BD, and MDD in cerebellum and striatum. We also performed coexpression network analyses for different disorders and controls separately. We developed a database named BrainEXP-NPD ( http://brainexpnpd.org:8088/BrainEXPNPD/ ), to provide a userfriendly web interface for accessing the data, and analytical results of meta- and mega-analyses, including gene differential expression and gene co-expression networks between cases and controls on different brain regions, sexes and age groups. Discussion: BrainEXP-NPD compiled the largest collection of brain transcriptomic data of major neuropsychiatric disorders and presented lists of differentially expressed genes and coexpression modules in multiple brain regions of six major disorders.
1
Citation2
0
Save
Load More