AB
Arjun Bhattacharya
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(50% Open Access)
Cited by:
89
h-index:
18
/
i10-index:
26
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Broad transcriptomic dysregulation occurs across the cerebral cortex in ASD

Michael Gandal et al.Nov 2, 2022
Abstract Neuropsychiatric disorders classically lack defining brain pathologies, but recent work has demonstrated dysregulation at the molecular level, characterized by transcriptomic and epigenetic alterations 1–3 . In autism spectrum disorder (ASD), this molecular pathology involves the upregulation of microglial, astrocyte and neural–immune genes, the downregulation of synaptic genes, and attenuation of gene-expression gradients in cortex 1,2,4–6 . However, whether these changes are limited to cortical association regions or are more widespread remains unknown. To address this issue, we performed RNA-sequencing analysis of 725 brain samples spanning 11 cortical areas from 112 post-mortem samples from individuals with ASD and neurotypical controls. We find widespread transcriptomic changes across the cortex in ASD, exhibiting an anterior-to-posterior gradient, with the greatest differences in primary visual cortex, coincident with an attenuation of the typical transcriptomic differences between cortical regions. Single-nucleus RNA-sequencing and methylation profiling demonstrate that this robust molecular signature reflects changes in cell-type-specific gene expression, particularly affecting excitatory neurons and glia. Both rare and common ASD-associated genetic variation converge within a downregulated co-expression module involving synaptic signalling, and common variation alone is enriched within a module of upregulated protein chaperone genes. These results highlight widespread molecular changes across the cerebral cortex in ASD, extending beyond association cortex to broadly involve primary sensory regions.
0
Citation85
-1
Save
1

Impact of cross-ancestry genetic architecture on GWAS in admixed populations

Rachel Mester et al.Jan 24, 2023
Genome-wide association studies (GWAS) have identified thousands of variants for disease risk. These studies have predominantly been conducted in individuals of European ancestries, which raises questions about their transferability to individuals of other ancestries. Of particular interest are admixed populations, usually defined as populations with recent ancestry from two or more continental sources. Admixed genomes contain segments of distinct ancestries that vary in composition across individuals in the population, allowing for the same allele to induce risk for disease on different ancestral backgrounds. This mosaicism raises unique challenges for GWAS in admixed populations, such as the need to correctly adjust for population stratification to balance type I error with statistical power. In this work we quantify the impact of differences in estimated allelic effect sizes for risk variants between ancestry backgrounds on association statistics. Specifically, while the possibility of estimated allelic effect-size heterogeneity by ancestry (HetLanc) can be modeled when performing GWAS in admixed populations, the extent of HetLanc needed to overcome the penalty from an additional degree of freedom in the association statistic has not been thoroughly quantified. Using extensive simulations of admixed genotypes and phenotypes we find that modeling HetLanc in its absence reduces statistical power by up to 72%. This finding is especially pronounced in the presence of allele frequency differentiation. We replicate simulation results using 4,327 African-European admixed genomes from the UK Biobank for 12 traits to find that for most significant SNPs HetLanc is not large enough for GWAS to benefit from modeling heterogeneity.
1
Citation3
0
Save
4

Evidence for the Placenta-Brain Axis: Multi-Omic Kernel Aggregation Predicts Intellectual and Social Impairment in Children Born Extremely Preterm

Hudson Santos et al.Jul 21, 2020
Abstract Background Children born extremely preterm are at heightened risk for intellectual and social impairment, including Autism Spectrum Disorder (ASD). There is increasing evidence for a key role of the placenta in prenatal developmental programming, suggesting that the placenta may explain origins of neurodevelopmental outcomes. Methods We examined associations between placental genomic and epigenomic profiles and assessed their ability to predict intellectual and social impairment at age 10 years in 379 children from the Extremely Low Gestational Age Newborn (ELGAN) cohort. Assessment of intellectual ability (IQ) and social function was completed with the Differential Ability Scales-II (DAS-II) and Social Responsiveness Scale (SRS), respectively. Examining IQ and SRS allows for studying ASD risk beyond the diagnostic criteria, as IQ and SRS are continuous measures strongly correlated with ASD. Genome-wide mRNA, CpG methylation and miRNA were assayed with the Illumina Hiseq 2500, HTG EdgeSeq miRNA Whole Transcriptome Assay, and Illumina EPIC/850K array, respectively. We conducted genome-wide differential mRNA/miRNA and epigenome-wide placenta analyses. These molecular features were integrated for a predictive analysis of IQ and SRS outcomes using kernel aggregation regression. We lastly examined associations between ASD and the genomically-predicted component of IQ and SRS. Results Genes with important roles in placenta angiogenesis and neural function were associated with intellectual and social impairment. Kernel aggregations of placental multi-omics strongly predicted intellectual and social function, explaining approximately 8% and 12% of the variance in SRS and IQ scores via cross-validation, respectively. Predicted in-sample SRS and IQ showed significant positive and negative associations with ASD case-control status. Limitations The ELGAN is a cohort of children born pre-term, andgeneralization may be affected by unmeasured confounders associated with low gestational age. We conducted external validation of predictive models, though the sample size of the out-sample dataset ( N = 49) and the scope of the available placental datasets are limited. Further validation of the models is merited. Conclusions Aggregating information from biomarkers within and between molecular data types improves prediction of complex traits like social and intellectual ability in children born extremely preterm, suggesting that traits influenced by the placenta-brain axis may be omnigenic.
4
Citation1
0
Save
0

An approach for normalization and quality control for NanoString RNA expression data

Arjun Bhattacharya et al.Apr 9, 2020
The NanoString RNA counting assay for formalin-fixed paraffin embedded samples is unique in its sensitivity, technical reproducibility, and robustness for analysis of clinical and archival samples. While commercial normalization methods are provided by NanoString, they are not optimal for all settings, particularly when samples exhibit strong technical or biological variation or where housekeeping genes have variable performance across the cohort. Here, we develop and evaluate a more comprehensive normalization procedure for NanoString data with steps for quality control, selection of housekeeping targets, normalization, and iterative data visualization and biological validation. The approach was evaluated using a large cohort (N = 1,649) from the Carolina Breast Cancer Study, two cohorts of moderate sample size (N = 359 and 130), and a small published dataset (N = 12). The iterative process developed here eliminates technical variation more reliably than the NanoString commercial package, without diminishing biological variation, especially in long-term longitudinal multi-phase or multi-site cohorts. We also find that probe sets validated for nCounter, such as the PAM50 gene signature, are impervious to batch issues. This work emphasizes that preprocessing of gene expression data is an important component of study design.### Competing Interest Statement
0

A framework for transcriptome-wide association studies in breast cancer in diverse study populations

Arjun Bhattacharya et al.Sep 14, 2019
Background : The relationship between germline genetic variation and breast cancer survival is largely unknown, especially in understudied minority populations who often have poorer survival. Genome-wide association studies (GWAS) have interrogated breast cancer survival but often are underpowered due to subtype heterogeneity and many clinical covariates and detect loci in non-coding regions that are difficult to interpret. Transcriptome-wide association studies (TWAS) show increased power in detecting functionally-relevant loci by leveraging expression quantitative trait loci (eQTLs) from external reference panels in relevant tissues. However, ancestry- or race-specific reference panels may be needed to draw correct inference in ancestrally-diverse cohorts. Such panels for breast cancer are lacking. Results : We provide a framework for TWAS for breast cancer in diverse populations, using data from the Carolina Breast Cancer Study (CBCS), a North Carolina population-based cohort that oversampled black women. We perform eQTL analysis for 406 breast cancer-related genes to train race-stratified predictive models of tumor expression from germline genotypes. Using these models, we impute expression in independent data from CBCS and TCGA, accounting for sampling variability in assessing performance. These models are not applicable across race, and their predictive performance varies across tumor subtype. Within CBCS (N = 3,828), at a false discovery-adjusted significance of 0.10 and stratifying for race, we identify associations in black women near AURKA , CAPN13 , PIK3CA , and SERPINB5 via TWAS that are underpowered in GWAS. Conclusions : We show that carefully implemented and thoroughly validated TWAS is an efficient approach for understanding the genetics underpinning breast cancer outcomes in diverse populations.
24

DeCompress: tissue compartment deconvolution of targeted mRNA expression panels using compressed sensing

Arjun Bhattacharya et al.Aug 14, 2020
ABSTRACT Targeted mRNA expression panels, measuring up to 800 genes, are used in academic and clinical settings due to low cost and high sensitivity for archived samples. Most samples assayed on targeted panels originate from bulk tissue comprised of many cell types, and cell-type heterogeneity confounds biological signals. Reference-free methods are used when cell-type-specific expression references are unavailable, but limited feature spaces render implementation challenging in targeted panels. Here, we present DeCompress , a semi-reference-free deconvolution method for targeted panels. DeCompress leverages a reference RNA-seq or microarray dataset from similar tissue to expand the feature space of targeted panels using compressed sensing. Ensemble reference-free deconvolution is performed on this artificially expanded dataset to estimate cell-type proportions and gene signatures. In simulated mixtures, four public cell line mixtures, and a targeted panel (1199 samples; 406 genes) from the Carolina Breast Cancer Study, DeCompress recapitulates cell-type proportions with less error than reference-free methods and finds biologically relevant compartments. We integrate compartment estimates into cis -eQTL mapping in breast cancer, identifying a tumor-specific cis -eQTL for CCR3 (C-C Motif Chemokine Receptor 3) at a risk locus. DeCompress improves upon reference-free methods without requiring expression profiles from pure cell populations, with applications in genomic analyses and clinical settings.
0

Discrimination Exposure and DNA Methylation of Stress-Related Genes in Latina Mothers

Hudson Santos et al.Apr 22, 2018
Latina mothers, who have the highest fertility rate among all ethnic groups in the US, are often exposed to discrimination. The biological impacts of this discrimination are unknown. This study is the first to explore the relationship between discrimination and DNA methylation of stress regulatory genes in Latinas. Our sample was Latina women (n = 147) with a mean age of 27.6 years who were assessed at 24-32 weeks gestation (T1) and 4-6 weeks postpartum (T2) and reside in the U.S. Blood was collected at T1, and the Everyday Discrimination Scale (EDS) was administered at T1 and T2. DNA Methylation at candidate gene regions was determined by bisulphite pyrosequencing. Associations between EDS and DNA methylation were assessed via zero-inflated Poisson models, adjusting for covariates and multiple-test comparisons. Discrimination was negatively associated with methylation at CpG sites within the glucocorticoid receptor (NR3C1) and brain-derived neurotrophic factor (BDNF) genes that were consistent over time. In addition, discrimination was negatively associated with methylation of a CpG in the glucocorticoid binding protein (FKBP5) at T1 but not at T2. This study underscores the complex biological pathways between discrimination and epigenetic modification in Latina women that warrant further investigation to better understand the genetic and psychopathological impact of discrimination on Latino mothers and their families.
0

Multi-omic strategies for transcriptome-wide prediction and association studies

Arjun Bhattacharya et al.Apr 18, 2020
Traditional predictive models for transcriptome-wide association studies (TWAS) consider only single nucleotide polymorphisms (SNPs) local to genes of interest and perform parameter shrinkage with a regularization process. These approaches ignore the effect of distal-SNPs or possible effects underlying the SNP-gene association. Here, we outline multi-omic strategies for transcriptome imputation from germline genetics for testing gene-trait associations by prioritizing distal-SNPs to the gene of interest. In one extension, we identify mediating biomarkers (CpG sites, microRNAs, and transcription factors) highly associated with gene expression and train predictive models for these mediators using their local SNPs. Imputed values for mediators are then incorporated into the final model as fixed effects with local SNPs to the gene included as regularized effects. In the second extension, we assess distal-eSNPs (SNPs in eQTLs) for their mediation effect through mediators local to these distal-eSNPs. Highly mediated distal-eSNPs are then included in the eventual transcriptomic prediction model. We show considerable gains in percent variance explained of gene expression and TWAS power to detect gene-trait associations using simulation analysis and real data applications with TCGA breast cancer data and in ROS/MAP brain tissue data. This integrative approach to transcriptome-wide imputation and association studies aids in understanding the complex interactions underlying genetic regulation within a tissue and identifying important risk genes for various traits and disorders.### Competing Interest StatementThe authors have declared no competing interest.