NZ
Noah Zaitlen
Author with expertise in Genomic Studies and Association Analyses
University of California, Los Angeles, UCLA Health, University of California, San Francisco
+ 8 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
56
(29% Open Access)
Cited by:
66
h-index:
52
/
i10-index:
111
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
136

Cross-trait assortative mating is widespread and inflates genetic correlation estimates

Richard Border et al.Oct 24, 2023
+9
A
G
R
The observation of genetic correlations between disparate traits has been interpreted as evidence of widespread pleiotropy, altered theories of human genetic architecture, and spurred considerable research activity across the natural and social sciences. Here, we introduce cross-trait assortative mating (xAM) as an alternative explanation for observed genetic correlations. We observe that xAM is common across a broad array of phenotypes and that phenotypic cross-mate correlation estimates are strongly associated with genetic correlation estimates ( R 2 = 76%). Then, we present theoretical and simulation-based results demonstrating that, under xAM, genetic correlation estimators yield significant estimates even for traits with entirely distinct genetic bases. We demonstrate that existing xAM plausibly accounts for substantial fractions of genetic correlation estimates in two large samples ( N = 827,960). For example, previously reported genetic correlation estimates between many pairs of psychiatric disorders are fully consistent with xAM alone. Finally, we provide evidence for a history of xAM at the genetic level using a novel approach based on cross-trait even/odd chromosome polygenic score correlations. Together, our results demonstrate that previous reports have likely overestimated the true genetic similarity between many phenotypes.
32

Fast and powerful statistical method for context-specific QTL mapping in multi-context genomic studies

Andrew Lu et al.Oct 24, 2023
+4
M
M
A
Abstract Recent studies suggest that context-specific eQTLs underlie genetic risk factors for complex diseases. However, methods for identifying them are still nascent, limiting their comprehensive characterization and downstream interpretation of disease-associated variants. Here, we introduce FastGxC, a method to efficiently and powerfully map context-specific eQTLs by leveraging the correlation structure of multi-context studies. We first show via simulations that FastGxC is orders of magnitude more powerful and computationally efficient than previous approaches, making previously year-long computations possible in minutes. We next apply FastGxC to bulk multi-tissue and single-cell RNA-seq data sets to produce the most comprehensive tissue- and cell-type-specific eQTL maps to date. We then validate these maps by establishing that context-specific eQTLs are enriched in corresponding functional genomic annotations. Finally, we examine the relationship between context-specific eQTLs and human disease and show that FastGxC context-specific eQTLs provide a three-fold increase in precision to identify relevant tissues and cell types for GWAS variants than standard eQTLs. In summary, FastGxC enables the construction of context-specific eQTL maps that can be used to understand the context-specific gene regulatory mechanisms underlying complex human diseases.
0

GBAT: a gene-based association method for robust trans-gene regulation detection

Xuanyao Liu et al.May 7, 2020
+4
A
J
X
Abstract Identification of trans -eQTLs has been limited by a heavy multiple testing burden, read-mapping biases, and hidden confounders. To address these issues, we developed GBAT, a powerful gene-based method that allows robust detection of trans gene regulation. Using simulated and real data, we show that GBAT drastically increases detection of trans -gene regulation over standard trans -eQTL analyses.
139

Disentangling selection on genetically correlated polygenic traits using whole-genome genealogies

Aaron Stern et al.Oct 24, 2023
R
N
L
A
Abstract We present a full-likelihood method to estimate and quantify polygenic adaptation from contemporary DNA sequence data. The method combines population genetic DNA sequence data and GWAS summary statistics from up to thousands of nucleotide sites in a joint likelihood function to estimate the strength of transient directional selection acting on a polygenic trait. Through population genetic simulations of polygenic trait architectures and GWAS, we show that the method substantially improves power over current methods. We examine the robustness of the method under uncorrected GWAS stratification, uncertainty and ascertainment bias in the GWAS estimates of SNP effects, uncertainty in the identification of causal SNPs, allelic heterogeneity, negative selection, and low GWAS sample size. The method can quantify selection acting on correlated traits, fully controlling for pleiotropy even among traits with strong genetic correlation (| r g | = 80%; c.f. schizophrenia and bipolar disorder) while retaining high power to attribute selection to the causal trait. We apply the method to study 56 human polygenic traits for signs of recent adaptation. We find signals of directional selection on pigmentation (tanning, sunburn, hair, P =5.5e-15, 1.1e-11, 2.2e-6, respectively), life history traits (age at first birth, EduYears, P =2.5e-4, 2.6e-4, respectively), glycated hemoglobin (HbA1c, P =1.2e-3), bone mineral density ( P =1.1e-3), and neuroticism ( P =5.5e-3). We also conduct joint testing of 137 pairs of genetically correlated traits. We find evidence of widespread correlated response acting on these traits (2.6-fold enrichment over the null expectation, P =1.5e-7). We find that for several traits previously reported as adaptive, such as educational attainment and hair color, a significant proportion of the signal of selection on these traits can be attributed to correlated response, vs direct selection ( P =2.9e-6, 1.7e-4, respectively). Lastly, our joint test uncovers antagonistic selection that has acted to increase type 2 diabetes (T2D) risk and decrease HbA1c ( P =1.5e-5).
139
Paper
Citation8
0
Save
0

On the cross-population generalizability of gene expression prediction models

Kevin Keys et al.May 7, 2020
+17
M
A
K
Abstract The genetic control of gene expression is a core component of human physiology. For the past several years, transcriptome-wide association studies have leveraged large datasets of linked genotype and RNA sequencing information to create a powerful gene-based test of association that has been used in dozens of studies. While numerous discoveries have been made, the populations in the training data are overwhelmingly of European descent, and little is known about the generalizability of these models to other populations. Here, we test for cross-population generalizability of gene expression prediction models using a dataset of African American individuals with RNA-Seq data in whole blood. We find that the default models trained in large datasets such as GTEx and DGN fare poorly in African Americans, with a notable reduction in prediction accuracy when compared to European Americans. We replicate these limitations in cross-population generalizability using the five populations in the GEUVADIS dataset. Via realistic simulations of both populations and gene expression, we show that accurate cross-population generalizability of transcriptome prediction only arises when eQTL architecture is substantially shared across populations. In contrast, models with non-identical eQTLs showed patterns similar to real-world data. Therefore, generating RNA-Seq data in diverse populations is a critical step towards multi-ethnic utility of gene expression prediction. Author summary Advances in RNA sequencing technology have reduced the cost of measuring gene expression at a genome-wide level. However, sequencing enough human RNA samples for adequately-powered disease association studies remains prohibitively costly. To this end, modern transcriptome-wide association analysis tools leverage existing paired genotype-expression datasets by creating models to predict gene expression using genotypes. These predictive models enable researchers to perform cost-effective association tests with gene expression in independently genotyped samples. However, most of these models use European reference data, and the extent to which gene expression prediction models work across populations is not fully resolved. We observe that these models predict gene expression worse than expected in a dataset of African-Americans when derived from European-descent individuals. Using simulations, we show that gene expression predictive model performance depends on both the amount of shared genotype predictors as well as the genetic relatedness between populations. Our findings suggest a need to carefully select reference populations for prediction and point to a pressing need for more genetically diverse genotype-expression datasets.
0

Decoding directional genetic dependencies through orthogonal CRISPR/Cas screens

Michael Boettcher et al.May 6, 2020
+7
J
R
M
Summary Genetic interaction studies are a powerful approach to identify functional interactions between genes. This approach can reveal networks of regulatory hubs and connect uncharacterised genes to well-studied pathways. However, this approach has previously been limited to simple gene inactivation studies. Here, we present an orthogonal CRISPR/Cas-mediated genetic interaction approach that allows the systematic activation of one gene while simultaneously knocking out a second gene in the same cell. We have developed this concept into a quantitative and scalable combinatorial screening platform that allows the parallel interrogation of hundreds of thousands of genetic interactions. We demonstrate that the established platform works robustly to uncover genetic interactions in human cancer cells and to interpret the direction of the flow of genetic information.
0
Paper
Citation5
0
Save
1

Gene expression in African Americans and Latinos reveals ancestry-specific patterns of genetic architecture

Linda Kachuri et al.Oct 24, 2023
+16
D
A
L
ABSTRACT We analyzed whole genome and RNA sequencing data from 2,733 African American and Hispanic/Latino children to explore ancestry- and heterozygosity-related differences in the genetic architecture of whole blood gene expression. We found that heritability of gene expression significantly increases with greater proportion of African genetic ancestry and decreases with higher levels of Indigenous American ancestry, consistent with a relationship between heterozygosity and genetic variance. Among heritable protein-coding genes, the prevalence of statistically significant ancestry-specific expression quantitative trait loci (anc-eQTLs) was 30% in African ancestry and 8% for Indigenous American ancestry segments. Most of the anc-eQTLs (89%) were driven by population differences in allele frequency, demonstrating the importance of measuring gene expression across multiple populations. Transcriptome-wide association analyses of multi-ancestry summary statistics for 28 traits identified 79% more gene-trait pairs using models trained in our admixed population than models trained in GTEx. Our study highlights the importance of large and ancestrally diverse genomic studies for enabling new discoveries of complex trait architecture and reducing disparities.
1
Paper
Citation5
0
Save
1

Multi-omic approach associates blood methylome with bronchodilator drug response in pediatric asthma

Javier Pérez-García et al.Nov 25, 2023
+15
A
E
J
Albuterol is the drug most widely used as asthma treatment among African Americans despite having a lower bronchodilator drug response (BDR) than other populations. Although BDR is affected by gene and environmental factors, the influence of DNA methylation is unknown.This study aimed to identify epigenetic markers in whole blood associated with BDR, study their functional consequences by multi-omic integration, and assess their clinical applicability in admixed populations with a high asthma burden.We studied 414 children and young adults (8-21 years old) with asthma in a discovery and replication design. We performed an epigenome-wide association study on 221 African Americans and replicated the results on 193 Latinos. Functional consequences were assessed by integrating epigenomics with genomics, transcriptomics, and environmental exposure data. Machine learning was used to develop a panel of epigenetic markers to classify treatment response.We identified 5 differentially methylated regions and 2 CpGs genome-wide significantly associated with BDR in African Americans located in FGL2 (cg08241295, P = 6.8 × 10-9) and DNASE2 (cg15341340, P = 7.8 × 10-8), which were regulated by genetic variation and/or associated with gene expression of nearby genes (false discovery rate < 0.05). The CpG cg15341340 was replicated in Latinos (P = 3.5 × 10-3). Moreover, a panel of 70 CpGs showed good classification for those with response and nonresponse to albuterol therapy in African American and Latino children (area under the receiver operating characteristic curve for training, 0.99; for validation, 0.70-0.71). The DNA methylation model showed similar discrimination as clinical predictors (P > .05).We report novel associations of epigenetic markers with BDR in pediatric asthma and demonstrate for the first time the applicability of pharmacoepigenetics in precision medicine of respiratory diseases.
1

Multi-context genetic modeling of transcriptional regulation resolves novel disease loci

Michael Thompson et al.Oct 24, 2023
+6
A
M
M
Abstract A majority of the variants identified in genome-wide association studies fall in non-coding regions of the genome, indicating their mechanism of impact is mediated via gene expression. Leveraging this hypothesis, transcriptome-wide association studies (TWAS) have assisted in both the interpretation and discovery of additional genes associated with complex traits. However, existing methods for conducting TWAS do not take full advantage of the intra-individual correlation inherently present in multi-context expression studies and do not properly adjust for multiple testing across contexts. We developed CONTENT— a computationally efficient method with proper cross-context false discovery correction that leverages correlation structure across contexts to improve power and generate context-specific and context-shared components of expression. We applied CONTENT to bulk multi-tissue and single-cell RNA-seq data sets and show that CONTENT leads to a 42% (bulk) and 110% (single cell) increase in the number of genetically predicted genes relative to previous approaches. Interestingly, we find the context-specific component of expression comprises 30% of heritability in tissue-level bulk data and 75% in single-cell data, consistent with cell type heterogeneity in bulk tissue. In the context of TWAS, CONTENT increased the number of gene-phenotype associations discovered by over 47% relative to previous methods across 22 complex traits.
1

Seeing beyond the target: Leveraging off-target reads in targeted clinical tumor sequencing to identify prognostic biomarkers

Serghei Mangul et al.Oct 24, 2023
+2
S
J
S
Abstract Clinical tumor sequencing is rapidly becoming a standard component of clinical care, providing essential information for selecting amongst treatment options and providing prognostic value. Here we develop a robust and scalable software platform (SBT: Seeing Beyond the Target) that mines discarded components of clinical sequences to produce estimates of a rich set of omics features including rDNA and mtDNA copy number, microbial species abundance, and T and B cell receptor sequences. We validate the accuracy of SBT via comparison to multimodal data from the TCGA and apply SBT to a tumor panel cohort of 2,920 lung adenocarcinomas to identify associations of clinical value. We replicated known associations of somatic events in TP53 with changes in rDNA (p=0.012); as well as diversity of BCR and TCR repertoires with the biopsy site (p=2.5×10 −6 , p<10 −20 ). We observed striking differences in EGFR mutant lung cancers versus wild-type, including higher rDNA copy number and lower immune repertoire diversity. Integrating clinical outcomes, we identified significant prognostic associations with overall survival, including SBT estimates of 5S rDNA (p=1.9×10 −4 , hazard ratio = 1.22) and TCR diversity (p=2.7×10 −3 , hazard ratio=1.77). Both novel survival associations replicated in 1,302 breast carcinoma and 1,651 colorectal cancer tumors. We anticipate that feature estimates derived by SBT will yield novel biomarker hypotheses and open research opportunities in existing and emerging clinical tumor sequencing cohorts.
1
Paper
Citation3
0
Save
Load More