HW
Heather Wheeler
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
20
(50% Open Access)
Cited by:
3,054
h-index:
34
/
i10-index:
61
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

A gene-based association method for mapping traits using reference transcriptome data

Eric Gamazon et al.Aug 10, 2015
Hae Kyung Im and colleagues report a method for predicting gene expression perturbations from genotype data after training on reference transcriptome data sets. Association of predicted gene expression with disease traits identifies known and new candidate disease genes. Genome-wide association studies (GWAS) have identified thousands of variants robustly associated with complex traits. However, the biological mechanisms underlying these associations are, in general, not well understood. We propose a gene-based association method called PrediXcan that directly tests the molecular mechanisms through which genetic variation affects phenotype. The approach estimates the component of gene expression determined by an individual's genetic profile and correlates 'imputed' gene expression with the phenotype under investigation to identify genes involved in the etiology of the phenotype. Genetically regulated gene expression is estimated using whole-genome tissue-dependent prediction models trained with reference transcriptome data sets. PrediXcan enjoys the benefits of gene-based approaches such as reduced multiple-testing burden and a principled approach to the design of follow-up experiments. Our results demonstrate that PrediXcan can detect known and new genes associated with disease traits and provide insights into the mechanism of these associations.
0
Citation1,615
0
Save
1

Integrating predicted transcriptome from multiple tissues improves association detection

Alvaro Barbeira et al.Jan 22, 2019
Integration of genome-wide association studies (GWAS) and expression quantitative trait loci (eQTL) studies is needed to improve our understanding of the biological mechanisms underlying GWAS hits, and our ability to identify therapeutic targets. Gene-level association methods such as PrediXcan can prioritize candidate targets. However, limited eQTL sample sizes and absence of relevant developmental and disease context restrict our ability to detect associations. Here we propose an efficient statistical method (MultiXcan) that leverages the substantial sharing of eQTLs across tissues and contexts to improve our ability to identify potential target genes. MultiXcan integrates evidence across multiple panels using multivariate regression, which naturally takes into account the correlation structure. We apply our method to simulated and real traits from the UK Biobank and show that, in realistic settings, we can detect a larger set of significantly associated genes than using each panel separately. To improve applicability, we developed a summary result-based extension called S-MultiXcan, which we show yields highly concordant results with the individual level version when LD is well matched. Our multivariate model-based approach allowed us to use the individual level results as a gold standard to calibrate and develop a robust implementation of the summary-based extension. Results from our analysis as well as software and necessary resources to apply our method are publicly available.
1
Citation295
0
Save
0

Association of an Inherited Genetic Variant With Vincristine-Related Peripheral Neuropathy in Children With Acute Lymphoblastic Leukemia

B Diouf et al.Feb 24, 2015

Importance

 With cure rates of childhood acute lymphoblastic leukemia (ALL) exceeding 85%, there is a need to mitigate treatment toxicities that can compromise quality of life, including peripheral neuropathy from vincristine treatment. 

Objective

 To identify genetic germline variants associated with the occurrence or severity of vincristine-induced peripheral neuropathy in children with ALL. 

Design, Setting, and Participants

 Genome-wide association study of patients in 1 of 2 prospective clinical trials for childhood ALL that included treatment with 36 to 39 doses of vincristine. Genome-wide single-nucleotide polymorphism (SNP) analysis and vincristine-induced peripheral neuropathy were assessed in 321 patients from whom DNA was available: 222 patients (median age, 6.0 years; range, 0.1-18.8 years) enrolled in 1994-1998 in the St Jude Children’s Research Hospital protocol Total XIIIB with toxic effects follow-up through January 2001, and 99 patients (median age, 11.4 years; range, 3.0-23.8 years) enrolled in 2007-2010 in the Children’s Oncology Group (COG) protocol AALL0433 with toxic effects follow-up through May 2011. Human leukemia cells and induced pluripotent stem cell neurons were used to assess the effects of lowerCEP72expression on vincristine sensitivity. 

Exposure

 Treatment with vincristine at a dose of 1.5 or 2.0 mg/m2

Main Outcomes and Measures

 Vincristine-induced peripheral neuropathy was assessed at clinic visits using National Cancer Institute criteria and prospectively graded as mild (grade 1), moderate (grade 2), serious/disabling (grade 3), or life threatening (grade 4). 

Results

 Grade 2 to 4 vincristine-induced neuropathy during continuation therapy occurred in 28.8% of patients (64/222) in the St Jude cohort and in 22.2% (22/99) in the COG cohort. A SNP in the promoter region of theCEP72gene, which encodes a centrosomal protein involved in microtubule formation, had a significant association with vincristine neuropathy (meta-analysisP = 6.3×10−9). This SNP had a minor allele frequency of 37% (235/642), with 50 of 321 patients (16%; 95% CI, 11.6%-19.5%) homozygous for the risk allele (TT at rs924607). Among patients with the high-riskCEP72genotype (TT at rs924607), 28 of 50 (56%; 95% CI, 41.2%-70.0%) developed at least 1 episode of grade 2 to 4 neuropathy, a higher rate than in patients with theCEP72CC or CT genotypes (58/271 patients [21.4%; 95% CI, 16.9%-26.7%];P = 2.4×10−6). The severity of neuropathy was greater in patients homozygous for the TT genotype compared with patients with the CC or CT genotype (2.4-fold by Poisson regression [P<.0001] and 2.7-fold based on mean grade of neuropathy: 1.23 [95% CI, 0.74-1.72] vs 0.45 [95% CI, 0.3-0.6];P = .004 byttest). ReducingCEP72expression in human neurons and leukemia cells increased their sensitivity to vincristine. 

Conclusions and Relevance

 In this preliminary study of children with ALL, an inherited polymorphism in the promoter region ofCEP72was associated with increased risk and severity of vincristine-related peripheral neuropathy. If replicated in additional populations, this finding may provide a basis for safer dosing of this widely prescribed anticancer agent.
0
Citation248
0
Save
0

Survey of the Heritability and Sparse Architecture of Gene Expression Traits Across Human Tissues

Heather Wheeler et al.Mar 15, 2016
Abstract Understanding the genetic architecture of gene expression traits is key to elucidating the underlying mechanisms of complex traits. Here, for the first time, we perform a systematic survey of the heritability and the distribution of effect sizes across all representative tissues in the human body. We find that local h 2 can be relatively well characterized with 59% of expressed genes showing significant h 2 (FDR < 0.1) in the DGN whole blood cohort. However, current sample sizes ( n ≤ 922) do not allow us to compute distal h 2 . Bayesian Sparse Linear Mixed Model (BSLMM) analysis provides strong evidence that the genetic contribution to local expression traits is dominated by a handful of genetic variants rather than by the collective contribution of a large number of variants each of modest size. In other words, the local architecture of gene expression traits is sparse rather than polygenic across all 40 tissues (from DGN and GTEx) examined. This result is confirmed by the sparsity of optimal performing gene expression predictors via elastic net modeling. To further explore the tissue context specificity, we decompose the expression traits into cross-tissue and tissue-specific components using a novel Orthogonal Tissue Decomposition (OTD) approach. Through a series of simulations we show that the cross-tissue and tissue-specific components are identifiable via OTD. Heritability and sparsity estimates of these derived expression phenotypes show similar characteristics to the original traits. Consistent properties relative to prior GTEx multi-tissue analysis results suggest that these traits reflect the expected biology. Finally, we apply this knowledge to develop prediction models of gene expression traits for all tissues. The prediction models, heritability, and prediction performance R 2 for original and decomposed expression phenotypes are made publicly available ( https://github.com/hakyimlab/PrediXcan ). Author Summary Gene regulation is known to contribute to the underlying mechanisms of complex traits. The GTEx project has generated RNA-Seq data on hundreds of individuals across more than 40 tissues providing a comprehensive atlas of gene expression traits. Here, we systematically examined the local versus distant heritability as well as the sparsity versus polygenicity of protein coding gene expression traits in tissues across the entire human body. To determine tissue context specificity, we decomposed the expression levels into cross-tissue and tissue-specific components. Regardless of tissue type, we found that local heritability, but not distal heritability, can be well characterized with current sample sizes. We found that the distribution of effect sizes is more consistent with a sparse local architecture in all tissues. We also show that the cross-tissue and tissue-specific expression phenotypes constructed with our orthogonal tissue decomposition model recapitulate complex Bayesian multi-tissue analysis results. This knowledge was applied to develop prediction models of gene expression traits for all tissues, which we make publicly available.
0
Citation8
0
Save
0

Integrating Predicted Transcriptome From Multiple Tissues Improves Association Detection

Alvaro Barbeira et al.Mar 31, 2018
Abstract Integration of genome-wide association studies (GWAS) and expression quantitative trait loci (eQTL) studies is needed to improve our understanding of the biological mechanisms underlying GWAS hits, and our ability to identify therapeutic targets. Gene-level association test methods such as PrediXcan can prioritize candidate targets. However, limited eQTL sample sizes and absence of relevant developmental and disease context restricts our ability to detect associations. Here we propose an efficient statistical method that leverages the substantial sharing of eQTLs across tissues and contexts to improve our ability to identify potential target genes: MulTiXcan. MulTiXcan integrates evidence across multiple panels while taking into account their correlation. We apply our method to a broad set of complex traits available from the UK Biobank and show that we can detect a larger set of significantly associated genes than using each panel separately. To improve applicability, we developed an extension to work on summary statistics: S-MulTiXcan, which we show yields highly concordant results with the individual level version. Results from our analysis as well as software and necessary resources to apply our method are publicly available.
0
Citation8
0
Save
43

Polygenic transcriptome risk scores improve portability of polygenic risk scores across ancestries

Yanyu Liang et al.Nov 13, 2020
Abstract Polygenic risk scores (PRS) are on course to translate the results of genome-wide association studies (GWAS) into clinical practice. To date, most GWAS have been based on individuals of European-ancestry, meaning that the utility of PRS for non-European populations is limited because SNP effects and LD patterns may not be conserved across populations. We hypothesized that cross population prediction at the level of genes rather than SNPs would be more effective, since the effect of genes on traits is likely to be more highly conserved. Therefore, we developed a framework to convert effect sizes at SNPs into effect sizes for genetically predicted transcript abundance, which we used for prediction in non-European populations. We compared this approach, which we call polygenic transcriptome risk scores (PTRS), to PRS, using data from 17 quantitative traits that were measured in multiple ancestries (European, African, East Asian, and South Asian) by UK Biobank. On average, PTRS using whole blood predicted transcriptome had lower absolute prediction accuracy than PRS, as we expected since not all regulatory processes were captured by a single tissue. However, as hypothesized, we found that in the African target set, the portability (prediction accuracy relative to the European reference set) was significantly higher for PTRS than PRS (p=0.03) with additional gain when transcriptomic prediction models ancestry matched the target population (p=0.021). Taken together, our results suggest that using PTRS can improve prediction in underrepresented populations and that increasing the diversity of transcriptomic data may be an effective way to improve portability of GWAS results between populations and help reduce health disparities.
43
Citation7
0
Save
4

Multi-ethnic transcriptome-wide association study of prostate cancer

Peter Fiorica et al.Jul 2, 2020
Abstract The genetic risk for prostate cancer has been governed by a few rare variants with high penetrance and over 150 commonly occurring variants with lower impact on risk; however, most of these variants have been identified in studies containing exclusively European individuals. People of non-European ancestries make up less than 15% of prostate cancer GWAS subjects. Across the globe, incidence of prostate cancer varies with population due to environmental and genetic factors. The discrepancy between disease incidence and representation in genetics highlights the need for more studies of the genetic risk for prostate cancer across diverse populations. To better understand the genetic risk for prostate cancer across diverse populations, we performed PrediXcan and GWAS in a cohort of 4,769 self-identified African American (2,463 cases and 2,306 controls), 2,199 Japanese American (1,106 cases and 1,093 controls), and 2,147 Latin American (1,081 cases and 1,066 controls) individuals from the Multiethnic Genome-wide Scan of Prostate Cancer. We used prediction models from 46 tissues in GTEx version 8 and five models from monocyte transcriptomes in the Multi-Ethnic Study of Artherosclerosis. Across the three populations, we predicted 19 gene-tissue pairs, including five unique genes, to be significantly ( lfsr < 0.05) associated with prostate cancer. One of these genes, NKX3-1 , replicated in a larger European cohort. At the SNP level, 110 SNPs met genome-wide significance in the African American cohort while 123 SNPs met significance in the Japanese American cohort. Fine mapping revealed three significant independent loci in the African American cohort and two significant independent loci in the Japanese American cohort. These identified loci confirm findings from previous GWAS of prostate cancer in diverse cohorts while PrediXcan-identified genes suggest potential new directions for prostate cancer research in populations across the globe.
4
Citation3
0
Save
8

Protein prediction for trait mapping in diverse populations

Ryan Schubert et al.Aug 11, 2021
Abstract Genetically regulated gene expression has helped elucidate the biological mechanisms underlying complex traits. Improved high-throughput technology allows similar interrogation of the genetically regulated proteome for understanding complex trait mechanisms. Here, we used the Trans-omics for Precision Medicine (TOPMed) Multi-omics pilot study, which comprises data from Multi-Ethnic Study of Atherosclerosis (MESA), to optimize genetic predictors of the plasma proteome for genetically regulated proteome-wide association studies (PWAS) in diverse populations. We built predictive models for protein abundances using data collected in TOPMed MESA, for which we have measured 1,305 proteins by a SOMAscan assay. We compared predictive models built via elastic net regression to models integrating posterior inclusion probabilities estimated by fine-mapping SNPs prior to elastic net. In order to investigate the transferability of predictive models across ancestries, we built protein prediction models in all four of the TOPMed MESA populations, African American (n=183), Chinese (n=71), European (n=416), and Hispanic/Latino (n=301), as well as in all populations combined. As expected, fine-mapping produced more significant protein prediction models, especially in African ancestries populations, potentially increasing opportunity for discovery. When we tested our TOPMed MESA models in the independent European INTERVAL study, fine-mapping improved cross-ancestries prediction for some proteins. Using GWAS summary statistics from the Population Architecture using Genomics and Epidemiology (PAGE) study, which comprises ~50,000 Hispanic/Latinos, African Americans, Asians, Native Hawaiians, and Native Americans, we applied S-PrediXcan to perform PWAS for 28 complex traits. The most protein-trait associations were discovered, colocalized, and replicated in large independent GWAS using proteome prediction model training populations with similar ancestries to PAGE. At current training population sample sizes, performance between baseline and fine-mapped protein prediction models in PWAS was similar, highlighting the utility of elastic net. Our predictive models in diverse populations are publicly available for use in proteome mapping methods at https://doi.org/10.5281/zenodo.4837328 . Author summary Gene regulation is a critical mechanism underlying complex traits. Transcriptome-wide association studies (TWAS) have helped elucidate potential mechanisms because each association connects a gene rather than a variant to the complex trait. Like genome-wide association studies (GWAS), most TWAS are still conducted exclusively in populations of European ancestry, which misses the opportunity to test the full spectrum of human genetic variation for associations with complex traits. Here, move beyond the transcriptome and because protein measurement assays are growing to allow interrogation of the proteome, we use data from TOPMed MESA to develop genetic predictors of protein abundance in diverse ancestry populations. We compare model-building strategies with the goal of providing the best resource for protein association discovery with available data. We demonstrate how these prediction models can be used to perform proteome-wide association studies (PWAS) in diverse populations. We show the most protein-trait associations were discovered, colocalized, and replicated in independent cohorts using proteome prediction model training populations with similar ancestries to individuals in the GWAS. We shared our protein prediction models and performance statistics publicly to facilitate future proteome mapping studies in diverse populations.
8
Citation1
0
Save
Load More