DH
Donglei Hu
Author with expertise in Genomic Studies and Association Analyses
UCSF Helen Diller Family Comprehensive Cancer Center, University of California, San Francisco, City College of San Francisco
+ 7 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
17
(41% Open Access)
Cited by:
35
h-index:
42
/
i10-index:
100
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Admixture mapping of severe asthma exacerbations in Hispanic/Latino children and youth

Esther Herrera‐Luis et al.Nov 25, 2023
+33
J
A
E
Background In the USA, genetically admixed populations have the highest asthma prevalence and severe asthma exacerbations rates. This could be explained not only by environmental factors but also by genetic variants that exert ethnic-specific effects. However, no admixture mapping has been performed for severe asthma exacerbations. Objective We sought to identify genetic variants associated with severe asthma exacerbations in Hispanic/Latino subgroups by means of admixture mapping analyses and fine mapping, and to assess their transferability to other populations and potential functional roles. Methods We performed an admixture mapping in 1124 Puerto Rican and 625 Mexican American children with asthma. Fine-mapping of the significant peaks was performed via allelic testing of common and rare variants. We performed replication across Hispanic/Latino subgroups, and the transferability to non-Hispanic/Latino populations was assessed in 1001 African Americans, 1250 Singaporeans and 941 Europeans with asthma. The effects of the variants on gene expression and DNA methylation from whole blood were also evaluated in participants with asthma and in silico with data obtained through public databases. Results Genomewide significant associations of Indigenous American ancestry with severe asthma exacerbations were found at 5q32 in Mexican Americans as well as at 13q13-q13.2 and 3p13 in Puerto Ricans. The single nucleotide polymorphism (SNP) rs1144986 ( C5orf46 ) showed consistent effects for severe asthma exacerbations across Hispanic/Latino subgroups, but it was not validated in non-Hispanics/Latinos. This SNP was associated with DPYSL3 DNA methylation and SCGB3A2 gene expression levels. Conclusions Admixture mapping study of asthma exacerbations revealed a novel locus that exhibited Hispanic/Latino-specific effects and regulated DPYSL3 and SCGB3A2 .
1
Paper
Citation8
0
Save
0

On the cross-population generalizability of gene expression prediction models

Kevin Keys et al.May 7, 2020
+17
M
A
K
Abstract The genetic control of gene expression is a core component of human physiology. For the past several years, transcriptome-wide association studies have leveraged large datasets of linked genotype and RNA sequencing information to create a powerful gene-based test of association that has been used in dozens of studies. While numerous discoveries have been made, the populations in the training data are overwhelmingly of European descent, and little is known about the generalizability of these models to other populations. Here, we test for cross-population generalizability of gene expression prediction models using a dataset of African American individuals with RNA-Seq data in whole blood. We find that the default models trained in large datasets such as GTEx and DGN fare poorly in African Americans, with a notable reduction in prediction accuracy when compared to European Americans. We replicate these limitations in cross-population generalizability using the five populations in the GEUVADIS dataset. Via realistic simulations of both populations and gene expression, we show that accurate cross-population generalizability of transcriptome prediction only arises when eQTL architecture is substantially shared across populations. In contrast, models with non-identical eQTLs showed patterns similar to real-world data. Therefore, generating RNA-Seq data in diverse populations is a critical step towards multi-ethnic utility of gene expression prediction. Author summary Advances in RNA sequencing technology have reduced the cost of measuring gene expression at a genome-wide level. However, sequencing enough human RNA samples for adequately-powered disease association studies remains prohibitively costly. To this end, modern transcriptome-wide association analysis tools leverage existing paired genotype-expression datasets by creating models to predict gene expression using genotypes. These predictive models enable researchers to perform cost-effective association tests with gene expression in independently genotyped samples. However, most of these models use European reference data, and the extent to which gene expression prediction models work across populations is not fully resolved. We observe that these models predict gene expression worse than expected in a dataset of African-Americans when derived from European-descent individuals. Using simulations, we show that gene expression predictive model performance depends on both the amount of shared genotype predictors as well as the genetic relatedness between populations. Our findings suggest a need to carefully select reference populations for prediction and point to a pressing need for more genetically diverse genotype-expression datasets.
1

Role of Sex on the Genetic Susceptibility to Childhood Asthma in Latinos and African Americans

Antonio Espuela‐Ortiz et al.Nov 25, 2023
+6
F
E
A
Asthma is a respiratory disease whose prevalence changes throughout the lifespan and differs by sex, being more prevalent in males during childhood and in females after puberty. In this study, we assessed the influence of sex on the genetic susceptibility to childhood asthma in admixed populations. Sex-interaction and sex-stratified genome-wide association studies (GWAS) were performed in 4291 Latinos and 1730 African Americans separately, and results were meta-analyzed. Genome-wide (p ≤ 9.35 × 10-8) and suggestive (p ≤ 1.87 × 10-6) population-specific significance thresholds were calculated based on 1000 Genomes Project data. Additionally, protein quantitative trait locus (pQTL) information was gathered for the suggestively associated variants, and enrichment analyses of the proteins identified were carried out. Four independent loci showed interaction with sex at a suggestive level. The stratified GWAS highlighted the 17q12-21 asthma locus as a contributor to asthma susceptibility in both sexes but reached genome-wide significance only in females (p-females < 9.2 × 10-8; p-males < 1.25 × 10-2). Conversely, genetic variants upstream of ligand-dependent nuclear receptor corepressor-like gene (LCORL), previously involved in height determination and spermatogenesis, were associated with asthma only in males (minimum p = 5.31 × 10-8 for rs4593128). Enrichment analyses revealed an overrepresentation of processes related to the immune system and highlighted differences between sexes. In conclusion, we identified sex-specific polymorphisms that could contribute to the differences in the prevalence of childhood asthma between males and females.
1

Multi-omic approach associates blood methylome with bronchodilator drug response in pediatric asthma

Javier Pérez-García et al.Nov 25, 2023
+15
A
E
J
Albuterol is the drug most widely used as asthma treatment among African Americans despite having a lower bronchodilator drug response (BDR) than other populations. Although BDR is affected by gene and environmental factors, the influence of DNA methylation is unknown.This study aimed to identify epigenetic markers in whole blood associated with BDR, study their functional consequences by multi-omic integration, and assess their clinical applicability in admixed populations with a high asthma burden.We studied 414 children and young adults (8-21 years old) with asthma in a discovery and replication design. We performed an epigenome-wide association study on 221 African Americans and replicated the results on 193 Latinos. Functional consequences were assessed by integrating epigenomics with genomics, transcriptomics, and environmental exposure data. Machine learning was used to develop a panel of epigenetic markers to classify treatment response.We identified 5 differentially methylated regions and 2 CpGs genome-wide significantly associated with BDR in African Americans located in FGL2 (cg08241295, P = 6.8 × 10-9) and DNASE2 (cg15341340, P = 7.8 × 10-8), which were regulated by genetic variation and/or associated with gene expression of nearby genes (false discovery rate < 0.05). The CpG cg15341340 was replicated in Latinos (P = 3.5 × 10-3). Moreover, a panel of 70 CpGs showed good classification for those with response and nonresponse to albuterol therapy in African American and Latino children (area under the receiver operating characteristic curve for training, 0.99; for validation, 0.70-0.71). The DNA methylation model showed similar discrimination as clinical predictors (P > .05).We report novel associations of epigenetic markers with BDR in pediatric asthma and demonstrate for the first time the applicability of pharmacoepigenetics in precision medicine of respiratory diseases.
1

Gene expression in African Americans and Latinos reveals ancestry-specific patterns of genetic architecture

Linda Kachuri et al.Oct 24, 2023
+16
D
A
L
ABSTRACT We analyzed whole genome and RNA sequencing data from 2,733 African American and Hispanic/Latino children to explore ancestry- and heterozygosity-related differences in the genetic architecture of whole blood gene expression. We found that heritability of gene expression significantly increases with greater proportion of African genetic ancestry and decreases with higher levels of Indigenous American ancestry, consistent with a relationship between heterozygosity and genetic variance. Among heritable protein-coding genes, the prevalence of statistically significant ancestry-specific expression quantitative trait loci (anc-eQTLs) was 30% in African ancestry and 8% for Indigenous American ancestry segments. Most of the anc-eQTLs (89%) were driven by population differences in allele frequency, demonstrating the importance of measuring gene expression across multiple populations. Transcriptome-wide association analyses of multi-ancestry summary statistics for 28 traits identified 79% more gene-trait pairs using models trained in our admixed population than models trained in GTEx. Our study highlights the importance of large and ancestrally diverse genomic studies for enabling new discoveries of complex trait architecture and reducing disparities.
1
Paper
Citation5
0
Save
0

A Genome-wide Association and Admixture Mapping Study of Bronchodilator Drug Response in African Americans with Asthma

Melissa Spear et al.May 7, 2020
+30
S
D
M
Abstract Background Short-acting B 2 -adrenergic receptor agonists (SABAs) are the most commonly prescribed asthma medications worldwide. Response to SABAs is measured as bronchodilator drug response (BDR), which varies among racial/ethnic groups in the U.S 1, 2 . However, the genetic variation that contributes to BDR is largely undefined in African Americans with asthma 3 Objective To identify genetic variants that may contribute to differences in BDR in African Americans with asthma. Methods We performed a genome-wide association study of BDR in 949 African American children with asthma, genotyped with the Axiom World Array 4 (Affymetrix, Santa Clara, CA) followed by imputation using 1000 Genomes phase 3 genotypes. We used linear regression models adjusting for age, sex, body mass index and genetic ancestry to test for an association between BDR and genotype at single nucleotide polymorphisms (SNPs). To increase power and distinguish between shared vs. population-specific associations with BDR in children with asthma, we performed a meta-analysis across 949 African Americans and 1,830 Latinos (Total=2,779). Lastly, we performed genome-wide admixture mapping to identify regions whereby local African or European ancestry is associated with BDR in African Americans. Two additional populations of 416 Latinos and 1,325 African Americans were used to replicate significant associations. Results We identified a population-specific association with an intergenic SNP on chromosome 9q21 that was significantly associated with BDR (rs73650726, p=7.69 × 10 −9 ). A trans-ethnic meta-analysis across African Americans and Latinos identified three additional SNPs within the intron of PRKG1 that were significantly associated with BDR (rs7903366, rs7070958, and rs7081864, p≤5 × 10 −8 ). Conclusions Our findings indicate that both population specific and shared genetic variation contributes to differences in BDR in minority children with asthma, and that the genetic underpinnings of BDR may differ between racial/ethnic groups. Key messages A GWAS for BDR in African American children with asthma identified an intergenic population specific variant at 9q21 to be associated with increased bronchodilator drug response (BDR). A meta-analysis of GWAS across African Americans and Latinos identified shared genetic variants at 10q21 in the intron of PRKG1 to be associated with differences in BDR. Further genetic studies need to be performed in diverse populations to identify the full set of genetic variants that contribute to BDR.
0

Whole Genome Sequencing of Pharmacogenetic Drug Response in Racially and Ethnically Diverse Children with Asthma

Angel Mak et al.May 7, 2020
+50
Z
M
A
Asthma is the most common chronic disease of children, with significant racial/ethnic differences in prevalence, morbidity, mortality and therapeutic response. Albuterol, a bronchodilator medication, is the first-line therapy for asthma treatment worldwide. We performed the largest whole genome sequencing (WGS) pharmacogenetics study to date using data from 1,441 minority children with asthma who had extremely high or low bronchodilator drug response (BDR). We identified population-specific and shared pharmacogenetic variants associated with BDR, including genome-wide significant (p < 3.53 x 10-7) and suggestive (p < 7.06 x 10-6) loci near genes previously associated with lung capacity (DNAH5), immunity (NFKB1 and PLCB1), and β-adrenergic signaling pathways (ADAMTS3 and COX18). Functional analyses centered on NFKB1 revealed potential regulatory function of our BDR-associated SNPs in bronchial smooth muscle cells. Specifically, these variants are in linkage disequilibrium with SNPs in a functionally active enhancer, and are also expression quantitative trait loci (eQTL) for a neighboring gene, SLC39A8. Given the lack of other asthma study populations with WGS data on minority children, replication of our rare variant associations is infeasible. We attempted to replicate our common variant findings in five independent studies with GWAS data. The age-specific associations previously found in asthma and asthma-related traits suggest that the over-representation of adults in our replication populations may have contributed to our lack of statistical replication, despite the functional relevance of the NFKB1 variants demonstrated by our functional assays. Our study expands the understanding of pharmacogenetic analyses in racially/ethnically diverse populations and advances the foundation for precision medicine in at-risk and understudied minority populations.
0

Ancestry and Genetic Associations with Bronchopulmonary Dysplasia in Preterm Infants

Dara Torgerson et al.May 7, 2020
+6
R
P
D
Bronchopulmonary dysplasia in premature infants is a common and often severe lung disease with long term sequelae. A genetic component is suspected but not fully defined. We performed an ancestry and genome-wide association study to identify variants, genes and pathways associated with survival without bronchopulmonary dysplasia in 387 high-risk infants treated with inhaled nitric oxide in the Trial of Late Surfactant study. Global African genetic ancestry was associated with increased survival without bronchopulmonary dysplasia among infants of maternal self-reported Hispanic White race/ethnicity (OR=4.5, p=0.01). Admixture mapping found suggestive outcome associations with local African ancestry at 18q21 and 10q22 among infants of maternal self-reported African American race/ethnicity. For all infants, the top individual variant identified was within the intron of NBL1, which is expressed in mid-trimester lung and is an antagonist of bone morphogenetic proteins (rs372271081, OR=0.17, p=7.4x10-7). The protective allele of this variant was significantly associated with lower nitric oxide metabolites in the urine of non-Hispanic white infants (p= 0.006), supporting a role in the racial differential response to nitric oxide. Interrogating genes upregulated in bronchopulmonary dysplasia lungs indicated association with variants in CCL18, a cytokine associated with fibrosis and interstitial lung disease, and pathway analyses implicated variation in genes involved in immune/inflammatory processes in response to infection and mechanical ventilation. Our results suggest that genetic variation related to lung development, drug metabolism, and immune response contribute to individual and racial/ethnic differences in respiratory outcomes following inhaled nitric oxide treatment of high-risk premature infants.
0

Identification of Novel Common Breast Cancer Risk Variants in Latinas at the 6q25 Locus

Joshua Hoffman et al.May 7, 2020
+19
D
L
J
Background: Breast cancer is a partially heritable trait and over 180 common genetic variants have been associated with breast cancer in genome wide association studies (GWAS). We have previously performed breast cancer GWAS in Latinas and identified a strongly protective single nucleotide polymorphism (SNP) at 6q25 with the protective minor allele originating from Indigenous American ancestry. Here we report on additional GWAS and replication in Latinas. Methods: We performed GWAS in 2385 cases and 7342 controls who were either U.S. Latinas or Mexican women. We replicated 2412 cases and 1620 controls of U.S Latina, Mexican, and Colombian women. In addition, we replicated the top novel variants in study of African American and African women and in one study of Chinese women. In each dataset we used logistic regression models to test the association between SNPs and breast cancer risk and corrected for genetic ancestry using either principal components or genetic ancestry inferred from ancestry informative markers using a model based approach. Results: We identified 3 SNPs (p=1.9x10-8 − 2.8x10-8) at 6q25 locus not in linkage disequilibrium (LD) with variants previously reported at this locus. These SNPs were in high LD with each other, with the top SNP, rs3778609, associated with breast cancer with an odds ratio (OR) and 95% confidence interval (95% CI) of 0.75 (0.68-0.83). In a replication in women of Latin American origin, we also observed a consistent effect (OR: 0.88; 95% CI: 0.78 − 0.99; p=0.037). Since the minor allele was common in East Asians and African American but not European ancestry populations, we replicated in a meta-analysis of those populations and also observed a consistent effect (OR 0.94; 95% CI: 0.91 − 0.97; p=0.013). Conclusion: The effect size of this variant is relatively large compared to other common variants associated with breast cancer and adds to evidence about the importance of the 6q25 locus for breast cancer susceptibility. Our finding also highlights the utility of performing additional searches for genetic variants for breast cancer in non-European populations.
0

The Effects of Migration and Assortative Mating on Admixture Linkage Disequilibrium

Noah Zaitlen et al.May 7, 2020
+12
D
S
N
Statistical models in medical and population genetics typically assume that individuals assort randomly in a population. While this simplifies model complexity, it contradicts an increasing body of evidence of non-random mating in human populations. Specifically, it has been shown that assortative mating is significantly affected by genomic ancestry. In this work we examine the effects of ancestry-assortative mating on the linkage disequilibrium between local ancestry tracks of individuals in an admixed population. To accomplish this, we develop an extension to the Wright-Fisher model that allows for ancestry based assortative mating. We show that ancestry-assortment perturbs the distribution of local ancestry linkage disequilibrium (LAD) and the variance of ancestry in a population as a function of the number of generations since admixture. This assortment effect can induce errors in demographic inference of admixed populations when methods assume random mating. We derive closed form formulae for LAD under an assortative-mating model with and without migration. We observe that LAD depends on the correlation of global ancestry of couples in each generation, the migration rate of each of the ancestral populations, the initial proportions of ancestral populations, and the number of generations since admixture. We also present the first evidence of ancestry-assortment in African Americans and examine LAD in simulated and real admixed population data of African Americans. We find that demographic inference under the assumption of random mating significantly underestimates the number of generations since admixture, and that accounting for assortative mating using the patterns of LAD results in estimates that more closely agrees with the historical narrative.
Load More