CH
Christopher Haiman
Author with expertise in Genomic Studies and Association Analyses
University of Southern California, Kyung Hee University, University of Hawaii System
+ 12 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
27
(56% Open Access)
Cited by:
37
h-index:
106
/
i10-index:
513
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
3

A Saturated Map of Common Genetic Variants Associated with Human Height from 5.4 Million Individuals of Diverse Ancestries

Loïc Yengo et al.Jan 12, 2022
+554
E
S
L
ABSTRACT Common SNPs are predicted to collectively explain 40-50% of phenotypic variation in human height, but identifying the specific variants and associated regions requires huge sample sizes. Here we show, using GWAS data from 5.4 million individuals of diverse ancestries, that 12,111 independent SNPs that are significantly associated with height account for nearly all of the common SNP-based heritability. These SNPs are clustered within 7,209 non-overlapping genomic segments with a median size of ~90 kb, covering ~21% of the genome. The density of independent associations varies across the genome and the regions of elevated density are enriched for biologically relevant genes. In out-of-sample estimation and prediction, the 12,111 SNPs account for 40% of phenotypic variance in European ancestry populations but only ~10%-20% in other ancestries. Effect sizes, associated regions, and gene prioritization are similar across ancestries, indicating that reduced prediction accuracy is likely explained by linkage disequilibrium and allele frequency differences within associated regions. Finally, we show that the relevant biological pathways are detectable with smaller sample sizes than needed to implicate causal genes and variants. Overall, this study, the largest GWAS to date, provides an unprecedented saturated map of specific genomic regions containing the vast majority of common height-associated variants.
0

Population specific reference panels are crucial for the genetic analyses of Native Hawai’ians: an example of theCREBRFlocus

Meng Lin et al.May 7, 2020
+14
P
C
M
Abstract Statistical imputation applied to genome-wide array data is the most cost-effective approach to complete the catalog of genetic variation in a study population. However, imputed genotypes in underrepresented populations incur greater inaccuracies due to ascertainment bias and a lack of representation among reference individuals,, further contributing to the obstacles to study these populations. Here we examined the consequences due to the lack of representation by genotyping a functionally important, Polynesian-specific variant, rs373863828, in the CREBRF gene, in a large number of self-reported Native Hawai’ians (N=3,693) from the Multiethnic Cohort. We found the derived allele of rs373863828 was significantly associated with several adiposity traits with large effects ( e.g. 0.214 s.d., or approximately 1.28 kg/m 2 , per allele, in BMI as the most significant; P = 7.5×10 −5 ). Due to the current absence of Polynesian representation in publicly accessible reference sequences, rs373863828 or any of its proxies could not be tested through imputation using these existing resources. Moreover, the association signals at this Polynesian-specific variant could not be captured by alternative approaches, such as admixture mapping. In contrast, highly accurate imputation can be achieved even if a small number (<200) of Polynesian reference individuals were available. By constructing an internal set of Polynesian reference individuals, we were able to increase sample size for analysis up to 3,936 individuals, and improved the statistical evidence of association (e.g. p = 1.5×10 −7 , 3×10 −6 , and 1.4×10 −4 for BMI, hip circumference, and T2D, respectively). Taken together, our results suggest the alarming possibility that lack of representation in reference panels would inhibit discovery of functionally important, population-specific loci such as CREBRF . Yet, they could be easily detected and prioritized with improved representation of diverse populations in sequencing studies.
0

Fine-mapping of 150 breast cancer risk regions identifies 178 high confidence target genes

Laura Fachal et al.May 6, 2020
+334
J
H
L
ABSTRACT Genome-wide association studies have identified breast cancer risk variants in over 150 genomic regions, but the mechanisms underlying risk remain largely unknown. These regions were explored by combining association analysis with in silico genomic feature annotations. We defined 205 independent risk-associated signals with the set of credible causal variants (CCVs) in each one. In parallel, we used a Bayesian approach (PAINTOR) that combines genetic association, linkage disequilibrium, and enriched genomic features to determine variants with high posterior probabilities (HPPs) of being causal. Potentially causal variants were significantly over-represented in active gene regulatory regions and transcription factor binding sites. We applied our INQUSIT pipeline for prioritizing genes as targets of potentially causal variants, using gene expression (eQTL), chromatin interaction and functional annotations. Known cancer drivers, transcription factors and genes in the developmental, apoptosis, immune system and DNA integrity checkpoint gene ontology pathways, were over-represented among the 178 highest confidence target genes.
0
Paper
Citation5
0
Save
0

Common variants in breast cancer risk loci predispose to distinct tumor subtypes

Thomas Ahearn et al.May 7, 2020
+155
K
H
T
Abstract Background Genome-wide association studies (GWAS) have identified multiple common breast cancer susceptibility variants. Many of these variants have differential associations by estrogen receptor (ER), but how these variants relate with other tumor features and intrinsic molecular subtypes is unclear. Methods Among 106,571 invasive breast cancer cases and 95,762 controls of European ancestry with data on 173 breast cancer variants identified in previous GWAS, we used novel two-stage polytomous logistic regression models to evaluate variants in relation to multiple tumor features (ER, progesterone receptor (PR), human epidermal growth factor receptor 2 (HER2) and grade) adjusting for each other, and to intrinsic-like subtypes. Results Eighty-five of 173 variants were associated with at least one tumor feature (false discovery rate <5%), most commonly ER and grade, followed by PR and HER2. Models for intrinsic-like subtypes found nearly all of these variants (83 of 85) associated at P<0.05 with risk for at least one luminal-like subtype, and approximately half (41 of 85) of the variants were associated with risk of at least one non-luminal subtype, including 32 variants associated with triple-negative (TN) disease. Ten variants were associated with risk of all subtypes in different magnitude. Five variants were associated with risk of luminal A-like and TN subtypes in opposite directions. Conclusion This report demonstrates a high level of complexity in the etiology heterogeneity of breast cancer susceptibility variants and can inform investigations of subtype-specific risk prediction.
0
Citation3
0
Save
5

Fine-Mapping and Credible Set Construction using a Multi-population Joint Analysis of Marginal Summary Statistics from Genome-wide Association Studies

Jiayi Shen et al.Oct 24, 2023
+5
K
L
J
Abstract Recent advancement in Genome-wide Association Studies (GWAS) comes from not only increasingly larger sample sizes but also the shifted focus towards underrepresented populations. Multi-population GWAS may increase power to detect novel risk variants and improve fine-mapping resolution by leveraging evidence from diverse populations and accounting for the difference in linkage disequilibrium (LD) across ethnic groups. Here, we expand upon our previous approach for single-population fine-mapping through Joint Analysis of Marginal SNP Effects (JAM) to a multi-population analysis (mJAM). Under the assumption that true causal variants are common across studies, we implement a novel version of JAM that conditions on multiple SNPs while explicitly incorporating the different LD structures across populations. The mJAM framework can be used to first select index variants using the mJAM likelihood with any feature selection approach. In addition, we present a novel approach leveraging the ideas of mediation to construct credible sets for these index variants. Construction of such credible sets can be performed given any existing index variants. We illustrate the implementation of the mJAM likelihood through two implementations: mJAM-SuSiE (a Bayesian approach) and mJAM-Forward selection. Through simulation studies based on realistic effect sizes and levels of LD, we demonstrated that mJAM performs better than other existing multi-ethnic methods for constructing concise credible sets that include the underlying causal variants. In real data examples taken from the most recent multi-population prostate cancer GWAS, we showed several practical advantages of mJAM over other existing methods.
60

Enrichment analyses identify shared associations for 25 quantitative traits in over 600,000 individuals from seven diverse ancestries

Samuel Smith et al.Oct 24, 2023
+12
W
S
S
Abstract Since 2005, genome-wide association (GWA) datasets have been largely biased toward sampling European ancestry individuals, and recent studies have shown that GWA results estimated from self-identified European individuals are not transferable to non-European individuals due to various confounding challenges. Here, we demonstrate that enrichment analyses which aggregate SNP-level association statistics at multiple genomic scales—from genes to genomic regions and pathways—have been underutilized in the GWA era and can generate biologically interpretable hypotheses regarding the genetic basis of complex trait architecture. We illustrate examples of the robust associations generated by enrichment analyses while studying 25 continuous traits assayed in 566,786 individuals from seven diverse self-identified human ancestries in the UK Biobank and the Biobank Japan, as well as 44,348 admixed individuals from the PAGE consortium including cohorts of African-American, Hispanic and Latin American, Native Hawaiian, and American Indian/Alaska Native individuals. We identify 1,000 gene-level associations that are genome-wide significant in at least two ancestry cohorts across these 25 traits, as well as highly conserved pathway associations with triglyceride levels in European, East Asian, and Native Hawaiian cohorts.
0

Alcohol intake and endogenous sex hormones in women: Meta‐analysis of cohort studies and Mendelian randomization

Sandar Tin et al.Sep 6, 2024
+24
P
K
S
Abstract Background The mechanisms underlying alcohol‐induced breast carcinogenesis are not fully understood but may involve hormonal changes. Methods Cross‐sectional associations were investigated between self‐reported alcohol intake and serum or plasma concentrations of estradiol, estrone, progesterone (in premenopausal women only), testosterone, androstenedione, dehydroepiandrosterone sulfate, and sex hormone binding globulin (SHBG) in 45 431 premenopausal and 173 476 postmenopausal women. Multivariable linear regression was performed separately for UK Biobank, European Prospective Investigation into Cancer and Nutrition, and Endogenous Hormones and Breast Cancer Collaborative Group, and meta‐analyzed the results. For testosterone and SHBG, we also conducted Mendelian randomization and colocalization using the ADH1B (alcohol dehydrogenase 1B) variant (rs1229984). Results Alcohol intake was positively, though weakly, associated with all hormones (except progesterone in premenopausal women), with increments in concentrations per 10 g/day increment in alcohol intake ranging from 1.7% for luteal estradiol to 6.6% for postmenopausal dehydroepiandrosterone sulfate. There was an inverse association of alcohol with SHBG in postmenopausal women but a small positive association in premenopausal women. Two‐sample randomization identified positive associations of alcohol intake with total testosterone (difference per 10 g/day increment: 4.1%; 95% CI, 0.6–7.6) and free testosterone (7.8%; 4.1–11.5), and an inverse association with SHBG (–8.1%; –11.3% to –4.9%). Colocalization suggested a shared causal locus at ADH1B between alcohol intake and higher free testosterone and lower SHBG (posterior probability for H4, 0.81 and 0.97, respectively). Conclusions Alcohol intake was associated with small increases in sex hormone concentrations, including bioavailable fractions, which may contribute to its effect on breast cancer risk.
4

Epigenome-wide association study of total nicotine equivalents in multiethnic current smokers from three prospective cohorts

Brian Huang et al.Mar 16, 2024
+18
B
A
B
The impact of tobacco exposure on health varies by race and ethnicity and is closely tied to internal nicotine dose, a marker of carcinogen uptake. DNA methylation is strongly responsive to smoking status and may mediate health effects, but study of associations with internal dose is limited. We performed a blood leukocyte epigenome-wide association study (EWAS) of urinary total nicotine equivalents (TNEs; a measure of nicotine uptake) and DNA methylation measured using the MethylationEPIC v1.0 BeadChip (EPIC) in six racial and ethnic groups across three cohort studies. In the Multiethnic Cohort Study (discovery, n = 1994), TNEs were associated with differential methylation at 408 CpG sites across >250 genomic regions (p < 9 × 10-8). The top significant sites were annotated to AHRR, F2RL3, RARA, GPR15, PRSS23, and 2q37.1, all of which had decreasing methylation with increasing TNEs. We identified 45 novel CpG sites, of which 42 were unique to the EPIC array and eight annotated to genes not previously linked with smoking-related DNA methylation. The most significant signal in a novel gene was cg03748458 in MIR383;SGCZ. Fifty-one of the 408 discovery sites were validated in the Singapore Chinese Health Study (n = 340) and the Southern Community Cohort Study (n = 394) (Bonferroni corrected p < 1.23 × 10-4). Significant heterogeneity by race and ethnicity was detected for CpG sites in MYO1G and CYTH1. Furthermore, TNEs significantly mediated the association between cigarettes per day and DNA methylation at 15 sites (average 22.5%-44.3% proportion mediated). Our multiethnic study highlights the transethnic and ethnic-specific methylation associations with internal nicotine dose, a strong predictor of smoking-related morbidities.
4
Citation1
1
Save
0

Early Prostate Cancer Deaths Among Men With Higher vs Lower Genetic Risk

Anna Plym et al.Sep 12, 2024
+12
K
Y
A
Importance Prostate cancer, a leading cause of cancer death among men, urgently requires new prevention strategies, which may involve targeting men with an underlying genetic susceptibility. Objective To explore differences in risk of early prostate cancer death among men with higher vs lower genetic risk to inform prevention efforts. Design, Setting, and Participants This cohort study used a combined analysis of genotyped men without prostate cancer at inclusion and with lifestyle data in 2 prospective cohort studies in Sweden and the US, the Malmö Diet and Cancer Study (MDCS) and the Health Professionals Follow-Up Study (HPFS), followed up from 1991 to 2019. Data were analyzed between April 2023 and April 2024. Exposures Men were categorized according to modifiable lifestyle behaviors and genetic risk. A polygenic risk score above the median or a family history of cancer defined men at higher genetic risk (67% of the study population); the remaining men were categorized as being at lower genetic risk. Main Outcomes and Measures Prostate cancer death analyzed using time-to-event analysis estimating hazard ratios (HR), absolute risks, and preventable deaths by age. Results Among the 19 607 men included for analysis, the median (IQR) age at inclusion was 59.0 (53.0-64.7) years (MDCS) and 65.1 (58.0-71.8) years (HPFS). During follow-up, 107 early (by age 75 years) and 337 late (after age 75 years) prostate cancer deaths were observed. Compared with men at lower genetic risk, men at higher genetic risk had increased rates of both early (HR, 3.26; 95% CI, 1.82-5.84) and late (HR, 2.26; 95% CI, 1.70-3.01) prostate cancer death, and higher lifetime risks of prostate cancer death (3.1% vs 1.3% [MDCS] and 2.3% vs 0.6% [HPFS]). Men at higher genetic risk accounted for 94 of 107 early prostate cancer deaths (88%), of which 36% (95% CI, 12%-60%) were estimated to be preventable through adherence to behaviors associated with a healthy lifestyle (not smoking, healthy weight, high physical activity, and a healthy diet). Conclusions and Relevance In this 20-year follow-up study, men with a genetic predisposition accounted for the vast majority of early prostate cancer deaths, of which one-third were estimated to be preventable. This suggests that men at increased genetic risk should be targeted in prostate cancer prevention strategies.
0
Citation1
0
Save
0

The impact of global and local Polynesian genetic ancestry on complex traits in Native Hawaiians

Hanxiao Sun et al.Jun 5, 2024
+10
E
M
H
Abstract Epidemiological studies of obesity, Type-2 diabetes (T2D), cardiovascular diseases and several common cancers have revealed an increased risk in Native Hawaiians compared to European- or Asian-Americans living in the Hawaiian islands. However, there remains a gap in our understanding of the genetic factors that affect the health of Native Hawaiians. To fill this gap, we studied the genetic risk factors at both the chromosomal and sub-chromosomal scales using genome-wide SNP array data on ∼4,000 Native Hawaiians from the Multiethnic Cohort. We estimated the genomic proportion of Native Hawaiian ancestry (“global ancestry,” which we presumed to be Polynesian in origin), as well as this ancestral component along each chromosome (“local ancestry”) and tested their respective association with binary and quantitative cardiometabolic traits. After attempting to adjust for non-genetic covariates evaluated through questionnaires, we found that per 10% increase in global Polynesian genetic ancestry, there is a respective 8.6%, and 11.0% increase in the odds of being diabetic ( P = 1.65 10 −4 ) and having heart failure ( P = 2.18 10 −4 ), as well as a 0.059 s.d. increase in BMI ( P = 1.04 10 −10 ). When testing the association of local Polynesian ancestry with risk of disease or biomarkers, we identified a chr6 region associated with T2D. This association was driven by an uniquely prevalent variant in Polynesian ancestry individuals. However, we could not replicate this finding in an independent Polynesian cohort from Samoa due to the small sample size of the replication cohort. In conclusion, we showed that Polynesian ancestry, which likely capture both genetic and lifestyle risk factors, is associated with an increased risk of obesity, Type-2 diabetes, and heart failure, and that larger cohorts of Polynesian ancestry individuals will be needed to replicate the putative association on chr6 with T2D. Author Summary Native Hawaiians are one of the fastest growing ethnic minority in the U.S., and exhibit increased risk for metabolic and cardiovascular diseases. However, they are generally understudied, especially from a genetic perspective. To fill this gap, we studied the association of Polynesian genetic ancestry, at genomic and subgenomic scale, with quantitative and binary traits in self-identified Native Hawaiians. We showed that Polynesian ancestry, which likely capture both genetic and non-genetic risk factors related to Native Hawaiian people and culture are associated with increased risk for obesity, type-2 diabetes, and heart failure. While we do not endorse utilizing genetic information to supplant current standards of defining community membership through self-identity or genealogical records, our results suggest future studies could identify population-specific genetic susceptibility factors that may be useful in suggesting underlying biological mechanisms and reducing the disparity in disease interventions in Polynesian populations.
Load More