MF
Myriam Fornage
Author with expertise in Genomic Studies and Association Analyses
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
13
(69% Open Access)
Cited by:
52
h-index:
19
/
i10-index:
42
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
3

A Saturated Map of Common Genetic Variants Associated with Human Height from 5.4 Million Individuals of Diverse Ancestries

Loïc Yengo et al.Jan 10, 2022
ABSTRACT Common SNPs are predicted to collectively explain 40-50% of phenotypic variation in human height, but identifying the specific variants and associated regions requires huge sample sizes. Here we show, using GWAS data from 5.4 million individuals of diverse ancestries, that 12,111 independent SNPs that are significantly associated with height account for nearly all of the common SNP-based heritability. These SNPs are clustered within 7,209 non-overlapping genomic segments with a median size of ~90 kb, covering ~21% of the genome. The density of independent associations varies across the genome and the regions of elevated density are enriched for biologically relevant genes. In out-of-sample estimation and prediction, the 12,111 SNPs account for 40% of phenotypic variance in European ancestry populations but only ~10%-20% in other ancestries. Effect sizes, associated regions, and gene prioritization are similar across ancestries, indicating that reduced prediction accuracy is likely explained by linkage disequilibrium and allele frequency differences within associated regions. Finally, we show that the relevant biological pathways are detectable with smaller sample sizes than needed to implicate causal genes and variants. Overall, this study, the largest GWAS to date, provides an unprecedented saturated map of specific genomic regions containing the vast majority of common height-associated variants.
3
Citation16
0
Save
1

Clonal hematopoiesis is driven by aberrant activation of TCL1A

Joshua Weinstock et al.Dec 13, 2021
Abstract A diverse set of driver genes, such as regulators of DNA methylation, RNA splicing, and chromatin remodeling, have been associated with pre-malignant clonal expansion of hematopoietic stem cells (HSCs). The factors mediating expansion of these mutant clones remain largely unknown, partially due to a paucity of large cohorts with longitudinal blood sampling. To circumvent this limitation, we developed and validated a method to infer clonal expansion rate from single timepoint data called PACER (passenger-approximated clonal expansion rate). Applying PACER to 5,071 persons with clonal hematopoiesis accurately recapitulated the known fitness effects due to different driver mutations. A genome-wide association study of PACER revealed that a common inherited polymorphism in the TCL1A promoter was associated with slower clonal expansion. Those carrying two copies of this protective allele had up to 80% reduced odds of having driver mutations in TET2, ASXL1, SF3B1, SRSF2 , and JAK2 , but not DNMT3A. TCL1A was not expressed in normal or DNMT3A -mutated HSCs, but the introduction of mutations in TET2 or ASXL1 by CRISPR editing led to aberrant expression of TCL1A and expansion of HSCs in vitro. These effects were abrogated in HSCs from donors carrying the protective TCL1A allele. Our results indicate that the fitness advantage of multiple common driver genes in clonal hematopoiesis is mediated through TCL1A activation. PACER is an approach that can be widely applied to uncover genetic and environmental determinants of pre-malignant clonal expansion in blood and other tissues.
1
Citation9
0
Save
11

Genetic analysis of mitochondrial DNA copy number and associated traits identifies loci implicated in nucleotide metabolism, platelet activation, and megakaryocyte proliferation, and reveals a causal association of mitochondrial function with mortality

RJ Longchamps et al.Jan 28, 2021
Abstract Mitochondrial DNA copy number (mtDNA-CN) measured from blood specimens is a minimally invasive marker of mitochondrial function that exhibits both inter-individual and intercellular variation. To identify genes involved in regulating mitochondrial function, we performed a genome-wide association study (GWAS) in 465,809 White individuals from the Cohorts for Heart and Aging Research in Genomic Epidemiology (CHARGE) consortium and the UK Biobank (UKB). We identified 133 SNPs with statistically significant, independent effects associated with mtDNA-CN across 100 loci. A combination of fine-mapping, variant annotation, and co-localization analyses were used to prioritize genes within each of the 133 independent sites. Putative causal genes were enriched for known mitochondrial DNA depletion syndromes ( p = 3.09 x 10 −15 ) and the gene ontology (GO) terms for mtDNA metabolism ( p = 1.43 x 10 −8 ) and mtDNA replication ( p = 1.2 x 10 −7 ). A clustering approach leveraged pleiotropy between mtDNA-CN associated SNPs and 41 mtDNA-CN associated phenotypes to identify functional domains, revealing three distinct groups, including platelet activation, megakaryocyte proliferation, and mtDNA metabolism. Finally, using mitochondrial SNPs, we establish causal relationships between mitochondrial function and a variety of blood cell related traits, kidney function, liver function and overall ( p = 0.044) and non-cancer mortality ( p = 6.56 x 10 −4 ).
11
Citation8
0
Save
9

Mosaic chromosomal alterations in blood across ancestries via whole-genome sequencing

Yasminka Jakubek et al.Nov 8, 2022
ABSTRACT Mosaic mutations in blood are common with increasing age and are prognostic markers for cancer, cardiovascular dysfunction and other diseases. This group of acquired mutations include megabase-scale mosaic chromosomal alterations (mCAs). These large mutations have mainly been surveyed using SNP array data from individuals of European (EA) or Japanese genetic ancestry. To gain a better understanding of mCA rates and associated risk factors in genetically diverse populations, we surveyed whole genome sequencing data from 67,390 individuals, including 20,132 individuals of African ancestry (AA), and 7,608 of Hispanic ancestry (HA) with deep (30X) whole genome sequencing data from the NHLBI Trans Omics for Precision Medicine (TOPMed) program. We adapted an existing mCA calling algorithm for application to WGS data, and observed higher sensitivity with WGS data, compared with array-based data, in uncovering mCAs at low mutant cell fractions. As in previous reports, we observed a strong association with age and a non-uniform distribution of mCAs across the genome. The presence of autosomal (but not chromosome X) mCAs was associated with an increased risk of both lymphoid and myeloid malignancies. After adjusting for age, we found that individuals of European ancestry have the highest rates of autosomal mCAs, mirroring the higher rate of leukemia in this group. Our analysis also uncovered higher rates of chromosome X mCAs in AA and HA compared to EA, again after adjusting for age. Germline variants in ATM and MPL showed strong associations with mCAs in cis , including ancestry specific variants. And rare variant gene-burden analysis confirmed the association of putatively protein altering variants in ATM and MPL with mCAs in cis . Individual rare variants in DCPS, ADM17, PPP1R16B , and TET2 were all associated with autosomal mCAs and rare variants in OR4C16 were associated with chromosome X mCAs in females. There was significant enrichment of co-occurrence of CHIP mutations and mCAs both altering cancer associated genes TET2, DNMT3A, JAK2, CUX1 , and TP53 . Overall, our study demonstrates that rates of mCAs differ across populations and that rare inherited germline variants are strongly associated with mCAs across genetically diverse populations. These results strongly motivate further studies of mCAs in under-represented populations to better understand the causes and consequences of this class of somatic variation.
9
Citation2
0
Save
57

A multi-layer functional genomic analysis to understand noncoding genetic variation in lipids

Shweta Ramdas et al.Dec 8, 2021
Abstract A major challenge of genome-wide association studies (GWAS) is to translate phenotypic associations into biological insights. Here, we integrate a large GWAS on blood lipids involving 1.6 million individuals from five ancestries with a wide array of functional genomic datasets to discover regulatory mechanisms underlying lipid associations. We first prioritize lipid-associated genes with expression quantitative trait locus (eQTL) colocalizations, and then add chromatin interaction data to narrow the search for functional genes. Polygenic enrichment analysis across 697 annotations from a host of tissues and cell types confirms the central role of the liver in lipid levels, and highlights the selective enrichment of adipose-specific chromatin marks in high-density lipoprotein cholesterol and triglycerides. Overlapping transcription factor (TF) binding sites with lipid-associated loci identifies TFs relevant in lipid biology. In addition, we present an integrative framework to prioritize causal variants at GWAS loci, producing a comprehensive list of candidate causal genes and variants with multiple layers of functional evidence. Two prioritized genes, CREBRF and RRBP1 , show convergent evidence across functional datasets supporting their roles in lipid biology.
57
Citation1
0
Save
0

A statistical framework for powerful multi-trait rare variant analysis in large-scale whole-genome sequencing studies

Xihao Li et al.Jan 1, 2023
Large-scale whole-genome sequencing (WGS) studies have improved our understanding of the contributions of coding and noncoding rare variants to complex human traits. Leveraging association effect sizes across multiple traits in WGS rare variant association analysis can improve statistical power over single-trait analysis, and also detect pleiotropic genes and regions. Existing multi-trait methods have limited ability to perform rare variant analysis of large-scale WGS data. We propose MultiSTAAR, a statistical framework and computationally-scalable analytical pipeline for functionally-informed multi-trait rare variant analysis in large-scale WGS studies. MultiSTAAR accounts for relatedness, population structure and correlation among phenotypes by jointly analyzing multiple traits, and further empowers rare variant association analysis by incorporating multiple functional annotations. We applied MultiSTAAR to jointly analyze three lipid traits (low-density lipoprotein cholesterol, high-density lipoprotein cholesterol and triglycerides) in 61,861 multi-ethnic samples from the Trans-Omics for Precision Medicine (TOPMed) Program. We discovered new associations with lipid traits missed by single-trait analysis, including rare variants within an enhancer of NIPSNAP3A and an intergenic region on chromosome 1.
24

Estimating heritability explained by local ancestry and evaluating stratification bias in admixture mapping from summary statistics

Tsz Chan et al.Apr 10, 2023
The heritability explained by local ancestry markers in an admixed population hγ2 provides crucial insight into the genetic architecture of a complex disease or trait. Estimation of hγ2 can be susceptible to biases due to population structure in ancestral populations. Here, we present a novel approach, Heritability estimation from Admixture Mapping Summary STAtistics (HAMSTA), which uses summary statistics from admixture mapping to infer heritability explained by local ancestry while adjusting for biases due to ancestral stratification. Through extensive simulations, we demonstrate that HAMSTA hγ2 estimates are approximately unbiased and are robust to ancestral stratification compared to existing approaches. In the presence of ancestral stratification, we show a HAMSTA-derived sampling scheme provides a calibrated family-wise error rate (FWER) of ~5% for admixture mapping, unlike existing FWER estimation approaches. We apply HAMSTA to 20 quantitative phenotypes of up to 15,988 self-reported African American individuals in the Population Architecture using Genomics and Epidemiology (PAGE) study. We observe hˆγ2 in the 20 phenotypes range from 0.0025 to 0.033 (mean hˆγ2=0.012+/-9.2×10-4), which translates to hˆ2 ranging from 0.062 to 0.85 (mean hˆ2=0.30+/-0.023). Across these phenotypes we find little evidence of inflation due to ancestral population stratification in current admixture mapping studies (mean inflation factor of 0.99 +/- 0.001). Overall, HAMSTA provides a fast and powerful approach to estimate genome-wide heritability and evaluate biases in test statistics of admixture mapping studies.
0

Novel genetic determinants of telomere length from a multi-ethnic analysis of 75,000 whole genome sequences in TOPMed

Margaret Taub et al.Sep 4, 2019
Telomeres shorten in replicating somatic cells and with age; in human leukocytes, telomere length (TL) is associated with a host of aging-related diseases. To date, 16 genome-wide association studies (GWAS) have identified twenty-three loci associated with leukocyte TL, but prior studies were primarily in individuals of European and Asian ancestry and relied on laboratory assays including Southern Blot and qPCR to quantify TL. Here, we estimated TL bioinformatically, leveraging whole genome sequencing (WGS) of whole blood from n=75,176 subjects in the Trans-Omics for Precision Medicine (TOPMed) Program. We performed the largest multi-ethnic and only WGS-based genome-wide association analysis of TL to date. We identified 22 associated loci (p-value <5x10-8), including 10 novel loci. Three of the novel loci map to genes involved in telomere maintenance and/or DNA damage repair: TERF2, RFWD3, and SAMHD1. Many of the 99 pathways identified in gene set enrichment analysis for the 22 loci (multiple-testing corrected false discovery rate (FDR) <0.05) pertain to telomere biology, including the top five (FDR<1x10-9). Importantly, several loci, including the recently identified TINF2 and ATM loci, showed strong ancestry-specific associations.
Load More