CL
Cathy Laurie
Author with expertise in Genomic Studies and Association Analyses
University of Washington, Association of Research Libraries, National Heart Lung and Blood Institute
+ 7 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
14
(21% Open Access)
Cited by:
23
h-index:
71
/
i10-index:
152
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Inherited Causes of Clonal Hematopoiesis of Indeterminate Potential in TOPMed Whole Genomes

Alexander Bick et al.May 6, 2020
+120
S
J
A
ABSTRACT Age is the dominant risk factor for most chronic human diseases; yet the mechanisms by which aging confers this risk are largely unknown. 1 Recently, the age-related acquisition of somatic mutations in regenerating hematopoietic stem cell populations was associated with both hematologic cancer incidence 2–4 and coronary heart disease prevalence. 5 Somatic mutations with leukemogenic potential may confer selective cellular advantages leading to clonal expansion, a phenomenon termed ‘Clonal Hematopoiesis of Indeterminate Potential’ (CHIP). 6 Simultaneous germline and somatic whole genome sequence analysis now provides the opportunity to identify root causes of CHIP. Here, we analyze high-coverage whole genome sequences from 97,691 participants of diverse ancestries in the NHLBI TOPMed program and identify 4,229 individuals with CHIP. We identify associations with blood cell, lipid, and inflammatory traits specific to different CHIP genes. Association of a genome-wide set of germline genetic variants identified three genetic loci associated with CHIP status, including one locus at TET2 that was African ancestry specific. In silico -informed in vitro evaluation of the TET2 germline locus identified a causal variant that disrupts a TET2 distal enhancer. Aggregates of rare germline loss-of-function variants in CHEK2 , a DNA damage repair gene, predisposed to CHIP acquisition. Overall, we observe that germline genetic variation altering hematopoietic stem cell function and the fidelity of DNA-damage repair increase the likelihood of somatic mutations leading to CHIP.
0
Citation22
0
Save
8

Protein prediction for trait mapping in diverse populations

Ryan Schubert et al.Oct 24, 2023
+29
I
E
R
Abstract Genetically regulated gene expression has helped elucidate the biological mechanisms underlying complex traits. Improved high-throughput technology allows similar interrogation of the genetically regulated proteome for understanding complex trait mechanisms. Here, we used the Trans-omics for Precision Medicine (TOPMed) Multi-omics pilot study, which comprises data from Multi-Ethnic Study of Atherosclerosis (MESA), to optimize genetic predictors of the plasma proteome for genetically regulated proteome-wide association studies (PWAS) in diverse populations. We built predictive models for protein abundances using data collected in TOPMed MESA, for which we have measured 1,305 proteins by a SOMAscan assay. We compared predictive models built via elastic net regression to models integrating posterior inclusion probabilities estimated by fine-mapping SNPs prior to elastic net. In order to investigate the transferability of predictive models across ancestries, we built protein prediction models in all four of the TOPMed MESA populations, African American (n=183), Chinese (n=71), European (n=416), and Hispanic/Latino (n=301), as well as in all populations combined. As expected, fine-mapping produced more significant protein prediction models, especially in African ancestries populations, potentially increasing opportunity for discovery. When we tested our TOPMed MESA models in the independent European INTERVAL study, fine-mapping improved cross-ancestries prediction for some proteins. Using GWAS summary statistics from the Population Architecture using Genomics and Epidemiology (PAGE) study, which comprises ~50,000 Hispanic/Latinos, African Americans, Asians, Native Hawaiians, and Native Americans, we applied S-PrediXcan to perform PWAS for 28 complex traits. The most protein-trait associations were discovered, colocalized, and replicated in large independent GWAS using proteome prediction model training populations with similar ancestries to PAGE. At current training population sample sizes, performance between baseline and fine-mapped protein prediction models in PWAS was similar, highlighting the utility of elastic net. Our predictive models in diverse populations are publicly available for use in proteome mapping methods at https://doi.org/10.5281/zenodo.4837328 . Author summary Gene regulation is a critical mechanism underlying complex traits. Transcriptome-wide association studies (TWAS) have helped elucidate potential mechanisms because each association connects a gene rather than a variant to the complex trait. Like genome-wide association studies (GWAS), most TWAS are still conducted exclusively in populations of European ancestry, which misses the opportunity to test the full spectrum of human genetic variation for associations with complex traits. Here, move beyond the transcriptome and because protein measurement assays are growing to allow interrogation of the proteome, we use data from TOPMed MESA to develop genetic predictors of protein abundance in diverse ancestry populations. We compare model-building strategies with the goal of providing the best resource for protein association discovery with available data. We demonstrate how these prediction models can be used to perform proteome-wide association studies (PWAS) in diverse populations. We show the most protein-trait associations were discovered, colocalized, and replicated in independent cohorts using proteome prediction model training populations with similar ancestries to individuals in the GWAS. We shared our protein prediction models and performance statistics publicly to facilitate future proteome mapping studies in diverse populations.
8
Paper
Citation1
0
Save
0

The PAGE Study: How Genetic Diversity Improves Our Understanding of the Architecture of Complex Traits

Genevieve Wojcik et al.May 6, 2020
+83
K
W
G
Genome-wide association studies (GWAS) have laid the foundation for many downstream investigations, including the biology of complex traits, drug development, and clinical guidelines. However, the dominance of European-ancestry populations in GWAS creates a biased view of human variation and hinders the translation of genetic associations into clinical and public health applications. To demonstrate the benefit of studying underrepresented populations, the Population Architecture using Genomics and Epidemiology (PAGE) study conducted a GWAS of 26 clinical and behavioral phenotypes in 49,839 non-European individuals. Using novel strategies for multi-ethnic analysis of admixed populations, we confirm 574 GWAS catalog variants across these traits, and find 28 novel loci and 42 residual signals in known loci. Our data show strong evidence of effect-size heterogeneity across ancestries for published GWAS associations, which substantially restricts genetically-guided precision medicine. We advocate for new, large genome-wide efforts in diverse populations to reduce health disparities.
0

Imputation-Based Genomic Coverage Assessments of Current Genotyping Arrays: Illumina HumanCore, OmniExpress, Multi-Ethnic global array and sub-arrays, Global Screening Array, Omni2.5M, Omni5M, and Affymetrix UK Biobank

Sarah Nelson et al.May 6, 2020
+2
K
J
S
Genotyping arrays have been widely adopted as an efficient means to interrogate variation across the human genome. Genetic variants may be observed either directly, via genotyping, or indirectly, through linkage disequilibrium with a genotyped variant. The total proportion of genomic variation captured by an array, either directly or indirectly, is referred to as “genomic coverage.” Here we use genotype imputation and Phase 3 of the 1000 Genomes Project to assess genomic coverage of several modern genotyping arrays. We find that in general, coverage increases with increasing array density. However, arrays designed to cover specific populations may yield better coverage in those populations compared to denser arrays not tailored to the given population. Ultimately, array choice involves trade-offs between cost, density, and coverage, and our work helps inform investigators weighing these choices and trade-offs.
0

Novel genetic determinants of telomere length from a multi-ethnic analysis of 75,000 whole genome sequences in TOPMed

Margaret Taub et al.May 7, 2020
+145
R
M
M
Telomeres shorten in replicating somatic cells and with age; in human leukocytes, telomere length (TL) is associated with a host of aging-related diseases. To date, 16 genome-wide association studies (GWAS) have identified twenty-three loci associated with leukocyte TL, but prior studies were primarily in individuals of European and Asian ancestry and relied on laboratory assays including Southern Blot and qPCR to quantify TL. Here, we estimated TL bioinformatically, leveraging whole genome sequencing (WGS) of whole blood from n=75,176 subjects in the Trans-Omics for Precision Medicine (TOPMed) Program. We performed the largest multi-ethnic and only WGS-based genome-wide association analysis of TL to date. We identified 22 associated loci (p-value <5x10-8), including 10 novel loci. Three of the novel loci map to genes involved in telomere maintenance and/or DNA damage repair: TERF2, RFWD3, and SAMHD1. Many of the 99 pathways identified in gene set enrichment analysis for the 22 loci (multiple-testing corrected false discovery rate (FDR) <0.05) pertain to telomere biology, including the top five (FDR<1x10-9). Importantly, several loci, including the recently identified TINF2 and ATM loci, showed strong ancestry-specific associations.
0

Efficient variant set mixed model association tests for continuous and binary traits in large-scale whole genome sequencing studies

Han Chen et al.May 7, 2020
+43
J
J
H
With advances in Whole Genome Sequencing (WGS) technology, more advanced statistical methods for testing genetic association with rare variants are being developed. Methods in which variants are grouped for analysis are also known as variant-set, gene-based, and aggregate unit tests. The burden test and Sequence Kernel Association Test (SKAT) are two widely used variant-set tests, which were originally developed for samples of unrelated individuals and later have been extended to family data with known pedigree structures. However, computationally-efficient and powerful variant-set tests are needed to make analyses tractable in large-scale WGS studies with complex study samples. In this paper, we propose the variant-Set Mixed Model Association Tests (SMMAT) for continuous and binary traits using the generalized linear mixed model framework. These tests can be applied to large-scale WGS studies involving samples with population structure and relatedness, such as in the National Heart, Lung, and Blood Institute's Trans-Omics for Precision Medicine (TOPMed) program. SMMAT tests share the same null model for different variant sets, and a virtue of this null model, which includes covariates only, is that it needs to be only fit once for all tests in each genome-wide analysis. Simulation studies show that all the proposed SMMAT tests correctly control type I error rates for both continuous and binary traits in the presence of population structure and relatedness. We also illustrate our tests in a real data example of analysis of plasma fibrinogen levels in the TOPMed program (n = 23,763), using the Analysis Commons, a cloud-based computing platform.
0

Multiethnic Meta-analysis Identifies New Loci for Pulmonary Function

Annah Wyss et al.May 7, 2020
+87
M
T
A
Nearly 100 loci have been identified for pulmonary function, almost exclusively in studies of European ancestry populations. We extend previous research by meta-analyzing genome-wide association studies of 1000 Genomes imputed variants in relation to pulmonary function in a multiethnic population of 90,715 individuals of European (N=60,552), African (N=8,429), Asian (N=9,959), and Hispanic/Latino (N=11,775) ethnicities. We identified over 50 novel loci at genome-wide significance in ancestry-specific and/or multiethnic meta-analyses. Recent fine mapping methods incorporating functional annotation, gene expression, and/or differences in linkage disequilibrium between ethnicities identified potential causal variants and genes at known and newly identified loci. Sixteen of the novel genes encode proteins with predicted or established drug targets, including KCNK2 and CDK12.
0

Multi-ancestry GWAS of the electrocardiographic PR interval identifies 210 loci underlying cardiac conduction

Ιωάννα Ντάλλα et al.May 7, 2020
+183
J
L
Ι
The electrocardiographic PR interval reflects atrioventricular conduction, and is associated with conduction abnormalities, pacemaker implantation, atrial fibrillation (AF), and cardiovascular mortality[1][1],[2][2]. We performed multi-ancestry (N=293,051) and European only (N=271,570) genome-wide association (GWAS) meta-analyses for the PR interval, discovering 210 loci of which 149 are novel. Variants at all loci nearly doubled the percentage of heritability explained, from 33.5% to 62.6%. We observed enrichment for genes involved in cardiac muscle development/contraction and the cytoskeleton highlighting key regulation processes for atrioventricular conduction. Additionally, 19 novel loci harbour genes underlying inherited monogenic heart diseases suggesting the role of these genes in cardiovascular pathology in the general population. We showed that polygenic predisposition to PR interval duration is an endophenotype for cardiovascular disease risk, including distal conduction disease, AF, atrioventricular pre-excitation, non-ischemic cardiomyopathy, and coronary heart disease. These findings advance our understanding of the polygenic basis of cardiac conduction, and the genetic relationship between PR interval duration and cardiovascular disease. [1]: #ref-1 [2]: #ref-2
0

Integrated Computing And Tracking System For Centralized High-Throughput Genetic Analysis: A Case Study

Adrienne Stilp et al.May 7, 2020
T
C
S
A
The Genetic Analysis Center (GAC) of the Hispanic Community Health Study/Study of Latinos (HCHS/SOL) developed an Integrated Computing and Tracking system (ICT) in order to perform genome-wide and other genetic association studies automatically and efficiently, while documenting all analysis specifications. This system provides easy-to-use analysis set-up and computing procedures, automatic reports, and analysis search functionality due to integration with an on-site database. In this paper we describe the ICT and demonstrate how it satisfies key principles of reproducible research, while respecting constraints and challenges arising from using very large, restricted access, human-subjects data. This case study may benefit other groups that have similar requirements for high-throughput analysis execution and management.
0

Trans-ethnic genome-wide association study provides insight into effector genes and molecular mechanisms for kidney function and highlights a causal effect on kidney-specific disease aetiologies

Andrew Morris et al.May 7, 2020
+65
H
T
A
Chronic kidney disease (CKD) affects ~10% of the global population, with considerable ethnic differences in prevalence and aetiology. We assembled genome-wide association studies (GWAS) of estimated glomerular filtration rate (eGFR), a measure of kidney function that defines CKD, in 312,468 individuals from four ancestry groups. We identified 93 loci (20 novel), which were delineated to 127 distinct association signals. These signals were homogenous across ancestries, and were enriched for coding exons, kidney-specific histone modifications, and binding sites for HDAC2 and EZH2. Fine-mapping revealed 40 high-confidence variants driving eGFR associations, and highlighted potential causal genes with kidney cell-type specific expression in glomerulus, and proximal and distal nephron. Mendelian randomisation (MR) highlighted causal effects of eGFR on overall and cause-specific CKD, kidney stone formation and diastolic blood pressure (DBP). These results define novel molecular mechanisms and effector genes for eGFR, offering insight into downstream clinical outcomes and potential routes to CKD treatment development.
Load More