SD
Scott Damrauer
Author with expertise in Genomic Studies and Association Analyses
University of Pennsylvania, Philadelphia VA Medical Center, Hospital of the University of Pennsylvania
+ 13 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
19
(47% Open Access)
Cited by:
42
h-index:
52
/
i10-index:
141
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
3

A Saturated Map of Common Genetic Variants Associated with Human Height from 5.4 Million Individuals of Diverse Ancestries

Loïc Yengo et al.Jan 12, 2022
+554
E
S
L
ABSTRACT Common SNPs are predicted to collectively explain 40-50% of phenotypic variation in human height, but identifying the specific variants and associated regions requires huge sample sizes. Here we show, using GWAS data from 5.4 million individuals of diverse ancestries, that 12,111 independent SNPs that are significantly associated with height account for nearly all of the common SNP-based heritability. These SNPs are clustered within 7,209 non-overlapping genomic segments with a median size of ~90 kb, covering ~21% of the genome. The density of independent associations varies across the genome and the regions of elevated density are enriched for biologically relevant genes. In out-of-sample estimation and prediction, the 12,111 SNPs account for 40% of phenotypic variance in European ancestry populations but only ~10%-20% in other ancestries. Effect sizes, associated regions, and gene prioritization are similar across ancestries, indicating that reduced prediction accuracy is likely explained by linkage disequilibrium and allele frequency differences within associated regions. Finally, we show that the relevant biological pathways are detectable with smaller sample sizes than needed to implicate causal genes and variants. Overall, this study, the largest GWAS to date, provides an unprecedented saturated map of specific genomic regions containing the vast majority of common height-associated variants.
0

Diversity and scale: Genetic architecture of 2068 traits in the VA Million Veteran Program

Anurag Verma et al.Aug 23, 2024
+68
A
J
A
One of the justifiable criticisms of human genetic studies is the underrepresentation of participants from diverse populations. Lack of inclusion must be addressed at-scale to identify causal disease factors and understand the genetic causes of health disparities. We present genome-wide associations for 2068 traits from 635,969 participants in the Department of Veterans Affairs Million Veteran Program, a longitudinal study of diverse United States Veterans. Systematic analysis revealed 13,672 genomic risk loci; 1608 were only significant after including non-European populations. Fine-mapping identified causal variants at 6318 signals across 613 traits. One-third ( n = 2069) were identified in participants from non-European populations. This reveals a broadly similar genetic architecture across populations, highlights genetic insights gained from underrepresented groups, and presents an extensive atlas of genetic associations.
0

Mapping and characterization of structural variation in 17,795 human genomes

Haley Abel et al.Sep 14, 2024
+97
A
D
H
0

Assessing a causal relationship between circulating lipids and breast cancer risk: Mendelian randomization study

Klein Johnson et al.May 7, 2020
+6
D
K
K
Abstract Objective To assess a potential causal relationship between genetic variants associated with plasma lipid traits (high-density lipoprotein cholesterol, HDL; low-density lipoprotein cholesterol, LDL; triglycerides, TG) with risk for breast cancer. Design Mendelian randomization (MR) study. Setting and Participants Data from genome-wide association studies in up to 215,551 subjects from the Million Veterans Project were used to construct genetic instruments for plasma lipid traits. The effect of these instruments on breast cancer risk was evaluated using genetic data from the BCAC consortium based on 122,977 breast cancer cases and 105,974 controls. Exposures Genetically modified plasma levels of LDL, HDL, or TG. Main Outcomes and Measures Odds ratio (OR) for breast cancer risk per standard-deviation increase in HDL, LDL, or TG. Results We observed that a 1-SD genetically determined increase in HDL levels is associated with an increased risk for all breast cancers (HDL: OR=1.08, 95% CI=1.04-1.13, P=7.4×10 −5 ). Multivariable MR analysis, which adjusted for the effects of LDL, TG, body mass index, and age at menarche, corroborated this observation for HDL (OR=1.06, 95% CI=1.03-1.10, P=4.9×10 −4 ) and also a relationship between LDL and breast cancer risk (OR=1.03, 95% CI=1.01-1.07, P=0.02). We did not observe a difference in these relationships when stratified by breast tumor estrogen receptor status. We repeated this analysis using genetic variants independent of the leading association at core HDL pathway genes and found that these variants were also associated with risk for breast cancers (OR=1.11, 95% CI=1.06–1.16, P=1.5×10 −6 ), including gene-specific associations at ABCA1, APOE-APOC1-APOC4-APOC2 and CETP . In addition, we find evidence that genetic variation at the ABO locus affects both lipid levels and breast cancer. Conclusions Genetically elevated plasma HDL levels appear to increase breast cancer risk. Future studies are required to understand the mechanism underlying this putative causal relationship, with the goal to develop potential therapeutic strategies aimed at altering the HDL-mediated effect on breast cancer risk.
1

Exome-wide association studies in general and long-lived populations identify genetic variants related to human age

Patrick Sin‐Chan et al.Oct 24, 2023
+19
C
N
P
SUMMARY Aging is characterized by degeneration in cellular and organismal functions leading to increased disease susceptibility and death. Although our understanding of aging biology in model systems has increased dramatically, large-scale sequencing studies to understand human aging are now just beginning. We applied exome sequencing and association analyses (ExWAS) to identify age-related variants on 58,470 participants of the DiscovEHR cohort. Linear Mixed Model regression analyses of age at last encounter revealed variants in genes known to be linked with clonal hematopoiesis of indeterminate potential, which are associated with myelodysplastic syndromes, as top signals in our analysis, suggestive of age-related somatic mutation accumulation in hematopoietic cells despite patients lacking clinical diagnoses. In addition to APOE , we identified rare DISP2 rs183775254 (p = 7.40×10 −10 ) and ZYG11A rs74227999 (p = 2.50×10 −08 ) variants that were negatively associated with age in either both sexes combined and females, respectively, which were replicated with directional consistency in two independent cohorts. Epigenetic mapping showed these variants are located within cell-type-specific enhancers, suggestive of important transcriptional regulatory functions. To discover variants associated with extreme age, we performed exome-sequencing on persons of Ashkenazi Jewish descent ascertained for extensive lifespans. Case-Control analyses in 525 Ashkenazi Jews cases (Males ≥ 92 years, Females ≥ 95years) were compared to 482 controls. Our results showed variants in APOE (rs429358, rs6857), and TMTC2 (rs7976168) passed Bonferroni-adjusted p-value, as well as several nominally-associated population-specific variants. Collectively, our Age-ExWAS, the largest performed to date, confirmed and identified previously unreported candidate variants associated with human age.
57

A multi-layer functional genomic analysis to understand noncoding genetic variation in lipids

Shweta Ramdas et al.Oct 24, 2023
+532
S
J
S
Abstract A major challenge of genome-wide association studies (GWAS) is to translate phenotypic associations into biological insights. Here, we integrate a large GWAS on blood lipids involving 1.6 million individuals from five ancestries with a wide array of functional genomic datasets to discover regulatory mechanisms underlying lipid associations. We first prioritize lipid-associated genes with expression quantitative trait locus (eQTL) colocalizations, and then add chromatin interaction data to narrow the search for functional genes. Polygenic enrichment analysis across 697 annotations from a host of tissues and cell types confirms the central role of the liver in lipid levels, and highlights the selective enrichment of adipose-specific chromatin marks in high-density lipoprotein cholesterol and triglycerides. Overlapping transcription factor (TF) binding sites with lipid-associated loci identifies TFs relevant in lipid biology. In addition, we present an integrative framework to prioritize causal variants at GWAS loci, producing a comprehensive list of candidate causal genes and variants with multiple layers of functional evidence. Two prioritized genes, CREBRF and RRBP1 , show convergent evidence across functional datasets supporting their roles in lipid biology.
0

Exome-by-phenome-wide rare variant gene burden association with electronic health record phenotypes

Joseph Park et al.May 7, 2020
+8
M
N
J
Background: By coupling large-scale DNA sequencing with electronic health records (EHR), "genome-first" approaches can enhance our understanding of the contribution of rare genetic variants to disease. Aggregating rare, loss-of-function variants in a candidate gene into a "gene burden" to test for association with EHR phenotypes can identify both known and novel clinical implications for the gene in human disease. However, this methodology has not yet been applied on both an exome-wide and phenome-wide scale, and the clinical ontologies of rare loss-of-function variants in many genes have yet to be described. Methods: We leveraged whole exome sequencing (WES) data in participants (N=11,451) in the Penn Medicine Biobank (PMBB) to address on an exome-wide scale the association of a burden of rare loss-of-function variants in each gene with diverse EHR phenotypes using a phenome-wide association study (PheWAS) approach. For discovery, we collapsed rare (minor allele frequency (MAF) ≤ 0.1%) predicted loss-of-function (pLOF) variants ( i.e. frameshift insertions/deletions, gain/loss of stop codon, or splice site disruption) per gene to perform a gene burden PheWAS. Subsequent evaluation of the significant gene burden associations was done by collapsing rare (MAF ≤ 0.1%) missense variants with Rare Exonic Variant Ensemble Learner (REVEL) scores ≥ 0.5 into corresponding yet distinct gene burdens, as well as interrogation of individual low-frequency to common (MAF > 0.1%) pLOF variants and missense variants with REVEL ≥ 0.5. We replicated our findings using the UK Biobank's (UKBB) whole exome sequence dataset (N=49,960). Results: From the pLOF-based discovery phase, we identified 106 gene burdens with phenotype associations at p<10-6 from our exome-by-phenome-wide association studies. Positive-control associations included TTN (cardiomyopathy, p=7.83E-13), MYBPC3 (hypertrophic cardiomyopathy, p=3.48E-15), CFTR (cystic fibrosis, p=1.05E-15), CYP2D6 (adverse effects due to opiates/narcotics, p=1.50E-09), and BRCA2 (breast cancer, p=1.36E-07). Of the 106 genes, 12 gene-phenotype relationships were also detected by REVEL-informed missense-based gene burdens and 19 by single-variant analyses, demonstrating the robustness of these gene-phenotype relationships. Three genes showed evidence of association using both additional methods ( BRCA1, CFTR, TGM6 ), leading to a total of 28 robust gene-phenotype associations within PMBB. Furthermore, replication studies in UKBB validated 30 of 106 gene burden associations, of which 12 demonstrated robustness in PMBB. Conclusion: Our study presents 12 exome-by-phenome-wide robust gene-phenotype associations, which include three proof-of-concept associations and nine novel findings. We show the value of aggregating rare pLOF variants into gene burdens on an exome-wide scale for unbiased association with EHR phenotypes to identify novel clinical ontologies of human genes. Furthermore, we show the significance of evaluating gene burden associations through complementary, yet non-overlapping genetic association studies from the same dataset. Our results suggest that this approach applied to even larger cohorts of individuals with WES or whole-genome sequencing data linked to EHR phenotype data will yield many new insights into the relationship of genetic variation and disease phenotypes.
0

Polygenic risk of psychiatric disorders exhibits cross-trait associations in electronic health record data

Rachel Kember et al.May 7, 2020
+6
S
A
R
Objective: Prediction of disease risk is a key component of precision medicine. Common, complex traits such as psychiatric disorders have a complex polygenic architecture making the identification of a single risk predictor difficult. Polygenic risk scores (PRS) denoting the sum of an individual's genetic liability for a disorder are a promising biomarker for psychiatric disorders, but require evaluation in a clinical setting. Methods: We develop PRS for six psychiatric disorders (schizophrenia, bipolar disorder, major depressive disorder, cross disorder, attention-deficit/hyperactivity disorder, anorexia nervosa) and 17 non-psychiatric traits in over 10,000 individuals from the Penn Medicine Biobank with accompanying electronic health records. We perform phenome-wide association analyses to test their association across disease categories. Results: Four of the six psychiatric PRS were associated with their primary phenotypes (odds ratios between 1.2-1.6). Individuals in the highest quintile of risk had between 1.4-2.9 times higher odds of the disorder than the remaining 80% of individuals. Cross-trait associations were identified both within the psychiatric domain and across trait domains. PRS for coronary artery disease and years of education were significantly associated with psychiatric disorders, largely driven by an association with tobacco use disorder. Conclusions: We demonstrate that the genetic architecture of common psychiatric disorders identified in a clinical setting confirms that which has been derived from large consortia. Even though the risk associated is low in this context, these results suggest that as identification of genetic markers proceeds, PRS is a promising approach for prediction of psychiatric disorders and associated conditions in clinical registries.
1

Multi-response Mendelian randomization: Identification of shared and distinct exposures for multimorbidity and multiple related disease outcomes

Verena Zuber et al.Oct 24, 2023
+7
M
A
V
Abstract The existing framework of Mendelian randomization (MR) infers the causal effect of one or multiple exposures on one single outcome. It is not designed to jointly model multiple outcomes, as would be necessary to detect causes of more than one outcome and would be relevant to model multimorbidity or other related disease outcomes. Here, we introduce Multi-response Mendelian randomization (MR 2 ), a novel MR method specifically designed for multiple outcomes to identify exposures that cause more than one outcome or, conversely, exposures that exert their effect on distinct responses. MR 2 uses a sparse Bayesian Gaussian copula regression framework to detect causal effects while estimating the residual correlation between summary-level outcomes, i.e., the correlation that cannot be explained by the exposures, and viceversa . We show both theoretically and in a comprehensive simulation study how unmeasured shared pleiotropy induces residual correlation. We also reveal how non-genetic factors that affect more than one outcome contribute to their correlation. We demonstrate that by accounting for residual correlation, MR 2 has higher power to detect shared exposures causing more than one outcome. It also provides more accurate causal effect estimates than existing methods that ignore the dependence between related responses. Finally, we illustrate how MR 2 detects shared and distinct causal exposures for five cardiovascular diseases in two applications considering cardiometabolic and lipidomic exposures and uncovers residual correlation between summary-level outcomes reflecting known relationships between cardiovascular diseases.
0

Abstract 3117: Cannabis Use Disorder And The Risk Of Atherosclerotic Cardiovascular Diseases

Pranav Sharma et al.Sep 14, 2024
+5
R
I
P
Introduction: With the legalization of cannabis, concerns have emerged regarding the long-term health impact of excessive use. The current literature has struggled to address questions about the adverse effects of cannabis, particularly in the context of atherosclerotic cardiovascular disease (ASCVD). Using genetic approaches to causal inference, we explored the relationship between cannabis use disorder (CUD) and ASCVD. Methods: Genetic instruments were constructed from a multi-population GWAS comprising 64,314 individuals with and 990,051 without CUD. Outcome data for coronary artery disease (CAD), ischemic stroke, peripheral artery disease (PAD), and abdominal aortic aneurysms (AAA) were derived from multi-population GWAS. Univariable Mendelian randomization (MR) was performed using the inverse-variance weighted (IVW) method to test the association of CUD with each outcome. Multivariable MR (MVMR) was performed to assess if the impact of cardiometabolic risk factors accounted for the association of CUD with ASCVD using summary statistics from publicly available GWAS of cardiometabolic risk factors. Results: CUD was associated with increased risk of CAD (OR 1.27; 95% CI 1.17-1.38; P=<0.01), ischemic stroke (OR 1.10; 95%CI 1.03-1.19; P=<0.01), PAD (OR 1.31; 95% CI 1.17-1.46; P=<0.01), and AAA (OR 1.37; 95% CI 1.21-1.55; P=<0.01). CUD also had a significant impact on cardiometabolic risk factors including triglycerides, waist-to-hip ratio, BMI, type 2 diabetes, obesity, and heart failure. The effect of CUD on ASCVD, other than stroke, remained largely independent of traditional risk factors except for lipids and tobacco smoking. Controlling for lifetime smoking index attenuated all associations between CUD and ASCVD except CAD, which remained significant (OR 1.21; 95% CI 1.11-1.31). Conclusion: Excessive cannabis use has the potential to increase ASCVD risk, independent of cardiometabolic risk factors, although this risk may in part be attributable to shared susceptibility to lipids and tobacco use. Awareness of the long-term risks of excessive cannabis use should be considered when formulating medical advice and public policy.
Load More