RK
Rachel Kember
Author with expertise in Genomic Studies and Association Analyses
Philadelphia VA Medical Center, University of Pennsylvania, University of Kentucky
+ 7 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
8
(38% Open Access)
Cited by:
33
h-index:
16
/
i10-index:
22
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
282

Multivariate genomic analysis of 1.5 million people identifies genes related to addiction, antisocial behavior, and health

Richard Linnér et al.Oct 24, 2023
+23
P
T
R
Abstract Behaviors and disorders related to self-regulation, such as substance use, antisocial conduct, and ADHD, are collectively referred to as externalizing and have a shared genetic liability. We applied a multivariate approach that leverages genetic correlations among externalizing traits for genome-wide association analyses. By pooling data from ~1.5 million people, our approach is statistically more powerful than single-trait analyses and identifies more than 500 genetic loci. The identified loci were enriched for genes expressed in the brain and related to nervous system development. A polygenic score constructed from our results captures variation in a broad range of behavioral and medical outcomes that were not part of our genome-wide analyses, including traits that until now lacked well-performing polygenic scores, such as opioid use disorder, suicide, HIV infections, criminal convictions, and unemployment. Our findings are consistent with the idea that persistent difficulties in self-regulation can be conceptualized as a neurodevelopmental condition.
282
Paper
Citation19
0
Save
3

A Saturated Map of Common Genetic Variants Associated with Human Height from 5.4 Million Individuals of Diverse Ancestries

Loïc Yengo et al.Jan 12, 2022
+554
E
S
L
ABSTRACT Common SNPs are predicted to collectively explain 40-50% of phenotypic variation in human height, but identifying the specific variants and associated regions requires huge sample sizes. Here we show, using GWAS data from 5.4 million individuals of diverse ancestries, that 12,111 independent SNPs that are significantly associated with height account for nearly all of the common SNP-based heritability. These SNPs are clustered within 7,209 non-overlapping genomic segments with a median size of ~90 kb, covering ~21% of the genome. The density of independent associations varies across the genome and the regions of elevated density are enriched for biologically relevant genes. In out-of-sample estimation and prediction, the 12,111 SNPs account for 40% of phenotypic variance in European ancestry populations but only ~10%-20% in other ancestries. Effect sizes, associated regions, and gene prioritization are similar across ancestries, indicating that reduced prediction accuracy is likely explained by linkage disequilibrium and allele frequency differences within associated regions. Finally, we show that the relevant biological pathways are detectable with smaller sample sizes than needed to implicate causal genes and variants. Overall, this study, the largest GWAS to date, provides an unprecedented saturated map of specific genomic regions containing the vast majority of common height-associated variants.
0

Polygenic Risk Scores for Cardio-renal-metabolic Diseases in the Penn Medicine Biobank

Rachel Kember et al.May 7, 2020
+6
S
A
R
Cardio-renal-metabolic (CaReMe) conditions are common and the leading cause of mortality around the world. Genome-wide association studies have shown that these diseases are polygenic and share many genetic risk factors. Identifying individuals at high genetic risk will allow us to target prevention and treatment strategies. Polygenic risk scores (PRS) are aggregate weighted counts that can demonstrate an individual’s genetic liability for disease. However, current PRS are often based on European ancestry individuals, limiting the implementation of precision medicine efforts in diverse populations. In this study, we develop PRS for six diseases and traits related to cardio-renal-metabolic disease in the Penn Medicine Biobank. We investigate their performance in both European and African ancestry individuals, and identify genetic and phenotypic overlap within these conditions. We find that genetic risk is associated with the primary phenotype in both ancestries, but this does not translate into a model of predictive value in African ancestry individuals. We conclude that future research should prioritize genetic studies in diverse ancestries in order to address this disparity.
0

Exome-by-phenome-wide rare variant gene burden association with electronic health record phenotypes

Joseph Park et al.May 7, 2020
+8
M
N
J
Background: By coupling large-scale DNA sequencing with electronic health records (EHR), "genome-first" approaches can enhance our understanding of the contribution of rare genetic variants to disease. Aggregating rare, loss-of-function variants in a candidate gene into a "gene burden" to test for association with EHR phenotypes can identify both known and novel clinical implications for the gene in human disease. However, this methodology has not yet been applied on both an exome-wide and phenome-wide scale, and the clinical ontologies of rare loss-of-function variants in many genes have yet to be described. Methods: We leveraged whole exome sequencing (WES) data in participants (N=11,451) in the Penn Medicine Biobank (PMBB) to address on an exome-wide scale the association of a burden of rare loss-of-function variants in each gene with diverse EHR phenotypes using a phenome-wide association study (PheWAS) approach. For discovery, we collapsed rare (minor allele frequency (MAF) ≤ 0.1%) predicted loss-of-function (pLOF) variants ( i.e. frameshift insertions/deletions, gain/loss of stop codon, or splice site disruption) per gene to perform a gene burden PheWAS. Subsequent evaluation of the significant gene burden associations was done by collapsing rare (MAF ≤ 0.1%) missense variants with Rare Exonic Variant Ensemble Learner (REVEL) scores ≥ 0.5 into corresponding yet distinct gene burdens, as well as interrogation of individual low-frequency to common (MAF > 0.1%) pLOF variants and missense variants with REVEL ≥ 0.5. We replicated our findings using the UK Biobank's (UKBB) whole exome sequence dataset (N=49,960). Results: From the pLOF-based discovery phase, we identified 106 gene burdens with phenotype associations at p<10-6 from our exome-by-phenome-wide association studies. Positive-control associations included TTN (cardiomyopathy, p=7.83E-13), MYBPC3 (hypertrophic cardiomyopathy, p=3.48E-15), CFTR (cystic fibrosis, p=1.05E-15), CYP2D6 (adverse effects due to opiates/narcotics, p=1.50E-09), and BRCA2 (breast cancer, p=1.36E-07). Of the 106 genes, 12 gene-phenotype relationships were also detected by REVEL-informed missense-based gene burdens and 19 by single-variant analyses, demonstrating the robustness of these gene-phenotype relationships. Three genes showed evidence of association using both additional methods ( BRCA1, CFTR, TGM6 ), leading to a total of 28 robust gene-phenotype associations within PMBB. Furthermore, replication studies in UKBB validated 30 of 106 gene burden associations, of which 12 demonstrated robustness in PMBB. Conclusion: Our study presents 12 exome-by-phenome-wide robust gene-phenotype associations, which include three proof-of-concept associations and nine novel findings. We show the value of aggregating rare pLOF variants into gene burdens on an exome-wide scale for unbiased association with EHR phenotypes to identify novel clinical ontologies of human genes. Furthermore, we show the significance of evaluating gene burden associations through complementary, yet non-overlapping genetic association studies from the same dataset. Our results suggest that this approach applied to even larger cohorts of individuals with WES or whole-genome sequencing data linked to EHR phenotype data will yield many new insights into the relationship of genetic variation and disease phenotypes.
0

Genetic pleiotropy between mood disorders, metabolic, and endocrine traits in a multigenerational pedigree

Rachel Kember et al.May 7, 2020
+7
J
L
R
Bipolar disorder (BD) is a mental disorder characterized by alternating periods of depression and mania. Individuals with BD have higher levels of early mortality than the general population, and a substantial proportion of this may be due to increased risk for comorbid diseases. Recent evidence suggests that pleiotropy, either in the form of a single risk-allele or the combination of multiple loci genome-wide, may underlie medical comorbidity between traits and diseases. To identify the molecular events that underlie BD and related medical comorbidities, we generated imputed whole genome sequence (WGS) data using a population specific reference panel, for an extended multigenerational Old Order Amish pedigree (400 family members) segregating BD and related disorders. First, we investigated all putative disease-causing variants at known Mendelian disease loci present in this pedigree. Second, we performed genomic profiling using polygenic risk scores to establish each individual's risk for several complex diseases. To explore the contribution of disease genes to BD we performed gene-based and variant-based association tests for BD, and found that Mendelian disease genes are enriched in the top results from both tests (OR=20.3, p=1x10-3; OR=2.2, p=1x10-2). We next identified a set of Mendelian variants that co-occur in individuals with BD more frequently than their unaffected family members, including the R3527Q mutation in APOB associated with hypercholesterolemia. Using polygenic risk scores, we demonstrated that BD individuals from this pedigree were enriched for the same common risk-alleles for BD as in the general population (β=0.416, p=6x10-4). Furthermore, in the extended Amish family we find evidence for a common genetic etiology between BD and clinical autoimmune thyroid disease (p=1x10-4), diabetes (p=1x10-3), and lipid traits such as triglyceride levels (p=3x10-4). We identify genomic regions that contribute to the differences between BD individuals and unaffected family members by calculating local genetic risk for independent LD blocks. Our findings provide evidence for the extensive genetic pleiotropy that can drive epidemiological findings of comorbidities between diseases and other complex traits. Identifying such patterns may enable the subtyping of complex diseases and facilitate our understanding of the genetic mechanisms underlying phenotypic heterogeneity.
0

Rare variants in the genetic background modulate the expressivity of neurodevelopmental disorders

Lucilla Pizzo et al.May 7, 2020
+53
A
M
L
Purpose: To assess the contribution of rare variants in the genetic background towards variability of neurodevelopmental phenotypes in individuals with rare copy-number variants (CNVs) and gene-disruptive mutations. Methods: We analyzed quantitative clinical information, exome-sequencing, and microarray data from 757 probands and 233 parents and siblings who carry disease-associated mutations. Results: The number of rare secondary mutations in functionally intolerant genes (second-hits) correlated with the expressivity of neurodevelopmental phenotypes in probands with 16p12.1 deletion (n=23, p=0.004) and in probands with autism carrying gene-disruptive mutations (n=184, p=0.03) compared to their carrier family members. Probands with 16p12.1 deletion and a strong family history presented more severe clinical features (p=0.04) and higher burden of second-hits compared to those with mild/no family history (p=0.001). The number of secondary variants also correlated with the severity of cognitive impairment in probands carrying pathogenic rare CNVs (n=53) or de novo mutations in disease genes (n=290), and negatively correlated with head size among 80 probands with 16p11.2 deletion. These second-hits involved known disease-associated genes such as SETD5, AUTS2, and NRXN1, and were enriched for genes affecting cellular and developmental processes. Conclusion: Accurate genetic diagnosis of complex disorders will require complete evaluation of the genetic background even after a candidate gene mutation is identified.
11

Multi-trait genome-wide association analyses leveraging alcohol use disorder findings identify novel loci for smoking behaviors in the Million Veteran Program

Youshu Cheng et al.Oct 24, 2023
+8
H
C
Y
Abstract Smoking behaviors and alcohol use disorder (AUD), moderately heritable traits, commonly co-occur in the general population. Single-trait genome-wide association studies (GWAS) have identified multiple loci for smoking and AUD. However, GWASs that have aimed to identify loci contributing to comorbid smoking and AUD have used small samples and thus have not been highly informative. Applying multi-trait analysis of GWASs (MTAG), we conducted a joint GWAS of smoking and AUD with data from the Million Veteran Program (N=318,694). By leveraging GWAS summary statistics for AUD, MTAG identified 21 genome-wide significant (GWS) loci associated with smoking initiation and 18 loci associated with smoking cessation compared to 16 and 8 loci, respectively, identified by single-trait GWAS. The novel loci for smoking behaviors identified by MTAG included those previously associated with psychiatric or substance use traits. Colocalization analysis identified 10 loci shared by AUD and smoking status traits, all of which achieved GWS in MTAG, including variants on SIX3, NCAM1 , and near DRD2 . Functional annotation of the MTAG variants highlighted biologically important regions on ZBTB20, DRD2, PPP6C , and GCKR that contribute to smoking behaviors. In contrast, MTAG of smoking behaviors and alcohol consumption (AC) did not enhance discovery compared with single-trait GWAS for smoking behaviors. We conclude that using MTAG to augment the power of GWAS enables the identification of novel genetic variants for commonly comorbid phenotypes, providing new insights into their pleiotropic effects on smoking behavior and AUD.
0

Meta-analysis of problematic alcohol use in 435,563 individuals identifies 29 risk variants and yields insights into biology, pleiotropy and causality

Hang Zhou et al.May 7, 2020
+23
S
J
H
Problematic alcohol use (PAU) is a leading cause of death and disability worldwide. Although genome-wide association studies (GWASs) have identified PAU risk genes, the genetic architecture of this trait is not fully understood. We conducted a proxy-phenotype meta-analysis of PAU combining alcohol use disorder and problematic drinking in 435,563 European-ancestry individuals. We identified 29 independent risk variants, 19 of them novel. PAU was genetically correlated with 138 phenotypes, including substance use and psychiatric traits. Phenome-wide polygenic risk score analysis in an independent biobank sample (BioVU, n=67,589) confirmed the genetic correlations between PAU and substance use and psychiatric disorders. Genetic heritability of PAU was enriched in brain and in genomic conserved and regulatory regions. Mendelian randomization suggested causal effects on liability to PAU of substance use, psychiatric status, risk-taking behavior, and cognitive performance. In summary, this large PAU meta-analysis identified novel risk loci and revealed genetic relationships with numerous other outcomes.