AK
Anna Köttgen
Author with expertise in Genomic Studies and Association Analyses
University Medical Center Freiburg, Johns Hopkins University, University of Freiburg
+ 14 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
13
(54% Open Access)
Cited by:
37
h-index:
80
/
i10-index:
211
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
35

Plasma proteome analyses in individuals of European and African ancestry identify cis-pQTLs and models for proteome-wide association studies

Jingning Zhang et al.Oct 24, 2023
+8
A
D
J
Abstract Improved understanding of genetic regulation of proteome can facilitate the identification of causal mechanisms for complex traits. We analyzed data on 4,657 plasma proteins from 7,213 European American (EA) and 1,871 African American (AA) individuals from the ARIC study, and further replicated findings on 467 AA individuals from the AASK study. Here we identified 2,004 proteins in EA and 1,618 in AA, with majority overlapping, which showed associations with common variants in cis -regions. Availability of AA samples led to smaller credible sets and significant number of population-specific cis -pQTLs. Elastic-net produced powerful models for protein prediction in both populations. An application of proteome-wide association studies (PWAS) to serum urate and gout, implicated several proteins, including IL1RN, revealing the promise of the drug anakinra to treat acute gout flares. Our study demonstrates the value of large and diverse ancestry study for genetic mechanisms of molecular phenotypes and their relationship with complex traits.
35
Citation17
0
Save
3

A Saturated Map of Common Genetic Variants Associated with Human Height from 5.4 Million Individuals of Diverse Ancestries

Loïc Yengo et al.Jan 12, 2022
+554
E
S
L
ABSTRACT Common SNPs are predicted to collectively explain 40-50% of phenotypic variation in human height, but identifying the specific variants and associated regions requires huge sample sizes. Here we show, using GWAS data from 5.4 million individuals of diverse ancestries, that 12,111 independent SNPs that are significantly associated with height account for nearly all of the common SNP-based heritability. These SNPs are clustered within 7,209 non-overlapping genomic segments with a median size of ~90 kb, covering ~21% of the genome. The density of independent associations varies across the genome and the regions of elevated density are enriched for biologically relevant genes. In out-of-sample estimation and prediction, the 12,111 SNPs account for 40% of phenotypic variance in European ancestry populations but only ~10%-20% in other ancestries. Effect sizes, associated regions, and gene prioritization are similar across ancestries, indicating that reduced prediction accuracy is likely explained by linkage disequilibrium and allele frequency differences within associated regions. Finally, we show that the relevant biological pathways are detectable with smaller sample sizes than needed to implicate causal genes and variants. Overall, this study, the largest GWAS to date, provides an unprecedented saturated map of specific genomic regions containing the vast majority of common height-associated variants.
24

Discovery and prioritization of variants and genes for kidney function in >1.2 million individuals

Kira Stanzick et al.Oct 24, 2023
+6
F
Y
K
ABSTRACT Chronic kidney disease (CKD) has a complex genetic underpinning. Genome-wide association studies (GWAS) of CKD-defining glomerular filtration rate (GFR) have identified hundreds of loci, but prioritization of variants and genes is challenging. To expand and refine GWAS discovery, we meta-analyzed GWAS data for creatinine-based estimated GFR (eGFRcrea) from the Chronic Kidney Disease Genetics Consortium (CKDGen, n=765,348, trans-ethnic) and UK Biobank (UKB, n=436,581, Europeans). The results (i) extend the number of eGFRcrea loci (424 loci; 201 novel; 8.9% eGFRcrea variance explained by 634 independent signals); (ii) improve fine-mapping resolution (138 99% credible sets with ≤5 variants, 44 single-variant sets); (iii) ascertain likely kidney function relevance for 343 loci (consistent association with alternative biomarkers); and (iv) highlight 34 genes with strong evidence by a systematic Gene PrioritiSation (GPS). We provide a sortable, searchable and customizable GPS tool to navigate through the in silico functional evidence and select relevant targets for functional investigations.
20

Polygenic Risk Scores for Kidney Function to the Circulating Proteome, and Incident Kidney Diseases: the Atherosclerosis Risk in Communities Study

Zhi Yu et al.Oct 24, 2023
+11
A
J
Z
ABSTRACT Genome-wide association studies (GWAS) have revealed numerous loci for kidney function (estimated glomerular filtration rate, eGFR). The relationship of polygenic predictors of eGFR, risk of incident adverse kidney outcomes, and the plasma proteome is not known. We developed a genome-wide polygenic risk score (PRS) using a weighted average of 1.2 million SNPs for eGFR using the LDpred algorithm, summary statistics generated by a European-ancestry (EA) meta-analysis of the CKDGen Consortium (N=558,423) and UK Biobank GWAS for eGFR (90% of the cohort; N=289,432), followed by best parameter selection using data from the remaining 10% of the UK Biobank (N=32,159). We then tested the association of the PRS among 8,886 EA participants in the Atherosclerosis Risk in Communities (ARIC) study (mean age: 54±6 years, 53% female) with incident chronic kidney disease (CKD), end stage kidney disease (ESKD), kidney failure (KF), and acute kidney injury (AKI). We also examined 4,877 plasma proteins measured at two time points (visit 3 (1993-95) and visit 5 (2011-13)) in relation to the PRS and compared associations between the proteome and eGFR itself. All models were adjusted for age, sex, center, and the first 10 principal components of ancestry. The developed PRS had an R 2 for eGFR of 0.07 in ARIC. Over 30 years of follow up, the number of incident CKD, ESKD, KF, and AKI were 2,959, 137, 470, and 1,723, respectively. The PRS showed significant associations with all outcomes: hazard ratios (95% CI) per 1 SD lower PRS were 1.33 (1.28, 1.39), 1.20 (1.00, 1.42), 1.17 (1.06, 1.28), and 1.07 (1.02, 1.12) for incident CKD, ESKD, KF, and AKI respectively. The PRS was significantly associated (Bonferroni threshold P<1.02 × 10 −5 ) with 108 proteins at both time points. The strongest associations were with cystatin-C (a marker of kidney function used in clinical practice), collagen alpha-1 (XV) chain, and desmocollin-2. All significant correlations with the PRS were negative, except those of testican-2 and angiostatin. Correlations of proteins with eGFR were much stronger than those with the PRS. Overall, we demonstrated that the PRS for eGFR is now sufficiently strong to capture risk for a spectrum of incident kidney diseases as well as broadly influence the plasma proteome.
20
Citation2
0
Save
0

Kidney Function and Blood Pressure: A Bi-directional Mendelian Randomisation Study

Zhi Yu et al.May 7, 2020
+8
G
J
Z
OBJECTIVE: To evaluate the bi-directional causal relation between kidney function and blood pressure. DESIGN: Mendelian randomisation study. SETTING: We performed two-sample Mendelian randomisation analyses. Genetic instruments of kidney function traits were selected from summary statistics of genome-wide association studies (GWAS) of glomerular filtration rate estimated from serum creatinine (eGFRcr) and blood urea nitrogen (BUN) and were required to be associated with both eGFRcr and BUN to ensure that the instruments were more likely to represent the underlying kidney function. Genetic instruments of blood pressure were selected from summary statistics of GWAS of systolic and diastolic blood pressure. We investigated Mendelian randomisation hypothesis using several alternative approaches, including methods that are most robust to the presence of horizontal pleiotropy. CONCLUSIONS: Mendelian randomisation analyses support causal effects of higher kidney function on lower blood pressure. These results suggest preventing kidney function decline can reduce the public health burden of hypertension.
10

Designing Single Cell RNA-Sequencing Experiments for Learning Latent Representations

Martin Treppner et al.Oct 24, 2023
H
A
S
M
Abstract To investigate the complexity arising from single-cell RNA-sequencing (scRNA-seq) data, researchers increasingly resort to deep generative models, specifically variational autoencoders (VAEs), which are trained by variational inference techniques. Similar to other dimension reduction approaches, this allows encoding the inherent biological signals of gene expression data, such as pathways or gene programs, into lower-dimensional latent representations. However, the number of cells necessary to adequately uncover such latent representations is often unknown. Therefore, we propose a single-cell variational inference approach for designing experiments (scVIDE) to determine statistical power for detecting cell group structure in a lower-dimensional representation. The approach is based on a test statistic that quantifies the contribution of every single cell to the latent representation. Using a smaller scRNA-seq data set as a starting point, we generate synthetic data sets of various sizes from a fitted VAE. Employing a permutation technique for obtaining a null distribution of the test statistic, we subsequently determine the statistical power for various numbers of cells, thus guiding experimental design. We illustrate with several data sets from various sequencing protocols how researchers can use scVIDE to determine the statistical power for cell group detection within their own scRNA-seq studies. We also consider the setting of transcriptomics studies with large numbers of cells, where scVIDE can be used to determine the statistical power for sub-clustering. For this purpose, we use data from the human KPMP Kidney Cell Atlas and evaluate the power for sub-clustering of the epithelial cells contained therein. To make our approach readily accessible, we provide a comprehensive Jupyter notebook at https://github.com/MTreppner/scVIDE.jl that researchers can use to design their own experiments based on scVIDE.
5

Multi-omic Analysis of Primary Human Kidney Tissues Identifies Medulla-Specific Gene Expression Patterns

Stefan Haug et al.Oct 24, 2023
+2
Y
S
S
Abstract The renal medulla is a specialized region of the kidney with important homeostatic functions. It has also been implicated in genetic and developmental disorders and ischemic and drug-induced injuries. Despite its role in kidney function and disease, the medulla’s baseline gene expression and epigenomic signatures have not been well described in the adult human kidney. Here we generate and analyze gene expression (RNA-seq), chromatin accessibility (ATAC-seq) and chromatin conformation (Hi-C) data from adult human kidney cortex and medulla. Using data from our carefully annotated specimens, we assign samples in the larger public GTEx database to cortex and medulla, thereby identifying several misassignments and extracting meaningful medullary gene expression signatures. Using integrated analysis of gene expression, chromatin accessibility and conformation profiles, we reveal insights into medulla development and function. Our datasets will also provide a valuable resource for researchers in the GWAS community for functional annotation of genetic variants.
0

Investigation of an LPA KIV-2 nonsense mutation in 11,000 individuals: the importance of linkage disequilibrium structure in LPA genetics.

Silvia Maio et al.May 7, 2020
+9
R
G
S
Background: Elevated Lp(a) plasma concentrations are determined mainly genetically by the LPA gene locus, but up to 70% of the coding sequence is located in the so-called kringle IV type 2 (KIV-2) copy number variation. This region is not resolved by common genotyping technologies and large epidemiological studies on this region are therefore missing. The Arg21Ter variant (R21X, variant frequency approximately 2%) is a functional variant in this region, but it has never been analyzed in large cohorts and is it unknown whether it is captured by genome-wide association studies. Methods and Results: We developed a highly sensitive allele-specific qPCR assay and genotyped R21X in 10,910 individuals from three populations (GCKD, KORA F3, KORA F4). R21X carriers showed significantly lower mean Lp(a) concentrations (-11.7 mg/dL [-15.5;-7.82], p=3.39e-32). Of particular note, virtually all R21X carriers also carried the splice mutation rs41272114 (D prime=0.957, R2=0.275), as confirmed by pulsed-field gel electrophoresis and long-range haplotyping. This proposes that the R21X mutation arose on the background of the rs41272114 splice variant. Conclusions: We performed the largest epidemiological study on an LPA KIV-2 variant so far. Interestingly, R21X is located on the same haplotype as the splice mutation rs41272114, creating double-null LPA alleles that are inactivated by two independent mutations. The effect of the R21X nonsense mutation can thus not be discerned from the effect of rs41272114 splice site mutation. This emphasizes the importance of assessing the complex LD structure within LPA even for functional variants.
0

Sequencing of 53,831 diverse genomes from the NHLBI TOPMed Program

Daniel Taliun et al.May 6, 2020
+174
M
D
D
The Trans-Omics for Precision Medicine (TOPMed) program seeks to elucidate the genetic architecture and disease biology of heart, lung, blood, and sleep disorders, with the ultimate goal of improving diagnosis, treatment, and prevention. The initial phases of the program focus on whole genome sequencing of individuals with rich phenotypic data and diverse backgrounds. Here, we describe TOPMed goals and design as well as resources and early insights from the sequence data. The resources include a variant browser, a genotype imputation panel, and sharing of genomic and phenotypic data via dbGaP. In 53,581 TOPMed samples, >400 million single-nucleotide and insertion/deletion variants were detected by alignment with the reference genome. Additional novel variants are detectable through assembly of unmapped reads and customized analysis in highly variable loci. Among the >400 million variants detected, 97% have frequency <1% and 46% are singletons. These rare variants provide insights into mutational processes and recent human evolutionary history. The nearly complete catalog of genetic variation in TOPMed studies provides unique opportunities for exploring the contributions of rare and non-coding sequence variants to phenotypic variation. Furthermore, combining TOPMed haplotypes with modern imputation methods improves the power and extends the reach of nearly all genome-wide association studies to include variants down to ~0.01% in frequency.
Load More