KS
Karsten Suhre
Author with expertise in Analysis of Gene Interaction Networks
Weill Cornell Medical College in Qatar, Cornell University, Cornell College
+ 15 more
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
33
(39% Open Access)
Cited by:
6
h-index:
82
/
i10-index:
267
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
38

Epigenetic scores for the circulating proteome as tools for disease prediction

Danni Gadd et al.Oct 24, 2023
+23
D
R
D
Abstract Protein biomarkers have been identified across many age-related morbidities. However, characterising epigenetic influences could further inform disease predictions. Here, we leverage epigenome-wide data to study links between the DNAm signatures of the circulating proteome and incident diseases. Using data from four cohorts, we trained and tested epigenetic scores (EpiScores) for 953 plasma proteins, identifying 109 scores that explained between 1% and 58% of the variance in protein levels after adjusting for known protein quantitative trait loci (pQTL) genetic effects. By projecting these EpiScores into an independent sample, (Generation Scotland; n=9,537) and relating them to incident morbidities over a follow-up of 14 years, we uncovered 137 EpiScore – disease associations. These associations were largely independent of immune cell proportions, common lifestyle and health factors and biological aging. Notably, we found that our diabetes-associated EpiScores highlighted previous top biomarker associations from proteome-wide assessments of diabetes. These EpiScores for protein levels can therefore be a valuable resource for disease prediction and risk stratification.
38
Citation2
0
Save
1

Genetic associations with ratios between protein levels detect new pQTLs and reveal protein-protein interactions

Karsten SuhreOct 24, 2023
K
Abstract Protein quantitative trait loci (pQTLs) are an invaluable source of information for drug target development as they provide genetic evidence to support protein function, suggest relationships between cis - and trans -associated proteins, and link proteins to disease where they collocate with genetic risk loci for clinical endpoints. Using the recently released Olink proteomics data for 1,463 proteins measured in over 54,000 samples of the UK Biobank we identified and replicated 4,248 associations with 2,821 ratios between protein levels (rQTLs) where the strengths of association at known pQTL loci increased by up to several hundred orders of magnitude. We attribute this increase in statistical power (p-gain) to accounting for genetic and non-genetic variance shared by the two proteins in the ratio pair. Protein pairs with a significant p-gain were 7.6-fold enriched in known protein-protein interactions, suggesting that their ratios reflect biological links between the implicated proteins. We then conducted a GWAS on the 2,821 ratios and identified 2,527 novel rQTLs, increasing the number of discovered genetic signals compared to the original protein-only GWAS by 24.7%. At examples we demonstrate that this approach can identify novel loci of clinical relevance, support causal gene identification, and reveal complex networks of interacting proteins. Taken together, our study adds significant value to the genetic insights that can be derived from the UKB proteomics data and motivates the wider use of ratios in large scale GWAS.
1

Auto-Immunoproteomics Analysis of COVID-19 ICU Patients Revealed Increased Levels of Autoantibodies Related to Male Reproductive System

Frank Schmidt et al.Oct 24, 2023
+18
K
H
F
Abstract The role of autoantibodies in coronavirus disease (COVID-19) complications is not yet fully understood. The current investigation screened two independent cohorts of 97 COVID-19 patients (Discovery (Disc) cohort from Qatar (n = 49) and Replication (Rep) cohort from New York (n = 48)) utilizing high-throughput KoRectly Expressed (KREX) immunome protein-array technology. Autoantibody responses to 57 proteins were significantly altered in the COVID-19 Disc cohort compared to healthy controls (P ≤ 0.05). The Rep cohort had altered autoantibody responses against 26 proteins compared to non-COVID-19 ICU patients that served as controls. Both cohorts showed substantial similarities (r 2 = 0.73) and exhibited higher autoantibodies responses to numerous transcription factors, immunomodulatory proteins, and human disease markers. Analysis of the combined cohorts revealed elevated autoantibody responses against SPANXN4, STK25, ATF4, PRKD2, and CHMP3 proteins in COVID-19 patients. KREX analysis of the specific IgG autoantibody responses indicates that the targeted host proteins are supposedly increased in COVID-19 patients. The autoantigen-autoantibody response was cross-validated for SPANXN4 and STK25 proteins using Uniprot BLASTP and sequence alignment tools. SPANXN4 is essential for spermiogenesis and male fertility, which may predict a potential role for this protein in COVID-19 associated male reproductive tract complications and warrants further research. Significance Statement Coronavirus disease (COVID-19), caused by the SARS-CoV-2 virus, has emerged as a global pandemic with a high morbidity rate and multiorgan complications. It is observed that the host immune system contributes to the varied responses to COVID-19 pathogenesis. Autoantibodies, immune system proteins that mistakenly target the body’s own tissue, may underlie some of this variation. We screened total IgG autoantibody responses against 1,318 human proteins in two COVID-19 patient cohorts. We observed several novel markers in COVID-19 patients that are associated with male fertility, such as sperm protein SPANXN4, STK25, and the apoptotic factor ATF4. Particularly, elevated levels of autoantibodies against the testicular tissue-specific protein SPANXN4 offer significant evidence of anticipating the protein role in COVID-19 associated male reproductive complications.
1
Citation1
0
Save
0

A roadmap to the molecular human linking multiomics with population traits and diabetes subtypes

Anna Halama et al.Sep 12, 2024
+22
G
S
A
In-depth multiomic phenotyping provides molecular insights into complex physiological processes and their pathologies. Here, we report on integrating 18 diverse deep molecular phenotyping (omics-) technologies applied to urine, blood, and saliva samples from 391 participants of the multiethnic diabetes Qatar Metabolomics Study of Diabetes (QMDiab). Using 6,304 quantitative molecular traits with 1,221,345 genetic variants, methylation at 470,837 DNA CpG sites, and gene expression of 57,000 transcripts, we determine (1) within-platform partial correlations, (2) between-platform mutual best correlations, and (3) genome-, epigenome-, transcriptome-, and phenome-wide associations. Combined into a molecular network of > 34,000 statistically significant trait-trait links in biofluids, our study portrays "The Molecular Human". We describe the variances explained by each omics in the phenotypes (age, sex, BMI, and diabetes state), platform complementarity, and the inherent correlation structures of multiomics data. Further, we construct multi-molecular network of diabetes subtypes. Finally, we generated an open-access web interface to "The Molecular Human" ( http://comics.metabolomix.com ), providing interactive data exploration and hypotheses generation possibilities.
0
Citation1
0
Save
0

Network-based metabolite ratios for an improved functional characterization of genome-wide association study results

Jan Krumsiek et al.May 7, 2020
+5
K
F
J
Genome-wide association studies (GWAS) with metabolite ratios as quantitative traits have successfully deepened our understanding of the complex relationship between genetic variants and metabolic phenotypes. Usually all ratio combinations are selected for association tests. However, with more metabolites being detectable, the quadratic increase of the ratio number becomes challenging from a statistical, computational and interpretational point-of-view. Therefore methods which select biologically meaningful ratios are required. We here present a network-based approach by selecting only closely connected metabolites in a given metabolic network. The feasibility of this approach was tested on in silico data derived from simulated reaction networks. Especially for small effect sizes, network-based metabolite ratios (NBRs) improved the metabolite-based prediction accuracy of genetically-influenced reactions compared to the 'all ratios' approach. Evaluating the NBR approach on published GWAS association results, we compared reported 'all ratio'-SNP hits with results obtained by selecting only NBRs as candidates for association tests. Input networks for NBR selection were derived from public pathway databases or reconstructed from metabolomics data. NBR-candidates covered more than 80% of all significant ratio-SNP associations and we could replicate 7 out of 10 new associations predicted by the NBR approach. In this study we evaluated a network-based approach to select biologically meaningful metabolite ratios as quantitative traits in GWAS. Taking metabolic network information into account facilitated the analysis and the biochemical interpretation of metabolite-gene association results. For upcoming studies, for instance with case-control design, large-scale metabolomics data and small sample numbers, the analysis of all possible metabolite ratios is not feasible due to the correction for multiple testing. Here our NBR approach increases the statistical power and lowers computational demands, allowing for a better understanding of the complex interplay between individual phenotypes, genetics and metabolic profiles.
1

Genome-wide Association Study Of Plasma Proteins Identifies Putatively Causal Genes, Proteins, And Pathways For Cardiovascular Disease

Chen Yao et al.May 7, 2020
+15
C
G
C
Identifying genetic variants associated with circulating protein concentrations (pQTLs) and integrating them with variants from genome-wide association studies (GWAS) may illuminate the proteome's causal role in disease and bridge a GWAS knowledge gap for hitherto unexplained SNP-disease associations. We conducted GWAS of 71 high-value proteins for cardiovascular disease in 6,861 Framingham Heart Study participants followed by external replication. We comprehensively mapped thousands of pQTLs, including functional annotations and clinical-trait associations, and created an integrated plasma-protein-QTL searchable database. We next identified 15 proteins with pQTLs coinciding with coronary heart disease (CHD)-related variants from GWAS or tested causal for CHD by Mendelian randomization; most of these proteins were associated with new-onset cardiovascular disease events in Framingham participants with long-term follow-up. Identifying pQTLs and integrating them with GWAS results yields insights into genes, proteins, and pathways that may be causally associated with disease and can serve as therapeutic targets for treatment and prevention.
0

Characterization of missing values in untargeted MS-based metabolomics data and evaluation of missing data handling strategies

Kieu Trinh et al.May 7, 2020
+13
J
S
K
BACKGROUND: Untargeted mass spectrometry (MS)-based metabolomics data often contain missing values that reduce statistical power and can introduce bias in epidemiological studies. However, a systematic assessment of the various sources of missing values and strategies to handle these data has received little attention. Missing data can occur systematically, e.g. from run day-dependent effects due to limits of detection (LOD); or it can be random as, for instance, a consequence of sample preparation. METHODS: We investigated patterns of missing data in an MS-based metabolomics experiment of serum samples from the German KORA F4 cohort (n = 1750). We then evaluated 31 imputation methods in a simulation framework and biologically validated the results by applying all imputation approaches to real metabolomics data. We examined the ability of each method to reconstruct biochemical pathways from data-driven correlation networks, and the ability of the method to increase statistical power while preserving the strength of established genetically metabolic quantitative trait loci. RESULTS: Run day-dependent LOD-based missing data accounts for most missing values in the metabolomics dataset. Although multiple imputation by chained equations (MICE) performed well in many scenarios, it is computationally and statistically challenging. K-nearest neighbors (KNN) imputation on observations with variable pre-selection showed robust performance across all evaluation schemes and is computationally more tractable. CONCLUSION: Missing data in untargeted MS-based metabolomics data occur for various reasons. Based on our results, we recommend that KNN-based imputation is performed on observations with variable pre-selection since it showed robust results in all evaluation schemes. NOTE: Kieu Trinh Do and Simone Wahl are co-first authors, and Gabi Kastenmueller and Jan Krumsiek are co-last authors.
0

ProGeM: A framework for the prioritisation of candidate causal genes at molecular quantitative trait loci

David Stacey et al.May 7, 2020
+6
D
E
D
Quantitative trait locus (QTL) mapping of molecular phenotypes such as metabolites, lipids, and proteins through genome-wide association studies (GWAS) represents a powerful means of highlighting molecular mechanisms relevant to human diseases. However, a major challenge of this approach is to identify the causal gene(s) at the observed QTLs. Here we present a framework for the 'Prioritisation of candidate causal Genes at Molecular QTLs' (ProGeM), which incorporates biological domain-specific annotation data alongside genome annotation data from multiple repositories. We assessed the performance of ProGeM using a reference set of 227 previously reported and extensively curated metabolite QTLs. For 98% of these loci, the expert-curated gene was one of the candidate causal genes prioritised by ProGeM. Benchmarking analyses revealed that 69% of the causal candidates were nearest to the sentinel variant at the investigated molecular QTLs, indicating that genomic proximity is the most reliable indicator of 'true positive' causal genes. In contrast, cis-gene expression QTL data led to three false positive candidate causal gene assignments for every one true positive assignment. We provide evidence that these conclusions also apply to other molecular phenotypes, suggesting that ProGeM is a powerful and versatile tool for annotating molecular QTLs. ProGeM is freely available via GitHub.
14

The HuMet Repository: Watching human metabolism at work

Patrick Weinisch et al.Oct 24, 2023
+9
W
J
P
The human metabolism constantly responds to stimuli such as food intake, fasting, exercise, and stress, triggering adaptive biochemical processes across multiple metabolic pathways. To understand the role of these processes and disruptions thereof in health and disease, detailed documentation of healthy metabolic responses is needed but still scarce on a time-resolved metabolome-wide level. Here, we present the HuMet Repository, a web-based resource for exploring dynamic metabolic responses to six physiological challenges (exercise, 36 h fasting, oral glucose and lipid loads, mixed meal, cold stress) in healthy subjects. For building this resource, we integrated existing and newly derived metabolomics data measured in blood, urine, and breath samples of 15 young healthy men at up to 56 time points during the six highly standardized challenge tests conducted over four days. The data comprise 1.1 million data points acquired on multiple platforms with temporal profiles of 2,656 metabolites from a broad range of biochemical pathways. By embedding the dataset into an interactive web application, we enable users to easily access, search, filter, analyze, and visualize the time-resolved metabolomic readouts and derived results. Users can put metabolites into their larger context by identifying metabolites with similar trajectories or by visualizing metabolites within holistic metabolic networks to pinpoint pathways of interest. In three showcases, we outline the value of the repository for gaining biological insights and generating hypotheses by analyzing the wash-out of dietary markers, the complementarity of metabolomics platforms in dynamic versus cross-sectional data, and similarities and differences in systemic metabolic responses across challenges. With its comprehensive collection of time-resolved metabolomics data, the HuMet Repository, freely accessible at https://humet.org/, is a reference for normal, healthy responses to metabolic challenges in young males. It will enable researchers with and without computational expertise, to flexibly query the data for their own research into the dynamics of human metabolism.
0

AutoFocus: A hierarchical framework to explore multi-omic disease associations spanning multiple scales of biomolecular interaction

Annalise Schweickart et al.Sep 8, 2023
+4
R
K
A
Recent advances in high-throughput measurement technologies have enabled the analysis of molecular perturbations associated with disease phenotypes at the multi-omic level. Such perturbations can range in scale from fluctuations of individual molecules to entire biological pathways. Data-driven clustering algorithms have long been used to group interactions into interpretable functional modules; however, these modules are typically constrained to a fixed size or statistical cutoff. Furthermore, modules are often analyzed independently of their broader biological context. Consequently, such clustering approaches limit the ability to explore functional module associations with disease phenotypes across multiple scales. Here, we introduce AutoFocus, a data-driven method that hierarchically organizes biomolecules and tests for phenotype enrichment at every level within the hierarchy. As a result, the method allows disease-associated modules to emerge at any scale. We evaluated this approach using two datasets: First, we explored associations of biomolecules from the multi-omic QMDiab dataset (n = 388) with the well-characterized type 2 diabetes phenotype. Secondly, we utilized the ROS/MAP Alzheimer9s disease dataset (n = 500), consisting of high-throughput measurements of brain tissue to explore modules associated with multiple Alzheimer9s Disease-related phenotypes. Our method identifies modules that are multi-omic, span multiple pathways, and vary in size. We provide an interactive tool to explore this hierarchy at different levels and probe enriched modules, empowering users to examine the full hierarchy, delve into biomolecular drivers of disease phenotype within a module, and incorporate functional annotations.
Load More