MS
Matthias Schulze
Author with expertise in Genomic Studies and Association Analyses
German Institute of Human Nutrition, University of Potsdam, German Center for Diabetes Research
+ 12 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
8
(63% Open Access)
Cited by:
19
h-index:
117
/
i10-index:
504
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
3

A Saturated Map of Common Genetic Variants Associated with Human Height from 5.4 Million Individuals of Diverse Ancestries

Loïc Yengo et al.Jan 12, 2022
+554
E
S
L
ABSTRACT Common SNPs are predicted to collectively explain 40-50% of phenotypic variation in human height, but identifying the specific variants and associated regions requires huge sample sizes. Here we show, using GWAS data from 5.4 million individuals of diverse ancestries, that 12,111 independent SNPs that are significantly associated with height account for nearly all of the common SNP-based heritability. These SNPs are clustered within 7,209 non-overlapping genomic segments with a median size of ~90 kb, covering ~21% of the genome. The density of independent associations varies across the genome and the regions of elevated density are enriched for biologically relevant genes. In out-of-sample estimation and prediction, the 12,111 SNPs account for 40% of phenotypic variance in European ancestry populations but only ~10%-20% in other ancestries. Effect sizes, associated regions, and gene prioritization are similar across ancestries, indicating that reduced prediction accuracy is likely explained by linkage disequilibrium and allele frequency differences within associated regions. Finally, we show that the relevant biological pathways are detectable with smaller sample sizes than needed to implicate causal genes and variants. Overall, this study, the largest GWAS to date, provides an unprecedented saturated map of specific genomic regions containing the vast majority of common height-associated variants.
0

Hepatic steatosis, metabolic dysfunction and risk of mortality: findings from a multinational prospective cohort study

Ana‐Lucia Mayén et al.Sep 11, 2024
+35
E
M
A
Abstract Background Non-alcoholic fatty liver disease (NAFLD) and metabolic syndrome (MetS) are implicated in the aetiology of non-communicable diseases. Our study aimed to evaluate associations between NAFLD and MetS with overall and cause-specific mortality. Methods We used dietary, lifestyle, anthropometric and metabolic biomarker data from a random subsample of 15,784 EPIC cohort participants. NAFLD was assessed using the fatty liver index (FLI) and MetS using the revised definition. Indices for metabolic dysfunction–associated fatty liver disease (MAFLD) were calculated. The individual associations of these indices with overall and cause-specific mortality were assessed using multivariable Cox proportional hazards models to estimate hazard ratios (HRs) and 95% confidence intervals (95%CIs). As a subobjective, risk associations with adaptations of new classifications of metabolic dysfunction–associated steatotic liver disease (MASLD) and metabolic and alcohol-related liver disease (MetALD) were also assessed. Results Among the 15,784 sub-cohort participants, a total of 1997 deaths occurred (835 due to cancer, 520 to CVD, 642 to other causes) over a median 15.6 (IQR, 12.3–17.1) years of follow-up. Compared to an FLI < 30, FLI ≥ 60 was associated with increased risks of overall mortality (HR = 1.44, 95%CI = 1.27–1.63), and deaths from cancer (HR = 1.32, 95%CI = 1.09–1.60), CVD (HR = 2.06, 95% CI = 1.61–2.63) or other causes (HR = 1.21, 95%CI = 0.97–1.51). Mortality risk associations were also elevated for individuals with MAFLD compared to those without. Individuals with MetS were at increased risk of all mortality endpoints, except cancer-specific mortality. MASLD and MetALD were associated with higher risk of overall mortality. Conclusions Our findings based on a prospective cohort suggest that individuals with hepatic steatosis or metabolic dysfunction have a higher overall and cause-specific mortality risk.
0
Citation2
0
Save
0

Healthy lifestyle change and all-cause and cancer mortality in the European Prospective Investigation into Cancer and Nutrition cohort

Komodo Matta et al.Sep 11, 2024
+34
E
V
K
Abstract Background Healthy lifestyles are inversely associated with the risk of noncommunicable diseases, which are leading causes of death. However, few studies have used longitudinal data to assess the impact of changing lifestyle behaviours on all-cause and cancer mortality. Methods Within the European Prospective Investigation into Cancer and Nutrition (EPIC) cohort, lifestyle profiles of 308,497 cancer-free adults (71% female) aged 35–70 years at recruitment across nine countries were assessed with baseline and follow-up questionnaires administered on average of 7 years apart. A healthy lifestyle index (HLI), assessed at two time points, combined information on smoking status, alcohol intake, body mass index, and physical activity, and ranged from 0 to 16 units. A change score was calculated as the difference between HLI at baseline and follow-up. Associations between HLI change and all-cause and cancer mortality were modelled with Cox regression, and the impact of changing HLI on accelerating mortality rate was estimated by rate advancement periods (RAP, in years). Results After the follow-up questionnaire, participants were followed for an average of 9.9 years, with 21,696 deaths (8407 cancer deaths) documented. Compared to participants whose HLIs remained stable (within one unit), improving HLI by more than one unit was inversely associated with all-cause and cancer mortality (hazard ratio [HR]: 0.84; 95% confidence interval [CI]: 0.81, 0.88; and HR: 0.87; 95% CI: 0.82, 0.92; respectively), while worsening HLI by more than one unit was associated with an increase in mortality (all-cause mortality HR: 1.26; 95% CI: 1.20, 1.33; cancer mortality HR: 1.19; 95% CI: 1.09, 1.29). Participants who worsened HLI by more than one advanced their risk of death by 1.62 (1.44, 1.96) years, while participants who improved HLI by the same amount delayed their risk of death by 1.19 (0.65, 2.32) years, compared to those with stable HLI. Conclusions Making healthier lifestyle changes during adulthood was inversely associated with all-cause and cancer mortality and delayed risk of death. Conversely, making unhealthier lifestyle changes was positively associated with mortality and an accelerated risk of death.
0
Citation1
0
Save
5

A new pipeline for the normalization and pooling of metabolomics data

Vivian Viallon et al.Oct 24, 2023
+44
S
M
V
Abstract Pooling metabolomics data across studies is often desirable to increase the statistical power of the analysis. However, this can raise methodological challenges as several preanalytical and analytical factors could introduce differences in measured concentrations and variability between datasets. Specifically, different studies may use variable sample types (e.g., serum versus plasma) collected, treated and stored according to different protocols, and assayed in different laboratories using different instruments. To address these issues, a new pipeline was developed to normalize and pool metabolomics data through a set of sequential steps: (i) exclusions of the least informative observations and metabolites and removal of outliers; imputation of missing data; (ii) identification of the main sources of variability through PC-PR2 analysis; (iii) application of linear mixed models to remove unwanted variability, including samples’ originating study and batch, and preserve biological variations while accounting for potential differences in the residual variances across studies. This pipeline was applied to targeted metabolomics data acquired using Biocrates AbsoluteIDQ kits in eight case-control studies nested within the European Prospective Investigation into Cancer and Nutrition (EPIC) cohort. Comprehensive examination of metabolomics measurements indicated that the pipeline improved the comparability of data across the studies. Our pipeline can be adapted to normalize other molecular data, including biomarkers as well as proteomics data, and could be used for pooling molecular datasets, for example in international consortia, to limit biases introduced by inter-study variability. This versatility of the pipeline makes our work of potential interest to molecular epidemiologists.
5
Paper
Citation1
0
Save
57

A multi-layer functional genomic analysis to understand noncoding genetic variation in lipids

Shweta Ramdas et al.Oct 24, 2023
+532
S
J
S
Abstract A major challenge of genome-wide association studies (GWAS) is to translate phenotypic associations into biological insights. Here, we integrate a large GWAS on blood lipids involving 1.6 million individuals from five ancestries with a wide array of functional genomic datasets to discover regulatory mechanisms underlying lipid associations. We first prioritize lipid-associated genes with expression quantitative trait locus (eQTL) colocalizations, and then add chromatin interaction data to narrow the search for functional genes. Polygenic enrichment analysis across 697 annotations from a host of tissues and cell types confirms the central role of the liver in lipid levels, and highlights the selective enrichment of adipose-specific chromatin marks in high-density lipoprotein cholesterol and triglycerides. Overlapping transcription factor (TF) binding sites with lipid-associated loci identifies TFs relevant in lipid biology. In addition, we present an integrative framework to prioritize causal variants at GWAS loci, producing a comprehensive list of candidate causal genes and variants with multiple layers of functional evidence. Two prioritized genes, CREBRF and RRBP1 , show convergent evidence across functional datasets supporting their roles in lipid biology.
0

Tissue-Specific Alteration of Metabolic Pathways Influences Glycemic Regulation

Natasha Ng et al.May 7, 2020
+252
J
S
N
Metabolic dysregulation in multiple tissues alters glucose homeostasis and influences risk for type 2 diabetes (T2D). To identify pathways and tissues influencing T2D-relevant glycemic traits (fasting glucose [FG], fasting insulin [FI], two-hour glucose [2hGlu] and glycated hemoglobin [HbA1c]), we investigated associations of exome-array variants in up to 144,060 individuals without diabetes of multiple ancestries. Single-variant analyses identified novel associations at 21 coding variants in 18 novel loci, whilst gene-based tests revealed signals at two genes, TF (HbA1c) and G6PC (FG, FI). Pathway and tissue enrichment analyses of trait-associated transcripts confirmed the importance of liver and kidney for FI and pancreatic islets for FG regulation, implicated adipose tissue in FI and the gut in 2hGlu, and suggested a role for the non-endocrine pancreas in glucose homeostasis. Functional studies demonstrated that a novel FG/FI association at the liver-enriched G6PC transcript was driven by multiple rare loss-of-function variants. The FG/HbA1c-associated, islet-specific G6PC2 transcript also contained multiple rare functional variants, including two alleles within the same codon with divergent effects on glucose levels. Our findings highlight the value of integrating genomic and functional data to maximize biological inference.
0

PROTEIN-CODING VARIANTS IMPLICATE NOVEL GENES RELATED TO LIPID HOMEOSTASIS CONTRIBUTING TO BODY FAT DISTRIBUTION

Anne Justice et al.May 6, 2020
+276
H
T
A
Body fat distribution is a heritable risk factor for a range of adverse health consequences, including hyperlipidemia and type 2 diabetes. To identify protein-coding variants associated with body fat distribution, assessed by waist-to-hip ratio adjusted for body mass index, we analyzed 228,985 predicted coding and splice site variants available on exome arrays in up to 344,369 individuals from five major ancestries for discovery and 132,177 independent European-ancestry individuals for validation. We identified 15 common (minor allele frequency, MAF ≥ 5%) and 9 low frequency or rare (MAF < 5%) coding variants that have not been reported previously. Pathway/gene set enrichment analyses of all associated variants highlight lipid particle, adiponectin level, abnormal white adipose tissue physiology, and bone development and morphology as processes affecting fat distribution and body shape. Furthermore, the cross-trait associations and the analyses of variant and gene function highlight a strong connection to lipids, cardiovascular traits, and type 2 diabetes. In functional follow-up analyses, specifically in Drosophila RNAi-knockdown crosses, we observed a significant increase in the total body triglyceride levels for two genes (DNAH10 and PLXND1). By examining variants often poorly tagged or entirely missed by genome-wide association studies, we implicate novel genes in fat distribution, stressing the importance of interrogating low-frequency and protein-coding variants.
0

Refining The Accuracy Of Validated Target Identification Through Coding Variant Fine-Mapping In Type 2 Diabetes

Anubha Mahajan et al.May 6, 2020
+232
S
J
A
Identification of coding variant associations for complex diseases offers a direct route to biological insight, but is dependent on appropriate inference concerning the causal impact of those variants on disease risk. We aggregated coding variant data for 81,412 type 2 diabetes (T2D) cases and 370,832 controls of diverse ancestry, identifying 40 distinct coding variant association signals (at 38 loci) reaching significance (p<2.2x10-7). Of these, 16 represent novel associations mapping outside known genome-wide association study (GWAS) signals. We make two important observations. First, despite a threefold increase in sample size over previous efforts, only five of the 40 signals are driven by variants with minor allele frequency <5%, and we find no evidence for low-frequency variants with allelic odds ratio >1.29. Second, we used GWAS data from 50,160 T2D cases and 465,272 controls of European ancestry to fine-map these associated coding variants in their regional context, with and without additional weighting to account for the global enrichment of complex trait association signals in coding exons. At the 37 signals for which we attempted fine-mapping, we demonstrate convincing support (posterior probability >80% under the 'annotation-weighted' model) that coding variants are causal for the association at 16 (including novel signals involving POC5 p.His36Arg, ANKH p.Arg187Gln, WSCD2 p.Thr113Ile, PLCB3 p.Ser778Leu, and PNPLA3 p.Ile148Met). However, at 13 of the 37 loci, the associated coding variants represent 'false leads' and naïve analysis could have led to an erroneous inference regarding the effector transcript mediating the signal. Accurate identification of validated targets is dependent on correct specification of the contribution of coding and non-coding mediated mechanisms at associated loci.