YS
Yun Sung
Author with expertise in Genomic Studies and Association Analyses
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
12
(75% Open Access)
Cited by:
59
h-index:
44
/
i10-index:
85
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Genome-wide meta-analysis of macronutrient intake of 91,114 European ancestry participants from the cohorts for heart and aging research in genomic epidemiology consortium

Jordi Merino et al.Jul 9, 2018
Macronutrient intake, the proportion of calories consumed from carbohydrate, fat, and protein, is an important risk factor for metabolic diseases with significant familial aggregation. Previous studies have identified two genetic loci for macronutrient intake, but incomplete coverage of genetic variation and modest sample sizes have hindered the discovery of additional loci. Here, we expanded the genetic landscape of macronutrient intake, identifying 12 suggestively significant loci (P < 1 × 10−6) associated with intake of any macronutrient in 91,114 European ancestry participants. Four loci replicated and reached genome-wide significance in a combined meta-analysis including 123,659 European descent participants, unraveling two novel loci; a common variant in RARB locus for carbohydrate intake and a rare variant in DRAM1 locus for protein intake, and corroborating earlier FGF21 and FTO findings. In additional analysis of 144,770 participants from the UK Biobank, all identified associations from the two-stage analysis were confirmed except for DRAM1. Identified loci might have implications in brain and adipose tissue biology and have clinical impact in obesity-related phenotypes. Our findings provide new insight into biological functions related to macronutrient intake.
0
Citation50
0
Save
10

GEM: Scalable and flexible gene-environment interaction analysis in millions of samples

Kenneth Westerman et al.May 14, 2020
ABSTRACT Motivation Gene-environment interaction (GEI) studies are a general framework that can be used to identify genetic variants that modify the effects of environmental, physiological, lifestyle, or treatment effects on complex traits. Moreover, accounting for GEIs can enhance our understanding of the genetic architecture of complex diseases. However, commonly-used statistical software programs for GEI studies are either not applicable to testing certain types of GEI hypotheses or have not been optimized for use in large samples. Results Here, we develop a new software program, GEM (Gene-Environment interaction analysis in Millions of samples), which supports the inclusion of multiple GEI terms, adjustment for GEI covariates, and robust inference, while allowing multi-threading to reduce computation time. GEM can conduct GEI tests as well as joint tests of genetic effects for both continuous and binary phenotypes. Through simulations, we demonstrate that GEM scales to millions of samples while addressing limitations of existing software programs. We additionally conduct a gene-sex interaction analysis on waist-hip ratio in 352,768 unrelated individuals from the UK Biobank, identifying 39 novel loci in the joint test that have not previously been reported in combined or sex-specific analyses. Our results demonstrate that GEM can facilitate the next generation of large-scale GEI studies and help advance our understanding of genomic contributions to complex traits. Availability GEM is freely available as an open source project at https://github.com/large-scale-gxe-methods/GEM . Contact akmanning@mgh.harvard.edu , Han.Chen.2@uth.tmc.edu Supplementary information Supplementary data are available at Bioinformatics online.
10
Citation5
0
Save
0

Efficient gene-environment interaction tests for large biobank-scale sequencing studies

Xinyu Wang et al.Apr 29, 2020
ABSTRACT Complex human diseases are affected by genetic and environmental risk factors and their interactions. Gene-environment interaction (GEI) tests for aggregate genetic variant sets have been developed in recent years. However, existing statistical methods become rate limiting for large biobank-scale sequencing studies with correlated samples. We propose efficient Mixed-model Association tests for GEne-Environment interactions (MAGEE), for testing GEI between an aggregate variant set and environmental exposures on quantitative and binary traits in large-scale sequencing studies with related individuals. Joint tests for the aggregate genetic main effects and GEI effects are also developed. A null generalized linear mixed model adjusting for covariates but without any genetic effects is fit only once in a whole genome GEI analysis, thereby vastly reducing the overall computational burden. Score tests for variant sets are performed as a combination of genetic burden and variance component tests by accounting for the genetic main effects using matrix projections. The computational complexity is dramatically reduced in a whole genome GEI analysis, which makes MAGEE scalable to hundreds of thousands of individuals. We applied MAGEE to the exome sequencing data of 41,144 related individuals from the UK Biobank, and the analysis of 18,970 protein coding genes finished within 10.4 CPU hours.
0
Citation1
0
Save
57

A multi-layer functional genomic analysis to understand noncoding genetic variation in lipids

Shweta Ramdas et al.Dec 8, 2021
Abstract A major challenge of genome-wide association studies (GWAS) is to translate phenotypic associations into biological insights. Here, we integrate a large GWAS on blood lipids involving 1.6 million individuals from five ancestries with a wide array of functional genomic datasets to discover regulatory mechanisms underlying lipid associations. We first prioritize lipid-associated genes with expression quantitative trait locus (eQTL) colocalizations, and then add chromatin interaction data to narrow the search for functional genes. Polygenic enrichment analysis across 697 annotations from a host of tissues and cell types confirms the central role of the liver in lipid levels, and highlights the selective enrichment of adipose-specific chromatin marks in high-density lipoprotein cholesterol and triglycerides. Overlapping transcription factor (TF) binding sites with lipid-associated loci identifies TFs relevant in lipid biology. In addition, we present an integrative framework to prioritize causal variants at GWAS loci, producing a comprehensive list of candidate causal genes and variants with multiple layers of functional evidence. Two prioritized genes, CREBRF and RRBP1 , show convergent evidence across functional datasets supporting their roles in lipid biology.
57
Citation1
0
Save
5

Lifestyle Risk Score for aggregating multiple lifestyle factors: Handling missingness of individual lifestyle components in meta-analysis of gene-by-lifestyle interactions

Hanfei Xu et al.May 28, 2020
Abstract Recent studies consider lifestyle risk score (LRS), an aggregation of multiple lifestyle exposures, in identifying association of gene-lifestyle interaction with disease traits. However, not all cohorts have data on all lifestyle factors, leading to increased heterogeneity in the environmental exposure in collaborative meta-analyses. We compared and evaluated four approaches (Naïve, Safe, Complete and Moderator Approaches) to handle the missingness in LRS-stratified meta-analyses under various scenarios. Compared to “benchmark” results with all lifestyle factors available for all cohorts, the Complete Approach, which included only cohorts with all lifestyle components, was underpowered, and the Naïve Approach, which utilized all available data and ignored the missingness, was slightly liberal. The Safe Approach, which used all data in LRS-exposed group and only included cohorts with all lifestyle factors available in the LRS-unexposed group, and the Moderator Approach, which handled missingness via moderator meta-regression, were both slightly conservative and yielded almost identical p-values. We also evaluated the performance of the Safe Approach under different scenarios. We observed that the larger the proportion of cohorts without missingness included, the more accurate the results compared to “benchmark” results. In conclusion, we generally recommend the Safe Approach to handle heterogeneity in the LRS based genome-wide interaction meta-analyses.
1

Sex and aging signatures of proteomics in human cerebrospinal fluid identify distinct clusters linked to neurodegeneration.

Dongil Seo et al.Jun 19, 2024
Abstract Sex and age are major risk factors for chronic diseases. Recent studies examining age-related molecular changes in plasma provided insights into age-related disease biology. Cerebrospinal fluid (CSF) proteomics can provide additional insights into brain aging and neurodegeneration. By comprehensively examining 7,006 aptamers targeting 6,139 proteins in CSF obtained from 660 healthy individuals aged from 43 to 91 years old, we subsequently identified significant sex and aging effects on 5,097 aptamers in CSF. Many of these effects on CSF proteins had different magnitude or even opposite direction as those on plasma proteins, indicating distinctive CSF-specific signatures. Network analysis of these CSF proteins revealed not only modules associated with healthy aging but also modules showing sex differences. Through subsequent analyses, several modules were highlighted for their proteins implicated in specific diseases. Module 2 and 6 were enriched for many aging diseases including those in the circulatory systems, immune mechanisms, and neurodegeneration. Together, our findings fill a gap of current aging research and provide mechanistic understanding of proteomic changes in CSF during a healthy lifespan and insights for brain aging and diseases.
0

Deriving stratified effects from joint models investigating Gene-Environment Interactions

Vincent Laville et al.Jul 4, 2019
Background Models including an interaction term and performing a joint test of SNP and/or interaction effect are often used to discover Gene-Environment (GxE) interactions. When the environmental exposure is a binary variable, analyses from exposure-stratified models which consist of estimating genetic effect in unexposed and exposed individuals separately can be of interest. In large-scale consortia focusing on GxE interactions in which only the joint test has been performed, it may be challenging to get summary statistics from both exposure-stratified and marginal (i.e not accounting for interaction) models.Results In this work, we developed a simple framework to estimate summary statistics in each stratum of a binary exposure and in the marginal model using summary statistics from the “joint” model. We performed simulation studies to assess our estimators’ accuracy and examined potential sources of bias, such as correlation between genotype and exposure and differing phenotypic variances within exposure strata. Results from these simulations highlight the high theoretical accuracy of our estimators and yield insights into the impact of potential sources of bias. We then applied our methods to real data and demonstrate our estimators’ retained accuracy after filtering SNPs by sample size to mitigate potential bias.Conclusions These analyses demonstrated the accuracy of our method in estimating both stratified and marginal summary statistics from a joint model of gene-environment interaction. In addition to facilitating the interpretation of GxE screenings, this work could be used to guide further functional analyses. We provide a user-friendly Python script to apply this strategy to real datasets. The Python script and documentation are available at .* GLIWG : Gene-Lifestyle Interaction Working Group GxE : Gene-Environment ICC : Intraclass Correlation Coefficient SNP : Single Nucleotide Polymorphism
0

Multi-ancestry analysis of gene-sleep interactions in 126,926 individuals identifies multiple novel blood lipid loci that contribute to our understanding of sleep-associated adverse blood lipid profile

Raymond Noordam et al.Feb 25, 2019
Both short and long sleep are associated with an adverse lipid profile, likely through different biological pathways. To provide new insights in the biology of sleep-associated adverse lipid profile, we conducted multi-ancestry genome-wide sleep-SNP interaction analyses on three lipid traits (HDL-c, LDL-c and triglycerides). In the total study sample (discovery + replication) of 126,926 individuals from 5 different ancestry groups, when considering either long or short total sleep time interactions in joint analyses, we identified 49 novel lipid loci, and 10 additional novel lipid loci in a restricted sample of European-ancestry cohorts. In addition, we identified new gene-sleep interactions for known lipid loci such as LPL and PCSK9. The novel gene-sleep interactions had a modest explained variance in lipid levels: most notable, gene-short-sleep interactions explained 4.25% of the variance in triglyceride concentration. Collectively, these findings contribute to our understanding of the biological mechanisms involved in sleep-associated adverse lipid profiles.
Load More