BD
Burcu Darst
Author with expertise in Analysis of Gene Interaction Networks
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
9
(44% Open Access)
Cited by:
358
h-index:
27
/
i10-index:
41
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Using recursive feature elimination in random forest to account for correlated variables in high dimensional data

Burcu Darst et al.Sep 1, 2018
Random forest (RF) is a machine-learning method that generally works well with high-dimensional problems and allows for nonlinear relationships between predictors; however, the presence of correlated predictors has been shown to impact its ability to identify strong predictors. The Random Forest-Recursive Feature Elimination algorithm (RF-RFE) mitigates this problem in smaller data sets, but this approach has not been tested in high-dimensional omics data sets. We integrated 202,919 genotypes and 153,422 methylation sites in 680 individuals, and compared the abilities of RF and RF-RFE to detect simulated causal associations, which included simulated genotype–methylation interactions, between these variables and triglyceride levels. Results show that RF was able to identify strong causal variables with a few highly correlated variables, but it did not detect other causal variables. Although RF-RFE decreased the importance of correlated variables, in the presence of many correlated variables, it also decreased the importance of causal variables, making both hard to detect. These findings suggest that RF-RFE may not scale to high-dimensional data.
0
Citation357
0
Save
0

Integrated analysis of genomics, longitudinal metabolomics, and Alzheimer's risk factors among 1,111 cohort participants

Burcu Darst et al.Oct 5, 2018
Although Alzheimer's disease (AD) is highly heritable, genetic variants known to be associated with AD only explain a small proportion of its heritability. Genetic factors may only convey disease risk in individuals with certain environmental exposures, suggesting that a multi-omics approach could reveal underlying mechanisms contributing to complex traits, such as AD. We developed an integrated network to investigate relationships between metabolomics, genomics, and AD risk factors using Wisconsin Registry for Alzheimer's Prevention participants. Analyses included 1,111 non-Hispanic Caucasian participants with whole blood expression for 11,376 genes (imputed from dense genome-wide genotyping), 1,097 fasting plasma metabolites, and 17 AD risk factors. A subset of 155 individuals also had 364 fasting cerebral spinal fluid (CSF) metabolites. After adjusting each of these 12,854 variables for potential confounders, we developed an undirected graphical network, representing all significant pairwise correlations upon adjusting for multiple testing. There were many instances of genes being indirectly linked to AD risk factors through metabolites, suggesting that genes may influence AD risk through particular metabolites. Follow-up analyses suggested that glycine mediates the relationship between CPS1 and measures of cardiovascular and diabetes risk, including body mass index, waist-hip ratio, inflammation, and insulin resistance. Further, 38 CSF metabolites explained more than 60% of the variance of CSF levels of tau, a detrimental protein that accumulates in the brain of AD patients and is necessary for its diagnosis. These results further our understanding of underlying mechanisms contributing to AD risk while demonstrating the utility of generating and integrating multiple omics data types.
0

Longitudinal plasma metabolomics of aging and sex

Burcu Darst et al.Oct 7, 2018
Understanding how metabolites are longitudinally influenced by age and sex could facilitate the identification of metabolomic profiles and trajectories that indicate disease risk. We investigated the metabolomics of age and sex using longitudinal plasma samples from the Wisconsin Registry for Alzheimer's Prevention (WRAP), a cohort of participants who were dementia free at enrollment. Metabolomic profiles were quantified for 2,316 fasting plasma samples among 1,187 participants, each with up to three study visits. Of 1,097 metabolites tested, 608 (55.4%) were associated with age and 680 (62.0%) with sex after correcting for multiple testing. Approximately twice as many metabolites were associated with age in stratified analyses of women versus men, and 63 metabolite trajectories significantly differed by sex, most notably including sphingolipids, which tended to increase in women and decrease in men with age. Using genome-wide genotyping, we also report the heritabilities of metabolites investigated, which ranged dramatically (0.2-99.2%); however, the median heritability of 36.2% suggests that many metabolites are highly influenced by a complex combination of genomic and environmental influences. These findings offer a more profound description of the aging process and may inform many new hypotheses regarding the role metabolites play in healthy and accelerated aging.
0

Cerebrospinal fluid metabolomics identifies 19 brain-related phenotype associations

Daniel Panyard et al.Feb 15, 2020
Advances in technology have allowed for the study of metabolomics in the context of disease, enabling the discovery of new potential risk factors, diagnostic markers, and drug targets. For neurological and psychiatric phenotypes, the cerebrospinal fluid (CSF) is of particular biomedical importance as it is in direct contact with the brain and spinal cord. However, the CSF metabolome is difficult to study on a large scale due to the relative complexity of the procedure needed to collect the fluid compared to blood or urine studies. Here, we present a metabolome-wide association study (MWAS), an analysis using individual-level genetic and metabolomic data from two cohorts to impute metabolites into large samples with genome-wide association summary statistics. We conducted a metabolome-wide genome-wide association analysis with 338 CSF metabolites, identifying 16 genotype-metabolite associations, 6 of which were novel. Using these results, we then built prediction models for all available CSF metabolites and tested for associations with 27 neurological and psychiatric phenotypes in large cohorts, identifying 19 significant CSF metabolite-phenotype associations. Our results demonstrate the potential of MWAS to overcome the logistic challenges inherent in cerebrospinal fluid research to study the role of metabolomics in brain-related phenotypes and the feasibility of this framework for similar studies of omic data in scarce sample types.
1

Genome-wide Association Study of Pancreatic Fat: The Multiethnic Cohort Adiposity Phenotype Study

Samantha Streicher et al.Mar 23, 2021
Abstract Several studies have found associations between higher pancreatic fat content and adverse health outcomes, such as diabetes and the metabolic syndrome, but investigations into the genetic contributions to pancreatic fat are limited. This genome-wide association study, comprised of 804 participants with MRI-assessed pancreatic fat measurements, was conducted in the ethnically diverse Multiethnic Cohort-Adiposity Phenotype Study (MEC-APS). Two genetic variants reaching genome-wide significance, rs73449607 on chromosome 13q21.2 (Beta = −0.67, P = 4.50×10 -8 ) and rs7996760 on chromosome 6q14 (Beta = −0.90, P = 4.91×10 -8 ) were associated with percent pancreatic fat on the log scale. Rs73449607 was most common in the African American population (13%) and rs79967607 was most common in the European American population (6%). Rs73449607 was also suggestively associated with lower risk of type 2 diabetes (OR = 0.95, 95% CI = 0.89-1.00, P = 0.047) in the Population Architecture Genomics and Epidemiology (PAGE) Study and the DIAbetes Genetics Replication and Meta-analysis (DIAGRAM), which included substantial numbers of non-European ancestry participants (53,102 cases and 193,679 controls). Rs73449607 is located in an intergenic region between GSX1 and PLUT , and rs79967607 is in intron 1 of EPM2A . PLUT , a linkRNA , regulates transcription of an adjacent gene, PDX1 , that controls beta-cell function in the mature pancreas, and EPM2A encodes the protein laforin, which plays a critical role in regulating glycogen production. If validated, these variants may suggest a genetic component for pancreatic fat and a common etiologic link between pancreatic fat and type 2 diabetes.
0

Biobank-wide association scan identifies risk factors for late-onset Alzheimer's disease and endophenotypes

Donghong Yan et al.Nov 12, 2018
Dense genotype data and thousands of phenotypes from large biobanks, coupled with increasingly accessible summary association statistics from genome-wide association studies (GWAS), provide great opportunities to dissect the complex relationships among human traits and diseases. We introduce BADGERS, a powerful method to perform polygenic score-based biobank-wide scans for disease-trait associations. Compared to traditional regression approaches, BADGERS uses GWAS summary statistics as input and does not require multiple traits to be measured on the same cohort. We applied BADGERS to two independent datasets for Alzheimer's disease (AD; N=61,212). Among the polygenic risk scores (PRS) for 1,738 traits in the UK Biobank, we identified 48 significant trait PRSs associated with AD after adjusting for multiple testing. Family history, high cholesterol, and numerous traits related to intelligence and education showed strong and independent associations with AD. Further, we identified 41 significant PRSs associated with AD endophenotypes. While family history and high cholesterol were strongly associated with neuropathologies and cognitively-defined AD subgroups, only intelligence and education-related traits predicted pre-clinical cognitive phenotypes. These results provide novel insights into the distinct biological processes underlying various risk factors for AD.
0

Biobank-wide association scan identifies risk factors for late-onset Alzheimer’s disease and endophenotypes

Donghai Yan et al.May 24, 2024
Rich data from large biobanks, coupled with increasingly accessible association statistics from genome-wide association studies (GWAS), provide great opportunities to dissect the complex relationships among human traits and diseases. We introduce BADGERS, a powerful method to perform polygenic score-based biobank-wide association scans. Compared to traditional approaches, BADGERS uses GWAS summary statistics as input and does not require multiple traits to be measured in the same cohort. We applied BADGERS to two independent datasets for late-onset Alzheimer’s disease (AD; n=61,212). Among 1738 traits in the UK biobank, we identified 48 significant associations for AD. Family history, high cholesterol, and numerous traits related to intelligence and education showed strong and independent associations with AD. Furthermore, we identified 41 significant associations for a variety of AD endophenotypes. While family history and high cholesterol were strongly associated with AD subgroups and pathologies, only intelligence and education-related traits predicted pre-clinical cognitive phenotypes. These results provide novel insights into the distinct biological processes underlying various risk factors for AD.