CE
Corinne Engelman
Author with expertise in Advances in Metabolomics Research
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
15
(40% Open Access)
Cited by:
361
h-index:
35
/
i10-index:
69
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Using recursive feature elimination in random forest to account for correlated variables in high dimensional data

Burcu Darst et al.Sep 1, 2018
Random forest (RF) is a machine-learning method that generally works well with high-dimensional problems and allows for nonlinear relationships between predictors; however, the presence of correlated predictors has been shown to impact its ability to identify strong predictors. The Random Forest-Recursive Feature Elimination algorithm (RF-RFE) mitigates this problem in smaller data sets, but this approach has not been tested in high-dimensional omics data sets. We integrated 202,919 genotypes and 153,422 methylation sites in 680 individuals, and compared the abilities of RF and RF-RFE to detect simulated causal associations, which included simulated genotype–methylation interactions, between these variables and triglyceride levels. Results show that RF was able to identify strong causal variables with a few highly correlated variables, but it did not detect other causal variables. Although RF-RFE decreased the importance of correlated variables, in the presence of many correlated variables, it also decreased the importance of causal variables, making both hard to detect. These findings suggest that RF-RFE may not scale to high-dimensional data.
0
Citation357
0
Save
0

Ancestry-specific polygenic scores and SNP heritability of 25(OH)D in African- and European-ancestry populations

Kathryn Hatchell et al.Apr 4, 2019
Abstract Context Vitamin D inadequacy, assessed by 25-hydroxyvitamin D [25(OH)D], affects around 50% of adults in the United States and is associated with numerous adverse health outcomes. Blood 25(OH)D concentrations are influenced by genetic factors that may determine how much vitamin D intake is required to reach optimal 25(OH)D. Despite large genome-wide association studies (GWASs), only a small portion of the genetic factors contributing to differences in 25(OH)D levels has been discovered. Objective Therefore, knowledge of a fuller set of genetic factors could be useful for risk prediction of 25(OH)D inadequacy, personalized vitamin D supplementation, and prevention of morbidity and mortality from deficient 25(OH)D. Design Using PRSice and weights from published African- and European-ancestry GWAS summary statistics, ancestry-specific polygenic scores (PGSs) were created to capture a more complete set of genetic factors. Patients or Other Participants Participants (European ancestry n=9,569, African ancestry n=2,761) came from three cohort studies. Main Outcome Measure(s) Blood concentrations of 25(OH)D. Results The PGS for African ancestry was derived using all input SNPs (a p-value cut-off of 1.0) and had an R 2 of 0.3%; for European ancestry, the optimal PGS used a p-value cut-off of 3.5×10 −4 in the target/tuning dataset and had an R 2 of 1.0% in the validation cohort. Those with highest genetic risk had 25(OH)D that was 2.8-3.0 ng/ml lower than those with lowest genetic risk (p=0.0463 to 3.2×10 −13 ), requiring an additional 467 to 500 IU of vitamin D intake to maintain equivalent 25(OH)D. Conclusions PGSs are a powerful predictive tool that could be leveraged for personalized vitamin D supplementation to prevent the negative downstream effects of 25(OH)D inadequacy.
0
Citation1
0
Save
0

Characterizing the effects of sex, APOE ε4, and literacy on mid-life cognitive trajectories: Application of Information-Theoretic model-averaging and multi-model inference techniques to the Wisconsin Registry for Alzheimer's Prevention Study

Rebecca Koscik et al.Dec 5, 2017
Objective: In this paper we apply Information-Theoretic (IT) model averaging to characterize a set of complex interactions in a longitudinal study on cognitive decline. Prior research has identified numerous genetic (including sex), education, health and lifestyle factors that predict cognitive decline. Traditional model selection approaches (e.g., backward or stepwise selection) attempt to find models that best fit the observed data; these techniques risk interpretations that only the selected predictors are important. In reality, several models may fit similarly well but result in different conclusions (e.g., about size and significance of parameter estimates); inference from traditional model selection approaches can lead to overly confident conclusions. Method: Here we use longitudinal cognitive data from ~1550 late-middle aged adults the Wisconsin Registry for Alzheimer's Prevention study to examine the effects of sex, Apolipoprotein E (APOE) ϵ4 allele (non-modifiable factors), and literacy achievement (modifiable) on cognitive decline. For each outcome, we applied IT model averaging to a model set with combinations of interactions among sex, APOE, literacy, and age. Results: For a list-learning test, model-averaged results showed better performance for women vs men, with faster decline among men; increased literacy was associated with better performance, particularly among men. APOE had less of an effect on cognitive performance in this age range (~40-70). Conclusions: These results illustrate the utility of the IT approach and point to literacy as a potential modifier of decline. Whether the protective effect of literacy is due to educational attainment or intrinsic verbal intellectual ability is the topic of ongoing work.
0

Longitudinal plasma metabolomics of aging and sex

Burcu Darst et al.Oct 7, 2018
Understanding how metabolites are longitudinally influenced by age and sex could facilitate the identification of metabolomic profiles and trajectories that indicate disease risk. We investigated the metabolomics of age and sex using longitudinal plasma samples from the Wisconsin Registry for Alzheimer's Prevention (WRAP), a cohort of participants who were dementia free at enrollment. Metabolomic profiles were quantified for 2,316 fasting plasma samples among 1,187 participants, each with up to three study visits. Of 1,097 metabolites tested, 608 (55.4%) were associated with age and 680 (62.0%) with sex after correcting for multiple testing. Approximately twice as many metabolites were associated with age in stratified analyses of women versus men, and 63 metabolite trajectories significantly differed by sex, most notably including sphingolipids, which tended to increase in women and decrease in men with age. Using genome-wide genotyping, we also report the heritabilities of metabolites investigated, which ranged dramatically (0.2-99.2%); however, the median heritability of 36.2% suggests that many metabolites are highly influenced by a complex combination of genomic and environmental influences. These findings offer a more profound description of the aging process and may inform many new hypotheses regarding the role metabolites play in healthy and accelerated aging.
0

Multi-ethnic analysis shows genetic risk and environmental predictors interact to influence 25(OH)D concentration and optimal vitamin D intake

Kathryn Hatchell et al.May 28, 2019
Background: Vitamin D inadequacy affects almost 50% of adults in the United States and is associated with numerous adverse health effects. Vitamin D concentration [25(OH)D] is a complex trait with genetic and environmental predictors that work in tandem to influence 25(OH)D and may determine how much vitamin D intake is required to reach an optimal 25(OH)D concentration. To date, there has been little investigation into how genetics and environment interact to affect 25(OH)D. Objective: Interactions between continuous measures of a polygenic score (PGS) and vitamin D intake (PGS*intake) or available ultra-violet (UV) radiation (PGS*UV) were evaluated separately in individuals of African or European ancestry. Methods: Mega-analyses were performed using three independent cohorts (N=9,668; African ancestry n=1,099; European ancestry n=8,569). Interaction terms and joint effects (main and interaction terms) were tested using one-degree of freedom (DF) and 2-DF models, respectively. All models controlled for age, sex, body mass index (BMI), cohort, and dietary intake/available UV. Additionally, in participants achieving Institute of Medicine (IOM) vitamin D intake recommendations, 25(OH)D was evaluated by level of genetic risk of 25(OH)D deficiency. Results: The 2-DF PGS*intake, 1-DF PGS*UV and 2-DF PGS*UV results were statistically significant in participants of European ancestry (p=3.3x10-18, 2.1x10-2, and 2.4x10-19, respectively), but not in those of African ancestry. In European-ancestry participants who reached IOM vitamin D intake guidelines, the percent of participants achieving adequate 25(OH)D (>20ng/ml) increased as genetic risk decreased (72% vs 89% in the highest vs lowest risk categories; p=0.018). Conclusions: Available UV radiation and vitamin D intake interact with genetics to influence 25(OH)D. Individuals with higher genetic risk of deficiency may require more vitamin D exposure to maintain optimal 25(OH)D concentrations. Overall, the results showcase the importance of incorporating both environmental and genetic factors into analyses, as well as the potential for gene-environment interactions to inform personalized dosing of vitamin D.
0

Biobank-wide association scan identifies risk factors for late-onset Alzheimer's disease and endophenotypes

Donghong Yan et al.Nov 12, 2018
Dense genotype data and thousands of phenotypes from large biobanks, coupled with increasingly accessible summary association statistics from genome-wide association studies (GWAS), provide great opportunities to dissect the complex relationships among human traits and diseases. We introduce BADGERS, a powerful method to perform polygenic score-based biobank-wide scans for disease-trait associations. Compared to traditional regression approaches, BADGERS uses GWAS summary statistics as input and does not require multiple traits to be measured on the same cohort. We applied BADGERS to two independent datasets for Alzheimer's disease (AD; N=61,212). Among the polygenic risk scores (PRS) for 1,738 traits in the UK Biobank, we identified 48 significant trait PRSs associated with AD after adjusting for multiple testing. Family history, high cholesterol, and numerous traits related to intelligence and education showed strong and independent associations with AD. Further, we identified 41 significant PRSs associated with AD endophenotypes. While family history and high cholesterol were strongly associated with neuropathologies and cognitively-defined AD subgroups, only intelligence and education-related traits predicted pre-clinical cognitive phenotypes. These results provide novel insights into the distinct biological processes underlying various risk factors for AD.
0

Cerebrospinal fluid metabolomics identifies 19 brain-related phenotype associations

Daniel Panyard et al.Feb 15, 2020
Advances in technology have allowed for the study of metabolomics in the context of disease, enabling the discovery of new potential risk factors, diagnostic markers, and drug targets. For neurological and psychiatric phenotypes, the cerebrospinal fluid (CSF) is of particular biomedical importance as it is in direct contact with the brain and spinal cord. However, the CSF metabolome is difficult to study on a large scale due to the relative complexity of the procedure needed to collect the fluid compared to blood or urine studies. Here, we present a metabolome-wide association study (MWAS), an analysis using individual-level genetic and metabolomic data from two cohorts to impute metabolites into large samples with genome-wide association summary statistics. We conducted a metabolome-wide genome-wide association analysis with 338 CSF metabolites, identifying 16 genotype-metabolite associations, 6 of which were novel. Using these results, we then built prediction models for all available CSF metabolites and tested for associations with 27 neurological and psychiatric phenotypes in large cohorts, identifying 19 significant CSF metabolite-phenotype associations. Our results demonstrate the potential of MWAS to overcome the logistic challenges inherent in cerebrospinal fluid research to study the role of metabolomics in brain-related phenotypes and the feasibility of this framework for similar studies of omic data in scarce sample types.
0

Biobank-wide association scan identifies risk factors for late-onset Alzheimer’s disease and endophenotypes

Donghai Yan et al.May 24, 2024
Rich data from large biobanks, coupled with increasingly accessible association statistics from genome-wide association studies (GWAS), provide great opportunities to dissect the complex relationships among human traits and diseases. We introduce BADGERS, a powerful method to perform polygenic score-based biobank-wide association scans. Compared to traditional approaches, BADGERS uses GWAS summary statistics as input and does not require multiple traits to be measured in the same cohort. We applied BADGERS to two independent datasets for late-onset Alzheimer’s disease (AD; n=61,212). Among 1738 traits in the UK biobank, we identified 48 significant associations for AD. Family history, high cholesterol, and numerous traits related to intelligence and education showed strong and independent associations with AD. Furthermore, we identified 41 significant associations for a variety of AD endophenotypes. While family history and high cholesterol were strongly associated with AD subgroups and pathologies, only intelligence and education-related traits predicted pre-clinical cognitive phenotypes. These results provide novel insights into the distinct biological processes underlying various risk factors for AD.
Load More