CL
Cathryn Lewis
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
20
(20% Open Access)
Cited by:
20
h-index:
45
/
i10-index:
87
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
75

Evaluation of Polygenic Prediction Methodology within a Reference-Standardized Framework

Oliver Pain et al.Jul 29, 2020
Abstract Background The predictive utility of polygenic scores is increasing, and many polygenic scoring methods are available, but it is unclear which method performs best. This study evaluates the predictive utility of polygenic scoring methods within a reference-standardized framework, which uses a common set of variants and reference-based estimates of linkage disequilibrium and allele frequencies to construct scores. Methods Eight polygenic score methods were tested: p-value thresholding and clumping (pT+clump), SBLUP, lassosum, LDPred1, LDPred2, PRScs, DBSLMM and SBayesR, evaluating their performance to predict outcomes in UK Biobank and the Twins Early Development Study (TEDS). Strategies to identify optimal p-value threshold and shrinkage parameters were compared, including 10-fold cross validation, pseudovalidation and infinitesimal models (with no validation sample), and multi-polygenic score elastic net models. Results LDPred2, lassosum and PRScs performed strongly using 10-fold cross-validation to identify the most predictive p-value threshold or shrinkage parameter, giving a relative improvement of 16-18% over pT+clump in the correlation between observed and predicted outcome values. Using pseudovalidation, the best methods were PRScs and DBSLMM, with a relative improvement of >10% over other pseudovalidation and infinitesimal methods (lassosum, SBLUP, SBayesR, LDPred1, LDPred2). PRScs pseudovalidation was only 3% worse than the best polygenic score identified by 10-fold cross validation. Elastic net models containing polygenic scores based on a range of parameters consistently improved prediction over any single polygenic score. Conclusion Within a reference-standardized framework, the best polygenic prediction was achieved using LDPred2, lassosum and PRScs, modeling multiple polygenic scores derived using multiple parameters. This study will help researchers performing polygenic score studies to select the most powerful and predictive analysis methods.
75
Citation9
0
Save
0

Genetic stratification of depression in UK Biobank suggests a subgroup linked to age of natural menopause

David Howard et al.May 5, 2017
Abstract Depression is a common and clinically heterogeneous mental health disorder that is frequently comorbid with other diseases and conditions. Stratification of depression may align sub-diagnoses more closely with their underling aetiology and provide more tractable targets for research and effective treatment. In the current study, we investigated whether genetic data could be used to identify subgroups within people with depression using the UK Biobank. Examination of cross-locus correlations was used to test for evidence of subgroups by examining whether there was clustering of independent genetic variants associated with eleven other complex traits and disorders in people with depression. We found evidence of a subgroup within depression using age of natural menopause variants ( P = 1.69 × 10 −3 ) and this effect remained significant in females ( P = 1.18 × 10 −3 ), but not males ( P = 0.186). However, no evidence for this subgroup ( P > 0.05) was found in Generation Scotland, iPSYCH, a UK Biobank replication cohort or the GERA cohort. In the UK Biobank, having depression was also associated with a later age of menopause (beta = 0.34, standard error = 0.06, P = 9.92 × 10 −8 ). A potential age of natural menopause subgroup within depression and the association between depression and a later age of menopause suggests that they partially share a developmental pathway.
0
Citation9
0
Save
28

Imputed Gene Expression Risk Scores: A Functionally Informed Component of Polygenic Risk

Oliver Pain et al.Dec 2, 2020
Abstract Background Integration of functional genomic annotations when estimating polygenic risk scores (PRS) can provide insight into aetiology and improve risk prediction. This study explores the predictive utility of gene expression risk scores (GeRS), calculated using imputed gene expression and transcriptome-wide association study (TWAS) results. Methods The predictive utility of GeRS was evaluated using 12 neuropsychiatric and anthropometric outcomes measured in two target samples: UK Biobank and the Twins Early Development Study (TEDS). GeRS were calculated based on imputed gene expression levels and TWAS results, using 53 gene expression-genotype panels, termed SNP-weight sets, capturing expression across a range of tissues. We compare the predictive utility of elastic net models containing GeRS within and across SNP-weight sets, and models containing both GeRS and PRS. We estimate the proportion of SNP-based heritability attributable to cis -regulated gene expression. Results GeRS significantly predicted a range of outcomes, with elastic net models combining GeRS across SNP-weight sets improving prediction. GeRS were less predictive than PRS, but models combining GeRS and PRS improved prediction for several outcomes, with relative improvements ranging from 0.3% for Height ( p =0.023) to 4% for Rheumatoid Arthritis ( p =5.9×10 -8 ). The proportion of SNP-based heritability attributable to cis -regulated expression was modest for most outcomes, even when restricting GeRS to colocalised genes. Conclusion GeRS represent a component of PRS and could be useful for functional stratification of genetic risk. Only in specific circumstances can GeRS substantially improve prediction over PRS alone. Future research considering functional genomic annotations when estimating genetic risk is warranted.
28
Citation1
0
Save
11

Investigating an in-silico approach for prioritizing antidepressant drug prescription based on drug-induced expression profiles and predicted gene expression

Muhammad Shoaib et al.Apr 24, 2020
Abstract In clinical practice, antidepressant prescription is a trial and error approach, which is time consuming and discomforting for patients. This study investigated an in-silico approach for ranking antidepressants based on their hypothetical likelihood of efficacy. We determined the transcriptomic profile of citalopram remitters by performing a transcriptomic-wide association study on STAR*D data ( N =1163 ). The transcriptional profile of remitters was compared with 21 antidepressant-induced gene expression profiles in five human cell lines available in the connectivity map database. Spearman correlation, Pearson correlation, and the Kolmogorov Smirnov test were used to determine the similarity between antidepressant-induced profiles and remitter profiles, subsequently calculating the average rank of antidepressants across the three methods and a p-value for each rank by using a permutation procedure. The drugs with the top ranks were those having high positive correlation with the expression profiles of remitters and they may have higher chances of efficacy in the tested patients. In MCF7 (breast cancer cell line), escitalopram had the highest average rank, with an average rank higher than expected by chance ( p=0.0014 ). In A375 (human melanoma) and PC3 (prostate cancer) cell lines, escitalopram and citalopram emerged as the second highest ranked antidepressants, respectively ( p =0.0310 and 0.0276, respectively). In HA1E (kidney) and HT29 (colon cancer) cell types, citalopram and escitalopram did not fall among top antidepressants. The correlation between citalopram remitters’ and (es)citalopram-induced expression profiles in three cell lines suggests that our approach may be useful and with future improvements it can be applicable at the individual level to tailor treatment prescription.
11
Citation1
0
Save
0

Polygenic risk scores for major depressive disorder and neuroticism as predictors of antidepressant response: meta-analysis of three treatment cohorts.

Joey Ward et al.Apr 5, 2018
Abstract There are currently no reliable approaches for correctly identifying which patients with major depressive disorder (MDD) will respond well to antidepressant therapy. However, recent genetic advances suggest that Polygenic Risk Scores (PRS) could allow MDD patients to be stratified for antidepressant response. We used PRS for MDD and PRS for neuroticism as putative predictors of antidepressant response within three treatment cohorts: The Genome-based Therapeutic Drugs for Depression (GENDEP) cohort, and 2 sub-cohorts from the Pharmacogenomics Research Network Antidepressant Medication Pharmacogenomics Study PRGN-AMPS (total patient number = 783). Results across cohorts were combined via meta-analysis within a random effects model. Overall, PRS for MDD and neuroticism did not significantly predict antidepressant response but there was a consistent direction of effect, whereby greater genetic loading for both MDD (best MDD result, p < 5*10-5 MDD-PRS at 4 weeks, β = -0.019, S.E = 0.008, p = 0.01) and neuroticism (best neuroticism result, p < 0.1 neuroticism-PRS at 8 weeks, β = -0.017, S.E = 0.008, p = 0.03) were associated with less favourable response. We conclude that the PRS approach may offer some promise for treatment stratification in MDD and should now be assessed within larger clinical cohorts.
0

Transforming summary statistics from logistic regression to the liability scale: application to genetic and environmental risk scores

Alexandra Gillett et al.Aug 6, 2018
Objective: Stratified medicine requires models of disease risk incorporating genetic and environmental factors. These may combine estimates from different studies and models must be easily updatable when new estimates become available. The logit scale is often used in genetic and environmental association studies however the liability scale is used for polygenic risk scores and measures of heritability, but combining parameters across studies requires a common scale for the estimates. Methods: We present equations to approximate the relationship between univariate effect size estimates on the logit scale and the liability scale, allowing model parameters to be translated between scales. Results: These equations are used to build a risk score on the liability scale, using effect size estimates originally estimated on the logit scale. Such a score can then be used in a joint effects model to estimate the risk of disease, and this is demonstrated for schizophrenia using a polygenic risk score and environmental risk factors. Conclusion: This straightforward method allows conversion of model parameters between the logit and liability scales, and may be a key tool to integrate risk estimates into a comprehensive risk model, particularly for joint models with environmental and genetic risk factors.
0

Evidence of causal effect of major depression on alcohol dependence: Findings from the Psychiatric Genomics Consortium

Renato Polimanti et al.Sep 9, 2018
Background: Despite established clinical associations among major depression (MD), alcohol dependence (AD), and alcohol consumption (AC), the nature of the causal relationship between them is not completely understood. Methods: This study was conducted using genome-wide data from the Psychiatric Genomics Consortium (MD: 135,458 cases and 344,901 controls; AD: 10,206 cases and 28,480 controls) and UK Biobank (AC-Frequency: from 'daily or almost daily' to 'never', 438,308 individuals; AC-Quantity: total units of alcohol per week, 307,098 individuals). Linkage disequilibrium score regression and Mendelian Randomization (MR) analyses were applied to investigate shared genetic mechanisms (horizontal pleiotropy) and causal relationships (mediated pleiotropy) among these traits. Outcomes: Positive genetic correlation was observed between MD and AD (rgMD-AD=+0.47, P=6.6x10-10). AC-Quantity showed positive genetic correlation with both AD (rgAD-AC-Quantity=+0.75, P=1.8x10-14) and MD (rgMD-AC-Quantity=+0.14, P=2.9x10-7), while there was negative correlation of AC-Frequency with MD (rgMD-AC-Frequency=-0.17, P=1.5x10-10) and a non-significant result with AD. MR analyses confirmed the presence of pleiotropy among these traits. However, the MD-AD results reflect a mediated-pleiotropy mechanism (i.e., causal relationship) with a causal role of MD on AD (beta=0.28, P=1.29x10-6) that does not appear to be biased by confounding such as horizontal pleiotropy. No evidence of reverse causation was observed as the AD genetic instrument did not show a causal effect on MD. Interpretation: Results support a causal role for MD on AD based on genetic datasets including thousands of individuals. Understanding mechanisms underlying MD-AD comorbidity not only addresses important public health concerns but also has the potential to facilitate prevention and intervention efforts.
0

Predictors of intestinal inflammation in asymptomatic first-degree relatives of patients with Crohn's disease

Kirstin Taylor et al.Aug 11, 2017
Objective: Relatives of individuals with Crohn's disease (CD) carry an increased number of CD-associated genetic variants and are at increased risk of developing the disease. Multiple environmental and genetic factors contribute to this increased risk. We aimed to estimate the utility of genotype, smoking, family history, and a panel of biomarkers to predict risk in asymptomatic first-degree relatives (FDRs) of CD patients. Design: We calculated a combined genotype (72 CD-associated genetic markers) and smoking relative risk score in 454 FDRs, and performed capsule endoscopy and collected 22 biomarkers in individuals from the highest and lowest risk quartiles. We then predicted small intestinal inflammation using genetic risk score, smoking status, number of relatives with CD, capsule transit time, and the panel of biomarkers in 124 individuals with complete data. Our principal analysis was to calculate the predictive utility from two machine learning classifiers: an elastic net and a random forest. Results: Both classifiers successfully predicted FDRs with intestinal inflammation: elastic net (AUC=0.80, 95% CI: 0.62-0.98), random forest (AUC=0.87, 95% CI: 0.75-1.00). The elastic net selected a 3-predictor solution: CD family history (OR=1.31), genetic risk score (OR=1.14), and faecal calprotectin (OR=1.04). The same 3 variables were among the top 5 most important predictors as ranked by the random forest. Conclusion: A readily collectable panel of genetic risk variants, added to family history and faecal calprotectin, predicts those at greatest risk for developing CD with a good degree of accuracy.
0

Genome wide meta-analysis identifies genomic relationships, novel loci, and pleiotropic mechanisms across eight psychiatric disorders.

Phil Lee et al.Jan 26, 2019
Genetic influences on psychiatric disorders transcend diagnostic boundaries, suggesting substantial pleiotropy of contributing loci. However, the nature and mechanisms of these pleiotropic effects remain unclear. We performed a meta-analysis of 232,964 cases and 494,162 controls from genome-wide studies of anorexia nervosa, attention-deficit/hyperactivity disorder, autism spectrum disorder, bipolar disorder, major depression, obsessive-compulsive disorder, schizophrenia, and Tourette syndrome. Genetic correlation analyses revealed a meaningful structure within the eight disorders identifying three groups of inter-related disorders. We detected 109 loci associated with at least two psychiatric disorders, including 23 loci with pleiotropic effects on four or more disorders and 11 loci with antagonistic effects on multiple disorders. The pleiotropic loci are located within genes that show heightened expression in the brain throughout the lifespan, beginning in the second trimester prenatally, and play prominent roles in a suite of neurodevelopmental processes. These findings have important implications for psychiatric nosology, drug development, and risk prediction.
Load More