MS
Merina Shrestha
Author with expertise in Genomic Studies and Association Analyses
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
3
(100% Open Access)
Cited by:
0
h-index:
6
/
i10-index:
5
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Evaluation of Bayesian Linear Regression Models as a Fine Mapping tool

Merina Shrestha et al.Sep 5, 2023
Abstract Bayesian linear regression (BLR) models consider the underlying genetic architecture of complex phenotypes by specifying different prior distributions for SNP effects allowing heterogenous distribution of the true genetic signals. Our goal is to evaluate BLR models with BayesC and BayesR prior distributions for fine mapping on simulated and real binary and quantitative phenotypes, and compare them to the state-of-the-art external models: FINEMAP, SuSIE-RSS, SuSIE-Inf and FINEMAP-Inf. Evaluation of models was based on the F 1 classification score for simulations, and predictive accuracy for the UK Biobank (UKB) phenotypes. We used over 533K genotyped SNPs (simulations) and 6.6 million imputed SNPs (UKB phenotypes), from over 335K White British Unrelated samples in the UK biobank. We simulated phenotypes from low (GA1) to moderate (GA2) polygenicity, heritability( h 2 ) of 30% and 10%, causal SNPs (π) of 0.1% and 1% sampled genome-wide, and prevalence (PV) of 5% and 15%. Summary statistics and in-sample linkage disequilibrium were used to fit models in regions defined by lead SNPs. BayesR improved the F 1 score, averaged across all simulations, by by 27.26%, 26.96%, 18.40%, 15.42%, and 13.32% relative to FINEMAP-Inf, BayesC, FINEMAP, SUSIE-RSS and SUSIE-Inf. Prediction R 2 , averaged across all the UKB quantitative phenotypes, with BayesR decreased by 5.32% and 3.71% compared to SuSIE-Inf and FINEMAP-Inf, whereas increased by 7.93% and 8.3% compared to SuSIE-RSS and BayesC. Prediction AUC, averaged across all the UKB binary phenotypes, with BayesR increased by 0.40%, 0.16%, 0.08%., and 0.05% relative to SuSIE-RSS, BayesC, FINEMAP-Inf, and SuSIE-Inf. These findings suggest that the performance of the BLR models was comparable to the state-of-the-art external models. The performance of BayesR prior was closely aligned with SuSIE-Inf and FINEMAP-Inf models. Results from both simulations and application of the models in the UKB phenotypes suggest that the BLR models are efficient fine mapping tools.
0

Evaluation of Bayesian Linear Regression Models for Gene Set Prioritization in Complex Diseases

Tahereh Gholipur‐Shahraki et al.Feb 26, 2024
ABSTRACT Genome-wide association studies (GWAS) provide valuable insights into the genetic architecture of complex traits, yet interpreting their results remains challenging due to the polygenic nature of most traits. Gene set analysis offers a solution by aggregating genetic variants into biologically relevant pathways, enhancing the detection of coordinated effects across multiple genes. In this study, we present and evaluate a gene set prioritization approach utilizing Bayesian Linear Regression (BLR) models to uncover shared genetic components among different phenotypes and facilitate biological interpretation. Through extensive simulations and analyses of real traits, we demonstrate the efficacy of the BLR model in prioritizing pathways for complex traits. Simulation studies reveal insights into the model’s performance under various scenarios, highlighting the impact of factors such as the number of causal genes, proportions of causal variants, heritability, and disease prevalence. Application of both single-trait and multi-trait BLR models to real data, specifically GWAS summary data for type 2 diabetes (T2D) and related phenotypes, identifies significant associations with T2D-related pathways. Furthermore, comparison between single- and multi-trait BLR analyses highlights the superior performance of the multi-trait approach in identifying associated pathways, showcasing increased statistical power when analyzing multiple traits jointly. Additionally, enrichment analysis with integrated data from various public resources supports our results, confirming significant enrichment of diabetes-related genes within the top T2D pathways resulting from the multi-trait analysis. The BLR model’s ability to handle diverse genomic features, perform regularization, conduct variable selection, and integrate information from multiple traits, genders, and ancestries demonstrates its utility in understanding the genetic architecture of complex traits. Our study provides insights into the potential of the BLR model to prioritize gene sets, offering a flexible framework applicable to various datasets. This model presents opportunities for advancing personalized medicine by exploring the genetic underpinnings of multifactorial traits, potentially leading to tailored therapeutic interventions.
0

Evaluation of Bayesian Linear Regression models for gene set prioritization in complex diseases

Tahereh Gholipur‐Shahraki et al.Nov 4, 2024
Genome-wide association studies (GWAS) provide valuable insights into the genetic architecture of complex traits, yet interpreting their results remains challenging due to the polygenic nature of most traits. Gene set analysis offers a solution by aggregating genetic variants into biologically relevant pathways, enhancing the detection of coordinated effects across multiple genes. In this study, we present and evaluate a gene set prioritization approach utilizing Bayesian Linear Regression (BLR) models to uncover shared genetic components among different phenotypes and facilitate biological interpretation. Through extensive simulations and analyses of real traits, we demonstrate the efficacy of the BLR model in prioritizing pathways for complex traits. Simulation studies reveal insights into the model’s performance under various scenarios, highlighting the impact of factors such as the number of causal genes, proportions of causal variants, heritability, and disease prevalence. Comparative analyses with MAGMA (Multi-marker Analysis of GenoMic Annotation) demonstrate BLR’s superior performance, especially in highly overlapped gene sets. Application of both single-trait and multi-trait BLR models to real data, specifically GWAS summary data for type 2 diabetes (T2D) and related phenotypes, identifies significant associations with T2D-related pathways. Furthermore, comparison between single- and multi-trait BLR analyses highlights the superior performance of the multi-trait approach in identifying associated pathways, showcasing increased statistical power when analyzing multiple traits jointly. Additionally, enrichment analysis with integrated data from various public resources supports our results, confirming significant enrichment of diabetes-related genes within the top T2D pathways resulting from the multi-trait analysis. The BLR model’s ability to handle diverse genomic features, perform regularization, conduct variable selection, and integrate information from multiple traits, genders, and ancestries demonstrates its utility in understanding the genetic architecture of complex traits. Our study provides insights into the potential of the BLR model to prioritize gene sets, offering a flexible framework applicable to various datasets. This model presents opportunities for advancing personalized medicine by exploring the genetic underpinnings of multifactorial traits.