SB
Sailalitha Bollepalli
Author with expertise in Genomic Studies and Association Analyses
Institute for Molecular Medicine Finland, University of Helsinki, New York Genome Center
+ 1 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
4
(50% Open Access)
Cited by:
15
h-index:
14
/
i10-index:
14
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
3

A Saturated Map of Common Genetic Variants Associated with Human Height from 5.4 Million Individuals of Diverse Ancestries

Loïc Yengo et al.Jan 12, 2022
+554
E
S
L
ABSTRACT Common SNPs are predicted to collectively explain 40-50% of phenotypic variation in human height, but identifying the specific variants and associated regions requires huge sample sizes. Here we show, using GWAS data from 5.4 million individuals of diverse ancestries, that 12,111 independent SNPs that are significantly associated with height account for nearly all of the common SNP-based heritability. These SNPs are clustered within 7,209 non-overlapping genomic segments with a median size of ~90 kb, covering ~21% of the genome. The density of independent associations varies across the genome and the regions of elevated density are enriched for biologically relevant genes. In out-of-sample estimation and prediction, the 12,111 SNPs account for 40% of phenotypic variance in European ancestry populations but only ~10%-20% in other ancestries. Effect sizes, associated regions, and gene prioritization are similar across ancestries, indicating that reduced prediction accuracy is likely explained by linkage disequilibrium and allele frequency differences within associated regions. Finally, we show that the relevant biological pathways are detectable with smaller sample sizes than needed to implicate causal genes and variants. Overall, this study, the largest GWAS to date, provides an unprecedented saturated map of specific genomic regions containing the vast majority of common height-associated variants.
57

A multi-layer functional genomic analysis to understand noncoding genetic variation in lipids

Shweta Ramdas et al.Oct 24, 2023
+532
S
J
S
Abstract A major challenge of genome-wide association studies (GWAS) is to translate phenotypic associations into biological insights. Here, we integrate a large GWAS on blood lipids involving 1.6 million individuals from five ancestries with a wide array of functional genomic datasets to discover regulatory mechanisms underlying lipid associations. We first prioritize lipid-associated genes with expression quantitative trait locus (eQTL) colocalizations, and then add chromatin interaction data to narrow the search for functional genes. Polygenic enrichment analysis across 697 annotations from a host of tissues and cell types confirms the central role of the liver in lipid levels, and highlights the selective enrichment of adipose-specific chromatin marks in high-density lipoprotein cholesterol and triglycerides. Overlapping transcription factor (TF) binding sites with lipid-associated loci identifies TFs relevant in lipid biology. In addition, we present an integrative framework to prioritize causal variants at GWAS loci, producing a comprehensive list of candidate causal genes and variants with multiple layers of functional evidence. Two prioritized genes, CREBRF and RRBP1 , show convergent evidence across functional datasets supporting their roles in lipid biology.
0

Smoking induces coordinated DNA methylation and gene expression changes in adipose tissue with consequences for metabolic health

Pei-Chien Tsai et al.May 7, 2020
+18
M
C
P
Tobacco smoking is a risk factor for multiple diseases, including cardiovascular disease and diabetes. Many smoking-associated signals have been detected in the blood methylome, but the extent to which these changes are widespread to metabolically relevant tissues, and impact gene expression or cardio-metabolic health, remains unclear. We investigated smoking-associated DNA methylation and gene expression variation in adipose tissue from 542 healthy female twins with available well-characterized cardio-metabolic phenotype profiles. We identified 42 smoking-methylation and 42 smoking-expression signals, where five genes (AHRR, CYP1A1, CYP1B1, CYTL1, F2RL3) were both hypo-methylated and up-regulated in smokers. We replicated and validated a proportion of the signals in blood, adipose, skin, and lung tissue datasets, identifying tissue-shared effects. Smoking leaves systemic imprints on DNA methylation after smoking cessation, with stronger but shorter-lived effects on gene expression. We tested for associations between the observed smoking signals and several adiposity phenotypes that constitute cardio-metabolic disease risk. Visceral fat and android/gynoid ratio were associated with methylation at smoking-markers with functional impacts on expression, such as CYP1A1, and in signals shared across tissues, such as NOTCH1. At smoking-signals BHLHE40 and AHRR DNA methylation and gene expression levels in current smokers were predictive of future gain in visceral fat upon smoking cessation. Our results provide the first comprehensive characterization of coordinated DNA methylation and gene expression markers of smoking in adipose tissue, a subset of which link to human cardio-metabolic health and may give insights into the wide-ranging risk effects of smoking across the body.
0

EpiSmokEr: A robust classifier to determine smoking status from DNA methylation data

Sailalitha Bollepalli et al.May 7, 2020
+2
J
T
S
Motivation Smoking strongly influences DNA methylation, with current, former and never smokers exhibiting different methylation profiles. To advance the practical applicability of the smoking-associated methylation signals, we used machine learning methodology to train a classifier for smoking status prediction.Results We show the prediction performance of our classifier on three independent whole-blood test datasets demonstrating its robustness and global applicability. Furthermore, we examine reasons for biologically meaningful misclassifications through comprehensive phenotypic evaluation. The major contribution of our classifier is its global applicability without a need for users to determine a threshold value applicable for each dataset to predict the smoking status.Availability and Implementation We provide an R package, EpiSmokEr , facilitating the use of our classifier to predict smoking status in future studies. EpiSmokEr is available from GitHub: Contact Sailalitha.bollepalli{at}helsinki.fi and miina.ollikainen{at}helsinki.fi