SR
Sanni Ruotsalainen
Author with expertise in Genomic Studies and Association Analyses
University of Helsinki, Institute for Molecular Medicine Finland, Helsinki University Hospital
+ 6 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
9
(44% Open Access)
Cited by:
30
h-index:
18
/
i10-index:
30
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
3

A Saturated Map of Common Genetic Variants Associated with Human Height from 5.4 Million Individuals of Diverse Ancestries

Loïc Yengo et al.Jan 12, 2022
+554
E
S
L
ABSTRACT Common SNPs are predicted to collectively explain 40-50% of phenotypic variation in human height, but identifying the specific variants and associated regions requires huge sample sizes. Here we show, using GWAS data from 5.4 million individuals of diverse ancestries, that 12,111 independent SNPs that are significantly associated with height account for nearly all of the common SNP-based heritability. These SNPs are clustered within 7,209 non-overlapping genomic segments with a median size of ~90 kb, covering ~21% of the genome. The density of independent associations varies across the genome and the regions of elevated density are enriched for biologically relevant genes. In out-of-sample estimation and prediction, the 12,111 SNPs account for 40% of phenotypic variance in European ancestry populations but only ~10%-20% in other ancestries. Effect sizes, associated regions, and gene prioritization are similar across ancestries, indicating that reduced prediction accuracy is likely explained by linkage disequilibrium and allele frequency differences within associated regions. Finally, we show that the relevant biological pathways are detectable with smaller sample sizes than needed to implicate causal genes and variants. Overall, this study, the largest GWAS to date, provides an unprecedented saturated map of specific genomic regions containing the vast majority of common height-associated variants.
0

Geographic variation and bias in polygenic scores of complex diseases and traits in Finland

Sini Kerminen et al.May 7, 2020
+9
J
A
S
Abstract Polygenic scores (PS) are becoming a useful tool to identify individuals with high genetic risk for complex diseases and several projects are currently testing their utility for translational applications. It is also tempting to use PS to assess whether genetic variation can explain a part of the geographic distribution of a phenotype. However, it is not well known how population genetic properties of the training and target samples affect the geographic distribution of PS. Here, we evaluate geographic differences, and related biases, of PS in Finland with geographically well-defined sample of 2,376 individuals from the National FINRISK study. First, we detect geographic differences in PS for coronary artery disease (CAD), rheumatoid arthritis, schizophrenia, waits-hip ratio (WHR), body-mass index (BMI) and height, but not for Crohn’s disease or ulcerative colitis. Second, we use height as a model trait to thoroughly assess the possible population genetic biases in PS and apply similar approaches to the other phenotypes. Most importantly, we detect suspiciously large accumulation of geographic differences for CAD, WHR, BMI and height, suggesting bias arising from population genetic structure rather than from a direct genotype-phenotype association. This work demonstrates how sensitive the geographic patterns of current PS are for small biases even within relatively homogenous populations and provides simple tools to identify such biases. A thorough understanding of the effects of population genetic structure on PS is essential for translational applications of PS.
0
Paper
Citation9
0
Save
1

Genetic analysis of obstructive sleep apnoea discovers a strong association with cardiometabolic health

Satu Strausz et al.Jan 24, 2021
+19
H
S
S
Abstract There is currently only limited understanding of the genetic aetiology of obstructive sleep apnoea (OSA). The aim of our study is to identify genetic loci associated with OSA risk and to test if OSA and its comorbidities share a common genetic background. We conducted the first large-scale genome-wide association study of OSA using FinnGen Study (217,955 individuals) with 16,761 OSA patients identified using nationwide health registries. We estimated 8.3% [0.06-0.11] heritability and identified five loci associated with OSA (P < 5.0 × 10 −8 ): rs4837016 near GTPase activating protein and VPS9 domains 1 ( GAPVD1 ), rs10928560 near C-X-C motif chemokine receptor 4 ( CXCR4 ), rs185932673 near Calcium/calmodulin-dependent protein kinase ID ( CAMK1D ) and rs9937053 near Fat mass and obesity-associated protein ( FTO ) - a variant previously associated with body mass index (BMI). In a BMI-adjusted analysis, an association was observed for rs10507084 near Rhabdomyosarcoma 2 associated transcript ( RMST )/NEDD1 gamma-tubulin ring complex targeting factor ( NEDD1 ). We found genetic correlations between OSA and BMI (rg=0.72 [0.62-0.83]) and with comorbidities including hypertension, type 2 diabetes (T2D), coronary heart disease (CHD), stroke, depression, hypothyroidism, asthma and inflammatory rheumatic diseases (IRD) (rg > 0.30). Polygenic risk score (PRS) for BMI showed 1.98-fold increased OSA risk between the highest and the lowest quintile and Mendelian randomization supported a causal relationship between BMI and OSA. Our findings support the causal link between obesity and OSA and joint genetic basis between OSA and comorbidities.
1
Citation6
0
Save
57

A multi-layer functional genomic analysis to understand noncoding genetic variation in lipids

Shweta Ramdas et al.Oct 24, 2023
+532
S
J
S
Abstract A major challenge of genome-wide association studies (GWAS) is to translate phenotypic associations into biological insights. Here, we integrate a large GWAS on blood lipids involving 1.6 million individuals from five ancestries with a wide array of functional genomic datasets to discover regulatory mechanisms underlying lipid associations. We first prioritize lipid-associated genes with expression quantitative trait locus (eQTL) colocalizations, and then add chromatin interaction data to narrow the search for functional genes. Polygenic enrichment analysis across 697 annotations from a host of tissues and cell types confirms the central role of the liver in lipid levels, and highlights the selective enrichment of adipose-specific chromatin marks in high-density lipoprotein cholesterol and triglycerides. Overlapping transcription factor (TF) binding sites with lipid-associated loci identifies TFs relevant in lipid biology. In addition, we present an integrative framework to prioritize causal variants at GWAS loci, producing a comprehensive list of candidate causal genes and variants with multiple layers of functional evidence. Two prioritized genes, CREBRF and RRBP1 , show convergent evidence across functional datasets supporting their roles in lipid biology.
0

Deep coverage whole genome sequences and plasma lipoprotein(a) in individuals of European and African ancestries

Seyedeh Zekavat et al.May 7, 2020
+21
R
S
S
Lipoprotein(a), Lp(a), is a modified low-density lipoprotein particle where apolipoprotein(a) (protein product of the LPA gene) is covalently attached to apolipoprotein B. Lp(a) is a highly heritable, causal risk factor for cardiovascular diseases and varies in concentrations across ancestries. To comprehensively delineate the inherited basis for plasma Lp(a), we performed deep-coverage whole genome sequencing in 8,392 individuals of European and African American ancestries. Through whole genome variant discovery and direct genotyping of all structural variants overlapping LPA, we quantified the 5.5kb kringle IV-2 copy number (KIV2-CN), a known LPA structural polymorphism, and developed a model for its imputation. Through common variant analysis, we discovered a novel locus (SORT1) associated with Lp(a)-cholesterol, and also genetic modifiers of KIV2-CN. Furthermore, in contrast to previous GWAS studies, we explain most of the heritability of Lp(a), observing Lp(a) to be 85% heritable among African Americans and 75% among Europeans, yet with notable inter-ethnic heterogeneity. Through analyses of aggregates of rare coding and non-coding variants with Lp(a)-cholesterol, we found the only genome-wide significant signal to be at a non-coding SLC22A3 intronic window also previously described to be associated with Lp(a); however, this association was mitigated by adjustment with KIV2-CN. Finally, using an additional imputation dataset (N=27,344), we performed Mendelian randomization of LPA variant classes, finding that genetically regulated Lp(a) is more strongly associated with incident cardiovascular diseases than directly measured Lp(a), and is significantly associated with measures of subclinical atherosclerosis in African Americans.
0

The rate of false polymorphisms introduced when imputing genotypes from global imputation panels

Ida Surakka et al.May 7, 2020
+5
S
A
I
Previous studies1,2 have shown that large multi-population imputation reference panels increases the number of well-imputed variants. However, to our knowledge, no previous studies have evaluated the rate of introduced variation in monomorphic sites of the study population when using imputation panels with admixed populations. In this study we evaluate the rate of false positive variants introduced by the imputation of Finnish genotype data using global reference panels (Haplotype Reference Consortium1; HRC, and the 1000Genomes project Phase I3; 1000G) and compare the results to a Finnish population-specific reference panel combining whole genome and exome sequenced samples. In sites that were monomorphic in our test set, we observed high false positive rates for the global reference panels (4.0% for 1000G and 2.6% for HRC) compared to the Finnish panel (0.26%). This rate was even higher (7.4%) when using a combination panel of 1000G and Finnish whole genome sequences with cross-panel imputation.
0

Deep-coverage whole genome sequences and blood lipids among 16,324 individuals

Pradeep Natarajan et al.May 6, 2020
+33
S
G
P
Deep-coverage whole genome sequencing at the population level is now feasible and offers potential advantages for locus discovery, particularly in the analysis rare mutations in non-coding regions. Here, we performed whole genome sequencing in 16,324 participants from four ancestries at mean depth >29X and analyzed correlations of genotypes with four quantitative traits - plasma levels of total cholesterol, low-density lipoprotein cholesterol (LDL-C), high-density lipoprotein cholesterol, and triglycerides. We conducted a discovery analysis including common or rare variants in coding as well as non-coding regions and developed a framework to interpret genome sequence for dyslipidemia risk. Common variant association yielded loci previously described with the exception of a few variants not captured earlier by arrays or imputation. In coding sequence, rare variant association yielded known Mendelian dyslipidemia genes and, in non-coding sequence, we detected no rare variant association signals after application of four approaches to aggregate variants in non-coding regions. We developed a new, genome-wide polygenic score for LDL-C and observed that a high polygenic score conferred similar effect size to a monogenic mutation (~30 mg/dl higher LDL-C for each); however, among those with extremely high LDL-C, a high polygenic score was considerably more prevalent than a monogenic mutation (23% versus 2% of participants, respectively).
0

Polygenic risk score of alcohol consumption predicts alcohol-related morbidity and all-cause mortality

Tuomo Kiiskinen et al.May 7, 2020
+12
T
N
T
Objective: To develop a highly polygenic risk score (PRS) for alcohol consumption and study whether it predicts alcohol-related morbidity and all-cause mortality. Design: Biobank-based prospective cohort study. Setting: FinnGen Study (Finland). Participants: 96,499 genotyped participants from the nationwide prospective FinnGen study and 36,499 participants from prospective cohorts (Health 2000, FINRISK, Twin Cohort) with detailed baseline data and up to 25 years of follow-up time. Main outcome measures: Incident alcohol-related morbidity and alcohol-related or all-cause mortality, based on hospitalizations, outpatient specialist care, drug purchases, and death reports. Results: In 96,499 FinnGen participants there were in total 4,785 first-observed incident alcohol-related health events. The PRS of alcohol consumption was associated with alcohol-related morbidity and the risk estimate (hazard ratio, HR) between the highest and lowest quintiles of the PRS was 1.67 [ 95 % confidence interval: 1.52-1.84], p=3.2*10-27). In 28,639 participants with comprehensive baseline data from prospective Health 2000 and FINRISK cohorts, 911 incident first alcohol-related events were observed. When adjusted for self-reported alcohol consumption, education, marital status, and gamma-glutamyl transferase blood levels, the risk estimate between the highest and lowest quintiles of the PRS was 1.58 (CI=[1.26-1.99], p=8.2*10-5). The PRS was also associated with all-cause mortality with a risk estimate of 1.33 between the highest and lowest quintiles (CI=[1.2-1.47], p=4.5e-08) in the adjusted model. In all 39,695 participants with self-reported alcohol consumption available, a 1 SD increase in the PRS was associated with 11.2 g (=0.93 drinks) higher weekly alcohol consumption (β=11.2 [9.85-12.58 g], p = 2.3*10-58). Conclusions: The PRS for alcohol consumption associates for both alcohol-related morbidity and all-cause mortality. These findings underline the importance of heritable factors in alcohol-related behavior and the related health burden. The results highlight how measured genetic risk for an important behavioral risk factor can be used to predict related health outcomes.
0

An expanded analysis framework for multivariate GWAS connects inflammatory biomarkers to functional variants and disease

Sanni Ruotsalainen et al.May 7, 2020
+15
A
J
S
Multivariate methods are known to increase the statistical power of association detection, but they have lacked essential follow-up analysis tools necessary for understanding the biology underlying these associations. We developed a novel computational workflow for multivariate GWAS follow-up analyses, including fine-mapping and identification of the subset of traits driving associations (driver traits). Many follow-up tools require univariate regression coefficients which are lacking from multivariate results. Our method overcomes this problem by using Canonical Correlation Analysis to turn each multivariate association into its optimal univariate Linear Combination Phenotype (LCP). This enables an LCP-GWAS, which in turn generates the statistics required for follow-up analyses. We implemented our method on 12 highly correlated inflammatory biomarkers in a Finnish population-based study. Altogether, we identified 11 associations, four of which (F5, ABO, C1orf140 and PDGFRB) were not detected by biomarker-specific analyses. Fine-mapping identified 19 signals within the 11 loci and driver trait analysis determined the traits contributing to the associations. A phenome-wide association study on the 19 putative causal variants from the signals in 176,899 individuals from the FinnGen study revealed 53 disease associations (p < 1x10-4). Several reported pQTLs in the 11 loci provided orthogonal evidence for the biologically relevant functions of the putative causal variants. Our novel multivariate analysis workflow provides a powerful addition to standard univariate GWAS analyses by enabling multivariate GWAS follow-up and thus promoting the advancement of powerful multivariate methods in genomics.