IS
Ida Surakka
Author with expertise in Genomic Studies and Association Analyses
University of Michigan–Ann Arbor, Levanger Hospital, Broad Institute
+ 8 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
15
(40% Open Access)
Cited by:
33
h-index:
59
/
i10-index:
119
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Genome-wide association study of cardiac troponin I in the general population

Marta Moksnes et al.Nov 25, 2023
+27
A
H
M
Circulating cardiac troponin proteins are associated with structural heart disease and predict incident cardiovascular disease in the general population. However, the genetic contribution to cardiac troponin I (cTnI) concentrations and its causal effect on cardiovascular phenotypes are unclear. We combine data from two large population-based studies, the Trøndelag Health Study and the Generation Scotland Scottish Family Health Study, and perform a genome-wide association study of high-sensitivity cTnI concentrations with 48 115 individuals. We further use two-sample Mendelian randomization to investigate the causal effects of circulating cTnI on acute myocardial infarction (AMI) and heart failure (HF). We identified 12 genetic loci (8 novel) associated with cTnI concentrations. Associated protein-altering variants highlighted putative functional genes: CAND2, HABP2, ANO5, APOH, FHOD3, TNFAIP2, KLKB1 and LMAN1. Phenome-wide association tests in 1688 phecodes and 83 continuous traits in UK Biobank showed associations between a genetic risk score for cTnI and cardiac arrhythmias, metabolic and anthropometric measures. Using two-sample Mendelian randomization, we confirmed the non-causal role of cTnI in AMI (5948 cases, 355 246 controls). We found indications for a causal role of cTnI in HF (47 309 cases and 930 014 controls), but this was not supported by secondary analyses using left ventricular mass as outcome (18 257 individuals). Our findings clarify the biology underlying the heritable contribution to circulating cTnI and support cTnI as a non-causal biomarker for AMI in the general population. Using genetically informed methods for causal inference helps inform the role and value of measuring cTnI in the general population.
0

New genetic signals for lung function highlight pathways and pleiotropy, and chronic obstructive pulmonary disease associations across multiple ancestries

Nick Shrine et al.May 6, 2020
+107
A
A
N
Abstract Reduced lung function predicts mortality and is key to the diagnosis of COPD. In a genome-wide association study in 400,102 individuals of European ancestry, we define 279 lung function signals, one-half of which are new. In combination these variants strongly predict COPD in deeply-phenotyped patient populations. Furthermore, the combined effect of these variants showed generalisability across smokers and never-smokers, and across ancestral groups. We highlight biological pathways, known and potential drug targets for COPD and, in phenome-wide association studies, autoimmune-related and other pleiotropic effects of lung function associated variants. This new genetic evidence has potential to improve future preventive and therapeutic strategies for COPD.
0
Citation9
0
Save
0

Geographic variation and bias in polygenic scores of complex diseases and traits in Finland

Sini Kerminen et al.May 7, 2020
+9
J
A
S
Abstract Polygenic scores (PS) are becoming a useful tool to identify individuals with high genetic risk for complex diseases and several projects are currently testing their utility for translational applications. It is also tempting to use PS to assess whether genetic variation can explain a part of the geographic distribution of a phenotype. However, it is not well known how population genetic properties of the training and target samples affect the geographic distribution of PS. Here, we evaluate geographic differences, and related biases, of PS in Finland with geographically well-defined sample of 2,376 individuals from the National FINRISK study. First, we detect geographic differences in PS for coronary artery disease (CAD), rheumatoid arthritis, schizophrenia, waits-hip ratio (WHR), body-mass index (BMI) and height, but not for Crohn’s disease or ulcerative colitis. Second, we use height as a model trait to thoroughly assess the possible population genetic biases in PS and apply similar approaches to the other phenotypes. Most importantly, we detect suspiciously large accumulation of geographic differences for CAD, WHR, BMI and height, suggesting bias arising from population genetic structure rather than from a direct genotype-phenotype association. This work demonstrates how sensitive the geographic patterns of current PS are for small biases even within relatively homogenous populations and provides simple tools to identify such biases. A thorough understanding of the effects of population genetic structure on PS is essential for translational applications of PS.
0
Paper
Citation9
0
Save
1

High-resolution population-specific recombination rates and their effect on phasing and genotype imputation

Shabbeer Hassan et al.Oct 24, 2023
+7
M
I
S
Abstract Founder population size, demographic changes (eg. population bottlenecks or rapid expansion) can lead to variation in recombination rates across different populations. Previous research has shown that using population-specific reference panels has a significant effect on downstream population genomic analysis like haplotype phasing, genotype imputation and association, especially in the context of population isolates. Here, we developed a high-resolution recombination rate mapping at 10kb and 50kb scale using high-coverage (20-30x) whole-genome sequenced 55 family trios from Finland and compared it to recombination rates of non-Finnish Europeans (NFE). We tested the downstream effects of the population-specific recombination rates in statistical phasing and genotype imputation in Finns as compared to the same analyses performed by using the NFE-based recombination rates. We found that Finnish recombination rates have a moderately high correlation (Spearman’s ρ =0.67-0.79) with non-Finnish Europeans, although on average (across all autosomal chromosomes), Finnish rates (2.268±0.4209 cM/Mb) are 12-14% lower than NFE (2.641±0.5032 cM/Mb). Finnish recombination map was found to have no significant effect in haplotype phasing accuracy (switch error rates ~ 2%) and average imputation concordance rates (97-98% for common, 92-96% for low frequency and 78-90% for rare variants). Our results suggest that downstream population genomic analyses like haplotype phasing and genotype imputation mostly depend on population-specific contexts like appropriate reference panels and their sample size, but not on population-specific recombination maps or effective population sizes. Currently, available HapMap recombination maps seem robust for population-specific phasing and imputation pipelines, even in the context of relatively isolated populations like Finland.
57

A multi-layer functional genomic analysis to understand noncoding genetic variation in lipids

Shweta Ramdas et al.Oct 24, 2023
+532
S
J
S
Abstract A major challenge of genome-wide association studies (GWAS) is to translate phenotypic associations into biological insights. Here, we integrate a large GWAS on blood lipids involving 1.6 million individuals from five ancestries with a wide array of functional genomic datasets to discover regulatory mechanisms underlying lipid associations. We first prioritize lipid-associated genes with expression quantitative trait locus (eQTL) colocalizations, and then add chromatin interaction data to narrow the search for functional genes. Polygenic enrichment analysis across 697 annotations from a host of tissues and cell types confirms the central role of the liver in lipid levels, and highlights the selective enrichment of adipose-specific chromatin marks in high-density lipoprotein cholesterol and triglycerides. Overlapping transcription factor (TF) binding sites with lipid-associated loci identifies TFs relevant in lipid biology. In addition, we present an integrative framework to prioritize causal variants at GWAS loci, producing a comprehensive list of candidate causal genes and variants with multiple layers of functional evidence. Two prioritized genes, CREBRF and RRBP1 , show convergent evidence across functional datasets supporting their roles in lipid biology.
0

Whole exome sequencing and characterization of coding variation in 49,960 individuals in the UK Biobank

Cristopher Hout et al.May 6, 2020
+46
J
I
C
The UK Biobank is a prospective study of 502,543 individuals, combining extensive phenotypic and genotypic data with streamlined access for researchers around the world. Here we describe the first tranche of large-scale exome sequence data for 49,960 study participants, revealing approximately 4 million coding variants (of which ~98.4% have frequency < 1%). The data includes 231,631 predicted loss of function variants, a >10-fold increase compared to imputed sequence for the same participants. Nearly all genes (>97%) had ≥1 predicted loss of function carrier, and most genes (>69%) had ≥10 loss of function carriers. We illustrate the power of characterizing loss of function variation in this large population through association analyses across 1,741 phenotypes. In addition to replicating a range of established associations, we discover novel loss of function variants with large effects on disease traits, including PIEZO1 on varicose veins, COL6A1 on corneal resistance, MEPE on bone density, and IQGAP2 and GMPR on blood cell traits. We further demonstrate the value of exome sequencing by surveying the prevalence of pathogenic variants of clinical significance in this population, finding that 2% of the population has a medically actionable variant. Additionally, we leverage the phenotypic data to characterize the relationship between rare BRCA1 and BRCA2 pathogenic variants and cancer risk. Exomes from the first 49,960 participants are now made accessible to the scientific community and highlight the promise offered by genomic sequencing in large-scale population-based studies.
0

Common variant burden contributes significantly to the familial aggregation of migraine in 1,589 families

Padhraig Gormley et al.May 7, 2020
+30
M
M
P
It has long been observed that complex traits, including migraine, often aggregate in families, but the underlying genetic architecture behind this is not well understood. Two competing hypotheses exist, emphasizing either rare or common genetic variation. More specifically, familial aggregation could be predominantly explained by rare, penetrant variants that segregate according to Mendelian inheritance or rather by the sufficient polygenic accumulation of many common variants, each with an individually small effect. Some combination of both common and rare variation could also contribute towards a spectrum of disease risk. We investigated this in a collection of 8,319 individuals across 1,589 migraine families from Finland. Family members were individually diagnosed by a migraine-specific questionnaire with either migraine without aura (MO, ICHD-3 code 1.1, n=2,357), migraine with typical aura (ICHD-3 code 1.2.1, n=2,420), hemiplegic migraine (HM, ICHD-3 code 1.2.3, n=540), or no migraine (n=3,002). For comparison, we used population-based migraine cases (n=1,101) and controls (n=13,369) from the FINRISK study. The disease status of FINRISK individuals was assigned based on health registry data from outpatient clinics and/or prescription medication. All individuals were genotyped on the Illumina CoreExome or PsychArray chip platforms and imputed to a Finnish reference panel of 6,962 haplotypes. Polygenic risk scores (PRS), representing the common variant burden in each individual, were calculated using weights from the most recent large-scale genome-wide association study of migraine. To account for family structure in our analyses, we used a mixed-model approach, adjusting for the genetic relationship matrix as a random effect. We found a significantly higher common variant burden in familial cases of migraine (for all subtypes, measured by the odds ratio [OR] per standard deviation [SD] increase in PRS; OR = 1.76, 95% CI = 1.71-1.81, P = 1.7×10-109) compared to cases from a population cohort (OR = 1.32, 95% CI = 1.25-1.38, P = 7.2×10-17) when using the population controls as a reference group. The highest enrichment was observed for HM (OR = 1.96, 95% CI = 1.86-2.07, P = 8.7×10-36) and migraine with typical aura (OR = 1.85, 95% CI = 1.79-1.91, P = 1.4×10-86) but enrichment was also present for MO (OR = 1.57, 95% CI = 1.51-1.63, P = 1.1×10-48). Comparing within cases, there was no significant difference in common variant burden between the migraine with aura subtypes, HM and migraine with typical aura (OR = 1.09, 95% CI = 0.99-1.19, P = 0.09), but both showed significantly higher enrichment compared to MO (OR = 1.28, 95% CI = 1.17-1.38, P = 7.3×10-7, and OR = 1.17, 95% CI = 1.11-1.23, P = 4.62×10-5, respectively). Additionally, we found that higher common variant burden corresponded to earlier age of headache onset (OR per SD increase in PRS for 3,631 cases with onset before 20 years old compared to 1,686 cases with onset later than 20 years old; OR = 1.11, 95% CI = 1.05-1.18, P = 8.3×10-4). FINRISK population cases identified from national health registry data were found to have lower common variant burden in comparison to the familial migraine cases (OR = 1.32, 95% CI = 1.25-1.38, P = 6.8×10-17), unless the individuals had attended both a specialist clinic and also received prophylactic migraine treatment (OR = 1.70, 95% CI = 1.53-1.88, P = 3.9×10-9). Finally, although rare variants have been suggested as the primary cause for familial hemiplegic migraine (FHM), we found only four out of 45 sequenced FHM families (8.9%) with a pathogenic mutation in one of the known risk genes. In summary, our results demonstrate a substantial contribution of common polygenic variation to familial aggregation in migraine, comparable to both controls and that observed in migraine cases from a population cohort. The findings also suggest that individuals with migraine aura symptoms (either typical aura, which is mostly visual, or rare motor aura) tend to have higher common variant burden on average supporting the polygenic model also in these migraine subtypes.
0
0
Save
0

Sex-specific and pleiotropic effects underlying kidney function identified from GWAS meta-analysis

Sarah Graham et al.May 7, 2020
+16
M
J
S
Chronic Kidney Disease (CKD) is a growing health burden currently affecting 10-15% of adults worldwide. Estimated glomerular filtration rate (eGFR) as a marker of kidney function is commonly used to diagnose CKD. Previous genome-wide association study (GWAS) meta-analyses of CKD and eGFR or related phenotypes have identified a number of variants associated with kidney function, but these only explain a fraction of the variability in kidney phenotypes attributed to genetic components. To extend these studies, we analyzed data from the Nord-Trondelag Health Study (HUNT), which is more densely imputed than previous studies, and performed a GWAS meta-analysis of eGFR with publicly available summary statistics, more than doubling the sample size of previous meta-analyses. We identified 147 loci (53 novel loci) associated with eGFR, including genes involved in transcriptional regulation, kidney development, cellular signaling, metabolism, and solute transport. Moreover, genes at these loci show enriched expression in urogenital tissues and highlight gene sets known to play a role in kidney function. In addition, sex-stratified analysis identified three regions (prioritized genes: PPM1J, MCL1, and SLC47A1) with more significant effects in women than men. Using genetic risk scores constructed from these eGFR meta-analysis results, we show that associated variants are generally predictive of CKD but improve detection only modestly compared with other known clinical risk factors. Collectively, these results yield additional insight into the genetic factors underlying kidney function and progression to CKD.
0

An expanded analysis framework for multivariate GWAS connects inflammatory biomarkers to functional variants and disease

Sanni Ruotsalainen et al.May 7, 2020
+15
A
J
S
Multivariate methods are known to increase the statistical power of association detection, but they have lacked essential follow-up analysis tools necessary for understanding the biology underlying these associations. We developed a novel computational workflow for multivariate GWAS follow-up analyses, including fine-mapping and identification of the subset of traits driving associations (driver traits). Many follow-up tools require univariate regression coefficients which are lacking from multivariate results. Our method overcomes this problem by using Canonical Correlation Analysis to turn each multivariate association into its optimal univariate Linear Combination Phenotype (LCP). This enables an LCP-GWAS, which in turn generates the statistics required for follow-up analyses. We implemented our method on 12 highly correlated inflammatory biomarkers in a Finnish population-based study. Altogether, we identified 11 associations, four of which (F5, ABO, C1orf140 and PDGFRB) were not detected by biomarker-specific analyses. Fine-mapping identified 19 signals within the 11 loci and driver trait analysis determined the traits contributing to the associations. A phenome-wide association study on the 19 putative causal variants from the signals in 176,899 individuals from the FinnGen study revealed 53 disease associations (p < 1x10-4). Several reported pQTLs in the 11 loci provided orthogonal evidence for the biologically relevant functions of the putative causal variants. Our novel multivariate analysis workflow provides a powerful addition to standard univariate GWAS analyses by enabling multivariate GWAS follow-up and thus promoting the advancement of powerful multivariate methods in genomics.
4

Genetic, sociodemographic, lifestyle, and clinical risk factors of recurrent coronary artery disease events: a population-based cohort study

So Cho et al.Jul 6, 2023
+8
M
S
S
Abstract Aims Complications of coronary artery disease (CAD) represent the leading cause of death among adults globally. This study examined the associations and clinical utilities of genetic, sociodemographic, lifestyle, and clinical risk factors on CAD recurrence. Methods and results Data were from 7024 UK Biobank middle-aged adults with established CAD at enrolment. Cox proportional hazards regressions modelled associations of age at enrolment, age at first CAD diagnosis, sex, cigarette smoking, physical activity, diet, sleep, Townsend Deprivation Index, body mass index, blood pressure, blood lipids, glucose, lipoprotein(a), C reactive protein, estimated glomerular filtration rate (eGFR), statin prescription, and CAD polygenic risk score (PRS) with first post-enrolment CAD recurrence. Over a median [interquartile range] follow-up of 11.6 [7.2–12.7] years, 2003 (28.5%) recurrent CAD events occurred. The hazard ratio (95% confidence interval [CI]) for CAD recurrence was the most pronounced with current smoking (1.35, 1.13–1.61) and per standard deviation increase in age at first CAD (0.74, 0.67–0.82). Additionally, age at enrolment, CAD PRS, C-reactive protein, lipoprotein(a), glucose, low-density lipoprotein cholesterol, deprivation, sleep quality, eGFR, and high-density lipoprotein (HDL) cholesterol also significantly associated with recurrence risk. Based on C indices (95% CI), the strongest predictors were CAD PRS (0.58, 0.57–0.59), HDL cholesterol (0.57, 0.57–0.58), and age at initial CAD event (0.57, 0.56–0.57). In addition to traditional risk factors, a comprehensive model improved the C index from 0.644 (0.632–0.654) to 0.676 (0.667–0.686). Conclusion Sociodemographic, clinical, and laboratory factors are each associated with CAD recurrence with genetic risk, age at first CAD event, and HDL cholesterol concentration explaining the most.
Load More