MK
Mitja Kurki
Author with expertise in Genomic Studies and Association Analyses
Broad Institute, Massachusetts General Hospital, Institute for Molecular Medicine Finland
+ 13 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
18
(33% Open Access)
Cited by:
17
h-index:
43
/
i10-index:
90
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Genetic analysis of obstructive sleep apnoea discovers a strong association with cardiometabolic health

Satu Strausz et al.Jan 24, 2021
+19
H
S
S
Abstract There is currently only limited understanding of the genetic aetiology of obstructive sleep apnoea (OSA). The aim of our study is to identify genetic loci associated with OSA risk and to test if OSA and its comorbidities share a common genetic background. We conducted the first large-scale genome-wide association study of OSA using FinnGen Study (217,955 individuals) with 16,761 OSA patients identified using nationwide health registries. We estimated 8.3% [0.06-0.11] heritability and identified five loci associated with OSA (P < 5.0 × 10 −8 ): rs4837016 near GTPase activating protein and VPS9 domains 1 ( GAPVD1 ), rs10928560 near C-X-C motif chemokine receptor 4 ( CXCR4 ), rs185932673 near Calcium/calmodulin-dependent protein kinase ID ( CAMK1D ) and rs9937053 near Fat mass and obesity-associated protein ( FTO ) - a variant previously associated with body mass index (BMI). In a BMI-adjusted analysis, an association was observed for rs10507084 near Rhabdomyosarcoma 2 associated transcript ( RMST )/NEDD1 gamma-tubulin ring complex targeting factor ( NEDD1 ). We found genetic correlations between OSA and BMI (rg=0.72 [0.62-0.83]) and with comorbidities including hypertension, type 2 diabetes (T2D), coronary heart disease (CHD), stroke, depression, hypothyroidism, asthma and inflammatory rheumatic diseases (IRD) (rg > 0.30). Polygenic risk score (PRS) for BMI showed 1.98-fold increased OSA risk between the highest and the lowest quintile and Mendelian randomization supported a causal relationship between BMI and OSA. Our findings support the causal link between obesity and OSA and joint genetic basis between OSA and comorbidities.
1
Citation6
0
Save
35

The impact of non-additive genetic associations on age-related complex diseases

Marta Guindo-Martínez et al.Oct 24, 2023
+18
S
R
M
Abstract Genome-wide association studies (GWAS) are not fully comprehensive as current strategies typically test only the additive model, exclude the X chromosome, and use only one reference panel for genotype imputation. We implemented an extensive GWAS strategy, GUIDANCE, which improves genotype imputation by using multiple reference panels, includes the analysis of the X chromosome and non-additive models to test for association. We applied this methodology to 62,281 subjects across 22 age-related diseases and identified 94 genome-wide associated loci, including 26 previously unreported. We observed that 27.6% of the 94 loci would be missed if we only used standard imputation strategies and only tested the additive model. Among the new findings, we identified three novel low-frequency recessive variants with odds ratios larger than 4, which would need at least a three-fold larger sample size to be detected under the additive model. This study highlights the benefits of applying innovative strategies to better uncover the genetic architecture of complex diseases.
0

Haplotype sharing provides insights into fine-scale population history and disease in Finland

Alicia Martin et al.May 7, 2020
+24
S
K
A
Abstract Finland provides unique opportunities to investigate population and medical genomics because of its adoption of unified national electronic health records, detailed historical and birth records, and serial population bottlenecks. We assemble a comprehensive view of recent population history (≤100 generations), the timespan during which most rare disease-causing alleles arose, by comparing pairwise haplotype sharing from 43,254 Finns to geographically and linguistically adjacent countries with different population histories, including 16,060 Swedes, Estonians, Russians, and Hungarians. We find much more extensive sharing in Finns, with at least one ≥ 5 cM tract on average between pairs of unrelated individuals. By coupling haplotype sharing with fine-scale birth records from over 25,000 individuals, we find that while haplotype sharing broadly decays with geographical distance, there are pockets of excess haplotype sharing; individuals from northeast Finland share several-fold more of their genome in identity-by-descent (IBD) segments than individuals from southwest regions containing the major cities of Helsinki and Turku. We estimate recent effective population size changes over time across regions of Finland and find significant differences between the Early and Late Settlement Regions as expected; however, our results indicate more continuous gene flow than previously indicated as Finns migrated towards the northernmost Lapland region. Lastly, we show that haplotype sharing is locally enriched among pairs of individuals sharing rare alleles by an order of magnitude, especially among pairs sharing rare disease causing variants. Our work provides a general framework for using haplotype sharing to reconstruct an integrative view of recent population history and gain insight into the evolutionary origins of rare variants contributing to disease.
0
Citation3
0
Save
0

Contribution of rare and common variants to intellectual disability in a high-risk population sub-isolate of Northern Finland

Mitja Kurki et al.May 7, 2020
+20
O
E
M
Abstract The contribution of de novo and ultra-rare genetic variants in severe and moderate intellectual disability (ID) has been extensively studied whereas the genetic architecture of mild ID has been less well characterized. To elucidate the genetic background of milder ID we studied a regional cohort of 442 ID patients enriched for mild ID (>50%) from a population isolate of Finland. We analyzed rare variants using exome sequencing and CNV genotyping and common variants using common variant polygenic risk scores. As controls we used a Finnish collection of exome sequenced (n=11311) and GWAS chip genotyped (n=11699) individuals. We show that rare damaging variants in genes known to be associated with cognitive defects are observed more often in severe (27%) than in mild ID (13%) patients (p-value: 7.0e-4). We further observed a significant enrichment of protein truncating variants in loss-of-function intolerant genes, as well as damaging missense variants in genes not yet associated with cognitive defects (OR: 2.1, p-value: 3e-8). For the first time to our knowledge, we show that a common variant polygenic load significantly contributes to all severity forms of ID. The heritability explained was the highest for educational attainment (EDU) in mild ID explaining 2.2% of the heritability on liability scale. For more severe ID it was lower at 0.6%. Finally, we identified a homozygote variant in the CRADD gene to be a cause of a specific syndrome with ID and pachygyria. The frequency of this variant is 50x higher in the Finnish population than in non-Finnish Europeans, demonstrating the benefits of utilizing population isolates in rare variant analysis of diseases under negative selection.
0

Risk Variants Associated With Normal Pressure Hydrocephalus

Joel Räsänen et al.Sep 12, 2024
+31
K
S
J
Large-scale genome-wide studies of chronic hydrocephalus have been lacking. We conducted a genome-wide association study (GWAS) in normal pressure hydrocephalus (NPH).
0
Citation1
0
Save
0

Genetics of human plasma lipidome: Understanding lipid metabolism and its link to diseases beyond traditional lipids

Rubina Tabassum et al.May 7, 2020
+24
P
J
R
Aim: Genetic investigation of human plasma lipidome to get insights into lipid-related disorders beyond traditional lipid measures. Methods and Results: We performed a genome-wide association study (GWAS) of 141 lipid species (n=2,181 individuals), followed by phenome-wide scans (PheWAS) with 44 clinical end-points related to cardiometabolic, psychiatric and gastrointestinal disorders (n=456,941 individuals). SNP-based heritability for lipid species ranged from 0.10-0.54. Lipids with long-chain polyunsaturated fatty acids showed higher heritability and genetic sharing, suggesting considerable genetic regulation at acyl chains levels. We identified 35 genomic regions associated with at least one lipid species (P<5x10-8), revealing 37 new SNP-lipid species pair associations e.g. new association between ABCG5/8 and CE(20:2;0). PheWAS of lipid-species-associated loci suggested new associations of BLK with obesity, FADS2 with thrombophlebitis, and BLK and SPTLC3 with gallbladder disease (false discovery rate <0.05). The association patterns of lipid-species-associated loci supplied clues to their probable roles in lipid metabolism e.g. suggestive role of SYNGR1, MIR100HG, and PTPRN2 in desaturation and/or elongation of fatty acids. At known lipid loci (FADS2, APOA5 and LPL), genetic associations provided detailed insights to their roles in lipid biology and diseases. We also show that traditional lipid measures may fail to capture lipids such as lysophospatidylcholines (LPCs) and phosphatidylcholines (PCs) that are potential disease risk factors, but are not included in routine screens. The full genome-wide association statistics are available on the web-based database (http://35.205.141.92). Conclusion: Our study reveals genetic regulation of plasma lipidome and highlights the potential of lipidomic profiling in disease gene mapping.
0

Insights into the genetic epidemiology of Crohn's and rare diseases in the Ashkenazi Jewish population

Manuel Rivas et al.May 6, 2020
+49
H
J
M
As part of a broader collaborative network of exome sequencing studies, we developed a jointly called data set of 5,685 Ashkenazi Jewish exomes. We make publicly available a resource of site and allele frequencies, which should serve as a reference for medical genetics in the Ashkenazim. We estimate that 30% of protein-coding alleles present in the Ashkenazi Jewish population at frequencies greater than 0.2% are significantly more frequent (mean 7.6-fold) than their maximum frequency observed in other reference populations. Arising via a well-described founder effect, this catalog of enriched alleles can contribute to differences in genetic risk and overall prevalence of diseases between populations. As validation we document 151 AJ enriched protein-altering alleles that overlap with ``pathogenic" ClinVar alleles, including those that account for 10-100 fold differences in prevalence between AJ and non-AJ populations of some rare diseases including Gaucher disease (GBA, p.Asn409Ser, 8-fold enrichment); Canavan disease (ASPA, p.Glu285Ala, 12-fold enrichment); and Tay-Sachs disease (HEXA, c.1421+1G>C, 27-fold enrichment; p.Tyr427IlefsTer5, 12-fold enrichment). We next sought to use this catalog, of well-established relevance to Mendelian disease, to explore Crohn's disease, a common disease with an estimated two to four-fold excess prevalence in AJ. We specifically evaluate whether strong acting rare alleles, enriched by the same founder-effect, contribute excess genetic risk to Crohn's disease in AJ, and find that ten rare genetic risk factors in NOD2 and LRRK2 are strongly enriched in AJ, including several novel contributing alleles, show evidence of association to CD. Independently, we find that genomewide common variant risk defined by GWAS shows a strong difference between AJ and non-AJ European control population samples (0.97 s.d. higher, p<10-16). Taken together, the results suggest coordinated selection in AJ population for higher CD risk alleles in general. The results and approach illustrate the value of exome sequencing data in case-control studies along with reference data sets like ExAC to pinpoint genetic variation that contributes to variable disease predisposition across populations.
0
0
Save
0

Polygenic and clinical risk scores and their impact on age at onset of cardiometabolic diseases and common cancers

Nina Mars et al.May 6, 2020
+13
P
J
N
Background Polygenic risk scores (PRS) have shown promise in predicting susceptibility to common diseases. However, the extent to which PRS and clinical risk factors act jointly and identify high-risk individuals for early onset of disease is unknown.Methods We used large-scale biobank data (the FinnGen study; n=135,300), with up to 46 years of prospective follow-up, and the FINRISK study with standardized clinical risk factor measurements to build genome-wide PRSs with >6M variants for coronary heart disease (CHD), type 2 diabetes (T2D), atrial fibrillation (AF), and breast and prostate cancer. We evaluated their associations with first disease events, age at disease onset, and impact together with routinely used clinical risk scores for predicting future disease.Results Compared to the 20-80th percentiles, a PRS in the top 2.5% translated into hazard ratios (HRs) for incident disease ranging from 2.03 to 4.28 (p-values 1.96×10−59 to <1.00×10−100) and the bottom 2.5% into HRs ranging from 0.20 to 0.61. The estimated difference in age at disease onset between top and bottom 2.5% of PRSs was 6 to 13 years. Among early-onset cases, 21.3-32.9% had a PRS in the highest decile and in CHD and AF.Conclusions The properties of PRS were similar in all five diseases. PRS identified a considerable proportion early-onset cases, and for all ages the performance of PRS was comparable to established clinical risk scores. These findings warrant further clinical studies on application of polygenic risk information for stratified screening or for guiding lifestyle and preventive medical interventions.
0

Gene family information facilitates variant interpretation and identification of disease-associated genes

Dennis Lal et al.May 6, 2020
+27
K
P
D
Differentiating risk-conferring from benign missense variants, and therefore optimal calculation of gene-variant burden, represent a major challenge in particular for rare and genetic heterogeneous disorders. While orthologous gene conservation is commonly employed in variant annotation, approximately 80% of known disease-associated genes are paralogs and belong to gene families. It has not been thoroughly investigated how gene family information can be utilized for disease gene discovery and variant interpretation. We developed a paralog conservation score to empirically evaluate whether paralog conserved or non-conserved sites of in-human paralogs are important for protein function. Using this score, we demonstrate that disease-associated missense variants are significantly enriched at paralog conserved sites across all disease groups and disease inheritance models tested. Next, we assessed whether gene family information could assist in discovering novel disease-associated genes. We subsequently developed a gene family de novo enrichment framework that identified 43 exome-wide enriched gene families including 98 de novo variant carrying genes in more than 10k neurodevelopmental disorder patients. 33 gene family enriched genes represent novel candidate genes which are brain expressed and variant constrained in neurodevelopmental disorders.
0
0
Save
12

An efficient and accurate frailty model approach for genome-wide survival association analysis controlling for population structure and relatedness in large-scale biobanks

Rounak Dey et al.Oct 24, 2023
+10
T
W
R
Abstract With decades of electronic health records linked to genetic data, large biobanks provide unprecedented opportunities for systematically understanding the genetics of the natural history of complex diseases. Genome-wide survival association analysis can identify genetic variants associated with ages of onset, disease progression and lifespan. We developed an efficient and accurate frailty (random effects) model approach for genome-wide survival association analysis of censored time-to-event (TTE) phenotypes in large biobanks by accounting for both population structure and relatedness. Our method utilizes state-of-the-art optimization strategies to reduce the computational cost. The saddlepoint approximation is used to allow for analysis of heavily censored phenotypes (>90%) and low frequency variants (down to minor allele count 20). We demonstrated the performance of our method through extensive simulation studies and analysis of five TTE phenotypes, including lifespan, with heavy censoring rates (90.9% to 99.8%) on ~400,000 UK Biobank participants with white British ancestry and ~180,000 samples in FinnGen, respectively. We further performed genome-wide association analysis for 871 TTE phenotypes in UK Biobank and presented the genome-wide scale phenome-wide association (PheWAS) results with the PheWeb browser.
12
0
Save
Load More