JK
Johannes Kettunen
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
37
(59% Open Access)
Cited by:
14,844
h-index:
67
/
i10-index:
135
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Hundreds of variants clustered in genomic loci and biological pathways affect human height

Hana Allen et al.Sep 29, 2010
A genome-wide association (GWA) study of more than 180,000 individuals has identified hundreds of genetic variants in at least 180 loci associated with adult human height. The loci are not clustered randomly but are enriched for genes involved in growth-related processes that influence adult height. This demonstrates that GWA studies of common human traits, and therefore of many diseases, can identify large numbers of loci that implicate potential causal genes. This very large genome-wide association study identifies hundreds of new genetic variants influencing adult height in at least 180 loci enriched for genes involved in skeletal growth defects. The results show that the likely causal gene is often located near the most strongly associated variant, that many loci have multiple independently associated variants and that associated variants are enriched for likely functional effects on genes. Most common human traits and diseases have a polygenic pattern of inheritance: DNA sequence variants at many genetic loci influence the phenotype. Genome-wide association (GWA) studies have identified more than 600 variants associated with human traits1, but these typically explain small fractions of phenotypic variation, raising questions about the use of further studies. Here, using 183,727 individuals, we show that hundreds of genetic variants, in at least 180 loci, influence adult height, a highly heritable and classic polygenic trait2,3. The large number of loci reveals patterns with important implications for genetic studies of common human diseases and traits. First, the 180 loci are not random, but instead are enriched for genes that are connected in biological pathways (P = 0.016) and that underlie skeletal growth defects (P < 0.001). Second, the likely causal gene is often located near the most strongly associated variant: in 13 of 21 loci containing a known skeletal growth gene, that gene was closest to the associated variant. Third, at least 19 loci have multiple independently associated variants, suggesting that allelic heterogeneity is a frequent feature of polygenic traits, that comprehensive explorations of already-discovered loci should discover additional variants and that an appreciable fraction of associated loci may have been identified. Fourth, associated variants are enriched for likely functional effects on genes, being over-represented among variants that alter amino-acid structure of proteins and expression levels of nearby genes. Our data explain approximately 10% of the phenotypic variation in height, and we estimate that unidentified common variants of similar effect sizes would increase this figure to approximately 16% of phenotypic variation (approximately 20% of heritable variation). Although additional approaches are needed to dissect the genetic architecture of polygenic human traits fully, our findings indicate that GWA studies can identify large numbers of loci that implicate biologically relevant genes and pathways.
0
Citation1,934
0
Save
0

Systematic identification of trans eQTLs as putative drivers of known disease associations

Harm-Jan Westra et al.Sep 8, 2013
Identifying the downstream effects of disease-associated SNPs is challenging. To help overcome this problem, we performed expression quantitative trait locus (eQTL) meta-analysis in non-transformed peripheral blood samples from 5,311 individuals with replication in 2,775 individuals. We identified and replicated trans eQTLs for 233 SNPs (reflecting 103 independent loci) that were previously associated with complex traits at genome-wide significance. Some of these SNPs affect multiple genes in trans that are known to be altered in individuals with disease: rs4917014, previously associated with systemic lupus erythematosus (SLE), altered gene expression of C1QB and five type I interferon response genes, both hallmarks of SLE. DeepSAGE RNA sequencing showed that rs4917014 strongly alters the 3' UTR levels of IKZF1 in cis, and chromatin immunoprecipitation and sequencing analysis of the trans-regulated genes implicated IKZF1 as the causal gene. Variants associated with cholesterol metabolism and type 1 diabetes showed similar phenomena, indicating that large-scale eQTL mapping provides insight into the downstream effects of many trait-associated variants.
0
Citation1,613
0
Save
0

FinnGen provides genetic insights from a well-phenotyped isolated population

Mitja Kurki et al.Jan 18, 2023
Abstract Population isolates such as those in Finland benefit genetic research because deleterious alleles are often concentrated on a small number of low-frequency variants (0.1% ≤ minor allele frequency < 5%). These variants survived the founding bottleneck rather than being distributed over a large number of ultrarare variants. Although this effect is well established in Mendelian genetics, its value in common disease genetics is less explored 1,2 . FinnGen aims to study the genome and national health register data of 500,000 Finnish individuals. Given the relatively high median age of participants (63 years) and the substantial fraction of hospital-based recruitment, FinnGen is enriched for disease end points. Here we analyse data from 224,737 participants from FinnGen and study 15 diseases that have previously been investigated in large genome-wide association studies (GWASs). We also include meta-analyses of biobank data from Estonia and the United Kingdom. We identified 30 new associations, primarily low-frequency variants, enriched in the Finnish population. A GWAS of 1,932 diseases also identified 2,733 genome-wide significant associations (893 phenome-wide significant (PWS), P < 2.6 × 10 –11 ) at 2,496 (771 PWS) independent loci with 807 (247 PWS) end points. Among these, fine-mapping implicated 148 (73 PWS) coding variants associated with 83 (42 PWS) end points. Moreover, 91 (47 PWS) had an allele frequency of <5% in non-Finnish European individuals, of which 62 (32 PWS) were enriched by more than twofold in Finland. These findings demonstrate the power of bottlenecked populations to find entry points into the biology of common diseases through low-frequency, high impact variants.
0
Citation1,372
0
Save
0

Identification of seven loci affecting mean telomere length and their association with disease

Veryan Codd et al.Mar 27, 2013
Nilesh Samani and colleagues report a meta-analysis of genome-wide association studies for mean leukocyte telomere length in 37,684 individuals, with replication of selected variants in an additional 10,739 individuals. They identify seven loci associated with mean telomere length, including two that have been associated with several cancers, and also find that alleles associated with shorter telomere length were associated with a higher risk of coronary artery disease. Interindividual variation in mean leukocyte telomere length (LTL) is associated with cancer and several age-associated diseases. We report here a genome-wide meta-analysis of 37,684 individuals with replication of selected variants in an additional 10,739 individuals. We identified seven loci, including five new loci, associated with mean LTL (P < 5 × 10−8). Five of the loci contain candidate genes (TERC, TERT, NAF1, OBFC1 and RTEL1) that are known to be involved in telomere biology. Lead SNPs at two loci (TERC and TERT) associate with several cancers and other diseases, including idiopathic pulmonary fibrosis. Moreover, a genetic risk score analysis combining lead variants at all 7 loci in 22,233 coronary artery disease cases and 64,762 controls showed an association of the alleles associated with shorter LTL with increased risk of coronary artery disease (21% (95% confidence interval, 5–35%) per standard deviation in LTL, P = 0.014). Our findings support a causal role of telomere-length variation in some age-related diseases.
0
Citation869
0
Save
0

Large-scale cis- and trans-eQTL analyses identify thousands of genetic loci and polygenic scores that regulate blood gene expression

Urmo Võsa et al.Sep 1, 2021
Trait-associated genetic variants affect complex phenotypes primarily via regulatory mechanisms on the transcriptome. To investigate the genetics of gene expression, we performed cis- and trans-expression quantitative trait locus (eQTL) analyses using blood-derived expression from 31,684 individuals through the eQTLGen Consortium. We detected cis-eQTL for 88% of genes, and these were replicable in numerous tissues. Distal trans-eQTL (detected for 37% of 10,317 trait-associated variants tested) showed lower replication rates, partially due to low replication power and confounding by cell type composition. However, replication analyses in single-cell RNA-seq data prioritized intracellular trans-eQTL. Trans-eQTL exerted their effects via several mechanisms, primarily through regulation by transcription factors. Expression of 13% of the genes correlated with polygenic scores for 1,263 phenotypes, pinpointing potential drivers for those traits. In summary, this work represents a large eQTL resource, and its results serve as a starting point for in-depth interpretation of complex phenotypes. Analyses of expression profiles from whole blood of 31,684 individuals identify cis-expression quantitative trait loci (eQTL) effects for 88% of genes and trans-eQTL effects for 37% of trait-associated variants.
0
Citation851
0
Save
0

Common variants associated with plasma triglycerides and risk for coronary artery disease

Ron Do et al.Oct 6, 2013
Sekar Kathiresan and colleagues examine 185 common variants using a modified mendelian randomization approach and provide evidence supporting a causal role of triglyceride-rich lipoproteins in the development of coronary artery disease. Triglycerides are transported in plasma by specific triglyceride-rich lipoproteins; in epidemiological studies, increased triglyceride levels correlate with higher risk for coronary artery disease (CAD). However, it is unclear whether this association reflects causal processes. We used 185 common variants recently mapped for plasma lipids (P < 5 × 10−8 for each) to examine the role of triglycerides in risk for CAD. First, we highlight loci associated with both low-density lipoprotein cholesterol (LDL-C) and triglyceride levels, and we show that the direction and magnitude of the associations with both traits are factors in determining CAD risk. Second, we consider loci with only a strong association with triglycerides and show that these loci are also associated with CAD. Finally, in a model accounting for effects on LDL-C and/or high-density lipoprotein cholesterol (HDL-C) levels, the strength of a polymorphism's effect on triglyceride levels is correlated with the magnitude of its effect on CAD risk. These results suggest that triglyceride-rich lipoproteins causally influence risk for CAD.
0
Citation808
0
Save
0

Sequence variants at CHRNB3–CHRNA6 and CYP2A6 affect smoking behavior

Thorgeir Thorgeirsson et al.Apr 25, 2010
Kari Stefansson and colleagues report genome-wide meta-analyses for association to smoking behaviors within the population cohorts of the ENGAGE consortium. They report three loci associated to cigarettes smoked per day. Smoking is a common risk factor for many diseases1. We conducted genome-wide association meta-analyses for the number of cigarettes smoked per day (CPD) in smokers (n = 31,266) and smoking initiation (n = 46,481) using samples from the ENGAGE Consortium. In a second stage, we tested selected SNPs with in silico replication in the Tobacco and Genetics (TAG) and Glaxo Smith Kline (Ox-GSK) consortia cohorts (n = 45,691 smokers) and assessed some of those in a third sample of European ancestry (n = 9,040). Variants in three genomic regions associated with CPD (P < 5 × 10−8), including previously identified SNPs at 15q25 represented by rs1051730[A] (effect size = 0.80 CPD, P = 2.4 × 10−69), and SNPs at 19q13 and 8p11, represented by rs4105144[C] (effect size = 0.39 CPD, P = 2.2 × 10−12) and rs6474412-T (effect size = 0.29 CPD, P = 1.4 × 10−8), respectively. Among the genes at the two newly associated loci are genes encoding nicotine-metabolizing enzymes (CYP2A6 and CYP2B6) and nicotinic acetylcholine receptor subunits (CHRNB3 and CHRNA6), all of which have been highlighted in previous studies of smoking and nicotine dependence2,3,4. Nominal associations with lung cancer were observed at both 8p11 (rs6474412[T], odds ratio (OR) = 1.09, P = 0.04) and 19q13 (rs4105144[C], OR = 1.12, P = 0.0006).
0
Citation678
0
Save
0

Genome-wide study for circulating metabolites identifies 62 loci and reveals novel systemic effects of LPA

Johannes Kettunen et al.Mar 23, 2016
Genome-wide association studies have identified numerous loci linked with complex diseases, for which the molecular mechanisms remain largely unclear. Comprehensive molecular profiling of circulating metabolites captures highly heritable traits, which can help to uncover metabolic pathophysiology underlying established disease variants. We conduct an extended genome-wide association study of genetic influences on 123 circulating metabolic traits quantified by nuclear magnetic resonance metabolomics from up to 24,925 individuals and identify eight novel loci for amino acids, pyruvate and fatty acids. The LPA locus link with cardiovascular risk exemplifies how detailed metabolic profiling may inform underlying aetiology via extensive associations with very-low-density lipoprotein and triglyceride metabolism. Genetic fine mapping and Mendelian randomization uncover wide-spread causal effects of lipoprotein(a) on overall lipoprotein metabolism and we assess potential pleiotropic consequences of genetically elevated lipoprotein(a) on diverse morbidities via electronic health-care records. Our findings strengthen the argument for safe LPA-targeted intervention to reduce cardiovascular risk.
0
Citation659
0
Save
0

Metabolite Profiling and Cardiovascular Event Risk

Peter Würtz et al.Jan 9, 2015
Background— High-throughput profiling of circulating metabolites may improve cardiovascular risk prediction over established risk factors. Methods and Results— We applied quantitative nuclear magnetic resonance metabolomics to identify the biomarkers for incident cardiovascular disease during long-term follow-up. Biomarker discovery was conducted in the National Finnish FINRISK study (n=7256; 800 events). Replication and incremental risk prediction was assessed in the Southall and Brent Revisited (SABRE) study (n=2622; 573 events) and British Women’s Health and Heart Study (n=3563; 368 events). In targeted analyses of 68 lipids and metabolites, 33 measures were associated with incident cardiovascular events at P <0.0007 after adjusting for age, sex, blood pressure, smoking, diabetes mellitus, and medication. When further adjusting for routine lipids, 4 metabolites were associated with future cardiovascular events in meta-analyses: higher serum phenylalanine (hazard ratio per standard deviation, 1.18; 95% confidence interval, 1.12–1.24; P =4×10 –10 ) and monounsaturated fatty acid levels (1.17; 1.11–1.24; P =1×10 –8 ) were associated with increased cardiovascular risk, while higher omega-6 fatty acids (0.89; 0.84–0.94; P =6×10 –5 ) and docosahexaenoic acid levels (0.90; 0.86–0.95; P =5×10 –5 ) were associated with lower risk. A risk score incorporating these 4 biomarkers was derived in FINRISK. Risk prediction estimates were more accurate in the 2 validation cohorts (relative integrated discrimination improvement, 8.8% and 4.3%), albeit discrimination was not enhanced. Risk classification was particularly improved for persons in the 5% to 10% risk range (net reclassification, 27.1% and 15.5%). Biomarker associations were further corroborated with mass spectrometry in FINRISK (n=671) and the Framingham Offspring Study (n=2289). Conclusions— Metabolite profiling in large prospective cohorts identified phenylalanine, monounsaturated fatty acids, and polyunsaturated fatty acids as biomarkers for cardiovascular risk. This study substantiates the value of high-throughput metabolomics for biomarker discovery and improved risk assessment.
Load More