MK
Mart Kals
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
10
(50% Open Access)
Cited by:
227
h-index:
33
/
i10-index:
66
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Advantages of genotype imputation with ethnically matched reference panel for rare variant association analyses

Mart Kals et al.Mar 16, 2019
Abstract Genotype imputation has become a standard procedure prior genome-wide association studies (GWASs). For common and low-frequency variants, genotype imputation can be performed sufficiently accurately with publicly available and ethnically heterogeneous reference datasets like 1000 Genomes Project (1000G) and Haplotype Reference Consortium panels. However, the imputation of rare variants has been shown to be significantly more accurate when ethnically matched reference panel is used. Even more, greater genetic similarity between reference panel and target samples facilitates the detection of rare (or even population-specific) causal variants. Notwithstanding, the genome-wide downstream consequences and differences of using ethnically mixed and matched reference panels have not been yet comprehensively explored. We determined and quantified these differences by performing several comparative evaluations of the discovery-driven analysis scenarios. A variant-wise GWAS was performed on seven complex diseases and body mass index by using genome-wide genotype data of ∼37,000 Estonians imputed with ethnically mixed 1000G and ethnically matched imputation reference panels. Although several previously reported common (minor allele frequency; MAF > 5%) variant associations were replicated in both resulting imputed datasets, no major differences were observed among the genome-wide significant findings or in the fine-mapping effort. In the analysis of rare (MAF < 1%) coding variants, 46 significantly associated genes were identified in the ethnically matched imputed data as compared to four genes in the 1000G panel based imputed data. All resulting genes were consequently studied in the UK Biobank data. These associations provide a solid example of how rare variants can be efficiently analysed to discover novel, potentially functional genetic variants in relevant phenotypes. Furthermore, our work serves as proof of a cost-efficient study design, demonstrating that the usage of ethnically matched imputation reference panels can enable substantially improved imputation of rare variants, facilitating novel high-confidence findings in rare variant GWAS scans. Author summary Over the last decade, genome-wide association studies (GWASs) have been widely used for detecting genetic biomarkers in a wide range of traits. Typically, GWASs are carried out using chip-based genotyping data, which are then combined with a more densely genotyped reference panel to infer untyped genetic variants in chip-typed individuals. The latter method is called genotype imputation and its accuracy depends on multiple factors. Publicly available and ethnically heterogeneous imputation reference panels (IRPs) such as 1000 Genomes Project (1000G) are sufficiently accurate for imputation of common and low-frequency variants, but custom ethnically matched IRPs outperform these in case of rare variants. In this work, we systematically compare downstream association analysis effects on eight complex traits in ∼37,000 Estonians imputed with ethnically mixed and ethnically matched IRPs. We do not observe major differences in the single variant analysis, where both imputed datasets replicate previously reported significant loci. But in the gene-based analysis of rare protein-coding variants we show that ethnically matched panel clearly outperforms 1000G panel based imputation, providing 10-fold increase in significant gene-trait associations. Our study demonstrates empirically that imputed data based on ethnically matched panel is very promising for rare variant analysis – it captures more population-specific variants and makes it possible to efficiently identify novel findings.
0
Citation21
0
Save
21

Omics-informed CNV calls reduce false positive rate and improve power for CNV-trait associations

Maarja Lepamets et al.Feb 10, 2022
Abstract Copy number variations (CNV) are believed to play an important role in a wide range of complex traits but discovering such associations remains challenging. Whilst whole genome sequencing (WGS) is the gold standard approach for CNV detection, there are several orders of magnitude more samples with available genotyping microarray data. Such array data can be exploited for CNV detection using dedicated software (e.g., PennCNV), however these calls suffer from elevated false positive and negative rates. In this study, we developed a CNV quality score that weights PennCNV calls (pCNV) based on their likelihood of being true positive. First, we established a measure of pCNV reliability by leveraging evidence from multiple omics data (WGS, transcriptomics and methylomics) obtained from the same samples. Next, we built a predictor of omics-confirmed pCNVs, termed omics-informed quality score (OQS), using only PennCNV software output parameters. Promisingly, OQS assigned to pCNVs detected in close family members was up to 35% higher than the OQS of pCNVs not carried by other relatives (P < 3.0−10 −90 ), outperforming other scores. Finally, in an association study of four anthropometric traits in 89,516 Estonian Biobank samples, the use of OQS led to a relative increase in the trait variance explained by CNVs of up to 34% compared to raw pCNVs or previous quality scores. Overall, we put forward a flexible framework to improve any CNV detection method leveraging multi-omics evidence, applied it to improve PennCNV calls and demonstrated its utility by improving the statistical power for downstream association analyses.
21
Citation1
0
Save
0

Comprehensive population-based genome sequencing provides insight into hematopoietic regulatory mechanisms

Michael Guo et al.Aug 4, 2016
Genetic variants affecting hematopoiesis can influence commonly measured blood cell traits. To identify factors that affect hematopoiesis, we performed association studies for blood cell traits in the population-based Estonian Biobank using high coverage whole genome sequencing (WGS) in 2,284 samples and SNP genotyping in an additional ~17,000 samples. Our analyses identified 17 associations across 14 blood cell traits. Integration of WGS-based fine-mapping and complementary epigenomic data sets provided evidence for causal mechanisms at several loci, including at a novel basophil count-associated locus near the master hematopoietic transcription factor CEBPA. The fine-mapped variant at this basophil count association near CEBPA overlapped an enhancer active in common myeloid progenitors and influenced its activity. In situ perturbation of this enhancer by CRISPR/Cas9 mutagenesis in hematopoietic stem and progenitor cells demonstrated that it is necessary for and specifically regulates CEBPA expression during basophil differentiation. We additionally identified basophil count-associated variation at another more pleiotropic myeloid enhancer near GATA2, highlighting regulatory mechanisms for ordered expression of master hematopoietic regulators during lineage specification. Our study illustrates how population-based genetic studies can provide key insights into poorly understood cell differentiation processes of considerable physiologic relevance.
3

Genetic determinants of plasma protein levels in the Estonian population

Anette Kalnapenkis et al.Jun 2, 2023
Abstract The proteome holds great potential as an intermediate layer between the genome and phenome. Previous protein quantitative trait locus studies have focused mainly on describing the effects of common genetic variations on the proteome. Here, we assessed the impact of the common and rare genetic variations as well as the copy number variants (CNVs) on 326 plasma proteins measured in up to 500 individuals. We identified 184 cis and 94 trans signals for 157 protein traits, which were further fine-mapped to credible sets for 101 cis and 87 trans signals for 151 proteins. Rare genetic variation contributed to the levels of 7 proteins, with 5 cis and 14 trans associations. CNVs were associated with the levels of 11 proteins (7 cis and 5 trans ), examples including a 3q12.1 deletion acting as a hub for multiple trans associations; and a CNV overlapping NAIP , a sensor component of the NAIP-NLRC4 inflammasome which is affecting pro-inflammatory cytokine interleukin 18 levels. In summary, this work presents a comprehensive resource of genetic variation affecting the plasma protein levels and provides the interpretation of identified effects.
0

Distinct Genetic Risk Profile in Aortic Stenosis Compared With Coronary Artery Disease

Teresa Trenkwalder et al.Nov 6, 2024
Importance Aortic stenosis (AS) and coronary artery disease (CAD) frequently coexist. However, it is unknown which genetic and cardiovascular risk factors might be AS-specific and which could be shared between AS and CAD. Objective To identify genetic risk loci and cardiovascular risk factors with AS-specific associations. Design, Setting, and Participants This was a genomewide association study (GWAS) of AS adjusted for CAD with participants from the European Consortium for the Genetics of Aortic Stenosis (EGAS) (recruited 2000-2020), UK Biobank (recruited 2006-2010), Estonian Biobank (recruited 1997-2019), and FinnGen (recruited 1964-2019). EGAS participants were collected from 7 sites across Europe. All participants were of European ancestry, and information on comorbid CAD was available for all participants. Follow-up analyses with GWAS data on cardiovascular traits and tissue transcriptome data were also performed. Data were analyzed from October 2022 to July 2023. Exposures Genetic variants. Main Outcomes and Measures Cardiovascular traits associated with AS adjusted for CAD. Replication was performed in 2 independent AS GWAS cohorts. Results A total of 18 792 participants with AS and 434 249 control participants were included in this GWAS adjusted for CAD. The analysis found 17 AS risk loci, including 5 loci with novel and independently replicated associations ( RNF114A , AFAP1 , PDGFRA , ADAMTS7 , HAO1 ). Of all 17 associated loci, 11 were associated with risk specifically for AS and were not associated with CAD ( ALPL , PALMD , PRRX1 , RNF144A , MECOM , AFAP1 , PDGFRA , IL6 , TPCN2 , NLRP6 , HAO1 ). Concordantly, this study revealed only a moderate genetic correlation of 0.15 (SE, 0.05) between AS and CAD ( P = 1.60 × 10 −3 ). Mendelian randomization revealed that serum phosphate was an AS-specific risk factor that was absent in CAD (AS: odds ratio [OR], 1.20; 95% CI, 1.11-1.31; P = 1.27 × 10 −5 ; CAD: OR, 0.97; 95% CI 0.94-1.00; P = .04). Mendelian randomization also found that blood pressure, body mass index, and cholesterol metabolism had substantially lesser associations with AS compared with CAD. Pathway and transcriptome enrichment analyses revealed biological processes and tissues relevant for AS development. Conclusions and Relevance This GWAS adjusted for CAD found a distinct genetic risk profile for AS at the single-marker and polygenic level. These findings provide new targets for future AS research.
0

Translating genotype data of 44,000 biobank participants into clinical pharmacogenetic recommendations: challenges and solutions

Sulev Reisberg et al.Jul 4, 2018
Purpose: Biomedical databases combining electronic medical records, phenotypic and genomic data constitute a powerful resource for the personalization of treatment. To leverage the wealth of information provided, algorithms are required that systematically translate the contained information into treatment recommendations based on existing genotype-phenotype associations. Methods: We developed and tested algorithms for translation of pre-existing genotype data of over 44,000 participants of the Estonian biobank into pharmacogenetic recommendations. We compared the results obtained by whole genome sequencing, whole exome sequencing and genotyping using microarrays, and evaluated the impact of pharmacogenetic reporting based on drug prescription statistics in the Nordic countries and Estonia. Results: Our most striking result was that the performance of genotyping arrays is similar to that of whole genome sequencing, whereas exome sequencing is not suitable for pharmacogenetic predictions. Interestingly, 99.8% of all assessed individuals had a genotype associated with increased risks to at least one medication, and thereby the implementation of pharmacogenetic recommendations based on genotyping affects at least 50 daily drug doses per 1000 inhabitants. Conclusion: We find that microarrays are a cost-effective solution for creating pre-emptive pharmacogenetic reports, and with slight modifications, existing databases can be applied for automated pharmacogenetic decision support for clinicians.