KL
Kaido Lepik
Author with expertise in Genomic Studies and Association Analyses
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
6
(67% Open Access)
Cited by:
4
h-index:
8
/
i10-index:
6
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The role of gene expression on human sexual dimorphism: too early to call

Eleonora Porcu et al.Apr 17, 2020
+5
K
A
E
Abstract The genetic underpinning of sexual dimorphism is very poorly understood. The prevalence of many diseases differs between men and women, which could be in part caused by sex-specific genetic effects. Nevertheless, only a few published genome-wide association studies (GWAS) were performed separately in each sex. The reported enrichment of expression quantitative trait loci (eQTLs) among GWAS–associated SNPs suggests a potential role of sex-specific eQTLs in the sex-specific genetic mechanism underlying complex traits. To explore this scenario, we performed a genome-wide analysis of sex-specific whole blood RNA-seq eQTLs from 3,447 individuals. Among 9 million SNP-gene pairs showing sex-combined associations, we found 18 genes with significant sex-specific cis -eQTLs (FDR 5%). Our phenome-wide association study of the 18 top sex-specific eQTLs on >700 traits unraveled that these eQTLs do not systematically translate into detectable sex-specific trait-associations. Power analyses using real eQTL- and causal effect sizes showed that millions of samples would be necessary to observe sex-specific trait associations that are fully driven by sex-specific cis -eQTLs. Compensatory effects may further hamper their detection. In line with this observation, we confirmed that the sex-specific trait-associations detected so far are not driven by sex-specific cis -eQTLs.
0
Citation3
0
Save
21

Omics-informed CNV calls reduce false positive rate and improve power for CNV-trait associations

Maarja Lepamets et al.Feb 10, 2022
+15
C
L
M
Abstract Copy number variations (CNV) are believed to play an important role in a wide range of complex traits but discovering such associations remains challenging. Whilst whole genome sequencing (WGS) is the gold standard approach for CNV detection, there are several orders of magnitude more samples with available genotyping microarray data. Such array data can be exploited for CNV detection using dedicated software (e.g., PennCNV), however these calls suffer from elevated false positive and negative rates. In this study, we developed a CNV quality score that weights PennCNV calls (pCNV) based on their likelihood of being true positive. First, we established a measure of pCNV reliability by leveraging evidence from multiple omics data (WGS, transcriptomics and methylomics) obtained from the same samples. Next, we built a predictor of omics-confirmed pCNVs, termed omics-informed quality score (OQS), using only PennCNV software output parameters. Promisingly, OQS assigned to pCNVs detected in close family members was up to 35% higher than the OQS of pCNVs not carried by other relatives (P < 3.0−10 −90 ), outperforming other scores. Finally, in an association study of four anthropometric traits in 89,516 Estonian Biobank samples, the use of OQS led to a relative increase in the trait variance explained by CNVs of up to 34% compared to raw pCNVs or previous quality scores. Overall, we put forward a flexible framework to improve any CNV detection method leveraging multi-omics evidence, applied it to improve PennCNV calls and demonstrated its utility by improving the statistical power for downstream association analyses.
21
Citation1
0
Save
3

Genetic determinants of plasma protein levels in the Estonian population

Anette Kalnapenkis et al.Jun 2, 2023
+6
K
M
A
Abstract The proteome holds great potential as an intermediate layer between the genome and phenome. Previous protein quantitative trait locus studies have focused mainly on describing the effects of common genetic variations on the proteome. Here, we assessed the impact of the common and rare genetic variations as well as the copy number variants (CNVs) on 326 plasma proteins measured in up to 500 individuals. We identified 184 cis and 94 trans signals for 157 protein traits, which were further fine-mapped to credible sets for 101 cis and 87 trans signals for 151 proteins. Rare genetic variation contributed to the levels of 7 proteins, with 5 cis and 14 trans associations. CNVs were associated with the levels of 11 proteins (7 cis and 5 trans ), examples including a 3q12.1 deletion acting as a hub for multiple trans associations; and a CNV overlapping NAIP , a sensor component of the NAIP-NLRC4 inflammasome which is affecting pro-inflammatory cytokine interleukin 18 levels. In summary, this work presents a comprehensive resource of genetic variation affecting the plasma protein levels and provides the interpretation of identified effects.
0

Mendelian Randomization integrating GWAS and eQTL data reveals genetic determinants of complex and clinical traits

Eleonora Porcu et al.Jul 25, 2018
+3
K
S
E
Genome-wide association studies (GWAS) identified thousands of variants associated with complex traits, but their biological interpretation often remains unclear. Most of these variants overlap with expression QTLs (eQTLs), indicating their potential involvement in the regulation of gene expression. Here, we propose an advanced transcriptome-wide summary statistics-based Mendelian Randomization approach (called TWMR) that uses multiple SNPs jointly as instruments and multiple gene expression traits as exposures, simultaneously. When applied to 43 human phenotypes it uncovered 2,369 genes whose blood expression is putatively associated with at least one phenotype resulting in 3,913 gene-trait associations; of note, 36% of them had no genome-wide significant SNP nearby in previous GWAS analysis. Using independent association summary statistics (UKBiobank), we confirmed that the majority of these loci were missed by conventional GWAS due to power issues. Noteworthy among these novel links is educational attainment-associated BSCL2, known to carry mutations leading to a mendelian form of encephalopathy. We similarly unraveled novel pleiotropic causal effects suggestive of mechanistic connections, e.g. the shared genetic effects of GSDMB in rheumatoid arthritis, ulcerative colitis and Crohn's disease. Our advanced Mendelian Randomization unlocks hidden value from published GWAS through higher power in detecting associations. It better accounts for pleiotropy and unravels new biological mechanisms underlying complex and clinical traits.
0

Leveraging biobank-scale rare and common variant analyses to identify ASPHD1 as the main driver of reproductive traits in the 16p11.2 locus

Katrin Männik et al.Jul 26, 2019
+29
J
A
K
Whereas genome-wide association studies (GWAS) allowed identifying thousands of associations between variants and traits, their success rate in pinpointing causal genes has been disproportionately low. Here, we integrate biobank-scale phenotype data from carriers of a rare copy-number variant (CNV), Mendelian randomization and animal modeling to identify causative genes in a GWAS locus for age at menarche (AaM). We show that the dosage of the 16p11.2 BP4-BP5 interval is correlated positively with AaM in the UK and Estonian biobanks and 16p11.2 clinical cohorts, with a directionally consistent trend for pubertal onset in males. These correlations parallel an increase in reproductive tract disorders in both sexes. In support of these observations, 16p11.2 mouse models display perturbed pubertal onset and structurally altered reproductive organs that track with CNV dose. Further, we report a negative correlation between the 16p11.2 dosage and relative hypothalamic volume in both humans and mice, intimating a perturbation in the gonadotropin-releasing hormone (GnRH) axis. Two independent lines of evidence identified candidate causal genes for AaM; Mendelian randomization and agnostic dosage modulation of each 16p11.2 gene in zebrafish gnrh3:egfp models. ASPHD1 , expressed predominantly in brain and pituitary gland, emerged as a major phenotype driver; and it is subject to modulation by KCTD13 to exacerbate GnRH neuron phenotype. Together, our data highlight the power of an interdisciplinary approach to elucidate disease etiologies underlying complex traits.
10

Widespread natural selection on metabolite levels in humans

Yanina Timasheva et al.Feb 7, 2023
+2
O
K
Y
Abstract Natural selection acts ubiquitously on complex human traits, predominantly constraining the occurrence of extreme phenotypes (stabilizing selection). These constrains propagate to DNA sequence variants associated with traits under selection. The genetic imprints of such evolutionary events can thus be detected via combining effect size estimates from genetic association studies and the corresponding allele frequencies. While this approach has been successfully applied to high-level traits, the prevalence and mode of selection acting on molecular traits remains poorly understood. Here, we estimate the action of natural selection on genetic variants associated with metabolite levels, an important layer of molecular traits. By leveraging summary statistics of published genome-wide association studies with large sample sizes, we find strong evidence of stabilizing selection for 15 out of 97 plasma metabolites, with an overrepresentation of amino acids among such cases. Mendelian randomization analysis revealed that metabolites under stronger stabilizing selection display larger effects on key cardiometabolic traits, suggesting that maintaining a healthy cardiometabolic profile may be an important source of selective constraints on the metabolome. Metabolites under strong stabilizing selection in humans are also more conserved in their concentrations among diverse mammalian species, suggesting shared selective forces across micro and macroevolutionary time scales. Finally, we also found evidence for both disruptive and directional selection on specific lipid metabolites, potentially indicating ongoing evolutionary adaptation in humans. Overall, this study demonstrates that variation in metabolite levels among humans is frequently shaped by natural selection and this may be acting indirectly through maintaining cardiometabolic fitness.