KA
Kaur Alasoo
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
19
(74% Open Access)
Cited by:
2,535
h-index:
19
/
i10-index:
24
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

FinnGen provides genetic insights from a well-phenotyped isolated population

Mitja Kurki et al.Jan 18, 2023
Abstract Population isolates such as those in Finland benefit genetic research because deleterious alleles are often concentrated on a small number of low-frequency variants (0.1% ≤ minor allele frequency < 5%). These variants survived the founding bottleneck rather than being distributed over a large number of ultrarare variants. Although this effect is well established in Mendelian genetics, its value in common disease genetics is less explored 1,2 . FinnGen aims to study the genome and national health register data of 500,000 Finnish individuals. Given the relatively high median age of participants (63 years) and the substantial fraction of hospital-based recruitment, FinnGen is enriched for disease end points. Here we analyse data from 224,737 participants from FinnGen and study 15 diseases that have previously been investigated in large genome-wide association studies (GWASs). We also include meta-analyses of biobank data from Estonia and the United Kingdom. We identified 30 new associations, primarily low-frequency variants, enriched in the Finnish population. A GWAS of 1,932 diseases also identified 2,733 genome-wide significant associations (893 phenome-wide significant (PWS), P < 2.6 × 10 –11 ) at 2,496 (771 PWS) independent loci with 807 (247 PWS) end points. Among these, fine-mapping implicated 148 (73 PWS) coding variants associated with 83 (42 PWS) end points. Moreover, 91 (47 PWS) had an allele frequency of <5% in non-Finnish European individuals, of which 62 (32 PWS) were enriched by more than twofold in Finland. These findings demonstrate the power of bottlenecked populations to find entry points into the biology of common diseases through low-frequency, high impact variants.
0
Citation1,372
0
Save
1

Common genetic variation drives molecular heterogeneity in human iPSCs

Helena Kilpinen et al.May 8, 2017
Technology utilizing human induced pluripotent stem cells (iPS cells) has enormous potential to provide improved cellular models of human disease. However, variable genetic and phenotypic characterization of many existing iPS cell lines limits their potential use for research and therapy. Here we describe the systematic generation, genotyping and phenotyping of 711 iPS cell lines derived from 301 healthy individuals by the Human Induced Pluripotent Stem Cells Initiative. Our study outlines the major sources of genetic and phenotypic variation in iPS cells and establishes their suitability as models of complex human traits and cancer. Through genome-wide profiling we find that 5–46% of the variation in different iPS cell phenotypes, including differentiation capacity and cellular morphology, arises from differences between individuals. Additionally, we assess the phenotypic consequences of genomic copy-number alterations that are repeatedly observed in iPS cells. In addition, we present a comprehensive map of common regulatory variants affecting the transcriptome of human pluripotent cells. Genetic and phenotypic analysis reveals expression quantitative trait loci in human induced pluripotent stem cell lines associated with cancer and disease. The Human Induced Pluripotent Stem Cells Initiative (HipSci) has resulted in the generation, genotyping and phenotyping of more than 700 human induced pluripotent stem (iPS) cell lines derived from 300 healthy individuals. Although analysis of these data indicates that most of the variations in phenotypes between cells arise from variations between individuals, the authors also assess the consequences of the rare genetic defects that are recurrently seen in iPS cells after reprogramming and provide a map of the common regulatory variants that can change the transcriptome of human pluripotent cells. This resource will be useful for genetic studies of complex traits and cancer.
1
Citation521
0
Save
0

eQTL Catalogue: a compendium of uniformly processed human gene expression and splicing QTLs

Nurlan Kerimov et al.Jan 29, 2020
Abstract An increasing number of gene expression quantitative trait locus (eQTL) studies have made summary statistics publicly available, which can be used to gain insight into complex human traits by downstream analyses, such as fine mapping and colocalisation. However, differences between these datasets, in their variants tested, allele codings, and in the transcriptional features quantified, are a barrier to their widespread use. Consequently, target genes for most GWAS signals have still not been identified. Here, we present the eQTL Catalogue ( https://www.ebi.ac.uk/eqtl/ ), a resource which contains quality controlled, uniformly recomputed QTLs from 21 eQTL studies. We find that for matching cell types and tissues, the eQTL effect sizes are highly reproducible between studies, enabling the integrative analysis of these data. Although most cis -eQTLs were shared between most bulk tissues, the analysis of purified cell types identified a greater diversity of cell-type-specific eQTLs, a subset of which also manifested as novel disease colocalisations. Our summary statistics can be downloaded by FTP, accessed via a REST API, and visualised on the Ensembl genome browser. New datasets will continuously be added to the eQTL Catalogue, enabling the systematic interpretation of human GWAS associations across many cell types and tissues.
0
Citation59
0
Save
0

Molecular and functional variation in iPSC-derived sensory neurons

Jeremy Schwartzentruber et al.Jan 6, 2017
Abstract Induced pluripotent stem cells (iPSCs), and cells derived from them, have become key tools to model biological processes and disease mechanisms, particularly in cell types such as neurons that are difficult to access from living donors. Here, we present the first map of regulatory variants in an iPSC-derived cell type. To investigate genetic contributions to human sensory function, we performed 123 differentiations of iPSCs from 103 unique donors to a sensory neuronal fate, and measured gene expression, chromatin accessibility, and neuronal excitability. Compared with primary dorsal root ganglion, where sensory nerves collect near the spinal cord, gene expression was more variable across iPSC-derived neuronal cultures, particularly in genes related to differentiation and nervous system development. Single cell RNA-sequencing revealed that although the majority of cells are neuronal and express the expected marker genes, a substantial fraction have a fibroblast-like expression profile. By applying an allele-specific method we identify 3,778 quantitative trait loci influencing gene expression, 6,318 for chromatin accessibility, and 2,097 for RNA splicing at FDR 10%. A number of these overlap with common disease associations, and suggest candidate causal variants and target genes. These include known causal variants at SNCA for Parkinson’s disease and TNFRSF1A for multiple sclerosis, as well as new candidates for migraine, Parkinson’s disease, and schizophrenia.
0
Citation5
0
Save
9

Improved detection of genetic effects on promoter usage with augmented transcript annotations

Andreas Vija et al.Jul 14, 2022
Abstract Disease-associated non-coding variants can modulate their target genes by disrupting multiple mechanisms, including regulating total gene expression level, splicing, alternative polyadenylation or promoter usage. Quantifying promoter usage from standard RNA sequencing data is challenging due to incomplete reference transcriptome annotations and low read coverage observed at the ends of transcripts. We previously developed the txrevise tool ( https://github.com/kauralasoo/txrevise ) to quantify promoter usage events from RNA-seq data using reference transcriptome annotations. Here, we augment the txrevise promoter event annotations with experimentally identified Cap Analysis of Gene Expression (CAGE) promoters from the FANTOM5 project. Applying the new annotations to RNA-seq data from 358 individuals, we found that augmented promoter event annotations increased the power to detect promoter usage quantitative trait loci (puQTLs) by ~30%. However, concordance between puQTLs inferred from RNA-seq data and those directly measured using CAGE remained low, suggesting that additional experimental and computational improvements are needed to capture the full range of regulatory effects of non-coding variants.
9
Citation3
0
Save
0

Predicted mechanistic impacts of human protein missense variants

Jürgen Jänes et al.May 29, 2024
Abstract Genome sequencing efforts have led to the discovery of tens of millions of protein missense variants found in the human population with the majority of these having no annotated role and some likely contributing to trait variation and disease. Sequence-based artificial intelligence approaches have become highly accurate at predicting variants that are detrimental to the function of proteins but they do not inform on mechanisms of disruption. Here we combined sequence and structure-based methods to perform proteome-wide prediction of deleterious variants with information on their impact on protein stability, protein-protein interactions and small-molecule binding pockets. AlphaFold2 structures were used to predict approximately 100,000 small-molecule binding pockets and stability changes for over 200 million variants. To inform on protein-protein interfaces we used AlphaFold2 to predict structures for nearly 500,000 protein complexes. We illustrate the value of mechanism-aware variant effect predictions to study the relation between protein stability and abundance and the structural properties of interfaces underlying trans protein quantitative trait loci (pQTLs). We characterised the distribution of mechanistic impacts of protein variants found in patients and experimentally studied example disease linked variants in FGFR1.
0
Citation1
0
Save
0

Co-expression analysis reveals interpretable gene modules controlled bytrans-acting genetic variants

Liis Kolberg et al.Apr 24, 2020
Abstract Background Developing novel therapies for complex disease requires better understanding of the causal processes that contribute to disease onset and progression. Although trans -acting gene expression quantitative trait loci ( trans -eQTLs) can be a powerful approach to directly reveal cellular processes modulated by disease variants, detecting trans -eQTLs remains challenging due to their small effect sizes and large number of genes tested. However, if a single trans -eQTL controls a group of co-regulated genes, then multiple testing burden can be greatly reduced by summarising gene expression at the level of co-expression modules prior to trans -eQTL analysis. Results We analysed gene expression and genotype data from six blood cell types from 226 to 710 individuals. We inferred gene co-expression modules with five methods on the full dataset, as well as in each cell type separately. We detected a number of established co-expression module trans -eQTLs, such as the monocyte-specific associations at the IFNB1 and LYZ loci, as well as a platelet-specific ARHGEF3 locus associated with mean platelet volume. We also discovered a novel trans association near the SLC39A8 gene in LPS-stimulated monocytes. Here, we linked an early-response cis -eQTL of the SLC39A8 gene to a module of co-expressed metallothionein genes upregulated more than 20 hours later and used motif analysis to identify zinc-induced activation of the MTF1 transcription factor as a likely mediator of this effect. Conclusions Our analysis provides a rare detailed characterisation of a trans -eQTL effect cascade from a proximal cis effect to the affected signalling pathway, transcription factor, and target genes. This highlights how co-expression analysis combined with functional enrichment analysis can greatly improve the identification and prioritisation of trans -eQTLs when applied to emerging cell-type specific datasets.
0
Citation1
0
Save
1

Systematic visualisation of molecular QTLs reveals variant mechanisms at GWAS loci

Nurlan Kerimov et al.Apr 7, 2023
Splicing quantitative trait loci (QTLs) have been implicated as a common mechanism underlying complex trait associations. However, utilising splicing QTLs in target discovery and prioritisation has been challenging due to extensive data normalisation which often renders the direction of the genetic effect as well as its magnitude difficult to interpret. This is further complicated by the fact that strong expression QTLs often manifest as weak splicing QTLs and vice versa, making it difficult to uniquely identify the underlying molecular mechanism at each locus. We find that these ambiguities can be mitigated by visualising the association between the genotype and average RNA sequencing read coverage in the region. Here, we generate these QTL coverage plots for 1.7 million molecular QTL associations in the eQTL Catalogue identified with five quantification methods. We illustrate the utility of these QTL coverage plots by performing colocalisation between vitamin D levels in the UK Biobank and all molecular QTLs in the eQTL Catalogue. We find that while visually confirmed splicing QTLs explain just 6/53 of the colocalising signals, they are significantly less pleiotropic than eQTLs and identify a prioritised causal gene in 4/6 cases. All our association summary statistics and QTL coverage plots are freely available at https://www.ebi.ac.uk/eqtl/.
1
Citation1
0
Save
Load More