AP
Aarno Palotie
Author with expertise in Genomic Studies and Association Analyses
Broad Institute, Massachusetts General Hospital, Institute for Molecular Medicine Finland
+ 7 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
27
(33% Open Access)
Cited by:
33
h-index:
58
/
i10-index:
111
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Phenome-wide association studies (PheWAS) across large “real-world data” population cohorts support drug target validation

Dorothée Diogo et al.May 6, 2020
+29
C
C
D
Abstract Phenome-wide association studies (PheWAS), which assess whether a genetic variant is associated with multiple phenotypes across a phenotypic spectrum, have been proposed as a possible aid to drug development through elucidating mechanisms of action, identifying alternative indications, or predicting adverse drug events (ADEs). Here, we evaluate whether PheWAS can inform target validation during drug development. We selected 25 single nucleotide polymorphisms (SNPs) linked through genome-wide association studies (GWAS) to 19 candidate drug targets for common disease therapeutic indications. We independently interrogated these SNPs through PheWAS in four large “real-world data” cohorts (23andMe, UK Biobank, FINRISK, CHOP) for association with a total of 1,892 binary endpoints. We then conducted meta-analyses for 145 harmonized disease endpoints in up to 697,815 individuals and joined results with summary statistics from 57 published GWAS. Our analyses replicate 70% of known GWAS associations and identify 10 novel associations with study-wide significance after multiple test correction (P<1.8x10 -6 ; out of 72 novel associations with FDR<0.1). By leveraging directionality and point estimate of the effect sizes, we describe new associations that may predict ADEs, e.g., acne, high cholesterol, gout and gallstones for rs738409 (p.I148M) in PNPLA3 ; or asthma for rs1990760 (p.T946A) in IFIH1 . We further propose how quantitative estimates of genetic safety/efficacy profiles can be used to help prioritize candidate targets for a specific indication. Our results demonstrate PheWAS as a powerful addition to the toolkit for drug discovery. One Sentence Summary Matching genetics with phenotypes in 800,000 individuals predicts efficacy and on-target safety of future drugs.
1

Genetic analysis of obstructive sleep apnoea discovers a strong association with cardiometabolic health

Satu Strausz et al.Jan 24, 2021
+19
H
S
S
Abstract There is currently only limited understanding of the genetic aetiology of obstructive sleep apnoea (OSA). The aim of our study is to identify genetic loci associated with OSA risk and to test if OSA and its comorbidities share a common genetic background. We conducted the first large-scale genome-wide association study of OSA using FinnGen Study (217,955 individuals) with 16,761 OSA patients identified using nationwide health registries. We estimated 8.3% [0.06-0.11] heritability and identified five loci associated with OSA (P < 5.0 × 10 −8 ): rs4837016 near GTPase activating protein and VPS9 domains 1 ( GAPVD1 ), rs10928560 near C-X-C motif chemokine receptor 4 ( CXCR4 ), rs185932673 near Calcium/calmodulin-dependent protein kinase ID ( CAMK1D ) and rs9937053 near Fat mass and obesity-associated protein ( FTO ) - a variant previously associated with body mass index (BMI). In a BMI-adjusted analysis, an association was observed for rs10507084 near Rhabdomyosarcoma 2 associated transcript ( RMST )/NEDD1 gamma-tubulin ring complex targeting factor ( NEDD1 ). We found genetic correlations between OSA and BMI (rg=0.72 [0.62-0.83]) and with comorbidities including hypertension, type 2 diabetes (T2D), coronary heart disease (CHD), stroke, depression, hypothyroidism, asthma and inflammatory rheumatic diseases (IRD) (rg > 0.30). Polygenic risk score (PRS) for BMI showed 1.98-fold increased OSA risk between the highest and the lowest quintile and Mendelian randomization supported a causal relationship between BMI and OSA. Our findings support the causal link between obesity and OSA and joint genetic basis between OSA and comorbidities.
1
Citation6
0
Save
0

De novo Variants in Neurodevelopmental Disorders with Epilepsy

Henrike Heyne et al.May 6, 2020
+25
H
T
H
Abstract Epilepsy is a frequent feature of neurodevelopmental disorders (NDD) but little is known about genetic differences between NDD with and without epilepsy. We analyzed de novo variants (DNV) in 6753 parent-offspring trios ascertained for different NDD. In the subset of 1942 individuals with NDD with epilepsy, we identified 33 genes with a significant excess of DNV, of which SNAP25 and GABRB2 had previously only limited evidence for disease association. Joint analysis of all individuals with NDD also implicated CACNA1E as a novel disease gene. Comparing NDD with and without epilepsy, we found missense DNV, DNV in specific genes, age of recruitment and severity of intellectual disability to be associated with epilepsy. We further demonstrate to what extent our results impact current genetic testing as well as treatment, emphasizing the benefit of accurate genetic diagnosis in NDD with epilepsy.
0
Citation5
0
Save
0

Contribution of rare and common variants to intellectual disability in a high-risk population sub-isolate of Northern Finland

Mitja Kurki et al.May 7, 2020
+20
O
E
M
Abstract The contribution of de novo and ultra-rare genetic variants in severe and moderate intellectual disability (ID) has been extensively studied whereas the genetic architecture of mild ID has been less well characterized. To elucidate the genetic background of milder ID we studied a regional cohort of 442 ID patients enriched for mild ID (>50%) from a population isolate of Finland. We analyzed rare variants using exome sequencing and CNV genotyping and common variants using common variant polygenic risk scores. As controls we used a Finnish collection of exome sequenced (n=11311) and GWAS chip genotyped (n=11699) individuals. We show that rare damaging variants in genes known to be associated with cognitive defects are observed more often in severe (27%) than in mild ID (13%) patients (p-value: 7.0e-4). We further observed a significant enrichment of protein truncating variants in loss-of-function intolerant genes, as well as damaging missense variants in genes not yet associated with cognitive defects (OR: 2.1, p-value: 3e-8). For the first time to our knowledge, we show that a common variant polygenic load significantly contributes to all severity forms of ID. The heritability explained was the highest for educational attainment (EDU) in mild ID explaining 2.2% of the heritability on liability scale. For more severe ID it was lower at 0.6%. Finally, we identified a homozygote variant in the CRADD gene to be a cause of a specific syndrome with ID and pachygyria. The frequency of this variant is 50x higher in the Finnish population than in non-Finnish Europeans, demonstrating the benefits of utilizing population isolates in rare variant analysis of diseases under negative selection.
0

Haplotype sharing provides insights into fine-scale population history and disease in Finland

Alicia Martin et al.May 7, 2020
+24
S
K
A
Abstract Finland provides unique opportunities to investigate population and medical genomics because of its adoption of unified national electronic health records, detailed historical and birth records, and serial population bottlenecks. We assemble a comprehensive view of recent population history (≤100 generations), the timespan during which most rare disease-causing alleles arose, by comparing pairwise haplotype sharing from 43,254 Finns to geographically and linguistically adjacent countries with different population histories, including 16,060 Swedes, Estonians, Russians, and Hungarians. We find much more extensive sharing in Finns, with at least one ≥ 5 cM tract on average between pairs of unrelated individuals. By coupling haplotype sharing with fine-scale birth records from over 25,000 individuals, we find that while haplotype sharing broadly decays with geographical distance, there are pockets of excess haplotype sharing; individuals from northeast Finland share several-fold more of their genome in identity-by-descent (IBD) segments than individuals from southwest regions containing the major cities of Helsinki and Turku. We estimate recent effective population size changes over time across regions of Finland and find significant differences between the Early and Late Settlement Regions as expected; however, our results indicate more continuous gene flow than previously indicated as Finns migrated towards the northernmost Lapland region. Lastly, we show that haplotype sharing is locally enriched among pairs of individuals sharing rare alleles by an order of magnitude, especially among pairs sharing rare disease causing variants. Our work provides a general framework for using haplotype sharing to reconstruct an integrative view of recent population history and gain insight into the evolutionary origins of rare variants contributing to disease.
0
Citation3
0
Save
1

High-resolution population-specific recombination rates and their effect on phasing and genotype imputation

Shabbeer Hassan et al.Oct 24, 2023
+7
M
I
S
Abstract Founder population size, demographic changes (eg. population bottlenecks or rapid expansion) can lead to variation in recombination rates across different populations. Previous research has shown that using population-specific reference panels has a significant effect on downstream population genomic analysis like haplotype phasing, genotype imputation and association, especially in the context of population isolates. Here, we developed a high-resolution recombination rate mapping at 10kb and 50kb scale using high-coverage (20-30x) whole-genome sequenced 55 family trios from Finland and compared it to recombination rates of non-Finnish Europeans (NFE). We tested the downstream effects of the population-specific recombination rates in statistical phasing and genotype imputation in Finns as compared to the same analyses performed by using the NFE-based recombination rates. We found that Finnish recombination rates have a moderately high correlation (Spearman’s ρ =0.67-0.79) with non-Finnish Europeans, although on average (across all autosomal chromosomes), Finnish rates (2.268±0.4209 cM/Mb) are 12-14% lower than NFE (2.641±0.5032 cM/Mb). Finnish recombination map was found to have no significant effect in haplotype phasing accuracy (switch error rates ~ 2%) and average imputation concordance rates (97-98% for common, 92-96% for low frequency and 78-90% for rare variants). Our results suggest that downstream population genomic analyses like haplotype phasing and genotype imputation mostly depend on population-specific contexts like appropriate reference panels and their sample size, but not on population-specific recombination maps or effective population sizes. Currently, available HapMap recombination maps seem robust for population-specific phasing and imputation pipelines, even in the context of relatively isolated populations like Finland.
0

Insights into the genetic epidemiology of Crohn's and rare diseases in the Ashkenazi Jewish population

Manuel Rivas et al.May 6, 2020
+49
H
J
M
As part of a broader collaborative network of exome sequencing studies, we developed a jointly called data set of 5,685 Ashkenazi Jewish exomes. We make publicly available a resource of site and allele frequencies, which should serve as a reference for medical genetics in the Ashkenazim. We estimate that 30% of protein-coding alleles present in the Ashkenazi Jewish population at frequencies greater than 0.2% are significantly more frequent (mean 7.6-fold) than their maximum frequency observed in other reference populations. Arising via a well-described founder effect, this catalog of enriched alleles can contribute to differences in genetic risk and overall prevalence of diseases between populations. As validation we document 151 AJ enriched protein-altering alleles that overlap with ``pathogenic" ClinVar alleles, including those that account for 10-100 fold differences in prevalence between AJ and non-AJ populations of some rare diseases including Gaucher disease (GBA, p.Asn409Ser, 8-fold enrichment); Canavan disease (ASPA, p.Glu285Ala, 12-fold enrichment); and Tay-Sachs disease (HEXA, c.1421+1G>C, 27-fold enrichment; p.Tyr427IlefsTer5, 12-fold enrichment). We next sought to use this catalog, of well-established relevance to Mendelian disease, to explore Crohn's disease, a common disease with an estimated two to four-fold excess prevalence in AJ. We specifically evaluate whether strong acting rare alleles, enriched by the same founder-effect, contribute excess genetic risk to Crohn's disease in AJ, and find that ten rare genetic risk factors in NOD2 and LRRK2 are strongly enriched in AJ, including several novel contributing alleles, show evidence of association to CD. Independently, we find that genomewide common variant risk defined by GWAS shows a strong difference between AJ and non-AJ European control population samples (0.97 s.d. higher, p<10-16). Taken together, the results suggest coordinated selection in AJ population for higher CD risk alleles in general. The results and approach illustrate the value of exome sequencing data in case-control studies along with reference data sets like ExAC to pinpoint genetic variation that contributes to variable disease predisposition across populations.
0
0
Save
0

Genomic prediction of coronary heart disease

Gad Abraham et al.May 7, 2020
+12
O
A
G
Background Genetics plays an important role in coronary heart disease (CHD) but the clinical utility of a genomic risk score (GRS) relative to clinical risk scores, such as the Framingham Risk Score (FRS), is unclear. Methods We generated a GRS of 49,310 SNPs based on a CARDIoGRAMplusC4D Consortium meta-analysis of CHD, then independently tested this using five prospective population cohorts (three FINRISK cohorts, combined n=12,676, 757 incident CHD events; two Framingham Heart Study cohorts (FHS), combined n=3,406, 587 incident CHD events). Results The GRS was strongly associated with time to CHD event (FINRISK HR=1.74, 95% CI 1.61-1.86 per S.D. of GRS; Framingham HR=1.28, 95% CI 1.18-1.38), and was largely unchanged by adjustment for clinical risk scores or individual risk factors, including family history. Integration of the GRS with clinical risk scores (FRS and ACC/AHA13 score) improved prediction of CHD events within 10 years (meta-analysis C-index: +1.5-1.6%, P<0.001), particularly for individuals ≥60 years old (meta-analysis C-index: +4.6-5.1%, P<0.001). Men in the top 20% of the GRS had 3-fold higher risk of CHD by age 75 in FINRISK and 2-fold in FHS, and attaining 10% cumulative CHD risk 18y earlier in FINRISK and 12y earlier in FHS than those in the bottom 20%. Furthermore, high genomic risk was partially compensated for by low systolic blood pressure, low cholesterol level, and non-smoking. Conclusions A GRS based on a large number of SNPs substantially improves CHD risk prediction and encodes decades of variation in CHD risk not captured by traditional clinical risk scores.
0

Identifying tissues implicated in Anorexia Nervosa using Transcriptomic Imputation

Laura Huckins et al.May 7, 2020
+212
W
A
L
Anorexia nervosa (AN) is a complex and serious eating disorder, occurring in ~1% of individuals. Despite having the highest mortality rate of any psychiatric disorder, little is known about the aetiology of AN, and few effective treatments exist. Global efforts to collect large sample sizes of individuals with AN have been highly successful, and a recent study consequently identified the first genome-wide significant locus involved in AN. This result, coupled with other recent studies and epidemiological evidence, suggest that previous characterizations of AN as a purely psychiatric disorder are over-simplified. Rather, both neurological and metabolic pathways may also be involved. In order to elucidate more of the system-specific aetiology of AN, we applied transcriptomic imputation methods to 3,495 cases and 10,982 controls, collected by the Eating Disorders Working Group of the Psychiatric Genomics Consortium (PGC-ED). Transcriptomic Imputation (TI) methods approaches use machine-learning methods to impute tissue-specific gene expression from large genotype data using curated eQTL reference panels. These offer an exciting opportunity to compare gene associations across neurological and metabolic tissues. Here, we applied CommonMind Consortium (CMC) and GTEx-derived gene expression prediction models for 13 brain tissues and 12 tissues with potential metabolic involvement (adipose, adrenal gland, 2 colon, 3 esophagus, liver, pancreas, small intestine, spleen, stomach). We identified 35 significant gene-tissue associations within the large chromosome 12 region described in the recent PGC-ED GWAS. We applied forward stepwise conditional analyses and FINEMAP to associations within this locus to identify putatively causal signals. We identified four independently associated genes; RPS26, C12orf49, SUOX, and RDH16. We also identified two further genome-wide significant gene-tissue associations, both in brain tissues; REEP5, in the dorso-lateral pre-frontal cortex (DLPFC; p=8.52x10-07), and CUL3, in the caudate basal ganglia (p=1.8x10-06). These genes are significantly enriched for associations with anthropometric phenotypes in the UK BioBank, as well as multiple psychiatric, addiction, and appetite/satiety pathways. Our results support a model of AN risk influenced by both metabolic and psychiatric factors.
0

Burden analysis of missense variants in 1,330 disease-associated genes on 3D provides insights into the mutation effects

Sumaiya Iqbal et al.May 7, 2020
+13
E
J
S
Interpretation of the colossal number of genetic variants identified from sequencing applications is one of the major bottlenecks in clinical genetics, with the inference of the effect of amino acid-substituting missense variants on protein structure and function being especially challenging. Here we evaluated the burden of amino acids affected in pathogenic variants (n=32,923) compared to the variants (n=164,915) from the general population in 1,330 disease-associated genes on forty protein features using over 14,000 experimentally-solved 3D structures. By analyzing the whole gene/variant set jointly, we identified 18 features associated with 3D mutational hotspots that are generally important for protein fitness and stability. Individual analyses performed for twenty-four protein functional classes further revealed 240 characteristics of mutational hotspots in total, including new associations recapitulating the sheer diversity across proteins essential structural regions. We demonstrated that the function-specific features of variants correspond to the readouts of mutagenesis experiments and positively correlate with clinically-interpreted pathogenic and benign missense variants. Finally, we made our results available through a web server to foster accessibility and downstream research. Our findings represent a crucial step towards translational genetics, from highlighting the impact of mutations on protein structure to rationalizing the pathogenicity of variants in terms of the perturbed molecular mechanisms.
Load More