LG
Leif Groop
Author with expertise in Genomic Studies and Association Analyses
Lund University, University of Helsinki, Institute for Molecular Medicine Finland
+ 7 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
20
(30% Open Access)
Cited by:
31
h-index:
150
/
i10-index:
697
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Characterising the loss-of-function impact of 5’ untranslated region variants in whole genome sequence data from 15,708 individuals

Konrad Karczewski et al.May 6, 2020
+161
S
X
K
Abstract Upstream open reading frames (uORFs) are important tissue-specific cis -regulators of protein translation. Although isolated case reports have shown that variants that create or disrupt uORFs can cause disease, genetic sequencing approaches typically focus on protein-coding regions and ignore these variants. Here, we describe a systematic genome-wide study of variants that create and disrupt human uORFs, and explore their role in human disease using 15,708 whole genome sequences collected by the Genome Aggregation Database (gnomAD) project. We show that 14,897 variants that create new start codons upstream of the canonical coding sequence (CDS), and 2,406 variants disrupting the stop site of existing uORFs, are under strong negative selection. Furthermore, variants creating uORFs that overlap the CDS show signals of selection equivalent to coding loss-of-function variants, and uORF-perturbing variants are under strong selection when arising upstream of known disease genes and genes intolerant to loss-of-function variants. Finally, we identify specific genes where perturbation of uORFs is likely to represent an important disease mechanism, and report a novel uORF frameshift variant upstream of NF2 in families with neurofibromatosis. Our results highlight uORF-perturbing variants as an important and under-recognised functional class that can contribute to penetrant human disease, and demonstrate the power of large-scale population sequencing data to study the deleteriousness of specific classes of non-coding variants.
0
Paper
Citation8
0
Save
1

Genetic analysis of obstructive sleep apnoea discovers a strong association with cardiometabolic health

Satu Strausz et al.Jan 24, 2021
+19
H
S
S
Abstract There is currently only limited understanding of the genetic aetiology of obstructive sleep apnoea (OSA). The aim of our study is to identify genetic loci associated with OSA risk and to test if OSA and its comorbidities share a common genetic background. We conducted the first large-scale genome-wide association study of OSA using FinnGen Study (217,955 individuals) with 16,761 OSA patients identified using nationwide health registries. We estimated 8.3% [0.06-0.11] heritability and identified five loci associated with OSA (P < 5.0 × 10 −8 ): rs4837016 near GTPase activating protein and VPS9 domains 1 ( GAPVD1 ), rs10928560 near C-X-C motif chemokine receptor 4 ( CXCR4 ), rs185932673 near Calcium/calmodulin-dependent protein kinase ID ( CAMK1D ) and rs9937053 near Fat mass and obesity-associated protein ( FTO ) - a variant previously associated with body mass index (BMI). In a BMI-adjusted analysis, an association was observed for rs10507084 near Rhabdomyosarcoma 2 associated transcript ( RMST )/NEDD1 gamma-tubulin ring complex targeting factor ( NEDD1 ). We found genetic correlations between OSA and BMI (rg=0.72 [0.62-0.83]) and with comorbidities including hypertension, type 2 diabetes (T2D), coronary heart disease (CHD), stroke, depression, hypothyroidism, asthma and inflammatory rheumatic diseases (IRD) (rg > 0.30). Polygenic risk score (PRS) for BMI showed 1.98-fold increased OSA risk between the highest and the lowest quintile and Mendelian randomization supported a causal relationship between BMI and OSA. Our findings support the causal link between obesity and OSA and joint genetic basis between OSA and comorbidities.
1
Citation6
0
Save
1

Rare coding variants in 35 genes associate with circulating lipid levels – a multi-ancestry analysis of 170,000 exomes

George Hindy et al.Dec 24, 2020
+179
M
P
G
Abstract Large-scale gene sequencing studies for complex traits have the potential to identify causal genes with therapeutic implications. We performed gene-based association testing of blood lipid levels with rare (minor allele frequency<1%) predicted damaging coding variation using sequence data from >170,000 individuals from multiple ancestries: 97,493 European, 30,025 South Asian, 16,507 African, 16,440 Hispanic/Latino, 10,420 East Asian, and 1,182 Samoan. We identified 35 genes associated with circulating lipid levels. Ten of these: ALB , SRSF2 , JAK2, CREB3L3 , TMEM136 , VARS , NR1H3 , PLA2G12A , PPARG and STAB1 have not been implicated for lipid levels using rare coding variation in population-based samples. We prioritize 32 genes identified in array-based genome-wide association study (GWAS) loci based on gene-based associations, of which three: EVI5, SH2B3 , and PLIN1 , had no prior evidence of rare coding variant associations. Most of the associated genes showed evidence of association in multiple ancestries. Also, we observed an enrichment of gene-based associations for low-density lipoprotein cholesterol drug target genes, and for genes closest to GWAS index single nucleotide polymorphisms (SNP). Our results demonstrate that gene-based associations can be beneficial for drug target development and provide evidence that the gene closest to the array-based GWAS index SNP is often the functional gene for blood lipid levels.
0

The Trans-Ancestral Genomic Architecture of Glycaemic Traits

Ji Chen et al.May 30, 2024
+405
G
C
J
Abstract Glycaemic traits are used to diagnose and monitor type 2 diabetes, and cardiometabolic health. To date, most genetic studies of glycaemic traits have focused on individuals of European ancestry. Here, we aggregated genome-wide association studies in up to 281,416 individuals without diabetes (30% non-European ancestry) with fasting glucose, 2h-glucose post-challenge, glycated haemoglobin, and fasting insulin data. Trans-ancestry and single-ancestry meta-analyses identified 242 loci (99 novel; P <5×10 -8 ), 80% with no significant evidence of between-ancestry heterogeneity. Analyses restricted to European ancestry individuals with equivalent sample size would have led to 24 fewer new loci. Compared to single-ancestry, equivalent sized trans-ancestry fine-mapping reduced the number of estimated variants in 99% credible sets by a median of 37.5%. Genomic feature, gene-expression and gene-set analyses revealed distinct biological signatures for each trait, highlighting different underlying biological pathways. Our results increase understanding of diabetes pathophysiology by use of trans-ancestry studies for improved power and resolution.
0

Genome-wide association study of diabetic kidney disease highlights biology involved in renal basement membrane collagen

Rany Salem et al.May 7, 2020
+85
N
J
R
Diabetic kidney disease (DKD) is a heritable but poorly understood complication of diabetes. To identify genetic variants predisposing to DKD, we performed genome-wide association analyses in 19,406 individuals with type 1 diabetes (T1D) using a spectrum of DKD definitions basedon albuminuria and renal function. We identified 16 genome-wide significant loci. The variant with the strongest association (rs55703767) is a common missense mutation in the collagen type IV alpha 3 chain (COL4A3) gene, which encodes a major structural component of the glomerular basement membrane (GBM) implicated in heritable nephropathies. The rs55703767 minor allele (Asp326Tyr) is protective against several definitions of DKD, including albuminuria and end-stage renal disease. Three other loci are in or near genes with known or suggestive involvement in DKD (BMP7) or renal biology ( COLEC11 and DDR1 ). The 16 DKD-associated loci provide novel insights into the pathogenesis of DKD, identifying potential biological targets for prevention and treatment.
0
Citation3
0
Save
0

Haplotype sharing provides insights into fine-scale population history and disease in Finland

Alicia Martin et al.May 7, 2020
+24
S
K
A
Abstract Finland provides unique opportunities to investigate population and medical genomics because of its adoption of unified national electronic health records, detailed historical and birth records, and serial population bottlenecks. We assemble a comprehensive view of recent population history (≤100 generations), the timespan during which most rare disease-causing alleles arose, by comparing pairwise haplotype sharing from 43,254 Finns to geographically and linguistically adjacent countries with different population histories, including 16,060 Swedes, Estonians, Russians, and Hungarians. We find much more extensive sharing in Finns, with at least one ≥ 5 cM tract on average between pairs of unrelated individuals. By coupling haplotype sharing with fine-scale birth records from over 25,000 individuals, we find that while haplotype sharing broadly decays with geographical distance, there are pockets of excess haplotype sharing; individuals from northeast Finland share several-fold more of their genome in identity-by-descent (IBD) segments than individuals from southwest regions containing the major cities of Helsinki and Turku. We estimate recent effective population size changes over time across regions of Finland and find significant differences between the Early and Late Settlement Regions as expected; however, our results indicate more continuous gene flow than previously indicated as Finns migrated towards the northernmost Lapland region. Lastly, we show that haplotype sharing is locally enriched among pairs of individuals sharing rare alleles by an order of magnitude, especially among pairs sharing rare disease causing variants. Our work provides a general framework for using haplotype sharing to reconstruct an integrative view of recent population history and gain insight into the evolutionary origins of rare variants contributing to disease.
0
Citation3
0
Save
21

TIGER: The gene expression regulatory variation landscape of human pancreatic islets

Lorena Alonso et al.Oct 24, 2023
+26
I
A
L
Abstract GWAS have identified more than 700 genetic signals associated with type 2 diabetes (T2D). To gain insight into the underlying molecular mechanisms, we created the Translational human pancreatic Islet Genotype tissue-Expression Resource (TIGER), aggregating >500 human islet RNA-seq and genotyping datasets. We imputed genotypes using 4 reference panels and meta-analyzed cohorts to improve coverage of expression quantitative trait loci (eQTL) and developed a method to combine allele-specific expression across samples (cASE). We identified >1 million islet eQTLs (56% novel), of which 53 colocalize with T2D signals (60% novel). Among them, a low-frequency allele that reduces T2D risk by half increases CCND2 expression. We identified 8 novel cASE colocalizations, among which an SLC30A8 T2D associated variant. We make all the data available through the open-access TIGER portal ( http://tiger.bsc.es ), which represents a comprehensive human islet genomic data resource to elucidate how genetic variation affects islet function and translate this into therapeutic insight and precision medicine for T2D.
0

Loss of ZnT8 function protects against diabetes by enhanced insulin secretion

Om Dwivedi et al.May 7, 2020
+42
B
M
O
A rare loss-of-function variant p.Arg138* in SLC30A8 encoding the zinc transporter 8 (ZnT8) enriched in Western Finland protects against type 2 diabetes (T2D). We recruited relatives of the identified carriers and showed that protection was associated with better insulin secretion due to enhanced glucose responsiveness and proinsulin conversion, especially compared with individuals matched for the genotype of a common T2D risk variant in SLC30A8, p.Arg325. In genome-edited human IPS-derived β-like cells, we establish that the p.Arg138* variant results in reduced SLC30A8 expression due to haploinsufficiency. In human β-cells loss of SLC30A8 leads to increased glucose responsiveness and reduced KATP channel function, which was also seen in isolated islets from carriers of the T2D-protective allele p.Trp325. These data position ZnT8 as an appealing target for treatment aiming at maintaining insulin secretion capacity in T2D.
0

Controllability in an islet specific regulatory network identifies the transcriptional factor NFATC4, which regulates Type 2 Diabetes associated genes

Amitabh Sharma et al.May 7, 2020
+13
J
A
A
Probing the dynamic control features of biological networks represents a new frontier in capturing the dysregulated pathways in complex diseases. Here, using patient samples obtained from a pancreatic islet transplantation program, we constructed a tissue-specific gene regulatory network and used the control centrality (Cc) concept to identify the high control centrality (HiCc) pathways, which might serve as key pathobiological pathways for Type 2 Diabetes (T2D). We found that HiCc pathway genes were significantly enriched with modest GWAS p-values in the DIAbetes Genetics Replication And Meta-analysis (DIAGRAM) study. We identified variants regulating gene expression (expression quantitative loci, eQTL) of HiCc pathway genes in islet samples. These eQTL genes showed higher levels of differential expression compared to non-eQTL genes in low, medium and high glucose concentrations in rat islets. Among genes with highly significant eQTL evidence, NFATC4 belonged to four HiCc pathways. We asked if the expressions of T2D-associated candidate genes from GWAS and literature are regulated by Nfatc4 in rat islets. Extensive in vitro silencing of Nfatc4 in rat islet cells displayed reduced expression of 16, and increased expression of 4 putative downstream T2D genes. Overall, our approach uncovers the mechanistic connection of NFATC4 with downstream targets including a previously unknown one, TCF7L2, and establishes the HiCc pathways' relationship to T2D.
0

Turning vice into virtue: Using Batch-Effects to Detect Errors in Large Genomic Datasets

Fabrizio Mafessoni et al.May 7, 2020
+2
L
R
F
It is often unavoidable to combine data from different sequencing centers or sequencing platforms when compiling datasets with a large number of individuals. However, the different data are likely to contain specific systematic errors that will appear as SNPs. Here, we devise a method to detect systematic errors in combined datasets. To measure quality differences between individual genomes, we study pairs of variants that reside on different chromosomes and co-occur in individuals. The abundance of these pairs of variants in different genomes is then used to detect systematic errors due to batch effects. Applying our method to the 1000 Genomes dataset, we find that coding regions are enriched for errors, where about 1% of the higher-frequency variants are predicted to be erroneous, whereas errors outside of coding regions are much rarer (<0.001%). As expected, predicted errors are less often found than other variants in a dataset that was generated with a different sequencing technology, indicating that many of the candidates are indeed errors. However, predicted 1000 Genomes errors are also found in other large datasets; our observation is thus not specific to the 1000 Genomes dataset. Our results show that batch effects can be turned into a virtue by using the resulting variation in large scale datasets to detect systematic errors.
Load More