LF
Lude Franke
Author with expertise in Genomic Studies and Association Analyses
University Medical Center Groningen, University of Groningen, Oncode Institute
+ 7 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
20
(60% Open Access)
Cited by:
25
h-index:
86
/
i10-index:
166
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

A linear mixed model approach to study multivariate gene-environment interactions

Rachel Moore et al.May 6, 2020
+4
M
F
R
Abstract Different environmental factors, including diet, physical activity, or external conditions can contribute to genotype-environment interactions (GxE). Although high-dimensional environmental data are increasingly available, and multiple environments have been implicated with GxE at the same loci, multi-environment tests for GxE are not established. Such joint analyses can increase power to detect GxE and improve the interpretation of these effects. Here, we propose the structured linear mixed model (StructLMM), a computationally efficient method to test for and characterize loci that interact with multiple environments. After validating our model using simulations, we apply StructLMM to body mass index in UK Biobank, where our method detects previously known and novel GxE signals. Finally, in an application to a large blood eQTL dataset, we demonstrate that StructLMM can be used to study interactions with hundreds of environmental variables.
0
Paper
Citation8
0
Save
0

Deconvolution of bulk blood eQTL effects into immune cell subpopulations

Raúl Aguirre‐Gamboa et al.May 6, 2020
+21
J
N
R
Abstract Expression quantitative trait loci (eQTL) studies are used to interpret the function of disease-associated genetic risk factors. To date, most eQTL analyses have been conducted in bulk tissues, such as whole blood and tissue biopsies, which are likely to mask the cell type context of the eQTL regulatory effects. Although this context can be investigated by generating transcriptional profiles from purified cell subpopulations, the current methods are labor-intensive and expensive. Here we introduce a new method, Decon2 , a statistical framework for estimating cell proportions using expression profiles from bulk blood samples (Decon-cell) and consecutive deconvolution of cell type eQTLs (Decon-eQTL). The estimated cell proportions from Decon-cell agree with experimental measurements across cohorts (R ≥ 0.77). Using Decon-cell we can predict the proportions of 34 circulating cell types for 3,194 samples from a population-based cohort. Next we identified 16,362 whole blood eQTLs and assign them to a cell type with Decon-eQTL using the predicted cell proportions from Decon-cell. Deconvoluted eQTLs show excellent allelic directional concordance with those of eQTL(≥ 96%) and chromatin mark QTL (≥87%) studies that used either purified cell subpopulations or single-cell RNA-seq. Our new method provides a way to assign cell type effects to eQTLs from bulk blood, which is useful in pinpointing the most relevant cell type for a certain complex disease. Decon2 is available as an R package and Java application ( https://github.com/molgenis/systemsgenetics/tree/master/Decon2 ), and as a web tool ( www.molgenis.org/deconvolution ).
1

Unbiased identification of unknown cellular and environmental factors that mediate eQTLs using principal interaction component analysis

Martijn Vochteloo et al.Oct 24, 2023
+7
B
P
M
Abstract Expression quantitative trait loci (eQTL) can reveal the regulatory mechanisms of trait associated variants. eQTLs are highly cell-type and context-specific, but often these contexts are unknown or not measured. Here, we introduce PICALO (Principal Interaction Component Analysis through Likelihood Optimization), an unbiased method to identify known and hidden contexts that influence eQTLs. PICALO uses expectation maximization to identify latent components, referred to as Principal Interaction Components (PIC), that interact with genotypes to maximize explained eQTL effect-sizes. We applied PICALO to bulk RNA-seq eQTL datasets in blood (n=2,932) and brain (n=2,440). We identify 31 PICs in blood, interacting with 4,169 (32%) unique cis-eQTLs (BH-FDR≤0.05). In brain, we identified 21 PICs, interacting with 4,058 (39%) unique cis-eQTLs (BH-FDR≤0.05). These PICs are associated with RNA quality, cell type composition or environmental influences. Furthermore, PICs clearly disentangle distinct eQTL contexts, for example technical from non-technical factors. Combined, 3,065 unique genes showed a cis-eQTL effect that is dependent on a cell type or other non-technical context, emphasizing the value of methods like PICALO. PICALO is robust, works well with heterogeneous datasets, yields reproducible interaction components, and identifies eQTL interactions and contexts that would have been missed when using cell counts or expression based principal components. Since PICALO allows for the identification of many context-dependent eQTLs without any prior knowledge of such contexts, this method can help to reveal and quantify the influence of previously unknown environmental factors that play a role in common diseases.
0

The role of gene expression on human sexual dimorphism: too early to call

Eleonora Porcu et al.May 7, 2020
+5
K
A
E
Abstract The genetic underpinning of sexual dimorphism is very poorly understood. The prevalence of many diseases differs between men and women, which could be in part caused by sex-specific genetic effects. Nevertheless, only a few published genome-wide association studies (GWAS) were performed separately in each sex. The reported enrichment of expression quantitative trait loci (eQTLs) among GWAS–associated SNPs suggests a potential role of sex-specific eQTLs in the sex-specific genetic mechanism underlying complex traits. To explore this scenario, we performed a genome-wide analysis of sex-specific whole blood RNA-seq eQTLs from 3,447 individuals. Among 9 million SNP-gene pairs showing sex-combined associations, we found 18 genes with significant sex-specific cis -eQTLs (FDR 5%). Our phenome-wide association study of the 18 top sex-specific eQTLs on >700 traits unraveled that these eQTLs do not systematically translate into detectable sex-specific trait-associations. Power analyses using real eQTL- and causal effect sizes showed that millions of samples would be necessary to observe sex-specific trait associations that are fully driven by sex-specific cis -eQTLs. Compensatory effects may further hamper their detection. In line with this observation, we confirmed that the sex-specific trait-associations detected so far are not driven by sex-specific cis -eQTLs.
12

Imbalanced expression for predicted high-impact, autosomal-dominant variants in a cohort of 3,818 healthy samples

Nigel Klein et al.Oct 24, 2023
+9
P
F
N
Abstract Background One of the growing problems in genome diagnostics is the increasing number of variants that get identified through genetic testing but for which it is unknown what the significance for the disease is (Variants of Unknown Significance - VUS) 1,2 . When these variants are observed in patients, clinicians need to be able to determine their relevance for causing the patient’s disease. Here we investigated whether allele-specific expression (ASE) can be used to prioritize disease-relevant VUS and therefore assist diagnostics. In order to do so, we conducted ASE analysis in RNA-seq data from 3,818 blood samples (part of the the Dutch BIOS biobank consortium), to ascertain how VUS affect gene expression. We compared the effect of VUS variants to variants that are predicted to have a high impact, and variants that are predicted to be pathogenic but are either recessive or autosomal-dominant with low penetrance. Results For immune and haematological disorders, we observed that 24.7% of known pathogenic variants from ClinVar show allelic imbalance in blood, as compared to 6.6% of known benign variants with matching allele frequencies. However, for other types of disorders, ASE information from blood did not distinguish (likely) pathogenic variants from benign variants. Unexpectedly, we identified 5 genes ( ALOX5, COMT, PRPF8, PSTPIP1 and SH3BP2 ) in which seven population-based samples had a predicted high impact, autosomal-dominant variant. For these genes the imbalanced expression of the major allele compensates for the lower expression of the minor allele. Conclusions Our analysis in a large population-based gene expression cohort reveals examples of high impact, autosomal-dominant variants that are compensated for by imbalanced expression. Additionally, we observed that ASE analyses in blood are informative for predicting pathogenic variants that are associated with immune and haematological conditions. We have made all our ASE results, including many ASE calls for rare variants (MAF < 1%), available at https://molgenis15.gcc.rug.nl/ .
12
Paper
Citation2
0
Save
31

Genetic, parental and lifestyle factors influence telomere length

Sergio Andreu‐Sánchez et al.Oct 24, 2023
+13
A
G
S
Abstract The average length of telomere repeats (TL) declines with age and is considered to be a marker of biological ageing. Here, we measured TL in six blood cell types from 1,046 individuals using the clinically validated Flow-FISH method. We identified remarkable cell-type-specific variations in TL. Host genetics, environmental, parental and intrinsic factors such as sex, parental age, and smoking are associated to variations in TL. By analysing the genome-wide methylation patterns, we identified that the association of maternal, but not paternal, age to TL is mediated by epigenetics. Coupling these measurements to single-cell RNA-sequencing data for 62 participants revealed differential gene expression in T-cells. Genes negatively associated with TL were enriched for pathways related to translation and nonsense-mediated decay. Altogether, this study addresses cell-type-specific differences in telomere biology and its relation to cell-type-specific gene expression and highlights how perinatal factors play a role in determining TL, on top of genetics and lifestyle.
31
Citation1
0
Save
47

Correction for both common and rare cell types in blood is important to identify genes that correlate with age

Damiano Coppola et al.Oct 24, 2023
+5
M
A
D
Abstract Background Aging is a multifactorial process that affects multiple tissues and is characterized by changes in homeostasis over time, leading to increased morbidity. Whole blood gene expression signatures have been associated with aging and have been used to gain information on its biological mechanisms, which are still not fully understood. However, blood is composed of many cell types whose proportions in blood vary with age. As a result, previously observed associations between gene expression levels and aging might be driven by cell type composition rather than intracellular aging mechanisms. To overcome this, previous aging studies already accounted for major cell types, but the possibility that the reported associations are false positives driven by less prevalent cell subtypes remains. Results Here, we compared the regression model from our previous work to an extended model that corrects for 33 additional white blood cell subtypes. Both models were applied to whole blood gene expression data from 3165 individuals belonging to the general population (age range of 18-81 years). We evaluated that the new model is a better fit for the data and it identified fewer genes associated with aging (625, compared to the 2808 of the initial model; P ≤ 2.5 × 10 −6 ). Moreover, 511 genes (∼18% of the 2,808 genes identified by the initial model) were found using both models, indicating that the other previously reported genes could be proxies for less abundant cell types. In particular, functional enrichment of the genes identified by the new model highlighted pathways and GO terms specifically associated with platelet activity. Conclusions We conclude that gene expression analyses in blood strongly benefit from correction for both common and rare blood cell types, and recommend using blood-cell count estimates as standard covariates when studying whole blood gene expression.
21

Omics-informed CNV calls reduce false positive rate and improve power for CNV-trait associations

Maarja Lepamets et al.Oct 24, 2023
+15
M
C
M
Abstract Copy number variations (CNV) are believed to play an important role in a wide range of complex traits but discovering such associations remains challenging. Whilst whole genome sequencing (WGS) is the gold standard approach for CNV detection, there are several orders of magnitude more samples with available genotyping microarray data. Such array data can be exploited for CNV detection using dedicated software (e.g., PennCNV), however these calls suffer from elevated false positive and negative rates. In this study, we developed a CNV quality score that weights PennCNV calls (pCNV) based on their likelihood of being true positive. First, we established a measure of pCNV reliability by leveraging evidence from multiple omics data (WGS, transcriptomics and methylomics) obtained from the same samples. Next, we built a predictor of omics-confirmed pCNVs, termed omics-informed quality score (OQS), using only PennCNV software output parameters. Promisingly, OQS assigned to pCNVs detected in close family members was up to 35% higher than the OQS of pCNVs not carried by other relatives (P < 3.0−10 −90 ), outperforming other scores. Finally, in an association study of four anthropometric traits in 89,516 Estonian Biobank samples, the use of OQS led to a relative increase in the trait variance explained by CNVs of up to 34% compared to raw pCNVs or previous quality scores. Overall, we put forward a flexible framework to improve any CNV detection method leveraging multi-omics evidence, applied it to improve PennCNV calls and demonstrated its utility by improving the statistical power for downstream association analyses.
21
Paper
Citation1
0
Save
0

Genome-wide identification of directed gene networks using large-scale population genomics data

René Luijk et al.May 7, 2020
+16
M
K
R
Identification of causal drivers behind regulatory gene networks is crucial in understanding gene function. We developed a method for the large-scale inference of gene-gene interactions in observational population genomics data that are both directed (using local genetic instruments as causal anchors, akin to Mendelian Randomization) and specific (by controlling for linkage disequilibrium and pleiotropy). The analysis of genotype and whole-blood RNA-sequencing data from 3,072 individuals identified 49 genes as drivers of downstream transcriptional changes (P < 7 x 10-10), among which transcription factors were overrepresented (P = 3.3 x 10-7). Our analysis suggests new gene functions and targets including for SENP7 (zinc-finger genes involved in retroviral repression) and BCL2A1 (novel target genes possibly involved in auditory dysfunction). Our work highlights the utility of population genomics data in deriving directed gene expression networks. A resource of trans-effects for all 6,600 genes with a genetic instrument can be explored individually using a web-based browser.
0

GAVIN - Gene-Aware Variant INterpretation for medical sequencing

K. Velde et al.May 7, 2020
+9
C
E
K
Here, we present GAVIN, a new method that delivers accurate classification of variants for next-generation sequencing molecular diagnostics. It is based on gene-specific calibrations of allele frequencies (from the ExAC database), effect impact (using SnpEff) and estimated deleteriousness (CADD scores) for >3,000 genes. In a benchmark on 18 clinical gene sets, we achieved a sensitivity of 91.6%, with a specificity of 78.2%. This accuracy was unmatched by 12 other tools we tested. We provide GAVIN as an online MOLGENIS service to annotate VCF files, and as open source executable for use in bioinformatic pipelines. It can be found at http://molgenis.org/gavin.
Load More