SL
Shuang� Li
Author with expertise in Genomic Studies and Association Analyses
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
8
(38% Open Access)
Cited by:
5
h-index:
29
/
i10-index:
30
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
83

Identification of genetic variants that impact gene co-expression relationships using large-scale single-cell data

Shuang� Li et al.Apr 20, 2022
Abstract Background Expression quantitative trait loci (eQTL) studies have shown how genetic variants affect downstream gene expression. To identify the upstream regulatory processes, single-cell data can be used. Single-cell data also offers the unique opportunity to reconstruct personalized co-expression networks—by exploiting the large number of cells per individual, we can identify SNPs that alter co-expression patterns (co-expression QTLs, co-eQTLs) using a limited number of individuals. Results To tackle the large multiple testing burden associated with a genome-wide analysis (i.e. the need to assess all combinations of SNPs and gene pairs), we conducted a co-eQTL meta-analysis across four scRNA-seq peripheral blood mononuclear cell datasets from three studies (reflecting 173 unique participants and 1 million cells) using a novel filtering strategy followed by a permutation-based approach. Before analysis, we evaluated the co-expression patterns to be used for co-eQTL identification using different external resources. The subsequent analysis identified a robust set of cell-type-specific co-eQTLs for 72 independent SNPs that affect 946 gene pairs, which we then replicated in a large bulk cohort. These co-eQTLs provide novel insights into how disease-associated variants alter regulatory networks. For instance, one co-eQTL SNP, rs1131017, that is associated with several autoimmune diseases affects the co-expression of RPS26 with other ribosomal genes. Interestingly, specifically in T cells, the SNP additionally affects co-expression of RPS26 and a group of genes associated with T cell-activation and autoimmune disease. Among these genes, we identified enrichment for targets of five T-cell-activation-related transcriptional factors whose binding sites harbor rs1131017. This reveals a previously overlooked process and pinpoints potential regulators that could explain the association of rs1131017 with autoimmune diseases. Conclusion Our co-eQTL results highlight the importance of studying gene regulation at the context-specific level to understand the biological implications of genetic variation. With the expected growth of sc-eQTL datasets, our strategy—combined with our technical guidelines—will soon identify many more co-eQTLs, further helping to elucidate unknown disease mechanisms.
83
Citation2
0
Save
25

DNA methylation signatures of aggression and closely related constructs: A meta-analysis of epigenome-wide studies across the lifespan

Jenny Dongen et al.Jul 22, 2020
Abstract DNA methylation profiles of aggressive behavior may capture lifetime cumulative effects of genetic, stochastic, and environmental influences associated with aggression. Here, we report the first large meta-analysis of epigenome-wide association studies (EWAS) of aggressive behavior (N=15,324 participants). In peripheral blood samples of 14,434 participants from 18 cohorts with mean ages ranging from 7 to 68 years, 13 methylation sites were significantly associated with aggression (alpha=1.2×10 −7 ; Bonferroni correction). In cord blood samples of 2,425 children from five cohorts with aggression assessed at mean ages ranging from 4 to 7 years, 83% of these sites showed the same direction of association with childhood aggression ( r =0.74, p=0.006) but no epigenome-wide significant sites were found. Top-sites (48 at a false discovery rate of 5% in the peripherl blood meta-analysis or in a combined meta-analysis of peripheral blood and cord blood) have been associated with chemical exposures, smoking, cognition, metabolic traits, and genetic variation (mQTLs). Three genes whose expression levels were associated with top-sites were previously linked to schizophrenia and general risk tolerance. At six CpGs, DNA methylation variation in blood mirrors variation in the brain. On average 44% (range=3-82%) of the aggression–methylation association was explained by current and former smoking and BMI. These findings point at loci that are sensitive to chemical exposures with potential implications for neuronal functions. We hope these results to be a starting point for studies leading to applications as peripheral biomarkers and to reveal causal relationships with aggression and related traits.
25
Citation2
0
Save
1

Integration of public DNA methylation and expression networks via eQTMs improves prediction of functional gene–gene associations

Shuang� Li et al.Dec 18, 2021
Abstract Gene co-expression networks can be used to infer functional relationships between genes, but they do not work well for all genes. We investigated whether DNA methylation can provide complementary information for such genes. We first carried out an eQTM meta-analysis of 3,574 gene expression and methylation samples from blood, brain and nasal epithelial brushed cells to identify links between methylated CpG sites and genes. This revealed 6,067 significant eQTM genes, and we observed that histone modification information is predictive of both eQTM direction and presence, enabling us to link many CpG sites to genes. We then generated a co-methylation network – MethylationNetwork – using 27,720 publicly available methylation profiles and integrated it with a public RNA-seq co-expression dataset of 31,499 samples. Here, we observed that MethylationNetwork can identify experimentally validated interacting pairs of genes that could not be identified in the RNA-seq datasets. We then developed a novel integration pipeline based on CCA and used the integrated methylation and gene networks to predict gene pairs reported in the STRING database. The integrated network showed significantly improved prediction performance compared to using a DNA co-methylation or a gene co-expression network alone. This is the first study to integrate data from two -omics layers from unmatched public samples across different tissues and diseases, and our results highlight the issues and potential of integrating public datasets from multiple molecular phenotypes. The eQTMs we identified can be used as an annotation resource for epigenome-wide association, and we believe that our integration pipeline can be used as a framework for future -omics integration analyses of public datasets. We provide supporting materials and results, including the harmonized DNA methylation data from multiple tissues and diseases in https://data.harmjanwestra.nl/comethylation/ , the discovered and predicted eQTMs, the corresponding CCA components and the trained prediction models in a Zenodo repository ( https://zenodo.org/record/4666994 ). We provide notebooks to facilitate use of the proposed pipeline in a GitHub repository ( https://github.com/molgenis/methylationnetwork ).
1
Citation1
0
Save
0

Phenome-wide association analysis of LDL-cholesterol lowering genetic variants in PCSK9

Amand Schmidt et al.May 25, 2018
Background: We characterised the phenotypic consequence of genetic variation at the PCSK9 locus and compared findings with recent trials of pharmacological inhibitors of PCSK9. Methods: Published and individual participant level data (300,000+ participants) were combined to construct a weighted PCSK9 gene-centric score (GS). Fourteen randomized placebo controlled PCSK9 inhibitor trials were included, providing data on 79,578 participants. Results were scaled to a one mmol/L lower LDL-C concentration. Results: The PCSK9 GS (comprising 4 SNPs) associations with plasma lipid and apolipoprotein levels were consistent in direction with treatment effects. The GS odds ratio (OR) for myocardial infarction (MI) was 0.53 (95%CI 0.42; 0.68), compared to a PCSK9 inhibitor effect of 0.90 (95%CI 0.86; 0.93). For ischemic stroke ORs were 0.84 (95%CI 0.57; 1.22) for the GS, compared to 0.85 (95%CI 0.78; 0.93) in the drug trials. ORs with type 2 diabetes mellitus (T2DM) were 1.29 (95% CI 1.11; 1.50) for the GS, as compared to 1.00 (95%CI 0.96; 1.04) for incident T2DM in PCSK9 inhibitor trials. No genetic associations were observed for cancer, heart failure, atrial fibrillation, chronic obstructive pulmonary disease, or Alzheimer's disease - outcomes for which large-scale trial data were unavailable. Conclusions: Genetic variation at the PCSK9 locus recapitulates the effects of therapeutic inhibition of PCSK9 on major blood lipid fractions and MI. Apparent discordance between genetic associations and trial outcome for T2DM might be explained lack by a of statistical precision, or differences in the nature and duration of genetic versus pharmacological perturbation of PCSK9.
0

MetaMap: An atlas of metatranscriptomic reads in human disease-related RNA-seq data

Lukas Simon et al.Feb 22, 2018
Background: With the advent of the age of big data in bioinformatics, large volumes of data and high performance computing power enable researchers to perform re-analyses of publicly available datasets at an unprecedented scale. Ever more studies imply the microbiome in both normal human physiology and a wide range of diseases. RNA sequencing technology (RNA-seq) is commonly used to infer global eukaryotic gene expression patterns under defined conditions, including human disease-related contexts, but its generic nature also enables the detection of microbial and viral transcripts. Findings: We developed a bioinformatic pipeline to screen existing human RNA-seq datasets for the presence of microbial and viral reads by re-inspecting the non-human-mapping read fraction. We validated this approach by recapitulating outcomes from 6 independent controlled infection experiments of cell line models and comparison with an alternative metatranscriptomic mapping strategy. We then applied the pipeline to close to 150 terabytes of publicly available raw RNA-seq data from >17,000 samples from >400 studies relevant to human disease using state-of-the-art high performance computing systems. The resulting data of this large-scale re-analysis are made available in the presented MetaMap resource. Conclusions: Our results demonstrate that common human RNA-seq data, including those archived in public repositories, might contain valuable information to correlate microbial and viral detection patterns with diverse diseases. The presented MetaMap database thus provides a rich resource for hypothesis generation towards the role of the microbiome in human disease.
0

Discovering patterns of pleiotropy in genome-wide association studies

Jianan Zhana et al.Feb 28, 2018
Genome-wide association studies have had great success in identifying human genetic variants associated with disease, disease risk factors, and other biomedical phenotypes. Many variants are associated with multiple traits, even after correction for trait-trait correlation. Discovering subsets of variants associated with a shared subset of phenotypes could help reveal disease mechanisms, suggest new therapeutic options, and increase the power to detect additional variants with similar pattern of associations. Here we introduce two methods based on a Bayesian framework, SNP And Pleiotropic PHenotype Organization (SAPPHO), one modeling independent phenotypes (SAPPHO-I) and the other incorporating a full phenotype covariance structure (SAPPHO-C). These two methods learn patterns of pleiotropy from genotype and phenotype data, using identified associations to discover additional associations with shared patterns. The SAPPHO methods, along with other recent approaches for pleiotropic association tests, were assessed using data from the Atherosclerotic Risk in Communities (ARIC) study of 8,000 individuals, whose gold-standard associations were provided by meta-analysis of 40,000 to 100,000 individuals from the CHARGE consortium. Using power to detect gold-standard associations at genome-wide significance (0.05 family-wise error rate) as a metric, SAPPHO performed best. The SAPPHO methods were also uniquely able to select the most significant variants in a parsimonious model, excluding other less likely variants within a linkage disequilibrium block. For meta-analysis, the SAPPHO methods implement summary modes that use sufficient statistics rather than full phenotype and genotype data. Meta-analysis applied to CHARGE detected 16 additional associations to the gold-standard loci, as well as 124 novel loci, at 0.05 false discovery rate. Reasons for the superior performance were explored by performing simulations over a range of scenarios describing different genetic architectures. With SAPPHO we were able to learn genetic structures that were hidden using the traditional univariate tests.