ZY
Zhengmin Yu
Author with expertise in RNA Methylation and Modification in Gene Expression
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
3
(100% Open Access)
Cited by:
5
h-index:
4
/
i10-index:
1
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

sc2GWAS: a comprehensive platform linking single cell and GWAS traits of human

Mingxue Yin et al.Nov 20, 2024
Abstract Identifying cell populations associated with risk variants is essential for uncovering cell-specific mechanisms that drive disease development and progression. Integrating genome-wide association studies (GWAS) with single-cell RNA sequencing (scRNA-seq) has become an effective strategy for detecting trait–cell relationships. The accumulation of trait-related single cell data has led to an urgent need for its comprehensively processing. To address this, we developed sc2GWAS (https://bio.liclab.net/sc2GWAS/), which aims to document large-scale GWAS trait–cell regulatory pairs at single-cell resolution and provide comprehensive annotations and enrichment analyses for these related pairs. The current version of sc2GWAS curates a total of 15 078 310 candidate trait–cell pairs from &gt; 6 300 000 individual cells, offering a valuable resource for exploring complex regulatory relationships between traits and cells. We applied strict quality control measures on both scRNA-seq data and GWAS data, ensuring the reliability and accuracy of the datasets for the identification of trait-relevant cells and genes. In addition, sc2GWAS provides ranked lists of trait-relevant genes and extensive (epi) genetic annotations, making it a valuable resource for downstream analyses. We demonstrate the utility of the platform by investigating Alzheimer’s disease, where we identified significant associations between the disease and microglial cells, with the APOE gene emerging as particularly significant. This platform facilitates detailed research into complex trait–cell and trait–gene interactions, we anticipate that sc2GWAS will become a comprehensive and valuable platform for exploring GWAS trait–cell regulatory mechanisms.
0
Citation3
0
Save
0

FunlncModel: integrating multi-omic features from upstream and downstream regulatory networks into a machine learning framework to identify functional lncRNAs

Yanyu Li et al.Nov 22, 2024
Abstract Accumulating evidence indicates that long noncoding RNAs (lncRNAs) play important roles in molecular and cellular biology. Although many algorithms have been developed to reveal their associations with complex diseases by using downstream targets, the upstream (epi)genetic regulatory information has not been sufficiently leveraged to predict the function of lncRNAs in various biological processes. Therefore, we present FunlncModel, a machine learning–based interpretable computational framework, which aims to screen out functional lncRNAs by integrating a large number of (epi)genetic features and functional genomic features from their upstream/downstream multi-omic regulatory networks. We adopted the random forest method to mine nearly 60 features in three categories from &gt;2000 datasets across 11 data types, including transcription factors (TFs), histone modifications, typical enhancers, super-enhancers, methylation sites, and mRNAs. FunlncModel outperformed alternative methods for classification performance in human embryonic stem cell (hESC) (0.95 Area Under Curve (AUROC) and 0.97 Area Under the Precision-Recall Curve (AUPRC)). It could not only infer the most known lncRNAs that influence the states of stem cells, but also discover novel high-confidence functional lncRNAs. We extensively validated FunlncModel’s efficacy by up to 27 cancer-related functional prediction tasks, which involved multiple cancer cell growth processes and cancer hallmarks. Meanwhile, we have also found that (epi)genetic regulatory features, such as TFs and histone modifications, serve as strong predictors for revealing the function of lncRNAs. Overall, FunlncModel is a strong and stable prediction model for identifying functional lncRNAs in specific cellular contexts. FunlncModel is available as a web server at https://bio.liclab.net/FunlncModel/.