XZ
Xiaoqi Zheng
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
6
(83% Open Access)
Cited by:
0
h-index:
27
/
i10-index:
53
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

BS-clock, advancing epigenetic age prediction with high-resolution DNA methylation bisulfite sequencing data

Congcong Hu et al.Nov 2, 2024
Abstract Motivation DNA methylation patterns provide precise and accurate estimates of biological age due to their robustness and predictable changes associated with aging processes. Although several methylation aging clocks have been developed in recent years, they are primarily designed for DNA methylation array data, which has limited CpG coverage and detection sensitivity compared to bisulfite sequencing data. Results Here, we present BS-clock, a novel DNA methylation clock for human aging based on bisulfite sequencing data. Using BS-seq data from 529 samples retrieved from four tissues, our BS-clock achieves higher correlations with chronological age in multiple tissue types compared to existing array-based clocks. Our study revealed age-dependent aging rates across different age stages and disease conditions, and overall low cross-tissue prediction capability by applying the model trained on one tissue type to others. In summary, BS-clock overcomes limitations of array-based techniques, offering genome-wide CpG site coverage and more robust and accurate aging quantification. This research paves the way for advanced epigenetic studies of aging and holds promise for developing targeted interventions to promote healthy aging. Availability and Implementation All analysis codes for reproducing the results of the study are publicly available at https://github.com/hucongcong97/BS-clock. Supplementary information Supplementary data are available at Bioinformatics online.
11

Spider: a flexible and unified framework for simulating spatial transcriptomics data

Jun Yang et al.May 22, 2023
Abstract Spatial transcriptomics technology provides a valuable view for studying cellular heterogeneity due to its ability to simultaneously acquire gene expression profile and cell location information. However, benchmarking these rapidly accumulating spatial transcriptomics analysis tools is challenging owing to the limited diversity and accuracy of “gold standard” data sets annotated by pathologists. To address this issue, we proposed Spider, a flexible and unified simulator for spatial transcriptomics data guided by cell type proportion and transition matrix of adjacent cell types. Taking advantage of a heuristic batched simulated annealing algorithm (BSA) in assigning simulated cell type labels, Spider can generate spatial transcriptomics data for one million cells in just five minutes. Furthermore, Spider can generate various types of spatial transcriptomics data, including immune hot/cold tumor samples by specifying different immune cell proportions and transition matrices and layered tissue samples via an interactive interface. In addition, Spider is also a unified framework for ST data simulation in which we have implemented diverse simulators proposed by other researchers as special cases. We have systematically evaluated the performance of Spider and competing tools, and demonstrated Spider’s remarkable power to capture the spatial pattern of the reference dataset. Spider is available at https://github.com/YANG-ERA/Artist .
0

STCC: consensus clustering enhances spatial domain detection for spatial transcriptomics data

Congcong Hu et al.Feb 28, 2024
Abstract The rapid advance of spatially resolved transcriptomics technologies has yielded substantial spatial transcriptomics data. Deriving biological insights from these data poses non-trivial computational and analysis challenges, of which the most fundamental step is spatial domain detection (or spatial clustering). Although a number of tools for spatial domain detection have been proposed in recent years, their performance varies across datasets and experimental platforms. It is thus an important task to take full advantage of different tools to get a more accurate and stable result through consensus strategy. In this work, we developed STCC, a novel consensus clustering framework for spatial transcriptomics data that aggregates outcomes from state-of-the-art tools using a variety of consensus strategies, including Onehot-based, Average-based, Hypergraph-based and wNMF-based methods. Comprehensive assessments on simulated and real data from distinct experimental platforms show that consensus clustering significantly improves clustering accuracy over individual methods under varied input parameters. For normal tissue samples exhibiting clear layered structure, consensus clustering by integrating multiple baseline methods leads to improved results. Conversely, when analyzing tumor samples that display scattered cell type distribution patterns, integration of a single baseline method yields satisfactory performance. For consensus strategies, Average-based and Hypergraph-based approaches demonstrated optimal precision and stability. Overall, STCC provides a scalable and practical solution for spatial domain detection in spatial transcriptomic data, laying a solid foundation for future research and applications in spatial transcriptomics.
3

CellPatch: a Highly Efficient Foundation Model for Single-Cell Transcriptomics with Heuristic Patching

Hua‐Jun Wu et al.Nov 17, 2024
The rapid advancement of foundation models has significantly enhanced the analysis of single-cell omics data, enabling researchers to gain deeper insights into the complex interactions between cells and genes across diverse tissues. However, existing foundation models often exhibit excessive complexity, hindering their practical utility for downstream tasks. Here, we present CellPatch, a lightweight foundation model that leverages the strengths of the cross-attention mechanism and patch tokenization to reduce model complexity while extracting efficient biological representations. Comprehensive evaluations conducted on single-cell RNA-sequencing datasets across multiple organs and tissue states demonstrate that CellPatch achieves state-of-the-art performance in downstream analytical tasks while maintaining ultra-low computational costs during both pretraining and finetuning phases. Moreover, the flexibility and scalability of CellPatch allow it to serve as a general framework that can be incorporated with other well established single-cell analysis software, thereby enhancing their performance through transfer learning on diverse downstream tasks.