XZ
Xiaomeng Zhang
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
14
(64% Open Access)
Cited by:
2,004
h-index:
35
/
i10-index:
83
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Two distinct interstitial macrophage populations coexist across tissues in specific subtissular niches

Svetoslav Chakarov et al.Mar 14, 2019
+28
L
H
S
Macrophages are a heterogeneous cell population involved in tissue homeostasis, inflammation, and various pathologies. Although the major tissue-resident macrophage populations have been extensively studied, interstitial macrophages (IMs) residing within the tissue parenchyma remain poorly defined. Here we studied IMs from murine lung, fat, heart, and dermis. We identified two independent IM subpopulations that are conserved across tissues: Lyve1loMHCIIhiCX3CR1hi (Lyve1loMHCIIhi) and Lyve1hiMHCIIloCX3CR1lo (Lyve1hiMHCIIlo) monocyte-derived IMs, with distinct gene expression profiles, phenotypes, functions, and localizations. Using a new mouse model of inducible macrophage depletion (Slco2b1flox/DTR), we found that the absence of Lyve1hiMHCIIlo IMs exacerbated experimental lung fibrosis. Thus, we demonstrate that two independent populations of IMs coexist across tissues and exhibit conserved niche-dependent functional programming.
0
Citation791
0
Save
0

A benchmark of batch-effect correction methods for single-cell RNA sequencing data

Hoa Tran et al.Jan 16, 2020
+4
M
K
H
Abstract Background Large-scale single-cell transcriptomic datasets generated using different technologies contain batch-specific systematic variations that present a challenge to batch-effect removal and data integration. With continued growth expected in scRNA-seq data, achieving effective batch integration with available computational resources is crucial. Here, we perform an in-depth benchmark study on available batch correction methods to determine the most suitable method for batch-effect removal. Results We compare 14 methods in terms of computational runtime, the ability to handle large datasets, and batch-effect correction efficacy while preserving cell type purity. Five scenarios are designed for the study: identical cell types with different technologies, non-identical cell types, multiple batches, big data, and simulated data. Performance is evaluated using four benchmarking metrics including kBET, LISI, ASW, and ARI. We also investigate the use of batch-corrected data to study differential gene expression. Conclusion Based on our results, Harmony, LIGER, and Seurat 3 are the recommended methods for batch integration. Due to its significantly shorter runtime, Harmony is recommended as the first method to try, with the other methods as viable alternatives.
0

Up-Regulation of TWIST in Prostate Cancer and Its Implication as a Therapeutic Target

Wai Kwok et al.Jun 15, 2005
+9
M
Y
W
Androgen-independent metastatic prostate cancer is the main obstacle in the treatment of this cancer. Unlike a majority of solid cancers, prostate cancer usually shows poor response to chemotherapeutic drugs. In this study, we have shown a potential novel target, TWIST, a highly conserved bHLH transcription factor, in the treatment of prostate cancer. Using malignant and nonmalignant prostate tissues, we found that TWIST expression was highly expressed in the majority (90%) of prostate cancer tissues but only in a small percentage (6.7%) of benign prostate hyperplasia. In addition, the TWIST expression levels were positively correlated with Gleason grading and metastasis, indicating its role in the development and progression of prostate cancer. Furthermore, down-regulation of TWIST through small interfering RNA in androgen-independent prostate cancer cell lines, DU145 and PC3, resulted in increased sensitivity to the anticancer drug taxol-induced cell death which was associated with decreased Bcl/Bax ratio, leading to activation of the apoptosis pathway. More importantly, inactivation of TWIST suppressed migration and invasion abilities of androgen-independent prostate cancer cells, which was correlated with induction of E-cadherin expression as well as morphologic and molecular changes associated with mesenchymal to epithelial transition. These results were further confirmed on the androgen-dependent LNCaP cells ectopically expressing the TWIST protein. Our results have identified TWIST as a critical regulator of prostate cancer cell growth and suggest a potential therapeutic approach to inhibit the growth and metastasis of androgen-independent prostate cancer through inactivation of the TWIST gene.
0
Citation455
0
Save
6

Relating enhancer genetic variation across mammals to complex phenotypes using machine learning

Irene Kaplow et al.Aug 26, 2022
+9
D
A
I
Abstract Protein-coding differences between mammals often fail to explain phenotypic diversity, suggesting involvement of enhancers, often rapidly evolving regions that regulate gene expression. Identifying associations between enhancers and phenotypes is challenging because enhancer activity is context-dependent and may be conserved without much sequence conservation. We developed TACIT (Tissue-Aware Conservation Inference Toolkit) to associate open chromatin regions (OCRs) with phenotypes using predictions in hundreds of mammalian genomes from machine learning models trained to learn tissue-specific regulatory codes. Applying TACIT for motor cortex and parvalbumin-positive interneurons to neurological phenotypes revealed dozens of new OCR-phenotype associations. Many associated OCRs were near relevant genes, including brain size-associated OCRs near genes mutated in microcephaly or macrocephaly. Our work creates a forward genomics foundation for identifying candidate enhancers associated with phenotype evolution. One Sentence Summary A new machine learning-based approach associates enhancers with the evolution of brain size and behavior across mammals.
6
Citation6
0
Save
0

TAZ-CAMTA1 and YAP-TFE3 modulate the basal TAZ/YAP transcriptional program by recruiting the ATAC histone acetyltransferase complex

Nicole Merritt et al.Sep 8, 2020
+10
D
K
N
Abstract Epithelioid hemangioendothelioma (EHE) is a vascular sarcoma that metastasizes early and lacks an effective medical therapy. The TAZ-CAMTA1 and YAP-TFE3 fusion proteins are chimeric transcription factors and initiating oncogenic drivers of EHE. A combined proteomic/genetic screen identified YEATS2 and ZZZ3, components of the A da 2a - c ontaining histone acetyltransferase (ATAC) complex, as key interactors of both TAZ-CAMTA1 and YAP-TFE3 despite the dissimilarity of the C terminal fusion partners CAMTA1 and TFE3. An integrative next generation sequencing approach showed the fusion proteins drive expression of a unique transcriptome distinct from TAZ and YAP by simultaneously hyperactivating a TEAD-based transcriptional program and modulating the chromatin environment via interaction with the ATAC complex. Interaction of the ATAC complex with both TAZ-CAMTA1 and YAP-TFE3 indicates the histone acetyltransferase complex is an oncogenic driver in EHE and potentially other sarcomas. Furthermore, the ATAC complex is an enzymatic transcriptional cofactor required for both fusion proteins in EHE, representing a unifying therapeutic target for this sarcoma. Gene fusions are the most common genetic alterations activating TAZ and YAP in cancer, and this study serves as a template for identifying epigenetic modifiers recruited by the C terminal fusion partners of other TAZ/YAP gene fusions occurring in gliomas, carcinomas, and other sarcomas. Summary TAZ-CAMTA1 and YAP-TFE3 alter the TAZ/YAP transcriptional program by recruiting the ATAC complex and modifying the chromatin landscape.
0
Citation1
0
Save
0

Elucidation of the influencing mechanism of SO3 on mercury oxidation over MnO2-based catalyst: A combined experimental and theoretical study

Shibo Zhang et al.Aug 6, 2024
+4
J
X
S
1

FastIntegration: a versatile R package for accessing and integrating large-scale single-cell RNA-seq data

Mengwei Li et al.May 11, 2022
J
K
X
M
Abstract Constructing atlas-scale comprehensive cell maps from publicly available data enables extensive data mining to achieve novel biological insights. Data integration to construct such maps require both harmonized datasets and an atlas-scale capable data integration tool. The first requirement is met by DISCO, a comprehensive repository of harmonized publicly available single cell data with standardized annotation. To meet the second requirement, the tool must have the capacity to integrate hundreds if not thousands of samples within an acceptable time frame. Moreover, it should output batch-corrected gene expression values to facilitate downstream analyses. Here, we present FastIntegration, a package which allows users to access and integrate public data in a convenient way. FastIntegration provides a fast and high-capacity version of Seurat Integration which can integrate more than 4 million cells within 2 days. It outputs batch corrected values for all genes that we can use for downstream analyses. For the first time, we demonstrated that using batch corrected values can improve the performance of downstream analyses. In particular, we found more accurately identified differentially expressed genes for cell types that are not shared between batches. Moreover, we also showed that FastIntegration outperforms existing methods for both homogeneous and heterogeneous data integration. FastIntegration also provides an API for programmatic access to data hosted on DISCO, a single-cell RNA-seq database that contains more than 5200 single-cell datasets. Users can filter for data at the sample level by tissue, disease and platform etc., and at cell level by specifying the expressed and unexpressed genes.
0

A Monte Carlo method for in silico modeling and visualization of Waddington's epigenetic landscape with intermediate details

Xiaomeng Zhang et al.Apr 29, 2018
J
K
X
Waddington's epigenetic landscape is a classic metaphor for describing the cellular dynamics during the development modulated by gene regulation. Quantifying Waddington's epigenetic landscape by mathematical modeling would be useful for understanding the mechanisms of cell fate determination. A few computational methods have been proposed for quantitative modeling of landscape; however, to model and visualize the landscape of a high dimensional gene regulatory system with realistic details is still challenging. Here, we propose a Monte Carlo method for modeling the Waddington's epigenetic landscape of a gene regulatory network (GRN). The method estimates the probability distribution of cellular states by collecting a large number of time-course simulations with random initial conditions. By projecting all the trajectories into a 2-dimensional plane of dimension i and j, we can approximately calculate the quasi-potential U(x^i, x^j) = -ln P(x^i, x^j), where P(x^i, x^j ) is the estimated probability of an equilibrium steady state or a non-equilibrium state. A state with locally maximal probability corresponds to a locally minimal potential and such a state is called an attractor. Compared to the state-of-the-art methods, our Monte Carlo method can quantify the global potential landscape of GRN for a high dimensional system. The same topography of landscape can be produced from deterministic or stochastic time-course simulations. The potential landscapes show that not only attractors represent stability, but the paths between attractors are also part of the stability or robustness of biological systems. We demonstrate the novelty and reliability of our method by plotting the potential landscapes of a few published models of GRN. Besides GRN-driven landscapes of cellular dynamics, the algorithm proposed can also be applied to studies of global dynamics of other dynamical systems.
0

MCLand: A Python program for drawing emerging shapes of Waddington’s epigenetic landscape by Monte Carlo simulations

Ket Chong et al.Jan 17, 2024
J
L
X
K
Abstract Waddington’s epigenetic landscape is a powerful metaphor for illustrating the process of cell differentiation. Recently, it has been used to model cancer progression and stem cell reprogramming. User-friendly software for landscape quantification and visualization is needed to allow more modeling researchers to benefit from this theory. Results We present MCLand, a Python program for plotting Waddington’s epigenetic landscape with a user-friendly graphical user interface. It models gene regulatory network (GRN) in ordinary differential equations (ODEs), and uses a Monte Carlo method to estimate the probability distribution of cell states from simulated time-course trajectories to quantify the landscape. Monte Carlo method has been tested on a few GRN models with biologically meaningful results. MCLand shows better intermediate details of kinetic path in Waddington’s landscape compared to the state-of-the-art software Netland. Availability and implementation The source code and user manual of MCLand can be downloaded from https://mcland-ntu.github.io/MCLand/index.html .
8

From comparative gene content and gene order to ancestral contigs, chromosomes and karyotypes

Qiaoji Xu et al.Sep 30, 2022
+3
C
L
Q
Abstract To reconstruct the ancestral genome of a set of phylogenetically related descendant species, we use the Raccroche pipeline for organizing a large number of generalized gene adjacencies into contigs and then into chromosomes. Separate reconstructions are carried out for each ancestral node of the phylogenetic tree for focal taxa. The ancestral reconstructions are monoploids; they each contain at most one member of each gene family constructed from descendants, ordered along the chromosomes. We design and implement a new computational technique for solving the problem of estimating the ancestral monoploid number of chromosomes x . This involves a “ g -mer” analysis to resolve a bias due long contigs, and gap statistics to estimate x . We find that the monoploid number of all the rosid and asterid orders is x = 9 . We show that this is not an artifact of our method by deriving x ≈ 20 for the metazoan ancestor.
Load More