XZ
Xiang Zhou
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
9
(78% Open Access)
Cited by:
353
h-index:
30
/
i10-index:
63
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Sorption of 243Am(III) to Multiwall Carbon Nanotubes

Xiangke Wang et al.Mar 11, 2005
+3
W
C
X
Carbon nanotubes have attracted great interest in multidisciplinary study since their discovery. Herein, radionuclide 243Am(III) sorption to uncapped multiwall carbon nanotubes (MWCNTs) was carried out at 20 ± 2 °C in 0.01 and 0.1 M NaClO4 solutions. Effects of 243Am(III) solution concentration, ionic strength, and pH on 243Am(III) sorption to MWCNTs were also investigated. The sorption is strongly dependent on pH values and weakly dependent on the ionic strength in the experimental conditions. The results show that MWCNTs can adsorb 243Am(III) with extraordinarily high efficiency by forming very stable complexes. Chemisorption or chemicomplexation is the main mechanism of 243Am(III) sorption on the surface of MWCNTs. MWCNTs can be a promising candidate for the preconcentration and solidification of 243Am(III) or its analogue lanthanides and actinides from large volumes of aqueous solution, as required for remediation purposes, and perhaps also as a sorbent for the removal of heavy metal ions from the industry wastewater.
0

Integrating multi-omics data through deep learning for accurate cancer prognosis prediction

Hua Chai et al.Oct 17, 2019
+3
J
Z
H
Abstract Background Genomic information is nowadays widely used for precise cancer treatments. Since the individual type of omics data only represents a single view that suffers from data noise and bias, multiple types of omics data are required for accurate cancer prognosis prediction. However, it is challenging to effectively integrate multi-omics data due to the large number of redundant variables but relatively small sample size. With the recent progress in deep learning techniques, Autoencoder was used to integrate multi-omics data for extracting representative features. Nevertheless, the generated model is fragile from data noises. Additionally, previous studies usually focused on individual cancer types without making comprehensive tests on pan-cancer. Here, we employed the denoising Autoencoder to get a robust representation of the multi-omics data, and then used the learned representative features to estimate patients’ risks. Results By applying to 15 cancers from The Cancer Genome Atlas (TCGA), our method was shown to improve the C-index values over previous methods by 6.5% on average. Considering the difficulty to obtain multi-omics data in practice, we further used only mRNA data to fit the estimated risks by training XGboost models, and found the models could achieve an average C-index value of 0.627. As a case study, the breast cancer prognosis prediction model was independently tested on three datasets from the Gene Expression Omnibus (GEO), and shown able to significantly separate high-risk patients from low-risk ones (C-index>0.6, p-values<0.05). Based on the risk subgroups divided by our method, we identified nine prognostic markers highly associated with breast cancer, among which seven genes have been proved by literature review. Conclusion Our comprehensive tests indicated that we have constructed an accurate and robust framework to integrate multi-omics data for cancer prognosis prediction. Moreover, it is an effective way to discover cancer prognosis-related genes.
9

Graph Convolutional Network-based Method for Clustering Single-cell RNA-seq Data

Yuansong Zeng et al.Sep 3, 2020
+3
Y
X
Y
Abstract Single-cell RNA sequencing (scRNA-seq) technologies promise to characterize the transcriptome of genes at cellular resolution, which shed light on unfolding cell heterogeneity and diversity. Fast-growing scRNA-seq profiles require efficient clustering algorithms to identify the same type of cells. Although many methods have been developed for cell clustering, existing clustering methods are limited to extract the representations from expression data of individual cells, while ignoring the high-order structural relations between cells. Here, we proposed GraphSCC, a robust graph artificial intelligence model to cluster single cells by accounting for structural relations between cells. The representation learned from the graph convolutional network, together with another representation output from a denoising autoencoder network, are optimized by a dual self-supervised module for better cell clustering. The experimental results indicate that GraphSCC model outperforms state-of-the-art methods in terms of various evaluation metrics on both simulated and real datasets. Further visualizations show that GraphSCC provides representations for better intra-cluster compactness and inter-cluster separability.
7

scAdapt: Virtual adversarial domain adaptation network for single cell RNA-seq data classification across platforms and species

Xiang Zhou et al.Jan 19, 2021
+3
H
Y
X
Abstract Motivation In single cell analyses, cell types are conventionally identified based on known marker gene expressions. Such approaches are time-consuming and irreproducible. Therefore, many new supervised methods have been developed to identify cell types for target datasets using the rapid accumulation of public datasets. However, these approaches are sensitive to batch effects or biological variations since the data distributions are different in cross-platforms or species predictions. Results We developed scAdapt, a virtual adversarial domain adaptation network to transfer cell labels between datasets with batch effects. scAdapt used both the labeled source and unlabeled target data to train an enhanced classifier, and aligned the labeled source centroid and pseudo-labeled target centroid to generate a joint embedding. We demonstrate that scAdapt outperforms existing methods for classification in simulated, cross-platforms, cross-species, and spatial transcriptomic datasets. Further quantitative evaluations and visualizations for the aligned embeddings confirm the superiority in cell mixing and preserving discriminative cluster structure present in the original datasets. Availability https://github.com/zhoux85/scAdapt . Contact angyd25@mail.sysu.edu.cn or luojinx5@mail.sysu.edu.cn
10

A Robust and Scalable Graph Neural Network for Accurate Single Cell Classification

Yuansong Zeng et al.Jun 25, 2021
+2
Z
X
Y
ABSTRACT Motivation Single-cell RNA sequencing (scRNA-seq) techniques provide high-resolution data on cellular heterogeneity in diverse tissues, and a critical step for the data analysis is cell type identification. Traditional methods usually cluster the cells and manually identify cell clusters through marker genes, which is time-consuming and subjective. With the launch of several large-scale single-cell projects, millions of sequenced cells have been annotated and it is promising to transfer labels from the annotated datasets to newly generated datasets. One powerful way for the transferring is to learn cell relations through the graph neural network (GNN), while vanilla GNN is difficult to process millions of cells due to the expensive costs of the message-passing procedure at each training epoch. Results Here, we have developed a robust and scalable GNN-based method for accurate single cell classification (GraphCS), where the graph is constructed to connect similar cells within and between labelled and unlabelled scRNA-seq datasets for propagation of shared information. To overcome the slow information propagation of GNN at each training epoch, the diffused information is pre-calculated via the approximate Generalized PageRank algorithm, enabling sublinear complexity for a high speed and scalability on millions of cells. Compared with existing methods, GraphCS demonstrates better performance on simulated, cross-platform, and cross-species scRNA-seq datasets. More importantly, our model can achieve superior performance on a large dataset with one million cells within 50 minutes.
0

Furfural tolerance of mutant Saccharomyces cerevisiae selected via ionizing radiation combined with adaptive laboratory evolution

Junle Ren et al.Aug 22, 2024
+8
X
M
J
Lignocellulose is a renewable and sustainable resource used to produce second-generation biofuel ethanol to cope with the resource and energy crisis. Furfural is the most toxic inhibitor of Saccharomyces cerevisiae cells produced during lignocellulose treatment, and can reduce the ability of S. cerevisiae to utilize lignocellulose, resulting in low bioethanol yield. In this study, multiple rounds of progressive ionizing radiation was combined with adaptive laboratory evolution to improve the furfural tolerance of S. cerevisiae and increase the yield of ethanol. In this study, the strategy of multiple rounds of progressive X-ray radiation combined with adaptive laboratory evolution significantly improved the furfural tolerance of brewing yeast. After four rounds of experiments, four mutant strains resistant to high concentrations of furfural were obtained (SCF-R1, SCF-R2, SCF-R3, and SCF-R4), with furfural tolerance concentrations of 4.0, 4.2, 4.4, and 4.5 g/L, respectively. Among them, the mutant strain SCF-R4 obtained in the fourth round of radiation had a cellular malondialdehyde content of 49.11 nmol/mg after 3 h of furfural stress, a weakening trend in mitochondrial membrane potential collapse, a decrease in accumulated reactive oxygen species, and a cell death rate of 12.60%, showing better cell membrane integrity, stable mitochondrial function, and an improved ability to limit reactive oxygen species production compared to the other mutant strains and the wild-type strain. In a fermentation medium containing 3.5 g/L furfural, the growth lag phase of the SCF-R4 mutant strain was shortened, and its growth ability significantly improved. After 96 h of fermentation, the ethanol production of the mutant strain SCF-R4 was 1.86 times that of the wild-type, indicating that with an increase in the number of irradiation rounds, the furfural tolerance of the mutant strain SCF-R4 was effectively enhanced. In addition, through genome-transcriptome analysis, potential sites related to furfural detoxification were identified, including GAL7, MAE1, PDC6, HXT1, AUS1, and TPK3. These results indicate that multiple rounds of progressive X-ray radiation combined with adaptive laboratory evolution is an effective mutagenic strategy for obtaining furfural-tolerant mutants and that it has the potential to tap genes related to the furfural detoxification mechanism.
0
Citation1
0
Save
15

Imputing missing RNA-seq data from DNA methylation by using transfer learning based neural network

Xiang Zhou et al.Oct 13, 2019
+2
C
H
X
Abstract Background Gene expression plays a key intermediate role in linking molecular features at DNA level and phenotype. However, due to various limitations in experiments, the RNA-seq data is missing in many samples while there exists high-quality of DNA methylation data. As DNA methylation is an important epigenetic modification to regulate gene expression, it can be used to predict RNA-seq data. For this purpose, many methods have been developed. A common limitation of these methods is that they mainly focus on single cancer dataset, and do not fully utilize information from large pan-cancer dataset. Results Here, we have developed a novel method to impute missing gene expression data from DNA methylation data through transfer learning-based neural network, namely TDimpute. In the method, the pan-cancer dataset from The Cancer Genome Atlas (TCGA) was utilized for training a general model, which was then fine-tuned on the specific cancer dataset. By testing on 16 cancer datasets, we found that our method significantly outperforms other state-of-the-art methods in imputation accuracy with 7%-11% increase under different missing rates. The imputed gene expression was further proved to be useful for downstream analyses, including the identification of both methylation-driving and prognosis-related genes, clustering analysis, and survival analysis on the TCGA dataset. More importantly, our method was indicated to be useful for general purpose by the independent test on the Wilms tumor dataset from the Therapeutically Applicable Research To Generate Effective Treatments (TARGET) project. Conclusions TDimpute is an effective method for RNA-seq imputation with limited training samples.
0

Imputing Single-cell RNA-seq data by combining Graph Convolution and Autoencoder Neural Networks

Jiahua Rao et al.Feb 5, 2020
+2
Y
X
J
Single-cell RNA sequencing technology promotes the profiling of single-cell transcriptomes at an unprecedented throughput and resolution. However, in scRNA-seq studies, only a low amount of sequenced mRNA in each cell leads to missing detection for a portion of mRNA molecules, i.e. the dropout problem. The dropout event hinders various downstream analysis, such as clustering analysis, differential expression analysis, and inference of gene-to-gene relationships. Therefore, it is necessary to develop robust and effective imputation methods for the increasing scRNA-seq data. In this study, we have developed an imputation method (GraphSCI) to impute the dropout events in scRNA-seq data based on the graph convolution networks. The method takes advantage of low-dimensional representations of similar cells and gene-gene interactions to impute the dropouts. Ex-tensive experiments demonstrated that GraphSCI outperforms other state-of-the-art methods for im-putation on both simulated and real scRNA-seq data. Meanwhile, GraphSCI is able to accurately infer gene-to-gene relationships by utilizing the imputed matrix that are concealed by dropout events in raw data.
0

Integration of food raw materials, food microbiology, and food additives: systematic research and comprehensive insights into sweet sorghum juice, Clostridium tyrobutyricum TGL-A236 and bio-butyric acid

Mei-Han Liu et al.May 30, 2024
+12
M
X
M
Introduction Sweet sorghum juice is a typical production feedstock for natural, eco-friendly sweeteners and beverages. Clostridium tyrobutyricum is one of the widely used microorganisms in the food industry, and its principal product, bio-butyric acid is an important food additive. There are no published reports of Clostridium tyrobutyricum producing butyric acid using SSJ as the sole substrate without adding exogenous substances, which could reach a food-additive grade. This study focuses on tailoring a cost-effective, safe, and sustainable process and strategy for their production and application. Methods This study modeled the enzymolysis of non-reducing sugars via the first/second-order kinetics and added food-grade diatomite to the hydrolysate. Qualitative and quantitative analysis were performed using high-performance liquid chromatography, gas chromatography-mass spectrometer, full-scale laser diffraction method, ultra-performance liquid chromatography–tandem mass spectrometry, the cell double-staining assay, transmission electron microscopy, and Oxford nanopore technology sequencing. Quantitative real-time polymerase chain reaction, pathway and process enrichment analysis, and homology modeling were conducted for mutant genes. Results The treated sweet sorghum juice showed promising results, containing 70.60 g/L glucose and 63.09 g/L fructose, with a sucrose hydrolysis rate of 98.29% and a minimal sucrose loss rate of 0.87%. Furthermore, 99.62% of the colloidal particles and 82.13% of the starch particles were removed, and the concentrations of hazardous substances were effectively reduced. A food microorganism Clostridium tyrobutyricum TGL-A236 with deep utilization value was developed, which showed superior performance by converting 30.65% glucose and 37.22% fructose to 24.1364 g/L bio-butyric acid in a treated sweet sorghum juice (1:1 dilution) fermentation broth. This titer was 2.12 times higher than that of the original strain, with a butyric acid selectivity of 86.36%. Finally, the Genome atlas view, Gene Ontology (GO), Kyoto Encyclopedia of Genes and Genomes (KEGG), and evolutionary genealogy of genes: Non-supervised Orthologous (eggNOG) functional annotations, three-dimensional structure and protein cavity prediction of five non-synonymous variant genes were obtained. Conclusion This study not only includes a systematic process flow and in-depth elucidation of relevant mechanisms but also provides a new strategy for green processing of food raw materials, improving food microbial performance, and ensuring the safe production of food additives.