ZZ
Zhongming Zhao
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
The University of Texas Health Science Center at Houston, Vanderbilt University Medical Center, The University of Texas MD Anderson Cancer Center
+ 9 more
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
17
(71% Open Access)
Cited by:
871
h-index:
76
/
i10-index:
368
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
2

Genomic and Molecular Landscape of DNA Damage Repair Deficiency across The Cancer Genome Atlas

Mark Rubin et al.Nov 20, 2020
+753
N
M
M

Summary

 DNA damage repair (DDR) pathways modulate cancer risk, progression, and therapeutic response. We systematically analyzed somatic alterations to provide a comprehensive view of DDR deficiency across 33 cancer types. Mutations with accompanying loss of heterozygosity were observed in over 1/3 of DDR genes, including TP53 and BRCA1/2. Other prevalent alterations included epigenetic silencing of the direct repair genes EXO5MGMT, and ALKBH3 in ∼20% of samples. Homologous recombination deficiency (HRD) was present at varying frequency in many cancer types, most notably ovarian cancer. However, in contrast to ovarian cancer, HRD was associated with worse outcomes in several other cancers. Protein structure-based analyses allowed us to predict functional consequences of rare, recurrent DDR mutations. A new machine-learning-based classifier developed from gene expression data allowed us to identify alterations that phenocopy deleterious TP53 mutations. These frequent DDR gene alterations in many human cancers have functional consequences that may determine cancer progression and guide therapy.
2
Citation852
0
Save
16

Association of CXCR6 with COVID-19 severity: Delineating the host genetic factors in transcriptomic regulation

Yulin Dai et al.Oct 24, 2023
+3
H
J
Y
Abstract Background The coronavirus disease 2019 (COVID-19) is an infectious disease that mainly affects the host respiratory system with ∼80% asymptomatic or mild cases and ∼5% severe cases. Recent genome-wide association studies (GWAS) have identified several genetic loci associated with the severe COVID-19 symptoms. Delineating the genetic variants and genes is important for better understanding its biological mechanisms. Methods We implemented integrative approaches, including transcriptome-wide association studies (TWAS), colocalization analysis and functional element prediction analysis, to interpret the genetic risks using two independent GWAS datasets in lung and immune cells. To understand the context-specific molecular alteration, we further performed deep learning-based single cell transcriptomic analyses on a bronchoalveolar lavage fluid (BALF) dataset from moderate and severe COVID-19 patients. Results We discovered and replicated the genetically regulated expression of CXCR6 and CCR9 genes. These two genes have a protective effect on the lung and a risk effect on whole blood, respectively. The colocalization analysis of GWAS and cis -expression quantitative trait loci highlighted the regulatory effect on CXCR6 expression in lung and immune cells. In the lung resident memory CD8 + T (T RM ) cells, we found a 3.32-fold decrease of cell proportion and lower expression of CXCR6 in the severe than moderate patients using the BALF transcriptomic dataset. Pro-inflammatory transcriptional programs were highlighted in T RM cells trajectory from moderate to severe patients. Conclusions CXCR6 from the 3p21 . 31 locus is associated with severe COVID-19. CXCR6 tends to have a lower expression in lung T RM cells of severe patients, which aligns with the protective effect of CXCR6 from TWAS analysis. We illustrate one potential mechanism of host genetic factor impacting the severity of COVID-19 through regulating the expression of CXCR6 and T RM cell proportion and stability. Our results shed light on potential therapeutic targets for severe COVID-19.
1

Enabling the clinical application of artificial intelligence in genomics: a perspective of the AMIA Genomics and Translational Bioinformatics Workgroup

Nephi Walton et al.Jan 7, 2024
+18
C
R
N
Abstract Objective Given the importance AI in genomics and its potential impact on human health, the American Medical Informatics Association—Genomics and Translational Biomedical Informatics (GenTBI) Workgroup developed this assessment of factors that can further enable the clinical application of AI in this space. Process A list of relevant factors was developed through GenTBI workgroup discussions in multiple in-person and online meetings, along with review of pertinent publications. This list was then summarized and reviewed to achieve consensus among the group members. Conclusions Substantial informatics research and development are needed to fully realize the clinical potential of such technologies. The development of larger datasets is crucial to emulating the success AI is achieving in other domains. It is important that AI methods do not exacerbate existing socio-economic, racial, and ethnic disparities. Genomic data standards are critical to effectively scale such technologies across institutions. With so much uncertainty, complexity and novelty in genomics and medicine, and with an evolving regulatory environment, the current focus should be on using these technologies in an interface with clinicians that emphasizes the value each brings to clinical decision-making.
1
Citation4
0
Save
0

INSCT: Integrating millions of single cells using batch-aware triplet neural networks

Lukas Simon et al.May 30, 2024
Z
Y
L
Abstract Efficient integration of heterogeneous and increasingly large single cell RNA sequencing (scRNA-seq) data poses a major challenge for analysis and in particular, comprehensive atlasing efforts. Here, we developed a novel deep learning algorithm to overcome batch effects using batch-aware triplet neural networks, called INSCT (“Insight”). Using simulated and real data, we demonstrate that INSCT generates an embedding space which accurately integrates cells across experiments, platforms and species. Our benchmark comparisons with current state-of-the-art scRNA-seq integration methods revealed that INSCT outperforms competing methods in scalability while achieving comparable accuracies. Moreover, using INSCT in semi-supervised mode enables users to classify unlabeled cells by projecting them into a reference collection of annotated cells. To demonstrate scalability, we applied INSCT to integrate more than 2.6 million transcriptomes from four independent studies of mouse brains in less than 1.5 hours using less than 25 gigabytes of memory. This feature empowers researchers to perform atlasing scale data integration in a typical desktop computer environment. INSCT is freely available at https://github.com/lkmklsmn/insct . Highlights INSCT accurately integrates multiple scRNA-seq datasets INSCT accurately predicts cell types for an independent scRNA-seq dataset Efficient deep learning framework enables integration of millions of cells on a personal computer
0
Citation4
0
Save
7

deCS: A Tool for Systematic Cell Type Annotations of Single-cell RNA Sequencing Data among Human Tissues

Guangsheng Pei et al.Oct 24, 2023
+3
L
F
G
Abstract Single-cell RNA sequencing (scRNA-seq) is revolutionizing the study of complex and dynamic cellular mechanisms. However, cell-type annotation remains a main challenge as it largely relies on a priori knowledge and manual curation, which is cumbersome and less accurate. The increasing number of scRNA-seq data sets, as well as numerous published genetic studies, motivated us to build a comprehensive human cell type reference atlas. Here, we present deCS ( de coding C ell type- S pecificity), an automatic cell type annotation method augmented by a comprehensive collection of human cell type expression profiles and marker genes. We used deCS to annotate scRNA-seq data from various tissue types and systematically evaluated the annotation accuracy under different conditions, including reference panels, sequencing depth and feature selection strategies. Our results demonstrated that expanding the references is critical for improving annotation accuracy. Compared to many existing state-of-the-art annotation tools, deCS significantly reduced computation time and increased accuracy. deCS can be integrated into the standard scRNA-seq analytical pipeline to enhance cell type annotation. Finally, we demonstrated the broad utility of deCS to identify trait-cell type associations in 51 human complex traits, providing deeper insights into the cellular mechanisms of disease pathogenesis. All documents, including source code, user manual, demo data, and tutorials, are freely available at https://github.com/bsml320/deCS .
7
Citation2
0
Save
1

Single-cell multiomics decodes regulatory programs for mouse secondary palate development

Fangfang Yan et al.Feb 23, 2024
+7
C
A
F
Perturbations in gene regulation during palatogenesis can lead to cleft palate, which is among the most common congenital birth defects. Here, we perform single-cell multiome sequencing and profile chromatin accessibility and gene expression simultaneously within the same cells (n = 36,154) isolated from mouse secondary palate across embryonic days (E) 12.5, E13.5, E14.0, and E14.5. We construct five trajectories representing continuous differentiation of cranial neural crest-derived multipotent cells into distinct lineages. By linking open chromatin signals to gene expression changes, we characterize the underlying lineage-determining transcription factors. In silico perturbation analysis identifies transcription factors SHOX2 and MEOX2 as important regulators of the development of the anterior and posterior palate, respectively. In conclusion, our study charts epigenetic and transcriptional dynamics in palatogenesis, serving as a valuable resource for further cleft palate research.
1
Paper
Citation1
0
Save
0

VER-Net: a hybrid transfer learning model for lung cancer detection using CT scan images

Anindita Saha et al.Sep 11, 2024
+3
P
S
A
Lung cancer is the second most common cancer worldwide, with over two million new cases per year. Early identification would allow healthcare practitioners to handle it more effectively. The advancement of computer-aided detection systems significantly impacted clinical analysis and decision-making on human disease. Towards this, machine learning and deep learning techniques are successfully being applied. Due to several advantages, transfer learning has become popular for disease detection based on image data.
6

EmptyNN: A neural network based on positive-unlabeled learning to remove cell-free droplets and recover lost cells in single-cell RNA sequencing data

Fangfang Yan et al.Jan 18, 2021
L
Z
F
ABSTRACT Droplet-based single-cell RNA sequencing (scRNA-seq) has significantly increased the number of cells profiled per experiment and revolutionized the study of individual transcriptomes. However, to maximize the biological signal robust computational methods are needed to distinguish cell-free from cell-containing droplets. Here, we introduce a novel cell-calling algorithm called EmptyNN, which trains a neural network based on positive-unlabeled learning for improved filtering of barcodes. We leveraged cell hashing and genetic variation to provide ground-truth. EmptyNN accurately removed cell-free droplets while recovering lost cell clusters, and achieved an Area Under the Receiver Operating Characteristics (AUROC) of 94.73% and 96.30%, respectively. The comparisons to current state-of-the-art cell-calling algorithms demonstrated the superior performance of EmptyNN, as measured by the number of recovered cell-containing droplets and cell types. EmptyNN was further applied to two additional datasets and showed good performance. Therefore, EmptyNN represents a powerful tool to enhance scRNA-seq quality control analyses.
6
Paper
Citation1
0
Save
0

Modeling of Content addressable memory using 2D Reconfigurable Transistors

Ashwin Tunga et al.Sep 14, 2024
+3
Z
J
A
4

NetBCE: An Interpretable Deep Neural Network for Accurate Prediction of Linear B-Cell Epitopes

Haodong Xu et al.Oct 24, 2023
Z
H
Abstract Identification of B-cell epitopes (BCEs) plays an essential role in the development of peptide vaccines, immuno-diagnostic reagents, and antibody design and production. In this work, we generated a large benchmark dataset comprising 126,779 experimentally-supported, linear epitope-containing regions in 3567 protein clusters from over 1.3 million B cell assays. Analysis of this curated dataset showed large pathogen diversity covering 176 different families. The accuracy in linear BCE prediction was found to strongly vary with different features, while the performance by sequence features was superior to that by structural features. To search more efficient and interpretive feature representations, a ten-layer deep learning framework for linear BCE prediction, namely NetBCE, was developed. NetBCE achieved high accuracy and robust performance with the average area under the curve (AUC) value of 0.846 in five-fold cross validation through automatically learning the informative classification features. NetBCE substantially outperformed the conventional machine learning algorithms and other tools, with an over 22.06% improvement of AUC value compared to other tools using an independent dataset. Through investigating the output of important network modules in NetBCE, epitopes and non-epitopes tended to present in distinct regions with efficient feature representation along the network layer hierarchy. The NetBCE tool will be useful for linear B-cell epitopes identification and more generally, immunological and computational biology research.
Load More