CM
Cong Ma
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
13
(38% Open Access)
Cited by:
383
h-index:
21
/
i10-index:
32
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Epigenetic regulation during cancer transitions across 11 tumour types

Nadezhda Terekhanova et al.Nov 1, 2023
Chromatin accessibility is essential in regulating gene expression and cellular identity, and alterations in accessibility have been implicated in driving cancer initiation, progression and metastasis1-4. Although the genetic contributions to oncogenic transitions have been investigated, epigenetic drivers remain less understood. Here we constructed a pan-cancer epigenetic and transcriptomic atlas using single-nucleus chromatin accessibility data (using single-nucleus assay for transposase-accessible chromatin) from 225 samples and matched single-cell or single-nucleus RNA-sequencing expression data from 206 samples. With over 1 million cells from each platform analysed through the enrichment of accessible chromatin regions, transcription factor motifs and regulons, we identified epigenetic drivers associated with cancer transitions. Some epigenetic drivers appeared in multiple cancers (for example, regulatory regions of ABCC1 and VEGFA; GATA6 and FOX-family motifs), whereas others were cancer specific (for example, regulatory regions of FGF19, ASAP2 and EN1, and the PBX3 motif). Among epigenetically altered pathways, TP53, hypoxia and TNF signalling were linked to cancer initiation, whereas oestrogen response, epithelial-mesenchymal transition and apical junction were tied to metastatic transition. Furthermore, we revealed a marked correlation between enhancer accessibility and gene expression and uncovered cooperation between epigenetic and genetic drivers. This atlas provides a foundation for further investigation of epigenetic dynamics in cancer transitions.
0
Citation15
1
Save
0

Deriving Ranges of Optimal Estimated Transcript Expression Due to Non-identifiability

Hongyu Zheng et al.Dec 13, 2019
Abstract Current expression quantification methods suffer from a fundamental but under-characterized type of error: the most likely estimates for transcript abundances are not unique. This means multiple estimates of transcript abundances generate the observed RNA-seq reads with equal likelihood, and the underlying true expression cannot be determined. This problem is called non-identifiability for probabilistic models, and is further exacerbated by incomplete reference transcriptome. That is, reads may be sequenced from unannotated expressed transcripts. Graph quantification is a generalization to transcript quantification, accounting for the reference incompleteness by allowing exponentially many unannotated transcripts to express reads. We propose methods to calculate a “confidence range of expression” for each transcript, representing its possible abundance across equally optimal estimates for both quantification models. This range informs both whether a transcript has potential estimation error due to non-identifiability and the extent of the error. Applying our methods to the Human Body Map data, we observe 35%–50% of transcripts potentially suffer from inaccurate quantification caused by non-identifiability. When comparing the expression between isoforms in one sample, we find that the degree of inaccuracy of 20%–47% transcripts can be so large that the ranking of expression between the transcript and its sibling isoforms cannot be determined. When comparing the expression of a transcript between two groups of RNA-seq samples in differential expression analysis, we observe that the majority of detected differentially expressed transcripts are reliable with a few exceptions after considering the ranges of the optimal expression estimates. The code for computing the range of expression is available at https://github.com/Kingsford-Group/subgraphquant . The code for the involved analyses is available at https://github.com/Kingsford-Group/subgraphquantanalysis .
0
Citation5
0
Save
0

Inferring allele-specific copy number aberrations and tumor phylogeography from spatially resolved transcriptomics

Cong Ma et al.Mar 13, 2024
Abstract A key challenge in cancer research is to reconstruct the somatic evolution within a tumor over time and across space. Spatially resolved transcriptomics (SRT) measures gene expression at thousands of spatial locations in a tumor, but does not directly reveal genetic aberrations. We introduce CalicoST, an algorithm to simultaneously infer allele-specific copy number aberrations (CNAs) and a spatial model of tumor evolution from SRT of tumor slices. By modeling CNA-induced perturbations in both total and allele-specific gene expression, CalicoST identifies important types of CNAs – including copy-neutral loss of heterozygosity (CNLOH) and mirrored subclonal CNAs– that are invisible to total copy number analysis. On SRT data from nine patients from the Human Tumor Atlas Network (HTAN) with matched whole exome sequencing (WES) data, CalicoST achieves an average accuracy of 86%, approximately 21% higher than existing methods. On two patients with SRT data from multiple adjacent slices, CalicoST reconstructs a tumor phylogeography that describes the spread of cancerous clones in three-dimensional space. CalicoST analysis of multiple SRT slices from a cancerous prostate organ reveals five spatially coherent clones, with mirrored subclonal CNAs distinguishing clones on the two sides of the prostate, forming a bifurcating phylogeography in both genetic and physical space.
0
Citation1
0
Save
0

Estimating mutual information under measurement error

Cong Ma et al.Nov 23, 2019
Mutual information is widely used to characterize dependence between biological signals, such as co-expression between genes or co-evolution between amino acids. However, measurement error of the biological signals is rarely considered in estimating mutual information. Measurement error is widespread and non-negligible in some cases. As a result, the distribution of the signals is blurred, and the mutual information may be biased when estimated using the blurred measurements. We derive a corrected estimator for mutual information that accounts for the distribution of measurement error. Our corrected estimator is based on the correction of the probability mass function (PMF) or probability density function (PDF, based on kernel density estimation). We prove that the corrected estimator is asymptotically unbiased in the (semi-) discrete case when the distribution of measurement error is known. We show that it reduces the estimation bias in the continuous case under certain assumptions. On simulated data, our corrected estimator leads to a more accurate estimation for mutual information when the sample size is not the limiting factor for estimating PMF or PDF accurately. We compare the uncorrected and corrected estimator on the gene expression data of TCGA breast cancer samples and show a difference in both the value and the ranking of estimated mutual information between the two estimators.
44

Mapping the topography of spatial gene expression with interpretable deep learning

Uthsav Chitra et al.Jan 1, 2023
Spatially resolved transcriptomics technologies provide high-throughput measurements of gene expression in a tissue slice, but the sparsity of this data complicates the analysis of spatial gene expression patterns such as gene expression gradients. We address these issues by deriving a topographic map of a tissue slice–analogous to a map of elevation in a landscape–using a novel quantity called the isodepth. Contours of constant isodepth enclose spatial domains with distinct cell type composition, while gradients of the isodepth indicate spatial directions of maximum change in gene expression. We develop GASTON, an unsupervised and interpretable deep learning algorithm that simultaneously learns the isodepth, spatial gene expression gradients, and piecewise linear functions of the isodepth that model both continuous gradients and discontinuous spatial variation in the expression of individual genes. We validate GASTON by showing that it accurately identifies spatial domains and marker genes across several biological systems. In SRT data from the brain, GASTON reveals gradients of neuronal differentiation and firing, and in SRT data from a tumor sample, GASTON infers gradients of metabolic activity and epithelial-mesenchymal transition (EMT)-related gene expression in the tumor microenvironment
44
0
Save
0

Experimental investigation into coal wettability changes caused by reactions with scCO2-H2O

Ke Li et al.Jun 1, 2024
Geological CO2 sequestration (GCS) can help mitigate global warming and enhance methane recovery from coal beds. However, few studies have linked the effects of CO2 to surface chemistry changes controlling wetting behavior in deep coal beds. Contact angles (CAs) of CO2/N2-high volatile bituminous coal-water systems were measured under different temperatures and pressures. The surface chemistry and physical structure of coals were characterized to investigate changes in physicochemical properties and their relations with wettability after reactions. For N2 treatment, the time-dependence of static and dynamic CAs were insignificant, ranging within 4°. For gaseous CO2 treatment, the static CAs and the average advancing angles increased slightly. With supercritical (sc) CO2, both the static and dynamic CAs increased significantly, and adv changed to intermediate-wet (92°). Reactions with minerals exposed to scCO2 resulted in greater surface roughness and heterogeneity, greater contact angle hysteresis and more surface sites occupied by scCO2 rather than H2O. Increases in hydrophobic functional groups and decreases in hydrophilicity were shown by FTIR spectra, reflecting the shedding of polar oxygen-containing functional groups, reduction of hydrogen bonds, and increasing percentage of hydrocarbons. XRD patterns obtained following scCO2-treatment showed that crystallite growth and molecular polymerization were higher toward graphite-like. The calculated structural parameters of functional groups and crystallites both showed elevated coal rank. Changes in crystallite structure, notably higher carbon content and decreased negative surface charge, are unfavorable for water-wetting. This study contributes to understanding surface chemistry changes responsible for decreased wettability during CO2-enhanced coal bed methane recovery and GCS in coal reservoirs.
Load More