TT
Thao Truong
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
9
(44% Open Access)
Cited by:
60
h-index:
10
/
i10-index:
12
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
14

Venice: A New Algorithm for Finding Marker Genes in Single-Cell Transcriptomic Data

Hy Vuong et al.Nov 17, 2020
A bstract Most widely used tools for finding marker genes in single cell data (SeuratT/NegBinom/Poisson, CellRanger, EdgeR, limmatrend) use a conventional definition of differentially expressed genes : genes with different mean expression values. However, in single-cell data, a cell population can be a mixture of many cell types/cell states, hence the mean expression of genes cannot represent the whole population. In addition, these tools assume that gene expression of a population belongs to a specific family of distribution. This assumption is often violated in single-cell data. In this work, we define marker genes of a cell population as genes that can be used to distinguish cells in the population from cells in other populations. Besides log-fold change, we devise a new metric to classify genes into up-regulated, down-regulated, and transitional states. In a benchmark for finding up-regulated and down-regulated genes, our tool outperforms all compared methods, including Seurat, ROTS, scDD, edgeR, MAST, limma, normal t-test, Wilcoxon and Kolmogorov–Smirnov test. Our method is much faster than all compared methods, therefore, enables interactive analysis for large single-cell data sets in BioTuring Browser. Venice algorithm is available within Signac package: https://github.com/bioturing/signac 1 ).
14
Citation16
0
Save
0

SARS-CoV-2 variants from long-term, persistently infected immunocompromised patients have altered syncytia formation, temperature-dependent replication, and serum neutralizing antibody escape

Camille Wouters et al.May 20, 2024
Abstract SARS-CoV-2 infection of immunocompromised individuals often leads to prolonged detection of viral RNA and infectious virus in nasal specimens, presumably due to the lack of induction of an appropriate adaptive immune response. Mutations identified in virus sequences obtained from persistently infected patients bear signatures of immune evasion and have some overlap with sequences present in variants of concern. We characterized virus isolates from two COVID-19 patients undergoing immunosuppressive cancer therapy, with all isolates obtained greater than 100 days after the initial COVID-19 diagnoses and compared to an isolate from the start of the infection. Isolates from an individual who never mounted an antibody response specific to SARS-CoV-2 despite the administration of convalescent plasma showed slight reductions in plaque size and some showed temperature-dependent replication attenuation on human nasal epithelial cell culture compared to the virus that initiated infection. An isolate from another patient - who did mount a SARS-CoV-2 IgM response – showed temperature dependent changes in plaque size as well as increased syncytia formation and escape from serum neutralizing antibody. Our results indicate that not all virus isolates from immunocompromised COVID-19 patients display clear signs of phenotypic change, but increased attention should be paid to monitoring virus evolution in this patient population.
0

Hera-T: an efficient and accurate approach for quantifying gene abundances from 10X-Chromium data with high rates of non-exonic reads.

Thang Tran et al.Jan 26, 2019
An important but rarely discussed phenomenon in single cell data generated by the 10X-Chromium protocol is that the fraction of non-exonic reads is very high. This number usually exceeds 30% of the total reads. Without aligning them to a complete genome reference, non-exonic reads can be erroneously aligned to the transcriptome reference with higher error rates. To tackle this problem, Cell Ranger chooses to firstly align reads against the whole genome, and at a later step, uses a genome annotation to select reads that align to the transcriptome. Despite its high running time and large memory consumption, Cell Ranger remains the most widely used tool to quantify 10XGenomics single-cell RNA-Seq data for its accuracy. In this work, we introduce Hera-T, a fast and accurate tool for estimating gene abundances in single cell data generated by the 10X-Chromium protocol. By devising a new strategy for aligning reads to both transcriptome and genome references, Hera-T reduces both running time and memory consumption from 10 to 100 folds while giving similar results compared to CellRanger's. Hera-T also addresses some difficult splicing alignment scenarios that Cell Ranger fails to address, and therefore, obtains better accuracy compared to Cell Ranger. Excluding the reads in those scenarios, Hera-T and Cell Ranger results have correlation scores>0.99. For a single-cell data set with 49 million of reads, Cell Ranger took 3 hours (179 minutes)while Hera-T took 1.75 minutes; for another single-cell data set with 784 millions of reads, Cell Ranger took about 25 hours while Hera-T took 32 minutes. For those data sets, CellRanger completely used all 32 GB of memory while Hera-T consumed at most 8 GB. Hera-T package is available for download at https://bioturing.com/product/hera-t