ST
Scott Tyler
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
4
(100% Open Access)
Cited by:
25
h-index:
22
/
i10-index:
30
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
125

Erasure of Biologically Meaningful Signal by Unsupervised scRNAseq Batch-correction Methods

Scott Tyler et al.Nov 19, 2021
E
E
S
Abstract Single cell RNAseq (scRNAseq) batches range from technical-replicates to multi-tissue atlases, thus requiring robust batch-correction methods that operate effectively across this spectrum of between-batch similarity. Commonly employed benchmarks quantify removal of batch effects and preservation of within-batch variation, the preservation of biologically meaningful differences between batches has been under-researched. Here, we address these gaps, quantifying batch effects at the level of cluster composition and along overlapping topologies through the introduction of two new measures. We discovered that standard approaches of scRNAseq batch-correction erase cell-type and cell-state variation in real-world biological datasets, single cell gene expression atlases, and in silico experiments. We highlight through examples showing that these issues may create the artefactual appearance of external validation/replication of findings. Our results demonstrate that either biological effects, if known, must be balanced between batches (like bulk-techniques), or technical effects that vary between batches must be explicitly modeled to prevent erasure of biological variation by unsupervised batch correction approaches.
27

Anti-correlated Feature Selection Prevents False Discovery of Subpopulations in scRNAseq

Scott Tyler et al.Dec 7, 2022
E
E
S
Abstract While sub-clustering cell-populations has become popular in single cell-omics, negative controls for this process are lacking. Popular feature-selection/clustering algorithms fail the null-dataset problem, allowing erroneous subdivisions of homogenous clusters until nearly each cell is called its own cluster. Using 45,348 scRNAseq analyses of real and synthetic datasets, we found that anti-correlated gene selection reduces or eliminates erroneous subdivisions, increases marker-gene selection efficacy, and efficiently scales to 245k cells without the need for high-performance computing.
27
Citation2
0
Save
1

Acetate supplementation rescues social deficits and alters transcriptional regulation in prefrontal cortex of Shank3 deficient mice

Aya Osman et al.Apr 30, 2020
+14
A
N
A
Abstract Autism spectrum disorder (ASD) is a heterogenous neurodevelopmental disorder with complex pathophysiology including both genetic and environmental factors. Recent evidence demonstrates the gut microbiome and its resultant metabolome can influence brain and behavior and have been implicated in ASD. To investigate gene by microbiome interactions in a model for genetic risk of ASD, we utilize mutant mice carrying a deletion of the ASD-associated Shank3 gene (Shank3 KO ). Shank3 KO have altered microbiome composition and function at baseline in addition to social deficits. Further depletion of the microbiome with antibiotics exacerbates social deficits in Shank3 KO , and results in transcriptional changes in the frontal cortex. Supplementation with the microbial metabolite acetate leads to reversal of social behavioral phenotypes even in mice with a depleted microbiome, and significantly alters transcriptional regulation in the prefrontal cortex. These results suggest a key role for the gut microbiome and the neuroactive metabolite acetate in regulating ASD-like behaviors.
1
Citation2
0
Save
33

Self-supervised Benchmarking for scRNAseq Clustering

Scott Tyler et al.Jul 10, 2023
E
E
S
Abstract Interpretation of single cell RNAseq (scRNAseq) data are typically built upon clustering results and/or cell-cell topologies. However, the validation process is often exclusively left to bench biologists, which can take years and tens of thousands of dollars. Furthermore, a lack of objective ground-truth labels in complex biological datasets, has resulted in difficulties when benchmarking single cell analysis methods. Here, we address these gaps with count splitting, creating a cluster validation algorithm, accounting for Poisson sampling noise, and benchmark 120 pipelines using an independent test-set for ground-truth assessment, thus enabling the first self-supervised benchmark. Anti-correlation-based feature selection paired with locally weighted Louvain modularity on the Euclidean distance of 50 principal-components with cluster-validation showed the best performance of all tested pipelines for scRNAseq clustering, yielding reproducible biologically meaningful populations. These new approaches enabled the discovery of a novel metabolic gene signature associated with hepatocellular carcinoma survival time.