JC
J. Chamberlin
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
3
(67% Open Access)
Cited by:
8
h-index:
13
/
i10-index:
16
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
46

Differences in molecular sampling and data processing explain variation among single-cell and single-nucleus RNA-seq experiments

J. Chamberlin et al.Aug 3, 2022
A
G
Y
J
Abstract A mechanistic understanding of the biological and technical factors that impact cell and nuclear transcript measurements is essential to designing, analyzing, and interpreting single-cell and single-nucleus RNA sequencing experiments. RNA sampling in nuclei and cells is fundamentally different as nuclei contain the same pre-mRNA population as cells, yet contain a small subset of the largely-cytoplasmic mRNAs. Nonetheless, early studies argued that including pre-mRNA in single-nucleus analysis led to results comparable to cellular samples. However, typical bioinformatic workflows do not distinguish between pre-mRNA and mRNA when analyzing gene expression, and variation in the relative abundance of pre-mRNA and mRNA across cell types has received limited attention. These gaps are especially important given that incorporating pre-mRNA in routine gene expression analysis is now commonplace for both assays, despite known gene length bias in pre-mRNA capture. Here, we reanalyze public datasets from mouse and human to describe the mechanisms and contrasting effects of mRNA and pre-mRNA sampling in single-cell and nucleus RNA-seq. We disentangle the roles of bioinformatic processing, assay choice, and biological variability on measured gene expression and marker gene selection. We show that pre-mRNA levels vary considerably among cell types, which mediates the degree of gene length bias within and between assays and limits the generalizability of a recently-published normalization method intended to correct for this bias. As an alternative solution, we demonstrate the applicability of an existing post hoc gene length-based correction method developed for conventional RNA-seq gene set enrichment analysis. Finally, we show that the inclusion of pre-mRNA in bioinformatic processing can impart a larger effect on gene expression estimates than the choice of cell versus nuclear assay, which is pivotal to the effective reuse of existing data. Broadly, these analyses advance our understanding of the biological and technical factors underlying variation in single-cell and single-nucleus RNA-seq experiments to promote more informed choices in experimental design, data analysis, and data sharing and reuse.
46
Citation6
0
Save
1

No evidence for whole-chromosome dosage compensation or global transcriptomic expression differences in spontaneously-aneuploid mutation accumulation lines ofSaccharomyces cerevisiae

Holly McQueary et al.Dec 2, 2020
+5
S
M
H
Abstract Aneuploidy, the state in which an organism’s genome contains one or more missing or additional chromosomes, often causes widespread genotypic and phenotypic effects. Most often, aneuploidies are deleterious; the most common examples in humans being Down’s syndrome (Trisomy 21) and Turner’s syndrome (monosomy X). However, aneuploidy is surprisingly common in wild yeast populations. In recent years, there has been debate as to whether yeast contain an innate dosage compensation response that operates at the gene, chromosome, or the whole-genome level, or if natural isolates are robust to aneuploidy without such a mechanism. In this study, we tested for differential gene expression in 20 aneuploid and 16 euploid lines of yeast from two previous mutation accumulation experiments, where selection was minimized and therefore aneuploidies arose spontaneously. We found no evidence for whole-chromosome dosage compensation in aneuploid yeast but did find some evidence for attenuation of expression on a gene-by-gene basis. We additionally found that aneuploidy has no effect on the expression of the rest of the genome (i.e. “trans” genes), and that very few mutually exclusive aneuploid lines shared differentially expressed genes. However, we found there was a small set of genes that exhibited a shared expression response in the euploid lines, suggesting an effect of mutation accumulation on gene expression. Our findings contribute to our understanding of aneuploidy in yeast and support the hypothesis that there is no innate dosage compensation mechanism at the whole-chromosome level.
1
Citation2
0
Save
0

Improved characterization of single-cell RNA-seq libraries with paired-end avidity sequencing

J. Chamberlin et al.Jul 12, 2024
A
A
J
Prevailing poly(dT)-primed 3' single-cell RNA-seq protocols generate barcoded cDNA fragments containing the reverse transcriptase priming site, which is expected to be the poly(A) tail or a genomic adenine homopolymer. Direct sequencing across this priming site was historically difficult because of DNA sequencing errors induced by the homopolymeric primer at the "barcode" end. Here, we evaluate the capability of "avidity base chemistry" DNA sequencing from Element Biosciences to sequence through this homopolymer accurately, and the impact of the additional cDNA sequence on read alignment and precise quantification of polyadenylation site usage. We find that the Element Aviti instrument sequences through the thymine homopolymer into the subsequent cDNA sequence without detectable loss of accuracy. The resulting paired-end alignments enable direct and independent assignment of reads to polyadenylation sites, which bypasses complexities and limitations of conventional approaches but does not consistently improve read mapping rates compared to single-end alignment. We also characterize low-level artifacts and arrive at an adjusted adapter trimming and alignment workflow that significantly improves the alignment of sequence data from Element and Illumina, particularly in the context of extended read lengths. Our analyses confirm that Element avidity sequencing is an effective alternative to Illumina sequencing for standard single-cell RNA-seq, particularly for polyadenylation site analyses but do not rule out the potential for similar performance from other emerging platforms.