CL
Charity Law
Author with expertise in Microarray Data Analysis and Gene Expression Profiling
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
16
(50% Open Access)
Cited by:
36,188
h-index:
21
/
i10-index:
25
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

limma powers differential expression analyses for RNA-sequencing and microarray studies

Matthew Ritchie et al.Jan 20, 2015
limma is an R/Bioconductor software package that provides an integrated solution for analysing data from gene expression experiments. It contains rich features for handling complex experimental designs and for information borrowing to overcome the problem of small sample sizes. Over the past decade, limma has been a popular choice for gene discovery through differential expression analyses of microarray and high-throughput PCR data. The package contains particularly strong facilities for reading, normalizing and exploring such data. Recently, the capabilities of limma have been significantly expanded in two important directions. First, the package can now perform both differential expression and differential splicing analyses of RNA sequencing (RNA-seq) data. All the downstream analysis tools previously restricted to microarray data are now available for RNA-seq as well. These capabilities allow users to analyse both RNA-seq and microarray data with very similar pipelines. Second, the package is now able to go past the traditional gene-wise expression analyses in a variety of ways, analysing expression profiles in terms of co-regulated sets of genes or in terms of higher-order expression signatures. This provides enhanced possibilities for biological interpretation of gene expression differences. This article reviews the philosophy and design of the limma package, summarizing both new and historical features, with an emphasis on recent enhancements and features that have not been previously described.
0
136

Comprehensive characterization of single cell full-length isoforms in human and mouse with long-read sequencing

Luyi Tian et al.Aug 10, 2020
Abstract Alternative splicing shapes the phenotype of cells in development and disease. Long-read RNA-sequencing recovers full-length transcripts but has limited throughput at the single-cell level. Here we developed single-cell full-length transcript sequencing by sampling ( FLT-seq ), together with the computational pipeline FLAMES to overcome these issues and perform isoform discovery and quantification, splicing analysis and mutation detection in single cells. With FLT-seq and FLAMES , we performed the first comprehensive characterization of the full-length isoform landscape in single cells of different types and species and identified thousands of unannotated isoforms. We found conserved functional modules that were enriched for alternative transcript usage in different cell populations, including ribosome biogenesis and mRNA splicing. Analysis at the transcript-level allowed data integration with scATAC-seq on individual promoters, improved correlation with protein expression data and linked mutations known to confer drug resistance to transcriptome heterogeneity. Our methods reveal previously unseen isoform complexity and provide a better framework for multi-omics data integration.
136
Citation16
0
Save
0

Spotlight on 10x Visium: a multi-sample protocol comparison of spatial technologies

Mei Du et al.Mar 14, 2024
Background Spatial transcriptomics allows gene expression to be measured within complex tissue contexts. Among the array of spatial capture technologies available is 10x Genomics’ Visium platform, a popular method which enables transcriptomewide profiling of tissue sections. Visium offers a range of sample handling and library construction methods which introduces a need for benchmarking to compare data quality and assess how well the technology can recover expected tissue features and biological signatures. Results Here we present SpatialBench , a unique reference dataset generated from spleen tissue of mice responding to malaria infection spanning several tissue preparation protocols (both fresh frozen and FFPE samples, with and without CytAssist tissue placement). We noted better quality control metrics in reference samples prepared using probe-based capture methods, particularly those processed with CytAssist, validating the improvement in data quality produced with the platform. Our analysis of replicate samples extends to explore spatially variable gene detection, the outcomes of clustering and cell deconvolution using matched single-cell RNA-sequencing data and publicly available reference data to identify cell types and tissue regions expected in the spleen. Multi-sample differential expression analysis recovered known gene signatures related to biological sex or gene knockout. Conclusions We framed a comprehensive multi-sample analysis workflow that allowed us to generate consistent results both within and between different subsets of replicate samples, enabling broader comparisons and interpretations to be made at the group-level. Our SpatialBench dataset, analysis, and workflow can serve as a practical guide for Visium users and may prove valuable in other benchmarking studies.
1

The long and the short of it: unlocking nanopore long-read RNA sequencing data with short-read tools

Xueyi Dong et al.Jun 29, 2020
Application of Oxford Nanopore Technologies’ long-read sequencing platform to transcriptomic analysis is increasing in popularity. However, such analysis can be challenging due to small library sizes and high sequence error, which decreases quantification accuracy and reduces power for statistical testing. Here, we report the analysis of two nanopore sequencing RNA-seq datasets with the goal of obtaining gene-level and isoform-level differential expression information. A dataset of synthetic, spliced, spike-in RNAs (“sequins”) as well as a mouse neural stem cell dataset from samples with a null mutation of the epigenetic regulator Smchd1 were analysed using a mix of long-read specific tools for preprocessing together with established short-read RNA-seq methods. We used limma-voom to perform differential gene expression analysis, and the novel FLAMES pipeline to perform isoform identification and quantification, followed by DRIMSeq and limma-diffSplice (with stageR ) to perform differential transcript usage analysis. We compared results from the sequins dataset to the ground truth, and results of the mouse dataset to a previous short-read study on equivalent samples. Overall, our work shows that transcriptomic analysis of long-read nanopore data using short-read software and methods that are already in wide use can yield meaningful results.
1
Citation2
0
Save
0

Covering all your bases: incorporating intron signal from RNA-seq data

Stuart Lee et al.Jun 21, 2018
RNA-seq datasets can contain millions of intron reads per sequenced library that are typically removed from downstream analysis. Only reads overlapping annotated exons are considered to be informative since mature mRNA is assumed to be the major component sequenced, especially when examining poly(A) RNA samples. In this paper, we demonstrate that intron reads are informative and that pre-mRNA is the major source of intron signal. Making use of pre-mRNA signal, our index method combines differential expression analyses from intron and exon counts to categorise changes observed in each count set, giving additional genes with evidence of transcriptional changes when compared to a classic approach. Considering the importance of intron retention in some biological systems, another novel method, superintronic , looks for evidence of intron retention after accounting for the presence of pre-mRNA signal. The results presented here overcomes deficiencies and biases in previous works related to intron reads by exploring multiple sources for intron reads simultaneously using a data-driven approach, and provides a broad overview into how intron reads can be utilised in relation to multiple aspects of transcriptional biology.
0

Differential transcript usage from RNA-seq data: isoform pre-filtering improves performance of count-based methods

Charlotte Soneson et al.Aug 24, 2015
Large-scale sequencing of cDNA (RNA-seq) has been a boon to the quantitative analysis of transcriptomes. A notable application is the detection of changes in transcript usage between experimental conditions. For example, discovery of pathological alternative splicing may allow the development of new treatments or better management of patients. From an analysis perspective, there are several ways to approach RNA-seq data to unravel differential transcript usage, such as annotation-based exon-level counting, differential analysis of the `percent spliced in' measure or quantitative analysis of assembled transcripts. The goal of this research is to compare and contrast current state-of-the-art methods, as well as to suggest improvements to commonly used workflows. We assess the performance of representative workflows using synthetic data and explore the effect of using non-standard counting bin definitions as input to a state-of-the-art inference engine (DEXSeq). Although the canonical counting provided the best results overall, several non-canonical approaches were as good or better in specific aspects and most counting approaches outperformed the evaluated event- and assembly-based methods. We show that an incomplete annotation catalog can have a detrimental effect on the ability to detect differential transcript usage in transcriptomes with few isoforms per gene and that isoform-level pre-filtering can considerably improve false discovery rate (FDR) control. Count-based methods generally perform well in detection of differential transcript usage. Controlling the FDR at the imposed threshold is difficult, mainly in complex organisms, but can be improved by pre-filtering of the annotation catalog.
Load More