TS
Timothy Shaw
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(88% Open Access)
Cited by:
2,212
h-index:
29
/
i10-index:
44
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Assemblathon 2: evaluating de novo methods of genome assembly in three vertebrate species

Keith Bradnam et al.Jul 22, 2013
+88
T
A
K
Background - The process of generating raw genome sequence data continues to become cheaper, faster, and more accurate. However, assembly of such data into high-quality, finished genome sequences remains challenging. Many genome assembly tools are available, but they differ greatly in terms of their performance (speed, scalability, hardware requirements, acceptance of newer read technologies) and in their final output (composition of assembled sequence). More importantly, it remains largely unclear how to best assess the quality of assembled genome sequences. The Assemblathon competitions are intended to assess current state-of-the-art methods in genome assembly. Results - In Assemblathon 2, we provided a variety of sequence data to be assembled for three vertebrate species (a bird, a fish, and snake). This resulted in a total of 43 submitted assemblies from 21 participating teams. We evaluated these assemblies using a combination of optical map data, Fosmid sequences, and several statistical methods. From over 100 different metrics, we chose ten key measures by which to assess the overall quality of the assemblies. Conclusions - Many current genome assemblers produced useful assemblies, containing a significant representation of their genes, regulatory sequences, and overall genome structure. However, the high degree of variability between the entries suggests that there is still much room for improvement in the field of genome assembly and that approaches which work well in assembling the genome of one species may not necessarily work well for another.
0
Citation670
0
Save
0

C9orf72 Dipeptide Repeats Impair the Assembly, Dynamics, and Function of Membrane-Less Organelles

Kyung-Ha Lee et al.Oct 1, 2016
+17
H
P
K
Expansion of a hexanucleotide repeat GGGGCC (G4C2) in C9ORF72 is the most common cause of amyotrophic lateral sclerosis (ALS) and frontotemporal dementia (FTD). Transcripts carrying (G4C2) expansions undergo unconventional, non-ATG-dependent translation, generating toxic dipeptide repeat (DPR) proteins thought to contribute to disease. Here, we identify the interactome of all DPRs and find that arginine-containing DPRs, polyGly-Arg (GR) and polyPro-Arg (PR), interact with RNA-binding proteins and proteins with low complexity sequence domains (LCDs) that often mediate the assembly of membrane-less organelles. Indeed, most GR/PR interactors are components of membrane-less organelles such as nucleoli, the nuclear pore complex and stress granules. Genetic analysis in Drosophila demonstrated the functional relevance of these interactions to DPR toxicity. Furthermore, we show that GR and PR altered phase separation of LCD-containing proteins, insinuating into their liquid assemblies and changing their material properties, resulting in perturbed dynamics and/or functions of multiple membrane-less organelles.
0
Citation630
0
Save
0

Assemblathon 1: A competitive assessment of de novo short read assembly methods

Dent Earl et al.Sep 16, 2011
+68
J
K
D
Low-cost short read sequencing technology has revolutionized genomics, though it is only just becoming practical for the high-quality de novo assembly of a novel large genome. We describe the Assemblathon 1 competition, which aimed to comprehensively assess the state of the art in de novo assembly methods when applied to current sequencing technologies. In a collaborative effort, teams were asked to assemble a simulated Illumina HiSeq data set of an unknown, simulated diploid genome. A total of 41 assemblies from 17 different groups were received. Novel haplotype aware assessments of coverage, contiguity, structure, base calling, and copy number were made. We establish that within this benchmark: (1) It is possible to assemble the genome to a high level of coverage and accuracy, and that (2) large differences exist between the assemblies, suggesting room for further improvements in current methods. The simulated benchmark, including the correct answer, the assemblies, and the code that was used to evaluate the assemblies is now public and freely available from http://www.assemblathon.org/ .
0
Citation522
0
Save
0

Deep Multilayer Brain Proteomics Identifies Molecular Networks in Alzheimer’s Disease Progression

Bing Bai et al.Jan 8, 2020
+31
Y
X
B
Alzheimer's disease (AD) displays a long asymptomatic stage before dementia. We characterize AD stage-associated molecular networks by profiling 14,513 proteins and 34,173 phosphosites in the human brain with mass spectrometry, highlighting 173 protein changes in 17 pathways. The altered proteins are validated in two independent cohorts, showing partial RNA dependency. Comparisons of brain tissue and cerebrospinal fluid proteomes reveal biomarker candidates. Combining with 5xFAD mouse analysis, we determine 15 Aβ-correlated proteins (e.g., MDK, NTN1, SMOC1, SLIT2, and HTRA1). 5xFAD shows a proteomic signature similar to symptomatic AD but exhibits activation of autophagy and interferon response and lacks human-specific deleterious events, such as downregulation of neurotrophic factors and synaptic proteins. Multi-omics integration prioritizes AD-related molecules and pathways, including amyloid cascade, inflammation, complement, WNT signaling, TGF-β and BMP signaling, lipid metabolism, iron homeostasis, and membrane transport. Some Aβ-correlated proteins are colocalized with amyloid plaques. Thus, the multilayer omics approach identifies protein networks during AD progression.
0

Adapterama II: Universal amplicon sequencing on Illumina platforms (TaggiMatrix)

Travis Glenn et al.Apr 26, 2019
+24
S
T
T
Next-generation sequencing (NGS) of amplicons is used in a wide variety of contexts. Most NGS amplicon sequencing remains overly expensive and inflexible, with library preparation strategies relying upon the fusion of locus-specific primers to full-length adapter sequences with a single identifying sequence or ligating adapters onto PCR products. In Adapterama I, we presented universal stubs and primers to produce thousands of unique index combinations and a modifiable system for incorporating them into Illumina libraries. Here, we describe multiple ways to use the Adapterama system and other approaches for amplicon sequencing on Illumina instruments. In the variant we use most frequently for large-scale projects, we fuse partial adapter sequences (TruSeq or Nextera) onto the 5′ end of locus-specific PCR primers with variable-length tag sequences between the adapter and locus-specific sequences. These fusion primers can be used combinatorially to amplify samples within a 96-well plate (eight forward primers + 12 reverse primers yield 8 x 12 = 96 combinations), and the resulting amplicons can be pooled. The initial PCR products then serve as template for a second round of PCR with dual-indexed iTru or iNext primers (also used combinatorially) to make full-length libraries. The resulting quadruple-indexed amplicons have diversity at most base positions and can be pooled with any standard Illumina library for sequencing. The number of sequencing reads from the amplicon pools can be adjusted, facilitating deep sequencing when required or reducing sequencing costs per sample to an economically trivial amount when deep coverage is not needed. We demonstrate the utility and versatility of our approaches with results from six projects using different implementations of our protocols. Thus, we show that these methods facilitate amplicon library construction for Illumina instruments at reduced cost with increased flexibility. A simple web page to design fusion primers compatible with iTru primers is available at: http://baddna.uga.edu/tools-taggi.html. A fast and easy to use program to demultiplex amplicon pools with internal indexes is available at: https://github.com/lefeverde/Mr_Demuxy.
11

CBFA2T3-GLIS2-dependent pediatric acute megakaryoblastic leukemia is driven by GLIS2 and sensitive to Navitoclax

Mathieu Neault et al.Dec 19, 2022
+17
M
C
M
Abstract Pediatric acute megakaryoblastic leukemia (AMKL) is an aggressive, uncurable blood cancer associated with poor therapeutic response and high mortality. We developed CBFA2T3-GLIS2-driven mouse models of AMKL that recapitulate the phenotypic and transcriptional signatures of the human disease. We show that an activating Ras mutation, which occurs in human AMKL, increased the penetrance and decreased the latency of CBF2AT3-GLIS2-driven AMKL. CBFA2T3-GLIS2 and GLIS2 modulate similar transcriptional networks. We uncover the dominant oncogenic properties of GLIS2, which trigger AMKL in cooperation with oncogenic Ras. We find that both CBFA2T3-GLIS2 and GLIS2 alter the expression of numerous BH3-only proteins, causing AMKL cell sensitivity to the BCL-2 inhibitor navitoclax both in vitro and in vivo , suggesting a novel therapeutic option for pediatric patients suffering from CBFA2T3-GLIS2-driven AMKL. Key points GLIS2 cooperates with activated Nras to promote the development of acute megakaryoblastic leukemia. CBFA2T3-GLIS2 and GLIS2 alter the expression of BCL2 family members rendering AMKL cells sensitive to navitoclax.
1

BERLIN: Basic Explorer for single-cell RNAseq analysis and cell Lineage Determination

Gabrielle Nobles et al.Jul 15, 2023
+10
C
A
G
Abstract Single-cell RNA sequencing has revolutionized the study of immuno-oncology, cancer biology, and developmental biology by enabling the joint characterization of gene expression and cellular heterogeneity in a single platform. As of July 2023, the Gene Expression Omnibus now contains over 4000 published single-cell data sets, providing an invaluable opportunity for reanalysis to identify new cell types or cellular states as well as their defining transcriptional programs. To facilitate the reprocessing of these public datasets, we have devised a single-cell RNA sequencing analysis framework for data retrieval, quality control, expression normalization, dimension reduction, cell clustering, and data integration. Additionally, we have developed a Shiny App visualization platform that enables the exploration of gene expression, cell type annotations, and cell lineages through a user interface. We performed a re-analysis of single-cell RNAseq data generated from acute myeloid leukemia and tumor-reactive lymphocytes and found our pipeline to faithfully recapitulated the cell type assignment as well as expected lineage trajectories. Altogether, we present BERLIN, a single-cell RNAseq analysis pipeline that facilitates the integration and public dissemination of results from the reanalysis.
1

Summarizing internal dynamics boosts differential analysis and functional interpretation of super enhancers

Xiang Liu et al.Sep 26, 2021
+5
B
A
X
ABSTRACT Super enhancers (SEs) are broad enhancer domains usually containing multiple constituent enhancers that hold elevated activities in gene regulation. Disruption in one or more constituent enhancers causes aberrant SE activities that lead to gene dysregulation in diseases. To quantify SE aberrations, differential analysis is performed to compare SE activities between cell conditions. The state-of-art strategy in estimating differential SEs relies on overall activities and neglect the changes in length and structure of SEs. Here, we propose a novel computational method to identify differential SEs by weighting the combinatorial effects of constituent-enhancer activities and locations (i.e., internal dynamics). In addition to overall activity changes, our method identified four novel classes of differential SEs with distinct enhancer structural alterations. We demonstrate that these structure alterations hold distinct regulatory impact, such as regulating different number of genes and modulating gene expression with different strengths, highlighting the differentiated regulatory roles of these unexplored SE features. When compared to the existing method, our method showed improved identification of differential SEs that were linked to better discernment of cell-type-specific SE activity and functional interpretation. We implement an R package, DASE , to facilitate the use of our method.