AS
Amol Shetty
Author with expertise in RNA Sequencing Data Analysis
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
6
(50% Open Access)
Cited by:
4
h-index:
29
/
i10-index:
46
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

FADU: A Feature Counting Tool for Prokaryotic RNA-Seq Analysis

Matthew Chung et al.Jun 3, 2018
+6
A
C
M
Abstract Motivation The major algorithms for quantifying transcriptomics data for differential gene expression analysis were designed for analyzing data from human or human-like genomes, specifically those with single gene transcripts and distinct transcriptional boundaries that extend beyond the coding sequence (CDS) as identified through expressed sequence tags (ESTs) or EST-like sequence data. Some eukaryotic genomes and all, or nearly all, bacterial genomes require alternate methods of quantification since they lack annotation of transcriptional boundaries with EST or EST-like data, have overlapping transcriptional boundaries, and/or have polycistronic transcripts. Results An algorithm was developed and tested that better quantifies transcriptomics data for differential gene expression analysis in organisms with overlapping transcriptional units and polycistronic transcripts. Using data from standard libraries originating from Escherichia coli and Ehrlichia chaffeensis, and strand-specific libraries from the Wolbachia endosymbiont wBm, FADU can derive counts for genes that are missed by HTSeq and featurecounts. Using the default parameters with the E. coli data, FADU can detect transcription of 51 more genes than HTSeq in union mode and 21 genes more than featurecounts, with 42 and 18 of these features being <300 bp, respectively. Due to its ability to derive counts for otherwise unrepresented genes without overstating their abundance, we believe FADU to be an improved tool for quantifying transcripts in prokaryotic systems for RNA-Seq analyses. Availability and implementation FADU is available at https://github.com/adkinsrs/FADU . FADU was implemented using Python3 and requires the PySAM module (version 0.12.0.1 or later). Contact jdhotopp@som.umaryland.edu
0
Citation3
0
Save
0

The Evolutionary Genomic Dynamics of Peruvians Before, During, and After the Inca Empire

Daniel Harris et al.Nov 16, 2017
+16
C
K
D
Abstract Native Americans from the Amazon, Andes, and coast regions of South America have a rich cultural heritage, but have been genetically understudied leading to gaps in our knowledge of their genomic architecture and demographic history. Here, we sequenced 150 high-coverage and genotyped 130 genomes from Native American and mestizo populations in Peru. A majority of our samples possess greater than 90% Native American ancestry and demographic modeling reveals, consistent with a rapid peopling model of the Americas, that most of Peru was peopled approximately 12,000 years ago. While the Native American populations possessed distinct ancestral divisions, the mestizo groups were admixtures of multiple Native American communities which occurred before and during the Inca Empire. The mestizo communities also show Spanish introgression only after Peruvian Independence. Thus, we present a detailed model of the evolutionary dynamics which impacted the genomes of modern day Peruvians.
0
Citation1
0
Save
0

Dual RNA sequencing (dRNA-Seq) of bacteria and their host cells

J. Marsh et al.Jan 6, 2017
+3
A
R
J
Bacterial pathogens subvert host cells by manipulating cellular pathways for survival and replication; in turn, host cells respond to the invading pathogen through cascading changes in gene expression. Deciphering these complex temporal and spatial dynamics to identify novel bacterial virulence factors or host response pathways is crucial for improved diagnostics and therapeutics. Dual RNA sequencing (dRNA-Seq) has recently been developed to simultaneously capture host and bacterial transcriptomes from an infected cell. This approach builds on the high sensitivity and resolution of RNA-Seq technology and is applicable to any bacteria that interact with eukaryotic cells, encompassing parasitic, commensal or mutualistic lifestyles. We pioneered dRNA-Seq to simultaneously capture prokaryotic and eukaryotic expression profiles of cells infected with bacteria, using in vitro Chlamydia-infected epithelial cells as proof of principle. Here we provide a detailed laboratory and bioinformatics protocol for dRNA-seq that is readily adaptable to any host-bacteria system of interest.
0

Cost Effective, Experimentally Robust Differential Expression Analysis for Human/Mammalian, Pathogen, and Dual-Species Transcriptomics

Amol Shetty et al.Jun 3, 2018
+4
A
D
A
As sequencing read length has increased, researchers have quickly adopted longer reads for their experiments. Here, we examine host-pathogen interaction studies to assess if using longer reads is warranted. Six diverse datasets encountered in studies of host-pathogen interactions were used to assess what genomic attributes might affect the outcome of differential gene expression analysis including: gene density, operons, gene length, number of introns/exons, and intron length. Principal components analysis, hierarchical clustering with bootstrap support, and regression analyses of pairwise comparisons were undertaken on the same reads, looking at all combinations of paired and unpaired reads trimmed to 36, 54, 72, and 101-bp. For E. coli, 36-bp single end reads performed as well as any other read length and as well as paired end reads. For all other comparisons, 54-bp and 72-bp reads were typically equivalent and different from 36-bp and 101-bp reads. Read pairing improved the outcome in several, but not all, comparisons in no discernable pattern, such that using paired reads is recommended in most scenarios. No specific genome attribute appeared to influence the data. However, experiments with an a priori expected greater biological complexity had more variable results with all read lengths relative to those with decreased complexity. When combined with cost, 54-bp paired end reads provided the most robust, internally reproducible results across all comparisons. However, using 36-bp single end reads may be desirable for bacterial samples, although possibly only if the transcriptional response is expected a priori to be robust.
0

Targeted enrichment outperforms other enrichment techniques and enables more multi-species RNA-Seq analyses

Matthew Chung et al.Feb 1, 2018
+15
X
A
M
Enrichment methodologies enable analysis of minor members in multi-species transcriptomic analyses. We compared standard enrichment of bacterial and eukaryotic mRNA to targeted enrichment with Agilent SureSelect (AgSS) capture for Brugia malayi, Aspergillus fumigatus, and the Wolbachia endosymbiont of B. malayi (wBm). Without introducing significant systematic bias, the AgSS quantitatively enriched samples, resulting in more reads mapping to the target organism. The AgSS-enriched libraries consistently had a positive linear correlation with its unenriched counterpart (r2=0.559-0.867). Up to a 2,242-fold enrichment of RNA from the target organism was obtained following a power law (r2=0.90), with the greatest fold enrichment achieved in samples with the largest ratio difference between the major and minor members. While using a single total library for prokaryote and eukaryote in a single sample could be beneficial for samples where RNA is limiting, we observed a decrease in reads mapping to protein coding genes and an increase of multi-mapping reads to rRNAs in AgSS enrichments from eukaryotic total RNA libraries as opposed to eukaryotic poly(A)-enriched libraries. Our results support a recommendation of using Agilent SureSelect targeted enrichment on poly(A)-enriched libraries for eukaryotic captures and total RNA libraries for prokaryotic captures to increase the robustness of multi-species transcriptomic studies.
5

DeterminingAspergillus fumigatustranscription factor expression and function during invasion of the mammalian lung

Hong Liu et al.Dec 23, 2020
+9
W
A
H
Abstract To gain a better understanding of the transcriptional response of Aspergillus fumigatus during invasive pulmonary infection, we used a NanoString nCounter to assess the transcript levels of 467 A. fumigatus genes during growth in the lungs of immunosuppressed mice. These genes included ones known to respond to diverse environmental conditions and those encoding most transcription factors in the A. fumigatus genome. We found that invasive growth in vivo induces a unique transcriptional profile as the organism responds to nutrient limitation and attack by host phagocytes. This in vivo transcriptional response is largely mimicked by in vitro growth in Aspergillus minimal medium that is deficient in nitrogen, iron, and/or zinc. From the transcriptional profiling data, we selected 9 transcription factor genes that were either highly expressed or strongly up-regulated during in vivo growth. Deletion mutants were constructed for each of these genes and assessed for virulence in mice. Two transcription factor genes were found to be required for maximal virulence. One was rlmA, which governs the ability of the organism to proliferate in the lung. The other was ace1 , which regulates of the expression of multiple secondary metabolite gene clusters and mycotoxin genes independently of laeA . Using deletion and overexpression mutants, we determined that the attenuated virulence of the Δ ace1 mutant is due to decreased expression aspf1, which specifies a ribotoxin, but is not mediated by reduced expression of the fumigaclavine gene cluster or the fumagillin-pseruotin supercluster. Thus, in vivo transcriptional profiling focused on transcription factors genes provides a facile approach to identifying novel virulence regulators. Author summary Although A. fumigatus causes the majority of cases of invasive aspergillosis, the function of most of the genes in its genome remains unknown. To identify genes encoding transcription factors that may be important for virulence, we used a NanoString nCounter to measure the mRNA levels of A. fumigatus transcription factor genes in the lungs of mice with invasive aspergillosis. The transcriptional profiling data indicate that the organism is exposed to nutrient limitation and stress during growth in the lungs, and that it responds by up-regulating genes that encode mycotoxins and secondary metabolites. In vitro, this response was most closely mimicked by growth in medium that was deficient in nitrogen, iron and/or zinc. Using the transcriptional profiling data, we identified two transcription factors that govern A. fumigatus virulence. These were RlmA, which is governs proliferation in the lung and Ace1, which controls the production of mycotoxins and secondary metabolites.