DG
Devika Ganesamoorthy
Author with expertise in RNA Sequencing Data Analysis
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
11
(0% Open Access)
Cited by:
0
h-index:
19
/
i10-index:
25
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Scaffolding and Completing Genome Assemblies in Real-time with Nanopore Sequencing

Minh Cao et al.May 22, 2016
Genome assemblies obtained from short read sequencing technologies are often fragmented into many contigs because of the abundance of repetitive sequences. Long read sequencing technologies allow the generation of reads spanning most repeat sequences, providing the opportunity to complete these genome assemblies. However, substantial amounts of sequence data and computational resources are required to overcome the high per-base error rate inherent to these technologies. Furthermore, most existing methods only assemble the genomes after sequencing has completed which could result in either generation of more sequence data at greater cost than required or a low-quality assembly if insufficient data are generated. Here we present the first computational method which utilises real-time nanopore sequencing to scaffold and complete short-read assemblies while the long read sequence data is being generated. The method reports the progress of completing the assembly in real-time so users can terminate the sequencing once an assembly of sufficient quality and completeness is obtained. We use our method to complete four bacterial genomes and one eukaryotic genome, and show that it is able to construct more complete and more accurate assemblies, and at the same time, requires less sequencing data and computational resources than existing pipelines. We also demonstrate that the method can facilitate real-time analyses of positional information such as identification of bacterial genes encoded in plasmids and pathogenicity islands.
0

Streaming algorithms for identification of pathogens and antibiotic resistance potential from real-time MinION sequencing

Minh Cao et al.May 15, 2015
The recently introduced Oxford Nanopore MinION platform generates DNA sequence data in real-time. This opens immense potential to shorten the sample-to-results time and is likely to lead to enormous benefits in rapid diagnosis of bacterial infection and identification of drug resistance. However, there are very few tools available for streaming analysis of real-time sequencing data. Here, we present a framework for streaming analysis of MinION real-time sequence data, together with probabilistic streaming algorithms for species typing, multi-locus strain typing, gene presence strain-typing and antibiotic resistance profile identification. Using three culture isolate samples as well as a mixed-species sample, we demonstrate that bacterial species and strain information can be obtained within 30 minutes of sequencing and using about 500 reads, initial drug-resistance profiles within two hours, and complete resistance profiles within 10 hours. Multi-locus strain typing required more than 15x coverage to generate confident assignments, whereas gene-presence typing could detect the presence of a known strain with 0.5x coverage. We also show that our pipeline can process over 100 times more data than the current throughput of the MinION on a desktop computer.
0

Multifactorial Chromosomal Variants Regulate Polymyxin Resistance In Extensively Drug-Resistant Klebsiella pneumoniae

Miranda Pitt et al.May 8, 2017
Extensively drug-resistant Klebsiella pneumoniae (XDR-KP) infections cause high mortality and are disseminating globally. Identifying the genetic basis underpinning resistance allows for rapid diagnosis and treatment. XDR isolates sourced from Greece and Brazil, including nineteen polymyxin-resistant and five polymyxin-susceptible strains, underwent whole genome sequencing. Approximately 90% of polymyxin resistance was enabled by alterations upstream or within mgrB. The most common mutation identified was an insertion at nucleotide position 75 in mgrB via an ISKpn26-like element in the ST258 lineage and ISKpn13 in one ST11 isolate. Three strains acquired an IS1 element upstream of mgrB and another strain had an ISKpn25 insertion at 133 bp. Other isolates had truncations (C28STOP, Q30STOP) or a missense mutation (D31E) affecting mgrB. Complementation assays revealed all mgrB perturbations contributed to resistance. Missense mutations in phoQ (T281M, G385C) were also found to facilitate resistance. Several variants in phoPQ co-segregating with the ISKpn26-like insertion were identified as potential partial suppressor mutations. Three ST258 samples were found to contain subpopulations with different resistance conferring mutations, including the ISKpn26-like insertion colonising with a novel mutation in pmrB (P158R), both confirmed via complementation assays. We also characterized a new multi-drug resistant Klebsiella quasipneumoniae strain ST2401 which was susceptible to polymyxins. These findings highlight the broad spectrum of chromosomal modifications which can facilitate and regulate resistance against polymyxins in K. pneumoniae.
0

Octapeptin C4 Induces Less Resistance and Novel Mutations in an Epidemic Carbapenemase-producing Klebsiella pneumoniae ST258 Clinical Isolate Compared to Polymyxins

Miranda Pitt et al.Apr 28, 2018
Polymyxin B and E (colistin) have been pivotal in the treatment of extensively drug-resistant (XDR) Gram-negative bacterial infections, with increasing use over the past decade. Unfortunately, resistance to these antibiotics is rapidly emerging. The structurally-related octapeptin C4 (OctC4) has shown significant potency against XDR bacteria, including against polymyxin-resistant (Pmx-R) strains, but its mode of action remains undefined. We sought to compare and contrast the acquisition of XDR Klebsiella pneumoniae (ST258) resistance in vitro with all three lipopeptides to help elucidate the mode of action of the drugs and potential mechanisms of resistance evolution. Strikingly, 20 days of exposure to the polymyxins resulted in a dramatic (1000-fold) increase in the minimum inhibitory concentration (MIC) for the polymyxins, reflecting the evolution of resistance seen in clinical isolates, whereas for OctC4 only a 4-fold increase was witnessed. There was no cross-resistance observed between the polymyxin- and octapeptin-induced resistant strains. Sequencing revealed previously known gene alterations for polymyxin resistance, including crrB, mgrB, pmrB, phoPQ and yciM, and novel mutations in qseC. In contrast, mutations in mlaDF and pqiB, genes related to phospholipid transport, were found in octapeptin-resistant isolates. Mutation effects were validated via complementation assays. These genetic variations were reflected in phenotypic changes to lipid A. Pmx-R isolates increased 4-amino-4-deoxy-arabinose fortification to phosphate groups of lipid A, whereas OctC4 induced strains harbored a higher abundance of hydroxymyristate and palmitoylate. The results reveal a differing mode of action compared to polymyxins which provides hope for future therapeutics to combat the increasingly threat of XDR bacteria.
0

GtTR: Bayesian estimation of absolute tandem repeat copy number using sequence capture and high throughput sequencing

Devika Ganesamoorthy et al.Jan 10, 2018
Background: Tandem repeats comprise significant proportion of the human genome including coding and regulatory regions. They are highly prone to repeat number variation and nucleotide mutation due to their repetitive and unstable nature, making them a major source of genomic variation between individuals. Despite recent advances in high throughput sequencing, analysis of tandem repeats in the context of complex diseases is still hindered by technical limitations. Methods: We report a novel targeted sequencing approach, which allows simultaneous analysis of hundreds of repeats. We developed a Bayesian algorithm, namely - GtTR - which combines information from a reference long-read dataset with a short read counting approach to genotype tandem repeats at population scale. PCR sizing analysis was used for validation. Results: We used a PacBio long-read sequenced sample to generate a reference tandem repeat genotype dataset with on average 13% absolute deviation from PCR sizing results. Using this reference dataset GtTR generated estimates of VNTR copy number with accuracy within 95% high posterior density (HPD) intervals of 68% and 83% for capture sequence data and 200X WGS data respectively, improving to 87% and 94% with use of a PCR reference. We show that the genotype resolution increases as a function of depth, such that the median 95% HPD interval lies within 25%, 14%, 12% and 8% of the its midpoint copy number value for 30X, 200X WGS, 395X and 800X capture sequence data respectively. We validated nine targets by PCR sizing analysis and genotype estimates from sequencing results correlated well with PCR results. Conclusions: The novel genotyping approach described here presents a new cost-effective method to explore previously unrecognized class of repeat variation in GWAS studies of complex diseases at the population level. Further improvements in accuracy can be obtained by improving accuracy of the reference dataset.
0

High-throughput multiplexed tandem repeat genotyping using targeted long-read sequencing

Devika Ganesamoorthy et al.Jun 17, 2019
Tandem repeats (TRs) are highly prone to variation in copy numbers due to their repetitive and unstable nature, which makes them a major source of genomic variation between individuals. However, population variation of TRs have not been widely explored due to the limitations of existing tools, which are either low-throughput or restricted to a small subset of TRs. Here, we used SureSelect targeted sequencing approach combined with Nanopore sequencing to overcome these limitations. We achieved an average of 3062-fold target enrichment on a panel of 142 TR loci, generating an average of 97X sequence coverage on 7 samples utilizing 2 MinION flow-cells with 200ng of input DNA per sample. We identified a subset of 110 TR loci with length less than 2kb, and GC content greater than 25% for which we achieved an average genotyping rate of 75% and increasing to 91% for the highest-coverage sample. Alleles estimated from targeted long-read sequencing were concordant with gold standard PCR sizing analysis and moreover highly correlated with alleles estimated from whole genome long-read sequencing. We demonstrate a targeted long-read sequencing approach that enables simultaneous analysis of hundreds of TRs and accuracy is comparable to PCR sizing analysis. Our approach is feasible to scale for more targets and more samples facilitating large-scale analysis of TRs.
0

sCNAphase: using haplotype resolved read depth to genotype somatic copy number alterations from low cellularity aneuploid tumors

Wenhan Chen et al.Feb 4, 2016
Accurate identification of copy number alterations is an essential step in understanding the events driving tumor progression. While a variety of algorithms have been developed to use high-throughput sequencing data to profile copy number changes, no tool is able to reliably characterize ploidy and genotype absolute copy number from tumor samples which contain less than 40% tumor cells. To increase our power to resolve the copy number profile from low-cellularity tumor samples, we developed a novel approach which pre-phases heterozygote germline SNPs in order to replace the commonly used 'B-allele frequency' with a more powerful 'parental-haplotype frequency'. We apply our tool - sCNAphase - to characterize the copy number and loss-of-heterozygosity profiles of four publicly available breast cancer cell-lines. Comparisons to previous spectral karyotyping and microarray studies revealed that sCNAphase reliably identified overall ploidy as well as the individual copy number mutations from each cell-line. Analysis of artificial cell-line mixtures demonstrated the capacity of this method to determine the level of tumor cellularity, consistently identify sCNAs and characterize ploidy in samples with as little as 10% tumor cells. This novel methodology has the potential to bring sCNA profiling to low-cellularity tumors, a form of cancer unable to be accurately studied by current methods.
0

Profiling copy number alterations in cell-free tumour DNA using a single-reference

Alan Robertson et al.Mar 28, 2018
Background: The accurate detection of copy number alterations from the analysis of circulating cell free tumour DNA (ctDNA) in blood is essential to realising the potential of liquid biopsies. However, existing approaches require a large number of plasma samples from healthy individuals, sequenced using the same platform and protocols to act as a reference panel. Obtaining this reference panel can be challenging, prohibitively expensive and limits the ability to migrate to improved sequencing platforms and improved protocols. Methods: We developed qCNV and sCNA-seq, two distinct tools that together provide a new approach for profiling somatic copy number alterations (sCNA) through the analysis of cell free DNA (cfDNA) without a reference panel. Our approach was designed to identify sCNA from cfDNA through the analysis of a single plasma sample and a matched normal DNA sample - both of which can be obtained from the same blood draw. qCNV is an efficient method for extracting read-depth from BAM files and sCNA-seq is a method that uses a probabilistic model of read depth to infer the copy number segmentation of the tumour. We compared the results from our pipeline to the established copy number profile of a cell-line, as well as the results from the plasma-Seq analysis of cfDNA-like mixtures and real, clinical data-sets. Results: With a single, unmatched, germline reference sample, our pipeline recapitulated the known copy number profile of a cell-line and demonstrated similar results to those obtained from plasma-Seq. With less than 1X genome coverage, our approach identified clinically relevant sCNA in samples with as little as 20 % tumour DNA. When applied to plasma samples from cancer patients, our pipeline identified clinically significant mutations. Conclusions: These results show it is possible to identify therapeutically-relevant copy number mutations from plasma samples without the need to generate a reference panel from a large number of healthy individuals. Together with the range of sequencing platforms supported by our qCNV+sCNA-Seq pipeline, as well as the Galaxy implementation of this solution, this pipeline makes cfDNA profiling more accessible and makes it easier to identify sCNA from the plasma of cancer patients.
Load More