AS
Anita Schürch
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
12
(67% Open Access)
Cited by:
501
h-index:
29
/
i10-index:
41
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

CRISPR/Cas9-Mediated Genome Editing of Herpesviruses Limits Productive and Latent Infections

Ferdy Diemen et al.Jun 30, 2016
Herpesviruses infect the majority of the human population and can cause significant morbidity and mortality. Herpes simplex virus (HSV) type 1 causes cold sores and herpes simplex keratitis, whereas HSV-2 is responsible for genital herpes. Human cytomegalovirus (HCMV) is the most common viral cause of congenital defects and is responsible for serious disease in immuno-compromised individuals. Epstein-Barr virus (EBV) is associated with infectious mononucleosis and a broad range of malignancies, including Burkitt’s lymphoma, nasopharyngeal carcinoma, Hodgkin’s disease, and post-transplant lymphomas. Herpesviruses persist in their host for life by establishing a latent infection that is interrupted by periodic reactivation events during which replication occurs. Current antiviral drug treatments target the clinical manifestations of this productive stage, but they are ineffective at eliminating these viruses from the infected host. Here, we set out to combat both productive and latent herpesvirus infections by exploiting the CRISPR/Cas9 system to target viral genetic elements important for virus fitness. We show effective abrogation of HCMV and HSV-1 replication by targeting gRNAs to essential viral genes. Simultaneous targeting of HSV-1 with multiple gRNAs completely abolished the production of infectious particles from human cells. Using the same approach, EBV can be almost completely cleared from latently infected EBV-transformed human tumor cells. Our studies indicate that the CRISPR/Cas9 system can be effectively targeted to herpesvirus genomes as a potent prophylactic and therapeutic anti-viral strategy that may be used to impair viral replication and clear latent virus infection.
0
Citation258
0
Save
0

On the (im)possibility of reconstructing plasmids from whole-genome short-read sequencing data

Sergio Arredondo-Alonso et al.Aug 18, 2017
To benchmark algorithms for automated plasmid sequence reconstruction from short-read sequencing data, we selected 42 publicly available complete bacterial genome sequences spanning 12 genera, containing 148 plasmids. We predicted plasmids from short-read data with four programs (PlasmidSPAdes, Recycler, cBar and PlasmidFinder) and compared the outcome to the reference sequences. PlasmidSPAdes reconstructs plasmids based on coverage differences in the assembly graph. It reconstructed most of the reference plasmids (recall=0.82), but approximately a quarter of the predicted plasmid contigs were false positives (precision=0.75). PlasmidSPAdes merged 84 % of the predictions from genomes with multiple plasmids into a single bin. Recycler searches the assembly graph for sub-graphs corresponding to circular sequences and correctly predicted small plasmids, but failed with long plasmids (recall=0.12, precision=0.30). cBar, which applies pentamer frequency analysis to detect plasmid-derived contigs, showed a recall and precision of 0.76 and 0.62, respectively. However, cBar categorizes contigs as plasmid-derived and does not bin the different plasmids. PlasmidFinder, which searches for replicons, had the highest precision (1.0), but was restricted by the contents of its database and the contig length obtained from de novo assembly (recall=0.36). PlasmidSPAdes and Recycler detected putative small plasmids (<10 kbp), which were also predicted as plasmids by cBar, but were absent in the original assembly. This study shows that it is possible to automatically predict small plasmids. Prediction of large plasmids (>50 kbp) containing repeated sequences remains challenging and limits the high-throughput analysis of plasmids from short-read whole-genome sequencing data.
0
Citation238
0
Save
34

Consistent typing of plasmids with the mge-cluster pipeline

Sergio Arredondo-Alonso et al.Dec 19, 2022
Abstract Extrachromosomal elements of bacterial cells such as plasmids are notorious for their importance in evolution and adaptation to changing ecology. However, high-resolution population-wide analysis of plasmids has only become accessible recently with the advent of scalable long-read sequencing technology. Current typing methods for the classification of plasmids remain limited in their scope which motivated us to develop a computationally efficient approach to simultaneously recognize novel types and classify plasmids into previously identified groups. Our method can easily handle thousands of input sequences which are compressed using a unitig representation in a de Bruijn graph. We provide an intuitive visualization, classification and clustering scheme that users can explore interactively. This provides a framework that can be easily distributed and replicated, enabling a consistent labelling of plasmids across past, present, and future sequence collections. We illustrate the attractive features of our approach by the analysis of population-wide plasmid data from the opportunistic pathogen Escherichia coli and the distribution of the colistin resistance gene mcr-1 . 1 in the plasmid population.
34
Citation2
0
Save
26

Recovering Escherichia coli plasmids in the absence of long-read sequencing data

Julián Paganini et al.Jul 7, 2021
Abstract The incidence of infections caused by multidrug-resistant E. coli strains has risen in the past years. Antibiotic resistance in E. coli is often mediated by acquisition and maintenance of plasmids. The study of E. coli plasmid epidemiology and genomics often requires long-read sequencing information, but recently a number of tools that allow plasmid prediction from short-read data have been developed. Here, we reviewed 25 available plasmid prediction tools and categorized them into binary plasmid/chromosome classification tools and plasmid reconstruction tools. We benchmarked six tools that aim to reliably reconstruct distinct plasmids, with a special focus on plasmids carrying antibiotic resistance genes (ARGs) such as extended-spectrum beta-lactamase genes. They use either assembly graph information (plasmidSPAdes, gplas), reference databases (MOB-Suite, FishingForPlasmids) or both (HyAsP and SCAPP) to produce plasmid predictions. The benchmark data set consisted of 240 E. coli strains, harboring 631 plasmids, which were representative for the diversity of E. coli in public databases. Notably, these strains were not used for training any of the tools. We found that two thirds (n=425, 66.3.%) of all plasmids were correctly reconstructed by at least one of the six tools, with a range of 92 (14.58%) to 317 (50.23%) correctly predicted plasmids. However, the majority of plasmids that carried antibiotic resistance genes (n=85, 57.8%) could not be completely recovered as distinct plasmids by any of the tools. MOB-suite was the only tool that was able to correctly reconstruct the majority of plasmids (n=317, 50.23%), and performed best at reconstructing large plasmids (n=166, 46.37%) and ARG-plasmids (n=41, 27.9%), but predictions frequently contained chromosome contamination (40%). In contrast, plasmidSPAdes reconstructed the highest fraction of plasmids smaller than 18 kbp (n=168, 61.54%). Large ARG-plasmids, however, were recovered with small precision values (median=0.47, IQR=0.61), indicating that plasmidSPAdes frequently merged sequences derived from distinct replicons. Additionally, only 63% of all plasmid-borne ARGs were correctly predicted by plasmidSPAdes. The remaining four tools (FishingForPlasmids, HyAsP, SCAPP and gplas) were able to correctly reconstruct a combined total of 18 plasmids that were missed by MOB-suite and plasmidSPAdes. Available bioinformatic tools can provide valuable insight into E. coli plasmids, but also have important limitations. This work will serve as a guideline for selecting the most appropriate plasmid reconstruction tool for studies focusing on E. coli plasmids in the absence of long-read sequencing data.
26
Citation2
0
Save
41

A high-throughput multiplexing and selection strategy to complete bacterial genomes

Sergio Arredondo-Alonso et al.Jun 14, 2021
Abstract Background Bacterial whole-genome sequencing based on short-read sequencing data often results in a draft assembly formed by contiguous sequences. The introduction of long-read sequencing technologies permits to unambiguously bridge those contiguous sequences into complete genomes. However, the elevated costs associated with long-read sequencing frequently limit the number of bacterial isolates that can be long-read sequenced. Here we evaluated the recently released 96 barcoding kit from Oxford Nanopore Technologies (ONT) to generate complete genomes on a high-throughput basis. In addition, we propose a long-read isolate selection strategy that optimizes a representative selection of isolates from large-scale bacterial collections. Results Despite an uneven distribution of long-reads per barcode, near-complete chromosomal sequences (assembly contiguity = 0.89) were generated for 96 Escherichia coli isolates with associated short-read sequencing data. The assembly contiguity of the plasmid replicons was even higher (0.98) which indicated the suitability of the multiplexing strategy for studies focused on resolving plasmid sequences. We benchmarked hybrid and ONT-only assemblies and showed that the combination of ONT sequencing data with short-read sequencing data is still highly desirable: (i) to perform an unbiased selection of isolates for long-read sequencing, (ii) to achieve an optimal genome accuracy and completeness, and (iii) to include small plasmids underrepresented in the ONT library. Conclusions The proposed long-read isolate selection ensures completing bacterial genomes of isolates that span the genome diversity inherent in large collections of bacterial isolates. We show the potential of using this multiplexing approach to close bacterial genomes on a high-throughput basis.
41
Citation1
0
Save
3

Genomic rearrangements uncovered by genome-wide co-evolution analysis of a major nosocomial pathogen Enterococcus faecium

Janetta Top et al.Oct 20, 2020
Abstract Enterococcus faecium is a gut commensal of the gastro-digestive tract, but also known as nosocomial pathogen among hospitalized patients. Population genetics based on whole-genome sequencing has revealed that E. faecium strains from hospitalized patients form a distinct clade, designated as clade A1 and that plasmids are major contributors to the emergence of nosocomial E. faecium . Here we further explored the adaptive evolution of E. faecium using a genome-wide co-evolution study (GWES) to identify co-evolving SNPs. We identified three genomic regions harboring large numbers of SNPs in tight linkage which are not proximal to each other based on the completely assembled chromosome of clade A1 reference hospital isolate AUS0004. Close examination of these regions revealed that they are located at the borders of four different types of large-scale genomic rearrangements, insertion sites of two different genomic islands and an IS 30 -like transposon. In non-clade A1 isolates, these regions are adjacent to each other and they lack the insertions of the genomic islands and IS 30 -like transposon. Additionally, among the clade A1 isolates there is one group of pet isolates lacking the genomic rearrangement and insertion of the genomic islands, suggesting a distinct evolutionary trajectory. In silico analysis of the biological functions of the genes encoded in three regions revealed a common link to a stress response. This suggests that these rearrangements may reflect adaptation to the stringent conditions in the hospital environment, such as antibiotics and detergents, to which bacteria are exposed. In conclusion, to our knowledge, this is the first study using GWES to identify genomic rearrangements, suggesting that there is considerable untapped potential to unravel hidden evolutionary signals from population genomic data. Impact statement Enterococcus faecium has emerged as an important nosocomial pathogen around the world. Population genetics revealed that clinical E. faecium strains form a distinct clade, designated as clade A1 and that plasmids are major contributors to the emergence of nosocomial E. faecium . Here, the adaptive evolution of E. faecium was further explored using an unsupervised machine learning method (SuperDCA) to identify genome-wide co-evolving SNPs. We identified three genomic regions harboring large numbers of SNPs in tight linkage which are separated by a large chromosomal distance in a clinical clade A1 reference isolate, but appeared adjacent to each other in non-clade A1 isolates. We identified four different types of large-scale genomic rearrangements and in all cases, we found insertion of two different genomic islands and an insertion element at the border. In contrast, no genomic rearrangement and insertions were identified among a group of clade A1 pet isolates, suggesting a distinct evolutionary trajectory. Based on the in silico predicted biological functions, we found a common link to a stress response for the genes encoded in three regions. This suggests that these rearrangements may reflect adaptation to the stringent conditions in the hospital environment, such as antibiotics and detergents, to which bacteria are exposed. Data summary Raw core-genome alignment (1.1 MB, Harvest suite v1.1.2), including the 1,644 Clade A isolates and the complete E. faecium AUS0004 (accession number CP003351 ) as a reference is available under the following gitlab repository https://gitlab.com/sirarredondo/efm_gwes .
1

PlasmidEC and gplas2: An optimised short-read approach to predict and reconstruct antibiotic resistance plasmids inEscherichia coli

Julián Paganini et al.Sep 3, 2023
Abstract Accurate reconstruction of Escherichia coli antibiotic resistance gene (ARG) plasmids from Illumina sequencing data has proven to be a challenge with current bioinformatic tools. In this work, we present an improved method to reconstruct E. coli plasmids using short reads. We developed plasmidEC, an ensemble classifier that identifies plasmid-derived contigs by combining the output of three different binary classification tools. We showed that plasmidEC is especially suited to classify contigs derived from ARG plasmids with a high recall of 0.941. Additionally, we optimised gplas, a graph-based tool that bins plasmid-predicted contigs into distinct plasmid predictions. Gplas2 is more effective at recovering plasmids with large sequencing coverage variations and can be combined with the output of any binary classifier. The combination of plasmidEC with gplas2 showed a high completeness (median=0.818) and F1-score (median=0.812) when reconstructing ARG plasmids and exceeded the binning capacity of the reference-based method MOB-suite. In the absence of long read data, our method offers an excellent alternative to reconstruct ARG plasmids in E. coli . Data Summary No new sequencing data have been generated in this study. All genomes used in this research are publicly available at the GenBank and Sequence Read Archive of the National Center for Biotechnology Information. Accession numbers are specified in Supplementary Materials. Scripts to reproduce the results reported in this manuscript can be accessed at https://gitlab.com/jpaganini/ecoli-binary-classifier . The ensemble classifier, plasmidEC, is publicly available at https://gitlab.com/mmb-umcu/plasmidEC (release 1.3.1), and gplas2 (release 1.0.0) can be found at https://gitlab.com/mmb-umcu/gplas2 . Impact Statement Escherichia coli has emerged as a highly pervasive multidrug resistant pathogen on a global scale. The dissemination of resistance is significantly influenced by plasmids, mobile genetic elements that facilitate the transfer of antimicrobial resistance genes within and between diverse bacterial species. Consequently, precise and high-throughput identification of plasmids is imperative for effective genomic surveillance of resistance. However, accurate plasmid reconstruction remains challenging with the use of affordable short-read sequencing data. In this work, we present a novel method to accurately predict and reconstruct E. coli plasmids based on Illumina data. Additionally, we demonstrate that our approach outperforms the reference-based method MOB-suite, especially when reconstructing plasmids carrying antimicrobial resistance genes.
0

Extended-spectrum beta-lactamase (ESBL)-producing and non-ESBL-producing Escherichia coli isolates causing bacteremia in the Netherlands (2014 – 2016) differ in clonal distribution, antimicrobial resistance gene and virulence gene content

Denise Hout et al.Aug 15, 2019
Background Knowledge on the molecular epidemiology of Escherichia coli causing E. coli bacteremia (ECB) in the Netherlands is mostly based on extended-spectrum beta-lactamase-producing E. coli (ESBL-Ec). We determined differences in clonality and resistance and virulence gene (VG) content between non-ESBL-producing E. coli (non-ESBL-Ec) and ESBL-Ec blood isolates with different epidemiological characteristics.Materials/methods A random selection of non-ESBL-Ec isolates as well as all available ESBL-Ec blood isolates was obtained from two Dutch hospitals between 2014 and 2016. Whole genome sequencing was performed to infer sequence types (STs), serotypes, acquired antibiotic resistance genes and VG scores, based on presence of 49 predefined putative pathogenic VG.Results ST73 was most prevalent among the 212 non-ESBL-Ec (N=26, 12.3%) and ST131 among the 69 ESBL-Ec (N=30, 43.5%). Prevalence of ST131 among non-ESBL-Ec was 10.4% (N=22, P value < 0.001 compared to ESBL-Ec). O25:H4 was the most common serotype in both non-ESBL-Ec and ESBL-Ec. Median acquired resistance gene counts were 1 (IQR 1 – 6) and 7 (IQR 4 – 9) for non-ESBL-Ec and ESBL-Ec, respectively ( P value < 0.001). Among non-ESBL-Ec, acquired resistance gene count was highest among blood isolates from a primary gastro-intestinal focus (median 4, IQR 1 – 8). Median VG scores were 13 (IQR 9 – 20) and 12 (IQR 8 – 14) for non-ESBL-Ec and ESBL-Ec, respectively ( P value = 0.002). VG scores among non-ESBL-Ec from a primary urinary focus (median 15, IQR 11 – 21) were higher compared to non-ESBL-Ec from a primary gastro-intestinal (median 10, IQR 6 – 13) or hepatic-biliary focus (median 11, IQR 5 – 18) ( P values = 0.007 and 0.036, respectively). VG content varied between different E. coli STs.Conclusions Non-ESBL-Ec and ESBL-Ec blood isolates from two Dutch hospitals differed in clonal distribution, resistance gene and VG content. Also, resistance gene and VG content differed between non-ESBL-Ec from different primary foci of ECB.
Load More