IT
Igor Tolstoy
Author with expertise in Ecology and Evolution of Viruses in Ecosystems
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
9
(89% Open Access)
Cited by:
2,018
h-index:
14
/
i10-index:
16
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Validating the AMRFinder Tool and Resistance Gene Database by Using Antimicrobial Resistance Genotype-Phenotype Correlations in a Collection of Isolates

Michael Feldgarden et al.Aug 14, 2019
+14
D
V
M
Antimicrobial resistance (AMR) is a major public health problem that requires publicly available tools for rapid analysis. To identify AMR genes in whole-genome sequences, the National Center for Biotechnology Information (NCBI) has produced AMRFinder, a tool that identifies AMR genes using a high-quality curated AMR gene reference database.
0
Citation912
0
Save
0

Gene: a gene-centered information resource at NCBI

Garth Brown et al.Oct 29, 2014
+8
K
V
G
The National Center for Biotechnology Information's (NCBI) Gene database (www.ncbi.nlm.nih.gov/gene) integrates gene-specific information from multiple data sources. NCBI Reference Sequence (RefSeq) genomes for viruses, prokaryotes and eukaryotes are the primary foundation for Gene records in that they form the critical association between sequence and a tracked gene upon which additional functional and descriptive content is anchored. Additional content is integrated based on the genomic location and RefSeq transcript and protein sequence data. The content of a Gene record represents the integration of curation and automated processing from RefSeq, collaborating model organism databases, consortia such as Gene Ontology, and other databases within NCBI. Records in Gene are assigned unique, tracked integers as identifiers. The content (citations, nomenclature, genomic location, gene products and their attributes, phenotypes, sequences, interactions, variation details, maps, expression, homologs, protein domains and external databases) is available via interactive browsing through NCBI's Entrez system, via NCBI's Entrez programming utilities (E-Utilities and Entrez Direct) and for bulk transfer by FTP.
0
Citation573
0
Save
0

RefSeq microbial genomes database: new representation and annotation strategy

Tatiana Tatusova et al.Dec 6, 2013
+2
B
S
T
Journal Article RefSeq microbial genomes database: new representation and annotation strategy Get access Tatiana Tatusova, Tatiana Tatusova * National Center for Biotechnology Information, National Library of Medicine, National Institutes of Health, Bldg. 38A 8600 Rockville Pike, Bethesda, MD 20894, USA *To whom correspondence should be addressed. Tel: +11 301 435 5756; Fax: +11 301 402 9651; Email: tatiana@ncbi.nlm.nih.gov Search for other works by this author on: Oxford Academic PubMed Google Scholar Stacy Ciufo, Stacy Ciufo National Center for Biotechnology Information, National Library of Medicine, National Institutes of Health, Bldg. 38A 8600 Rockville Pike, Bethesda, MD 20894, USA Search for other works by this author on: Oxford Academic PubMed Google Scholar Boris Fedorov, Boris Fedorov National Center for Biotechnology Information, National Library of Medicine, National Institutes of Health, Bldg. 38A 8600 Rockville Pike, Bethesda, MD 20894, USA Search for other works by this author on: Oxford Academic PubMed Google Scholar Kathleen O’Neill, Kathleen O’Neill National Center for Biotechnology Information, National Library of Medicine, National Institutes of Health, Bldg. 38A 8600 Rockville Pike, Bethesda, MD 20894, USA Search for other works by this author on: Oxford Academic PubMed Google Scholar Igor Tolstoy Igor Tolstoy National Center for Biotechnology Information, National Library of Medicine, National Institutes of Health, Bldg. 38A 8600 Rockville Pike, Bethesda, MD 20894, USA Search for other works by this author on: Oxford Academic PubMed Google Scholar Nucleic Acids Research, Volume 42, Issue D1, 1 January 2014, Pages D553–D559, https://doi.org/10.1093/nar/gkt1274 Published: 07 December 2013 Article history Received: 22 October 2013 Revision received: 15 November 2013 Accepted: 18 November 2013 Published: 07 December 2013
0
Citation466
0
Save
0

Using the NCBI AMRFinder Tool to Determine Antimicrobial Resistance Genotype-Phenotype Correlations Within a Collection of NARMS Isolates

Michael Feldgarden et al.Feb 15, 2019
+14
D
V
M
Abstract Antimicrobial resistance (AMR) is a major public health problem that requires publicly available tools for rapid analysis. To identify acquired AMR genes in whole genome sequences, the National Center for Biotechnology Information (NCBI) has produced a high-quality, curated, AMR gene reference database consisting of up-to-date protein and gene nomenclature, a set of hidden Markov models (HMMs), and a curated protein family hierarchy. Currently, the Bacterial Antimicrobial Resistance Reference Gene Database contains 4,579 antimicrobial resistance gene proteins and more than 560 HMMs. Here, we describe AMRFinder, a tool that uses this reference dataset to identify AMR genes. To assess the predictive ability of AMRFinder, we measured the consistency between predicted AMR genotypes from AMRFinder against resistance phenotypes of 6,242 isolates from the National Antimicrobial Resistance Monitoring System (NARMS). This included 5,425 Salmonella enterica , 770 Campylobacter spp., and 47 Escherichia coli phenotypically tested against various antimicrobial agents. Of 87,679 susceptibility tests performed, 98.4% were consistent with predictions. To assess the accuracy of AMRFinder, we compared its gene symbol output with that of a 2017 version of ResFinder, another publicly available resistance gene database. Most gene calls were identical, but there were 1,229 gene symbol differences between them, with differences due to both algorithmic differences and database composition. AMRFinder missed 16 loci that Resfinder found, while Resfinder missed 1,147 loci AMRFinder identified. Two missing drug classes from the 2017 version of ResFinder contributed 81% of missed loci. Based on these results, AMRFinder appears to be a highly accurate AMR gene detection system. Importance Antimicrobial resistance is a major public health problem. Traditionally, antimicrobial resistance has been identified using phenotypic assays. With the advent of genome sequencing, we now can identify resistance genes and deduce if an isolate could be resistant to antibiotics. We describe a database of 4,579 acquired antimicrobial resistance genes, the largest publicly available, and a software tool to identify genes in bacterial genomes, AMRFinder. Unlike other tools, AMRFinder uses a gene hierarchy to prevent overpredicting what the correct gene call should be, enabling more accurate assessment. To assess these resources, we determined the resistance gene content of over 6,200 bacterial isolates from the National Antimicrobial Resistance Monitoring System that have been assayed using traditional methods and that also have had their genomes sequenced. We also compared our gene assessments to those of a popularly used tool. We found that AMRFinder has a high overall consistency between genotypes and phenotypes.
0
Citation64
0
Save
0

Unique genomic features of crAss-like phages, the dominant component of the human gut virome

Natalya Yutin et al.Jul 20, 2020
+6
S
S
N
Abstract CrAssphage is the most abundant virus identified in the human gut virome and the founding member of a large group of bacteriophages that infect bacteria of the phylum Bacteroidetes and have been discovered by metagenomics of both animal-associated and environmental habitats. By analysis of circular contigs from human gut microbiomes, we identified nearly 600 genomes of crAss-like phages. Phylogenetic analysis of conserved genes demonstrates the monophyly of crAss-like phages, which can be expected to become a new order of viruses, and of 5 distinct branches, likely, families within that order. Two of these putative families have not been identified previously. The phages in one of these groups have large genomes (145-192 kilobases) and contain an unprecedented high density of self-splicing introns and inteins. Many crAss-like phages encode suppressor tRNAs that enable readthrough of UGA or UAG stop-codons, mostly, in late phage genes, which could represent a distinct anti-defense strategy. Another putative anti-defense mechanism that might target an unknown defense system in Bacteroidetes inhibiting phage DNA replication involves multiple switches of the phage DNA polymerase type between A and B families. Thus, comparative genomic analysis of the expanded assemblage of crAss-like phages reveals several unusual features of genome architecture and expression as well as phage biology that were not apparent from the previous crAssphage analyses.
0
Citation3
0
Save
0

DNA polymerase swapping in Caudoviricetes bacteriophages

Natalya Yutin et al.Aug 26, 2024
+2
P
I
N
Abstract Background Viruses with double-stranded (ds) DNA genomes in the realm Duplodnaviria share a conserved structural gene module but show a broad range of variation in their repertoires of DNA replication proteins. Some of the duplodnaviruses encode (nearly) complete replication systems whereas others lack (almost) all genes required for replication, relying on the host replication machinery. DNA polymerases (DNAPs) comprise the centerpiece of the DNA replication apparatus. The replicative DNAPs are classified into 4 unrelated or distantly related families (A-D), with the protein structures and sequences within each family being, generally, highly conserved. More than half of the duplodnaviruses encode a DNAP of family A, B or C. We showed previously that multiple pairs of closely related viruses in the order Crassvirales encode DNAPs of different families. Methods Groups of phages in which DNAP swapping likely occurred were identified as subtrees of a defined depth in a comprehensive evolutionary tree of tailed bacteriophages that included phages with DNAPs of different families. The DNAP swaps were validated by constrained tree analysis that was performed on phylogenetic tree of large terminase subunits, and the phage genomes encoding swapped DNAPs were aligned using Mauve. The structures of the discovered unusual DNAPs were predicted using AlphaFold2. Results We identified four additional groups of tailed phages in the class Caudoviricetes in which the DNAPs apparently were swapped on multiple occasions, with replacements occurring both between families A and B, or A and C, or between distinct subfamilies within the same family. The DNAP swapping always occurs “in situ”, without changes in the organization of the surrounding genes. In several cases, the DNAP gene is the only region of substantial divergence between closely related phage genomes, whereas in others, the swap apparently involved neighboring genes encoding other proteins involved in phage genome replication. In addition, we identified two previously undetected, highly divergent groups of family A DNAPs that are encoded in some phage genomes along with the main DNAP implicated in genome replication. Conclusions Replacement of the DNAP gene by one encoding a DNAP of a different family occurred on many independent occasions during the evolution of different families of tailed phages, in some cases, resulting in very closely related phages encoding unrelated DNAPs. DNAP swapping was likely driven by selection for avoidance of host antiphage mechanisms targeting the phage DNAP that remain to be identified, and/or by selection against replicon incompatibility.
0

Analysis of Spounaviruses as a Case Study for the Overdue Reclassification of Tailed Bacteriophages

Jakub Barylski et al.Nov 16, 2017
+15
J
P
J
It is almost a cliche that tailed bacteriophages of the order Caudovirales are the most abundant and diverse viruses in the world. Yet, their taxonomy still consists of a single order with just three families: Myoviridae, Siphoviridae, and Podoviridae. Thousands of newly discovered phage genomes have recently challenged this morphology-based classification, revealing that tailed bacteriophages are genomically even more diverse than once thought. Here, we evaluate a range of methods for bacteriophage taxonomy by using a particularly challenging group as an example, the Bacillus phage SPO1-related viruses of the myovirid subfamily Spounavirinae. Exhaustive phylogenetic and phylogenomic analyses indicate that the spounavirins are consistent with the taxonomic rank of family and should be divided into at least five subfamilies. This work is a case study for virus genomic taxonomy and the first step in an impending massive reorganization of the tailed bacteriophage taxonomy.
0

Jumping DNA polymerases in bacteriophages

Natalya Yutin et al.Apr 27, 2024
+3
P
I
N
Viruses with double-stranded (ds) DNA genomes in the realm
1

Type IV pili is a critical virulence factor in clinical isolates ofPaenibacillus thiaminolyticus

Christine Hehnly et al.Jan 24, 2022
+13
P
A
C
Abstract Hydrocephalus, the leading indication for childhood neurosurgery worldwide, is particularly prevalent in low-and-middle-income countries (LMICs). Hydrocephalus preceded by an infection, or postinfectious hydrocephalus (PIH), accounts for up to 60% of hydrocephalus in LMICs. Since many children with hydrocephalus suffer poor long-term outcomes despite surgical intervention, prevention of hydrocephalus remains paramount. Our previous studies implicated a novel bacterial pathogen, Paenibacillus thiaminolyticus, as a contributor to PIH in Uganda. Here we report the isolation of three P. thiaminolyticus strains, Mbale, Mbale2, and Mbale3, from patients with PIH and the demonstration that the three clinical isolates exhibit virulence in mice while P. thiaminolyticus type strain, B-4156, does not. We constructed complete genome assemblies of the clinical isolates as well as the reference strain and performed comparative genomics and proteomics analyses to identify potential virulence factors. One candidate virulence factor is a cluster of genes carried on a mobile genetic element that encodes a type IV pilus and is present in all three PIH patient strains but absent in the type strain. Proteomic and transcriptomic data confirmed the expression of this cluster of genes in the Mbale strain, while CRISPR-mediated deletion of the gene cluster substantially reduced the virulence of this strain. Our comparative proteogenomic analysis also identified various antibiotic resistance loci in the virulent strains. These results provide insight into the mechanism of virulence of Paenibacillus thiaminolyticus and suggest avenues for the diagnosis and treatment of this novel bacterial pathogen. Author Summary Postinfectious hydrocephalus (PIH), a devastating sequela of neonatal infection, is associated with increased childhood mortality and morbidity. Paenibacillus thiaminolyticus was recently identified as the dominant organism highly associated with PIH in an African cohort. Our whole-genome sequencing, RNA sequencing and proteomics of three clinical isolates and a type strain in combination with CRISPR editing has revealed the type IV pili (T4P), encoded in a mobile genetic element, as a critical virulence factor for P. thiaminolyticus infection. Given the widespread presence of T4P in pathogens, the presence of T4P operon could serve as an important diagnostic and therapeutic target in P. thiaminolyticus and related bacteria.