AC
Antônio Camargo
Author with expertise in Ecology and Evolution of Viruses in Ecosystems
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
14
(86% Open Access)
Cited by:
1,253
h-index:
20
/
i10-index:
24
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

CheckV assesses the quality and completeness of metagenome-assembled viral genomes

Stephen Nayfach et al.Dec 21, 2020
Abstract Millions of new viral sequences have been identified from metagenomes, but the quality and completeness of these sequences vary considerably. Here we present CheckV, an automated pipeline for identifying closed viral genomes, estimating the completeness of genome fragments and removing flanking host regions from integrated proviruses. CheckV estimates completeness by comparing sequences with a large database of complete viral genomes, including 76,262 identified from a systematic search of publicly available metagenomes, metatranscriptomes and metaviromes. After validation on mock datasets and comparison to existing methods, we applied CheckV to large and diverse collections of metagenome-assembled viral sequences, including IMG/VR and the Global Ocean Virome. This revealed 44,652 high-quality viral genomes (that is, >90% complete), although the vast majority of sequences were small fragments, which highlights the challenge of assembling viral genomes from short-read metagenomes. Additionally, we found that removal of host contamination substantially improved the accurate identification of auxiliary metabolic genes and interpretation of viral-encoded functions.
0
Citation970
0
Save
0

IMG/VR v4: an expanded database of uncultivated virus genomes within a framework of extensive functional, taxonomic, and ecological metadata

Antônio Camargo et al.Nov 18, 2022
Viruses are widely recognized as critical members of all microbiomes. Metagenomics enables large-scale exploration of the global virosphere, progressively revealing the extensive genomic diversity of viruses on Earth and highlighting the myriad of ways by which viruses impact biological processes. IMG/VR provides access to the largest collection of viral sequences obtained from (meta)genomes, along with functional annotation and rich metadata. A web interface enables users to efficiently browse and search viruses based on genome features and/or sequence similarity. Here, we present the fourth version of IMG/VR, composed of >15 million virus genomes and genome fragments, a ≈6-fold increase in size compared to the previous version. These clustered into 8.7 million viral operational taxonomic units, including 231 408 with at least one high-quality representative. Viral sequences in IMG/VR are now systematically identified from genomes, metagenomes, and metatranscriptomes using a new detection approach (geNomad), and IMG standard annotation are complemented with genome quality estimation using CheckV, taxonomic classification reflecting the latest taxonomic standards, and microbial host taxonomy prediction. IMG/VR v4 is available at https://img.jgi.doe.gov/vr, and the underlying data are available to download at https://genome.jgi.doe.gov/portal/IMG_VR.
0
Citation193
0
Save
178

CheckV: assessing the quality of metagenome-assembled viral genomes

Stephen Nayfach et al.May 8, 2020
Abstract Over the last several years, metagenomics has enabled the assembly of millions of new viral sequences that have vastly expanded our knowledge of Earth’s viral diversity. However, these sequences range from small fragments to complete genomes and no tools currently exist for estimating their quality. To address this problem, we developed CheckV, which is an automated pipeline for estimating the completeness of viral genomes as well as the identification and removal of non-viral regions found on integrated proviruses. After validating the approach on mock datasets, CheckV was applied to large and diverse viral genome collections, including IMG/VR and the Global Ocean Virome, revealing that the majority of viral sequences were small fragments, with just 3.6% classified as high-quality (i.e. > 90% completeness) or complete genomes. Additionally, we found that removal of host contamination significantly improved identification of auxiliary metabolic genes and interpretation of viral-encoded functions. We expect CheckV will be broadly useful for all researchers studying and reporting viral genomes assembled from metagenomes. CheckV is freely available at: http://bitbucket.org/berkeleylab/CheckV .
178
Citation42
0
Save
49

A vast world of viroid-like circular RNAs revealed by mining metatranscriptomes

Benjamin Lee et al.Jul 20, 2022
Summary Viroids and viroid-like agents are unique, minimal RNA replicators that typically encode no proteins and hijack cellular enzymes for their genome replication. As the extent and diversity of viroid-like agents are poorly understood, we developed a computational pipeline to identify viroid-like covalently closed circular (ccc) RNAs and applied it to 5,131 global metatranscriptomes and 1,344 plant transcriptomes. The search resulted in 11,420 viroid-like, ribozyme-containing cccRNAs spanning 4,409 species-level clusters, which is a five-fold increase compared to the previously known set of viroids and viroid-like RNA agents. Within this diverse collection, we identified numerous putative novel viroids, satellite RNAs, retrozymes, and ribozylike viruses. We also found previously unknown ribozyme combinations and unusual ribozymes within the cccRNAs. Self-cleaving ribozymes were identified in both RNA strands of ambiviruses and some mito-like viruses as well as in capsid-encoding satellite virus-like cccRNAs. The broad presence of viroid-like cccRNAs in diverse transcriptomes and ecosystems implies that their host range is not limited to plants, and matches between viroid-like cccRNAs and CRISPR spacers suggest that some of them might replicate in prokaryotes.
49
Citation3
0
Save
1

Plant-associated microbiomes promote nutrient turnover in impoverished substrates of a biodiversity hotspot

Antônio Camargo et al.Aug 1, 2021
Abstract The substrates of the Brazilian campos rupestre s have extremely low concentrations of key nutrients, mainly phosphorus, imposing severe restrictions to plant growth. Regardless, this ecosystem harbors enormous biodiversity which raises the question of how nutrients are cycled and acquired by the biosphere. To uncover the nutrient turnover potential of plant-associated microorganisms in the campos rupestre s, we investigated the compositions and functions of microbiomes associated with two species of the Velloziaceae family that grow over distinct substrates (soil and rock). Amplicon, metagenomic, and metagenome-assembled genome sequence data showed that the campos rupestres harbor a novel assemblage of plant-associated prokaryotes and fungi. Compositional analysis revealed that the plant-associated soil and rock communities differed in taxonomic structure but shared a core of highly efficient colonizers that were strongly coupled with nutrient mobilization. Investigation of functional and abundance data revealed that the plant hosts actively recruit communities by exuding organic compounds and that the root-associated microbiomes possess a diverse repertoire of phosphorus turnover mechanisms. We also showed that the microbiomes of both plant species encompass novel populations capable of mobilizing nitrogen and that the substrate strongly influences the dynamics of this cycle. Our results show that the interplay between plants and their microbiomes shapes nutrient turnover in the campos rupestres . We highlight that investigation of microbial diversity is fundamental to understand plant fitness in stressful environments.
1
Paper
Citation1
0
Save
0

Predicting stop codon reassignment improves functional annotation of bacteriophages

Ryan Cook et al.Dec 19, 2023
Abstract The majority of bacteriophage diversity remains uncharacterised, and new intriguing mechanisms of their biology are being continually described. Members of some phage lineages, such as the Crassvirales , repurpose stop codons to encode an amino acid by using alternate genetic codes. Here, we investigated the prevalence of stop codon reassignment in phage genomes and subsequent impacts on functional annotation. We predicted 76 genomes within INPHARED and 712 vOTUs from the Unified Human Gut Virome catalogue (UHGV) that repurpose a stop codon to encode an amino acid. We re-annotated these sequences with modified versions of Pharokka and Prokka, called Pharokka-gv and Prokkagv, to automatically predict stop codon reassignment prior to annotation. Both tools significantly improved the quality of annotations, with Pharokka-gv performing best. For sequences predicted to repurpose TAG to glutamine (translation table 15), Pharokka-gv increased the median gene length (median of per genome medians) from 287 to 481 bp for UHGV sequences (67.8% increase) and from 318 to 550 bp for INPHARED sequences (72.9% increase). The re-annotation increased mean coding density from 66.8% to 90.0%, and from 69.0% to 89.8% for UHGV and INPHARED sequences. Furthermore, the proportion of genes that could be assigned functional annotation increased, including an increase in the number of major capsid proteins that could be identified. We propose that automatic prediction of stop codon reassignment before annotation is beneficial to downstream viral genomic and metagenomic analyses.
0
Citation1
0
Save
0

RNAsamba: coding potential assessment using ORF and whole transcript sequence information

Antônio Camargo et al.Apr 28, 2019
The advent of high-throughput sequencing technologies made it possible to obtain large volumes of genetic information, quickly and inexpensively. Thus, many efforts are devoted to unveil the biological roles of genomic elements, being one of the main tasks the identification of protein-coding and long non-coding RNAs. We describe RNAsamba, a tool to predict the coding potential of RNA molecules from sequence information using a deep-learning model that processes both the whole sequence and the ORF to look for patterns that distinguish coding and non-coding RNAs. We evaluated the model in the classification of coding and non-coding transcripts of humans and five other model organisms and show that RNAsamba generally outperforms other state-of-the-art methods. We also show that RNAsamba can identify coding signals in partial-length ORFs and UTR sequences, evidencing that its model is not dependent on the presence of complete coding regions. RNAsamba is a fast and easy tool that can provide valuable contributions to genome annotation pipelines. The source code of RNAsamba is freely available at: https://github.com/apcamargo/RNAsamba.
Load More