JS
João Setúbal
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
19
(47% Open Access)
Cited by:
5,089
h-index:
53
/
i10-index:
134
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Comparison of the genomes of two Xanthomonas pathogens with differing host specificities

A. Silva et al.May 1, 2002
+63
F
J
A
0
Citation1,191
0
Save
0

The genome of woodland strawberry (Fragaria vesca)

Vladimir Shulaev et al.Dec 26, 2010
+68
R
D
V
The International Strawberry Sequencing Consortium reports the draft genome of the woodland strawberry (Fragaria vesca). The genome of this diploid species should serve as a reference genome for the Fragaria genus, as the cultivated strawberry (Fragaria × ananassa) is an octoploid where F. vesca is predicted to be a subgenome donor. The woodland strawberry, Fragaria vesca (2n = 2x = 14), is a versatile experimental plant system. This diminutive herbaceous perennial has a small genome (240 Mb), is amenable to genetic transformation and shares substantial sequence identity with the cultivated strawberry (Fragaria × ananassa) and other economically important rosaceous plants. Here we report the draft F. vesca genome, which was sequenced to ×39 coverage using second-generation technology, assembled de novo and then anchored to the genetic linkage map into seven pseudochromosomes. This diploid strawberry sequence lacks the large genome duplications seen in other rosids. Gene prediction modeling identified 34,809 genes, with most being supported by transcriptome mapping. Genes critical to valuable horticultural traits including flavor, nutritional value and flowering time were identified. Macrosyntenic relationships between Fragaria and Prunus predict a hypothetical ancestral Rosaceae genome that had nine chromosomes. New phylogenetic analysis of 154 protein-coding genes suggests that assignment of Populus to Malvidae, rather than Fabidae, is warranted.
0
Citation1,123
0
Save
0

The Genome of the Natural Genetic Engineer Agrobacterium tumefaciens C58

Derek Wood et al.Dec 14, 2001
+48
R
J
D
The 5.67-megabase genome of the plant pathogen Agrobacterium tumefaciens C58 consists of a circular chromosome, a linear chromosome, and two plasmids. Extensive orthology and nucleotide colinearity between the genomes of A. tumefaciens and the plant symbiont Sinorhizobium meliloti suggest a recent evolutionary divergence. Their similarities include metabolic, transport, and regulatory systems that promote survival in the highly competitive rhizosphere; differences are apparent in their genome structure and virulence gene complement. Availability of the A. tumefaciens sequence will facilitate investigations into the molecular basis of pathogenesis and the evolutionary divergence of pathogenic and symbiotic lifestyles.
0
Citation784
0
Save
0

Metagenomic analysis of colorectal cancer datasets identifies cross-cohort microbial diagnostic signatures and a link with choline degradation

Andrew Thomas et al.Apr 1, 2019
+35
F
P
A
Several studies have investigated links between the gut microbiome and colorectal cancer (CRC), but questions remain about the replicability of biomarkers across cohorts and populations. We performed a meta-analysis of five publicly available datasets and two new cohorts and validated the findings on two additional cohorts, considering in total 969 fecal metagenomes. Unlike microbiome shifts associated with gastrointestinal syndromes, the gut microbiome in CRC showed reproducibly higher richness than controls (P < 0.01), partially due to expansions of species typically derived from the oral cavity. Meta-analysis of the microbiome functional potential identified gluconeogenesis and the putrefaction and fermentation pathways as being associated with CRC, whereas the stachyose and starch degradation pathways were associated with controls. Predictive microbiome signatures for CRC trained on multiple datasets showed consistently high accuracy in datasets not considered for model training and independent validation cohorts (average area under the curve, 0.84). Pooled analysis of raw metagenomes showed that the choline trimethylamine-lyase gene was overabundant in CRC (P = 0.001), identifying a relationship between microbiome choline metabolism and CRC. The combined analysis of heterogeneous CRC cohorts thus identified reproducible microbiome biomarkers and accurate disease-predictive models that can form the basis for clinical prognostic tests and hypothesis-driven mechanistic studies. Multicohort analysis identifies microbial signatures of colorectal cancer in fecal microbiomes.
0
Citation659
0
Save
0

Transcriptome analysis of the acoelomate human parasite Schistosoma mansoni

Sérgio Verjovski-Almeida et al.Sep 12, 2003
+34
E
R
S
Schistosoma mansoni is the primary causative agent of schistosomiasis, which affects 200 million individuals in 74 countries. We generated 163,000 expressed-sequence tags (ESTs) from normalized cDNA libraries from six selected developmental stages of the parasite, resulting in 31,000 assembled sequences and 92% sampling of an estimated 14,000 gene complement. By analyzing automated Gene Ontology assignments, we provide a detailed view of important S. mansoni biological systems, including characterization of metazoa-specific and eukarya-conserved genes. Phylogenetic analysis suggests an early divergence from other metazoa. The data set provides insights into the molecular mechanisms of tissue organization, development, signaling, sexual dimorphism, host interactions and immune evasion and identifies novel proteins to be investigated as vaccine candidates and potential drug targets.
0
Citation493
0
Save
0

Comparative Genomics of Two Leptospira interrogans Serovars Reveals Novel Insights into Physiology and Pathogenesis

Ana Nascimento et al.Mar 17, 2004
+44
E
A
A
ABSTRACT Leptospira species colonize a significant proportion of rodent populations worldwide and produce life-threatening infections in accidental hosts, including humans. Complete genome sequencing of Leptospira interrogans serovar Copenhageni and comparative analysis with the available Leptospira interrogans serovar Lai genome reveal that despite overall genetic similarity there are significant structural differences, including a large chromosomal inversion and extensive variation in the number and distribution of insertion sequence elements. Genome sequence analysis elucidates many of the novel aspects of leptospiral physiology relating to energy metabolism, oxygen tolerance, two-component signal transduction systems, and mechanisms of pathogenesis. A broad array of transcriptional regulation proteins and two new families of afimbrial adhesins which contribute to host tissue colonization in the early steps of infection were identified. Differences in genes involved in the biosynthesis of lipopolysaccharide O side chains between the Copenhageni and Lai serovars were identified, offering an important starting point for the elucidation of the organism's complex polysaccharide surface antigens. Differences in adhesins and in lipopolysaccharide might be associated with the adaptation of serovars Copenhageni and Lai to different animal hosts. Hundreds of genes encoding surface-exposed lipoproteins and transmembrane outer membrane proteins were identified as candidates for development of vaccines for the prevention of leptospirosis.
0
Citation419
0
Save
0

Distribution of nitrogen fixation and nitrogenase-like sequences amongst microbial genomes

Patricia Santos et al.May 3, 2012
+2
S
Z
P
Abstract Background The metabolic capacity for nitrogen fixation is known to be present in several prokaryotic species scattered across taxonomic groups. Experimental detection of nitrogen fixation in microbes requires species-specific conditions, making it difficult to obtain a comprehensive census of this trait. The recent and rapid increase in the availability of microbial genome sequences affords novel opportunities to re-examine the occurrence and distribution of nitrogen fixation genes. The current practice for computational prediction of nitrogen fixation is to use the presence of the nifH and/or nifD genes. Results Based on a careful comparison of the repertoire of nitrogen fixation genes in known diazotroph species we propose a new criterion for computational prediction of nitrogen fixation: the presence of a minimum set of six genes coding for structural and biosynthetic components, namely NifHDK and NifENB. Using this criterion, we conducted a comprehensive search in fully sequenced genomes and identified 149 diazotrophic species, including 82 known diazotrophs and 67 species not known to fix nitrogen. The taxonomic distribution of nitrogen fixation in Archaea was limited to the Euryarchaeota phylum; within the Bacteria domain we predict that nitrogen fixation occurs in 13 different phyla. Of these, seven phyla had not hitherto been known to contain species capable of nitrogen fixation. Our analyses also identified protein sequences that are similar to nitrogenase in organisms that do not meet the minimum-gene-set criteria. The existence of nitrogenase-like proteins lacking conserved co-factor ligands in both diazotrophs and non-diazotrophs suggests their potential for performing other, as yet unidentified, metabolic functions. Conclusions Our predictions expand the known phylogenetic diversity of nitrogen fixation, and suggest that this trait may be much more common in nature than it is currently thought. The diverse phylogenetic distribution of nitrogenase-like proteins indicates potential new roles for anciently duplicated and divergent members of this group of enzymes.
0
Citation418
0
Save
0

Non-phylogenetic identification of co-evolving genes for reconstructing the archaeal Tree of Life

Luiz Rangel et al.Oct 17, 2020
+2
J
S
L
Abstract Assessing the phylogenetic compatibility between individual gene families is a crucial and often computationally demanding step in many phylogenomics analyses. Here we describe the Evolutionary Similarity Index ( I ES ) to assess shared evolution between gene families using a weighted Orthogonal Distance Regression applied to sequence distances. This approach allows for straightforward pairing of paralogs between co-evolving gene families without resorting to multiple tests, or a priori assumptions of molecular interactions between protein products from assessed genes. The utilization of pairwise distance matrices, while less informative than phylogenetic trees, circumvents error-prone comparisons between trees whose topologies are inherently uncertain. Analyses of simulated gene family evolution datasets showed that I ES was more accurate and less susceptible to noise than popular tree-based methods (Robinson-Foulds and geodesic distance) for assessing evolutionary signal compatibility, since it bypasses phylogenetic reconstruction and its inherent uncertainty. Applying I ES to a real dataset of 1,322 genes from 42 archaeal genomes identified eight major clusters of gene families with compatible evolutionary trends. Four of these clusters included genes with a taxonomic distribution across all archaeal phyla, while other clusters included a subset of taxa that do not map to generally accepted archaeal clades, indicating possible shared horizontal transfers by clustered gene families. We identify one strongly connected set of 62 genes from the same cluster, occurring as both single-copy and multiple homologs per genome, with compatible phylogenetic reconstructions closely matching previously published species trees for Archaea. An I ES implementation is available at https://github.com/lthiberiol/evolSimIndex .
0
Citation1
0
Save
0

Comparative Analyses of Bacteriophage Genomes

F. Rossi et al.Jan 1, 2024
+3
G
V
F
Bacterial viruses (bacteriophages or phages) are the most abundant and diverse biological entities on Earth. There is a renewed worldwide interest in phage-centered research motivated by their enormous potential as antimicrobials to cope with multidrug-resistant pathogens. An ever-growing number of complete phage genomes are becoming available, derived either from newly isolated phages (cultivated phages) or recovered from metagenomic sequencing data (uncultivated phages). Robust comparative analysis is crucial for a comprehensive understanding of genotypic variations of phages and their related evolutionary processes, and to investigate the interaction mechanisms between phages and their hosts. In this chapter, we present a protocol for phage comparative genomics employing tools selected out of the many currently available, focusing on complete genomes of phages classified in the class Caudoviricetes. This protocol provides accurate identification of similarities, differences, and patterns among new and previously known complete phage genomes as well as phage clustering and taxonomic classification.
0
Citation1
0
Save
10

Comparative genomics of Xylella fastidiosa suggests determinants of host-specificity and expands its mobile genetic elements repertoire

Guillermo Uceda-Campos et al.Oct 17, 2021
+9
C
O
G
Abstract The Gram-negative bacterium Xylella fastidiosa colonizes plant xylem vessels and is obligately vectored by xylem sap-feeding hemipteran insects. X. fastidiosa causes diseases in many plant species but in a variety of its plant hosts this bacterium behaves as a commensal endophyte. Originally confined to the Americas, infecting mainly grapevine, citrus and coffee plants, X. fastidiosa has spread to several plant species in Europe, causing devastating crop diseases. Although many pathogenicity and virulence factors have been identified in X. fastidiosa which enable the bacterium to successfully establish in the xylem tissue, the mechanisms by which distinct X. fastidiosa strains colonize and cause disease in specific plant hosts have not been fully elucidated. Here we present comparative analyses of 94 publicly available whole-genome sequences of X. fastidiosa strains with the goal of providing insights into plant host specificity determinants for this phytopathogen as well as of expanding the knowledge of its mobile genetic elements (MGE) content, mainly prophages. Our results revealed a pangenome of 4,549 protein coding sequences (CDSs) which is still open. The core- and accessory genomes comprise 954 and 2,219 CDSs, respectively. Phylogenetic tree construction using all core genome CDSs grouped the strains in three major clades of subspecies fastidiosa, multiplex and pauca , with subclades related to the strains’ sequence type (ST) obtained from multi-locus sequence typing (MLST). The geographic region where the strains were collected showed stronger association with the clades of X. fastidiosa strains rather than the plant species from which they were isolated. Among the CDS related to virulence and pathogenicity found in the core genome, those related to lipopolysaccharide (LPS) synthesis and trimeric autotransporter adhesins (TAA) are somewhat related with the plant host of a given strain according to phylogenetic inference. The X. fastidiosa accessory genome is represented by an abundant and heterogeneous mobilome, which includes a diversity of prophage regions. In summary, the genome comparisons reported here will enable a better understanding of the diversity of phylogenetically close genomes and warrant further investigation of LPS and TAAs as potential X. fastidiosa host-specificity determinants. Impact statement The bacterium Xylella fastidiosa is a pathogen that infects many plant species and has caused devastating diseases in grapevine, citrus, coffee, and olive plants. This phytopathogen X. fastidiosa is original from the Americas and has emerged in Europe where it is causing severe economic losses for olive producers, mainly in Italy. Although many pathogenicity and virulence factors have been identified in X. fastidiosa , which enable this bacterium to successfully establish in the xylem vessels network, the mechanisms by which distinct X. fastidiosa strains colonize and cause disease in the different plant host species have not been fully elucidated. The comparative analyses of 94 whole-genome sequences from X. fastidiosa strains from diverse hosts and geographic regions provide insights into host specificity determinants for this phytopathogen as well as expand the knowledge of its mobile genetic elements (MGE) content, mainly prophages. Our results contribute for a better understanding of the diversity of phylogenetically close genomes and warrant further experimental investigation of lipopolysaccharide and trimeric autotransporter adhesins as potential host-specificity determinants for X. fastidiosa . Data summary All genomic sequences were accessed from publicly available GenBank RefSeq database at NCBI (National Center for Biotechnology Information). A full listing of NCBI accession numbers for X. fastidiosa strains described in this paper is available in Table S1 (available in the online version of this article).
Load More