LC
Luc Cornet
Author with expertise in RNA Sequencing Data Analysis
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
9
(78% Open Access)
Cited by:
8
h-index:
12
/
i10-index:
13
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Metagenomic assembly of new (sub)arctic Cyanobacteria and their associated microbiome from non-axenic cultures

Luc Cornet et al.Mar 27, 2018
Abstract Cyanobacteria form one of the most diversified phylum of Bacteria. They are important ecologically as primary producers, for Earth evolution and biotechnological applications. Yet, Cyanobacteria are notably difficult to purify and grow axenically, and most strains in culture collections contain heterotrophic bacteria that were likely associated to Cyanobacteria in the environment. Obtaining cyanobacterial DNA without contaminant sequences is thus a challenging and time-consuming task. Here, we deploy a metagenomic pipeline that enables the easy recovery of high-quality genomes from non-axenic cultures. We tested this pipeline on 17 cyanobacterial cultures from the BCCM/ULC public collection and generated novel genome sequences for 15 arctic or subarctic strains, of which 14 early-branching organisms that will be useful for cyanobacterial phylogenomics. In parallel, we managed to assemble 31 co-cultivated bacteria from the same cultures and showed that they mostly belong to Bacteroidetes and Proteobacteria, some of them being very closely related in spite of geographically distant sampling sites. Importance Complete genomes of cold-adapted Cyanobacteria are underrepresented in databases, due to the difficulty to grow them axenically. In this work, we report the genome sequencing of 12 (sub)arctic and 3 temperate Cyanobacteria, along with 21 Proteobacteria and 5 Bacteroidetes recovered from their microbiome. Following the use of a state-of-the-art metagenomic pipeline, 12 of our new cyanobacterial genome assemblies are of high-quality, which indicates that even non-axenic cultures can yield complete genomes suitable for phylogenomics and comparative genomics. From a methodological point of view, we investigate the fate of SSU rRNA (16S) genes during metagenomic binning and observe that multi-copy rRNA operons are lost because of higher sequencing coverage and divergent tetranucleotide frequencies. Moreover, we devised a measure of genomic identity to compare metagenomic bins of different completeness, which allowed us to show that Cyanobacteria-associated bacteria can be highly related in spite of considerable distance between collection points.
0
Citation3
0
Save
3

The GEN-ERA toolbox: unified and reproducible workflows for research in microbial genomics

Luc Cornet et al.Oct 21, 2022
Abstract Background Microbial culture collections play a key role in taxonomy by studying the diversity of their accessions and providing well characterized strains to the scientific community for fundamental and applied research. These microbial resource centers thus need to implement new standards in species delineation, including whole-genome sequencing and phylogenomics. In this context, the genomic needs of the Belgian Coordinated Collections of Microorganisms (BCCM) were studied, resulting in the GEN-ERA toolbox. The latter is a unified cluster of bioinformatic workflows dedicated to both bacteria and small eukaryotes (i.e. yeasts). Findings This public toolbox allows researchers without a specific training in bioinformatics to perform robust phylogenetic analyses. Hence, it facilitates all steps from genome downloading and quality assessment, including genomic contamination estimation, to tree reconstruction. It also offers workflows for average nucleotide identity comparisons and metabolic modeling. Technical details Nextflow workflows are launched by a single command and are available on the GEN-ERA GitHub repository ( https://github.com/Lcornet/GENERA ). All the workflows are based on Singularity containers to increase reproducibility. Testing The toolbox was developed for a diversity of microorganisms, including bacteria and fungi. It was further tested on an empirical dataset of 18 (meta)genomes of early-branching Cyanobacteria, providing the most up-to-date phylogenomic analysis of the Gloeobacterales order, the first group to diverge in the evolutionary tree of Cyanobacteria. Conclusion The GEN-ERA toolbox can be used to infer completely reproducible comparative genomic and metabolic analyses on prokaryotes and small eukaryotes. Although designed for routine bioinformatics of culture collections, it can also be useful for other applications, as shown by our case study on Gloeobacterales .
3
Citation1
0
Save
4

Phylogenomic analyses of Snodgrassella isolates from honeybees and bumblebees reveals taxonomic and functional diversity

Luc Cornet et al.Dec 11, 2021
Abstract Snodgrassella is a Betaproteobacteria genus found in the gut of honeybees ( Apis spp.) and bumblebees ( Bombus spp). It is part of a conserved microbiome that is composed of few core phylotypes and is essential for bee health and metabolism. Phylogenomic analyses using whole genome sequences of 75 Snodgrassella strains from 4 species of honey bees and 14 species of bumblebees showed that these strains formed a monophyletic lineage within the Neisseriaceae family, that Snodgrassella isolates from Asian honeybees diverged early on from the other species in their evolution, that isolates from honeybees and bumblebees were well separated and that this genus consists of at least seven species. We propose to formally name two new Snodgrassella species that were isolated from bumblebees, i.e. Snodgrassella gandavensis sp. nov. and Snodgrassella communis sp. nov. Possible evolutionary scenarios for 107 species or group specific genes revealed very limited evidence for horizontal gene transfer. Functional analyses revealed the importance of small proteins, defense mechanisms, amino acid transport and metabolism, inorganic ion transport and metabolism and carbohydrate transport and metabolism among these 107 specific genes. Importance The microbiome of honeybees ( Apis spp.) and bumblebees ( Bombus spp .) is highly conserved and represented by few phylotypes. This simplicity in taxon composition makes the bee’s microbiome an emergent model organism for the study of gut microbial communities. Since the description of the Snodgrassella genus, which was isolated from the gut of honeybees and bumblebees in 2013, a single species, i.e. Snodgrassella alvi , has been named. Here we demonstrate that this genus is actually composed of at least seven species, two of them ( Snodgrassella gandavensis sp. nov. and Snodgrassella communis sp. nov.) being formally described in the present publication. We also report the presence of 107 genes specific to Snodgrassella species, showing notably the importance of small proteins and defense mechanisms in this genus. Data summary Cornet L and Vandamme P, European Nucleotide Archive (ENA), Project accession: PRJEB47378 Cornet L and Vandamme P, European Nucleotide Archive (ENA), Reads accessions: SAMEA9570070 - SAMEA9570078 Cornet L and Vandamme P, European Nucleotide Archive (ENA), Genome accessions: GCA_914768015, GCA_914768025, GCA_914768035, GCA_914768045, GCA_914768055, GCA_914768065, GCA_914768075, GCA_914768085, GCA_914768095.
4
Citation1
0
Save
0

A constrained SSU-rRNA phylogeny reveals the unsequenced diversity of photosynthetic Cyanobacteria (Oxyphotobacteria)

Luc Cornet et al.May 7, 2018
Objectives: Cyanobacteria are an ancient phylum of prokaryotes that contain the class Oxyphotobacteria, the unique bacterial group able to perform oxygenic photosynthesis. This group has been extensively studied by phylogenomics during the last decade, notably because it is widely accepted that Cyanobacteria were responsible for the spread of photosynthesis to the eukaryotic domain. The aim of this study was to evaluate the fraction of the oxyphotobacterial diversity for which sequenced genomes are available for genomic studies. For this, we built a phylogenomic-constrained SSU rRNA (16S) tree to pinpoint unexploited clusters of Oxyphotobacteria that should be targeted for future genome sequencing, so as to improve our understanding of Oxyphotobacteria evolution. Results: We show that only a little fraction the oxyphotobacterial diversity has been sequenced so far. Indeed 31 rRNA clusters on the 60 composing the photosynthetic Cyanobacteria have a fraction of sequenced genomes <1%. This fraction remains low (min = 1%, median = 11.1 %, IQR = 7.3) within the remaining sequenced clusters that already contain some representative genomes. The unsequenced clusters are scattered across the whole Oxyphotobacteria tree, at the exception of very basal clades (G, F, E) and the Oscillatoriales clade (A), which have higher fractions of representative genomes. Yet, the very basal clades still feature some (sub)clusters without any representative genome. This last result is especially important, as these basal clades are prime candidate for plastid emergence.
0

Consensus assessment of the contamination level of publicly available cyanobacterial genomes

Luc Cornet et al.Apr 15, 2018
BACKGROUND: Publicly available genomes are crucial for phylogenetic and metagenomic studies, in which contaminating sequences can be the cause of major problems. This issue is expected to be especially important for Cyanobacteria because axenic strains are notoriously difficult to obtain and keep in culture. Yet, despite their great scientific interest, no data are currently available concerning the quality of publicly available cyanobacterial genomes. RESULTS: As reliably detecting contaminants is a complex task, we designed a pipeline combining six methods in a consensus strategy to assess the contamination level of 440 genome assemblies of Cyanobacteria. Two methods are based on published reference databases of ribosomal genes (SSU rRNA 16S and ribosomal proteins), one is indirectly based on a reference database of marker genes (CheckM), and three are based on complete genome analysis. Among those genome-wide methods, Kraken and DIAMOND blastx share the same reference database that we derived from Ensembl Bacteria, whereas CONCOCT does not require any reference database, instead relying on differences in DNA tetramer frequencies. Given that all the six methods appear to have their own strengths and limitations, we used the consensus of their rankings to infer that >5% of cyanobacterial genome assemblies are highly contaminated by foreign DNA (i.e., contaminants were detected by 5 or 6 methods). CONCLUSIONS: Our results will help researchers to check the quality of publicly available genomic data before use in their own analyses. Moreover, we argue that journals should make mandatory the submission of raw read data along with genome assemblies in order to facilitate the detection of contaminants in sequence databases.
1

A BAC-guided haplotype assembly pipeline increases the resolution of the virus resistance locus CMD2 in cassava

Luc Cornet et al.Oct 19, 2023
Cassava is an important crop for food security in the tropics where its production is jeopardized by several viral diseases, including the cassava mosaic disease (CMD) which is endemic in Sub-Saharan Africa and the Indian subcontinent. Resistance to CMD is linked to a single dominant locus, namely CMD2. The cassava genome contains highly repetitive regions making the accurate assembly of a reference genome challenging. In the present study, we generated BAC libraries of the CMD susceptible cassava cultivar (cv.) 60444 and the CMD resistant landrace TME3. We subsequently identified and sequenced BACs belonging to the CMD2 region in both cultivars using high-accuracy long-read PacBio circular consensus sequencing (ccs) reads. We then sequenced and assembled the complete genomes of cv. 60444 and TME3 using a combination of ONT ultra-long reads and optical mapping. Anchoring the assemblies on cassava genetic maps revealed discrepancies in our, as well as in previously released, CMD2 regions of the cv. 60444 and TME3 genomes. A BAC guided approach to assess cassava genome assemblies significantly improved the synteny between the assembled CMD2 regions of cv. 60444 and TME3 and the CMD2 genetic maps. We then performed repeat unmasked gene annotation on CMD2 assemblies and identified 81 stress resistance proteins present in the CMD2 region, amongst which 31 were previously not reported in publicly available CMD2 sequences