PP
Patrick Phaneuf
Author with expertise in RNA Sequencing Data Analysis
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
21
(67% Open Access)
Cited by:
20
h-index:
14
/
i10-index:
18
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
11

iModulonDB: a knowledgebase of microbial transcriptional regulation derived from machine learning

Kevin Rychel et al.Aug 14, 2020
ABSTRACT Independent component analysis (ICA) of bacterial transcriptomes has emerged as a powerful tool for obtaining co-regulated, independently-modulated gene sets (iModulons), inferring their activities across a range of conditions, and enabling their association to known genetic regulators. By grouping and analyzing genes based on observations from big data alone, iModulons can provide a novel perspective into how the composition of the transcriptome adapts to environmental conditions. Here, we present iModulonDB ( imodulondb.org ), a knowledgebase of prokaryotic transcriptional regulation computed from high-quality transcriptomic datasets using ICA. Users select an organism from the home page and then search or browse the curated iModulons that make up its transcriptome. Each iModulon and gene has its own interactive dashboard, featuring plots and tables with clickable, hoverable, and downloadable features. This site enhances research by presenting scientists of all backgrounds with co-expressed gene sets and their activity levels, which lead to improved understanding of regulator-gene relationships, discovery of transcription factors, and the elucidation of unexpected relationships between conditions and genetic regulatory activity. The current release of iModulonDB covers three organisms ( E. coli, S. aureus , and B. subtilis ) with 204 iModulons, and can be expanded to cover many additional organisms.
11
Citation4
0
Save
3

Laboratory-acquired mutations fall outside the wild-type alleleome of Escherichia coli

Edward Catoiu et al.Apr 6, 2022
Abstract Inexpensive DNA sequencing has led to a rapidly increasing number of whole genome sequences in the public domain. Natural sequence variation can now be assessed across a large number of sequenced strains of a bacterial species, resulting in the definition of the wild-type alleleome (the collection of alleles for every gene found in the species). Concurrently, laboratory evolution emerged as a new approach to address biological questions and to develop new phenotypic traits, and a large number of laboratory acquired mutations can be found in databases. The availability of this large-scale sequence variation data now allows for a detailed comparison of mutations fixed in natural versus laboratory evolutions. Such comparison shows that laboratory-acquired mutations are rarely found in the wild-type alleleome of Escherichia coli . The E. coli alleleome is highly conserved as most of the sequence variation is concentrated in about 2% of the coding region. We find that there are typically two alternate amino acids coded for in the variable locations, and switches between the two are found in the data sets. Finally, we find that adaptive laboratory mutations, unlike wild-type mutations, do not utilize the redundancy built into the genetic code: they are less likely to be synonymous and rely on changing a single nucleotide in a codon. However, the uniqueness of mutations fixed in laboratory evolutions bodes well for synthetic biology by revealing novel exploitable sequence space untouched by natural evolution.
3
Citation4
0
Save
0

Model-driven design and evolution of non-trivial synthetic syntrophic pairs

Colton Lloyd et al.May 21, 2018
Abstract Synthetic microbial communities are attractive for applied biotechnology and healthcare applications through their ability to efficiently partition complex metabolic functions. By pairing auxotrophic mutants in co-culture, nascent E. coli communities can be established where strain pairs are metabolically coupled. Intuitive synthetic communities have been demonstrated, but the full space of cross-feeding metabolites has yet to be explored. A novel algorithm, OptAux, was constructed to design 66 multi-knockout E. coli auxotrophic strains that require significant metabolite cross-feeding when paired in co-culture. Three OptAux predicted auxotrophic strains were co-cultured with an L-histidine auxotroph and validated via adaptive laboratory evolution (ALE). Time-course sequencing revealed the genetic changes employed by each strain to achieve higher community fitness and provided insights on mechanisms for sharing and adapting to the syntrophic niche. A community model of metabolism and gene expression was utilized to predict the relative community composition and fundamental characteristics of the evolved communities. This work presents a novel computational method to elucidate metabolic changes that empower community formation and thus guide the optimization of co-cultures for a desired application.
0
Citation3
0
Save
0

Pangenome mining of theStreptomycesgenus redefines their biosynthetic potential

Omkar Mohite et al.Feb 22, 2024
Abstract Background Streptomyces is a highly diverse genus known for the production of secondary or specialized metabolites with a wide range of applications in the medical and agricultural industries. Several thousand complete or nearly-complete Streptomyces genome sequences are now available, affording the opportunity to deeply investigate the biosynthetic potential within these organisms and to advance natural product discovery initiatives. Result We performed pangenome analysis on 2,371 Streptomyces genomes, including approximately 1,200 complete assemblies. Employing a data-driven approach based on genome similarities, the Streptomyces genus was classified into 7 primary and 42 secondary MASH-clusters, forming the basis for a comprehensive pangenome mining. A refined workflow for grouping biosynthetic gene clusters (BGCs) redefined their diversity across different MASH-clusters. This workflow also reassigned 2,729 known BGC families to only 440 families, a reduction caused by inaccuracies in BGC boundary detections. When the genomic location of BGCs is included in the analysis, a conserved genomic structure (synteny) among BGCs becomes apparent within species and MASH-clusters. This synteny suggests that vertical inheritance is a major factor in the acquisition of new BGCs. Conclusion Our analysis of a genomic dataset at a scale of thousands of genomes refined predictions of BGC diversity using MASH-clusters as a basis for pangenome analysis. The observed conservation in the order of BGCs’ genomic locations showed that the BGCs are vertically inherited. The presented workflow and the in-depth analysis pave the way for large-scale pangenome investigations and enhance our understanding of the biosynthetic potential of the Streptomyces genus.
0
Citation1
0
Save
1

Laboratory evolution of synthetic electron transport system variants reveals a larger metabolic respiratory system and its plasticity

Amitesh Anand et al.Apr 5, 2022
Respiration requires organisms to have an electron transport system (ETS) for the generation of proton motive force across the membrane that drives ATP synthase. Although the molecular details of the ETS are well studied and constitute textbook material, few studies have appeared to elucidate its systems biology. The most thermodynamically efficient ETS consists of two enzymes, an NADH: quinone oxidoreductase (NqRED) and a dioxygen reductase (O 2 RED), which facilitate the shuttling of electrons from NADH to oxygen. However, evolution has produced variations within ETS which modulate the overall energy efficiency of the system even within the same organism 1–3 . The system-level impact of these variations and their individual physiological optimality remain poorly determined. To mimic varying ETS efficiency we generated four Escherichia coli deletion strains (named ETS-1H, 2H, 3H, and 4H) harboring unbranched ETS variants that pump 1, 2, 3, or 4 proton(s) per electron respectively. We then used a combination of synergistic methods (laboratory evolution, multi-omic analyses, and computation of proteome allocation) to characterize these ETS variants. We found that: (a) all four ETS variants evolved to a similar optimized growth rate, (b) the evolution of ETS variants was enabled by specific rewiring of major energy-generating pathways that couple to the ETS to optimize their ATP production capability, (c) proteome allocation per ATP generated was the same for all the variants, (d) the aero-type, that designates the overall ATP generation strategy 4 of a variant, remained conserved during its laboratory evolution, with the exception of the ETS-4H variant, and (e) integrated computational analysis of then data supported a proton-to-ATP ratio of 10 protons per 3 ATP for ATP synthase for all four ETS variants. We thus have defined the Aero-Type System (ATS) as a generalization of the aerobic bioenergetics, which is descriptive of the metabolic systems biology of respiration and demonstrates its plasticity.
0

PanKB: An interactive microbial pangenome knowledgebase for research, biotechnological innovation, and knowledge mining

Sun Boying et al.Aug 19, 2024
Abstract The exponential growth of microbial genome data presents unprecedented opportunities for mining the potential of microorganisms. The burgeoning field of pangenomics offers a framework for extracting insights from this big biological data. Recent advances in microbial pangenomic research have generated substantial data and literature, yielding valuable knowledge across diverse microbial species. PanKB (pankb.org), a knowledgebase designed for microbial pangenomics research and biotechnological applications, was built to capitalize on this wealth of information. PanKB currently includes 51 pangenomes on 8 industrially relevant microbial families, comprising 8, 402 genomes, over 500, 000 genes, and over 7M mutations. To describe this data, PanKB implements four main components: 1) Interactive pangenomic analytics to facilitate exploration, intuition, and potential discoveries; 2) Alleleomic analytics, a pangenomic- scale analysis of variants, providing insights into intra-species sequence variation and potential mutations for applications; 3) A global search function enabling broad and deep investigations across pangenomes to power research and bioengineering workflows; 4) A bibliome of 833 open- access pangenomic papers and an interface with an LLM that can answer in-depth questions using their knowledge. PanKB empowers researchers and bioengineers to harness the full potential of microbial pangenomics and serves as a valuable resource bridging the gap between pangenomic data and practical applications. Graphical Abstract
1

Reconstructing the Transcriptional Regulatory Network of ProbioticL. reuteriis Enabled by Transcriptomics and Machine Learning

Jonathan Josephs‐Spaulding et al.Jul 3, 2023
I Abstract Limosilactobacillus reuteri , a probiotic microbe instrumental to human health and sustainable food production, adapts to diverse environmental shifts via dynamic gene expression. We applied independent component analysis to 117 high-quality RNA-seq datasets to decode its transcriptional regulatory network (TRN), identifying 35 distinct signals that modulate specific gene sets. This study uncovers the fundamental properties of L. reuteri’s TRN, deepens our understanding of its arginine metabolism, and the co-regulation of riboflavin metabolism and fatty acid biosynthesis. It also sheds light on conditions that regulate genes within a specific biosynthetic gene cluster and the role of isoprenoid biosynthesis in L. reuteri’s adaptive response to environmental changes. Through the integration of transcriptomics and machine learning, we provide a systems-level understanding of L. reuteri’s response mechanism to environmental fluctuations, thus setting the stage for modeling the probiotic transcriptome for applications in microbial food production. Graphical Abstract Comprehensive iModulon Workflow Overview. Our innovative workflow is grounded in the analysis of the LactoPRECISE compendium, a curated dataset containing 117 internally sequenced RNA-seq samples derived from a diversity of 50 unique conditions, encompassing an extensive range of 13 distinct condition types. We employ the power of Independent Component Analysis (ICA), a cutting-edge machine learning algorithm, to discern the underlying structure of iModulons within this wealth of data. In the subsequent stage of our workflow, the discovered iModulons undergo detailed scrutiny to uncover media-specific regulatory mechanisms governing metabolism, illuminate the context-dependent intricacies of gene expression, and predict pathways leading to the biosynthesis of probiotic secondary metabolites. Our workflow offers an invaluable and innovative lens through which to view probiotic strain design while simultaneously highlighting transformative approaches to data analytics in the field.
Load More