SH
Steven Hallam
Author with expertise in RNA Sequencing Data Analysis
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
10
(70% Open Access)
Cited by:
18
h-index:
12
/
i10-index:
16
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
4

Insights into the controls on metabolite distributions along a latitudinal transect of the western Atlantic Ocean

Winifred Johnson et al.Mar 9, 2021
Abstract Metabolites, or the small organic molecules that are synthesized by cells during metabolism, comprise a complex and dynamic pool of carbon in the ocean. They are an essential form of information, linking genotype to phenotype at the individual, population and community levels of biological organization. Characterizing metabolite distributions inside microbial cells and dissolved in seawater is essential to understanding the controls on their production and fate, as well as their roles in shaping marine microbial food webs. Here, we apply a targeted metabolomics method to quantify particulate and dissolved distributions of a suite of biologically relevant metabolites including vitamins, amino acids, nucleic acids, osmolytes, and intermediates in biosynthetic pathways along a latitudinal transect in the western Atlantic Ocean. We find that, in the euphotic zone, most particulate or intracellular metabolites positively co-vary with the most abundant microbial taxa. In contrast, dissolved metabolites exhibited greater variability with differences in distribution between ocean regions. Although fewer particulate metabolites were detected below the euphotic zone, molecules identified in the deep ocean may be linked to preservation of organic matter or adaptive physiological strategies of deep-sea microbes. Based on the identified metabolite distributions, we propose relationships between certain metabolites and microbial populations, and find that dissolved metabolite distributions are not directly related to their particulate abundances.
4
Citation5
0
Save
14

Mercury methylation by metabolically versatile and cosmopolitan marine bacteria

Heyu Lin et al.Jun 4, 2020
Abstract Microbes transform aqueous mercury (Hg) into methylmercury (MeHg), a potent neurotoxin in terrestrial and marine food webs. This process requires the gene pair hgcAB , which encodes for proteins that actuate Hg methylation, and has been well described for anoxic environments. However, recent studies report potential MeHg formation in suboxic seawater, although the microorganisms involved remain poorly understood. In this study, we conducted large-scale multi-omic analyses to search for putative microbial Hg methylators along defined redox gradients in Saanich Inlet (SI), British Columbia, a model natural ecosystem with previously measured Hg and MeHg concentration profiles. Analysis of gene expression profiles along the redoxcline identified several putative Hg methylating microbial groups, including Calditrichaeota , SAR324 and Marinimicrobia , with the last by far the most active based on hgc transcription levels. Marinimicrobia hgc genes were identified from multiple publicly available marine metagenomes, consistent with a potential key role in marine Hg methylation. Computational homology modelling predicted that Marinimicrobia HgcAB proteins contain the highly conserved structures required for functional Hg methylation. Furthermore, a number of terminal oxidases from aerobic respiratory chains were associated with several SI putative novel Hg methylators. Our findings thus reveal potential novel marine Hg-methylating microorganisms with a greater oxygen tolerance and broader habitat range than previously recognised.
14
Citation4
0
Save
1

An integrated, modular approach to data science education in the life sciences

Kimberly Dill‐McFarland et al.Jul 26, 2020
Abstract We live in an increasingly data-driven world, where high-throughput sequencing and mass spectrometry platforms are transforming biology into an information science. This has shifted major challenges in biological research from data generation and processing to interpretation and knowledge translation. However, post-secondary training in bioinformatics, or more generally data science for life scientists, lags behind current demand. In particular, development of accessible, undergraduate data science curricula has potential to improve research and learning outcomes and better prepare students in the life sciences to thrive in public and private sector careers. Here, we describe the Experiential Data science for Undergraduate Cross-Disciplinary Education (EDUCE) initiative, which aims to progressively build data science competency across several years of integrated practice. Through EDUCE, students complete data science modules integrated into required and elective courses augmented with coordinated co-curricular activities. The EDUCE initiative draws on a community of practice consisting of teaching assistants, postdocs, instructors and research faculty from multiple disciplines to overcome several reported barriers to data science for life scientists, including instructor capacity, student prior knowledge, and relevance to discipline-specific problems. Preliminary survey results indicate that even a single module improves student self-reported interest and/or experience in bioinformatics and computer science. Thus, EDUCE provides a flexible and extensible active learning framework for integration of data science curriculum into undergraduate courses and programs across the life sciences. Availability and implementation The EDUCE teaching and learning framework is accessible at educe-ubc.github.io
1
Paper
Citation3
0
Save
0

Relabeling metabolic pathway data with groups to improve prediction outcomes

Abdur Basher et al.Aug 24, 2020
Abstract Metabolic pathway inference from genomic sequence information is an integral scientific problem with wide ranging applications in the life sciences. As sequencing throughput increases, scalable and performative methods for pathway prediction at different levels of genome complexity and completion become compulsory. In this paper, we present reMap ( re labeling m etabolic pathway d a ta with grou p s) a simple, and yet, generic framework, that performs relabeling examples to a different set of labels, characterized as groups. A pathway group is comprised of a subset of statistically correlated pathways that can be further distributed between multiple pathway groups. This has important implications for pathway prediction, where a learning algorithm can revisit a pathway multiple times across groups to improve sensitivity. The relabeling process in reMap is achieved through an alternating feedback process. In the first feed-forward phase, a minimal subset of pathway groups is picked to label each example. In the second feed-backward phase, reMap’s internal parameters are updated to increase the accuracy of mapping examples to pathway groups. The resulting pathway group dataset is then be used to train a multi-label learning algorithm. reMap’s effectiveness was evaluated on metabolic pathway prediction where resulting performance metrics equaled or exceeded other prediction methods on organismal genomes with improved predictive performance.
0
Citation1
0
Save
1

Self-Assembly of a Repeatable DNA Nanohinge System Supporting Higher Order Structure Formation

Melanie Law et al.May 26, 2023
ABSTRACT DNA base pairs can both encode biological information and be used as a programmable material to build nanostructures with potential application in nanofabrication, data processing and storage, biosensing and drug delivery. Over several decades development of these DNA origami nanostructures has led to increasingly advanced self-assembling nanostructures and molecular machines actuated by various mechanisms such as toehold-mediated strand displacement (TMSD), magnetism and even light. However, scalability remains challenging as using larger scaffold strands can increase the likelihood of kinetic traps and misfolded conformations. Here we describe a repeatable DNA nanohinge system to increase the scalability of existing nanohinge designs for hierarchical assembly of more complex structures with greater degrees of mobility and functionality. The components of this system, comprising two distinct nanohinges, were designed in caDNAno. Structure conformation and stability were simulated using CanDo and MrDNA, and hinge assembly was validated by TEM. Electron micrographs revealed hinge-shaped nanostructures capable of self-assembly into more complex structures, as well as actuation using TMSD through a reversible locking mechanism incorporated into the design. Our work expands the existing utility of DNA nanohinges as building blocks for scalable DNA nanostructures and demonstrates the feasibility of polymerizing hinges in a novel manner for higher order assembly. The enhanced functionality of our dual hinge systems can be employed in future applications requiring greater control and mobility of DNA nanostructures.
0

Ecology and molecular targets of hypermutation in the global microbiome.

Simon Roux et al.Apr 2, 2020
Changes in the sequence of an organism's genome, i.e. mutations, are the raw material of evolution1. The frequency and location of mutations can be constrained by specific molecular mechanisms, such as Diversity-generating retroelements (DGRs). DGRs introduce mutations in specific target genes, and were characterized from several cultivated bacteria and bacteriophages. Whilst a larger diversity of DGR loci has been identified in genomic data from environmental samples, i.e. metagenomes, the ecological role of these DGRs and their associated evolutionary drivers remain poorly understood. Here we built and analyzed an extensive dataset of >30,000 metagenome-derived DGRs, and determine that DGRs have a single evolutionary origin and a universal bias towards adenine mutations. We further identified six major lineages of DGRs, each associated with a specific ecological niche defined as a genome type, i.e. whether the DGR is encoded on a viral or cellular genome, a limited set of taxa and environments, and a distinct type of target. Finally, we leverage read mapping and metagenomic time series to demonstrate that DGRs are consistently and broadly active, and responsible for >10% of all amino acid changes in some organisms at a conservative estimate. Overall, these results highlight the strong constraints under which DGRs diversify and expand, and elucidate several distinct roles these elements play in natural communities and in shaping microbial community structure and function in our environment.
0

Metabolic pathway inference using multi-label classification with rich pathway features

Abdur Basher et al.Feb 3, 2020
Metabolic inference from genomic sequence information is a necessary step in determining the capacity of cells to make a living in the world at different levels of biological organization. A common method for determining the metabolic potential encoded in genomes is to map conceptually translated open reading frames onto a database containing known product descriptions. Such gene-centric methods are limited in their capacity to predict pathway presence or absence and do not support standardized rule-sets for automated and reproducible research. Pathway-centric methods based on defined rule sets or machine learning algorithms provide an adjunct or alternative inference method that supports hypothesis generation and testing of metabaolic relationships within and between cells. Here, we present mlLGPR, multi-label based on logistic regression for pathway prediction, a software package that uses supervised multi-label classification and rich pathway features to infer metabolic networks at the individual, population and community levels of organization. We evaluated mlLGPR performance using a corpora of 12 experimental datasets manifesting diverse multi-label properties, including manually curated organismal genomes, synthetic microbial communities and low complexity microbial communities. Resulting performance metrics equaled or exceeded previous reports for organismal genomes and identify specific challenges associated with features engineering and training data for community-level metabolic inference.
0

Leveraging Heterogeneous Network Embedding for Metabolic Pathway Prediction

Abdur Basher et al.Feb 23, 2020
Metabolic pathway reconstruction from genomic sequence information is a key step in predicting regulatory and functional potential of cells at the individual, population and community levels of organization. Although the most common methods for metabolic pathway reconstruction are gene-centric e.g. mapping annotated proteins onto known pathways using a reference database, pathway-centric methods based on heuristics or machine learning to infer pathway presence provide a powerful engine for hypothesis generation in biological systems. Such methods rely on rule sets or rich feature information that may not be known or readily accessible. Here, we present pathway2vec, a software package consisting of six representational learning based modules used to automatically generate features for pathway inference. Specifically, we build a three layered network composed of compounds, enzymes, and pathways, where nodes within a layer manifest inter-interactions and nodes between layers manifest betweenness interactions. This layered architecture captures relevant relationships used to learn a neural embedding-based low-dimensional space of metabolic features. We benchmark pathway2vec performance based on node-clustering, embedding visualization and pathway prediction using MetaCyc as a trusted source. In the pathway prediction task, results indicate that it is possible to leverage embeddings to improve pathway prediction outcomes.Availability and implementation The software package, and installation instructions are published on [github.com/pathway2vec][1]Contact shallam{at}mail.ubc.ca [1]: http://github.com/pathway2vec