AM
Alan Moses
Author with expertise in Ribosome Structure and Translation Mechanisms
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
12
(58% Open Access)
Cited by:
8
h-index:
14
/
i10-index:
17
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Discovering molecular features of intrinsically disordered regions by using evolution for contrastive learning

Alex Lu et al.Jul 30, 2021
Abstract A major challenge to the characterization of intrinsically disordered regions (IDRs), which are widespread in the proteome, but relatively poorly understood, is the identification of molecular features that mediate functions of these regions, such as short motifs, amino acid repeats and physicochemical properties. Here, we introduce a proteome-scale feature discovery approach for IDRs. Our approach, which we call “reverse homology”, exploits the principle that important functional features are conserved over evolution. We use this as a contrastive learning signal for deep learning: given a set of homologous IDRs, the neural network has to correctly choose a held-out homologue from another set of IDRs sampled randomly from the proteome. We pair reverse homology with a simple architecture and standard interpretation techniques, and show that the network learns conserved features of IDRs that can be interpreted as motifs, repeats, or bulk features like charge or amino acid propensities. We also show that our model can be used to produce visualizations of what residues and regions are most important to IDR function, generating hypotheses for uncharacterized IDRs. Our results suggest that feature discovery using unsupervised neural networks is a promising avenue to gain systematic insight into poorly understood protein sequences.
1
Citation2
0
Save
1

Developmental Dynamics of RNA Translation in the Human Brain

Erin Duffy et al.Oct 23, 2021
ABSTRACT The precise regulation of gene expression is fundamental to neurodevelopment, plasticity, and cognitive function. While several studies have deeply profiled mRNA dynamics in the developing human brain, there is a fundamental gap in our understanding of accompanying translational regulation. We perform ribosome profiling from more than 70 human prenatal and adult cortex samples across ontogeny and into adulthood, mapping translation events at nucleotide resolution. In addition to characterizing the translational regulation of annotated open reading frames (ORFs), we identify thousands of previously unknown translation events, including small open reading frames (sORFs) that give rise to human- and/or brain-specific microproteins, many of which we independently verify using size-selected proteomics. Ribosome profiling in stem cell-derived human neuronal cultures further corroborates these findings and shows that several neuronal activity-induced long non-coding RNAs (lncRNAs), including LINC00473 , a primate-specific lncRNA implicated in depression, encode previously undescribed microproteins. Physicochemical analysis of these brain microproteinss identifies a large class harboring arginine-glycine-glycine (RGG) repeats as strong candidates for regulating RNA metabolism. Moreover, we find that, collectively, these previously unknown human brain sORFs are enriched for variants associated with schizophrenia. In addition to significantly expanding the translational landscape of the developing brain, this atlas will serve as a rich resource for the annotation and functional interrogation of thousands of previously unknown brain-specific protein products.
1
Citation2
0
Save
1

Functional similarity of non-coding regions is revealed in phylogenetic average motif score representations

Aqsa Alam et al.Apr 11, 2023
Abstract Here we frame the cis-regulatory code (that connects the regulatory functions of non-coding regions, such as promoters and UTRs, to their DNA sequences) as a representation building problem. Representation learning has emerged as a new approach to understand function of DNA and proteins, by projecting sequences into high-dimensional feature spaces, where the features are learned from data by a neural network. Inspired by these approaches, we seek to define a feature space where non-coding regions with similar regulatory functions are nearby each other. As a first attempt, we engineered features based on matches to biochemically characterized regulatory motifs in the DNA sequences of non-coding regions. Remarkably, we found that functionally similar promoters and 3’ UTRs could be grouped together in a feature space defined by simple averages of the best match scores in (unaligned) orthologous non-coding regions, which we refer to as phylogenetic average motif scores. Perhaps most important, because this feature space is based on known motifs and not fit to any data, it is fully interpretable and not limited to any particular cell type or experimental context. We find that we can read off known regulatory relationships and evolutionary rewiring from visualizations of phylogenetic average motif score representations, and that predicted regulatory interactions based on neighbors in the feature space are borne out in transcription factor deletion experiments. Phylogenetic averages of match scores to known motifs is a baseline for representation learning applied to non-coding sequences, and may continue to improve as databases of motifs become more complete.
1
Citation1
0
Save
0

Short linear motifs in intrinsically disordered regions modulate HOG signaling capacity

Bob Strome et al.Oct 7, 2017
The effort to characterize intrinsically disordered regions of signaling proteins is rapidly expanding. An important class of disordered interaction modules are ubiquitous and functionally diverse elements known as short linear motifs (SLiMs). We used a previously devised bioinformatics method to predict evolutionarily conserved SLiMs within a well-characterized pathway in S. cerevisiae. Using a single cell, flow cytometry assay with a pathway-specific promoter, we quantitatively assessed pathway output via systematic deletions of individual motifs. We found that, when deleted, 34% (10/29) of predicted SLiMs displayed a significant decrease in pathway output, providing evidence that these motifs play a role in signal transduction. In addition, we show that perturbations of parameters in a previously published stochastic model of HOG signaling could reproduce the quantitative effects of 4 out of 7 mutations in previously unknown SLiMs. Our study suggests that, even in well-characterized pathways, large numbers of functional elements remain undiscovered, and that challenges remain for application of systems biology models to interpret the effects of mutations in signalling pathways.
3

A functionally divergent intrinsically disordered region underlying the conservation of stochastic signaling

Ian Hsu et al.Jun 1, 2021
Abstract Stochastic signaling dynamics expand living cells’ information processing capabilities. An increasing number of studies report that regulators encode information in their pulsatile dynamics. The evolutionary mechanisms that lead to complex signaling dynamics remain uncharacterized, perhaps because key interactions of signaling proteins are encoded in intrinsically disordered regions (IDRs), whose evolution is difficult to analyze. Here we focused on the stochastic pulsing dynamics of Crz1, a transcription factor in fungi downstream of the widely conserved calcium signaling pathway. We find that Crz1 IDRs from anciently diverged fungi can all respond transiently to calcium stress; however, only Crz1 IDRs from the Saccharomyces clade support pulsatility, encode extra information, and rescue fitness, while the Crz1 IDRs from distantly related fungi do none of the three. On the other hand, we find that Crz1 pulsing is conserved in the distantly related fungi, consistent with the evolutionary model of stabilizing selection. Further, we show that a calcineurin docking site in a specific part of the IDRs appears to be sufficient for pulsing and show evidence for a beneficial increase in the relative calcineurin affinity of this docking site. We propose that evolutionary flexibility of functionally divergent IDRs underlies the conservation of stochastic signaling by stabilizing selection.
0

TSC22D,WNKandNRBPgene families exhibit functional buffering and evolved with Metazoa for macromolecular crowd sensing

Yu-Xi Xiao et al.Feb 15, 2024
SUMMARY The ability to sense and respond to osmotic fluctuations is critical for the maintenance of cellular integrity. Myriad redundancies have evolved across all facets of osmosensing in metazoans, including among water and ion transporters, regulators of cellular morphology, and macromolecular crowding sensors, hampering efforts to gain a clear understanding of how cells respond to rapid water loss. In this study, we harness the power of gene co-essentiality analysis and genome-scale CRISPR-Cas9 screening to identify an unappreciated relationship between TSC22D2 , WNK1 and NRBP1 in regulating cell volume homeostasis. Each of these genes have paralogs and are functionally buffered for macromolecular crowd sensing and cell volume control. Within seconds of hyperosmotic stress, TSC22D, WNK and NRBP family members physically associate into cytoplasmic biocondensates, a process that is dependent on intrinsically disordered regions (IDRs). A close examination of these protein families across metazoans reveals that TSC22D genes evolved alongside a domain in NRBPs that specifically binds to TSC22D proteins, which we have termed NbrT ( N RBP b inding region with T SC22D), and this co-evolution is concomitant with rapid IDR length expansion in WNK family kinases. Our study identifies functions for unrecognized components of the cell volume sensing machinery and reveals that TSC22D , WNK and NRBP genes evolved as cytoplasmic crowding sensors in metazoans to co-regulate rapid cell volume changes in response to osmolarity.
1

Architect: a tool for producing high-quality metabolic models through improved enzyme annotation

Nirvana Nursimulu et al.Oct 13, 2021
Abstract Motivation Constraints-based modeling is a powerful framework for understanding growth of organisms. Results from such simulation experiments can be affected at least in part by the quality of the metabolic models used. Reconstructing a metabolic network manually can produce a high-quality metabolic model but is a time-consuming task. At the same time, current methods for automating the process typically transfer metabolic function based on sequence similarity, a process known to produce many false positives. Results We created Architect, a pipeline for automatic metabolic model reconstruction from protein sequences. First, it performs enzyme annotation through an ensemble approach, whereby a likelihood score is computed for an EC prediction based on predictions from existing tools; for this step, our method shows both increased precision and recall compared to individual tools. Next, Architect uses these annotations to construct a high-quality metabolic network which is then gap-filled based on likelihood scores from the ensemble approach. The resulting metabolic model is output in SBML format, suitable for constraints-based analyses. Through comparisons of enzyme annotations and curated metabolic models, we demonstrate improved performance of Architect over other state-of-the-art tools. Availability Code for Architect is available at https://github.com/ParkinsonLab/Architect . Contact john.parkinson@utoronto.ca Supplementary information Supplementary data are available at Bioinformatics online.
0

Learning unsupervised feature representations for single cell microscopy images with paired cell inpainting

Alex Lu et al.Aug 20, 2018
Cellular microscopy images contain rich insights about biology. To extract this information, researchers use features, or measurements of the patterns of interest in the images. Here, we introduce a convolutional neural network (CNN) to automatically design features for fluorescence microscopy. We use a self-supervised method to learn feature representations of single cells in microscopy images without labelled training data. We train CNNs on a simple task that leverages the inherent structure of microscopy images and controls for variation in cell morphology and imaging: given one cell from an image, the CNN is asked to predict the fluorescence pattern in a second different cell from the same image. We show that our method learns high-quality features that describe protein expression patterns in single cells both yeast and human microscopy datasets. Moreover, we demonstrate that our features are useful for exploratory biological analysis, by capturing high-resolution cellular components in a proteome-wide cluster analysis of human proteins, and by quantifying multi-localized proteins and single-cell variability. We believe paired cell inpainting is a generalizable method to obtain feature representations of single cells in multichannel microscopy images.Author Summary To understand the cell biology captured by microscopy images, researchers use features, or measurements of relevant properties of cells, such as the shape or size of cells, or the intensity of fluorescent markers. Features are the starting point of most image analysis pipelines, so their quality in representing cells is fundamental to the success of an analysis. Classically, researchers have relied on features manually defined by imaging experts. In contrast, deep learning techniques based on convolutional neural networks (CNNs) automatically learn features, which can outperform manually-defined features at image analysis tasks. However, most CNN methods require large manually-annotated training datasets to learn useful features, limiting their practical application. Here, we developed a new CNN method that learns high-quality features for single cells in microscopy images, without the need for any labeled training data. We show that our features surpass other comparable features in identifying protein localization from images, and that our method can generalize to diverse datasets. By exploiting our method, researchers will be able to automatically obtain high-quality features customized to their own image datasets, facilitating many downstream analyses, as we highlight by demonstrating many possible use cases of our features in this study.
Load More