ER
Elijah Roberts
Author with expertise in Stochasticity in Gene Regulatory Networks
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
9
(44% Open Access)
Cited by:
396
h-index:
21
/
i10-index:
26
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

MultiSeq: unifying sequence and structure data for evolutionary analysis

Elijah Roberts et al.Aug 16, 2006
Z
D
J
E
Since the publication of the first draft of the human genome in 2000, bioinformatic data have been accumulating at an overwhelming pace. Currently, more than 3 million sequences and 35 thousand structures of proteins and nucleic acids are available in public databases. Finding correlations in and between these data to answer critical research questions is extremely challenging. This problem needs to be approached from several directions: information science to organize and search the data; information visualization to assist in recognizing correlations; mathematics to formulate statistical inferences; and biology to analyze chemical and physical properties in terms of sequence and structure changes.Here we present MultiSeq, a unified bioinformatics analysis environment that allows one to organize, display, align and analyze both sequence and structure data for proteins and nucleic acids. While special emphasis is placed on analyzing the data within the framework of evolutionary biology, the environment is also flexible enough to accommodate other usage patterns. The evolutionary approach is supported by the use of predefined metadata, adherence to standard ontological mappings, and the ability for the user to adjust these classifications using an electronic notebook. MultiSeq contains a new algorithm to generate complete evolutionary profiles that represent the topology of the molecular phylogenetic tree of a homologous group of distantly related proteins. The method, based on the multidimensional QR factorization of multiple sequence and structure alignments, removes redundancy from the alignments and orders the protein sequences by increasing linear dependence, resulting in the identification of a minimal basis set of sequences that spans the evolutionary space of the homologous group of proteins.MultiSeq is a major extension of the Multiple Alignment tool that is provided as part of VMD, a structural visualization program for analyzing molecular dynamics simulations. Both are freely distributed by the NIH Resource for Macromolecular Modeling and Bioinformatics and MultiSeq is included with VMD starting with version 1.8.5. The MultiSeq website has details on how to download and use the software: http://www.scs.uiuc.edu/~schulten/multiseq/
0
Citation390
0
Save
0

A Pairwise Distance Distribution Correction (DDC) algorithm to eliminate blinking-caused artifacts in super-resolution microscopy

Christopher Bohrer et al.Sep 12, 2019
+11
X
X
C
Abstract In single-molecule localization based super-resolution microscopy (SMLM), a fluorophore stochastically switches between fluorescent- and dark-states, leading to intermittent emission of fluorescence, a phenomenon known as blinking. Intermittent emissions create multiple localizations belonging to the same molecule, resulting in blinking-artifacts within SMLM images. These artifacts are often interpreted as true biological assemblies, confounding quantitative analyses and interpretations. Multiple methods have been developed to eliminate these artifacts, but they either require additional experiments, arbitrary thresholds, or specific photo-kinetic models. Here we present a method, termed Distance Distribution Correction (DDC), to eliminate blinking-caused repeat localizations without any additional calibrations. The approach relies on the finding that the true pairwise distance distribution of different fluorophores in an SMLM image can be naturally obtained from the imaging sequence by using distances between localizations separated by a time much longer than the average fluorescence survival time. We show that using the true pairwise distribution we can define and then maximize the likelihood of obtaining a particular set of localizations void of blinking-artifacts, generating an accurate reconstruction of the underlying cellular structure. Using both simulated and experimental data, we show that DDC surpasses all previous existing blinking-artifact correction methodologies, resulting in drastic improvements in obtaining the closest estimate of the true spatial organization and number of fluorescent emitters in a wide range of applications. The simplicity and robustness of DDC will allow it to become the field standard in SMLM imaging, enabling the most accurate reconstruction and quantification of SMLM images to date.
1

A spatially resolved stochastic model reveals the role of supercoiling in transcription regulation

Yuncong Geng et al.Dec 29, 2021
+5
N
C
Y
Abstract In Escherichia coli , translocation of RNA polymerase (RNAP) during transcription introduces supercoiling to DNA, which influences the initiation and elongation behaviors of RNAP. To quantify the role of supercoiling in transcription regulation, we develop a spatially resolved supercoiling model of transcription, describing RNAP-supercoiling interactions, topoisomerase activities, stochastic topological domain formation, and supercoiling diffusion in all transcription stages. This model establishes that transcription-induced supercoiling mediates the cooperation of co-transcribing RNAP molecules in highly expressed genes. It reveals that supercoiling transmits RNAP-accessible information through DNA and enables different RNAP molecules to communicate within and between genes. It thus predicts that a topological domain could serve as a transcription regulator, generating substantial transcription bursting and coordinating communications between adjacent genes in the domain. The model provides a quantitative platform for further theoretical and experimental investigations of how genome organization impacts transcription. Author Summary DNA mechanics and transcription dynamics are intimately coupled. During transcription, the translocation of RNA polymerase overwinds the DNA ahead and underwinds the DNA behind, rendering the DNA supercoiled. The supercoiled DNA could, in return, influences the behavior of the RNA polymerase, and consequently the amount of mRNA product it makes. Furthermore, supercoils could propagate on the DNA over thousands of base pairs, impacting RNA polymerase molecules at faraway sites. These complicated interplays between supercoiling and RNA polymerase makes supercoiling an important transcription regulator. To quantitatively investigate the role of supercoiling in transcription, we build a spatially resolved model that links transcription with the generation, propagation, and dissipation of supercoiling. Our model reveals that supercoiling mediates transcription at multiple length scales. At a single-gene scale, we show that supercoiling gives rise to the collective motion of co-transcribing RNA polymerase molecules, supporting recent experimental observations. Additionally, large variations in mRNA production of a gene can arise from the constraints of supercoiling diffusion in a topological domain. At a multi-gene scale, we show that supercoiling dynamics allow two adjacent genes influence each other’s transcription kinetics, thus serving as a transcription regulator.
0

Reconstructing an epigenetic landscape using a genetic 'pulling' approach

Michael Assaf et al.Sep 23, 2019
E
S
M
Cells use genetic switches to shift between alternate stable gene expression states, e.g., to adapt to new environments or to follow a developmental pathway. Conceptually, these stable phenotypes can be considered as attractive states on an epigenetic landscape with phenotypic changes being transitions between states. Measuring these transitions is challenging because they are both very rare in the absence of appropriate signals and very fast. As such, it has proven difficult to experimentally map the epigenetic landscapes that are widely believed to underly developmental networks. Here, we introduce a new nonequilibrium perturbation method to help reconstruct a regulatory network's epigenetic landscape. We derive the mathematical theory needed and then use the method on simulated data to reconstruct the landscapes. Our results show that with a relatively small number of perturbation experiments it is possible to recover an accurate representation of the true epigenetic landscape. We propose that our theory provides a general method by which epigenetic landscapes can be studied. Finally, our theory suggests that the total perturbation impulse required to induce a switch between metastable states is a fundamental quantity in developmental dynamics.
0

Automatic error control during forward flux sampling of rare events in master equation models

Max Klein et al.Jan 27, 2018
E
M
Enhanced sampling methods, such as forward flux sampling (FFS), have great capacity for accelerating stochastic simulations of nonequilibrium biochemical systems involving rare events. However, the description of the tradeoffs between simulation efficiency and error in FFS remains incomplete. We present a novel and mathematically rigorous analysis of the errors in FFS that, for the first time, covers the contribution of every phase of the simulation. We derive a closed form expression for the optimally efficient count of samples to take in each FFS phase in terms of a fixed constraint on sampling error. We introduce a new method, forward flux pilot sampling (FFPilot), that is designed to take full advantage of our optimizing equation without prior information or assumptions about the phase weights and costs along the transition path. In simulations of both single- and multi-dimensional gene regulatory networks, FFPilot is able to completely control sampling error. Higher dimensional systems have additional sources of error and we show that this extra error can be traced to correlations between phases due to roughness on the probability landscape. Finally, we show that in sets of simulations with matched error, FFPilot is on the order of tens-to-hundreds of times faster than direct sampling, in a fashion that scales with the rarity of the events.
0

Natural variation in stochastic photoreceptor specification and color preference in Drosophila

Caitlin Anderson et al.Jun 21, 2017
+9
A
C
C
Each individual perceives the world in a unique way, but little is known about the genetic basis of variation in sensory perception. In the fly eye, the random mosaic of color-detecting R7 photoreceptor subtypes is determined by stochastic ON/Off expression of the transcription factor Spineless (Ss). In a genome wide association study, we identified a naturally occurring insertion in a regulatory DNA element in ss that lowers the ratio of SsON to SsOFF cells. This change in photoreceptor fates shifts the innate color preference of flies from green to blue. The genetic variant increases the binding affinity for Klumpfuss (Klu), a zinc finger transcriptional repressor that regulates ss expression. Klu is expressed at intermediate levels to determine the normal ratio of SsON to SsOFF cells. Thus, binding site affinity and transcription factor levels are finely tuned to regulate stochastic expression, setting the ratio of alternative fates and determining color preference.
1

Gene regulation network inference using k-nearest neighbor-based mutual information estimation-Revisiting an old DREAM

Lior Shachaf et al.Dec 21, 2021
J
P
E
L
Abstract Background A cell exhibits a variety of responses to internal and external cues. These responses are possible, in part, due to the presence of an elaborate gene regulatory network (GRN) in every single cell. In the past twenty years, many groups worked on reconstructing the topological structure of GRNs from large-scale gene expression data using a variety of inference algorithms. Insights gained about participating players in GRNs may ultimately lead to therapeutic benefits. Mutual information (MI) is a widely used metric within this inference/reconstruction pipeline as it can detect any correlation (linear and non-linear) between any number of variables ( n -dimensions). However, the use of MI with continuous data (for example, normalized fluorescence intensity measurement of gene expression levels) is sensitive to data size, correlation strength and underlying distributions, and often requires laborious and, at times, ad hoc optimization. Results In this work, we first show that estimating MI of a bi- and tri-variate Gaussian distribution using k -nearest neighbor (kNN) MI estimation results in significant error reduction as compared to commonly used methods based on fixed binning. Second, we demonstrate that implementing the MI-based kNN Kraskov-Stoögbauer-Grassberger (KSG) algorithm leads to a significant improvement in GRN reconstruction for popular inference algorithms, such as Context Likelihood of Relatedness (CLR). Finally, through extensive in-silico benchmarking we show that a new inference algorithm CMIA (Conditional Mutual Information Augmentation), inspired by CLR, in combination with the KSG-MI estimator, outperforms commonly used methods. Conclusions Using three canonical datasets containing 15 synthetic networks, the newly developed method for GRN reconstruction - which combines CMIA, and the KSG-MI estimator - achieves an improvement of 20-35% in precision-recall measures over the current gold standard in the field. This new method will enable researchers to discover new gene interactions or choose gene candidates for experimental validations.
0

Modeling binary and graded cone cell fate patterning in the mouse retina

Kiara Eldred et al.May 26, 2019
E
R
C
K
Nervous systems are incredibly diverse, with myriad neuronal subtypes defined by gene expression. How binary and graded fate characteristics are patterned across tissues is poorly understood. Expression of opsin photopigments in the cone photoreceptors of the mouse retina provides an excellent model to address this question. Individual cones express S-opsin only, M-opsin, or both S-opsin and M-opsin. These cell populations are patterned along the dorsal-ventral axis, with greater M-opsin expression in the dorsal region and greater S-opsin expression in the ventral region. Thyroid hormone signaling plays a critical role in activating M-opsin and repressing S-opsin. Here, we developed an image analysis approach to identify individual cone cells and evaluate their opsin expression from immunofluorescence imaging tiles spanning roughly 6 mm along the D-V axis of the mouse retina. From analyzing the opsin expression of ∼250,000 cells, we found that cones make a binary decision between S-opsin only and co-expression competent fates. Co-expression competent cells express graded levels of S- and M-opsins, depending nonlinearly on their position in the dorsal-ventral axis. M- and S-opsin expression display differential, inverse patterns. Using these single-cell data we developed a quantitative, stochastic model of cone cell decisions in the retinal tissue based on thyroid hormone signaling activity. The model recovers the probability distribution for cone fate patterning in the mouse retina and describes a minimal set of interactions that are necessary to reproduce the observed cell fates. Our study provides a paradigm describing how differential responses to regulatory inputs generate complex patterns of binary and graded cell fates.Author Summary The development of a cell in a mammalian tissue is governed by a complex regulatory network that responds to many input signals to give the cell a distinct identity, a process referred to as cell-fate specification. Some of these cell fates have binary on-or-off gene expression patterns, while others have graded gene expression that changes across the tissue. Differentiation of the photoreceptor cells that sense light in the mouse retina provides a good example of this process. Here, we explore how complex patterns of cell fates are specified in the mouse retina by building a computational model based on analysis of a large number of photoreceptor cells from microscopy images of whole retinas. We use the data and the model to study what exactly it means for a cell to have a binary or graded cell fate and how these cell fates can be distinguished from each other. Our study shows how tens-of-thousands of individual photoreceptor cells can be patterned across a complex tissue by a regulatory network, creating a different outcome depending upon the received inputs.
0

Neural network control of focal position during time-lapse microscopy of cells

Ling Wei et al.Dec 13, 2017
E
L
Live-cell microscopy is quickly becoming an indispensable technique for studying the dynamics of cellular processes. Maintaining the specimen in focus during image acquisition is crucial for high-throughput applications, especially for long experiments or when a large sample is being continuously scanned. Automated focus control methods are often expensive, imperfect, or ill-adapted to a specific application and are a bottleneck for widespread adoption of high-throughput, live-cell imaging. Here, we demonstrate a neural network approach for automatically maintaining focus during bright-field microscopy. Z-stacks of yeast cells growing in a microfluidic device were collected and used to train a convolutional neural network to classify images according to their z-position. We studied the effect on prediction accuracy of the various hyperparameters of the neural network, including downsampling, batch size, and z-bin resolution. The network was able to predict the z-position of an image with ±1 μm accuracy, outperforming human annotators. Finally, we used our neural network to control microscope focus in real-time during a 24 hour growth experiment. The method robustly maintained the correct focal position compensating for 40 μm of focal drift and was insensitive to changes in the field of view. Only ~100 annotated z-stacks were required to train the network making our method quite practical for custom autofocus applications.