AT
Ammar Tareen
Author with expertise in Ribosome Structure and Translation Mechanisms
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
5
(60% Open Access)
Cited by:
17
h-index:
9
/
i10-index:
9
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
43

MAVE-NN: learning genotype-phenotype maps from multiplex assays of variant effect

Ammar Tareen et al.Jul 14, 2020
+3
A
M
A
Abstract Multiplex assays of variant effect (MAVEs) are a family of methods that includes deep mutational scanning (DMS) experiments on proteins and massively parallel reporter assays (MPRAs) on gene regulatory sequences. However, a general strategy for inferring quantitative models of genotype-phenotype (G-P) maps from MAVE data is lacking. Here we introduce MAVE-NN, a neural-network-based Python package that implements a broadly applicable information-theoretic framework for learning G-P maps—including biophysically interpretable models—from MAVE datasets. We demonstrate MAVE-NN in multiple biological contexts, and highlight the ability of our approach to deconvolve mutational effects from otherwise confounding experimental nonlinearities and noise.
43
Citation11
0
Save
12

Evolution of DNA Replication Origin Specification and Gene Silencing Mechanisms

Youjun Hu et al.Jul 4, 2020
+6
Y
A
Y
Abstract DNA replication in eukaryotic cells initiates from chromosomal locations, called replication origins, that bind the Origin Recognition Complex (ORC) prior to S phase. Origin establishment is guided by well-defined DNA sequence motifs in Saccharomyces cerevisiae and some other budding yeasts, but most eukaryotes lack sequence-specific origins. At present, the mechanistic and evolutionary reasons for this difference are unclear. A 3.9 Å structure of S. cerevisiae ORC-Cdc6-Cdt1-Mcm2-7 (OCCM) bound to origin DNA revealed, among other things, that a loop within Orc2 inserts into a DNA minor groove and an α-helix within Orc4 inserts into a DNA major groove 1 . We show that this Orc4 α-helix mediates the sequence-specificity of origins in S. cerevisiae . Specifically, mutations were identified within this α-helix that alter the sequence-dependent activity of individual origins as well as change global genomic origin firing patterns. This was accomplished using a massively parallel origin selection assay analyzed using a custom mutual-information-based modeling approach and a separate analysis of whole-genome replication profiling and statistics. Interestingly, the sequence specificity of DNA replication initiation, as mediated by the Orc4 α-helix, has evolved in close conjunction with the gain of ORC-Sir4-mediated gene silencing and the loss of RNA interference.
12
Citation3
0
Save
20

Structural and mechanistic basis of σ-dependent transcriptional pausing

Chirangini Pukhrambam et al.Jan 25, 2022
+10
H
M
C
Abstract In σ-dependent transcriptional pausing, the transcription initiation factor σ, translocating with RNA polymerase (RNAP), makes sequence-specific protein-DNA interactions with a promoter-like sequence element in the transcribed region, inducing pausing. It has been proposed that, in σ-dependent pausing, the RNAP active center can access off-pathway “backtracked” states that are substrates for the transcript-cleavage factors of the Gre family, and on-pathway “scrunched” states that mediate pause escape. Here, using site-specific protein-DNA photocrosslinking to define positions of the RNAP trailing and leading edges and of σ relative to DNA at the λ PR’ promoter, we show directly that σ-dependent pausing in the absence of GreB in vitro predominantly involves a state backtracked by 2-4 bp, and that σ-dependent pausing in the presence of GreB in vitro and in vivo predominantly involves a state scrunched by 2-3 bp. Analogous experiments with a library of 4 7 (∼16,000) transcribed-region sequences show that the state scrunched by 2-3 bp--and only that state--is associated with the consensus sequence, T -3 N -2 Y -1 G +1 , (where -1 corresponds to the position of the RNA 3’ end), which is identical to the consensus for pausing in initial transcription, and which is related to the consensus for pausing in transcription elongation. Experiments with heteroduplex templates show that sequence information at position T -3 resides in the DNA nontemplate strand. A cryo-EM structure of a complex engaged in σ-dependent pausing reveals positions of DNA scrunching on the DNA nontemplate and template strands and suggests that position T -3 of the consensus sequence exerts its effects by facilitating scrunching.
20
Citation3
0
Save
0

Logomaker: beautiful sequence logos in Python

Ammar Tareen et al.May 13, 2019
J
A
Summary: Sequence logos are visually compelling ways of illustrating the biological properties of DNA, RNA, and protein sequences, yet it is currently difficult to generate such logos within the Python programming environment. Here we introduce Logomaker, a Python API for creating publication-quality sequence logos. Logomaker can produce both standard and highly customized logos from any matrix-like array of numbers. Logos are rendered as vector graphics that are easy to stylize using standard matplotlib functions. Methods for creating logos from multiple-sequence alignments are also included. Availability and Implementation: Logomaker can be installed using the pip package manager and is compatible with both Python 2.7 and Python 3.6. Source code is available at http://github.com/jbkinney/logomaker. Supplemental Information: Documentation is provided at http://logomaker.readthedocs.io.
0

Biophysical models of cis-regulation as interpretable neural networks

Ammar Tareen et al.Nov 8, 2019
J
A
The adoption of deep learning techniques in genomics has been hindered by the difficulty of mechanistically interpreting the models that these techniques produce. In recent years, a variety of post-hoc attribution methods have been proposed for addressing this neural network interpretability problem in the context of gene regulation. Here we describe a complementary way of approaching this problem. Our strategy is based on the observation that two large classes of biophysical models of cis-regulatory mechanisms can be expressed as deep neural networks in which nodes and weights have explicit physiochemical interpretations. We also demonstrate how such biophysical networks can be rapidly inferred, using modern deep learning frameworks, from the data produced by certain types of massively parallel reporter assays (MPRAs). These results suggest a scalable strategy for using MPRAs to systematically characterize the biophysical basis of gene regulation in a wide range of biological contexts. They also highlight gene regulation as a promising venue for the development of scientifically interpretable approaches to deep learning.