BL
Bryan Lunt
Author with expertise in Regulation of RNA Processing and Function
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
6
(50% Open Access)
Cited by:
1,384
h-index:
4
/
i10-index:
4
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Direct-coupling analysis of residue coevolution captures native contacts across many protein families

Faruck Morcos et al.Nov 21, 2011
The similarity in the three-dimensional structures of homologous proteins imposes strong constraints on their sequence variability. It has long been suggested that the resulting correlations among amino acid compositions at different sequence positions can be exploited to infer spatial contacts within the tertiary protein structure. Crucial to this inference is the ability to disentangle direct and indirect correlations, as accomplished by the recently introduced Direct Coupling Analysis (DCA) (Weigt et al. (2009) Proc Natl Acad Sci 106:67). Here we develop a computationally efficient implementation of DCA, which allows us to evaluate the accuracy of contact prediction by DCA for a large number of protein domains, based purely on sequence information. DCA is shown to yield a large number of correctly predicted contacts, recapitulating the global structure of the contact map for the majority of the protein domains examined. Furthermore, our analysis captures clear signals beyond intra- domain residue contacts, arising, e.g., from alternative protein conformations, ligand- mediated residue couplings, and inter-domain interactions in protein oligomers. Our findings suggest that contacts predicted by DCA can be used as a reliable guide to facilitate computational predictions of alternative protein conformations, protein complex formation, and even the de novo prediction of protein domain structures, provided the existence of a large number of homologous sequences which are being rapidly made available due to advances in genome sequencing.
0
Citation1,382
0
Save
0

Mechanistic analysis of enhancer sequences in the Estrogen Receptor transcriptional program

Shayan Tabe-Bordbar et al.Nov 9, 2020
Abstract Background Estrogen Receptor α (ERα) is a major lineage determining transcription factor (TF) in mammary gland development, orchestrating the expression of thousands of genes. Dysregulation of ERα-mediated transcriptional program results in abnormal cell proliferation and cancer. Transcriptomic and epigenomic profiling of breast cancer cell lines has revealed large numbers of enhancers involved in this regulatory program, but how these enhancers encode function in their sequence remains poorly understood. Results A subset of ERα-bound enhancers are transcribed into short bidirectional RNA (enhancer RNA or eRNA), and this property is believed to be a reliable marker of active enhancers. We therefore analyze thousands of ERα-bound enhancers and build quantitative, mechanism-aware models to discriminate eRNAs from non-transcribing enhancers based on their sequence. Our thermodynamics-based models provide insights into the roles of specific TFs in ERα-mediated transcriptional program, many of which are supported by the literature. We use in silico perturbations to predict TF-enhancer regulatory relationships and integrate these findings with experimentally determined enhancer-promoter interactions to construct a gene regulatory network. We also demonstrate that the model can prioritize breast cancer-related sequence variants while providing mechanistic explanations for their function. Finally, we experimentally validate the model-proposed mechanisms underlying three such variants. Conclusions We modeled the sequence-to-expression relationship in ERα-driven enhancers and gained mechanistic insights into the workings of a major transcriptional program. Our model is consistent with the current body of knowledge and its predictions are confirmed by experimental observations. We believe this to be a promising approach to analysis of regulatory sequences and variants.
0
Citation2
0
Save
0

Model-based analysis of polymorphisms in an enhancer reveals cis-regulatory mechanisms

Farzaneh Khajouei et al.Feb 9, 2020
It is challenging to predict the impact of small genetic changes such as single nucleotide polymorphisms on gene expression, since mechanisms involved in gene regulation and their cis-regulatory encoding are not well-understood. Recent studies have attempted to predict the functional impact of non-coding variants based on available knowledge of cis-regulatory encoding, e.g., transcription factor (TF) motifs. In this work, we explore the relationship between regulatory variants and cis-regulatory encoding from the opposite angle, using the former to inform the latter. We employ sequence-to-expression modeling to resolve ambiguities regarding gene regulatory mechanisms using information about effects of single nucleotide variations in an enhancer. We demonstrate our methodology using a well-studied enhancer of the developmental gene intermediate neuroblasts defective (ind) in D. melanogaster. We first trained the thermodynamics-based model GEMSTAT to relate the neuroectodermal expression pattern of ind to its enhancer's sequence, and constructed an ensemble of models that represent different parameter settings consistent with available data for this gene. We then predicted the effects of every possible single nucleotide variation within this enhancer, and compared these to SNP data recorded in the Drosophila Genome Reference Panel. We chose specific SNPs for which different models in the ensemble made conflicting predictions, and tested their effect in vivo. These experiments narrowed in on one mechanistic model as capable of explaining the observed effects. We further confirmed the generalizability of this model to orthologous enhancers and other related developmental enhancers. In conclusion, mechanistic models of cis-regulatory function not only help make specific predictions of variant impact, they may also be learned more accurately using data on variants.
0

Regularization Improves the Robustness of Learned Sequence-to-Expression Models

Bryan Lunt et al.Aug 20, 2018
Understanding of the gene regulatory activity of enhancers is a major problem in regulatory biology. The nascent field of sequence-to-expression modelling seeks to create quantitative models of gene expression based on regulatory DNA (cis) and cellular environmental (trans) contexts. All quantitative models are defined partially by numerical parameters, and it is common to fit these parameters to data provided by existing experimental results. However, the relative paucity of experimental data appropriate for this task, and lacunae in our knowledge of all components of the systems, results in problems often being under-specified, which in turn may lead to a situation where wildly different model parameterizations perform similarly well on training data. It may also lead to models being fit to the idiosyncrasies of the training data, without representing the more general process (overfitting). In other contexts where parameter-fitting is performed, it is common to apply regularization to reduce overfitting. We systematically evaluated the efficacy of three types of regularization in improving the generalizability of trained sequence-to-expression models. The evaluation was performed in two types of cross-validation experiments: one training on D. melanogaster data and predicting on orthologous enhancers from related species, and the other cross-validating between four D. melanogaster neurogenic ectoderm enhancers, which are thought to be under control of the same transcription factors. We show that training with a combination of noise-injection, L1, and L2 regularization can drastically reduce overfitting and improve the generalizability of learned sequence-to-expression models. These results suggest that it may be possible to mitigate the tendency of sequence-to-expression models to overfit available data, thus improving predictive power and potentially resulting in models that provide better insight into underlying biological processes.
0

Mechanistic analysis of enhancer sequences in the estrogen receptor transcriptional program

Shayan Tabe-Bordbar et al.Jun 11, 2024
Abstract Estrogen Receptor α (ERα) is a major lineage determining transcription factor (TF) in mammary gland development. Dysregulation of ERα-mediated transcriptional program results in cancer. Transcriptomic and epigenomic profiling of breast cancer cell lines has revealed large numbers of enhancers involved in this regulatory program, but how these enhancers encode function in their sequence remains poorly understood. A subset of ERα-bound enhancers are transcribed into short bidirectional RNA (enhancer RNA or eRNA), and this property is believed to be a reliable marker of active enhancers. We therefore analyze thousands of ERα-bound enhancers and build quantitative, mechanism-aware models to discriminate eRNAs from non-transcribing enhancers based on their sequence. Our thermodynamics-based models provide insights into the roles of specific TFs in ERα-mediated transcriptional program, many of which are supported by the literature. We use in silico perturbations to predict TF-enhancer regulatory relationships and integrate these findings with experimentally determined enhancer-promoter interactions to construct a gene regulatory network. We also demonstrate that the model can prioritize breast cancer-related sequence variants while providing mechanistic explanations for their function. Finally, we experimentally validate the model-proposed mechanisms underlying three such variants.