IK
Ivan Kulakovskiy
Author with expertise in Ribosome Structure and Translation Mechanisms
Kazan Federal University, Institute of Protein Research, Vavilov Institute of General Genetics
+ 7 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
14
(64% Open Access)
Cited by:
10
h-index:
26
/
i10-index:
44
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

A GO catalogue of human DNA-binding transcription factors

Ruth Lovering et al.Oct 24, 2023
+8
M
P
R
Abstract DNA-binding transcription factors recognise genomic addresses, specific sequence motifs in gene regulatory regions, to control gene transcription. A complete and reliable catalogue of all DNA-binding transcription factors is key to investigating the delicate balance of gene regulation in response to environmental and developmental stimuli. The need for such a catalogue of proteins is demonstrated by the many lists of DNA-binding transcription factors that have been produced over the past decade. The COST Action Gene Regulation Ensemble Effort for the Knowledge Commons (GREEKC) Consortium brought together experts in the field of transcription with the aim of providing high quality and interoperable gene regulatory data. The Gene Ontology (GO) Consortium provides strict definitions for gene product function, including factors that regulate transcription. The collaboration between the GREEKC and GO Consortia has enabled the application of those definitions to produce a new curated catalogue of human DNA-binding transcription factors, that can be accessed at https://www.ebi.ac.uk/QuickGO/targetset/dbTF . In addition, this curation effort has led to the GO annotation of almost sixty thousand DNA-binding transcription factors in over a hundred species. Thus, this work will aid researchers investigating the regulation of transcription in both biomedical and basic science.
1

LegNet: a best-in-class deep learning model for short DNA regulatory regions

Dmitry Penzar et al.Oct 24, 2023
+6
E
D
D
Abstract Motivation The increasing volume of data from high-throughput experiments including parallel reporter assays facilitates the development of complex deep learning approaches for DNA regulatory grammar. Results Here we introduce LegNet, an EfficientNetV2-inspired convolutional network for modeling short gene regulatory regions. By approaching the sequence-to-expression regression problem as a soft classification task, LegNet secured first place for the autosome.org team in the DREAM 2022 challenge of predicting gene expression from gigantic parallel reporter assays. Using published data, here we demonstrate that LegNet outperforms existing models and accurately predicts gene expression per se as well as the effects of single-nucleotide variants. Furthermore, we show how LegNet can be used in a diffusion network manner for the rational design of promoter sequences yielding the desired expression level. Availability and Implementation https://github.com/autosome-ru/LegNet . The GitHub repository includes the Python code under the MIT license to reproduce the results presented in the study and a Jupyter Notebook tutorial. Supplementary Information Online-only supplementary data are available at Bioinformatics online. Contact dmitrypenzar1996@gmail.com , ivan.kulakovskiy@gmail.com
1

Landscape of allele-specific transcription factor binding in the human genome

Sergey Abramov et al.Oct 24, 2023
+10
D
A
S
Abstract Sequence variants in gene regulatory regions alter gene expression and contribute to phenotypes of individual cells and the whole organism, including disease susceptibility and progression. Single-nucleotide variants in enhancers or promoters may affect gene transcription by altering transcription factor binding sites. Differential transcription factor binding in heterozygous genomic loci provides a natural source of information on such regulatory variants. We present a novel approach to call the allele-specific transcription factor binding events at single-nucleotide variants in ChIP-Seq data, taking into account the joint contribution of aneuploidy and local copy number variation, that is estimated directly from variant calls. We have conducted a meta-analysis of more than 7 thousand ChIP-Seq experiments and assembled the database of allele-specific binding events listing more than half a million entries at nearly 270 thousand single-nucleotide polymorphisms for several hundred human transcription factors and cell types. These polymorphisms are enriched for associations with phenotypes of medical relevance and often overlap eQTLs, making candidates for causality by linking variants with molecular mechanisms. Specifically, there is a special class of switching sites, where different transcription factors preferably bind alternative alleles, thus revealing allele-specific rewiring of molecular circuitry.
1
Citation2
0
Save
3

Enhanced C/EBPs binding to C>T mismatches facilitates fixation of CpG mutations

A. Ershova et al.Oct 24, 2023
+4
O
I
A
Abstract Knowledge of mechanisms responsible for mutagenesis of adult stem cells is crucial to track genomic alterations that may affect cell renovation and provoke malignant cell transformation. Mutations in regulatory regions are widely studied nowadays, though mostly in cancer. In this study, we decomposed the mutation signature of adult stem cells, mapped the corresponding mutations into transcription factor binding regions, and assessed mutation frequency in sequence motif occurrences. We found binding sites of C/EBP transcription factors strongly enriched with [C>T]G mutations within the core CG dinucleotide related to deamination of the methylated cytosine. This effect was also exhibited in related cancer samples. Structural modeling predicted enhanced CEBPB binding to the consensus sequence with the [C>T]G mismatch, which was then confirmed in the direct experiment. We propose that it is the enhanced binding of C/EBPs that shields C>T transitions from DNA repair and leads to selective accumulation of the [C>T]G mutations within binding sites.
1

Human tissues exhibit diverse composition of translation machinery

Aleksandra Anisimova et al.Oct 24, 2023
+3
N
N
A
Abstract While protein synthesis is vital for the majority of cell types of the human body, diversely differentiated cells require specific translation regulation. This suggests specialization of translation machinery across tissues and organs. Using transcriptomic data from GTEx, FANTOM, and Gene Atlas we systematically explored the abundance of transcripts encoding translation factors and aminoacyl-tRNA synthetases (ARSases) in human tissues. We revised a few known and identified several novel translation-related genes exhibiting strict tissue-specific expression. The proteins they encode include eEF1A1, eEF1A2, PABPC1L, PABPC3, eIF1B, eIF4E1B, eIF4ENIF1, and eIF5AL1. Furthermore, our analysis revealed a pervasive tissue-specific relative abundance of translation machinery components (e.g. PABP and eRF3 paralogs, eIF2B subunits, eIF5MPs, and some ARSases), suggesting presumptive variance in the composition of translation initiation, elongation, and termination complexes. These conclusions were largely confirmed by the analysis of proteomic data. Finally, we paid attention to sexual dimorphism in the repertoire of translation factors encoded in sex chromosomes (eIF1A, eIF2γ, and DDX3), and identified testis and brain as organs with the most diverged expression of translation-associated genes.
61

Systematic Identification of Post-Transcriptional Regulatory Modules

Matvei Khoroshkin et al.Oct 24, 2023
+17
M
A
M
ABSTRACT In our cells, a limited number of RNA binding proteins (RBPs) are responsible for all aspects of RNA metabolism across the entire transcriptome. To accomplish this, RBPs form regulatory units that act on specific target regulons. However, the landscape of RBP combinatorial interactions remains poorly explored. Here, we performed a systematic annotation of RBP combinatorial interactions via multimodal data integration. We built a large-scale map of RBP protein neighborhoods by generating in vivo proximity-dependent biotinylation datasets of 50 human RBPs. In parallel, we used CRISPR interference with single-cell readout to capture transcriptomic changes upon RBP knockdowns. By combining these physical and functional interaction readouts, along with the atlas of RBP mRNA targets from eCLIP assays, we generated an integrated map of functional RBP interactions. We then used this map to match RBPs to their context-specific functions and validated the predicted functions biochemically for four RBPs. This study highlights the previously underappreciated scale of the inter-RBP interactions, be it genetic or physical, and is a first step towards a more comprehensive understanding of post-transcriptional regulatory processes and their underlying molecular grammar.
0

Statistical framework for calling allelic imbalance in high-throughput sequencing data

Andrey Buyan et al.Nov 9, 2023
+9
В
G
A
High-throughput sequencing facilitates large-scale studies of gene regulation and allows tracing the associations of individual genomic variants with changes in gene expression. Compared to classic association studies, allelic imbalance at heterozygous variants captures the functional effects of the regulatory genome variation with smaller sample sizes and higher sensitivity. Yet, the identification of allele-specific events from allelic read counts remains non-trivial due to multiple sources of technical and biological variability, which induce data-dependent biases and overdispersion. Here we present MIXALIME, a novel computational framework for calling allele-specific events in diverse omics data with a repertoire of statistical models accounting for read mapping bias and copy-number variation. We benchmark MIXALIME against existing tools and demonstrate its practical usage by constructing an atlas of allele-specific chromatin accessibility, UDACHA, from thousands of available datasets obtained from diverse cell types.
0
0
Save
0

Multi-faceted deregulation of gene expression and protein synthesis with age

Aleksandra Anisimova et al.May 7, 2020
+3
M
M
A
Protein synthesis represents a major metabolic activity of the cell. However, how it is affected by aging and how this in turn impacts cell function remains largely unexplored. To address this question, herein we characterized age-related changes in both the transcriptome and translatome of mouse tissues over the entire lifespan. Expression of the majority of differentially expressed genes followed a U-shaped curve with the turning point around 3-months-old. We showed that transcriptome changes govern changes in the translatome and are associated with altered expression of genes involved in inflammation, extracellular matrix and lipid metabolism. We also identified genes that may serve as candidate biomarkers of aging. At the translational level, we uncovered sustained down-regulation of a set of 5' terminal oligopyrimidine (5'TOP) transcripts encoding protein synthesis and ribosome biogenesis machinery and regulated by the mTOR pathway. For many of them, ribosome occupancy dropped 3-fold or even more. Moreover, with age, ribosome coverage gradually decreased in the vicinity of start codons and increased near stop codons, revealing complex age-related changes in the translation process. Taken together, our results reveal systematic and multi-dimensional deregulation in protein synthesis, showing this major cellular process declines with age.
0

Sequence-based model of gap gene regulatory network

Konstantin Kozlov et al.May 7, 2020
M
I
V
K
Background: The detailed analysis of transcriptional regulation is crucially important for understanding biological processes. The gap gene network in Drosophila attracts large interest among researches studying mechanisms of transcriptional regulation. It implements the most upstream regulatory layer of the segmentation gene network. The knowledge of molecular mechanisms involved in gap gene regulation is far less complete than that of genetics of the system. Mathematical modeling goes beyond insights gained by genetics and molecular approaches. It allows us to reconstruct wild-type gene expression patterns in silico, infer underlying regulatory mechanism and prove its sufficiency. Results: We developed a new model that provides a dynamical description of gap gene regulatory systems, using detailed DNA-based information, as well as spatial transcription factor concentration data at varying time points. We showed that this model correctly reproduces gap gene expression patterns in wild type embryos and is able to predict gap expression patterns in Kr mutants and four reporter constructs. We used four-fold cross validation test and fitting to random dataset to validate the model and proof its sufficiency in data description. The identifiability analysis showed that most model parameters are well identifiable. We reconstructed the gap gene network topology and studied the impact of individual transcription factor binding sites on the model output. We measured this impact by calculating the site regulatory weight as a normalized difference between the residual sum of squares error for the set of all annotated sites and the set, from which the site of interest was left out. Conclusions: The reconstructed topology of the gap gene network is in agreement with previous modeling results and data from literature. We showed that 1) the regulatory weights of transcription factor binding sites show very weak correlation with their PWM score; 2) sites with low regulatory weight are important for the model output; 3) functional important sites are not exclusively located in cis-regulatory elements, but are rather dispersed through regulatory region. It is of importance that some of the sites with high functional impact in hb, Kr and kni regulatory regions coincide with strong sites annotated and verified in Dnase I footprint assays. Keywords: transcription; thermodynamics; reaction-diffusion; drosophila
0

Coat color allele and mtDNA haplotype distributions in Russian cat populations: a citizen-science research

Olga Zaytseva et al.May 7, 2020
+12
E
Y
O
This work has started as a project for the summer school in molecular and theoretical biology. Efficient teaching and learning modern methods of molecular biology and population genetics in a two-week study course for high school students needs an attractive subject. We chose phylogeography of the domestic cat as the subject of our project because 1) everybody likes cats; 2) cats are polymorphic for several coat color mutations, which can be easily detected by street survey or in the photographs; 3) samples for DNA extraction are easy to collect without posing ethical and biosafety problems; 4) rich background information of geographical distribution of coat color alleles and variation in mtDNA is available; 5) phylogeography of cat population in Russia is poorly studied and therefore new data collected in this large territory may shed a light on the global cat distribution and on the origin of the fancy breeds. During the project students studied coat color and mitotype distribution across Russian random bred cats. The basics of field (observations of natural cat populations, hair collection), formal (inheritance of coat colors), mathematical population (allele frequency distributions and their comparisons, building phylogenetic trees, multidimensional scaling), and molecular (DNA extraction and amplification, quality control of DNA sequencing data) genetics were covered. We scored coat color phenotypes in 1182 cats and sequenced mtDNA control region from hair samples of 38 cats from 18 geographical sites. Analysis of coat color alleles frequencies and mitotype distribution confirmed relative homogeneity of gene pools of Russian cat populations, indicating their recent origin. We found several unique mitotypes and demonstrated that OL1 mitotype, previously found only in Siberian fancy breed, was present in random bred cats from several Russian cities. This contributes to the discussion on the origin of the Siberian breed of cats, and supports the view that Siberians is a recent breed created in the 1980s by breeding of selected representatives of the random bred population.
0
0
Save
Load More