TS
Tatiana Shashkova
Author with expertise in Protein Structure Prediction and Analysis
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
5
(80% Open Access)
Cited by:
15
h-index:
11
/
i10-index:
11
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
5

SEMA: Antigen B-cell conformational epitope prediction using deep transfer learning

Tatiana Shashkova et al.Jun 21, 2022
+8
M
D
T
Abstract One of the primary tasks in vaccine design and development of immunotherapeutic drugs is to predict conformational B-cell epitopes corresponding to primary antibody binding sites within the antigen tertiary structure. To date, multiple approaches have been developed to address this issue. However, for a wide range of antigens their accuracy is limited. In this paper, we applied the transfer learning approach using pretrained deep learning models to develop a model that predicts conformational B-cell epitopes based on the primary antigen sequence and tertiary structure. A pretrained protein language model, ESM-1b, and an inverse folding model, ESM-IF1, were fine-tuned to quantitatively predict antibody-antigen interaction features and distinguish between epitope and non-epitope residues. The resulting model called SEMA demonstrated the best performance on an independent test set with ROC AUC of 0.76 compared to peer-reviewed tools. We show that SEMA can quantitatively rank the immunodominant regions within the RBD domain of SARS-CoV-2. SEMA is available at https://github.com/AIRI-Institute/SEMAi and the web-interface http://sema.airi.net .
33

PROSTATA: Protein Stability Assessment using Transformers

Dmitry Umerenkov et al.Dec 26, 2022
+4
П
T
D
Abstract Accurate prediction of change in protein stability due to point mutations is an attractive goal that remains unachieved. Despite the high interest in this area, little consideration has been given to the transformer architecture, which is dominant in many fields of machine learning. In this work, we introduce PROSTATA, a predictive model built in knowledge transfer fashion on a new curated dataset. PROSTATA demonstrates superiority over existing solutions based on neural networks. We show that the large margin of improvement is due to both the architecture of the model and the quality of the new training data set. This work opens up opportunities for developing new lightweight and accurate models for protein stability assessment. PROSTATA is available at https://github.com/AIRI-Institute/PROSTATA .
0

Varicose veins of lower extremities: insights from the first large-scale genetic study

Alexandra Shadrina et al.Jul 13, 2018
Y
T
S
A
Abstract Varicose veins of lower extremities (VVs) are a common multifactorial vascular disease. Genetic factors underlying VVs development remain largely unknown. Here we report the first large-scale study of VVs performed on a freely available genetic data of 408,455 European-ancestry individuals. We identified 7 reliably associated loci that explain 10% of the SNP-based heritability, and prioritized the most likely causal genes CASZ1, PPP3R1, EBF1, STIM2 , and HFE . Genetic correlation analysis confirmed known epidemiological associations and found genetic overlap with various traits including fluid intelligence score, educational attainment, smoking, and pain. Finally, we observed causal effects of height, weight, both fat and fat-free mass, and plasma levels of MICB and CD209 proteins.
0
Citation3
0
Save
0

Knomics-Biota - a system for exploratory analysis of human gut microbiota data

Anna Popenko et al.Mar 6, 2018
+14
A
A
A
Summary: Metagenomic surveys of human microbiota are becoming increasingly widespread in academic research as well as in food and pharmaceutical industries and clinical context. Intuitive tools for exploration of experimental data are of high interest to researchers. Knomics-Biota is a Web-based resource for exploratory analysis of human gut metagenomes. Users can generate analytical reports that correspond to common experimental schemes (like case-control study or paired comparison). Statistical analysis and visualizations of microbiota composition are provided in association with the external factors and in the context of thousands of publicly available datasets. Availability and Implementation: The Web-service is available at https://biota.knomics.ru . Contact: anna.popenko@knomics.ru or a.tyakht@gmail.com. Supplementary information: Supplementary figures are available at Bioinformatics online.
1

Identification of tissue-specific and common methylation quantitative trait loci in healthy individuals using MAGAR

Michael Scherer et al.May 30, 2021
+11
G
E
M
Abstract Background Understanding the influence of genetic variants on DNA methylation is fundamental for the interpretation of epigenomic data in the context of disease. There is a need for systematic approaches not only for determining methylation quantitative trait loci (methQTL) but also for discriminating general from cell-type-specific effects. Results Here, we present a two-step computational framework MAGAR , which fully supports identification of methQTLs from matched genotyping and DNA methylation data, and additionally the identification of quantitative cell-type-specific methQTL effects. In a pilot analysis, we apply MAGAR on data in four tissues (ileum, rectum, T-cells, B-cells) from healthy individuals and demonstrate the discrimination of common from cell-type-specific methQTLs. We experimentally validate both types of methQTLs in an independent dataset comprising additional cell types and tissues. Finally, we validate selected methQTLs ( PON1 , ZNF155 , NRG2 ) by ultra-deep local sequencing. In line with previous reports, we find cell-type-specific methQTLs to be preferentially located in enhancer elements. Conclusions Our analysis demonstrates that a systematic analysis of methQTLs provides important new insights on the influences of genetic variants to cell-type-specific epigenomic variation.