CP
Carmina Pérez-Romero
Author with expertise in Coronavirus Disease 2019 Research
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
12
(58% Open Access)
Cited by:
933
h-index:
5
/
i10-index:
5
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
22

Design of Specific Primer Set for Detection of B.1.1.7 SARS-CoV-2 Variant using Deep Learning

Alejandro Lopez‐Rincon et al.Dec 29, 2020
ABSTRACT The SARS-CoV-2 variant B.1.1.7 lineage, also known as clade GR from Global Initiative on Sharing All Influenza Data (GISAID), Nextstrain clade 20B, or Variant Under Investigation in December 2020 (VUI – 202012/01), appears to have an increased transmissability in comparison to other variants. Thus, to contain and study this variant of the SARS-CoV-2 virus, it is necessary to develop a specific molecular test to uniquely identify it. Using a completely automated pipeline involving deep learning techniques, we designed a primer set which is specific to SARS-CoV-2 variant B.1.1.7 with >99% accuracy, starting from 8,923 sequences from GISAID. The resulting primer set is in the region of the synonymous mutation C16176T in the ORF1ab gene, using the canonical sequence of the variant B.1.1.7 as a reference. Further in-silico testing shows that the primer set’s sequences do not appear in different viruses, using 20,571 virus samples from the National Center for Biotechnology Information (NCBI), nor in other coronaviruses, using 487 samples from National Genomics Data Center (NGDC). In conclusion, the presented primer set can be exploited as part of a multiplexed approach in the initial diagnosis of Covid-19 patients, or used as a second step of diagnosis in cases already positive to Covid-19, to identify individuals carrying the B.1.1.7 variant.
22
Citation19
0
Save
37

Design of Specific Primer Sets for the Detection of SARS-CoV-2 Variants of Concern B.1.1.7, B.1.351, P.1, B.1.617.2 using Artificial Intelligence

Carmina Pérez-Romero et al.Jan 21, 2021
ABSTRACT As the COVID-19 pandemic continues, new SARS-CoV-2 variants with potentially dangerous features have been identified by the scientific community. Variant B.1.1.7 lineage clade GR from Global Initiative on Sharing All Influenza Data (GISAID) was first detected in the UK, and it appears to possess an increased transmissibility. At the same time, South African authorities reported variant B.1.351, that shares several mutations with B.1.1.7, and might also present high transmissibility. Earlier this year, a variant labelled P.1 with 17 non-synonymous mutations was detected in Brazil. Recently the World Health Organization has raised concern for the variants B.1.617.2 mainly detected in India but now exported worldwide. It is paramount to rapidly develop specific molecular tests to uniquely identify new variants. Using a completely automated pipeline built around deep learning and evolutionary algorithms techniques, we designed primer sets specific to variants B.1.1.7, B.1.351, P.1 and respectively. Starting from sequences openly available in the GISAID repository, our pipeline was able to deliver the primer sets for each variant. In-silico tests show that the sequences in the primer sets present high accuracy and are based on 2 mutations or more. In addition, we present an analysis of key mutations for SARS-CoV-2 variants. Finally, we tested the designed primers for B.1.1.7 using RT-PCR. The presented methodology can be exploited to swiftly obtain primer sets for each new variant, that can later be a part of a multiplexed approach for the initial diagnosis of COVID-19 patients.
37
Citation16
0
Save
0

Both the transcriptional activator, Bcd, and transcriptional repressor, Cic, form small mobile oligomeric clusters in early fly embryo nuclei

Lili Zhang et al.Feb 2, 2024
ABSTRACT Transcription factors play an essential role in pattern formation during early embryo development, generating a strikingly fast and precise transcriptional response that results in sharp gene expression boundaries. To characterize the steps leading up to transcription, we performed a side-by-side comparison of the nuclear dynamics of two morphogens, a transcriptional activator, Bicoid (Bcd), and a transcriptional repressor, Capicua (Cic), both involved in body patterning along the anterior-posterior axis of the early Drosophila embryo. We used a combination of fluorescence recovery after photobleaching, fluorescence correlation spectroscopy, and single particle tracking to access a wide range of dynamical timescales. Despite their opposite effects on gene transcription, we find that Bcd and Cic have very similar nuclear dynamics, characterized by the co-existence of a freely diffusing monomer population with a number of oligomeric clusters, which range from low stoichiometry and high mobility clusters to larger, DNA-bound hubs. Our observations are consistent with the inclusion of both Bcd and Cic into transcriptional hubs or condensates, while putting constraints on the mechanism by which these form. These results fit in with the recent proposal that many transcription factors might share a common search strategy for target genes regulatory regions that makes use of their large unstructured regions, and may eventually help explain how the transcriptional response they elicit can be at the same time so fast and so precise. SIGNIFICANCE By conducting a comparative study of the nuclear dynamics of Bicoid (a transcriptional activator) and Capicua (a transcriptional repressor) in the Drosophila embryo, we have uncovered a striking similarity in their behaviours. Despite their divergent roles in transcription, both proteins have a propensity to form oligomeric species ranging from highly mobile, low stoichiometry clusters to larger, DNA-bound hubs. Such findings impose new constraints on the existing models of gene regulation by transcription factors, particularly in aspects related to target search and oligomeric binding to gene regulatory regions needed to explain the rapid and precise transcriptional response observed in developmental processes.
0
Citation1
0
Save
0

Both the transcriptional activator, Bcd, and repressor, Cic, form small mobile oligomeric clusters.

Lili Zhang et al.Aug 20, 2024
Transcription factors play an essential role in pattern formation during early embryo development, generating a strikingly fast and precise transcriptional response that results in sharp gene expression boundaries. To characterize the steps leading up to transcription, we performed a side-by-side comparison of the nuclear dynamics of two morphogens, a transcriptional activator, Bicoid (Bcd), and a transcriptional repressor, Capicua (Cic), both involved in body patterning along the anterior-posterior axis of the early Drosophila embryo. We used a combination of fluorescence recovery after photobleaching, fluorescence correlation spectroscopy, and single particle tracking to access a wide range of dynamical timescales. Despite their opposite effects on gene transcription, we find that Bcd and Cic have very similar nuclear dynamics, characterized by the co-existence of a freely diffusing monomer population with a number of oligomeric clusters, which range from low stoichiometry and high mobility clusters to larger, DNA-bound hubs. Our observations are consistent with the inclusion of both Bcd and Cic into transcriptional hubs or condensates, while putting constraints on the mechanism by which these form. These results fit in with the recent proposal that many transcription factors might share a common search strategy for target genes regulatory regions that makes use of their large unstructured regions, and may eventually help explain how the transcriptional response they elicit can be at the same time so fast and so precise.
0

Accurate Identification of SARS-CoV-2 from Viral Genome Sequences using Deep Learning

Alejandro Lopez‐Rincon et al.Mar 14, 2020
One of the reasons for the fast spread of SARS-CoV-2 is the lack of accuracy in detection tools in the clinical field. Molecular techniques, such as quantitative real-time RT-PCR and nucleic acid sequencing methods, are widely used to identify pathogens. For this particular virus, however, they have an overall unsatisfying detection rate, due to its relatively recent emergence and still not completely understood features. In addition, SARS-CoV-2 is remarkably similar to other Coronaviruses, and it can present with other respiratory infections, making identification even harder. To tackle this issue, we propose an assisted detection test, combining molecular testing with deep learning. The proposed approach employs a state-of-the-art deep convolutional neural network, able to automatically create features starting from the genome sequence of the virus. Experiments on data from the Novel Coronavirus Resource (2019nCoVR) show that the proposed approach is able to correctly classify SARS-CoV-2, distinguishing it from other coronavirus strains, such as MERS-CoV, HCoV-NL63, HCoV-OC43, HCoV-229E, HCoV-HKU1, and SARS-CoV regardless of missing information and errors in sequencing (noise). From a dataset of 553 complete genome non-repeated sequences that vary from 1,260 to 31,029 bps in length, the proposed approach classifies the different coronaviruses with an average accuracy of 98.75% in a 10-fold cross-validation, identifying SARS-CoV-2 with an AUC of 98%, specificity of 0.9939 and sensitivity of 1.00 in a binary classification. Then, using the same basis, we classify SARS-CoV-2 from 384 complete viral genome sequences with human host, that contain the gene ORF1ab from the NCBI with a 10-fold accuracy of 98.17%, a specificity of 0.9797 and sensitivity of 1.00. Furthermore, an in-depth analysis of the results allow us to identify base pairs sequences that are unique to SARS-CoV-2 and do not appear in other virus strains, that could then be used as a base for designing new primers and examined by experts to extract further insights. These preliminary results seem encouraging enough to identify deep learning as a promising research venue to develop assisted detection tests for SARS-CoV-2. At this end the interaction between viromics and deep learning , will hopefully help to solve global infection problems. In addition, we offer our code and processed data to be used for diagnostic purposes by medical doctors, virologists and scientists involved in solving the SARS-CoV-2 pandemic. As more data become available we will update our system.
0

Precision of readout at the hunchback gene

Jonathan Desponds et al.Jul 14, 2016
The simultaneous expression of the hunchback gene in the multiple nuclei of the developing fly embryo gives us a unique opportunity to study how transcription is regulated in functional organisms. A recently developed MS2-MCP technique for imaging transcription in living Drosophila embryos allows us to quantify the dynamics of the developmental transcription process. The initial measurement of the morphogens by the hunchback promoter takes place during very short cell cycles, not only giving each nucleus little time for a precise readout, but also resulting in short time traces. Additionally, the relationship between the measured signal and the promoter state depends on the molecular design of the reporting probe. We develop an analysis approach based on tailor made autocorrelation functions that overcomes the short trace problems and quantifies the dynamics of transcription initiation. Based on life imaging data, we identify signatures of bursty transcription initiation from the hunchback promoter. We show that the precision of the expression of the hunchback gene to measure its position along the anterior-posterior axis is low both at the boundary and in the anterior even at cycle 13, suggesting additional post-translational averaging mechanisms to provide the precision observed in fixed material.
1

SARS-CoV-2 Omicron Variant AI-based Primers

Carmina Pérez-Romero et al.Jan 26, 2022
ABSTRACT As the COVID-19 pandemic continues to affect the world, a new variant of concern, B.1.1.529 (Omicron), has been recently identified by the World Health Organization. At the time of writing, there are still no available primer sets specific to the Omicron variant, and its identification is only possible by using multiple targets, checking for specific failures, amplifying the suspect samples, and sequencing the results. This procedure is considerably time-consuming, in a situation where time might be of the essence. In this paper we use an Artificial Intelligence (AI) technique to identify a candidate primer set for the Omicron variant. The technique, based on Evolutionary Algorithms (EAs), has been already exploited in the recent past to develop primers for the B.1.1.7/Alpha variant, that have later been successfully tested in the lab. Starting from available virus samples, the technique explores the space of all possible subsequences of viral RNA, evaluating them as candidate primers. The criteria used to establish the suitability of a sequence as primer includes its frequency of appearance in samples labeled as Omicron, its absence from samples labeled as other variants, a specific range of melting temperature, and its CG content. The resulting primer set has been validated in silico and proves successful in preliminary laboratory tests. Thus, these results prove further that our technique could be established as a working template for a quick response to the appearance of new SARS-CoV-2 variants.
Load More