AG
Andrea Gioacchino
Author with expertise in Ribosome Structure and Translation Mechanisms
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
9
(100% Open Access)
Cited by:
21
h-index:
8
/
i10-index:
6
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
32

Repeats Mimic Pathogen-Associated Patterns Across a Vast Evolutionary Landscape

Petr Šulc et al.Nov 4, 2021
ABSTRACT An emerging hallmark across human diseases – such as cancer, autoimmune and neurodegenerative disorders – is the aberrant transcription of typically silenced repetitive elements. Once active, a subset of repeats may be capable of “viral mimicry”: the display of pathogen-associated molecular patterns (PAMPs) that can, in principle, bind pattern recognition receptors (PRRs) of the innate immune system and trigger inflammation. Yet how to quantify the landscape of viral mimicry and how it is shaped by natural selection remains a critical gap in our understanding of both genome evolution and the immunological basis of disease. We propose a theoretical framework to quantify selective forces on virus-like features as the entropic cost a sequence pays to hold a non-self PAMP and show our approach can predict classes of viral-mimicry within the human genome and across eukaryotes. We quantify the breadth and conservation of viral mimicry across multiple species for the first time and integrate selective forces into predictive evolutionary models. We show HSATII and intact LINE-1 (L1) are under selection to maintain CpG motifs, and specific Alu families likewise maintain the proximal presence of inverted copies to form double-stranded RNA (dsRNA). We validate our approach by predicting high CpG L1 ligands of L1 proteins and the innate receptor ZCCHC3 , and dsRNA present both intracellularly and as MDA5 ligands. We conclude viral mimicry is a general evolutionary mechanism whereby genomes co-opt pathogen-associated features generated by prone repetitive sequences, likely offering an advantage as a quality control system against transcriptional dysregulation.
32
Citation8
0
Save
10

The heterogeneous landscape and early evolution of pathogen-associated CpG dinucleotides in SARS-CoV-2

Andrea Gioacchino et al.May 7, 2020
COVID-19 can lead to acute respiratory syndrome, which can be due to dysregulated immune signaling. We analyze the distribution of CpG dinucleotides, a pathogen-associated molecular pattern, in the SARS-CoV-2 genome. We find that the CpG content, which we characterize by a force parameter that accounts for statistical constraints acting on the genome at the nucleotidic and amino-acid levels, is, on average, low compared to other pathogenic betacoronaviruses. However, the CpG force widely fluctuates along the genome, with a particularly low value, comparable to the circulating seasonal HKU1, in the spike coding region and a greater value, comparable to SARS and MERS, in the highly expressed nucleocapside coding region (N ORF), whose transcripts are relatively abundant in the cytoplasm of infected cells and present in the 3'UTRs of all subgenomic RNA. This dual nature of CpG content could confer to SARS-CoV-2 the ability to avoid triggering pattern recognition receptors upon entry, while eliciting a stronger response during replication. We then investigate the evolution of synonymous mutations since the outbreak of the COVID-19 pandemic, finding a signature of CpG loss in regions with a greater CpG force. Sequence motifs preceding the CpG-loss-associated loci in the N ORF match recently identified binding patterns of the Zinc finger Anti-viral Protein. Using a model of the viral gene evolution under human host pressure, we find that synonymous mutations seem driven in the SARS-CoV-2 genome, and particularly in the N ORF, by the viral codon bias, the transition-transversion bias and the pressure to lower CpG content.
10
Citation5
0
Save
0

Deciphering the code of viral-host adaptation through maximum entropy models

Andrea Gioacchino et al.Oct 30, 2023
Abstract Understanding how the genome of a virus evolves depending on the host it infects is an important question that challenges our knowledge about several mechanisms of host-pathogen interactions, including mutational signatures, innate immunity, and codon optimization. A key facet of this general topic is the study of viral genome evolution after a host-jumping event, a topic which has experienced a surge in interest due to the fight against emerging pathogens such as SARS-CoV-2. In this work, we tackle this question by introducing a new method to learn Maximum Entropy Nucleotide Bias models (MENB) reflecting single, di- and tri-nucleotide usage, which can be trained from viral sequences that infect a given host. We show that both the viral family and the host leave a fingerprint in nucleotide usages which MENB models decode. When the task is to classify both the host and the viral family for a sequence of unknown viral origin MENB models outperform state of the art methods based on deep neural networks. We further demonstrate the generative properties of the proposed framework, presenting an example where we change the nucleotide composition of the 1918 H1N1 Influenza A sequence without changing its protein sequence, while manipulating the nucleotide usage, by diminishing its CpG content. Finally we consider two well-known cases of zoonotic jumps, for the H1N1 Influenza A and for the SARS-CoV-2 viruses, and show that our method can be used to track the adaptation to the new host and to shed light on the more relevant selective pressures which have acted on motif usage during this process. Our work has wide-ranging applications, including integration into metagenomic studies to identify hosts for diverse viruses, surveillance of emerging pathogens, prediction of synonymous mutations that effect immunogenicity during viral evolution in a new host, and the estimation of putative evolutionary ages for viral sequences in similar scenarios. Additionally, the computational frame-work introduced here can be used to assist vaccine design by tuning motif usage with fine-grained control. Author summary In our research, we delved into the fascinating world of viruses and their genetic changes when they jump from one host to another, a critical topic in the study of emerging pathogens. We developed a novel computational method to capture how viruses change the nucleotide usage of their genes when they infect different hosts. We found that viruses from various families have unique strategies for tuning their nucleotide usage when they infect the same host. Our model could accurately pinpoint which host a viral sequence came from, even when the sequence was vastly different from the ones we trained on. We demonstrated the power of our method by altering the nucleotide usage of an RNA sequence without affecting the protein it encodes, providing a proof-of-concept of a method that can be used to design better RNA vaccines or to fine-tune other nucleic acid-based therapies. Moreover the framework we introduce can help tracking emerging pathogens, predicting synonymous mutations in the adaptation to a new host and estimating how long viral sequences have been evolving in it. Overall, our work sheds light on the intricate interactions between viruses and their hosts.
1

Designing molecular RNA switches with Restricted Boltzmann machines

Jorge Fernández-de-Cossio-Díaz et al.May 12, 2023
ABSTRACT Riboswitches are structured allosteric RNA molecules capable of switching between competing conformations in response to a metabolite binding event, eventually triggering a regulatory response. Computational modelling of these molecules is complicated by complex tertiary contacts, conditioned to the presence of their cognate metabolite. In this work, we show that Restricted Boltzmann machines (RBM), a simple two-layer machine learning model, capture intricate sequence dependencies induced by secondary and tertiary structure, as well as the switching mechanism, resulting in a model that can be successfully used for the design of allosteric RNA. As a case study we consider the aptamer domain of SAM-I riboswitches. To validate the functionality of designed sequences experimentally by SHAPE-MaP, we develop a tailored analysis pipeline adequate for high-throughput probing of diverse homologous sequences. We find that among the probed 84 RBM designed sequences, showing up to 20% divergence from any natural sequence, about 28% (and 47% of the 45 among them having low RBM effective energies), are correctly structured and undergo a structural allosteric in response to SAM. Finally, we show how the flexibility of the molecule to switch conformations is connected to fine energetic features of its structural components.
1

Cancer cells co-evolve with retrotransposons to mitigate viral mimicry

Siyu Sun et al.May 20, 2023
Overexpression of repetitive elements is an emerging hallmark of human cancers 1 . Diverse repeats can mimic viruses by replicating within the cancer genome through retrotransposition, or presenting pathogen-associated molecular patterns (PAMPs) to the pattern recognition receptors (PRRs) of the innate immune system 2-5 . Yet, how specific repeats affect tumor evolution and shape the tumor immune microenvironment (TME) in a pro- or anti-tumorigenic manner remains poorly defined. Here, we integrate whole genome and total transcriptome data from a unique autopsy cohort of multiregional samples collected in pancreatic ductal adenocarcinoma (PDAC) patients, into a comprehensive evolutionary analysis. We find that more recently evolved S hort I nterspersed N uclear E lements (SINE), a family of retrotransposable repeats, are more likely to form immunostimulatory double-strand RNAs (dsRNAs). Consequently, younger SINEs are strongly co-regulated with RIG-I like receptor associated type-I interferon genes but anti-correlated with pro-tumorigenic macrophage infiltration. We discover that immunostimulatory SINE expression in tumors is regulated by either L ong I nterspersed N uclear E lements 1 (LINE1/L1) mobility or ADAR1 activity in a TP53 mutation dependent manner. Moreover, L1 retrotransposition activity tracks with tumor evolution and is associated with TP53 mutation status. Altogether, our results suggest pancreatic tumors actively evolve to modulate immunogenic SINE stress and induce pro-tumorigenic inflammation. Our integrative, evolutionary analysis therefore illustrates, for the first time, how dark matter genomic repeats enable tumors to co-evolve with the TME by actively regulating viral mimicry to their selective advantage.