MP
Mattia Prosperi
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
16
(69% Open Access)
Cited by:
505
h-index:
42
/
i10-index:
116
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The global spread of 2019-nCoV: a molecular evolutionary analysis

Domenico Benvenuto et al.Feb 12, 2020
The global spread of the 2019-nCoV is continuing and is fast moving, as indicated by the WHO raising the risk assessment to high. In this article, we provide a preliminary phylodynamic and phylogeographic analysis of this new virus. A Maximum Clade Credibility tree has been built using the 29 available whole genome sequences of 2019-nCoV and two whole genome sequences that are highly similar sequences from Bat SARS-like Coronavirus available in GeneBank. We are able to clarify the mechanism of transmission among the countries which have provided the 2019-nCoV sequence isolates from their patients. The Bayesian phylogeographic reconstruction shows that the 2019–2020 nCoV most probably originated from the Bat SARS-like Coronavirus circulating in the Rhinolophus bat family. In agreement with epidemiological observations, the most likely geographic origin of the new outbreak was the city of Wuhan, China, where 2019-nCoV time of the most recent common ancestor emerged, according to molecular clock analysis, around November 25th, 2019. These results, together with previously recorded epidemics, suggest a recurring pattern of periodical epizootic outbreaks due to Betacoronavirus. Moreover, our study describes the same population genetic dynamic underlying the SARS 2003 epidemic, and suggests the urgent need for the development of effective molecular surveillance strategies of Betacoronavirus among animals and Rhinolophus of the bat family.
0
Citation213
0
Save
1

Differing impacts of global and regional responses on SARS-CoV-2 transmission cluster dynamics

Brittany Magalis et al.Nov 6, 2020
Although the global response to COVID-19 has not been entirely unified, the opportunity arises to assess the impact of regional public health interventions and to classify strategies according to their outcome. Analysis of genetic sequence data gathered over the course of the pandemic allows us to link the dynamics associated with networks of connected individuals with specific interventions. In this study, clusters of transmission were inferred from a phylogenetic tree representing the relationships of patient sequences sampled from December 30, 2019 to April 17, 2020. Metadata comprising sampling time and location were used to define the global behavior of transmission over this earlier sampling period, but also the involvement of individual regions in transmission cluster dynamics. Results demonstrate a positive impact of international travel restrictions and nationwide lockdowns on global cluster dynamics. However, residual, localized clusters displayed a wide range of estimated initial secondary infection rates, for which uniform public health interventions are unlikely to have sustainable effects. Our findings highlight the presence of so-called "super-spreaders", with the propensity to infect a larger-than-average number of people, in countries, such as the USA, for which additional mitigation efforts targeting events surrounding this type of spread are urgently needed to curb further dissemination of SARS-CoV-2.
1
Citation7
0
Save
13

DYNAMITE: a phylogenetic tool for identification of dynamic transmission epicenters

Brittany Magalis et al.Jan 22, 2021
Abstract Molecular data analysis is invaluable in understanding the overall behavior of a rapidly spreading virus population when epidemiological surveillance is problematic. It is also particularly beneficial in describing subgroups within the population, often identified as clades within a phylogenetic tree, that represent individuals connected via direct transmission or transmission via differing risk factors in viral spread. However, transmission patterns or viral dynamics within these smaller groups should not be expected to exhibit homogeneous behavior over time. As such, standard phylogenetic approaches that identify clusters based on summary statistics (e.g., median genetic distance over the clade) would not be expected to capture dynamic clusters of transmission. For this purpose, we have developed DYNAMITE (DYNAMic Identification of Transmission Epicenters), a cluster identification algorithm based on a branch-wise (rather than traditional clade-wise) search for cluster criteria, allowing partial clades to be recognized as clusters. Using simulated viral outbreaks with varying cluster types and dynamics, we show that DYNAMITE is consistently more sensitive than existing tools in detecting both static and dynamic transmission clusters. DYNAMITE has been implemented in R and released as open source at: github.com/ProsperiLab/DYNAMITE .
13
Citation2
0
Save
1

The K-mer Antibiotic Resistance Gene Variant Analyzer (KARGVA)

Simone Marini et al.Aug 15, 2022
Abstract Characterization of antibiotic resistance genes (ARGs) from high-throughput sequencing data of metagenomics and cultured bacterial samples is a challenging task, with the need to account for both computational (e.g., string algorithms) and biological (e.g., gene transfers, rearrangements) aspects. Curated ARG databases exist together with assorted ARG classification approaches (e.g., database alignment, machine learning). Besides ARGs that naturally occur in bacterial strains or are acquired through mobile elements, there are chromosomal genes that can render a bacterium resistant to antibiotics through point mutations, i.e., ARG variants (ARGVs). While ARG repositories also collect ARGVs, there are only a few tools that are able to identify ARGVs from metagenomics and high throughput sequencing data, with a number of limitations (e.g., pre-assembly, a posteriori verification of mutations, or specification of species). In this work we present the k -mer, i.e., strings of fixed length k , ARGV analyzer –KARGVA– an open-source, multi-platform tool that provides: (i) an ad hoc, large ARGV database derived from multiple sources; (ii) input capability for various types of high-throughput sequencing data; (iii) a three-way, hash-based, k -mer search setup to process data efficiently, linking k -mers to ARGVs, k -mers to point mutations, and ARGVs to k -mers, respectively; (iv) a statistical filter on sequence classification to reduce type I and II errors. On semi-synthetic data, KARGVA provides very high accuracy even in presence of high sequencing errors or mutations (99.2% and 86.6% accuracy within 1% and 5% base change rates, respectively), and genome rearrangements (98.2% accuracy), with robust performance on ad hoc false positive sets. On data from the worldwide MetaSUB consortium, comprising 3,700+ metagenomics experiments, KARGVA identifies more ARGVs than Resistance Gene Identifier (4.8x) and PointFinder (6.8x), yet all predictions are below the expected false positive estimates. The prevalence of ARGVs is correlated to ARGs but ecological characteristics do not explain well ARGV variance. KARGVA is publicly available at https://github.com/DataIntellSystLab/KARGVA under MIT license.
1
Citation1
0
Save
3

Brain tissue transcriptomic analysis of SIV-infected macaques identifies several altered metabolic pathways linked to neuropathogenesis, and Poly (ADP-ribose) polymerases (PARPs) as potential therapeutic targets

Carla Mavian et al.May 24, 2020
Abstract Background Despite improvements in antiretroviral therapy, human immunodeficiency virus type 1 (HIV-1)-associated neurocognitive disorders (HAND) remain prevalent in subjects undergoing therapy. HAND significantly affects individuals’ quality of life, as well as adherence to therapy, and, despite the increasing understanding of neuropathogenesis, no definitive diagnostic or prognostic marker has been identified. Results We investigated transcriptomic profiles in frontal cortex tissues of Simian immunodeficiency virus (SIV)-infected Rhesus macaques sacrificed at different stages of infection. Gene expression was compared among SIV-infected animals (n=11), with or without CD8+ lymphocyte depletion, based on detectable (n=6) or non-detectable (n=5) presence of the virus in frontal cortex tissues. Significant enrichment in activation of monocyte and macrophage cellular pathways was found in animals with detectable brain infection, independently from CD8+ lymphocyte depletion. In addition, transcripts of four poly (ADP-ribose) polymerases (PARPs) were up-regulated in the frontal cortex, which was confirmed by real-time polymerase chain reaction. Conclusions Our results shed light on involvement of PARPs in SIV infection of the brain and their role in SIV-associated neurodegenerative processes. Inhibition of PARPs may provide an effective novel therapeutic target for HIV-related neuropathology.
1

Finding Overlapping Rmaps via Gaussian Mixture Model Clustering

Kingshuk Mukherjee et al.Jul 18, 2021
ABSTRACT Optical mapping is a method for creating high resolution restriction maps of an entire genome. Optical mapping has been largely automated, and first produces single molecule restriction maps, called Rmaps, which are assembled to generate genome wide optical maps. Since the location and orientation of each Rmap is unknown, the first problem in the analysis of this data is finding related Rmaps, i.e., pairs of Rmaps that share the same orientation and have significant overlap in their genomic location. Although heuristics for identifying related Rmaps exist, they all require quantization of the data which leads to a loss in the precision. In this paper, we propose a Gaussian mixture modelling clustering based method, which we refer to as OM clust , that finds overlapping Rmaps without quantization. Using both simulated and real datasets, we show that OM clust substantially improves the precision (from 48.3% to 73.3%) over the state-of-the art methods while also reducing CPU time and memory consumption. Further, we integrated OM clust into the error correction methods (Elmeri and c OM et ) to demonstrate the increase in the performance of these methods. When OM clust was combined with c OM et to error correct Rmap data generated from human DNA, it was able to error correct close to 3x more Rmaps, and reduced the CPU time by more than 35x. Our software is written in C++ and is publicly available under GNU General Public License at https://github.com/kingufl/OMclust
1

Towards routine employment of computational tools for antimicrobial resistance determination via high-throughput sequencing

Simone Marini et al.Nov 3, 2021
Abstract Antimicrobial resistance (AMR) is a growing threat to public health and farming at large. In clinical and veterinary practice, timely characterization of the antibiotic susceptibility profile of bacterial infections is a crucial step in optimizing treatment. High-throughput sequencing is a promising option for clinical point-of-care and ecological surveillance, opening the opportunity to develop genotyping-based AMR determination as a possibly faster alternative to phenotypic testing. In the present work, we compare the performance of state-of-the-art methods for detection of AMR using high-throughput sequencing data from clinical settings. We consider five computational approaches based on alignment (AMRPlusPlus), deep learning (DeepARG), k -mer genomic signatures (KARGA, ResFinder) or hidden Markov models (Meta-MARC). We use an extensive collection of 585 isolates with available AMR resistance profiles determined by phenotypic tests across nine antibiotic classes. We show how the prediction landscape of AMR classifiers is highly heterogeneous, with balanced accuracy varying from 0.40 to 0.92. Although some algorithms—ResFinder, KARGA, and AMRPlusPlus– exhibit overall better balanced accuracy than others, the high per-AMR-class variance and related findings suggest that: (1) all algorithms might be subject to sampling bias present both in data repositories used for training and experimental/clinical settings; and (2) a portion of clinical samples might contain uncharacterized AMR genes that the algorithms—mostly trained on known AMR genes—fail to generalize upon. These results lead us to formulate practical advice for software configuration and application, and give suggestions for future study designs to further develop AMR prediction tools from proof-of-concept to bedside.
Load More