CL
Congyu Lu
Author with expertise in Viral RNA Silencing and Plant Immunity
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
5
(60% Open Access)
Cited by:
5
h-index:
7
/
i10-index:
6
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
7

Prokaryotic virus Host Predictor: a Gaussian model for host prediction of prokaryotic viruses in metagenomics

Congyu Lu et al.Dec 3, 2020
Abstract Background Viruses are ubiquitous biological entities, estimated to be the largest reservoirs of unexplored genetic diversity on Earth. Full functional characterization and annotation of newly-discovered viruses requires tools to enable taxonomic assignment, the range of hosts, and biological properties of the virus. Here we focus on prokaryotic viruses, which include phages and archaeal viruses, and for which identifying the viral host is an essential step in characterizing the virus, as the virus relies on the host for survival. Currently, the method for determining the viral host is either to culture the virus, which is low-throughput, time-consuming, and expensive, or to computationally predict the viral hosts, which needs improvements at both accuracy and usability. Here we develop a Gaussian model to predict hosts for prokaryotic viruses with better performances than previous computational methods. Results We present here Prokaryotic virus Host Predictor (PHP), a software tool using a Gaussian model, to predict hosts for prokaryotic viruses using the differences of Æ -mer frequencies between viral and host genomic sequences as features. PHP gave a host prediction accuracy of 34% (genus level) on the VirHostMatcher benchmark dataset and a host prediction accuracy of 35% (genus level) on a new dataset containing 671 viruses and 60,105 prokaryotic genomes. The prediction accuracy exceeded that of two alignment-free methods (VirHostMatcher and WIsH, 28%-34%, genus level). PHP also outperformed these two alignment-free methods much (24%-38% vs 18%-20%, genus level) when predicting hosts for prokaryotic viruses which cannot be predicted by the BLAST-based or the CRISPR-spacer-based methods alone. Requiring a minimal score for making predictions (thresholding) and taking the consensus of the top 30 predictions further improved the host prediction accuracy of PHP. Conclusions The Prokaryotic virus Host Predictor software tool provides an intuitive and user-friendly API for the Gaussian model described herein. This work will facilitate the rapid identification of hosts for newly-identified prokaryotic viruses in metagenomic studies. Author Summary Prokaryotic viruses which include phages and archaeal viruses play an important role in balancing the global ecosystem by regulating the composition of bacteria and archaea in water and soil. Identifying the viral host is essential for characterizing the virus, as the virus relies on the host for survival. Currently, the method for determining the viral host is either to culture the virus which is low-throughput, time-consuming, and expensive, or to computationally predict the viral hosts which needs improvements at both accuracy and usability. This study developed a Gaussian model to predict hosts for prokaryotic viruses with better performances than previous computational methods. It will contribute to the rapid identification of hosts for prokaryotic viruses in metagenomic studies, and will extend our knowledge of virus-host interactions.
7
Citation3
0
Save
0

Homologous Recombination as an Evolutionary Force in African Swine Fever Viruses

Zhaozhong Zhu et al.Nov 4, 2018
Abstract Recent outbreaks of African swine fever virus (ASFV) in China severely influenced the swine industry of the country. Currently, there is no effective vaccine or drugs against ASFVs. How to effectively control the virus is challenging. In this study, we have analyzed all the publicly available ASFV genomes and demonstrated that there was a large genetic diversity of ASFV genomes. Interestingly, the genetic diversity was mainly caused by extensive genomic insertions and/or deletions (indels) instead of the point mutations. The genomic diversity of the virus resulted in proteome diversity. Over 250 types of proteins were inferred from the ASFV genomes, among which only 144 were observed in all analyzed viruses. Further analyses showed that the homologous recombination may contribute much to the indels, as supported by significant associations between the occurrence of extensive recombination events and the indels in the ASFV genomes. Repeated elements of dozens of nucleotides in length were observed to widely distribute and cluster in the adjacent positions of ASFV genomes, which may facilitate the occurrence of homologous recombination. Moreover, two enzymes, which were possibly related to the homologous recombination, i.e., a Lambda-like exonuclease with a YqaJ-like viral recombinase domain, and a DNA topoisomerase II, were found to be conservative in all the analyzed ASFVs. This work highlighted the importance of the homologous recombination in the evolution of the ASFVs, and helped with the strategy development of the prevention and control of the virus.
0
Citation1
0
Save
12

Exploring the genome and protein space of viruses

Congyu Lu et al.Nov 5, 2022
Abstract Recent metagenomic studies have identified a vast number of viruses. However, the systematic assessment of the true genetic diversity of the whole virus community on our planet remains to be investigated. Here, we explored the genome and protein space of viruses by simulating the process of virus discovery in viral metagenomic studies. Among multiple functions, the power function was found to best fit the increasing trends of virus diversity and was therefore used to predict the genetic space of viruses. The estimate suggests that there are at least 8.23e+08 viral Operational Taxonomic Units (vOTUs) and 1.62e+09 viral protein clusters on Earth when assuming the saturation of the virus genetic space, taking into account the balance of costs and the identification of novel viruses. It’s noteworthy that less than 3% of the viral genetic diversity has been uncovered thus far, emphasizing the vastness of the unexplored viral landscape. To saturate the genetic space, a total of 3.08e+08 samples would be required. Analysis of viral genetic diversity by ecosystem yielded estimates consistent with those mentioned above. Furthermore, the estimate of the virus genetic space remained robust when accounting for the redundancy of sampling, sampling time, sequencing platform, and parameters used for protein clustering. This study provides a guide for future sequencing efforts in virus discovery and contributes to a better understanding of viral diversity in nature.
12
Citation1
0
Save
0

Prediction of antiviral drugs against African Swine Fever Viruses based on protein-protein interaction analysis

Zhaozhong Zhu et al.Apr 5, 2019
The African swine fever virus (ASFV) has severely influenced the swine industry of the world. Unfortunately, there is no effective antiviral drug or vaccine against the virus until now. Identification of new anti-ASFV drugs is urgently needed. Here, an up-to-date set of protein-protein interactions (PPIs) between ASFV and swine were curated by integration of PPIs from multiple sources. Thirty-two swine proteins were observed to interact with ASFVs and were defined as AIPs. They were found to play a central role in the swine PPI network, with significant larger degree, betweenness and smaller shortest path length than other swine proteins. Some of AIPs also interacted with several other viruses and could be taken as potential targets of drugs for broad-spectrum effect, such as HSP90AB1. Finally, the antiviral drugs which targeted AIPs and ASFV proteins were predicted. Several drugs with either broad-spectrum effect or high specificity on AIPs were identified, such as Polaprezinc. This work could not only deepen our understanding towards the ASFV-swine interactions, but also help for the development of effective antiviral drugs against the ASFVs.