AL
Aimin Li
Author with expertise in Role of Long Noncoding RNAs in Cancer and Development
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
8
(75% Open Access)
Cited by:
665
h-index:
33
/
i10-index:
83
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

PLEK: a tool for predicting long non-coding RNAs and messenger RNAs based on an improved k-mer scheme

Aimin Li et al.Sep 19, 2014
High-throughput transcriptome sequencing (RNA-seq) technology promises to discover novel protein-coding and non-coding transcripts, particularly the identification of long non-coding RNAs (lncRNAs) from de novo sequencing data. This requires tools that are not restricted by prior gene annotations, genomic sequences and high-quality sequencing. We present an alignment-free tool called PLEK (predictor of long non-coding RNAs and messenger RNAs based on an improved k-mer scheme), which uses a computational pipeline based on an improved k-mer scheme and a support vector machine (SVM) algorithm to distinguish lncRNAs from messenger RNAs (mRNAs), in the absence of genomic sequences or annotations. The performance of PLEK was evaluated on well-annotated mRNA and lncRNA transcripts. 10-fold cross-validation tests on human RefSeq mRNAs and GENCODE lncRNAs indicated that our tool could achieve accuracy of up to 95.6%. We demonstrated the utility of PLEK on transcripts from other vertebrates using the model built from human datasets. PLEK attained >90% accuracy on most of these datasets. PLEK also performed well using a simulated dataset and two real de novo assembled transcriptome datasets (sequenced by PacBio and 454 platforms) with relatively high indel sequencing errors. In addition, PLEK is approximately eightfold faster than a newly developed alignment-free tool, named Coding-Non-Coding Index (CNCI), and 244 times faster than the most popular alignment-based tool, Coding Potential Calculator (CPC), in a single-threading running manner. PLEK is an efficient alignment-free computational tool to distinguish lncRNAs from mRNAs in RNA-seq transcriptomes of species lacking reference genomes. PLEK is especially suitable for PacBio or 454 sequencing data and large-scale transcriptome data. Its open-source software can be freely downloaded from https://sourceforge.net/projects/plek/files/ .
0
Citation647
0
Save
6

The K18-hACE2 Transgenic Mouse Model Recapitulates Non-Severe and Severe COVID-19 in Response to Infectious Dose of SARS-CoV-2 Virus

Wenjuan Dong et al.May 9, 2021
Abstract A comprehensive analysis and characterization of a SARS-CoV-2 infection model that mimics non-severe and severe COVID-19 in humans is warranted for understating the virus and developing preventive and therapeutic agents. Here, we characterized the K18-hACE2 mouse model expressing human (h)ACE2 in mice, controlled by the human keratin 18 (K18) promoter, in epithelia, including airway epithelial cells where SARS-CoV-2 infections typically start. We found that intranasal inoculation with higher viral doses (2×10 3 and 2×10 4 PFU) of SARS-CoV-2 caused lethality of all mice and severe damage of various organs, including lungs, liver, and kidney, while lower doses (2×10 1 and 2×10 2 PFU) led to less severe tissue damage and some mice recovered from the infection. In this humanized hACE2 mouse model, SARS-CoV-2 infection damaged multiple tissues, with a dose-dependent effect in most tissues. Similar damage was observed in biopsy samples from COVID-19 patients. Finally, the mice that recovered after infection with a low dose of virus also survived rechallenge with a high dose of virus. Compared to other existing models, the K18-hACE2 model seems to be the most sensitive COVID-19 model reported to date. Our work expands the information available about this model to include analysis of multiple infectious doses and various tissues with comparison to human biopsy samples from COVID-19 patients. In conclusion, the K18-hACE2 mouse model recapitulates both severe and non-severe COVID-19 in humans and can provide insight into disease progression and the efficacy of therapeutics for preventing or treating COVID-19. Importance The pandemic of COVID-19 has reached 112,589,814 cases and caused 2,493,795 deaths worldwide as of February 23, 2021, has raised an urgent need for development of novel drugs and therapeutics to prevent the spread and pathogenesis of SARS-CoV-2. To achieve this goal, an animal model that recapitulates the features of human COVID-19 disease progress and pathogenesis is greatly needed. In this study, we have comprehensively characterized a mouse model of SARS-CoV-2 infection using K18-hACE2 transgenic mice. We infected the mice with low and high doses of SARS-CoV-2 virus to study the pathogenesis and survival in response to different infection patterns. Moreover, we compared the pathogenesis of the K18-hACE2 transgenic mice with that of the COVID-19 patients to show that this model could be a useful tool for the development of anti-viral drugs and therapeutics.
6
Citation11
0
Save
11

Worldwide tracing of mutations and the evolutionary dynamics of SARS-CoV-2

Zhongyin Zhou et al.Aug 10, 2020
Abstract Understanding the mutational and evolutionary dynamics of SARS-CoV-2 is essential for treating COVID-19 and the development of a vaccine. Here, we analyzed publicly available 15,818 assembled SARS-CoV-2 genome sequences, along with 2,350 raw sequence datasets sampled worldwide. We investigated the distribution of inter-host single nucleotide polymorphisms (inter-host SNPs) and intra-host single nucleotide variations (iSNVs). Mutations have been observed at 35.6% (10,649/29,903) of the bases in the genome. The substitution rate in some protein coding regions is higher than the average in SARS-CoV-2 viruses, and the high substitution rate in some regions might be driven to escape immune recognition by diversifying selection. Both recurrent mutations and human-to-human transmission are mechanisms that generate fitness advantageous mutations. Furthermore, the frequency of three mutations (S protein, F400L; ORF3a protein, T164I; and ORF1a protein, Q6383H) has gradual increased over time on lineages, which provides new clues for the early detection of fitness advantageous mutations. Our study provides theoretical support for vaccine development and the optimization of treatment for COVID-19. We call researchers to submit raw sequence data to public databases.
11
Citation5
0
Save
24

FXa cleaves the SARS-CoV-2 spike protein and blocks cell entry to protect against infection with inferior effects in B.1.1.7 variant

Wenjuan Dong et al.Jun 8, 2021
The ongoing coronavirus disease 2019 (COVID-19) pandemic is caused by infection with severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2). Human natural defense mechanisms against SARS-CoV-2 are largely unknown. Serine proteases (SPs) including furin and TMPRSS2 cleave SARS-CoV-2 spike protein, facilitating viral entry. Here, we show that FXa, a SP for blood coagulation, is upregulated in COVID-19 patients compared to non-COVID-19 donors and exerts anti-viral activity. Mechanistically, FXa cleaves the SARS-CoV-2 spike protein, which prevents its binding to ACE2, and thus blocks viral entry. Furthermore, the variant B.1.1.7 with several mutations is dramatically resistant to the anti-viral effect of FXa compared to wild-type SARA-CoV-2 in vivo and in vitro. The anti-coagulant rivaroxaban directly inhibits FXa and facilitates viral entry, whereas the indirect inhibitor fondaparinux does not. In a lethal humanized hACE2 mouse model of SARS-CoV-2, FXa prolonged survival while combination with rivaroxaban but not fondaparinux abrogated this protection. These preclinical results identify a previously unknown SP function and associated anti-viral host defense mechanism and suggest caution in considering direct inhibitors for prevention or treatment of thrombotic complications in COVID-19 patients.
24
Citation2
0
Save
0

PLEKv2: predicting lncRNAs and mRNAs based on intrinsic sequence features and the coding-net model

Aimin Li et al.Aug 2, 2024
Long non-coding RNAs (lncRNAs) are RNA transcripts of more than 200 nucleotides that do not encode canonical proteins. Their biological structure is similar to messenger RNAs (mRNAs). To distinguish between lncRNA and mRNA transcripts quickly and accurately, we upgraded the PLEK alignment-free tool to its next version, PLEKv2, and constructed models tailored for both animals and plants. PLEKv2 can achieve 98.7% prediction accuracy for human datasets. Compared with classical tools and deep learning-based models, this is 8.1%, 3.7%, 16.6%, 1.4%, 4.9%, and 48.9% higher than CPC2, CNCI, Wen et al.'s CNN, LncADeep, PLEK, and NcResNet, respectively. The accuracy of PLEKv2 was > 90% for cross-species prediction. PLEKv2 is more effective and robust than CPC2, CNCI, LncADeep, PLEK, and NcResNet for primate datasets (including chimpanzees, macaques, and gorillas). Moreover, PLEKv2 is not only suitable for non-human primates that are closely related to humans, but can also predict the coding ability of RNA sequences in plants such as Arabidopsis. The experimental results illustrate that the model constructed by PLEKv2 can distinguish lncRNAs and mRNAs better than PLEK. The PLEKv2 software is freely available at https://sourceforge.net/projects/plek2/ .
3

CPPVec: an accurate coding potential predictor based on a distributed representation of protein sequence

Chao Wei et al.Jun 1, 2022
ABSTRACT Long non-coding RNAs (lncRNAs) play a crucial role in numbers of biological processes and have received wide attention during the past years. Meanwhile, the rapid development of high-throughput transcriptome sequencing technologies (RNA-seq) lead to a large amount of RNA data, it is urgent to develop a fast and accurate coding potential predictor. Many computational methods have been proposed to alleviate this issue, they usually exploit information on open reading frame (ORF), k-mer, evolutionary signatures, or known protein databases. Despite the effectiveness, these methods still have much room to improve. Indeed, none of these methods exploit the context information of sequence, simple measures that are calculated with the continuous nucleotides are not enough to reflect global sequence order information. In view of this shortcoming, here, we present a novel alignment-free method, CPPVec, which exploits the global sequence order information of transcript for coding potential prediction for the first time, it can be easily implemented by distributed representation (e.g., doc2vec) of protein sequence translated from the longest ORF. Tests on human, mouse, zebrafish, fruit fly and Saccharomyces cerevisiae datasets demonstrate that CPPVec is an accurate coding potential predictor and significantly outperforms existing state-of-the-art methods.