CW
Chengsong Wan
Author with expertise in Analysis of Gene Interaction Networks
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
12
(67% Open Access)
Cited by:
411
h-index:
14
/
i10-index:
18
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

The CAFA challenge reports improved protein function prediction and new functional annotations for hundreds of genes through experimental screens

Naihui Zhou et al.Nov 19, 2019
Abstract Background The Critical Assessment of Functional Annotation (CAFA) is an ongoing, global, community-driven effort to evaluate and improve the computational annotation of protein function. Results Here, we report on the results of the third CAFA challenge, CAFA3, that featured an expanded analysis over the previous CAFA rounds, both in terms of volume of data analyzed and the types of analysis performed. In a novel and major new development, computational predictions and assessment goals drove some of the experimental assays, resulting in new functional annotations for more than 1000 genes. Specifically, we performed experimental whole-genome mutation screening in Candida albicans and Pseudomonas aureginosa genomes, which provided us with genome-wide experimental data for genes associated with biofilm formation and motility. We further performed targeted assays on selected genes in Drosophila melanogaster , which we suspected of being involved in long-term memory. Conclusion We conclude that while predictions of the molecular function and biological process annotations have slightly improved over time, those of the cellular component have not. Term-centric prediction of experimental annotations remains equally challenging; although the performance of the top methods is significantly better than the expectations set by baseline methods in C. albicans and D. melanogaster , it leaves considerable room and need for improvement. Finally, we report that the CAFA community now involves a broad range of participants with expertise in bioinformatics, biological experimentation, biocuration, and bio-ontologies, working together to improve functional annotation, computational function prediction, and our ability to manage big data in the era of large experimental screens.
1
Citation346
0
Save
35

Recurrent chromosome reshuffling and the evolution of neo-sex chromosomes in parrots

Zhen Huang et al.Mar 9, 2021
Abstract The karyotype of most birds has remained considerably stable during more than 100 million years’ evolution, except for some groups, such as parrots. The evolutionary processes and underlying genetic mechanism of chromosomal rearrangements in parrots, however, are poorly understood. Here, using chromosome-level assemblies of three parrot genomes (monk parakeet, blue-fronted amazon, budgerigar), we uncovered frequent chromosome fusions and fissions among parrots, with most of them being lineage-specific. In particular, at least 12 chromosomes recurrently experienced inter-chromosomal fusions in different parrot lineages. Two conserved vertebrate genes, ALC1 and PARP3, with known functions in the repair of double-strand breaks and maintenance of genome stability, were specifically lost in parrots. The loss of ALC1 was associated with multiple deletions and an accumulation of CR1-psi, a novel subfamily of transposable elements (TEs) that recently amplified in parrots, while the loss of PARP3 was associated with an inversion. Additionally, the fusion of the ZW sex chromosomes and chromosome 11 has created a pair of neo-sex chromosomes in the ancestor of parrots, and the chromosome 25 has been further added to the sex chromosomes in monk parakeet. The newly formed neo-sex chromosomes were validated by our chromosomal painting, genomic and phylogenetic analyses. Transcriptome profiling for multiple tissues of males and females did not reveal signals of female-specific selection driving the formation of neo-sex chromosomes. Finally, we identified one W-specific satellite repeat that contributed to the unusual enlargement of the W chromosome in monk parakeet. Together, the combination of our genomic and cytogenetic analyses highlight the role of TEs and genetic drift in promoting chromosome rearrangements, gene loss and the evolution of neo-sex chromosome in parrots.
35
Citation7
0
Save
1

Gene mutations and molecular evolution of the chikungunya virus E1 and E2 from 2014 to 2019

Xiaoxia Li et al.Mar 18, 2022
ABSTRACT Chikungunya virus (CHIKV), a mosquito-borne Alphavirus , is the etiological agent of chikungunya fever. To investigate the prevalence and genetic characteristics of CHIKV in China, we performed a molecular epidemiological study during the 2014–2019 period. Phylogenetic analysis of CHIKV in the 2014-2019 shows that it is currently clustered geographically, which means that CHIKV’s local adaptability is gradually strengthening. Focusing on CHIKV adaptive mutation E1-A226V is not obvious in our study. The CHIKV E1 amino acid non-synonymous mutation results revealed the common mutation site M343I. Most mutation sites belong to the American epidemic strains, and the mutation rate is 2.8%. In 31 sequences, 19 non-synonymous mutations were found in CHIKV E1 (total mutation rate 20/499 = 4%), and 37 non-synonymous mutations in CHIKV E2 (total mutation rate 30/425 = 7%). It is worth noting that the mutation of CHIKV E2 has changed more than that of CHIKV E1 between 2014 and 2019. CHIKV E2 screened out common mutation sites, and the results showed that there are five common mutation sites, namely S119G, L182M, G206D, S300N, and A345T. Eighty-three percent of the CHIKV E2 receptor binding domain mutations in the American strains, namely T3I and N6H, may cause immune escape. We constructed a new luciferase immunosorbent assay using CHIKV E2 antigen and mutant E2 antigen to test the serum of the CHIKV infected patients, and the detected samples and dilution ratios were different. The T3I, N6H, S119G, L182M, G206D, S300N, and A345T mutations in CHIKV E2 could explain these differences between patients. IMPORTANCE CHIKV originated in Africa more than 500 years ago, with a common lineage dividing into two distinct branches called West Africa (West African, WA) and East/Central/South Africa (East/Central/South African, ECSA). Moreover, the E1-A226V mutation enhanced the replication and transmission capacity of CHIKV in Aedes albopictus . However, it should be noted that E1-A226V does not explain the CHIKV epidemic that has occurred in the Americas in recent years. We analyzed CHIKV samples in the 2014-2019, and the results showed that the mutation of CHIKV E1 protein occurred was not mainly concentrated in E1-A226V, but concentrated in M343I. This also means that CHIKV constantly mutates in the natural environment and is formed under natural conditions. Analysis of the common mutation sites of CHIKV E2 showed that there were seven common mutation sites S119G/L182M/ G206D /S300N/A345T, and the new mutation of CHIKV E2 may affect serological antibody detection.
0

The CAFA challenge reports improved protein function prediction and new functional annotations for hundreds of genes through experimental screens

Naihui Zhou et al.May 29, 2019
The Critical Assessment of Functional Annotation (CAFA) is an ongoing, global, community-driven effort to evaluate and improve the computational annotation of protein function. Here we report on the results of the third CAFA challenge, CAFA3, that featured an expanded analysis over the previous CAFA rounds, both in terms of volume of data analyzed and the types of analysis performed. In a novel and major new development, computational predictions and assessment goals drove some of the experimental assays, resulting in new functional annotations for more than 1000 genes. Specifically, we performed experimental whole-genome mutation screening in Candida albicans and Pseudomonas aureginosa genomes, which provided us with genome-wide experimental data for genes associated with biofilm formation and motility P. aureginosa only). We further performed targeted assays on selected genes in Drosophila melanogaster, which we suspected of being involved in long-term memory. We conclude that, while predictions of the molecular function and biological process annotations have slightly improved over time, those of the cellular component have not. Term-centric prediction of experimental annotations remains equally challenging; although the performance of the top methods is significantly better than expectations set by baseline methods in C. albicans and D. melanogaster, it leaves considerable room and need for improvement. We finally report that the CAFA community now involves a broad range of participants with expertise in bioinformatics, biological experimentation, biocuration, and bio-ontologies, working together to improve functional annotation, computational function
0

Predicting Human Protein Function with Multi-task Deep Neural Networks

Rui Fa et al.Jan 30, 2018
Machine learning methods for protein function prediction are urgently needed, especially now that a substantial fraction of known sequences remains unannotated despite the extensive use of functional assignments based on sequence similarity. One major bottleneck supervised learning faces in protein function prediction is the structured, multi-label nature of the problem, because biological roles are represented by lists of terms from hierarchically organised controlled vocabularies such as the Gene Ontology. In this work, we build on recent developments in the area of deep learning and investigate the usefulness of multi-task deep neural networks (MTDNN), which consist of upstream shared layers upon which are stacked in parallel as many independent modules (additional hidden layers with their own output units) as the number of output GO terms (the tasks). MTDNN learns individual tasks partially using shared representations and partially from task-specific characteristics. When no close homologues with experimentally validated functions can be identified, MTDNN gives more accurate predictions than baseline methods based on annotation frequencies in public databases or homology transfers. More importantly, the results show that MTDNN binary classification accuracy is higher than alternative machine learning-based methods that do not exploit commonalities and differences among prediction tasks. Interestingly, compared with a single-task predictor, the performance improvement is not linearly correlated with the number of tasks in MTDNN, but medium size models provide more improvement in our case. One of advantages of MTDNN is that given a set of features, there is no requirement for MTDNN to have a bootstrap feature selection procedure as what traditional machine learning algorithms do. Overall, the results indicate that the proposed MTDNN algorithm improves the performance of protein function prediction. On the other hand, there is still large room for deep learning techniques to further enhance prediction ability.
Load More