RC
Rita Casadio
Author with expertise in Prediction of Protein Subcellular Localization
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
29
(86% Open Access)
Cited by:
8,970
h-index:
65
/
i10-index:
210
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

I-Mutant2.0: predicting stability changes upon mutation from the protein sequence or structure

Emidio Capriotti et al.Jun 26, 2005
I-Mutant2.0 is a support vector machine (SVM)-based tool for the automatic prediction of protein stability changes upon single point mutations. I-Mutant2.0 predictions are performed starting either from the protein structure or, more importantly, from the protein sequence. This latter task, to the best of our knowledge, is exploited for the first time. The method was trained and tested on a data set derived from ProTherm, which is presently the most comprehensive available database of thermodynamic experimental data of free energy changes of protein stability upon mutation under different conditions. I-Mutant2.0 can be used both as a classifier for predicting the sign of the protein stability change upon mutation and as a regression estimator for predicting the related DeltaDeltaG values. Acting as a classifier, I-Mutant2.0 correctly predicts (with a cross-validation procedure) 80% or 77% of the data set, depending on the usage of structural or sequence information, respectively. When predicting DeltaDeltaG values associated with mutations, the correlation of predicted with expected/experimental values is 0.71 (with a standard error of 1.30 kcal/mol) and 0.62 (with a standard error of 1.45 kcal/mol) when structural or sequence information are respectively adopted. Our web interface allows the selection of a predictive mode that depends on the availability of the protein structure and/or sequence. In this latter case, the web server requires only pasting of a protein sequence in a raw format. We therefore introduce I-Mutant2.0 as a unique and valuable helper for protein design, even when the protein structure is not yet known with atomic resolution.http://gpcr.biocomp.unibo.it/cgi/predictors/I-Mutant2.0/I-Mutant2.0.cgi.
0
Citation1,753
0
Save
0

Predicting the insurgence of human genetic diseases associated to single point protein mutations with support vector machines and evolutionary information

Emidio Capriotti et al.Aug 7, 2006
Abstract Motivation: Human single nucleotide polymorphisms (SNPs) are the most frequent type of genetic variation in human population. One of the most important goals of SNP projects is to understand which human genotype variations are related to Mendelian and complex diseases. Great interest is focused on non-synonymous coding SNPs (nsSNPs) that are responsible of protein single point mutation. nsSNPs can be neutral or disease associated. It is known that the mutation of only one residue in a protein sequence can be related to a number of pathological conditions of dramatic social impact such as Altzheimer's, Parkinson's and Creutzfeldt-Jakob's diseases. The quality and completeness of presently available SNPs databases allows the application of machine learning techniques to predict the insurgence of human diseases due to single point protein mutation starting from the protein sequence. Results: In this paper, we develop a method based on support vector machines (SVMs) that starting from the protein sequence information can predict whether a new phenotype derived from a nsSNP can be related to a genetic disease in humans. Using a dataset of 21 185 single point mutations, 61% of which are disease-related, out of 3587 proteins, we show that our predictor can reach more than 74% accuracy in the specific task of predicting whether a single point mutation can be disease related or not. Our method, although based on less information, outperforms other web-available predictors implementing different approaches. Availability: A beta version of the web tool is available at Contact: casadio@alma.unibo.it
0
Citation833
0
Save
0

Transmembrane helices predicted at 95% accuracy

Burkhard Rost et al.Mar 1, 1995
Abstract We describe a neural network system that predicts the locations of transmembrane helices in integral membrane proteins. By using evolutionary information as input to the network system, the method significantly improved on a previously published neural network prediction method that had been based on single sequence information. The input data were derived from multiple alignments for each position in a window of 13 adjacent residues: amino acid frequency, conservation weights, number of insertions and deletions, and position of the window with respect to the ends of the protein chain. Additional input was the amino acid composition and length of the whole protein. A rigorous cross‐validation test on 69 proteins with experimentally determined locations of transmembrane segments yielded an overall two‐state per‐residue accuracy of 95%. About 94% of all segments were predicted correctly. When applied to known globular proteins as a negative control, the network system incorrectly predicted fewer than 5% of globular proteins as having transmembrane helices. The method was applied to all 269 open reading frames from the complete yeast VIII chromosome. For 59 of these, at least two transmembrane helices were predicted. Thus, the prediction is that about one‐fourth of all proteins from yeast VIII contain one transmembrane helix, and some 20%, more than one.
0
Paper
Citation666
0
Save
0

Functional annotations improve the predictive score of human disease-related mutations in proteins

Remo Calabrese et al.May 12, 2009
Human MutationVolume 30, Issue 8 p. 1237-1244 MethodFree Access Functional annotations improve the predictive score of human disease-related mutations in proteins Remo Calabrese, Remo Calabrese Laboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, Bologna, ItalySearch for more papers by this authorEmidio Capriotti, Emidio Capriotti Laboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, Bologna, ItalySearch for more papers by this authorPiero Fariselli, Piero Fariselli Laboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, Bologna, ItalySearch for more papers by this authorPier Luigi Martelli, Pier Luigi Martelli Laboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, Bologna, ItalySearch for more papers by this authorRita Casadio, Corresponding Author Rita Casadio casadio@biocomp.unibo.it Laboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, Bologna, ItalyLaboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, via Irnerio 42, 40126 Bologna, ItalySearch for more papers by this author Remo Calabrese, Remo Calabrese Laboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, Bologna, ItalySearch for more papers by this authorEmidio Capriotti, Emidio Capriotti Laboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, Bologna, ItalySearch for more papers by this authorPiero Fariselli, Piero Fariselli Laboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, Bologna, ItalySearch for more papers by this authorPier Luigi Martelli, Pier Luigi Martelli Laboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, Bologna, ItalySearch for more papers by this authorRita Casadio, Corresponding Author Rita Casadio casadio@biocomp.unibo.it Laboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, Bologna, ItalyLaboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, via Irnerio 42, 40126 Bologna, ItalySearch for more papers by this author First published: 12 May 2009 https://doi.org/10.1002/humu.21047Citations: 406AboutPDF ToolsRequest permissionExport citationAdd to favoritesTrack citation ShareShare Give accessShare full text accessShare full-text accessPlease review our Terms and Conditions of Use and check box below to share full-text version of article.I have read and accept the Wiley Online Library Terms and Conditions of UseShareable LinkUse the link below to share a full-text version of this article with your friends and colleagues. Learn more.Copy URL Share a linkShare onFacebookTwitterLinked InRedditWechat Abstract Single nucleotide polymorphisms (SNPs) are the simplest and most frequent form of human DNA variation, also valuable as genetic markers of disease susceptibility. The most investigated SNPs are missense mutations resulting in residue substitutions in the protein. Here we propose SNPs&GO, an accurate method that, starting from a protein sequence, can predict whether a mutation is disease related or not by exploiting the protein functional annotation. The scoring efficiency of SNPs&GO is as high as 82%, with a Matthews correlation coefficient equal to 0.63 over a wide set of annotated nonsynonymous mutations in proteins, including 16,330 disease-related and 17,432 neutral polymorphisms. SNPs&GO collects in unique framework information derived from protein sequence, evolutionary information, and function as encoded in the Gene Ontology terms, and outperforms other available predictive methods. Hum Mutat 30:1–8, 2009. © 2009 Wiley-Liss, Inc. Citing Literature Volume30, Issue8August 2009Pages 1237-1244 ReferencesRelatedInformation
0
Citation619
0
Save
0

Topology prediction for helical transmembrane proteins at 86% accuracy–Topology prediction at 86% accuracy

Burkhard Rost et al.Aug 1, 1996
Abstract Previously, we introduced a neural network system predicting locations of transmembrane helices (HTMs) based on evolutionary profiles (PHDhtm, Rost B, Casadio R, Fariselli P, Sander C, 1995, Protein Sci 4 :521–533). Here, we describe an improvement and an extension of that system. The improvement is achieved by a dynamic programming‐like algorithm that optimizes helices compatible with the neural network output. The extension is the prediction of topology (orientation of first loop region with respect to membrane) by applying to the refined prediction the observation that positively charged residues are more abundant in extra‐cytoplasmic regions. Furthermore, we introduce a method to reduce the number of false positives, i.e., proteins falsely predicted with membrane helices. The evaluation of prediction accuracy is based on a cross‐validation and a double‐blind test set (in total 131 proteins). The final method appears to be more accurate than other methods published: (1) For almost 89% (π3%) of the test proteins, all HTMs are predicted correctly. (2) For more than 86% (π3%) of the proteins, topology is predicted correctly. (3) We define reliability indices that correlate with prediction accuracy: for one half of the proteins, segment accuracy raises to 98%; and for two‐thirds, accuracy of topology prediction is 95%. (4) The rate of proteins for which HTMs are predicted falsely is below 2% (π1%). Finally, the method is applied to 1,616 sequences of Haemophilus influenzae . We predict 19% of the genome sequences to contain one or more HTMs. This appears to be lower than what we predicted previously for the yeast VIII chromosome (about 25%).
0

PredGPI: a GPI-anchor predictor

Andrea Pierleoni et al.Sep 23, 2008
Abstract Background Several eukaryotic proteins associated to the extracellular leaflet of the plasma membrane carry a Glycosylphosphatidylinositol (GPI) anchor, which is linked to the C-terminal residue after a proteolytic cleavage occurring at the so called ω-site. Computational methods were developed to discriminate proteins that undergo this post-translational modification starting from their aminoacidic sequences. However more accurate methods are needed for a reliable annotation of whole proteomes. Results Here we present PredGPI, a prediction method that, by coupling a Hidden Markov Model (HMM) and a Support Vector Machine (SVM), is able to efficiently predict both the presence of the GPI-anchor and the position of the ω-site. PredGPI is trained on a non-redundant dataset of experimentally characterized GPI-anchored proteins whose annotation was carefully checked in the literature. Conclusion PredGPI outperforms all the other previously described methods and is able to correctly replicate the results of previously published high-throughput experiments. PredGPI reaches a lower rate of false positive predictions with respect to other available methods and it is therefore a costless, rapid and accurate method for screening whole proteomes.
0
Citation584
0
Save
0

An expanded evaluation of protein function prediction methods shows an improvement in accuracy

Yuxiang Jiang et al.Sep 7, 2016
A major bottleneck in our understanding of the molecular underpinnings of life is the assignment of function to proteins. While molecular experiments provide the most reliable annotation of proteins, their relatively low throughput and restricted purview have led to an increasing role for computational function prediction. However, assessing methods for protein function prediction and tracking progress in the field remain challenging.We conducted the second critical assessment of functional annotation (CAFA), a timed challenge to assess computational methods that automatically assign protein function. We evaluated 126 methods from 56 research groups for their ability to predict biological functions using Gene Ontology and gene-disease associations using Human Phenotype Ontology on a set of 3681 proteins from 18 species. CAFA2 featured expanded analysis compared with CAFA1, with regards to data set size, variety, and assessment metrics. To review progress in the field, the analysis compared the best methods from CAFA1 to those of CAFA2.The top-performing methods in CAFA2 outperformed those from CAFA1. This increased accuracy can be attributed to a combination of the growing number of experimental annotations and improved methods for function prediction. The assessment also revealed that the definition of top-performing algorithms is ontology specific, that different performance metrics can be used to probe the nature of accurate predictions, and the relative diversity of predictions in the biological process and human phenotype ontologies. While there was methodological improvement between CAFA1 and CAFA2, the interpretation of results and usefulness of individual methods remain context-dependent.
0
Citation397
0
Save
1

The CAFA challenge reports improved protein function prediction and new functional annotations for hundreds of genes through experimental screens

Naihui Zhou et al.Nov 19, 2019
Abstract Background The Critical Assessment of Functional Annotation (CAFA) is an ongoing, global, community-driven effort to evaluate and improve the computational annotation of protein function. Results Here, we report on the results of the third CAFA challenge, CAFA3, that featured an expanded analysis over the previous CAFA rounds, both in terms of volume of data analyzed and the types of analysis performed. In a novel and major new development, computational predictions and assessment goals drove some of the experimental assays, resulting in new functional annotations for more than 1000 genes. Specifically, we performed experimental whole-genome mutation screening in Candida albicans and Pseudomonas aureginosa genomes, which provided us with genome-wide experimental data for genes associated with biofilm formation and motility. We further performed targeted assays on selected genes in Drosophila melanogaster , which we suspected of being involved in long-term memory. Conclusion We conclude that while predictions of the molecular function and biological process annotations have slightly improved over time, those of the cellular component have not. Term-centric prediction of experimental annotations remains equally challenging; although the performance of the top methods is significantly better than the expectations set by baseline methods in C. albicans and D. melanogaster , it leaves considerable room and need for improvement. Finally, we report that the CAFA community now involves a broad range of participants with expertise in bioinformatics, biological experimentation, biocuration, and bio-ontologies, working together to improve functional annotation, computational function prediction, and our ability to manage big data in the era of large experimental screens.
1
Citation346
0
Save
Load More