PM
Pier Martelli
Author with expertise in Prediction of Protein Subcellular Localization
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
22
(82% Open Access)
Cited by:
3,355
h-index:
42
/
i10-index:
112
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Functional annotations improve the predictive score of human disease-related mutations in proteins

Remo Calabrese et al.May 12, 2009
Human MutationVolume 30, Issue 8 p. 1237-1244 MethodFree Access Functional annotations improve the predictive score of human disease-related mutations in proteins Remo Calabrese, Remo Calabrese Laboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, Bologna, ItalySearch for more papers by this authorEmidio Capriotti, Emidio Capriotti Laboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, Bologna, ItalySearch for more papers by this authorPiero Fariselli, Piero Fariselli Laboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, Bologna, ItalySearch for more papers by this authorPier Luigi Martelli, Pier Luigi Martelli Laboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, Bologna, ItalySearch for more papers by this authorRita Casadio, Corresponding Author Rita Casadio casadio@biocomp.unibo.it Laboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, Bologna, ItalyLaboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, via Irnerio 42, 40126 Bologna, ItalySearch for more papers by this author Remo Calabrese, Remo Calabrese Laboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, Bologna, ItalySearch for more papers by this authorEmidio Capriotti, Emidio Capriotti Laboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, Bologna, ItalySearch for more papers by this authorPiero Fariselli, Piero Fariselli Laboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, Bologna, ItalySearch for more papers by this authorPier Luigi Martelli, Pier Luigi Martelli Laboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, Bologna, ItalySearch for more papers by this authorRita Casadio, Corresponding Author Rita Casadio casadio@biocomp.unibo.it Laboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, Bologna, ItalyLaboratory of Biocomputing, CIRB/Department of Biology, University of Bologna, via Irnerio 42, 40126 Bologna, ItalySearch for more papers by this author First published: 12 May 2009 https://doi.org/10.1002/humu.21047Citations: 406AboutPDF ToolsRequest permissionExport citationAdd to favoritesTrack citation ShareShare Give accessShare full text accessShare full-text accessPlease review our Terms and Conditions of Use and check box below to share full-text version of article.I have read and accept the Wiley Online Library Terms and Conditions of UseShareable LinkUse the link below to share a full-text version of this article with your friends and colleagues. Learn more.Copy URL Share a linkShare onFacebookTwitterLinked InRedditWechat Abstract Single nucleotide polymorphisms (SNPs) are the simplest and most frequent form of human DNA variation, also valuable as genetic markers of disease susceptibility. The most investigated SNPs are missense mutations resulting in residue substitutions in the protein. Here we propose SNPs&GO, an accurate method that, starting from a protein sequence, can predict whether a mutation is disease related or not by exploiting the protein functional annotation. The scoring efficiency of SNPs&GO is as high as 82%, with a Matthews correlation coefficient equal to 0.63 over a wide set of annotated nonsynonymous mutations in proteins, including 16,330 disease-related and 17,432 neutral polymorphisms. SNPs&GO collects in unique framework information derived from protein sequence, evolutionary information, and function as encoded in the Gene Ontology terms, and outperforms other available predictive methods. Hum Mutat 30:1–8, 2009. © 2009 Wiley-Liss, Inc. Citing Literature Volume30, Issue8August 2009Pages 1237-1244 ReferencesRelatedInformation
0
Citation619
0
Save
0

PredGPI: a GPI-anchor predictor

Andrea Pierleoni et al.Sep 23, 2008
Abstract Background Several eukaryotic proteins associated to the extracellular leaflet of the plasma membrane carry a Glycosylphosphatidylinositol (GPI) anchor, which is linked to the C-terminal residue after a proteolytic cleavage occurring at the so called ω-site. Computational methods were developed to discriminate proteins that undergo this post-translational modification starting from their aminoacidic sequences. However more accurate methods are needed for a reliable annotation of whole proteomes. Results Here we present PredGPI, a prediction method that, by coupling a Hidden Markov Model (HMM) and a Support Vector Machine (SVM), is able to efficiently predict both the presence of the GPI-anchor and the position of the ω-site. PredGPI is trained on a non-redundant dataset of experimentally characterized GPI-anchored proteins whose annotation was carefully checked in the literature. Conclusion PredGPI outperforms all the other previously described methods and is able to correctly replicate the results of previously published high-throughput experiments. PredGPI reaches a lower rate of false positive predictions with respect to other available methods and it is therefore a costless, rapid and accurate method for screening whole proteomes.
0
Citation584
0
Save
0

An expanded evaluation of protein function prediction methods shows an improvement in accuracy

Yuxiang Jiang et al.Sep 7, 2016
A major bottleneck in our understanding of the molecular underpinnings of life is the assignment of function to proteins. While molecular experiments provide the most reliable annotation of proteins, their relatively low throughput and restricted purview have led to an increasing role for computational function prediction. However, assessing methods for protein function prediction and tracking progress in the field remain challenging.We conducted the second critical assessment of functional annotation (CAFA), a timed challenge to assess computational methods that automatically assign protein function. We evaluated 126 methods from 56 research groups for their ability to predict biological functions using Gene Ontology and gene-disease associations using Human Phenotype Ontology on a set of 3681 proteins from 18 species. CAFA2 featured expanded analysis compared with CAFA1, with regards to data set size, variety, and assessment metrics. To review progress in the field, the analysis compared the best methods from CAFA1 to those of CAFA2.The top-performing methods in CAFA2 outperformed those from CAFA1. This increased accuracy can be attributed to a combination of the growing number of experimental annotations and improved methods for function prediction. The assessment also revealed that the definition of top-performing algorithms is ontology specific, that different performance metrics can be used to probe the nature of accurate predictions, and the relative diversity of predictions in the biological process and human phenotype ontologies. While there was methodological improvement between CAFA1 and CAFA2, the interpretation of results and usefulness of individual methods remain context-dependent.
0
Citation397
0
Save
1

The CAFA challenge reports improved protein function prediction and new functional annotations for hundreds of genes through experimental screens

Naihui Zhou et al.Nov 19, 2019
Abstract Background The Critical Assessment of Functional Annotation (CAFA) is an ongoing, global, community-driven effort to evaluate and improve the computational annotation of protein function. Results Here, we report on the results of the third CAFA challenge, CAFA3, that featured an expanded analysis over the previous CAFA rounds, both in terms of volume of data analyzed and the types of analysis performed. In a novel and major new development, computational predictions and assessment goals drove some of the experimental assays, resulting in new functional annotations for more than 1000 genes. Specifically, we performed experimental whole-genome mutation screening in Candida albicans and Pseudomonas aureginosa genomes, which provided us with genome-wide experimental data for genes associated with biofilm formation and motility. We further performed targeted assays on selected genes in Drosophila melanogaster , which we suspected of being involved in long-term memory. Conclusion We conclude that while predictions of the molecular function and biological process annotations have slightly improved over time, those of the cellular component have not. Term-centric prediction of experimental annotations remains equally challenging; although the performance of the top methods is significantly better than the expectations set by baseline methods in C. albicans and D. melanogaster , it leaves considerable room and need for improvement. Finally, we report that the CAFA community now involves a broad range of participants with expertise in bioinformatics, biological experimentation, biocuration, and bio-ontologies, working together to improve functional annotation, computational function prediction, and our ability to manage big data in the era of large experimental screens.
1
Citation346
0
Save
0

BaCelLo: a balanced subcellular localization predictor

Andrea Pierleoni et al.Jul 15, 2006
Abstract Motivation. The knowledge of the subcellular localization of a protein is fundamental for elucidating its function. It is difficult to determine the subcellular location for eukaryotic cells with experimental high-throughput procedures. Computational procedures are then needed for annotating the subcellular location of proteins in large scale genomic projects. Results. BaCelLo is a predictor for five classes of subcellular localization (secretory pathway, cytoplasm, nucleus, mitochondrion and chloroplast) and it is based on different SVMs organized in a decision tree. The system exploits the information derived from the residue sequence and from the evolutionary information contained in alignment profiles. It analyzes the whole sequence composition and the compositions of both the N- and C-termini. The training set is curated in order to avoid redundancy. For the first time a balancing procedure is introduced in order to mitigate the effect of biased training sets. Three kingdom-specific predictors are implemented: for animals, plants and fungi, respectively. When distributing the proteins from animals and fungi into four classes, accuracy of BaCelLo reach 74% and 76%, respectively; a score of 67% is obtained when proteins from plants are distributed into five classes. BaCelLo outperforms the other presently available methods for the same task and gives more balanced accuracy and coverage values for each class. We also predict the subcellular localization of five whole proteomes, Homo sapiens, Mus musculus, Caenorhabditis elegans, Saccharomyces cerevisiae and Arabidopsis thaliana, comparing the protein content in each different compartment. Availability. BaCelLo can be accessed at Contact. casadio@alma.unibo.it, andrea@biocomp.unibo.it, gigi@biocomp.unibo.it, piero@biocomp.unibo.it
0
Citation315
0
Save
0

WS-SNPs&GO: a web server for predicting the deleterious effect of human protein variants using functional annotation

Emidio Capriotti et al.Jan 1, 2013
SNPs&GO is a method for the prediction of deleterious Single Amino acid Polymorphisms (SAPs) using protein functional annotation. In this work, we present the web server implementation of SNPs&GO (WS-SNPs&GO). The server is based on Support Vector Machines (SVM) and for a given protein, its input comprises: the sequence and/or its three-dimensional structure (when available), a set of target variations and its functional Gene Ontology (GO) terms. The output of the server provides, for each protein variation, the probabilities to be associated to human diseases. The server consists of two main components, including updated versions of the sequence-based SNPs&GO (recently scored as one of the best algorithms for predicting deleterious SAPs) and of the structure-based SNPs&GO3d programs. Sequence and structure based algorithms are extensively tested on a large set of annotated variations extracted from the SwissVar database. Selecting a balanced dataset with more than 38,000 SAPs, the sequence-based approach achieves 81% overall accuracy, 0.61 correlation coefficient and an Area Under the Curve (AUC) of the Receiver Operating Characteristic (ROC) curve of 0.88. For the subset of ~6,600 variations mapped on protein structures available at the Protein Data Bank (PDB), the structure-based method scores with 84% overall accuracy, 0.68 correlation coefficient, and 0.91 AUC. When tested on a new blind set of variations, the results of the server are 79% and 83% overall accuracy for the sequence-based and structure-based inputs, respectively. WS-SNPs&GO is a valuable tool that includes in a unique framework information derived from protein sequence, structure, evolutionary profile, and protein function. WS-SNPs&GO is freely available at http://snps.biofold.org/snps-and-go.
0
Citation303
0
Save
0

A high‐density, SNP‐based consensus map of tetraploid wheat as a bridge to integrate durum and bread wheat genomics and breeding

Marco Maccaferri et al.Nov 26, 2014
Summary Consensus linkage maps are important tools in crop genomics. We have assembled a high‐density tetraploid wheat consensus map by integrating 13 data sets from independent biparental populations involving durum wheat cultivars ( Triticum turgidum ssp. durum ), cultivated emmer ( T. turgidum ssp . dicoccum ) and their ancestor (wild emmer, T. turgidum ssp. dicoccoides ). The consensus map harboured 30 144 markers (including 26 626 SNPs and 791 SSRs) half of which were present in at least two component maps. The final map spanned 2631 cM of all 14 durum wheat chromosomes and, differently from the individual component maps, all markers fell within the 14 linkage groups. Marker density per genetic distance unit peaked at centromeric regions, likely due to a combination of low recombination rate in the centromeric regions and even gene distribution along the chromosomes. Comparisons with bread wheat indicated fewer regions with recombination suppression, making this consensus map valuable for mapping in the A and B genomes of both durum and bread wheat. Sequence similarity analysis allowed us to relate mapped gene‐derived SNP s to chromosome‐specific transcripts. Dense patterns of homeologous relationships have been established between the A‐ and B‐genome maps and between nonsyntenic homeologous chromosome regions as well, the latter tracing to ancient translocation events. The gene‐based homeologous relationships are valuable to infer the map location of homeologs of target loci/ QTL s. Because most SNP and SSR markers were previously mapped in bread wheat, this consensus map will facilitate a more effective integration and exploitation of genes and QTL for wheat breeding purposes.
0
Citation262
0
Save
0

INPS-MD: a web server to predict stability of protein variants from sequence and structure

Castrense Savojardo et al.Apr 10, 2016
Abstract Motivation: Protein function depends on its structural stability. The effects of single point variations on protein stability can elucidate the molecular mechanisms of human diseases and help in developing new drugs. Recently, we introduced INPS, a method suited to predict the effect of variations on protein stability from protein sequence and whose performance is competitive with the available state-of-the-art tools. Results: In this article, we describe INPS-MD (Impact of Non synonymous variations on Protein Stability-Multi-Dimension), a web server for the prediction of protein stability changes upon single point variation from protein sequence and/or structure. Here, we complement INPS with a new predictor (INPS3D) that exploits features derived from protein 3D structure. INPS3D scores with Pearson’s correlation to experimental ΔΔG values of 0.58 in cross validation and of 0.72 on a blind test set. The sequence-based INPS scores slightly lower than the structure-based INPS3D and both on the same blind test sets well compare with the state-of-the-art methods. Availability and Implementation: INPS and INPS3D are available at the same web server: http://inpsmd.biocomp.unibo.it. Supplementary information: Supplementary data are available at Bioinformatics online. Contact: gigi@biocomp.unibo.it
0
Citation201
0
Save
Load More