JS
Jeffrey Skolnick
Author with expertise in Protein Structure Prediction and Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
14
(79% Open Access)
Cited by:
5,141
h-index:
87
/
i10-index:
301
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Scoring function for automated assessment of protein structure template quality

Yang Zhang et al.Oct 8, 2004
J
Y
We have developed a new scoring function, the template modeling score (TM-score), to assess the quality of protein structure templates and predicted full-length models by extending the approaches used in Global Distance Test (GDT)1 and MaxSub.2 First, a protein size-dependent scale is exploited to eliminate the inherent protein size dependence of the previous scores and appropriately account for random protein structure pairs. Second, rather than setting specific distance cutoffs and calculating only the fractions with errors below the cutoff, all residue pairs in alignment/modeling are evaluated in the proposed score. For comparison of various scoring functions, we have constructed a large-scale benchmark set of structure templates for 1489 small to medium size proteins using the threading program PROSPECTOR_3 and built the full-length models using MODELLER and TASSER. The TM-score of the initial threading alignments, compared to the GDT and MaxSub scoring functions, shows a much stronger correlation to the quality of the final full-length models. The TM-score is further exploited as an assessment of all 'new fold' targets in the recent CASP5 experiment and shows a close coincidence with the results of human-expert visual assessment. These data suggest that the TM-score is a useful complement to the fully automated assessment of protein structure predictions. The executable program of TM-score is freely downloadable at http://bioinformatics.buffalo.edu/TM-score.
0

Electrostatic Persistence Length of a Wormlike Polyelectrolyte

Jeffrey Skolnick et al.Sep 1, 1977
M
J
ADVERTISEMENT RETURN TO ISSUEPREVArticleNEXTElectrostatic Persistence Length of a Wormlike PolyelectrolyteJeffrey Skolnick and Marshall FixmanCite this: Macromolecules 1977, 10, 5, 944–948Publication Date (Print):September 1, 1977Publication History Published online1 May 2002Published inissue 1 September 1977https://pubs.acs.org/doi/10.1021/ma60059a011https://doi.org/10.1021/ma60059a011research-articleACS PublicationsRequest reuse permissionsArticle Views2070Altmetric-Citations763LEARN ABOUT THESE METRICSArticle Views are the COUNTER-compliant sum of full text article downloads since November 2008 (both PDF and HTML) across all institutions and individuals. These metrics are regularly updated to reflect usage leading up to the last few days.Citations are the number of other articles citing this article, calculated by Crossref and updated daily. Find more information about Crossref citation counts.The Altmetric Attention Score is a quantitative measure of the attention that a research article has received online. Clicking on the donut icon will load a page at altmetric.com with additional details about the score and the social media presence for the given article. Find more information on the Altmetric Attention Score and how the score is calculated. Share Add toView InAdd Full Text with ReferenceAdd Description ExportRISCitationCitation and abstractCitation and referencesMore Options Share onFacebookTwitterWechatLinked InRedditEmail Other access optionsGet e-Alertsclose Get e-Alerts
0

Ab initio modeling of small proteins by iterative TASSER simulations

Sitao Wu et al.May 8, 2007
Y
J
S
Abstract Background Predicting 3-dimensional protein structures from amino-acid sequences is an important unsolved problem in computational structural biology. The problem becomes relatively easier if close homologous proteins have been solved, as high-resolution models can be built by aligning target sequences to the solved homologous structures. However, for sequences without similar folds in the Protein Data Bank (PDB) library, the models have to be predicted from scratch. Progress in the ab initio structure modeling is slow. The aim of this study was to extend the TASSER ( t hreading/ asse mbly/ r efinement) method for the ab initio modeling and examine systemically its ability to fold small single-domain proteins. Results We developed I-TASSER by iteratively implementing the TASSER method, which is used in the folding test of three benchmarks of small proteins. First, data on 16 small proteins (< 90 residues) were used to generate I-TASSER models, which had an average C α -root mean square deviation (RMSD) of 3.8Å, with 6 of them having a C α -RMSD < 2.5Å. The overall result was comparable with the all-atomic ROSETTA simulation, but the central processing unit (CPU) time by I-TASSER was much shorter (150 CPU days vs. 5 CPU hours). Second, data on 20 small proteins (< 120 residues) were used. I-TASSER folded four of them with a C α -RMSD < 2.5Å. The average C α -RMSD of the I-TASSER models was 3.9Å, whereas it was 5.9Å using TOUCHSTONE-II software. Finally, 20 non-homologous small proteins (< 120 residues) were taken from the PDB library. An average C α -RMSD of 3.9Å was obtained for the third benchmark, with seven cases having a C α -RMSD < 2.5Å. Conclusion Our simulation results show that I-TASSER can consistently predict the correct folds and sometimes high-resolution models for small single-domain proteins. Compared with other ab initio modeling methods such as ROSETTA and TOUCHSTONE II, the average performance of I-TASSER is either much better or is similar within a lower computational time. These data, together with the significant performance of automated I-TASSER server (the Zhang-Server) in the 'free modeling' section of the recent Critical Assessment of Structure Prediction (CASP)7 experiment, demonstrate new progresses in automated ab initio model generation. The I-TASSER server is freely available for academic users http://zhang.bioinformatics.ku.edu/I-TASSER .
0

SPICKER: A clustering approach to identify near‐native protein folds

Yang Zhang et al.Mar 1, 2004
J
Y
Abstract We have developed SPICKER , a simple and efficient strategy to identify near‐native folds by clustering protein structures generated during computer simulations. In general, the most populated clusters tend to be closer to the native conformation than the lowest energy structures. To assess the generality of the approach, we applied SPICKER to 1489 representative benchmark proteins ≤200 residues that cover the PDB at the level of 35% sequence identity; each contains up to 280,000 structure decoys generated using the recently developed TASSER (Threading ASSembly Refinement) algorithm. The best of the top five identified folds has a root‐mean‐square deviation from native (RMSD) in the top 1.4% of all decoys. For 78% of the proteins, the difference in RMSD from native to the identified models and RMSD from native to the absolutely best individual decoy is below 1 Å; the majority belong to the targets with converged conformational distributions. Although native fold identification from divergent decoy structures remains a challenge, our overall results show significant improvement over our previous clustering algorithms. © 2004 Wiley Periodicals, Inc. J Comput Chem 25: 865–871, 2004
0
Citation390
0
Save
0

How Well is Enzyme Function Conserved as a Function of Pairwise Sequence Identity?

Weidong Tian et al.Oct 1, 2003
J
W
Enzyme function conservation has been used to derive the threshold of sequence identity necessary to transfer function from a protein of known function to an unknown protein. Using pairwise sequence comparison, several studies suggested that when the sequence identity is above 40%, enzyme function is well conserved. In contrast, Rost argued that because of database bias, the results from such simple pairwise comparisons might be misleading. Thus, by grouping enzyme sequences into families based on sequence similarity and selecting representative sequences for comparison, he showed that enzyme function starts to diverge quickly when the sequence identity is below 70%. Here, we employ a strategy similar to Rost's to reduce the database bias; however, we classify enzyme families based not only on sequence similarity, but also on functional similarity, i.e. sequences in each family must have the same four digits or the same first three digits of the enzyme commission (EC) number. Furthermore, instead of selecting representative sequences for comparison, we calculate the function conservation of each enzyme family and then average the degree of enzyme function conservation across all enzyme families. Our analysis suggests that for functional transferability, 40% sequence identity can still be used as a confident threshold to transfer the first three digits of an EC number; however, to transfer all four digits of an EC number, above 60% sequence identity is needed to have at least 90% accuracy. Moreover, when PSI-BLAST is used, the magnitude of the E-value is found to be weakly correlated with the extent of enzyme function conservation in the third iteration of PSI-BLAST. As a result, functional annotation based on the E-values from PSI-BLAST should be used with caution. We also show that by employing an enzyme family-specific sequence identity threshold above which 100% functional conservation is required, functional inference of unknown sequences can be accurately accomplished. However, this comes at a cost: those true positive sequences below this threshold cannot be uniquely identified.
0
Citation387
0
Save
0

Crowding and hydrodynamic interactions likely dominate in vivo macromolecular motion

Tadashi Ando et al.Oct 11, 2010
J
T
To begin to elucidate the principles of intermolecular dynamics in the crowded environment of cells, employing Brownian dynamics (BD) simulations, we examined possible mechanism(s) responsible for the great reduction in diffusion constants of macromolecules in vivo from that at infinite dilution. In an Escherichia coli cytoplasm model comprised of 15 different macromolecule types at physiological concentrations, BD simulations of molecular-shaped and equivalent sphere representations were performed with a soft repulsive potential. At cellular concentrations, the calculated diffusion constant of GFP is much larger than experiment, with no significant shape dependence. Next, using the equivalent sphere system, hydrodynamic interactions (HI) were considered. Without adjustable parameters, the in vivo experimental GFP diffusion constant was reproduced. Finally, the effects of nonspecific attractive interactions were examined. The reduction in diffusivity is very sensitive to macromolecular radius with the motion of the largest macromolecules dramatically slowed down; this is not seen if HI dominate. In addition, long-lived clusters involving the largest macromolecules form if attractions dominate, whereas HI give rise to significant, size independent intermolecular dynamic correlations. These qualitative differences provide a testable means of differentiating the importance of HI vs. nonspecific attractive interactions on macromolecular motion in cells.
0

Fast procedure for reconstruction of full‐atom protein models from reduced representations

Piotr Rotkiewicz et al.Jan 14, 2008
J
P
Abstract We introduce PULCHRA, a fast and robust method for the reconstruction of full‐atom protein models starting from a reduced protein representation. The algorithm is particularly suitable as an intermediate step between coarse‐grained model‐based structure prediction and applications requiring an all‐atom structure, such as molecular dynamics, protein‐ligand docking, structure‐based function prediction, or assessment of quality of the predicted structure. The accuracy of the method was tested on a set of high‐resolution crystallographic structures as well as on a set of low‐resolution protein decoys generated by a protein structure prediction algorithm TASSER. The method is implemented as a standalone program that is available for download from http://cssb.biology.gatech.edu/skolnick/files/PULCHRA . © 2008 Wiley Periodicals, Inc. J Comput Chem, 2008
0

Automated structure prediction of weakly homologous proteins on a genomic scale

Yang Zhang et al.May 4, 2004
J
Y
We have developed TASSER, a hierarchical approach to protein structure prediction that consists of template identification by threading, followed by tertiary structure assembly via the rearrangement of continuous template fragments guided by an optimized C(alpha) and side-chain-based potential driven by threading-based, predicted tertiary restraints. TASSER was applied to a comprehensive benchmark set of 1,489 medium-sized proteins in the Protein Data Bank. With homologues excluded, in 927 cases, the templates identified by our threading algorithm PROSPECTOR_3 have a rms deviation from native <6.5 A with approximately 80% alignment coverage. After template reassembly, this number increases to 1,172. This shows significant and systematic improvement of the final models with respect to the initial template alignments. Furthermore, significant improvements in loop modeling are demonstrated. We then apply TASSER to the 1,360 medium-sized ORFs in the Escherichia coli genome; approximately 920 can be predicted with high accuracy based on confidence criteria established in the Protein Data Bank benchmark. These results from our unprecedented comprehensive folding benchmark on all protein categories provide a reliable basis for the application of TASSER to structural genomics, especially to proteins of low sequence identity to solved protein structures.
0
Citation345
0
Save
3

Prediction of inter-chain distance maps of protein complexes with 2D attention-based deep neural networks

Zhiye Guo et al.Jun 20, 2022
J
J
J
Z
Abstract Residue-residue distance information is useful for predicting the tertiary structures of protein monomers or the quaternary structures of protein complexes. Many deep learning methods have been developed to predict intra-chain residue-residue distances of monomers accurately, but very few methods can accurately predict inter-chain residue-residue distances of protein complexes. We develop a new deep learning method CDPred (i.e., Complex Distance Prediction) based on the 2D attention-powered residual network architecture to address the gap. CDPred predicts the inter-chain distance maps of dimers (homodimers or heterodimers) from the features extracted from multiple sequence alignments (MSAs) and the intra-chain distance maps of predicted tertiary structures of monomers. Tested on two homodimer test datasets, CDPred achieves the precision of 61.56% and 43.26% for top L/5 inter-chain contact predictions (L: length of the monomer in homodimer), respectively, which is substantially higher than DeepHomo’s 37.40% and 23.08% and GLINTER’s 48.09% and 36.74%. And tested on the two heterodimer test datasets, the top L/5 inter-chain contact prediction precision (L: length of the shorter monomer in heterodimer) of CDPred is 47.59% and 22.87% respectively, which surpasses GLINTER’s 23.24% and 13.49%. Moreover, we demonstrate that the residue-residue co-evolutionary features calculated from multiple sequence alignments by a deep learning language model are more informative for the inter-chain contact prediction than the traditional statistical optimization approach of maximizing direct co-evolutionary signals, and large intra-chain distances in the intra-chain distance maps of monomers are more useful for the inter-chain distance prediction than small intra-chain distances.
0

Utility of the Morgan Fingerprint in Structure-Based Virtual Ligand Screening

Hongyi Zhou et al.May 24, 2024
J
H
In modern drug discovery, virtual ligand screening (VLS) is frequently applied to identify possible hits before experimental testing and refinement due to its cost-effective nature for large compound libraries. For decades, efforts have been devoted to developing VLS methods with high accuracy. These include the state-of-the-art FINDSITE suite of approaches FINDSITE
Load More