IB
Inigo Barrio-Hernandez
Author with expertise in Computational Methods in Drug Discovery
Wellcome Sanger Institute, European Bioinformatics Institute, Open Targets
+ 3 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
7
(86% Open Access)
Cited by:
82
h-index:
16
/
i10-index:
21
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Clustering predicted structures at the scale of the known protein universe

Inigo Barrio-Hernandez et al.Mar 11, 2024
+7
J
J
I
Proteins are key to all cellular processes and their structure is important in understanding their function and evolution. Sequence-based predictions of protein structures have increased in accuracy1, and over 214 million predicted structures are available in the AlphaFold database2. However, studying protein structures at this scale requires highly efficient methods. Here, we developed a structural-alignment-based clustering algorithm-Foldseek cluster-that can cluster hundreds of millions of structures. Using this method, we have clustered all of the structures in the AlphaFold database, identifying 2.30 million non-singleton structural clusters, of which 31% lack annotations representing probable previously undescribed structures. Clusters without annotation tend to have few representatives covering only 4% of all proteins in the AlphaFold database. Evolutionary analysis suggests that most clusters are ancient in origin but 4% seem to be species specific, representing lower-quality predictions or examples of de novo gene birth. We also show how structural comparisons can be used to predict domain families and their relationships, identifying examples of remote structural similarity. On the basis of these analyses, we identify several examples of human immune-related proteins with putative remote homology in prokaryotic species, illustrating the value of this resource for studying protein function and evolution across the tree of life.
108

Towards a structurally resolved human protein interaction network

David Burke et al.Nov 16, 2021
+13
I
P
D
Abstract All cellular functions are governed by complex molecular machines that assemble through protein-protein interactions. Their atomic details are critical to the study of their molecular mechanisms but fewer than 5% of hundreds of thousands of human interactions have been structurally characterized. Here, we test the potential and limitations of recent progress in deep-learning methods using AlphaFold2 to predict structures for 65,484 human interactions. We show that higher confidence models are enriched in interactions supported by affinity or structure-based methods and can be orthogonally confirmed by spatial constraints defined by cross-link data. We identify 3,137 high confidence models, of which 1,371 have no homology to a known structure, from which we identify interface residues harbouring disease mutations, suggesting potential mechanisms for pathogenic variants. We find groups of interface phosphorylation sites that show patterns of co-regulation across conditions, suggestive of coordinated tuning of multiple interactions as signalling responses. Finally, we provide examples of how the predicted binary complexes can be used to build larger assemblies. Accurate prediction of protein complexes promises to greatly expand our understanding of the atomic details of human cell biology in health and disease.
5

A guide for potential drugs to treat COVID-19 based on interactions between all SARS-Cov-2 and human proteins

David Gordon et al.Mar 23, 2020
+91
M
G
D
This study created a protein-protein interaction map of all the proteins present within the SARS-CoV-2 virus and humans. Understanding how viral proteins interact with human proteins gives researchers targets for the repurposing of drugs to treat COVID-19
0

Genetic interaction library screening with a next-generation dual guide CRISPR system

Thomas Burgold et al.May 27, 2024
+10
E
E
T
Abstract Pairwise perturbation of gene function using the CRISPR/Cas9 system has huge potential in screening for genetic interactions and synthetic lethal gene pairs to identify novel combination therapies for cancer. However, existing dual guide expression systems are cumbersome to clone, often result in a large proportion of undesired guide pairs and have imbalance of guide expression from the two positions. Here, we demonstrate a next-generation system for dual guide delivery based around a tRNA spacer that allows a single step cloning strategy, as little as 2% of undesired guide pairs, and highly balanced expression of the two guides. This system allows efficient library-scale screening for hundreds of thousands of genetic interactions using the well understood Streptococcus pyogenes Cas9 (SpCas9) system. We use this to screen a 100,136 guide pair library in colorectal cancer cells and successfully identify synthetic lethal genetic interactions between paralogs, establishing our method for performing efficient large scale genetic interaction screens. This system is versatile and can be used with most guide RNA vector systems, and for other uses of paired guide delivery such as improving single gene knockout efficiency or improving guide detection in single cell or optical CRISPR screens.
0
0
Save
49

Network expansion of genetic associations defines a pleiotropy map of human cell biology

Inigo Barrio-Hernandez et al.Oct 24, 2023
+9
A
J
I
Abstract Proteins that interact within molecular networks tend to have similar functions and when perturbed influence the same organismal traits. Interaction networks can be used to expand the list of likely trait associated genes from genome-wide association studies (GWAS). Here, we used improvements in SNP-to-gene mapping to perform network based expansion of trait associated genes for 1,002 human traits showing that this recovers known disease genes or drug targets. The similarity of network expansion scores identifies groups of traits likely to share a common genetic basis as well as the biological processes underlying this. We identified 73 pleiotropic gene modules linked to multiple traits that are enriched in genes involved in processes such as protein ubiquitination and RNA processing. We show examples of modules linked to human diseases enriched in genes with pathogenic variants found in patients or relevant mouse knock-out phenotypes and can be used to map targets of approved drugs for repurposing opportunities. Finally, we illustrate the use of the network expansion scores to study genes at inflammatory bowel disease (IBD) GWAS loci, and implicate IBD-relevant genes with strong functional and genetic support.
52

Systematic identification of structure-specific protein–protein interactions

Aleš Holfeld et al.Oct 24, 2023
+13
F
D
A
Abstract Protein–protein interactions (PPIs) mediate numerous essential functions and regulatory events in living organisms. The physical interactome of a protein can be abnormally altered in response to external and internal cues, thus modulating cell physiology and contributing to human disease. In particular, neurodegenerative diseases due to the accumulation of aberrantly folded and aggregated proteins may lead to alterations in protein interactomes. Identifying changes in the interactomes of normal and disease states of proteins could help to understand molecular disease mechanisms, but current interactomics methods are limited in the ability to pinpoint structure-specific PPIs and their interaction interfaces on a proteome-wide scale. Here, we adapted limited proteolysis–mass spectrometry (LiP–MS) to systematically identify putative structure-specific PPIs by probing protein structural alterations within cellular extracts upon treatment with specific structural states of a given protein. We demonstrate the feasibility of our method to detect well-characterized PPIs, including antibody–target protein interactions and interactions with membrane proteins, and show that it pinpoints PPI interfaces. We then applied the LiP–MS approach to study the structure-specific interactors of the Parkinson’s disease hallmark protein alpha-synuclein (aSyn). We identified several previously known interactors of both aSyn monomer and amyloid fibrils and provide a resource of novel putative structure-specific interactors for further studies. This approach is applicable to identify structure-specific interactomes of any protein, including posttranslationally modified and unmodified, or metabolite-bound and unbound structural states of proteins.
428

Clustering predicted structures at the scale of the known protein universe

Inigo Barrio-Hernandez et al.Oct 24, 2023
+5
J
J
I
Proteins are key to all cellular processes and their structure is important in understanding their function and evolution. Sequence-based predictions of protein structures have increased in accuracy with over 214 million predicted structures available in the AlphaFold database (AFDB). However, studying protein structures at this scale requires highly efficient methods. Here, we developed a structural-alignment based clustering algorithm - Foldseek cluster - that can cluster hundreds of millions of structures. Using this method we have clustered all structures in AFDB, identifying 2.27M non-singleton structural clusters, of which 31% lack annotations representing likely novel structures. Clusters without annotation tend to have few representatives covering only 4% of all proteins in the AFDB. Evolutionary analysis suggests that most clusters are ancient in origin but 4% seem species specific, representing lower quality predictions or examples of de-novo gene birth. Additionally, we show how structural comparisons can be used to predict domain families and their relationships, identifying examples of remote homology. Based on these analyses we identify several examples of human immune related proteins with remote homology in prokaryotic species which illustrates the value of this resource for studying protein function and evolution across the tree of life.