BH
Bozhen Hu
Author with expertise in Protein Structure Prediction and Analysis
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
2
(100% Open Access)
Cited by:
0
h-index:
6
/
i10-index:
5
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Learning Complete Protein Representation by Deep Coupling of Sequence and Structure

Bozhen Hu et al.Jul 7, 2023
+6
Y
Y
B
Abstract Learning effective representations is crucial for understanding proteins and their biological functions. Recent advancements in language models and graph neural networks have enabled protein models to leverage primary or tertiary structure information to learn representations. However, the lack of practical methods to deeply co-model the relationships between protein sequences and structures has led to suboptimal embeddings. In this work, we propose CoupleNet, a network that couples protein sequence and structure to obtain informative protein representations. CoupleNet incorporates multiple levels of features in proteins, including the residue identities and positions for sequences, as well as geometric representations for tertiary structures. We construct two types of graphs to model the extracted sequential features and structural geometries, achieving completeness on these graphs, respectively, and perform convolution on nodes and edges simultaneously to obtain superior embeddings. Experimental results on a range of tasks, such as protein fold classification and function prediction, demonstrate that our proposed model outperforms the state-of-the-art methods by large margins.
0

Seq2Topt: a sequence-based deep learning predictor of enzyme optimal temperature

Sizhe Qiu et al.Aug 14, 2024
+2
J
B
S
Abstract An accurate deep learning predictor is needed for enzyme optimal temperature ( T opt ), which quantitatively describes how temperature affects the enzyme catalytic activity. Seq2Topt, developed in this study, reached a superior accuracy on T opt prediction just using protein sequences (RMSE = 13.3℃ and R2=0.48) in comparison with existing models, and could capture key protein regions for enzyme T opt with multi-head attention on residues. Through case studies on thermophilic enzyme selection and predicting enzyme T opt shifts caused by point mutations, Seq2Topt was demonstrated as a promising computational tool for enzyme mining and in-silico enzyme design. Additionally, accurate deep learning predictors of enzyme optimal pH (Seq2pHopt, RMSE=0.92 and R2=0.37) and melting temperature (Seq2Tm, RMSE=7.57℃ and R2=0.64) were developed based on the model architecture of Seq2Topt, suggesting that the development of Seq2Topt could potentially give rise to a useful prediction platform of enzymes.