HY
Haopeng Yu
Author with expertise in Ribosome Structure and Translation Mechanisms
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(50% Open Access)
Cited by:
3
h-index:
11
/
i10-index:
11
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Comparative Population Genomics of Bread Wheat (Triticum aestivum) Reveals Its Cultivation and Breeding History in China

Haofeng Chen et al.Jan 14, 2019
The evolution of bread wheat (Triticum aestivum) is distinctive in that domestication, natural hybridization, and allopolyploid speciation have all had significant effects on the diversification of its genome. Wheat was spread around the world by humans and has been cultivated in China for ~4,600 years. Here, we report a comprehensive assessment of the evolution of wheat based on the genome-wide resequencing of 120 representative landraces and elite wheat accessions from China and other representative regions. We found substantially higher genetic diversity in the A and B subgenomes than in the D subgenome. Notably, the A and B subgenomes of the modern Chinese elite cultivars were mainly derived from European landraces, while Chinese landraces had a greater contribution to their D subgenomes. The duplicated copies of homoeologous genes from the A, B, and D subgenomes were commonly found to be under different levels of selection. Our genome-wide assessment of the genetic changes associated with wheat breeding in China provides new strategies and practical targets for future breeding.
0

Prediction of DNA i-Motifs Via Machine Learning

Bibo Yang et al.Jan 1, 2023
i-Motifs (iMs), are secondary structures formed in cytosine-rich DNA sequences and are involved in multiple functions in the genome. Although putative iM forming sequences are widely distributed in the human genome, the folding status and strength of putative iMs vary dramatically. Much previous research on iM has focused on assessing the iM folding properties using biophysical experiments. However, there are no dedicated computational tools for predicting the folding status and strength of iM structures. Here, we introduce a machine learning pipeline, iM-Seeker, to predict both folding status and structural stability of DNA iMs. The programme iM-Seeker incorporates a Balanced Random Forest classifier trained on genome-wide iMab antibody-based CUT&Tag sequencing data to predict the folding status and an Extreme Gradient Boosting regressor to estimate the folding strength according to both literature biophysical data and our in-house biophysical experiments. iM-Seeker predicts DNA iM folding status with a classification accuracy of 81% and estimates the folding strength with coefficient of determination (R2) of 0.642 on the test set. Model interpretation confirms that the nucleotide composition of the C-rich sequence significantly affects iM stability, with a positive correlation with sequences containing cytosine and thymine and a negative correlation with guanine and adenine.
1

Structure and engineering of miniatureAcidibacillus sulfuroxidansCas12f1

Zhaowei Wu et al.Jul 3, 2023
Abstract The miniature CRISPR-Cas12f nucleases allow for efficient delivery via cargo-size-limited adeno-associated virus delivery vehicles, thereby showing promising potential for in vivo therapeutic applications. Acidibacillus sulfuroxidans Cas12f1 (AsCas12f1, 422 amino acids) is the most compact Cas12f nuclease identified to date, showing a moderate level of genome-editing activity in human cells compared to Cas9 and Cas12a. Understanding the mechanisms of why such a compact nuclease is active for genome editing would facilitate its rational engineering. Here, we report the cryo-EM structure of the AsCas12f1-sgRNA-dsDNA ternary complex, and reveal that AsCas12f1 functions as an asymmetric dimer for single-guide RNA (sgRNA) binding and DNA targeting. The detailed mechanisms for dimer formation, PAM recognition, and sgRNA accommodation are elucidated. Leading by the structural knowledge, we extensively engineer the AsCas12f1 nuclease and its corresponding sgRNA, resulting in an evolved AsCas12f1-sgRNA combination with drastically enhanced genome editing activity in human cells. These results provide further understanding of compact CRISPR systems and expand the mini CRISPR toolbox for therapeutic applications.
0

PlantRNA-FM: An Interpretable RNA Foundation Model for Exploration Functional RNA Motifs in Plants

Haopeng Yu et al.Jun 27, 2024
The complex 'language' of plant RNA encodes a vast array of biological regulatory elements that orchestrate crucial aspects of plant growth, development, and adaptation to environmental stresses. Recent advancements in foundation models (FMs) have demonstrated their unprecedented potential to decipher complex 'language' in biology. In this study, we introduced PlantRNA-FM, a novel high-performance and interpretable RNA FM specifically designed based on RNA features including both sequence and structure. PlantRNA-FM was pre-trained on an extensive dataset, integrating RNA sequences and RNA structure information from 1,124 distinct plant species. PlantRNA-FM exhibits superior performance in plant-specific downstream tasks, such as plant RNA annotation prediction and RNA translation efficiency (TE) prediction. Compared to the second-best FMs, PlantRNA-FM achieved an F1 score improvement of up to 52.45% in RNA genic region annotation prediction and up to 15.30% in translation efficiency prediction, respectively. Our PlantRNA-FM is empowered by our interpretable framework that facilitates the identification of biologically functional RNA sequence and structure motifs, including both RNA secondary and tertiary structure motifs across transcriptomes. Through experimental validations, we revealed novel translation-associated RNA motifs in plants. Our PlantRNA-FM also highlighted the importance of the position information of these functional RNA motifs in genic regions. Taken together, our PlantRNA-FM facilitates the exploration of functional RNA motifs across the complexity of transcriptomes, empowering plant scientists with novel capabilities for programming RNA codes in plants.
0

Deciphering the rules of mRNA structure differentiation in vivo and in vitro with deep neural networks in Saccharomyces cerevisiae

Haopeng Yu et al.Jun 3, 2018
The structure of mRNA in vivo is influenced by various factors involved in the translation process, resulting in significant differentiation of mRNA structure from that in vitro . Because multiple factors cause the differentiation of in vivo and in vitro mRNA structures, it was difficult to perform a more accurate analysis of mRNA structures in previous studies. In this study, we have proposed a novel application of a deep neural network (DNN) model to predict the structural stability of mRNA in vivo by fitting six quantifiable features that may affect mRNA folding: ribosome density, minimum folding free energy, GC content, mRNA abundance, ribosomal initial density and position of mRNA structure. Simulated mutations of the mRNA structure were designed and then fed into the trained DNN model to compute their structural stability. We found unique effects of these six features on mRNA structural stability in vivo . Strikingly, the ribosome density of the structural region is the most important factor affecting the structural stability of mRNA in vivo , and the strength of the mRNA structure in vitro should have a relatively small effect on its structural stability in vivo . The recruitment of DNNs provides a new paradigm to decipher the differentiation of mRNA structure in vivo and in vitro . This improved knowledge on the mechanisms of factors influencing mRNA structural stability will facilitate the design and functional analysis of mRNA structure in vivo .