CD
Chuan Dong
Author with expertise in RNA Sequencing Data Analysis
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
8
(63% Open Access)
Cited by:
14
h-index:
8
/
i10-index:
6
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
13

Biomechanical Characterization of SARS-CoV-2 Spike RBD and Human ACE2 Protein-Protein Interaction

Wenpeng Cao et al.Jul 31, 2020
+5
S
C
W
The current COVID-19 pandemic has already had a devastating impact across the world. SARS-CoV-2 (the virus causing COVID-19) is known to use its surface spike (S) protein's receptor binding domain (RBD) to interact with the angiotensin-converting enzyme 2 (ACE2) receptor expressed on many human cell types. The RBD–ACE2 interaction is a crucial step to mediate the host cell entry of SARS-CoV-2. Recent studies indicate that the ACE2 interaction with the SARS-CoV-2 S protein has higher affinity than its binding with the structurally identical S protein of SARS-CoV-1, the virus causing the 2002-2004 SARS epidemic. However, the biophysical mechanism behind such binding affinity difference is unclear. This study utilizes a combined single-molecule force spectroscopy and steered molecular dynamics (SMD) simulation approach to quantify the specific interactions between CoV-2 or CoV-1 RBD and ACE2. Depending on the loading rates, the unbinding forces between CoV-2 RBD and ACE2 range from 70 to 110 pN, and are 30-50% higher than those of CoV-1 RBD and ACE2 under similar loading rates. SMD results indicate that CoV-2 RBD interacts with the N-linked glycan on Asn90 of ACE2. This interaction is mostly absent in the CoV-1 RBD–ACE2 complex. During the SMD simulations, the extra RBD-N-glycan interaction contributes to a greater force and prolonged interaction lifetime. The observation is confirmed by our experimental force spectroscopy study. After the removal of N-linked glycans on ACE2, its mechanical binding strength with CoV-2 RBD decreases to a similar level of the CoV-1 RBD–ACE2 interaction. Together, the study uncovers the mechanism behind the difference in ACE2 binding between SARS-CoV-2 and SARS-CoV-1, and could aid in the development of new strategies to block SARS-CoV-2 entry.
13
Paper
Citation8
0
Save
5

Precise detection of Acrs in prokaryotes using only six features

Chuan Dong et al.May 26, 2020
+4
X
D
C
ABSTRACT Anti-CRISPR proteins (Acrs) can suppress the activity of CRISPR-Cas systems. Some viruses depend on Acrs to expand their genetic materials into the host genome which can promote species diversity. Therefore, the identification and determination of Acrs are of vital importance. In this work we developed a random forest tree-based tool, AcrDetector, to identify Acrs in the whole genomescale using merely six features. AcrDetector can achieve a mean accuracy of 99.65%, a mean recall of 75.84%, a mean precision of 99.24% and a mean F1 score of 85.97%; in multi-round, 5-fold cross-validation (30 different random states). To demonstrate that AcrDetector can identify real Acrs precisely at the whole genome-scale we performed a cross-species validation which resulted in 71.43% of real Acrs being ranked in the top 10. We applied AcrDetector to detect Acrs in the latest data. It can accurately identify 3 Acrs, which have previously been verified experimentally. A standalone version of AcrDetector is available at https://github.com/RiversDong/AcrDetector . Additionally, our result showed that most of the Acrs are transferred into their host genomes in a recent stage rather than early.
5
Citation4
0
Save
7

Species-specific gene duplication inArabidopsis thalianaevolved novel phenotypic effects on morphological traits under strong positive selection

Yuan Huang et al.Apr 6, 2021
+8
J
C
Y
Abstract Gene duplication is increasingly recognized as an important mechanism for the origination of new genes, as revealed by comparative genomic analysis. However, the ways in which new duplicate genes contribute to phenotypic evolution remain largely unknown, especially in plants, owing to a lack of experimental and phenotypic data. In this study, we identified the new gene Exov, derived from a partial gene region duplication of its parental gene Exov-L , which is a member of an exonuclease family, into a different chromosome in Arabidopsis thaliana . We experimentally investigated the phenotypic effects of Exov and Exov-L in an attempt to understand how the new gene diverged from the parental copy and contributes to phenotypic evolution. Evolutionary analysis demonstrated that Exov is a species-specific gene that originated within the last 3.5 million years and shows strong signals of positive selection. Unexpectedly, RNAseq analyses reveal that the new gene, despite its young age, has acquired a large number of novel direct and indirect interactions in which the parental gene does not engage. This is consistent with a high, selection-driven substitution rate in the protein sequence encoded by Exov in contrast to the slowly evolving Exov-L , suggesting an important role for Exov in phenotypic evolution. We analyzed phenotypic effects of exov and exov-l single T-DNA-insertion mutants;double exov, exov-l T-DNA insertion mutants; and CRISPR/Cas9-mediated exov crp and exov-l crp knockouts on seven morphological traits in both the new and parental genes. We detected significant segregation of morphological changes for all seven traits when assessed in terms of single mutants, as well as morphological changes for seven traits associated with segregation of double exov, exov-l mutants. Substantial divergence of phenotypic effects between new and parental genes was revealed by principal component analyses, suggesting neofunctionalization in the new gene. These results reveal a young gene that plays critical roles in biological processes that underlie morphological and developmental evolution in Arabidopsis thaliana .
7
Citation1
0
Save
3

New gene evolution with subcellular expression patterns detected in PacBio-sequenced genomes ofDrosophilagenus

Chuan Dong et al.Dec 2, 2022
+2
D
S
C
Abstract Previous studies described gene age distributions in the focal species of Drosophila melanogaster . Using third-generation PacBio technology to sequence Drosophila species we investigated gene age distribution in the two subgenera of Drosophila . Our work resulted in several discoveries. First, our data detected abundant new genes in entire Drosophila genus. Second, in analysis of subcellular expression, we found that new genes tend to secret into extracellular matrix and are involved in regulation, environmental adaption, and reproductive functions. We also found that extracellular localization for new genes provides a possible environment to promote their fast evolution. Third, old genes tend to be enriched in mitochondrion and the plasma membrane compared with young genes which may support the endosymbiotic theory that mitochondria originate from bacteria that once lived in primitive eukaryotic cells. Fourth, as gene age becomes older the subcellular compartments in which their products reside broadens suggesting that the evolution of new genes in subcellular location drives functional evolution and diversity in Drosophila species. Additionally, based on the analysis of RNA-Seq of two D. melanogaster populations, we determined a universal paradigm of “from specific to constitutive” expression pattern during the evolutionary process of new genes.
3
Citation1
0
Save
4

Structural basis for the association of PLEKHA7 with membrane-embedded phosphatidylinositol lipids

Alexander Aleshin et al.Nov 25, 2020
+10
A
Y
A
Summary PLEKHA7 (pleckstrin homology domain containing family A member 7) plays key roles in intracellular signaling, cytoskeletal organization and cell adhesion, and is associated with multiple human cancers. The interactions of its pleckstrin homology (PH) domain with membrane phosphatidyl-inositol-phosphate (PIP) lipids, are critical for proper cellular localization and function, and their inhibition is an attractive target for anti-cancer therapy. While structural data can provide insights in this area, little is known about the way in which PLEKHA7 and other PH domains interact with membrane-embedded PIPs. Here we report atomic-resolution structures of the PLEHA7 PH domain and describe the molecular mechanism for its recognition of membrane-bound PIPs. Using X-ray crystallography, nuclear magnetic resonance (NMR), molecular dynamics (MD) simulations, and isothermal titration calorimetry (ITC), we show – in atomic-level detail – that the interaction of PLEKHA7 with PIPs is multivalent and induces PIP clustering. The PIP binding mechanism is distinct from a discrete one-to-one interaction. Our findings reveal a central role of the membrane assembly in mediating protein-PIP association and provide a roadmap for the design of PLEKHA7-PIP inhibitors.
0

Accurate prediction of human essential genes using only nucleotide composition and association information

Feng-Biao Biao et al.Oct 28, 2016
+5
H
C
F
Three groups recently identified essential genes in human cancer cell lines using wet experiments, and these genes are of high values. Herein, we improved the widely used Z curve method by creating a λ-interval Z curve, which considered interval association information. With this method and recursive feature elimination technology, a computational model was developed to predict human gene essentiality. The 5-fold cross-validation test based on our benchmark dataset obtained an area under the receiver operating characteristic curve (AUC) of 0.8814. For the rigorous jackknife test, the AUC score was 0.8854. These results demonstrated that the essentiality of human genes could be reliably reflected by only sequence information. However, previous classifiers in three eukaryotes can gave satisfactory prediction only combining sequence with other features. It is also demonstrated that although the information contributed by interval association is less than adjacent nucleotides, this information can still play an independent role. Integrating the interval information into adjacent ones can significantly improve our classifier's prediction capacity. We re-predicted the benchmark negative dataset by Pheg server (http://cefg.uestc.edu.cn/Pheg), and 118 genes were additionally predicted as essential. Among them, 21 were found to be homologues in mouse essential genes, indicating that at least a part of the 118 genes were indeed essential, however previous experiments overlooked them. As the first available server, Pheg could predict essentiality for anonymous gene sequences of human. It is also hoped the λ-interval Z curve method could be effectively extended to classification issues of other DNA elements.
0

Internal Tensile Force and A2 Domain Unfolding of von Willebrand Factor Multimers in Shear Flow

Michael Morabito et al.May 2, 2018
+4
W
C
M
Using Brownian molecular dynamics simulations, we examine the internal dynamics and biomechanical response of von Willebrand Factor (vWF) multimers subject to shear flow. The coarse grain multimer description employed here is based on a monomer model in which the A2 domain of vWF is explicitly represented by a non-linear elastic spring whose mechanical response was fit to experimental force/extension data from vWF monomers. This permits examination of the dynamic behavior of hydrodynamic forces acting on A2 domains as a function of shear rate and multimer length, as well as position of an A2 domain along the multimer contour. Force/position data reveal that collapsed multimers exhibit a force distribution with two peaks, one near each end of the chain; unraveled multimers, however, show a single peak in A2 domain force near the center of multimers. Guided further by experimental data, significant excursions of force acting on a domain are associated with an increasing probability for A2 domain unfolding. Our results suggest that the threshold shear rate required to induce A2 domain unfolding is inversely proportional to multimer length. By examining data for the duration and location of significant force excursions, convincing evidence is advanced that unfolding of A2 domains, and therefore scission of vWF multimers by the size-regulating blood enzyme ADAMTS13, happen preferentially near the center of unraveled multimers.
0

CasLocusAnno: a web-based server for annotating Cas loci and their corresponding (sub)types

Chuan Dong et al.Nov 1, 2018
+9
J
Z
C
CRISPR-Cas systems are prevalent in bacterial and archaeal genomes, and these systems provide a powerful adaptive immune system against predation by phages and other mobile genetic elements (MGEs). They also contribute to other functions, such as gene regulation in prokaryotic organisms. Determining Cas proteins and Cas loci can help mine Cas proteins and facilitate the identification of Cas-associated accessory proteins. Therefore, the purpose of this work is to develop a web-based server, CasLocusAnno, to annotate Cas proteins and Cas loci and to classify them according to (sub)type based on a previous study. CasLocusAnno can annotate Cas proteins and Cas loci and assign their (sub)types within ~28 seconds for whole protein sequence submissions, with protein sequence numbers ranging from ~30 to ~10500. Comparison with Makarova et al's benchmark data demonstrates that CasLocusAnno can accurately identify Cas loci and (sub)types. In addition, CasLocusAnno can identify Cas proteins with higher accuracy and a lower additional prediction rate (APR) than two excellent software programs, CRISPRCasFinder and MacSyFinder. The domain alignment of a Cas protein can be easily browsed in the annotation results. Our server can be freely accessed at http://cefg.uestc.edu.cn/CasLocusAnno/.