YD
Yong Ding
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
3
(33% Open Access)
Cited by:
523
h-index:
23
/
i10-index:
28
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Multiple exposures to drought 'train' transcriptional responses in Arabidopsis

Yong Ding et al.Mar 13, 2012
Z
M
Y
Pre-exposure to stress may alter plants' subsequent responses by producing faster and/or stronger reactions implying that plants exercise a form of 'stress memory'. The mechanisms of plants' stress memory responses are poorly understood leaving this fundamental biological question unanswered. Here we show that during recurring dehydration stresses Arabidopsis plants display transcriptional stress memory demonstrated by an increase in the rate of transcription and elevated transcript levels of a subset of the stress–response genes (trainable genes). During recovery (watered) states, trainable genes produce transcripts at basal (preinduced) levels, but remain associated with atypically high H3K4me3 and Ser5P polymerase II levels, indicating that RNA polymerase II is stalled. This is the first example of a stalled RNA polymerase II and its involvement in transcriptional memory in plants. These newly discovered phenomena might be a general feature of plant stress–response systems and could lead to novel approaches for increasing the flexibility of a plant's ability to respond to the environment. Whether plants can remember their transcriptional response to stress is unknown. By repeatedly exposingArabidopsisto drought, we show that the plants remember their transcriptional response to stress and that the altered genes retain the epigenetic mark H3K4me3 and stalled phosphorylated polymerase II.
0
Citation523
0
Save
5

Deepurify: a multi-modal deep language model to remove contamination from metagenome-assembled genomes

bohao ZOU et al.Jan 1, 2023
+9
Y
B
b
Metagenome-assembled genomes (MAGs) offer valuable insights into the exploration of microbial dark matter using metagenomic sequencing data. However, there is a growing concern that contamination in MAGs may significantly impact the downstream analysis results. Existing MAG decontamination methods heavily rely on marker genes but do not fully leverage genomic sequences. To address the limitations, we have introduced a novel decontamination approach named Deepurify, which utilizes a multi-modal deep language model employing contrastive learning to learn taxonomic similarities of genomic sequences. Deepurify utilizes inferred taxonomic lineages to guide the allocation of contigs into a MAG-separated tree and employs a tree traversal strategy for maximizing the total number of medium- and high-quality MAGs. Extensive experiments were conducted on two simulated datasets, CAMI I, and human gut metagenomic sequencing data. These results demonstrate that Deepurify significantly outperforms other decontamination methods.
0

TRAFICA: Improving Transcription Factor Binding Affinity Prediction using Large Language Model on ATAC-seq Data

Yu Xu et al.Jan 1, 2023
+5
Y
K
Y
In silico prediction of transcription factor (TF) binding affinity plays a vital role in determining TF binding preferences and understanding gene regulation. Many existing tools utilize known TF-DNA binding data to train conventional machine learning and deep learning models to predict TF-DNA binding affinities. The majority of these tools do not consider the natural preferences of DNA sequences binding to TFs, which could be influenced by chromatin accessibility. In this study, we developed TRAFICA, a deep language model to predict TF-DNA binding affinities by integrating chromatin accessibility from ATAC-seq and known TF-DNA binding data. We pre-trained TRAFICA on an integrated ATAC-seq dataset with over 13 million nucleotide sequences in a self-supervised manner to learn potential TF-DNA binding preferences and contextual relationships within DNA sequences. TRAFICA was fine-tuned using PBM and HT-SELEX datasets to predict in vitro TF-DNA binding affinities. We also implemented AdapterFusion to enhance its ability to predict in vivo TF-DNA binding affinities. We observed TRAFICA significantly outperformed the six existing tools in predicting in vitro TF-DNA binding affinities and was comparable with the best tool on in vivo prediction.