JY
Jiapei Yuan
Author with expertise in Role of Long Noncoding RNAs in Cancer and Development
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
7
(57% Open Access)
Cited by:
576
h-index:
11
/
i10-index:
12
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Characterization of stress‐responsive lncRNAs in Arabidopsis thaliana by integrating expression, epigenetic and structural features

Chao Di et al.Sep 26, 2014
Recently, in addition to poly(A)+ long non-coding RNAs (lncRNAs), many lncRNAs without poly(A) tails, have been characterized in mammals. However, the non-polyA lncRNAs and their conserved motifs, especially those associated with environmental stresses, have not been fully investigated in plant genomes. We performed poly(A)- RNA-seq for seedlings of Arabidopsis thaliana under four stress conditions, and predicted lncRNA transcripts. We classified the lncRNAs into three confidence levels according to their expression patterns, epigenetic signatures and RNA secondary structures. Then, we further classified the lncRNAs to poly(A)+ and poly(A)- transcripts. Compared with poly(A)+ lncRNAs and coding genes, we found that poly(A)- lncRNAs tend to have shorter transcripts and lower expression levels, and they show significant expression specificity in response to stresses. In addition, their differential expression is significantly enriched in drought condition and depleted in heat condition. Overall, we identified 245 poly(A)+ and 58 poly(A)- lncRNAs that are differentially expressed under various stress stimuli. The differential expression was validated by qRT-PCR, and the signaling pathways involved were supported by specific binding of transcription factors (TFs), phytochrome-interacting factor 4 (PIF4) and PIF5. Moreover, we found many conserved sequence and structural motifs of lncRNAs from different functional groups (e.g. a UUC motif responding to salt and a AU-rich stem-loop responding to cold), indicated that the conserved elements might be responsible for the stress-responsive functions of lncRNAs.
0
Citation279
0
Save
1

Accurate prediction of cohesin-mediated 3D genome organization from 2D chromatin features

Ahmed Abbas et al.Nov 25, 2022
ABSTRACT The three-dimensional (3D) genome organization influences diverse nuclear processes. Chromatin interaction analysis by paired-end tag sequencing (ChIA-PET) and Hi-C are powerful methods to study the 3D genome organization. However, ChIA-PET and Hi-C experiments are expensive, time-consuming, require tens to hundreds of millions of cells, and are challenging to optimize and analyze. Predicting ChIA-PET/Hi-C data using cheaper ChIP-Seq data and other easily obtainable features could be a useful alternative. It is well-established that the cohesin protein complex is a key determinant of 3D genome organization. Here we present Chromatin Interaction Predictor (ChIPr), a suite of regression models based on deep neural networks (DNN), random forest, and gradient boosting, respectively, to predict cohesin-mediated chromatin interaction strength between any two loci in the genome. Comprehensive tests on four cell lines show that the predictions of ChIPr correlate well with the original ChIA-PET data at the peak-level resolution and bin sizes of 25 and 5 Kbp. In addition, ChIPr can accurately capture most of the cell-type-dependent loops identified by ChIA-PET and Hi-C data. Rigorous feature testing indicated that genomic distance and RAD21 (a cohesin component) ChIP-Seq signals are the most important inputs for ChIPr in determining chromatin interaction strength. The standard ChIPr model requires three experimental inputs: ChIP-Seq signals for RAD21, H3K27ac (enhancer/active chromatin mark) and H3K27me3 (inactive chromatin mark). The minimal ChIPr model performs comparably and requires a single experimental input: ChIP-Seq signals for RAD21. Integrative analysis revealed novel insights into the role of CTCF motif, its orientation, and CTCF binding on the prevalence and strength of cohesin-mediated chromatin interactions. These studies outline the general features of genome folding and open new avenues to analyze spatial genome organization in specimens with limited cell numbers.
1
Citation2
0
Save
0

Single-cell transcriptomic analysis of the immune microenvironment in pediatric acute leukemia

Jiapei Yuan et al.Jun 5, 2024
Relapse and treatment resistance pose significant challenges in the management of pediatric B cell acute lymphoblastic leukemia (B-ALL) and acute myeloid leukemia (AML). The efficacy of immunotherapy in leukemia remains limited due to factors such as the immunosuppressive tumor microenvironment (TME) and lack of suitable immunotherapeutic targets. Thus, an in-depth characterization of the TME in pediatric leukemia is warranted to improve the efficacy of immunotherapy. Here, we used single-cell RNA sequencing (scRNA-seq) to characterize the TME of pediatric B-ALL and AML, focusing specifically on bone-marrow-derived T cells. Moreover, we investigated the transcriptome changes during the initiation, remission, and relapse stages of pediatric AML. Our findings revealed that specific functional expression programs correlated with fluctuations in various T cell subsets, which may be associated with AML progression and relapse. Furthermore, our analysis of cellular communication networks led to the identification of VISTA, CD244, and TIM3 as potential immunotherapeutic targets in pediatric AML. Finally, we detected elevated proportions of γδ T cells and associated functional genes in samples from pediatric patients diagnosed with B-ALL and AML, which could inform the development of novel therapeutic approaches, potentially focusing on γδ T cells.
0

Comprehensive mapping of mammalian transcriptomes identifies conserved genes associated with different cell differentiation states

Yang Yang et al.Jul 15, 2015
Cell identity (or cell state) is established via gene expression programs, represented by ???associated genes??? with dynamic expression across cell identities. Here we integrate RNA-seq data from 40 tissues and cell types from human, chimpanzee, bonobo, and mouse to investigate the conservation and differentiation of cell states. We employ a statistical tool, ???Transcriptome Overlap Measure??? (TROM) to first identify cell-state-associated genes, both protein-coding and non-coding. Next, we use TROM to comprehensively map the cell states within each species and also between species based on the cell-state-associated genes. The within-species mapping measures which cell states are similar to each other, allowing us to construct a human cell differentiation tree that recovers both known and novel lineage relationships between cell states. Moreover, the between-species mapping summarizes the conservation of cell states across the four species. Based on these results, we identify conserved associated genes for different cell states and annotate their biological functions. Interestingly, we find that neural and testis tissues exhibit distinct evolutionary signatures in which neural tissues are much less enriched in conserved associated genes than testis. In addition, our mapping demonstrate that besides protein-coding genes, long non-coding RNAs serve well as associated genes to indicate cell states. We further infer the biological functions of those non-coding associated genes based on their co-expressed protein-coding associated genes. Overall, we provide a catalog of conserved and species-specific associated genes that identifies candidates for downstream experimental studies of the roles of these candidates in controlling cell identity.
0

Recurrently deregulated lncRNAs associated with HCC tumorigenesis and metastasis revealed by genomic, epigenomic and transcriptomic profiling in paired primary tumor and PVTT samples

Yang� Yang et al.Apr 26, 2016
Hepatocellular carcinoma (HCC) are highly potent to invade the portal venous system and subsequently develop into the portal vein tumor thrombosis (PVTT). PVTT could induce intra-hepatic metastasis, which is closely associated with poor prognosis. A comprehensive systematic characterization of long noncoding RNAs (lncRNAs) associated with HCC metastasis has not been reported. Here, we first assayed 60 clinical samples (matched primary tumor, adjacent normal tissue, and PVTT) from 20 HCC patients using total RNA sequencing. We identified and characterized 8,603 novel lncRNAs from 9.6 billion sequenced reads, indicating specific expression of these lncRNAs in our samples. On the other hand, the expression patterns of 3,212 known and novel recurrently deregulated lncRNAs (in >=20% of our patients) were well correlated with clinical data in a TCGA cohort and published liver cancer data. Some lncRNAs (e.g., RP11-166D19.1/MIR100HG) were shown to be useful as putative biomarkers for prognosis and metastasis. Moreover, matched array data from 60 samples showed that copy number variations (CNVs) and alterations in DNA methylation contributed to the observed recurrent deregulation of 716 lncRNAs. Subsequently, using a coding-noncoding co-expression network, we found that many recurrently deregulated lncRNAs were enriched in clusters of genes related to cell adhesion, immune response, and metabolic processes. Candidate lncRNAs related to metastasis, such as HAND2-AS1, were further validated using RNAi-based loss-of-function assays. The results of our integrative analysis provide a valuable resource regarding functional lncRNAs and novel biomarkers associated with HCC tumorigenesis and metastasis.