ZL
Zhi Lu
Author with expertise in Role of Long Noncoding RNAs in Cancer and Development
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
17
(82% Open Access)
Cited by:
2,721
h-index:
37
/
i10-index:
55
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Comparative analysis of the transcriptome across distant species

Mark Gerstein et al.Aug 26, 2014
Uniform processing and detailed annotation of human, worm and fly RNA-sequencing data reveal ancient, conserved features of the transcriptome, shared co-expression modules (many enriched in developmental genes), matched expression patterns across development and similar extent of non-canonical, non-coding transcription; furthermore, the data are used to create a single, universal model to predict gene-expression levels for all three organisms from chromatin features at the promoter. In this paper the modENCODE consortium reports on a comparative analysis of transcriptome data for human, worm and fly, revealing ancient, conserved features such as shared co-expression modules enriched in developmental genes. Expression patterns are used to align the stages in worm and fly development. Gene expression levels, both coding and non-coding, in all three organisms can be quantitatively predicted from chromatin features at the promoter using a model based on a single set of organism-independent parameters. The transcriptome is the readout of the genome. Identifying common features in it across distant species can reveal fundamental principles. To this end, the ENCODE and modENCODE consortia have generated large amounts of matched RNA-sequencing data for human, worm and fly. Uniform processing and comprehensive annotation of these data allow comparison across metazoan phyla, extending beyond earlier within-phylum transcriptome comparisons and revealing ancient, conserved features1,2,3,4,5,6. Specifically, we discover co-expression modules shared across animals, many of which are enriched in developmental genes. Moreover, we use expression patterns to align the stages in worm and fly development and find a novel pairing between worm embryo and fly pupae, in addition to the embryo-to-embryo and larvae-to-larvae pairings. Furthermore, we find that the extent of non-canonical, non-coding transcription is similar in each organism, per base pair. Finally, we find in all three organisms that the gene-expression levels, both coding and non-coding, can be quantitatively predicted from chromatin features at the promoter using a ‘universal model’ based on a single set of organism-independent parameters.
0
Citation298
0
Save
0

Characterization of stress‐responsive lncRNAs in Arabidopsis thaliana by integrating expression, epigenetic and structural features

Chao Di et al.Sep 26, 2014
Summary Recently, in addition to poly(A)+ long non‐coding RNA s (lnc RNA s), many lnc RNA s without poly(A) tails, have been characterized in mammals. However, the non‐polyA lnc RNA s and their conserved motifs, especially those associated with environmental stresses, have not been fully investigated in plant genomes. We performed poly(A)− RNA ‐seq for seedlings of A rabidopsis thaliana under four stress conditions, and predicted lnc RNA transcripts. We classified the lnc RNA s into three confidence levels according to their expression patterns, epigenetic signatures and RNA secondary structures. Then, we further classified the lnc RNA s to poly(A)+ and poly(A)− transcripts. Compared with poly(A)+ lncRNAs and coding genes, we found that poly(A)− lncRNAs tend to have shorter transcripts and lower expression levels, and they show significant expression specificity in response to stresses. In addition, their differential expression is significantly enriched in drought condition and depleted in heat condition. Overall, we identified 245 poly(A)+ and 58 poly(A)− lnc RNA s that are differentially expressed under various stress stimuli. The differential expression was validated by q RT ‐ PCR , and the signaling pathways involved were supported by specific binding of transcription factors ( TF s), phytochrome‐interacting factor 4 ( PIF 4) and PIF 5. Moreover, we found many conserved sequence and structural motifs of lnc RNA s from different functional groups (e.g. a UUC motif responding to salt and a AU‐rich stem‐loop responding to cold), indicated that the conserved elements might be responsible for the stress‐responsive functions of lnc RNA s.
0
Citation275
0
Save
0

Diverse transcription factor binding features revealed by genome-wide ChIP-seq in C. elegans

Wei Niu et al.Dec 22, 2010
Regulation of gene expression by sequence-specific transcription factors is central to developmental programs and depends on the binding of transcription factors with target sites in the genome. To date, most such analyses in Caenorhabditis elegans have focused on the interactions between a single transcription factor with one or a few select target genes. As part of the modENCODE Consortium, we have used chromatin immunoprecipitation coupled with high-throughput DNA sequencing (ChIP-seq) to determine the genome-wide binding sites of 22 transcription factors (ALR-1, BLMP-1, CEH-14, CEH-30, EGL-27, EGL-5, ELT-3, EOR-1, GEI-11, HLH-1, LIN-11, LIN-13, LIN-15B, LIN-39, MAB-5, MDL-1, MEP-1, PES-1, PHA-4, PQM-1, SKN-1, and UNC-130) at diverse developmental stages. For each factor we determined candidate gene targets, both coding and non-coding. The typical binding sites of almost all factors are within a few hundred nucleotides of the transcript start site. Most factors target a mixture of coding and non-coding target genes, although one factor preferentially binds to non-coding RNA genes. We built a regulatory network among the 22 factors to determine their functional relationships to each other and found that some factors appear to act preferentially as regulators and others as target genes. Examination of the binding targets of three related HOX factors--LIN-39, MAB-5, and EGL-5--indicates that these factors regulate genes involved in cellular migration, neuronal function, and vulval differentiation, consistent with their known roles in these developmental processes. Ultimately, the comprehensive mapping of transcription factor binding sites will identify features of transcriptional networks that regulate C. elegans developmental processes.
0
Citation223
0
Save
0

Integrative genomic analysis of early neurogenesis reveals a temporal genetic program for differentiation and specification of preplate and Cajal-Retzius neurons

Jia Li et al.May 29, 2018
Abstract Neurogenesis in the developing neocortex begins with the generation of the preplate, which consists of early born neurons including Cajal-Retzius (CR) cells and subplate neurons. Here, utilizing the Ebf2-EGFP transgenic mouse in which EGFP initially labels the preplate neurons then persists in CR cells, we reveal the dynamic transcriptome profiles of early neurogenesis and CR cell differentiation. At E15.5 when Ebf2-EGFP+ cells are mostly CR neurons, single-cell sequencing analysis of purified Ebf2-EGFP+ cells uncovers molecular heterogeneity in CR neurons, but without apparent clustering of cells with distinct regional origins. Along a pseudotemporal trajectory these cells are classified into three different developing states, revealing genetic cascades from early generic neuronal differentiation to late fate specification during the establishment of CR neuron identity and function. Further genome-wide RNA-seq and ChIP-seq analyses at multiple early neurogenic stages have revealed the temporal gene expression dynamics of early neurogenesis and distinct histone modification patterns in early differentiating neurons. We have also identified a new set of coding genes and lncRNAs involved in early neuronal differentiation and validated with functional assays In Vitro and In Vivo . Our findings shed light on the molecular mechanisms governing the early differentiation steps during cortical development, especially CR neuron biology, and help understand the developmental basis for cortical function and diseases.
0
Citation3
0
Save
0

Selective translation by alternative bacterial ribosomes

Yuxiang Chen et al.Apr 11, 2019
Abstract Alternative ribosome subunit proteins are prevalent in the genomes of diverse bacterial species but their functional significance is controversial. Attempts to study microbial ribosomal heterogeneity have mostly relied on comparing wild-type strains with mutants in which subunits have been deleted, but this approach does not allow direct comparison of alternate ribosome isoforms isolated from identical cellular contexts. Here, by simultaneously purifying canonical and alternative RpsR ribosomes from Mycobacterium smegmatis , we show that alternative ribosomes have distinct translational features compared with their canonical counterparts. Both alternative and canonical ribosomes actively take part in gene translation, although they translate a subset of genes with differential efficiency as measured by ribosome profiling. We also show that alternative ribosomes have a relative defect in initiation complex formation. Our work convincingly confirms the distinct and non-redundant contribution of alternative bacterial ribosomes for adaptation to hostile environments. Significance Statement Many organisms, including most bacteria code for multiple paralogues of some ribosomal protein subunits. The relative contribution of these alternative subunits to ribosome function and gene translation is unknown and controversial. Furthermore, many studies on alternative ribosomes have been confounded by isolation of alternative and canonical ribosomes from different strains and/ or different growth conditions, potentially confounding results. Here, we show unequivocally that one form of alternative ribosome from Mycobacterium smegmatis actively engages in gene translation, but its translational profile from an identical cellular context is subtly different from canonical ribosomes. Given the prevalence of alternative ribosomal genes in diverse organisms, our study suggests that alternative ribosomes may represent a further layer of regulation of gene translation.
0
Citation2
0
Save
0

RNA-ligand interaction scoring via data perturbation and augmentation modeling

Hongli Ma et al.Jun 29, 2024
RNA-targeting drug discovery is undergoing an unprecedented revolution. Despite recent advances in this field, developing data-driven deep learning models remains challenging due to the limited availability of validated RNA-small molecule interactions and the scarcity of known RNA structures. In this context, we introduce RNAsmol, a novel sequence-based deep learning framework that incorporates data perturbation with augmentation, graph-based molecular feature representation and attention-based feature fusion modules to predict RNA-small molecule interactions. RNAsmol employs perturbation strategies to balance the bias between true negative and unknown interaction space thereby elucidating the intrinsic binding patterns between RNA and small molecules. The resulting model demonstrates accurate predictions of the binding between RNA and small molecules, outperforming other methods with average improvements of ~8% (AUROC) in 10-fold cross-validation, ~16% (AUROC) in cold evaluation (on unseen datasets), and ~30% (ranking score) in decoy evaluation. Moreover, we use case studies to validate molecular binding hotspots in the prediction of RNAsmol, proving the model's interpretability. In particular, we demonstrate that RNAsmol, without requiring structural input, can generate reliable predictions and be adapted to many RNA-targeting drug design scenarios.
Load More