JL
Jingyi Li
Author with expertise in Microarray Data Analysis and Gene Expression Profiling
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
14
(79% Open Access)
Cited by:
119
h-index:
60
/
i10-index:
384
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
11

Define and visualize pathological architectures of human tissues from spatially resolved transcriptomics using deep learning

Yuzhou Chang et al.Jul 9, 2021
Abstract Spatially resolved transcriptomics provides a new way to define spatial contexts and understand biological functions in complex diseases. Although some computational frameworks can characterize spatial context via various clustering methods, the detailed spatial architectures and functional zonation often cannot be revealed and localized due to the limited capacities of associating spatial information. We present RESEPT, a deep-learning framework for characterizing and visualizing tissue architecture from spatially resolved transcriptomics. Given inputs as gene expression or RNA velocity, RESEPT learns a three-dimensional embedding with a spatial retained graph neural network from the spatial transcriptomics. The embedding is then visualized by mapping as color channels in an RGB image and segmented with a supervised convolutional neural network model. Based on a benchmark of sixteen 10x Genomics Visium spatial transcriptomics datasets on the human cortex, RESEPT infers and visualizes the tissue architecture accurately. It is noteworthy that, for the in-house AD samples, RESEPT can localize cortex layers and cell types based on a pre-defined region-or cell-type-specific genes and furthermore provide critical insights into the identification of amyloid-beta plaques in Alzheimer’s disease. Interestingly, in a glioblastoma sample analysis, RESEPT distinguishes tumor-enriched, non-tumor, and regions of neuropil with infiltrating tumor cells in support of clinical and prognostic cancer applications.
1

A novel framework for single-cell Hi-C clustering based on graph-convolution-based imputation and two-phase-based feature extraction

Caiwei Zhen et al.May 1, 2021
ABSTRACT The three-dimensional genome structure plays a key role in cellular function and gene regulation. Singlecell Hi-C technology can capture genome structure information at the cell level, which provides the opportunity to study how genome structure varies among different cell types. However, few methods are well designed for single-cell Hi-C clustering, because of high sparsity, noise and heterogeneity of single-cell Hi-C data. In this manuscript, we propose a novel framework, named ScHiC-Rep, for singlecell Hi-C data representation and clustering. ScHiC-Rep mainly contains two parts: data imputation and feature extraction. In the imputation part, a novel imputation workflow is proposed, including graph convolution-based, random walk with restart-based and genomic neighbor-based imputation. In the feature extraction part, a two-phase feature extraction method is proposed, including linear phase for chromosome level and non-linear phase for cell level feature extraction. The evaluation results show that the proposed framework outperforms existing state-of-the-art approaches on both human and mouse datasets.
0

An exact transformation for CNN kernel enables accurate sequence motif identification and leads to a potentially full probabilistic interpretation of CNN

Yang Ding et al.Jul 13, 2017
Abstract Motivation Convolutional neural network (CNN) has been widely used in functional motifs identification for large-scale DNA/RNA sequences. Currently, however, the only way to interpret such a convolutional kernel is a heuristic construction of a position weight matrix (PWM) from fragments scored highly by that kernel. Results Instead of using heuristics, we developed a novel, exact kernel-to-PWM transformation whose equivalency is theoretically proven: the log-likelihood of the resulting PWM generating any DNA/RNA sequence is exactly the sum of a constant and the convolution of the original kernel on the same sequence. Importantly, we further proved that the resulting PWM’s performance on sequence classification/regression can be exactly the same as the original kernel’s under popular CNN frame-works. In simulation, the exact transformation rivals or outperforms the heuristic PWMs in terms of classifying sequences with sequence- or structure-motifs. The exact transformation also faithfully reproduces the output of CNN models on real-world cases, while the heuristic one fails, especially on the case with little prior knowledge on the form of underlying true motifs. Of note, the time complexity of the novel exact transformation is independent on the number of input sequences, enabling it to scale well for massive training sequences. Availability Python scripts for the transformation from kernel to PWM, the inverted transformation from PWM to kernel, and a proof-of-concept for the maximum likelihood estimation of optimal PWM are available through https://github.com/gao-lab/kernel-to-PWM . Contact gaog@mail.cbi.pku.edu.cn
8

Duck pan-genome reveals two transposon-derived structural variations caused bodyweight enlarging and white plumage phenotype formation during evolution

Kejun Wang et al.Jan 30, 2023
ABSTRACT Structural variations (SVs) are a major source of domestication and improvement traits, however SV profiles of duck and their phenotypic impacts largely hidden. We present the first duck pan-genome constructed using five genome assemblies capturing ∼40.98 Mb new sequences. This pan-genome together with high-depth sequencing data (∼46.5X) identified 101,041 SVs, of which substantial proportions were derived from transposable element (TE) activity. Many TE-derived SVs anchoring in a gene body or regulatory region are linked to duck’s domestication and improvement. By combining quantitative genetics with molecular experiments, we dissect how TE-derived SVs change gene expression of IGF2BP1 and generate a novel transcript of MITF , shaping bodyweight and white plumage. In the IGF2BP1 locus, the TE-derived SV explains the largest effect on bodyweight among avian species (27.61% of phenotypic variation). Our findings highlight the importance of using a pan-genome as a reference in genomics studies and explore the roles of TE-derived SVs in trait formation and in livestock breeding.
8
Citation3
0
Save
4

Single cell Transcriptome and T cell Repertoire Mapping of the Mechanistic Signatures and T cell Trajectories Contributing to Vascular and Dermal Manifestations of Behcet’s Disease

Ling Chang et al.Mar 23, 2022
Abstract Behcet’s disease (BD) is a form of vasculitis characterized by complex multi-organ manifestations that may frequently recur and induce major tissue damage. Although genetic association studies have identified a number of risk factors, the etiology of BD and its tissue manifestations remains unknown, and the landscape of immune responses in BD is opaque, particularly in terms of inflammatory recurrence. In this study, we mapped the transcriptomes of the immune cell compartment in BD at single-cell resolution, sampling both circulation and affected skin in order to chart the immune interplay driving pathogenesis. Through comprehensive expression and communication analysis of the twenty major cell types identified, we observe striking mechanistic differences in immune response between BD skin lesions and peripheral circulation involving TNF signaling and T cell migration. Through integrated TCR sequencing, we further discover a pattern of clonal sharing between circulating and skin CD8+T cell populations along a trajectory defined by the acquisition of tissue-residential properties. In addition, we also identify a population of expanded CD4+ Tregs with the propensity to produce IL-32. Instead of suppressing effector T cell proliferation and function, IL-32 triggers increased expression of CD97, and may thus encourage prolonged local T cell activity in the skin. Collectively, our data serve to advance understandings of contributions of varying immune cell types to BD pathogenesis in the vasculature and skin, as well as the lifecycle patterns of T cells clones in this context. These data may also assist in further investigations of the mechanisms contributing to Treg dysfunction in systemic autoimmunity, while generating a conceptual model of T cell function contributing to BD recurrence.
4
Citation2
0
Save
7

TIPS: Trajectory Inference of Pathway Significance through Pseudotime Comparison for Functional Assessment of single-cell RNAseq Data

Zihan Zheng et al.Dec 19, 2020
Recent advances in bioinformatics analyses have led to the development of novel tools enabling the capture and trajectory mapping of single-cell RNA sequencing (scRNAseq) data. However, there is a lack of methods to assess the contributions of biological pathways and transcription factors to an overall developmental trajectory mapped from scRNAseq data. In this manuscript, we present a simplified approach for trajectory inference of pathway significance (TIPS) that leverages existing knowledgebases of functional pathways and transcription factor targets to enable further mechanistic insights into a biological process. TIPS returns both the key pathways whose changes are associated with the process of interest, as well as the individual genes that best reflect these changes. TIPS also provides insight into the relative timing of pathway changes, as well as a suite of visualizations to enable simplified data interpretation of scRNAseq libraries generated using a wide range of techniques. The TIPS package can be run through either a web server, or downloaded as a user-friendly GUI run in R, and may serve as a useful tool to help biologists perform deeper functional analyses and visualization of their single-cell and/or large cohort RNAseq data.
7
Citation1
0
Save
9

Markonv: a novel convolutional layer with inter-positional correlations modeled

Jingyi Li et al.Jun 13, 2022
Abstract Deep neural networks equipped with convolutional neural layers have been widely used in omics data analysis. Though highly efficient in data-oriented feature detection, the classical convolutional layer is designed with inter-positional independent filters, hardly modeling inter-positional correlations in various biological data. Here, we proposed Markonv layer (Markov convolutional neural layer), a novel convolutional neural layer with Markov transition matrices as its filters, to model the intrinsic dependence in inputs as Markov processes. Extensive evaluations based on both synthetic and real-world data showed that Markonv-based networks could not only identify functional motifs with inter-positional correlations in large-scale omics sequence data effectively, but also decode complex electrical signals generated by Oxford Nanopore sequencing efficiently. Designed as a drop-in replacement of the classical convolutional layer, Markonv layers enable an effective and efficient identification for inter-positional correlations from various biological data of different modalities. All source codes of a PyTorch-based implementation are publicly available on GitHub for academic usage.
1

Analysis of clinical manifestations and risk factors of HIV-1 associated thrombocytopenia in a general teaching hospital in western China

Zhuoyun Tang et al.Nov 10, 2022
Abstract Background Thrombocytopenia is one of the hematologic disorders that frequently accompany HIV-1 infection. The interaction of HIV-1 and platelets is crucial in the Blood-Brain Barrier’s (BBB) degeneration and causes neuroinflammation. The research aims to evaluate the prevalence and risk factors for HAT (HIV-1 associated thrombocytopenia) and summary the features of HAT-related neuroinflammation. Method A retrospective study including 221 HAT patients was conducted in West China Hospital from 2017 to 2021. Clinical and laboratory data was analyzed the prevalence and risk factors for HAT and HAT-related neuroinflammation. Results The prevalence of HAT was 11.06% and most patients were men (76.92%), elderly (≥50, 55.21%) and 63.80% patients were mild thrombocytopenia. CD4 + T cell count, platelet crit (PCT) and the rate of large platelets (P-LCR) were significantly different between HAT group and control group ( P < 0.001, P 0.001, P =0.002). CD4 + T cell count <200 cell/μL ( P =0.001) was an important risk factor in the occurrence of HAT while advanced age and high viral load were closely related to the occurrence of HAT. HAT-related neuroinflammation patients were mostly distributed in male ( X 2 =10.066, P =0.007), with higher viral load ( X 2 =12.297, P =0.006) and advanced age ( X 2 =11.721, P =0.02) with neuropsychiatric symptoms and rising level of inflammatory factors like IL-6 and proteins in CSF. Conclusion HAT and HAT with neuroinflammation cannot be ignored in HIV-1 infection because of the activation of monocytes, macrophages and microglia, further causing thrombocytopenia and neuroinflammation. Advanced age, lower CD4 + T cell count and high viral load were closely related to the occurrence of HAT and HAT-related neuroinflammation.
Load More