JT
Jimin Tan
Author with expertise in Regulation of Chromatin Structure and Function
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
5
(40% Open Access)
Cited by:
7
h-index:
10
/
i10-index:
10
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

GET: a foundation model of transcription across human cell types

Xi Fu et al.Jan 1, 2023
Transcriptional regulation, involving the complex interplay between regulatory sequences and proteins, directs all biological processes. Computational models of transcriptions lack generalizability to accurately extrapolate in unseen cell types and conditions. Here, we introduce GET, an interpretable foundation model, designed to uncover regulatory grammars across 213 human fetal and adult cell types. Relying exclusively on chromatin accessibility data and sequence information, GET achieves experimental-level accuracy in predicting gene expression even in previously unseen cell types. GET showcases remarkable adaptability across new sequencing platforms and assays, enabling regulatory inference across a broad range of cell types and conditions, and uncovering universal and cell type specific transcription factor interaction networks. We evaluated its performance on prediction of regulatory activity, inference of regulatory elements and regulators, and identification of physical interactions between transcription factors. Specifically, we show GET outperforms current models in predicting lentivirus-based massive parallel reporter assay readout with reduced input data. In Fetal erythroblast, we identify distal (>1Mbp) regulatory regions that were missed by previous models. In B cell, we identified a lymphocyte-specific transcription factor-transcription factor interaction that explains the functional significance of a lymphoma-risk predisposing germline mutation. In sum, we provide a generalizable and accurate model for transcription together with catalogs of gene regulation and transcription factor interactions, all with cell type specificity. A demo of GET can be viewed at https://huggingface.co/spaces/get-foundation/getdemo.
0

Characterization of tumor heterogeneity through segmentation-free representation learning

Jimin Tan et al.Sep 6, 2024
The interaction between tumors and their microenvironment is complex and heterogeneous. Recent developments in high-dimensional multiplexed imaging have revealed the spatial organization of tumor tissues at the molecular level. However, the discovery and thorough characterization of the tumor microenvironment (TME) remains challenging due to the scale and complexity of the images. Here, we propose a self-supervised representation learning framework, CANVAS, that enables discovery of novel types of TMEs. CANVAS is a vision transformer that directly takes high-dimensional multiplexed images and is trained using self-supervised masked image modeling. In contrast to traditional spatial analysis approaches which rely on cell segmentations, CANVAS is segmentation-free, utilizes pixel-level information, and retains local morphology and biomarker distribution information. This approach allows the model to distinguish subtle morphological differences, leading to precise separation and characterization of distinct TME signatures. We applied CANVAS to a lung tumor dataset and identified and validated a monocytic signature that is associated with poor prognosis.
0

PCV2 aggravated SS2 infection directly showed from differentially expressed proteome of PK15 cells.

Jimin Tan et al.Feb 26, 2020
PCV2 and SS2 were clinically two major pathogens in pigs and they were zoonotic pathogens. There was extensive cellular tropism for both PCV2 and SS2, as well as, PK15 cells was PCV2 infection mainly cell model. It was found that when PCV2 infected PK15 cells before at the MOI=0.1, SS2 could cause more damage to PK15 cells. ITRAQ labeling proteomic technology was used to explore the differentially expressed proteome of PCV2 and SS2 single infection and co-infection in PK15 cells. The results showed that there were total 4736 proteins distinct changed in this infection models for PK15 cells. PCV2 aggravated SS2 infection were showed directly in the big amount of differentially expressed proteins like AGO3, OSBPL1A, ALB, RIC8A, UBL4A, INTS5 and so on. For the KEGG pathway analysis, it indicated that PCV2 mainly induced the proteins lessen though a series of disease pathway like metabolic pathways, huntingtons disease, insulin signaling pathways, long-term depression, etc. to make cell at a state of compensation. PCV2 before infection made the cells was on the chopping block. Contemporary, SS2 induced the proteins of PK15 rapidly changing, including pathways like spliceosome, endoplasmic reticulum, tight junction, actin cytoskeleton and some involved in parasitic infections pathways like ECM-receptor interaction, Leishmaniasis, Toxoplasmosis and so on. Simultaneously, PCV2 and SS2 existed common ground that they influence PK15 cell by some virulence factor interacted with cytomembrane, influenced the function of ribosome and tRNA. The role of SS2 in the co-infection like a cook chopper. KEYWORDS: PCV2, SS2, iTRAQ, co-infection, proteomics, pathways
0

A foundation model of transcription across human cell types

Xi Fu et al.Jan 8, 2025
Transcriptional regulation, which involves a complex interplay between regulatory sequences and proteins, directs all biological processes. Computational models of transcription lack generalizability to accurately extrapolate to unseen cell types and conditions. Here we introduce GET (general expression transformer), an interpretable foundation model designed to uncover regulatory grammars across 213 human fetal and adult cell types1,2. Relying exclusively on chromatin accessibility data and sequence information, GET achieves experimental-level accuracy in predicting gene expression even in previously unseen cell types3. GET also shows remarkable adaptability across new sequencing platforms and assays, enabling regulatory inference across a broad range of cell types and conditions, and uncovers universal and cell-type-specific transcription factor interaction networks. We evaluated its performance in prediction of regulatory activity, inference of regulatory elements and regulators, and identification of physical interactions between transcription factors and found that it outperforms current models4 in predicting lentivirus-based massively parallel reporter assay readout5,6. In fetal erythroblasts7, we identified distal (greater than 1 Mbp) regulatory regions that were missed by previous models, and, in B cells, we identified a lymphocyte-specific transcription factor–transcription factor interaction that explains the functional significance of a leukaemia risk predisposing germline mutation8–10. In sum, we provide a generalizable and accurate model for transcription together with catalogues of gene regulation and transcription factor interactions, all with cell type specificity. A foundation model learns transcriptional regulatory syntax from chromatin accessibility and sequence data across a range of cell types to predict gene expression and transcription factor interactions, with generalizability to unseen cell types.