YK
Yusuke Koga
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
8
(75% Open Access)
Cited by:
502
h-index:
12
/
i10-index:
14
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
4

Whole genome doubling confers unique genetic vulnerabilities on tumor cells

Ryan Quinton et al.Jun 19, 2020
Summary Whole genome doubling (WGD) occurs early in tumorigenesis and generates genetically unstable tetraploid cells that fuel tumor development. Cells that undergo WGD (WGD + ) must adapt to accommodate their abnormal tetraploid state; however, the nature of these adaptations, and whether they confer vulnerabilities that can subsequently be exploited therapeutically, is unclear. Using sequencing data from ∼10,000 primary human cancer samples and essentiality data from ∼600 cancer cell lines, we show that WGD gives rise to common genetic traits that are accompanied by unique vulnerabilities. We reveal that WGD + cells are more dependent on spindle assembly checkpoint signaling, DNA replication factors, and proteasome function than WGD − cells. We also identify KIF18A , which encodes for a mitotic kinesin, as being specifically required for the viability of WGD + cells. While loss of KIF18A is largely dispensable for accurate chromosome segregation during mitosis in WGD − cells, its loss induces dramatic mitotic errors in WGD + cells, ultimately impairing cell viability. Collectively, our results reveal new strategies to specifically target WGD + cancer cells while sparing the normal, non-transformed WGD − cells that comprise human tissue.
4
Citation7
0
Save
9

Celda: A Bayesian model to perform co-clustering of genes into modules and cells into subpopulations using single-cell RNA-seq data

Zhe Wang et al.Nov 17, 2020
Abstract Single-cell RNA-seq (scRNA-seq) has emerged as a powerful technique to quantify gene expression in individual cells and elucidate the molecular and cellular building blocks of complex tissues. We developed a novel Bayesian hierarchical model called Cellular Latent Dirichlet Allocation (Celda) to perform simultaneous co-clustering of genes into transcriptional modules and cells into subpopulations. Celda can quantify the probabilistic contribution of each gene to each module, each module to each cell population, and each cell population to each sample. We used Celda to identify transcriptional modules and cell subpopulations in a publicly available peripheral blood mononuclear cell (PBMC) dataset. Celda identified a population of proliferating T cells and a single plasma cell which were missed by two other clustering methods. Celda identified transcriptional modules that highlighted unique and shared biological programs across cell types. Celda also outperformed a PCA-based approach for gene clustering on simulated data. Overall, Celda presents a novel statistically principled approach towards characterizing transcriptional programs and cellular heterogeneity in single-cell RNA-seq data.
9
Citation7
0
Save
10

Interactive analysis of single-cell data using flexible workflows with SCTK2.0

Yichen Wang et al.Jul 14, 2022
Summary Analysis of single-cell RNA-seq (scRNA-seq) data can reveal novel insights into heterogeneity of complex biological systems. Many tools and workflows have been developed to perform different types of analysis. However, these tools are spread across different packages or programming environments, rely on different underlying data structures, and can only be utilized by people with knowledge of programming languages. In the Single Cell Toolkit 2.0 (SCTK2.0), we have integrated a variety of popular tools and workflows to perform various aspects of scRNA-seq analysis. All tools and workflows can be run in the R console or using an intuitive graphical user interface built with R/Shiny. HTML reports generated with Rmarkdown can be used to document and recapitulate individual steps or entire analysis workflows. We show that the toolkit offers more features when compared with existing tools and allows for a seamless analysis of scRNA-seq data for non-computational users. Graphical Abstract Highlights Intuitive graphical user interface for interactive analysis of scRNA-seq data Allows non-computational users to analyze scRNA-seq data with end-to-end workflows Provides interoperability between tools across different programming environments Produces HTML reports for reproducibility and easy sharing of results
18

Comprehensive generation, visualization, and reporting of quality control metrics for single-cell RNA sequencing data

Rui Hong et al.Nov 17, 2020
Abstract Single-cell RNA sequencing (scRNA-seq) can be used to gain insights into cellular heterogeneity within complex tissues. However, a variety of technical artifacts can be present in scRNA-seq data and need to be assessed before downstream analyses can be performed. While several algorithms and tools have been developed to perform individual quality control (QC) tasks, they are scattered in different packages across several programming environments. Comprehensive pipelines to streamline the process of generating and visualizing QC metrics are lacking. To address this need, we built the SCTK-QC pipeline within the singleCellTK R package ( https://github.com/compbiomed/singleCellTK ). Features in this pipeline include the ability to import data from 11 different preprocessing tools or file formats, perform empty droplet detection with 2 different algorithms, generate standard quality control metrics such as number of UMIs per cell or the percentage of mitochondrial counts, predict doublets using 6 different algorithms, and estimate ambient RNA. QC data can be exported to R and/or Python objects used in popular down-stream workflows. Results are visualized in an easy-to-read HTML report. This pipeline can also be used by non-computational users with an interactive graphical user interface developed with R/Shiny. Overall, the SCTK-QC pipeline will streamline and standardize QC analysis for scRNA-seq data across a variety of different single-cell transcriptomic platforms and preprocessing tools.