KA
Kayoko Abe
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
8
(38% Open Access)
Cited by:
7
h-index:
14
/
i10-index:
20
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
13

scMM: Mixture-of-experts multimodal deep generative model for single-cell multiomics data analysis

Kodai Minoura et al.Feb 19, 2021
A bstract The recent development in single-cell multiomics analysis has enabled simultaneous detection of multiple traits at the single-cell level, thus providing deeper insights into the cellular phenotypes and functions in diverse tissues. However, currently, it is challenging to infer the joint representations and learn relationships among multiple modalities from complex multimodal single-cell data. Herein, we present scMM, a novel deep generative model-based framework for the extraction of interpretable joint representations and cross-modal generation. scMM addresses the complexity of data by leveraging a mixture-of-experts multimodal variational autoencoder. The pseudocell generation strategy of scMM compensates for the limited interpretability of deep learning models and discovered multimodal regulatory programs associated with latent dimensions. Analysis of recently produced datasets validated that scMM facilitates high-resolution clustering with rich interpretability. Furthermore, we show that cross-modal generation by scMM leads to more precise prediction and data integration compared with the state-of-the-art and conventional approaches.
0

Survivability and Life Support in Sealed Mini-Ecosystems with Simulated Planetary Soils

Tsubasa Sato et al.Jan 1, 2023
Establishing a sustainable life-support system for space exploration is challenging due to the vast distances, costs, and differing environments from Earth. Using insights from the Biosphere 2 experiment, we introduced the "Ecosphere" and "Biosealed" systems in custom containers to replicate Earth9s ecosystems, suggesting feasible space migration through transplanting Earth-like biomes. Over four years, we gained deeper insights into these enclosed ecosystems. Moisture deficiency was a major obstacle to plant growth, which we addressed by incorporating a groundwater layer in the containers. We underscored the critical role of microorganisms in building and sustaining these ecosystems. However, temperature spikes from sunlight threatened stability. Our experiments confirmed fruit flies9 survival on plant-produced oxygen and photosynthetic bacteria. Interactions between plants, microbes, and simulated space soils were examined. Detailed analysis unveiled diverse microbes shaping both confined and simulated space environments. Major findings include the symbiotic relationship of plants with cyanobacteria, the potential of LED lighting in sun-limited missions, and challenges with ethylene gas and moisture. Microbial integration in rough soils holds promise for seed germination, but understanding their role in space soils is crucial. Our research offers a comprehensive foundation for future space life-support systems and underlines potential concerns about microbes affecting human health.
0
0
Save
0

A deep generative model for estimating single-cell RNA splicing and degradation rates

Chikara Mizukoshi et al.Nov 26, 2023
A bstract Messenger RNA splicing and degradation kinetics contribute to gene expression regulation, abnormality of which is closely associated with the development of various diseases. The RNA velocity theory achieves optimization of the kinetic rates by applying splicing mathematical models to single-cell transcriptome data; however, most previous methods assumed a single value for all cells. Here, we introduce DeepKINET, a novel method for estimating splicing and degradation rates at single-cell resolution, using a deep generative model framework. DeepKINET assumes a single-cell transcriptome generation process based on a mathematical splicing model and latent cellular state-dependent kinetic rates. Using these assumptions and optimizing real scRNA-seq data, DeepKINET achieved a single-cell kinetic rate estimation. We first validated the accuracy of the estimated rates using a simulated dataset and a metabolic labeling dataset and confirmed the superiority of our method over an existing method. We further applied DeepKINET to forebrain and breast cancer datasets to extract RNA-binding proteins responsible for the diversity of splicing and degradation rates and to identify genes showing significant changes in kinetic rates across cell populations. Our results indicated that DeepKINET is an effective method for revealing cellular heterogeneity in post-transcriptional regulation and the molecular mechanisms that produce heterogeneity.
0

A Latent Allocation Model for the Analysis of Microbial Composition and Disease

Kayoko Abe et al.Aug 21, 2018
Background: Establishing the relationship between microbiota and specific disease is important but requires appropriate statistical methodology. A specialized feature of microbiome count data is the presence of a large number of zeros, which makes it difficult to analyze in case-control studies. Most existing approaches either add a small number called a pseudo-count or use probability models such as the multinomial and Dirichlet-multinomial distributions to explain the excess zero counts, which may produce unnecessary biases and impose a correlation structure that is unsuitable for microbiome data. Results: The purpose of this article is to develop a new probabilistic model, called BERMUDA (BERnoulli and MUltinomial Distribution-based latent Allocation), to address these problems. BERMUDA enables us to describe the differences in bacteria composition and a certain disease among samples. We also provide a simple and efficient learning procedure for the proposed model using an annealing EM algorithm. Conclusion: We illustrate the performance of the proposed method both through both the simulation and real data analysis. BERMUDA is implemented with R and is available from GitHub (https://github.com/abikoushi/Bermuda).
0

Model-based cell clustering and population tracking for time-series flow cytometry data

Kodai Minoura et al.Jul 2, 2019
Motivation Modern flow cytometry technology has enabled the simultaneous analysis of multiple cell markers at the single-cell level, and it is widely used in a broad field of research. The detection of cell populations in flow cytometry data has long been dependent on “manual gating” by visual inspection. Recently, numerous software have been developed for automatic, computationally guided detection of cell populations; however, they are not designed for time-series flow cytometry data. Time-series flow cytometry data are indispensable for investigating the dynamics of cell populations that could not be elucidated by static time-point analysis.Therefore, there is a great need for tools to systematically analyze time-series flow cytometry data.Results We propose a simple and efficient statistical framework, named CYBERTRACK (CYtometry-Based Estimation and Reasoning for TRACKing cell populations), to perform clustering and cell population tracking for time-series flow cytometry data. CYBERTRACK assumes that flow cytometry data are generated from a multivariate Gaussian mixture distribution with its mixture proportion at the current time dependent on that at a previous timepoint. Using simulation data, we evaluate the performance of CYBERTRACK when estimating parameters for a multivariate Gaussian mixture distribution, tracking time-dependent transitions of mixture proportions, and detecting change-points in the overall mixture proportion. The CYBERTRACK performance is validated using two real flow cytometry datasets, which demonstrate that the population dynamics detected by CYBERTRACK are consistent with our prior knowledge of lymphocyte behavior.Conclusions Our results indicate that CYBERTRACK offers better understandings of time-dependent cell population dynamics to cytometry users by systematically analyzing time-series flow cytometry data.
0

LineageVAE: Reconstructing Historical Cell States and Transcriptomes toward Unobserved Progenitors

Koichiro Majima et al.Feb 20, 2024
A bstract Single-cell RNA sequencing (scRNA-seq) enables comprehensive characterization of the cell state. However, its destructive nature prohibits measuring gene expression changes during dynamic processes such as embryogenesis. Although recent studies integrating scRNA-seq with lineage tracing have provided clonal insights between progenitor and mature cells, challenges remain. Because of their experimental nature, observations are sparse, and cells observed in the early state are not the exact progenitors of cells observed at later time points. To overcome these limitations, we developed LineageVAE, a novel computational methodology that utilizes deep learning based on the property that cells sharing barcodes have identical progenitors. This approach transforms scRNA-seq observations with an identical lineage barcode into sequential trajectories toward a common progenitor in a latent cell state space. Using hematopoiesis and reprogrammed fibroblast datasets, we demonstrate the capability of LineageVAE to reconstruct unobservable cell state transitions, historical transcriptome, and regulatory dynamics toward progenitor cell states at single-cell resolution.
0

Hierarchical non-negative matrix factorization using clinical information for microbial communities

Kayoko Abe et al.Jul 2, 2019
Background The human microbiome forms very complex communities that consist of hundreds to thousands of different microorganisms that not only affect the host, but also participate in disease processes. Several state-of-the-art methods have been proposed for learning the structure of microbial communities and to investigate the relationship between microorganisms and host environmental factors. However, these methods were mainly designed to model and analyze single microbial communities that do not interact with or depend on other communities. Such methods therefore cannot comprehend the properties between interdependent systems in communities that affect host behavior and disease processes.Results We introduce a novel hierarchical Bayesian framework, called BALSAMICO (BAyesian Latent Semantic Analysis of MIcrobial COmmunities), which uses microbial metagenome data to discover the underlying microbial community structures and the associations between microbiota and their environmental factors. BALSAMICO models mixtures of communities in the framework of nonnegative matrix factorization, taking into account environmental factors. This method first proposes an efficient procedure for estimating parameters. A simulation then evaluates the accuracy of the estimated parameters. Finally, the method is used to analyze clinical data. In this analysis, we successfully detected bacteria related to colorectal cancer. These results show that the method not only accurately estimates the parameters needed to analyze the connections between communities of microbiota and their environments, but also allows for the effective detection of these communities in real-world circumstances.