CY
Calysta Yan
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
5
(100% Open Access)
Cited by:
48
h-index:
8
/
i10-index:
7
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
42

Robust integrated intracellular organization of the human iPS cell: where, how much, and how variable

Matheus Viana et al.Dec 10, 2020
Summary Despite the intimate link between cell organization and function, the principles underlying intracellular organization and the relation between organization, gene expression and phenotype are not well understood. We address this by creating a benchmark for mean cell organization and the natural range of cell-to-cell variation. This benchmark can be used for comparison to other normal or abnormal cell states. To do this, we developed a reproducible microscope imaging pipeline to generate a high-quality dataset of 3D, high-resolution images of over 200,000 live cells from 25 isogenic human induced pluripotent stem cell (hiPSC) lines from the Allen Cell Collection. Each line contains one fluorescently tagged protein, created via endogenous CRISPR/Cas9 gene editing, representing a key cellular structure or organelle. We used these images to develop a new multi-part and generalizable analysis approach of the locations, amounts, and variation of these 25 cellular structures. Taking an integrated approach, we found that both the extent to which a structure’s individual location varied (“stereotypy”) and the extent to which the structure localized relative to all the other cellular structures (“concordance”) were robust to a wide range of cell shape variation, from flatter to taller, smaller to larger, or less to more polarized cells. We also found that these cellular structures varied greatly in how their volumes scaled with cell and nuclear size. These analyses create a data-driven set of quantitative rules for the locations, amounts, and variation of 25 cellular structures within the hiPSC as a normal baseline for cell organization.
42
Citation23
0
Save
56

Cell states beyond transcriptomics: integrating structural organization and gene expression in hiPSC-derived cardiomyocytes

Kaytlyn Gerbin et al.May 27, 2020
Summary We present a quantitative co-analysis of RNA abundance and sarcomere organization in single cells and an integrated framework to predict subcellular organization states from gene expression. We used human induced pluripotent stem cell (hiPSC)-derived cardiomyocytes expressing mEGFP-tagged alpha-actinin-2 to develop quantitative image analysis tools for systematic and automated classification of subcellular organization. This captured a wide range of sarcomeric organization states within cell populations that were previously difficult to quantify. We performed RNA FISH targeting genes identified by single cell RNA sequencing to simultaneously assess the relationship between transcript abundance and structural states in single cells. Co-analysis of gene expression and sarcomeric patterns in the same cells revealed biologically meaningful correlations that could be used to predict organizational states. This study establishes a framework for multi-dimensional analysis of single cells to study the relationships between gene expression and subcellular organization and to develop a more nuanced description of cell states. Graphical Abstract Transcriptional profiling and structural classification was performed on human induced pluripotent stem cell-derived cardiomyocytes to characterize the relationship between transcript abundance and subcellular organization.
56
Citation13
0
Save
1

A comprehensive analysis of gene expression changes in a high replicate and open-source dataset of differentiating hiPSC-derived cardiomyocytes

Tanya Grancharova et al.Apr 23, 2021
Abstract We performed a comprehensive analysis of the transcriptional changes within and across cell populations during human induced pluripotent stem cell (hiPSC) differentiation to cardiomyocytes. Using the single cell RNA-seq combinatorial barcoding method SPLiT-seq, we sequenced >20,000 single cells from 55 independent samples representing two differentiation protocols and multiple hiPSC lines. Samples included experimental replicates ranging from undifferentiated hiPSCs to mixed populations of cells at D90 post-differentiation. As expected, differentiated cell populations clustered by time point, with differential expression analysis revealing markers of cardiomyocyte differentiation and maturation changing from D12 to D90. We next performed a complementary cluster-independent sparse regression analysis to identify and rank genes that best assigned cells to differentiation time points. The two highest ranked genes between D12 and D24 ( MYH7 and MYH6 ) resulted in an accuracy of 0.84, and the three highest ranked genes between D24 and D90 ( A2M, H19, IGF2 ) resulted in an accuracy of 0.94, revealing that low dimensional gene features can identify differentiation or maturation stages in differentiating cardiomyocytes. Expression levels of select genes were validated using RNA FISH. Finally, we interrogated differences in differentiation population composition and cardiac gene expression resulting from two differentiation protocols, experimental replicates, and three hiPSC lines in the WTC-11 background to identify sources of variation across these experimental variables.
1
Citation4
0
Save
1

A deep generative model of 3D single-cell organization

Rory Donovan-Maiye et al.Jun 9, 2021
1 Abstract We introduce a framework for end-to-end integrative modeling of 3D single-cell multi-channel fluorescent image data of diverse subcellular structures. We employ stacked conditional β -variational autoencoders to first learn a latent representation of cell morphology, and then learn a latent representation of subcellular structure localization which is conditioned on the learned cell morphology. Our model is flexible and can be trained on images of arbitrary subcellular structures and at varying degrees of sparsity and reconstruction fidelity. We train our full model on 3D cell image data and explore design trade-offs in the 2D setting. Once trained, our model can be used to impute structures in cells where they were not imaged and to quantify the variation in the location of all subcellular structures by generating plausible instantiations of each structure in arbitrary cell geometries. We apply our trained model to a small drug perturbation screen to demonstrate its applicability to new data. We show how the latent representations of drugged cells differ from unperturbed cells as expected by on-target effects of the drugs. 2 Author summary It’s impossible to acquire all the information we want about every cell we’re interested in in a single experiment. Even just limiting ourselves to imaging, we can only image a small set of subcellular structures in each cell. If we are interested in integrating those images into a holistic picture of cellular organization directly from data, there are a number of approaches one might take. Here, we leverage the fact that of the three channels we image in each cell, two stay the same across the data set; these two channels assess the cell’s shape and nuclear morphology. Given these two reference channels, we learn a model of cell and nuclear morphology, and then use this as a reference frame in which to learn a representation of the localization of each subcellular structure as measured by the third channel. We use β-variational autoencoders to learn representations of both the reference channels and representations of each subcellular structure (conditioned on the reference channels of the cell in which it was imaged). Since these models are both probabilistic and generative, we can use them to understand the variation in the data from which they were trained, to generate instantiations of new cell morphologies, and to generate imputations of structures in real cell images to create an integrated model of subcellular organization.