TV
Thao Vu
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
7
(100% Open Access)
Cited by:
5
h-index:
5
/
i10-index:
4
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

SPF: A Spatial and Functional Data Analytic Approach to cell Imaging data

Thao Vu et al.Oct 1, 2021
+3
B
J
T
Abstract The tumor microenvironment (TME), which characterizes the tumor and its surroundings, plays a critical role in understanding cancer development and progression. Recent advances in imaging techniques enable researchers to study spatial structure of the TME at a single-cell level. Investigating spatial patterns and interactions of cell subtypes within the TME provides useful insights into how cells with different biological purposes behave, which may consequentially impact a subject’s clinical outcomes. We utilize a class of well-known spatial summary statistics, the K-function and its variants, to explore inter-cell dependence as a function of distances between cells. Using techniques from functional data analysis, we introduce an approach to model the association between these summary spatial functions and subject-level outcomes, while controlling for other clinical scalar predictors such as age and disease stage. In particular, we leverage the additive functional Cox regression model (AFCM) to study the nonlinear impact of spatial interaction between tumor and stromal cells on overall survival in patients with non-small cell lung cancer, using multiplex immunohistochemistry (mIHC) data. The applicability of our approach is further validated using a publicly available Multiplexed Ion beam Imaging (MIBI) triple-negative breast cancer dataset.
1
Citation2
0
Save
1

SpaceANOVA: Spatial co-occurrence analysis of cell types in multiplex imaging data using point process and functional ANOVA

Souvik Seal et al.Jul 7, 2023
+7
P
B
S
Multiplex imaging platforms have enabled the identification of the spatial organization of different types of cells in complex tissue or tumor microenvironment (TME). Exploring the potential variations in the spatial co-occurrence or co-localization of different cell types across distinct tissue or disease classes can provide significant pathological insights, paving the way for intervention strategies. However, the existing methods in this context either rely on stringent statistical assumptions or suffer from a lack of generalizability.
5

DenVar: Density-based Variation analysis of multiplex imaging data

Souvik Seal et al.Sep 29, 2021
+2
T
T
S
Abstract Multiplex immunohistochemistry (mIHC) and multiplexed ion beam imaging (MIBI) platforms have become increasingly popular for studying complex single-cell biology in the tumor microenvironment (TME) of cancer subjects. Studying the intensity of the proteins that regulate important cell-functions, often known as functional markers, in the TME becomes extremely crucial for subject-specific assessment of risks, such as risk of recurrence and risk of death. The conventional approach requires selection of two thresholds, one to define the cells of the TME as positive or negative for a particular functional marker, and the other to classify the subjects based on the proportion of the positive cells. The selection of the thresholds has a large impact on the results and an arbitrary selection can lead to an incomprehensible conclusion. In light of this problem, we present a threshold-free distance between the subjects based on the probability densities of the functional markers. The distance can be used to classify the subjects into meaningful groups or can be used in a linear mixed model setup for testing association with clinical outcomes. The method gets rid of the subjectivity bias of the thresholding-based approach, enabling an easier but interpretable analysis of these types of data. With the proposed method, we analyze a lung cancer dataset from an mIHC platform, finding the difference in the density of functional marker HLA-DR to be significantly associated with the overall survival. The approach is also applied on an MIBI triple-negative breast cancer dataset to analyze effects of multiple functional markers. Finally, we demonstrate the reliability of our method through extensive simulation studies.
5

FunSpace: A functional and spatial analytic approach to cell imaging data using entropy measures

Thao Vu et al.Jun 18, 2022
+3
J
S
T
Spatial heterogeneity in the tumor microenvironment (TME) plays a critical role in gaining insights into tumor development and progression. Conventional metrics typically capture the spatial differential between TME cellular architectures by either exploring the cell distributions in a pairwise fashion or aggregating the heterogeneity across multiple cell distributions without considering for the spatial contribution. As such, none of the existing approaches has fully accounted for the heterogeneity caused by both cellular diversity and spatial configurations of multiple cell categories. In this article, we propose an approach to leverage the spatial entropy measures at multiple distance ranges to account for the spatial heterogeneity across different cellular architectures. Then, functional principal component analysis (FPCA) targeting sparse data is applied to estimate FPC scores which are then predictors in a Cox regression model to investigate the impact of spatial heterogeneity in the TME on survival outcome, holding other clinical variables constant. Using an ovarian cancer dataset (n = 114) as a case study, we found that the spatial heterogeneity in the TME immune compositions of CD19+ B cells, CD4+ T cells, CD8+ T cells, and CD68+ macrophages, had a significant non-zero effect on the overall survival (p = 0.027). In the simulations studies under different spatial configurations, the proposed method demonstrated a high predictive power by accounting for both clinical effect and the impact of spatial heterogeneity.
5
Paper
Citation1
0
Save
0

cytoKernel: Robust kernel embeddings for assessing differential expression of single cell data

Tusharkanti Ghosh et al.Aug 19, 2024
+5
S
R
T
High-throughput sequencing of single-cell data can be used to rigorously evlauate cell specification and enable intricate variations between groups or conditions. Many popular existing methods for differential expression target differences in aggregate measurements (mean, median, sum) and limit their approaches to detect only global differential changes. We present a robust method for differential expression of single-cell data using a kernel-based score test, cytoKernel. cytoKernel is specifically designed to assess the differential expression of single cell RNA sequencing and high-dimensional flow or mass cytometry data using the full probability distribution pattern. cytoKernel is based on kernel embeddings which employs the probability distributions of the single cell data, by calculating the pairwise divergence/distance between distributions of subjects. It can detect both patterns involving aggregate changes, as well as more elusive variations that are often overlooked due to the multimodal characteristics of single cell data. We performed extensive benchmarks across both simulated and real data sets from mass cytometry data and single-cell RNA sequencing. The cytoKernel procedure effectively controls the False Discovery Rate (FDR) and shows favourable performance compared to existing methods. The method is able to identify more differential patterns than existing approaches. We apply cytoKernel to assess gene expression and protein marker expression differences from cell subpopulations in various publicly available single-cell RNAseq and mass cytometry data sets. The methods described in this paper are implemented in the open-source R package cytoKernel, which is freely available from Bioconductor at \url{http://bioconductor.org/packages/cytoKernel}.
0

Smccnet 2.0: a comprehensive tool for multi-omics network inference with shiny visualization

W. Liu et al.Aug 24, 2024
+3
I
T
W
Sparse multiple canonical correlation network analysis (SmCCNet) is a machine learning technique for integrating omics data along with a variable of interest (e.g., phenotype of complex disease), and reconstructing multi-omics networks that are specific to this variable. We present the second-generation SmCCNet (SmCCNet 2.0) that adeptly integrates single or multiple omics data types along with a quantitative or binary phenotype of interest. In addition, this new package offers a streamlined setup process that can be configured manually or automatically, ensuring a flexible and user-friendly experience. This package is available in both CRAN: https://cran.r-project.org/web/packages/SmCCNet/index.html and Github: https://github.com/KechrisLab/SmCCNet under the MIT license. The network visualization tool is available at https://smccnet.shinyapps.io/smccnetnetwork/ .
0

SmCCNet 2.0: an Upgraded R package for Multi-omics Network Inference

W. Liu et al.Nov 21, 2023
+3
I
T
W
Abstract Summary Sparse multiple canonical correlation network analysis (SmCCNet) is a machine learning technique for integrating omics data along with a variable of interest (e.g., phenotype of complex disease), and reconstructing multi-omics networks that are specific to this variable. We present the second-generation SmCCNet (SmCCNet 2.0) that adeptly integrates single or multiple omics data types along with a quantitative or binary phenotype of interest. In addition, this new package offers a streamlined setup process that can be configured manually or automatically, ensuring a flexible and user-friendly experience. Availability This package is available in both CRAN: https://cran.r-project.org/web/packages/SmCCNet/index.html and Github: https://github.com/KechrisLab/SmCCNet under the MIT license. The network visualization tool is available at https://smccnet.shinyapps.io/smccnetnetwork/ .