WZ
William Zeng
Author with expertise in Cancer Stem Cells and Tumor Metastasis
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
2
(0% Open Access)
Cited by:
0
h-index:
4
/
i10-index:
3
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Evaluating cell lines as models for metastatic cancer through integrative analysis of open genomic data

Ke Liu et al.Jun 2, 2018
+4
W
B
K
Metastasis is the most common cause of cancer-related death and, as such, there is an urgent need to discover new therapies to treat metastasized cancers. Cancer cell lines are widely-used models to study cancer biology and evaluate drug candidates. However, it is still unknown whether they adequately recapitulate the disease in patients. The recent accumulation of large-scale genomic data in cell lines, mouse models, and patient tissue samples provides an unprecedented opportunity to evaluate the suitability of cancer cell lines as models for metastatic cancer research. Through comprehensively comparing the genomic profiles of 57 breast cancer cell lines with those of metastatic breast cancer samples, we found their substantial genomic differences. We also identified cell lines that more closely resemble different subtypes of metastatic breast cancer. However, we found none of the currently established Basal-like cell lines sufficiently resemble the samples of Basal-like metastatic breast cancer, a subtype of high interest in therapeutic discovery. Further analysis of mutation, copy number variation and gene expression data suggested that MDAMB231, the most commonly used triple negative cell line, had little genomic similarity with Basal-like metastatic breast cancer samples. Our work demonstrates an urgent need of cell lines that more closely resemble Basal-like metastatic breast cancer samples, and could guide cell line selection in other metastasis-related translational research.
0

Selecting precise reference normal tissue samples for cancer research using a deep learning approach

Billy Zeng et al.Jun 2, 2018
+2
Y
W
B
Background: Normal tissue samples are often employed as a control for understanding disease mechanisms, however, collecting matched normal tissues from patients is difficult in many instances. In cancer research, for example, the open cancer resources such as TCGA and TARGET do not provide matched tissue samples for every cancer or cancer subtype. The recent GTEx project has profiled samples from healthy individuals, providing an excellent resource for this field, yet the feasibility of using GTEx samples as the reference remains unanswered. Methods: We analyze RNA-Seq data processed from the same computational pipeline and systematically evaluate GTEx as a potential reference resource. We use those cancers that have adjacent normal tissues in TCGA as a benchmark for the evaluation. To correlate tumor samples and normal samples, we explore top varying genes, reduced features from principal component analysis, and encoded features from an autoencoder neural network. We first evaluate whether these methods can identify the correct tissue of origin from GTEx for a given cancer and then seek to answer whether disease expression signatures are consistent between those derived from TCGA and from GTEx. Results: Among 32 TCGA cancers, 18 cancers have less than 10 matched adjacent normal tissue samples. Among three methods, autoencoder performed the best in predicting tissue of origin, with 12 of 14 cancers correctly predicted. The reason for misclassification of two cancers is that none of normal samples from GTEx correlate well with any tumor samples in these cancers. This suggests that GTEx has matched tissues for the majority cancers, but not all. While using autoencoder to select proper normal samples for disease signature creation, we found that disease signatures derived from normal samples selected via an autoencoder from GTEx are consistent with those derived from adjacent samples from TCGA in many cases. Interestingly, choosing top 50 mostly correlated samples regardless of tissue type performed reasonably well or even better in some cancers. Conclusions: Our findings demonstrate that samples from GTEx can serve as reference normal samples for cancers, especially those do not have available adjacent tissue samples. A deep-learning based approach holds promise to select proper normal samples.