JD
Jiarui Ding
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
16
(81% Open Access)
Cited by:
5,763
h-index:
30
/
i10-index:
41
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The clonal and mutational evolution spectrum of primary triple-negative breast cancers

Sohrab Shah et al.Apr 3, 2012
Primary triple-negative breast cancers are shown to vary widely and continuously in the degree of clonal evolution and mutational content at the time of diagnosis, with implications for future studies of the disease. Samuel Aparicio et al. provide an in-depth genomic view of primary triple-negative breast cancers (TNBC), which represent approximately 16% of all breast cancers. TNBC cells are deficient in the expression of receptors for oestrogen, progesterone and epidermal growth factor. Through a combination of transcriptomic data and copy-number variation, this study shows that TNBCs vary widely and continuously in the content of clonal genotypes at the time of diagnosis. This means that future studies will need to consider individual tumour clonal genotypes. Primary triple-negative breast cancers (TNBCs), a tumour type defined by lack of oestrogen receptor, progesterone receptor and ERBB2 gene amplification, represent approximately 16% of all breast cancers1. Here we show in 104 TNBC cases that at the time of diagnosis these cancers exhibit a wide and continuous spectrum of genomic evolution, with some having only a handful of coding somatic aberrations in a few pathways, whereas others contain hundreds of coding somatic mutations. High-throughput RNA sequencing (RNA-seq) revealed that only approximately 36% of mutations are expressed. Using deep re-sequencing measurements of allelic abundance for 2,414 somatic mutations, we determine for the first time—to our knowledge—in an epithelial tumour subtype, the relative abundance of clonal frequencies among cases representative of the population. We show that TNBCs vary widely in their clonal frequencies at the time of diagnosis, with the basal subtype of TNBC2,3 showing more variation than non-basal TNBC. Although p53 (also known as TP53), PIK3CA and PTEN somatic mutations seem to be clonally dominant compared to other genes, in some tumours their clonal frequencies are incompatible with founder status. Mutations in cytoskeletal, cell shape and motility proteins occurred at lower clonal frequencies, suggesting that they occurred later during tumour progression. Taken together, our results show that understanding the biology and therapeutic responses of patients with TNBC will require the determination of individual tumour clonal genotypes.
0
Citation1,861
0
Save
1

Chromatin Potential Identified by Shared Single-Cell Profiling of RNA and Chromatin

Sai Ma et al.Oct 23, 2020
Cell differentiation and function are regulated across multiple layers of gene regulation, including modulation of gene expression by changes in chromatin accessibility. However, differentiation is an asynchronous process precluding a temporal understanding of regulatory events leading to cell fate commitment. Here we developed simultaneous high-throughput ATAC and RNA expression with sequencing (SHARE-seq), a highly scalable approach for measurement of chromatin accessibility and gene expression in the same single cell, applicable to different tissues. Using 34,774 joint profiles from mouse skin, we develop a computational strategy to identify cis-regulatory interactions and define domains of regulatory chromatin (DORCs) that significantly overlap with super-enhancers. During lineage commitment, chromatin accessibility at DORCs precedes gene expression, suggesting that changes in chromatin accessibility may prime cells for lineage commitment. We computationally infer chromatin potential as a quantitative measure of chromatin lineage-priming and use it to predict cell fate outcomes. SHARE-seq is an extensible platform to study regulatory circuitry across diverse cells in tissues.
1
Citation730
0
Save
0

Systematic comparison of single-cell and single-nucleus RNA-sequencing methods

Jiarui Ding et al.Apr 6, 2020
The scale and capabilities of single-cell RNA-sequencing methods have expanded rapidly in recent years, enabling major discoveries and large-scale cell mapping efforts. However, these methods have not been systematically and comprehensively benchmarked. Here, we directly compare seven methods for single-cell and/or single-nucleus profiling—selecting representative methods based on their usage and our expertise and resources to prepare libraries—including two low-throughput and five high-throughput methods. We tested the methods on three types of samples: cell lines, peripheral blood mononuclear cells and brain tissue, generating 36 libraries in six separate experiments in a single center. To directly compare the methods and avoid processing differences introduced by the existing pipelines, we developed scumi, a flexible computational pipeline that can be used with any single-cell RNA-sequencing method. We evaluated the methods for both basic performance, such as the structure and alignment of reads, sensitivity and extent of multiplets, and for their ability to recover known biological information in the samples. Seven methods for single-cell RNA sequencing are benchmarked on cell lines, primary cells and mouse cortex.
0
Citation648
0
Save
0

Distinct evolutionary trajectories of primary high‐grade serous ovarian cancers revealed through spatial mutational profiling

Ali Bashashati et al.Jun 18, 2013
High-grade serous ovarian cancer (HGSC) is characterized by poor outcome, often attributed to the emergence of treatment-resistant subclones. We sought to measure the degree of genomic diversity within primary, untreated HGSCs to examine the natural state of tumour evolution prior to therapy. We performed exome sequencing, copy number analysis, targeted amplicon deep sequencing and gene expression profiling on 31 spatially and temporally separated HGSC tumour specimens (six patients), including ovarian masses, distant metastases and fallopian tube lesions. We found widespread intratumoural variation in mutation, copy number and gene expression profiles, with key driver alterations in genes present in only a subset of samples (eg PIK3CA, CTNNB1, NF1). On average, only 51.5% of mutations were present in every sample of a given case (range 10.2–91.4%), with TP53 as the only somatic mutation consistently present in all samples. Complex segmental aneuploidies, such as whole-genome doubling, were present in a subset of samples from the same individual, with divergent copy number changes segregating independently of point mutation acquisition. Reconstruction of evolutionary histories showed one patient with mixed HGSC and endometrioid histology, with common aetiologic origin in the fallopian tube and subsequent selection of different driver mutations in the histologically distinct samples. In this patient, we observed mixed cell populations in the early fallopian tube lesion, indicating that diversity arises at early stages of tumourigenesis. Our results revealed that HGSCs exhibit highly individual evolutionary trajectories and diverse genomic tapestries prior to therapy, exposing an essential biological characteristic to inform future design of personalized therapeutic solutions and investigation of drug-resistance mechanisms. © 2013 The Authors. Journal of Pathology published by John Wiley & Sons Ltd on behalf of Pathological Society of Great Britain and Ireland.
0
Citation393
0
Save
0

Mutational and structural analysis of diffuse large B-cell lymphoma using whole-genome sequencing

Ryan Morin et al.May 23, 2013
Diffuse large B-cell lymphoma (DLBCL) is a genetically heterogeneous cancer composed of at least 2 molecular subtypes that differ in gene expression and distribution of mutations. Recently, application of genome/exome sequencing and RNA-seq to DLBCL has revealed numerous genes that are recurrent targets of somatic point mutation in this disease. Here we provide a whole-genome-sequencing-based perspective of DLBCL mutational complexity by characterizing 40 de novo DLBCL cases and 13 DLBCL cell lines and combining these data with DNA copy number analysis and RNA-seq from an extended cohort of 96 cases. Our analysis identified widespread genomic rearrangements including evidence for chromothripsis as well as the presence of known and novel fusion transcripts. We uncovered new gene targets of recurrent somatic point mutations and genes that are targeted by focal somatic deletions in this disease. We highlight the recurrence of germinal center B-cell-restricted mutations affecting genes that encode the S1P receptor and 2 small GTPases (GNA13 and GNAI2) that together converge on regulation of B-cell homing. We further analyzed our data to approximate the relative temporal order in which some recurrent mutations were acquired and demonstrate that ongoing acquisition of mutations and intratumoral clonal heterogeneity are common features of DLBCL. This study further improves our understanding of the processes and pathways involved in lymphomagenesis, and some of the pathways mutated here may indicate new avenues for therapeutic intervention.
0
Citation374
0
Save
0

TITAN: inference of copy number architectures in clonal cell populations from tumor whole-genome sequence data

Gavin Ha et al.Jul 24, 2014
The evolution of cancer genomes within a single tumor creates mixed cell populations with divergent somatic mutational landscapes. Inference of tumor subpopulations has been disproportionately focused on the assessment of somatic point mutations, whereas computational methods targeting evolutionary dynamics of copy number alterations (CNA) and loss of heterozygosity (LOH) in whole-genome sequencing data remain underdeveloped. We present a novel probabilistic model, TITAN, to infer CNA and LOH events while accounting for mixtures of cell populations, thereby estimating the proportion of cells harboring each event. We evaluate TITAN on idealized mixtures, simulating clonal populations from whole-genome sequences taken from genomically heterogeneous ovarian tumor sites collected from the same patient. In addition, we show in 23 whole genomes of breast tumors that the inference of CNA and LOH using TITAN critically informs population structure and the nature of the evolving cancer genome. Finally, we experimentally validated subclonal predictions using fluorescence in situ hybridization (FISH) and single-cell sequencing from an ovarian cancer patient sample, thereby recapitulating the key modeling assumptions of TITAN.
0
Citation366
0
Save
0

Use of mutation profiles to refine the classification of endometrial carcinomas

Melissa McConechy et al.May 31, 2012
Abstract The classification of endometrial carcinomas is based on pathological assessment of tumour cell type; the different cell types (endometrioid, serous, carcinosarcoma, mixed, undifferentiated, and clear cell) are associated with distinct molecular alterations. This current classification system for high‐grade subtypes, in particular the distinction between high‐grade endometrioid (EEC‐3) and serous carcinomas (ESC), is limited in its reproducibility and prognostic abilities. Therefore, a search for specific molecular classifiers to improve endometrial carcinoma subclassification is warranted. We performed target enrichment sequencing on 393 endometrial carcinomas from two large cohorts, sequencing exons from the following nine genes: ARID1A, PPP2R1A, PTEN, PIK3CA, KRAS, CTNNB1, TP53, BRAF , and PPP2R5C . Based on this gene panel, each endometrial carcinoma subtype shows a distinct mutation profile. EEC‐3s have significantly different frequencies of PTEN and TP53 mutations when compared to low‐grade endometrioid carcinomas. ESCs and EEC‐3s are distinct subtypes with significantly different frequencies of mutations in PTEN, ARID1A, PPP2R1A, TP53 , and CTNNB1 . From the mutation profiles, we were able to identify subtype outliers, ie cases diagnosed morphologically as one subtype but with a mutation profile suggestive of a different subtype. Careful review of these diagnostically challenging cases suggested that the original morphological classification was incorrect in most instances. The molecular profile of carcinosarcomas suggests two distinct mutation profiles for these tumours: endometrioid‐type ( PTEN, PIK3CA, ARID1A, KRAS mutations) and serous‐type ( TP53 and PPP2R1A mutations). While this nine‐gene panel does not allow for a purely molecularly based classification of endometrial carcinoma, it may prove useful as an adjunct to morphological classification and serve as an aid in the classification of problematic cases. If used in practice, it may lead to improved diagnostic reproducibility and may also serve to stratify patients for targeted therapeutics. Copyright © 2012 Pathological Society of Great Britain and Ireland. Published by John Wiley & Sons, Ltd.
0
Citation282
0
Save
0

Integrative analysis of genome-wide loss of heterozygosity and monoallelic expression at nucleotide resolution reveals disrupted pathways in triple-negative breast cancer

Gavin Ha et al.May 25, 2012
Loss of heterozygosity (LOH) and copy number alteration (CNA) feature prominently in the somatic genomic landscape of tumors. As such, karyotypic aberrations in cancer genomes have been studied extensively to discover novel oncogenes and tumor-suppressor genes. Advances in sequencing technology have enabled the cost-effective detection of tumor genome and transcriptome mutation events at single-base-pair resolution; however, computational methods for predicting segmental regions of LOH in this context are not yet fully explored. Consequently, whole transcriptome, nucleotide-level resolution analysis of monoallelic expression patterns associated with LOH has not yet been undertaken in cancer. We developed a novel approach for inference of LOH from paired tumor/normal sequence data and applied it to a cohort of 23 triple-negative breast cancer (TNBC) genomes. Following extensive benchmarking experiments, we describe the nucleotide-resolution landscape of LOH in TNBC and assess the consequent effect of LOH on the transcriptomes of these tumors using RNA-seq-derived measurements of allele-specific expression. We show that the majority of monoallelic expression in the transcriptomes of triple-negative breast cancer can be explained by genomic regions of LOH and establish an upper bound for monoallelic expression that may be explained by other tumor-specific modifications such as epigenetics or mutations. Monoallelically expressed genes associated with LOH reveal that cell cycle, homologous recombination and actin-cytoskeletal functions are putatively disrupted by LOH in TNBC. Finally, we show how inference of LOH can be used to interpret allele frequencies of somatic mutations and postulate on temporal ordering of mutations in the evolutionary history of these tumors.
0
Citation272
0
Save
Load More