FD
Felipe Dezem
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
9
(56% Open Access)
Cited by:
197
h-index:
10
/
i10-index:
10
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
119

A global metagenomic map of urban microbiomes and antimicrobial resistance

David Danko et al.Jun 1, 2021
+662
E
D
D
We present a global atlas of 4,728 metagenomic samples from mass-transit systems in 60 cities over 3 years, representing the first systematic, worldwide catalog of the urban microbial ecosystem. This atlas provides an annotated, geospatial profile of microbial strains, functional characteristics, antimicrobial resistance (AMR) markers, and genetic elements, including 10,928 viruses, 1,302 bacteria, 2 archaea, and 838,532 CRISPR arrays not found in reference databases. We identified 4,246 known species of urban microorganisms and a consistent set of 31 species found in 97% of samples that were distinct from human commensal organisms. Profiles of AMR genes varied widely in type and density across cities. Cities showed distinct microbial taxonomic signatures that were driven by climate and geographic differences. These results constitute a high-resolution global metagenomic atlas that enables discovery of organisms and genes, highlights potential public health and forensic applications, and provides a culture-independent view of AMR burden in cities.
119
Citation190
2
Save
0

Pleiotropy-guided transcriptome imputation from normal and tumor tissues identifies new candidate susceptibility genes for breast and ovarian cancer

Siddhartha Kar et al.Apr 24, 2020
+60
J
D
S
Abstract Familial, genome-wide association (GWAS), and sequencing studies and genetic correlation analyses have progressively unraveled the shared or pleiotropic germline genetics of breast and ovarian cancer. In this study, we aimed to leverage this shared germline genetics to improve the power of transcriptome-wide association studies (TWAS) to identify candidate breast cancer and ovarian cancer susceptibility genes. We built gene expression prediction models using the PrediXcan method in 681 breast and 295 ovarian tumors from The Cancer Genome Atlas and 211 breast and 99 ovarian normal tissue samples from the Genotype-Tissue Expression project and integrated these with GWAS meta-analysis data from the Breast Cancer Association Consortium (122,977 cases/105,974 controls) and the Ovarian Cancer Association Consortium (22,406 cases/40,941 controls). The integration was achieved through novel application of a pleiotropy-guided conditional/conjunction false discovery rate approach for the first time in the setting of a TWAS. This identified 14 new candidate breast cancer susceptibility genes spanning 11 genomic regions and 8 new candidate ovarian cancer susceptibility genes spanning 5 genomic regions at conjunction FDR < 0.05 that were > 1 Mb away from known breast and/or ovarian cancer susceptibility loci. We also identified 38 candidate breast cancer susceptibility genes and 17 candidate ovarian cancer susceptibility genes at conjunction FDR < 0.05 at known breast and/or ovarian susceptibility loci. Overlaying candidate causal risk variants identified by GWAS fine mapping onto expression prediction models for genes at known loci suggested that the association for 55% of these genes was driven by the underlying GWAS signal. Significance The 22 new genes identified by our cross-cancer analysis represent promising candidates that further elucidate the role of the transcriptome in mediating germline breast and ovarian cancer risk.
0
Citation5
0
Save
0

snPATHO-seq: unlocking the pathology archives

Taopeng Wang et al.Dec 8, 2023
+34
T
L
T
Abstract Formalin-fixed paraffin-embedded (FFPE) samples are valuable but underutilized in single-cell omics research due to their low DNA and RNA quality. In this study, leveraging recent single-cell genomic technology advances, we introduce a versatile method to derive high-quality single-nucleus transcriptomic data from FFPE samples.
0
Citation2
0
Save
0

Ovarian Cancer Risk Variants are Enriched in Histotype-Specific Enhancers that Disrupt Transcription Factor Binding Sites

Michelle Jones et al.Feb 25, 2020
+15
P
S
M
Quantifying the functional effects of complex disease risk variants can provide insights into mechanisms underlying disease biology. Genome wide association studies (GWAS) have identified 39 regions associated with risk of epithelial ovarian cancer (EOC). The vast majority of these variants lie in the non-coding genome, suggesting they mediate their function through the regulation of gene expression by their interaction with tissue specific regulatory elements (REs). In this study, by intersecting germline genetic risk data with regulatory landscapes of active chromatin in ovarian cancers and their precursor cell types, we first estimated the heritability explained by known common low penetrance risk alleles. The narrow sense heritability (h_g^2) of both EOC overall and high grade serous ovarian cancer (HGSOCs) was estimated to be 5-6%. Partitioned SNP-heritability across broad functional categories indicated a significant contribution of regulatory elements to EOC heritability. We collated epigenomic profiling data for 77 cell and tissue types from public resources (Roadmap Epigenomics and ENCODE), and H3K27Ac ChIP-Seq data generated in 26 ovarian cancer-relevant cell types. We identified significant enrichment of risk SNPs in active REs marked by H3K27Ac in HGSOCs. To further investigate how risk SNPs in active REs influence predisposition to ovarian cancer, we used motifbreakR to predict the disruption of transcription factor binding sites. We identified 469 candidate causal risk variants in H3K27Ac peaks that break TF motifs (enrichment P-Value < 1x10-5 compared to control variants). The most frequently broken motif was REST (P-Value = 0.0028), which has been reported as both a tumor suppressor and an oncogene. These systematic functional annotations with epigenomic data highlight the specificity of the regulatory landscape and demonstrate functional annotation of germline risk variants is most informative when performed in highly relevant cell types.
0

Transcriptome and interactome analyses identify theTP53interacting geneRCCD1as a candidate susceptibility gene at the 15p26.1 breast and ovarian cancer risk locus

Jasmine Plummer et al.Sep 30, 2020
+14
S
F
J
ABSTRACT Common genetic variation in a region on chromosome 15q26 confers susceptibility to breast and ovarian cancer. The P53 interacting gene RCCD1 in this region is a candidate susceptibility gene for both cancers. In this study, a colocalization analysis of breast and ovarian cancer case-control genetic association studies in over 145,000 and 146,000 controls fine mapped the shared association in this region to 17 pleiotropic credible causal risk variants ( P breast < 1.16 × 10 −14 and P ovary < 7.50 × 10 −7 ). These variants were strongly associated with the expression of RCCD1 in normal breast and ovarian tissues. Circular chromosome conformation capture (4C) analysis of RCCD1 in breast and ovarian cancer cells identified similar patterns of cis -interaction and significant binding site enrichment for the BRCA2 interacting gene EMSY (P adjusted = 9.24 × 10 −6 ). The 4C analysis pinpointed a single 2kB RCCD1 cis-interaction that contained two of the 17 shared risk variants. RCCD1 trans -interacting regions mapped to previously identified genome wide significant (P < 5 × 10 −8 ) breast cancer risk loci (1p34.2 and 3p14.1) and to the pleiotropic breast-ovarian cancer risk locus at chromosome 9q34.2. Stable overexpression of RCCD1 in breast and ovarian cancer precursor cells identified 13 and 11 differentially expressed genes (DEGs) respectively associated with breast and ovarian cancer risk at genome-wide significance ( P MAGMA < 2.6 × 10 −6 after Bonferroni correction). Eighty-two DEGs shared between breast and ovarian cancer were strongly enriched in TP53 (P = 9.9 × 10 −4 ), Hippo (P = 2.51 × 10 −3 ) and TNF signaling (P = 4.7 × 10 −3 ) pathways.
0

Predicting master transcription factors from pan-cancer expression data

Jessica Reddy et al.Nov 12, 2019
+27
R
M
J
The function of critical developmental regulators can be subverted by cancer cells to control expression of oncogenic transcriptional programs. These "master transcription factors" (MTFs) are often essential for cancer cell survival and represent vulnerabilities that can be exploited therapeutically. The current approaches to identify candidate MTFs examine super-enhancer associated transcription factor-encoding genes with high connectivity in network models. This relies on chromatin immunoprecipitation-sequencing (ChIP-seq) data, which is technically challenging to obtain from primary tumors, and is currently unavailable for many cancer types and clinically relevant subtypes. In contrast, gene expression data are more widely available, especially for rare tumors and subtypes where MTFs have yet to be discovered. We have developed a predictive algorithm called CaCTS (Cancer Core Transcription factor Specificity) to identify candidate MTFs using pan-cancer RNA-sequencing data from The Cancer Genome Atlas. The algorithm identified 273 candidate MTFs across 34 tumor types and recovered known tumor MTFs. We also made novel predictions, including for cancer types and subtypes for which MTFs have not yet been characterized. Clustering based on MTF predictions reproduced anatomic groupings of tumors that share 1-2 lineage-specific candidates, but also dictated functional groupings, such as a squamous group that comprised five tumor subtypes sharing 3 common MTFs. PAX8, SOX17, and MECOM were candidate factors in high-grade serous ovarian cancer (HGSOC), an aggressive tumor type where the core regulatory circuit is currently uncharacterized. PAX8, SOX17, and MECOM are required for cell viability and lie proximal to super-enhancers in HGSOC cells. ChIP-seq revealed that these factors co-occupy HGSOC regulatory elements globally and co-bind at critical gene loci including MUC16 (CA-125). Addiction to these factors was confirmed in studies using THZ1 to inhibit transcription in HGSOC cells, suggesting early down-regulation of these genes may be responsible for cytotoxic effects of THZ1 on HGSOC models. Identification of MTFs across 34 tumor types and 140 subtypes, especially for those with limited understanding of transcriptional drivers paves the way to therapeutic targeting of MTFs in a broad spectrum of cancers.
1

A Machine Learning One-Class Logistic Regression Model to Predict Stemness in Single Cell Transcriptomics and Spatial Omics Datasets

Felipe Dezem et al.May 7, 2023
+15
B
M
F
Abstract Cell annotation is a crucial methodological component to interpreting single cell and spatial omics data. These approaches are often biased and manually curated. Here we harness an existing stemness model for assessing oncogenic states to transform its application to single cell and spatial omic datasets. This one-class logistic regression machine learning algorithm is used to extract transcriptomic or proteomic features from non-transformed stem cells to identify dedifferentiated cell states. We found this method identifies single cell states in metastatic tumor cell populations without the requirement of cell annotation. Finally these stemness indices are applicable across a variety of spatial transcriptomic and proteomic technologies for the identification of oncogenic cell types in the tumor microenvironment. Graphical Abstract
0

Cis- and trans-eQTL TWAS of breast and ovarian cancer identify more than 100 risk associated genes in the BCAC and OCAC consortia

Simeon Head et al.Jan 1, 2023
+6
A
F
S
Transcriptome-wide association studies (TWAS) have investigated the role of genetically regulated transcriptional activity in the etiologies of breast and ovarian cancer. However, methods performed to date have only considered regulatory effects of risk associated SNPs thought to act in cis on a nearby target gene. With growing evidence for distal (trans) regulatory effects of variants on gene expression, we performed TWAS of breast and ovarian cancer using a Bayesian genome-wide TWAS method (BGW-TWAS) that considers effects of both cis- and trans-expression quantitative trait loci (eQTLs). We applied BGW-TWAS to whole genome and RNA sequencing data in breast and ovarian tissues from the Genotype-Tissue Expression project to train expression imputation models. We applied these models to large-scale GWAS summary statistic data from the Breast Cancer and Ovarian Cancer Association Consortia to identify genes associated with risk of overall breast cancer, non-mucinous epithelial ovarian cancer, and 10 cancer subtypes. We identified 101 genes significantly associated with risk with breast cancer phenotypes and 8 with ovarian phenotypes. These loci include established risk genes and several novel candidate risk loci, such as ACAP3, whose associations are predominantly driven by trans-eQTLs. We replicated several associations using summary statistics from an independent GWAS of these cancer phenotypes. We further used genotype and expression data in normal and tumor breast tissue from the Cancer Genome Atlas to examine the performance of our trained expression imputation models. This work represents a first look into the role of trans-eQTLs in the complex molecular mechanisms underlying these diseases.
14

A Comparative Analysis of Imaging-Based Spatial Transcriptomics Platforms

David Cook et al.Dec 14, 2023
+11
K
K
D
Abstract Spatial transcriptomics is a rapidly evolving field, overwhelmed by a multitude of technologies. This study aims to offer a comparative analysis of datasets generated from leading in situ imaging platforms. We have generated spatial transcriptomics data from serial sections of prostate adenocarcinoma using the 10x Genomics Xenium and NanoString CosMx SMI platforms. Additionally, orthogonal single-nucleus RNA sequencing (snRNA-seq) was performed on the same FFPE tissue to establish a reference for the tumor’s transcriptional profiles. We assessed various technical aspects, such as reproducibility, sensitivity, dynamic range, cell segmentation, cell type annotation, and congruence with single-cell profiling. The practicality of assessing cellular organization and biomarker localization was evaluated. Although fewer genes are measured (CosMx: 960, Xenium: 377, with an overlap of 125), Xenium consistently demonstrates higher sensitivity, a broader dynamic range, and better alignment with single-cell reference profiles. Conversely, CosMx’s out-of-the-box segmentation outperformed Xenium’s, resulting in noticeable transcript misassignment in Xenium within certain tissue areas. However, the impact of this on the cells’ transcriptional profile was minimal. Together, this comprehensive comparison of two leading commercial platforms for spatial transcriptomics provides essential metrics for assessing their performance, offering invaluable insights for future research and technological advancements in this dynamic field.
14
5.0
1
Save