ML
Marta Lucchetta
Author with expertise in RNA Methylation and Modification in Gene Expression
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
6
(67% Open Access)
Cited by:
644
h-index:
23
/
i10-index:
29
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

New functionalities in the TCGAbiolinks package for the study and integration of cancer data from GDC and GTEx

Mohamed Mounir et al.Mar 5, 2019
The advent of Next-Generation Sequencing (NGS) technologies has opened new perspectives in deciphering the genetic mechanisms underlying complex diseases. Nowadays, the amount of genomic data is massive and substantial efforts and new tools are required to unveil the information hidden in the data. The Genomic Data Commons (GDC) Data Portal is a platform that contains different genomic studies including the ones from The Cancer Genome Atlas (TCGA) and the Therapeutically Applicable Research to Generate Effective Treatments (TARGET) initiatives, accounting for more than 40 tumor types originating from nearly 30000 patients. Such platforms, although very attractive, must make sure the stored data are easily accessible and adequately harmonized. Moreover, they have the primary focus on the data storage in a unique place, and they do not provide a comprehensive toolkit for analyses and interpretation of the data. To fulfill this urgent need, comprehensive but easily accessible computational methods for integrative analyses of genomic data that do not renounce a robust statistical and theoretical framework are required. In this context, the R/Bioconductor package TCGAbiolinks was developed, offering a variety of bioinformatics functionalities. Here we introduce new features and enhancements of TCGAbiolinks in terms of i) more accurate and flexible pipelines for differential expression analyses, ii) different methods for tumor purity estimation and filtering, iii) integration of normal samples from other platforms iv) support for other genomics datasets, exemplified here by the TARGET data. Evidence has shown that accounting for tumor purity is essential in the study of tumorigenesis, as these factors promote confounding behavior regarding differential expression analysis. With this in mind, we implemented these filtering procedures in TCGAbiolinks. Moreover, a limitation of some of the TCGA datasets is the unavailability or paucity of corresponding normal samples. We thus integrated into TCGAbiolinks the possibility to use normal samples from the Genotype-Tissue Expression (GTEx) project, which is another large-scale repository cataloging gene expression from healthy individuals. The new functionalities are available in the TCGAbiolinks version 2.8 and higher released in Bioconductor version 3.7.
0

Analyses of cancer data in the Genomic Data Commons Data Portal with new functionalities in the TCGAbiolinks R/Bioconductor package

Mohamed Mounir et al.Jun 20, 2018
The advent of Next Generation Sequencing (NGS) technologies has opened new perspectives in deciphering the genetic mechanisms underlying complex diseases. Nowadays, the amount of genomic data is massive and substantial efforts and new tools are required to unveil the information hidden in the data. The Genomic Data Commons (GDC) Data Portal is a large data collection platform that includes different genomic studies included the ones from The Cancer Genome Atlas (TCGA) and the Therapeutically Applicable Research to Generate Effective Treatments (TARGET) initiatives, accounting for more than 40 tumor types originating from nearly 30000 patients. Such platforms, although very attractive, must make sure the stored data are easily accessible and adequately harmonized. Moreover, they have the primary focus on the data storage in a unique place, and they do not provide a comprehensive toolkit for analyses and interpretation of the data. To fulfill this urgent need, comprehensive but easily accessible computational methods for integrative analyses of genomic data without renouncing a robust statistical and theoretical framework are needed. In this context, the R/Bioconductor package TCGAbiolinks was developed, offering a variety of bioinformatics functionalities. Here we introduce new features and enhancements of TCGAbiolinks in terms of i) more accurate and flexible pipelines for differential expression analyses, ii) different methods for tumor purity estimation and filtering, iii) integration of normal samples from the Genotype-Tissue-Expression (GTEx) platform iv) support for other genomics datasets, here exemplified by the TARGET data. Evidence has shown that accounting for tumor purity is essential in the study of tumorigenesis, as these factors promote confounding behavior regarding differential expression analysis. Henceforth, we implemented these filtering procedures in TCGAbiolinks. Moreover, a limitation of some of the TCGA datasets is the unavailability or paucity of corresponding normal samples. We thus integrated into TCGAbiolinks the possibility to use normal samples from the Genotype-Tissue Expression (GTEx) project, which is another large-scale repository cataloging gene expression from healthy individuals. The new functionalities are available in the TCGABiolinks v 2.8 and higher released in Bioconductor version 3.7.
0

Different molecular signatures in lung cancer types from integrative bioinformatic analyses of RNASeq data

Marta Lucchetta et al.Dec 19, 2018
Background: Genomic initiatives such as The Cancer Genome Atlas (TCGA) project contain data on profiling of thousands of tumors with different -omics approaches, providing a valuable source of information which may be used to decipher cancer signaling and related alterations. Managing and analyzing data from large-scale projects such as TCGA is a demanding task. Indeed, it is difficult to dissect the high complexity hidden in genomic data and to adequately account for tumor heterogeneity. Results: In this study, we used a robust statistical framework along with the integration of diverse bioinformatic tools to analyze next-generation sequencing data from more than 1000 patient samples from two different lung cancer subtypes, i.e., the lung adenocarcinoma (LUAD) and the squamous cell carcinoma (LUSC). In particular, we used RNA-Seq gene expression data to identify both co-expression modules and differentially expressed genes to accurately discriminate between LUAD and LUSC. Moreover, we identified a group of genes which could act as specific oncogenes or tumor suppressor genes in one of the two lung cancer types, as well as two dual role genes. Our results have also been cross-validated against other transcriptomics data of lung cancer patients. Conclusions: Our integrative approach allowed to identify two key features: a substantial up-regulation of genes involved in O-glycosylation of mucins in LUAD, and compromised immune response in LUSC. The immune-profile associated with LUSC is linked to the activation of three specific oncogenic pathways which promote the evasion of the antitumor immune response, providing new future directions for the design of target therapies.
0

Claudin-1 in head and neck squamous cell carcinoma

Stefano Cavalieri et al.Aug 14, 2024
Introduction. The objective response rate to immunotherapy is limited in recurrent/metastatic head and neck squamous cell carcinoma (HNSCC) patients, whose prognosis is still dismal. Few prognostic factors are clinically available, mostly related to patient or disease characteristics. Gene expression signatures offer better prognostic abilities but are mainly used in research. One such GE model classifies HNSCC into 6 clusters with different prognoses. Claudin-1 (CLDN1), which influences tumor microenvironment and immune cell infiltration, has emerged as a potential target, especially in cancers like HNSCC with high CLDN1 expression. Methods. A single-center cohort of 100 loco-regionally advanced HNSCC patients from the BD2Decide observational study was analyzed. Patients were selected to balance long-term survivors and deceased patients, including HPV-negative and HPV-positive cases. Primary tumor specimens underwent GE analysis using Affymetrix ClariomD chips. Primary endpoint was overall survival (OS). Results. The cohort comprised 100 HNSCC patients with a median age of 60 years, predominantly men (76%). Median OS and DFS were 94.24 and 42.79 months, respectively. CLDN1 expression varied significantly among primary sites, being highest in hypopharynx cancers. Differences in expression were not significant when stratified by HPV status or clinical stage. CLDN1 expression differed across the 6 transcriptomic clusters, with the highest levels in clusters associated with mesenchymal and hypoxic features. Higher CLDN1 expression correlated with shorter OS (HR 3, p=0.0023) and DFS (HR 2.14, p=0.02). Conclusion. CLDN1 expression is heterogeneous in HNSCC and carries prognostic significance. It is highest in tumors with HPV-like biology and hypoxic environments, and lowest in immune-sensitive clusters. High CLDN1 is a negative prognostic factor and a promising therapeutic target. Anti-CLDN1 treatments could improve outcomes of CLDN1+ HNSCC patients, and combination therapies with ICIs might overcome resistance in CLDN1- cases. These findings support the need for clinical studies on anti-CLDN1 therapies.
5

Finding disease modules for cancer and COVID-19 in gene co-expression networks with the Core&Peel method

Marta Lucchetta et al.May 27, 2020
Abstract Diseases imply dysregulation of cell’s functions at several levels. The study of differentially expressed genes in case-control cohorts of patients is often the first step in understanding the details of the cell’s dysregulation. A further level of analysis is introduced by noticing that genes are organized in functional modules (often called pathways), thus their action and their dysregulation may be better understood by the identification of the modules most affected by the disease (aka disease modules, or active subnetworks). We describe how an algorithm based on the Core&Peel method developed originally for detecting protein complexes in PPI networks, can be adapted to detect disease modules in co-expression networks of genes. We first validate Core&Peel for the easier general task of functional module detection by comparison with 42 methods participating in the Disease Module Identification DREAM challenge of 2019. Next, we use four specific disease test cases (colorectal cancer, prostate cancer, asthma and rheumatoid arthritis), four state-of-the-art algorithms (ModuleDiscoverer, Degas, KeyPathwayMiner and ClustEx), and several pathway databases to validate the proposed algorithm. Core&Peel is the only method able to find significant associations of the predicted disease module with known validated relevant pathways for all four diseases. Moreover for the two cancer data sets, Core&Peel detects further nine relevant pathways enriched in the predicted disease module, not discovered by the other methods used in the comparative analysis. Finally we apply Core&Peel, along with other methods, to explore the transcriptional response of human cells to SARS-CoV-2 infection, at a modular level, aiming at finding supporting evidence for drug repositioning efforts.