MI
Marcin Imieliński
Author with expertise in Genomic Landscape of Cancer and Mutational Signatures
New York University, NYU Langone Health, New York Genome Center
+ 9 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
20
(45% Open Access)
Cited by:
46
h-index:
66
/
i10-index:
110
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
25

Systemic Tissue and Cellular Disruption from SARS-CoV-2 Infection revealed in COVID-19 Autopsies and Spatial Omics Tissue Maps

Jiwoon Park et al.Oct 24, 2023
+44
T
J
J
The Severe Acute Respiratory Syndrome Coronavirus 2 (SARS-CoV-2) virus has infected over 115 million people and caused over 2.5 million deaths worldwide. Yet, the molecular mechanisms underlying the clinical manifestations of COVID-19, as well as what distinguishes them from common seasonal influenza virus and other lung injury states such as Acute Respiratory Distress Syndrome (ARDS), remains poorly understood. To address these challenges, we combined transcriptional profiling of 646 clinical nasopharyngeal swabs and 39 patient autopsy tissues, matched with spatial protein and expression profiling (GeoMx) across 357 tissue sections. These results define both body-wide and tissue-specific (heart, liver, lung, kidney, and lymph nodes) damage wrought by the SARS-CoV-2 infection, evident as a function of varying viral load (high vs. low) during the course of infection and specific, transcriptional dysregulation in splicing isoforms, T cell receptor expression, and cellular expression states. In particular, cardiac and lung tissues revealed the largest degree of splicing isoform switching and cell expression state loss. Overall, these findings reveal a systemic disruption of cellular and transcriptional pathways from COVID-19 across all tissues, which can inform subsequent studies to combat the mortality of COVID-19, as well to better understand the molecular dynamics of lethal SARS-CoV-2 infection and other viruses.
25
Paper
Citation13
0
Save
210

Machine learning guided signal enrichment for ultrasensitive plasma tumor burden monitoring

Adam Widman et al.Oct 24, 2023
+39
N
M
A
ABSTRACT In solid tumor oncology, circulating tumor DNA (ctDNA) is poised to transform care through accurate assessment of minimal residual disease (MRD) and therapeutic response monitoring. To overcome the sparsity of ctDNA fragments in low tumor fraction (TF) settings and increase MRD sensitivity, we previously leveraged genome-wide mutational integration through plasma whole genome sequencing (WGS). We now introduce MRD-EDGE, a composite machine learning-guided WGS ctDNA single nucleotide variant (SNV) and copy number variant (CNV) detection platform designed to increase signal enrichment. MRD-EDGE uses deep learning and a ctDNA-specific feature space to increase SNV signal to noise enrichment in WGS by 300X compared to our previous noise suppression platform MRDetect. MRD-EDGE also reduces the degree of aneuploidy needed for ultrasensitive CNV detection through WGS from 1Gb to 200Mb, thereby expanding its applicability to a wider range of solid tumors. We harness the improved performance to track changes in tumor burden in response to neoadjuvant immunotherapy in non-small cell lung cancer and demonstrate ctDNA shedding in precancerous colorectal adenomas. Finally, the radical signal to noise enrichment in MRD-EDGE enables de novo mutation calling in melanoma without matched tumor, yielding clinically informative TF monitoring for patients on immune checkpoint inhibition.
0

SvABA: Genome-wide detection of structural variants and indels by local assembly

Jeremiah Wala et al.May 6, 2020
+13
N
P
J
Abstract Structural variants (SVs), including small insertion and deletion variants (indels), are challenging to detect through standard alignment-based variant calling methods. Sequence assembly offers a powerful approach to identifying SVs, but is difficult to apply at-scale genome-wide for SV detection due to its computational complexity and the difficulty of extracting SVs from assembly contigs. We describe SvABA, an efficient and accurate method for detecting SVs from short-read sequencing data using genome-wide local assembly with low memory and computing requirements. We evaluated SvABA’s performance on the NA12878 human genome and in simulated and real cancer genomes. SvABA demonstrates superior sensitivity and specificity across a large spectrum of SVs, and substantially improved detection performance for variants in the 20-300 bp range, compared with existing methods. SvABA also identifies complex somatic rearrangements with chains of short (< 1,000 bp) templated-sequence insertions copied from distant genomic regions. We applied SvABA to 344 cancer genomes from 11 cancer types, and found that templated-sequence insertions occur in ~4% of all somatic rearrangements. Finally, we demonstrate that SvABA can identify sites of viral integration and cancer driver alterations containing medium-sized SVs.
0
Paper
Citation9
0
Save
62

Fanconi Anemia Pathway Deficiency Drives Copy Number Variation in Squamous Cell Carcinomas

Andrew Webster et al.Oct 24, 2023
+41
K
M
A
Fanconi anemia (FA), a model syndrome of genome instability, is caused by a deficiency in DNA interstrand crosslink (ICL) repair resulting in chromosome breakage 1–3 . The FA repair pathway comprises at least 22 FANC proteins including BRCA1 and BRCA2 4–6 , and protects against carcinogenic endogenous and exogenous aldehydes 7–10 . Individuals with FA are hundreds to thousands-fold more likely to develop head and neck (HNSCC), esophageal and anogenital squamous cell carcinomas (SCCs) with a median onset age of 31 years 11 . The aggressive nature of these tumors and poor patient tolerance of platinum and radiation-based therapy have been associated with short survival in FA 11–16 . Molecular studies of SCCs from individuals with FA (FA SCCs) have been limited, and it is unclear how they relate to sporadic HNSCCs primarily driven by tobacco and alcohol exposure or human papillomavirus (HPV) infection 17 . Here, by sequencing FA SCCs, we demonstrate that the primary genomic signature of FA-deficiency is the presence of a high number of structural variants (SVs). SVs are enriched for small deletions, unbalanced translocations, and fold-back inversions that arise in the context of TP53 loss. The SV breakpoints preferentially localize to early replicating regions, common fragile sites, tandem repeats, and SINE elements. SVs are often connected forming complex rearrangements. Resultant genomic instability underlies elevated copy number alteration (CNA) rates of key HNSCC-associated genes, including PIK3CA, MYC, CSMD1, PTPRD, YAP1, MXD4, and EGFR. In contrast to sporadic HNSCC, we find no evidence of HPV infection in FA HNSCC, although positive cases were identified in gynecologic tumors. A murine allograft model of FA pathway-deficient SCC was enriched in SVs, exhibited dramatic tumor growth advantage, more rapid epithelial-to-mesenchymal transition (EMT), and enhanced autonomous inflammatory signaling when compared to an FA pathway-proficient model. In light of the protective role of the FA pathway against SV formation uncovered here, and recent findings of FA pathway insufficiency in the setting of increased formaldehyde load resulting in hematopoietic stem cell failure and carcinogenesis 18–20 , we propose that high copy-number instability in sporadic HNSCC may result from functional overload of the FA pathway by endogenous and exogenous DNA crosslinking agents. Our work lays the foundation for improved FA patient treatment and demonstrates that FA SCC is a powerful model to study tumorigenesis resulting from DNA crosslinking damage.
1

Ultrasensitive plasma-based monitoring of tumor burden using machine-learning-guided signal enrichment

Adam Widman et al.Jun 14, 2024
+58
A
M
A
21

Loose ends in cancer genome structure

Julie Behr et al.Oct 24, 2023
+5
K
X
J
Summary Recent pan-cancer studies have delineated patterns of structural genomic variation across thousands of tumor whole genome sequences. It is not known to what extent the shortcomings of short read (≤ 150 bp) whole genome sequencing (WGS) used for structural variant analysis has limited our understanding of cancer genome structure. To formally address this, we introduce the concept of “loose ends” - copy number alterations that cannot be mapped to a rearrangement by WGS but can be indirectly detected through the analysis of junction-balanced genome graphs. Analyzing 2,319 pan-cancer WGS cases across 31 tumor types, we found loose ends were enriched in reference repeats and fusions of the mappable genome to repetitive or foreign sequences. Among these we found genomic footprints of neotelomeres, which were surprisingly enriched in cancers with low telomerase expression and alternate lengthening of telomeres phenotype. Our results also provide a rigorous upper bound on the role of non-allelic homologous recombination (NAHR) in large-scale cancer structural variation, while nominating INO80 , FANCA , and ARID1A as positive modulators of somatic NAHR. Taken together, we estimate that short read WGS maps >97% of all large-scale (>10 kbp) cancer structural variation; the rest represent loose ends that require long molecule profiling to unambiguously resolve. Our results have broad relevance for future research and clinical applications of short read WGS and delineate precise directions where long molecule studies might provide transformative insight into cancer genome structure.
21
Paper
Citation1
0
Save
12

Molecular evolution of classic Hodgkin lymphoma revealed through whole genome sequencing of Hodgkin and Reed Sternberg cells

Francesco Maura et al.Oct 24, 2023
+25
J
B
F
Abstract The rarity of malignant Hodgkin and Reed Sternberg (HRS) cells within a classic Hodgkin lymphoma (cHL) biopsy limits the ability to study the genomics of cHL. To circumvent this, our group has previously optimized fluorescence-activated cell sorting to purify HRS cells. Here we leveraged this method to report the first whole genome sequencing landscape of HRS cells and reconstruct the chronology and likely etiology of pathogenic events prior to the clinical diagnosis of cHL. We identified alterations in driver genes not previously described in cHL, a high activity of the APOBEC mutational signature, and the presence complex structural variants including chromothripsis. We found that the high ploidy observed in cHL is often acquired through multiple, independent large chromosomal gain events including whole genome duplication. The first of these likely occurs several years prior to the diagnosis of cHL, and the last gains typically occur very close to the time of diagnosis. Evolutionary timing analyses revealed that driver mutations in B2M, BCL7A, GNA13 , and PTPN1 , and the onset of AID driven mutagenesis usually preceded large chromosomal gains. The study provides the first temporal reconstruction of cHL pathogenesis and suggests a relatively long time course between the first pathogenic event and the clinical diagnosis.
12
Paper
Citation1
0
Save
312

Shotgun Transcriptome and Isothermal Profiling of SARS-CoV-2 Infection Reveals Unique Host Responses, Viral Diversification, and Drug Interactions

Daniel Butler et al.Oct 11, 2023
+49
C
C
D
Abstract The Severe Acute Respiratory Syndrome Coronavirus 2 (SARS-CoV-2) has caused thousands of deaths worldwide, including >18,000 in New York City (NYC) alone. The sudden emergence of this pandemic has highlighted a pressing clinical need for rapid, scalable diagnostics that can detect infection, interrogate strain evolution, and identify novel patient biomarkers. To address these challenges, we designed a fast (30-minute) colorimetric test (LAMP) for SARS-CoV-2 infection from naso/oropharyngeal swabs, plus a large-scale shotgun metatranscriptomics platform (total-RNA-seq) for host, bacterial, and viral profiling. We applied both technologies across 857 SARS-CoV-2 clinical specimens and 86 NYC subway samples, providing a broad molecular portrait of the COVID-19 NYC outbreak. Our results define new features of SARS-CoV-2 evolution, nominate a novel, NYC-enriched viral subclade, reveal specific host responses in interferon, ACE, hematological, and olfaction pathways, and examine risks associated with use of ACE inhibitors and angiotensin receptor blockers. Together, these findings have immediate applications to SARS-CoV-2 diagnostics, public health, and new therapeutic targets.
0

The Precision Medicine Knowledge Base: an online application for collaborative editing, maintenance and sharing of structured clinical-grade cancer mutations interpretations

Linda Huang et al.May 7, 2020
+8
H
H
L
This paper describes the Precision Medicine Knowledge Base (PMKB; https://pmkb.weill.cornell.edu), an interactive online application for collaborative editing, maintenance and sharing of structured clinical-grade cancer mutations interpretations. PMKB was built using the Ruby on Rails Web application framework. Leveraging existing standards such as Human Genome Variation Society (HGVS) variant description format, we implemented a data model that links variants to tumor-specific and tissue-specific interpretations. Key features of PMKB include support for all major variant types, standardized authentication, distinct user roles including high-level approvers, detailed activity history. A REpresentational State Transfer (REST) application-programming interface (API) was implemented to query the PMKB programmatically. At the time of writing, PMKB contains 457 variant descriptions with 281 clinical-grade interpretations. The EGFR, BRAF, KRAS, and KIT genes are associated with the largest numbers of interpretable variants. The PMKB interpretations have been used in over 1,500 AmpliSeq tests and 750 whole exome sequencing tests. The interpretations are accessed either directly via the Web interface or programmatically via the existing API. An accurate and up-to-date knowledge base of genomic alterations of clinical significance is critical to the success of precision medicine programs. The open-access, programmatically accessible PMKB represents an important attempt at creating such a resource in the field of oncology. The PMKB was designed to help collect and maintain clinical-grade mutation interpretations and facilitates reporting for clinical cancer genomic testing. The PMKB was also designed to enable the creation of clinical cancer genomics automated reporting pipelines via an API.
0

Deep Convolutional Neural Networks Enable Discrimination of Heterogeneous Digital Pathology Images

Pegah Khosravi et al.May 6, 2020
+2
M
E
P
Pathological evaluation of tumor tissue is pivotal for diagnosis in cancer patients and automated image analysis approaches have great potential to increase precision of diagnosis and help reduce human error. In this study, we utilize various computational methods based on convolutional neural networks (CNN) and build a stand-alone pipeline to effectively classify different histopathology images across different types of cancer. In particular, we demonstrate the utility of our pipeline to discriminate between two subtypes of lung cancer, four biomarkers of bladder cancer, and five biomarkers of breast cancer. In addition, we apply our pipeline to discriminate among four immunohistochemistry (IHC) staining scores of bladder and breast cancers. Our classification pipeline utilizes a basic architecture of CNN, Google's Inceptions within three training strategies, and an ensemble of two state-of-the-art algorithms, Inception and ResNet. These strategies include training the last layer of Google's Inceptions, training the network from scratch, and fine-tunning the parameters for our data using two pre-trained version of Google's Inception architectures, Inception-V1 and Inception-V3. We demonstrate the power of deep learning approaches for identifying cancer subtypes, and the robustness of Google's Inceptions even in presence of extensive tumor heterogeneity. Our pipeline on average achieved accuracies of 100% , 92%, 95%, and 69% for discrimination of various cancer types, subtypes, biomarkers, and scores, respectively. Our pipeline and related documentation is freely available at https://github.com/ih-lab/CNN_Smoothie
Load More