SV
Samuel Volchenboum
Author with expertise in Impact of Health Information Technology in Healthcare
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
7
(57% Open Access)
Cited by:
2,943
h-index:
27
/
i10-index:
48
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Scalable and accurate deep learning with electronic health records

Alvin Rajkomar et al.May 4, 2018
Abstract Predictive modeling with electronic health record (EHR) data is anticipated to drive personalized medicine and improve healthcare quality. Constructing predictive statistical models typically requires extraction of curated predictor variables from normalized EHR data, a labor-intensive process that discards the vast majority of information in each patient’s record. We propose a representation of patients’ entire raw EHR records based on the Fast Healthcare Interoperability Resources (FHIR) format. We demonstrate that deep learning methods using this representation are capable of accurately predicting multiple medical events from multiple centers without site-specific data harmonization. We validated our approach using de-identified EHR data from two US academic medical centers with 216,221 adult patients hospitalized for at least 24 h. In the sequential format we propose, this volume of EHR data unrolled into a total of 46,864,534,945 data points, including clinical notes. Deep learning models achieved high accuracy for tasks such as predicting: in-hospital mortality (area under the receiver operator curve [AUROC] across sites 0.93–0.94), 30-day unplanned readmission (AUROC 0.75–0.76), prolonged length of stay (AUROC 0.85–0.86), and all of a patient’s final discharge diagnoses (frequency-weighted AUROC 0.90). These models outperformed traditional, clinically-used predictive models in all cases. We believe that this approach can be used to create accurate and scalable predictions for a variety of clinical scenarios. In a case study of a particular prediction, we demonstrate that neural networks can be used to identify relevant information from the patient’s chart.
0

Genomics of Ovarian Cancer Progression Reveals Diverse Metastatic Trajectories Including Intraepithelial Metastasis to the Fallopian Tube

Mark Eckert et al.Oct 8, 2016
Abstract Accumulating evidence has supported the fallopian tube rather than the ovary as the origin for high-grade serous ovarian cancer (HGSOC). To understand the relationship between putative precursor lesions and metastatic tumors, we performed whole-exome sequencing on specimens from eight HGSOC patient progression series consisting of serous tubal intraepithelial carcinomas (STIC), invasive fallopian tube lesions, invasive ovarian lesions, and omental metastases. Integration of copy number and somatic mutations revealed patient-specific patterns with similar mutational signatures and copy-number variation profiles across all anatomic sites, suggesting that genomic instability is an early event in HGSOC. Phylogenetic analyses supported STIC as precursor lesions in half of our patient cohort, but also identified STIC as metastases in 2 patients. Ex vivo assays revealed that HGSOC spheroids can implant in the fallopian tube epithelium and mimic STIC lesions. That STIC may represent metastases calls into question the assumption that STIC are always indicative of primary fallopian tube cancers. Significance: We find that the putative precursor lesions for HGSOC, STIC, possess most of the genomic aberrations present in advanced cancers. In addition, a proportion of STIC represent intraepithelial metastases to the fallopian tube rather than the origin of HGSOC. Cancer Discov; 6(12); 1342–51. ©2016 AACR. See related commentary by Swisher et al., p. 1309. This article is highlighted in the In This Issue feature, p. 1293
0
Citation184
0
Save
0

iCatalog: An open-source, collaborative platform for precision oncology studies.

Wenjun Kang et al.Jun 1, 2024
10020 Background: Genomic profiling of patient (pt) tumors using next-generation sequencing (NGS) has become an integral part of precision oncology (PO). To address the need for a streamlined, interoperable approach to clinical and NGS data management, interpretation, and reporting for a multi-institution pediatric PO study we developed iCatalog (iCat), a clinical decision support system for a multi-institution pediatric PO study. Methods: iCat was developed by the University of Chicago (UChicago) and Dana-Farber Cancer Institute to create clinical interpretation reports for the iCat2/Genomic Assessment Informs Novel Therapy Consortium (GAIN) study. It is a web-based application using the Python Django framework using open-source software and runs on virtual machines (VM) behind a secure firewall. iCat manages user and administrative permissions according to role and site. It securely stores, manages, and integrates genomic and clinical information as well as internal and external genomic knowledge on a patient level. Data types available during interpretation and report generation include pt demographics, specimen-level information such as diagnosis from pathology reports, and molecular data. iCat can host molecular data from different NGS test types. These data are entered through web interfaces and API calls. Genomic knowledge accessible in iCat is a combination of information brought in from external resources and gene and variant-level pediatric-specific curations completed in iCat by curators. Editable study-specific patient reports are generated for each test. Results: As of January 10, 2024, iCat has generated reports for 902 tests and stores information for an additional 217 tests for the 742 pts enrolled in the GAIN study. Of the 217 tests, 25 tests have reports in progress and 192 tests had reports generated manually before iCat was developed. Genomic data are from 11 different test types and clinical data are from patients with 92 rare pediatric solid tumor diagnoses. A total of 108 pts have received iCat clinical interpretation reports integrating genomic data from more than one NGS test type. The knowledge base contains pediatric-specific research-team authored curations for 561 genes, 2114 unique SNVs, 268 unique CNVs, and 227 unique structural variants. Test-specific, variant-level therapeutic recommendations have been made on 666 reports for 502 pts. Diagnostic or hereditary risk associations have been made on 729 reports for 537 pts. Conclusions: iCat is an academically developed open-source platform for PO studies that integrates clinical and genomic data, supports gene and variant interpretation, and facilitates the generation of an individualized genomic report with relevant clinical information for treating physicians. We developed and tested iCat for a pediatric precision oncology study and propose it as a customizable, collaborative platform for future precision oncology research.
0

GDPR and data sharing: the Pediatric Cancer Data Commons experience

Kirk Wyatt et al.May 28, 2024
In their Comment, 1 Topham JT Lawlor RT Lemaire D Casolino R Biankin AV Data sharing in cancer research: perceived risks and the consequences of not sharing. Lancet Oncol. 2024; 25: 275-276 Summary Full Text Full Text PDF PubMed Scopus (0) Google Scholar James T Topham and colleagues emphasise the vital role that data sharing has in studying rare diseases. They cite reluctance to share as a key factor constraining progress in cancer research, with a main frustration being the restrictive policies of the General Data Protection Regulation (GDPR). They highlight the work of the International Cancer Genome Consortium as a case study of how sharing genomic data poses challenges. Data sharing in cancer research: perceived risks and the consequences of not sharingOpen data sharing is a crucial component of effective cancer research. Increasing study sizes for rare diseases, approaching datasets from alternative perspectives, and capturing the uniqueness of geographical groups are all possible when data are openly shared. Patients often participate in research to help others similar to themselves, and have expectations on how their data will be shared among the research community. The ultimate contribution of their data relies on institutions that store and govern the data. Full-Text PDF