SK
Soner Koc
Author with expertise in Advanced Techniques in Bioimage Analysis and Microscopy
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
3
(100% Open Access)
Cited by:
0
h-index:
3
/
i10-index:
2
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
14

Strengthening the BioCompute Standard by Crowdsourcing on PrecisionFDA

Sarah Stephens et al.Nov 4, 2020
Abstract Background The field of bioinformatics has grown at such a rapid pace that a gap in standardization exists when reporting an analysis. In response, the BioCompute project was created to standardize the type and method of information communicated when describing a bioinformatic analysis. Once the project became established, its goals shifted to broadening awareness and usage of BioCompute, and soliciting feedback from a larger audience. To address these goals, the BioCompute project collaborated with precisionFDA on a crowdsourced challenge that ran from May 2019 to October 2019. This challenge had a beginner track where participants submitted BCOs based on a pipeline of their choosing, and an advanced track where participants submitted applications supporting the creation of a BCO and verification of BCO conformance to specifications. Results In total, there were 28 submissions to the beginner track (including submissions from a bioinformatics master’s class at George Washington University) and three submissions to the advanced track. Three top performers were selected from the beginner track, while a single top performer was selected for the advanced track. In the beginner track, top performers differentiated themselves by submitting BCOs that included more than the minimally compliant content. Advanced track submissions were very impressive. They included a complete web application, a command line tool that produced a static result, and a dockerized container that automatically created the BCO as the tool was run. The ability to harmonize the correct function, a simple user experience, and the aesthetics of the tool interface differentiated the tools. Conclusions Despite being new to the concept, most beginner track scores were high, indicating that most users understood the fundamental concepts of the BCO specification. Novice bioinformatics students were an ideal cohort for this Challenge because of their lack of familiarity with BioCompute, broad diversity of research interests, and motivation to submit high-quality work. This challenge was successful in introducing the BCO to a wider audience, obtaining feedback from that audience, and resulting in a tool novices may use for BCO creation and conformance. In addition, the BCO specification itself was improved based on feedback illustrating the utility of a “wisdom of the crowd” approach to standards development.
6

A pan-cancer PDX histology image repository with genomic and pathological annotations for deep learning analysis

Brian White et al.Oct 27, 2022
Abstract Patient-derived xenografts (PDXs) model human intra-tumoral heterogeneity in the context of the intact tissue of immunocompromised mice. Histological imaging via hematoxylin and eosin (H&E) staining is performed on PDX samples for routine assessment and, in principle, captures the complex interplay between tumor and stromal cells. Deep learning (DL)-based analysis of large human H&E image repositories has extracted inter-cellular and morphological signals correlated with disease phenotype and therapeutic response. Here, we present an extensive, pan-cancer repository of nearly 1,000 PDX and paired human progenitor H&E images. These images, curated from the PDXNet consortium, are associated with genomic and transcriptomic data, clinical metadata, pathological assessment of cell composition, and, in several cases, detailed pathological annotation of tumor, stroma, and necrotic regions. We demonstrate that DL can be applied to these images to classify tumor regions and to predict xenograft-transplant lymphoproliferative disorder, the unintended outgrowth of human lymphocytes at the transplantation site. This repository enables PDX-specific, investigations of cancer biology through histopathological analysis and contributes important model system data that expand on existing human histology repositories. We expect the PDXNet Image Repository to be valuable for controlled digital pathology analysis, both for the evaluation of technical issues such as stain normalization and for development of novel computational methods based on spatial behaviors within cancer tissues.
1

PDXNet Portal: Patient-Derived Xenograft model, data, workflow, and tool discovery

Soner Koc et al.Oct 16, 2021
Abstract We created the PDX Network (PDXNet) Portal ( https://portal.pdxnetwork.org/ ) to centralize access to the National Cancer Institute-funded PDXNet consortium resources (i.e., PDX models, sequencing data, treatment response data, and bioinformatics workflows), to facilitate collaboration among researchers, and to make resources easily available for research. The portal includes sections for resources, analysis results, metrics for PDXNet activities, data processing protocols, and training materials for processing PDX data. The initial portal release highlights PDXNet model and data resources, including 334 new models across 33 cancer types. Tissue samples of these models were deposited in the NCI’s Patient-Derived Model Repository (PDMR) for public access. These models have 2,822 associated sequencing files from 873 samples across 307 patients, which are hosted on the Cancer Genomics Cloud powered by Seven Bridges and the NCI Cancer Data Service for long-term storage and access with dbGaP permissions. The portal also includes results from standardized analysis workflows on PDXNet sequencing files and PDMR data (2,594 samples from 463 patients across 78 disease types). These 15 analysis workflows for whole-exome and RNA-Seq data are freely available, robust, validated, and standardized. The model and data lists will grow substantially over the next two years and will be continuously updated as new data are available. PDXNet models support multi-agent treatment studies, determination of sensitivity and resistance mechanisms, and preclinical trials. The PDXNet portal is a centralized location for these data and resources, which we expect to be of significant utility for the cancer research community.