KC
Kelsy Cotto
Author with expertise in Computational Methods in Drug Discovery
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
9
(78% Open Access)
Cited by:
1,448
h-index:
11
/
i10-index:
14
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

DGIdb 3.0: a redesign and expansion of the drug–gene interaction database

Kelsy Cotto et al.Nov 7, 2017
+7
Y
A
K
The drug–gene interaction database (DGIdb, www.dgidb.org) consolidates, organizes and presents drug–gene interactions and gene druggability information from papers, databases and web resources. DGIdb normalizes content from 30 disparate sources and allows for user-friendly advanced browsing, searching and filtering for ease of access through an intuitive web user interface, application programming interface (API) and public cloud-based server image. DGIdb v3.0 represents a major update of the database. Nine of the previously included 24 sources were updated. Six new resources were added, bringing the total number of sources to 30. These updates and additions of sources have cumulatively resulted in 56 309 interaction claims. This has also substantially expanded the comprehensive catalogue of druggable genes and anti-neoplastic drug–gene interactions included in the DGIdb. Along with these content updates, v3.0 has received a major overhaul of its codebase, including an updated user interface, preset interaction search filters, consolidation of interaction information into interaction groups, greatly improved search response times and upgrading the underlying web application framework. In addition, the expanded API features new endpoints which allow users to extract more detailed information about queried drugs, genes and drug–gene interactions, including listings of PubMed IDs, interaction type and other interaction metadata.
1
Citation771
0
Save
1

Integration of the Drug–Gene Interaction Database (DGIdb 4.0) with open crowdsource efforts

Sharon Freshour et al.Oct 23, 2020
+6
K
S
S
Abstract The Drug-Gene Interaction Database (DGIdb, www.dgidb.org) is a web resource that provides information on drug-gene interactions and druggable genes from publications, databases, and other web-based sources. Drug, gene, and interaction data are normalized and merged into conceptual groups. The information contained in this resource is available to users through a straightforward search interface, an application programming interface (API), and TSV data downloads. DGIdb 4.0 is the latest major version release of this database. A primary focus of this update was integration with crowdsourced efforts, leveraging the Drug Target Commons for community-contributed interaction data, Wikidata to facilitate term normalization, and export to NDEx for drug-gene interaction network representations. Seven new sources have been added since the last major version release, bringing the total number of sources included to 41. Of the previously aggregated sources, 15 have been updated. DGIdb 4.0 also includes improvements to the process of drug normalization and grouping of imported sources. Other notable updates include the introduction of a more sophisticated Query Score for interaction search results, an updated Interaction Score, the inclusion of interaction directionality, and several additional improvements to search features, data releases, licensing documentation and the application framework.
0

RegTools: Integrated analysis of genomic and transcriptomic data for the discovery of splice-associated variants in cancer

Kelsy Cotto et al.Oct 5, 2018
+22
O
W
K
Abstract Somatic mutations within non-coding regions and even exons may have unidentified regulatory consequences that are often overlooked in analysis workflows. Here we present RegTools ( www.regtools.org ), a computationally efficient, free, and open-source software package designed to integrate somatic variants from genomic data with splice junctions from bulk or single cell transcriptomic data to identify variants that may cause aberrant splicing. RegTools was applied to over 9,000 tumor samples with both tumor DNA and RNA sequence data. We discovered 235,778 events where a splice-associated variant significantly increased the splicing of a particular junction, across 158,200 unique variants and 131,212 unique junctions. To characterize these somatic variants and their associated splice isoforms, we annotated them with the Variant Effect Predictor (VEP), SpliceAI, and Genotype-Tissue Expression (GTEx) junction counts and compared our results to other tools that integrate genomic and transcriptomic data. While many events were corroborated by the aforementioned tools, the flexibility of RegTools also allowed us to identify novel splice-associated variants and previously unreported patterns of splicing disruption in known cancer drivers, such as TP53, CDKN2A , and B2M , as well as in genes not previously considered cancer-relevant.
0
Citation64
0
Save
1

Integration of the Drug-Gene Interaction Database (DGIdb) with open crowdsource efforts

Sharon Freshour et al.Sep 20, 2020
+6
K
S
S
ABSTRACT The Drug-Gene Interaction Database (DGIdb, www.dgidb.org ) is a web resource that provides information on drug-gene interactions and druggable genes from various sources including publications, databases, and other web-based sources in one resource. These drug, gene, and interaction claims are normalized and grouped to identify aliases, merge concepts, and reduce redundancy. The information contained in this resource is available to users through a straightforward search interface, an application programming interface (API), and TSV data downloads. DGIdb 4.0 is the latest major update of this database. Seven new sources have been added, bringing the total number of sources included to 41. Of the previously aggregated sources, 15 have been updated. DGIdb 4.0 also includes improvements to the process of drug normalization and grouping of imported sources. Other notable updates include further development of automatic jobs for routine data updates, more sophisticated query scores for interaction search results, extensive manual curation of interaction source link outs, and the inclusion of interaction directionality. A major focus of this update was integration with crowd-sourced efforts, including leveraging the curation activities of Drug Target Commons, using Wikidata to facilitate term normalization, and integrating into NDEx for producing network representations.
1
Citation12
0
Save
5

Computational prediction of MHC anchor locations guide neoantigen identification and prioritization

Huiming Xia et al.Dec 8, 2020
+21
M
J
H
Abstract Neoantigens are novel peptide sequences resulting from sources such as somatic mutations in tumors. Upon loading onto major histocompatibility complex (MHC) molecules, they can trigger recognition by T cells. Accurate neoantigen identification is thus critical for both designing cancer vaccines and predicting response to immunotherapies. Neoantigen identification and prioritization relies on correctly predicting whether the presenting peptide sequence can successfully induce an immune response. As the majority of somatic mutations are single nucleotide variants, changes between wildtype and mutated peptides are typically subtle and require cautious interpretation. A potentially underappreciated variable in neoantigen-prediction pipelines is the mutation position within the peptide relative to its anchor positions for the patient’s specific MHC molecules. While a subset of peptide positions are presented to the T-cell receptor for recognition, others are responsible for anchoring to the MHC, making these positional considerations critical for predicting T-cell responses. We computationally predicted high probability anchor positions for different peptide lengths for 328 common HLA alleles and identified unique anchoring patterns among them. Analysis of 923 tumor samples shows that 6-38% of neoantigen candidates are potentially misclassified and can be rescued using allelespecific knowledge of anchor positions. A subset of anchor results were orthogonally validated using protein crystallography structures. Representative anchor trends were experimentally validated using peptide-MHC stability assays and competition binding assays. By incorporating our anchor prediction results into neoantigen prediction pipelines, we hope to formalize, streamline and improve the identification process for relevant clinical studies. One Sentence Summary Neoantigen prediction accuracy is significantly influenced by the mutation position within the neoantigen and its relative position to the patient’s allele-specific MHC anchor locations.
5
Citation1
0
Save
1

Genomic and transcriptomic somatic alterations of hepatocellular carcinoma in non-cirrhotic livers

Zachary Skidmore et al.Dec 16, 2021
+15
W
C
Z
Abstract Background Liver cancer is the second leading cause of cancer-related deaths worldwide. Hepatocellular carcinoma (HCC) risk factors include chronic hepatitis, cirrhosis, and alcohol abuse, whereby tumorigenesis is induced through inflammation and subsequent fibrotic response. However, a subset of HCC arises in non-cirrhotic livers. We characterized the genomic and transcriptomic landscape of non-cirrhotic HCC to identify features underlying the disease’s development and progression. Methods Whole genome and transcriptome sequencing was performed on 30 surgically resectable tumors comprised of primarily of non-cirrhotic HCC and adjacent normal tissue. Using somatic variants, capture reagents were created and employed on an additional 87 cases of mixed cirrhotic/non-cirrhotic HCC. Cases were analyzed to identify viral integrations, single nucleotide variants (SNVs), insertions and deletions (INDELS), copy number variants, loss of heterozygosity, gene fusions, structural variants, and differential gene expression. Results We detected 3,750 SNVs/INDELS and extensive CNVs and expression changes. Recurrent TERT promoter mutations occurred in >52% of non-cirrhotic discovery samples. Frequently mutated genes included TP53 , CTNNB1 , and APOB . Cytochrome P450 mediated metabolism was significantly downregulated. Structural variants were observed at MACROD2, WDPCP and NCKAP5 in >20% of samples. Furthermore, NR1H4 fusions involving gene partners EWSR1, GNPTAB , and FNIP1 were detected and validated in 2 non-cirrhotic samples. Conclusion Genomic analysis can elucidate mechanisms that may contribute to non-cirrhotic HCC tumorigenesis. The comparable mutational landscape between cirrhotic and non-cirrhotic HCC supports previous work suggesting a convergence at the genomic level during disease progression. It is therefore possible genomic-based treatments can be applied to both HCC subtypes with progressed disease. Highlights Non-cirrhotic HCC genomically resembles cirrhotic HCC Comprehensive genome- and transcriptome-wide profiling allows detection of novel structural variants, fusions, and undiagnosed viral infections NR1H4 fusions may represent a novel mechanism for tumorigenesis in HCC Non-cirrhotic HCC is characterized by genotoxic mutational signatures and dysregulated liver metabolism Clinical history and comprehensive omic profiling incompletely explain underlying etiologies for non-cirrhotic HCC highlighting the need for further research Short Description This study characterizes the genomic landscape of hepatocellular carcinomas (HCCs) in non-cirrhotic livers. Using 117 HCCs tumor/normal pairs, we identified 3,750 SNVs/INDELS with high variant frequency in TERT, TP53 , CTNNB1 , and APOB . CYP450 was significantly downregulated and many structural variants were observed. This characterization could assist in elucidating non-cirrhotic HCC tumorigenesis.
0

CIViCpy: a Python software development and analysis toolkit for the CIViC knowledgebase

Alex Wagner et al.Sep 27, 2019
+8
A
O
A
Purpose: Precision oncology is dependent upon the matching of tumor variants to relevant knowledge describing the clinical significance of those variants. We recently developed the Clinical Interpretations for Variants in Cancer (CIViC; civicdb.org) crowd-sourced, expert-moderated, open-access knowledgebase, providing a structured framework for evaluating genomic variants of various types (e.g., fusions, SNVs) for their therapeutic, prognostic, predisposing, diagnostic, or functional utility. CIViC has a documented API for accessing CIViC records: Assertions, Evidence, Variants, and Genes. Third-party tools that analyze or access the contents of this knowledgebase programmatically must leverage this API, often reimplementing redundant functionality in the pursuit of common analysis tasks that are beyond the scope of the CIViC web application. Methods: To address this limitation, we developed CIViCpy (civicpy.org), a software development kit (SDK) for extracting and analyzing the contents of the CIViC knowledgebase. CIViCpy enables users to query CIViC content as dynamic objects in Python. We assess the viability of CIViCpy as a tool for advancing individualized patient care by using it to systematically match CIViC evidence to observed variants in patient cancer samples. Results: We used CIViCpy to evaluate variants from 59,437 sequenced tumors of the AACR Project GENIE dataset. We demonstrate that CIViCpy enables annotation of >1,200 variants per second, resulting in precise variant matches to CIViC level A (professional guideline) or B (clinical trial) evidence for 38.6% of tumors. Conclusions: The clinical interpretation of genomic variants in cancers requires high-throughput tools for interoperability and analysis of variant interpretation knowledge. These needs are met by CIViCpy, an SDK for downstream applications and rapid analysis. CIViCpy (civicpy.org) is fully documented, open-source, and freely available online.
1

Evolution of the open-access CIViC knowledgebase is driven by the needs of the cancer variant interpretation community

Kilannin Krysiak et al.Jun 14, 2021
+51
X
H
K
Abstract CIViC (Clinical Interpretation of Variants in Cancer; civicdb.org ) is a crowd-sourced, public domain knowledgebase composed of literature-derived evidence characterizing the clinical utility of cancer variants. As clinical sequencing becomes more prevalent in cancer management, the need for cancer variant interpretation has grown beyond the capability of any single institution. With nearly 300 contributors, CIViC contains peer-reviewed, published literature curated and expert-moderated into structured data units ( Evidence Items ) that can be accessed globally and in real time, reducing barriers to clinical variant knowledge sharing. We have extended CIViC’s functionality to support emergent variant interpretation guidelines, increase interoperability with other variant resources, and promote widespread dissemination of structured curated data. To support the full breadth of variant interpretation from basic to translational, including integration of somatic and germline variant knowledge and inference of drug response, we have enabled curation of three new evidence types (predisposing, oncogenic and functional). The growing CIViC knowledgebase distributes clinically-relevant cancer variant data currently representing >2500 variants in >400 genes from >2800 publications.
0

DGIdb 3.0: a redesign and expansion of the drug-gene interaction database

Kelsy Cotto et al.Oct 9, 2017
+8
Y
A
K
The Drug-Gene Interaction Database (DGIdb, www.dgidb.org) consolidates, organizes, and presents drug-gene interactions and gene druggability information from papers, databases, and web resources. DGIdb normalizes content from more than thirty disparate sources and allows for user-friendly advanced browsing, searching and filtering for ease of access through an intuitive web user interface, application programming interface (API), and public cloud-based server image. DGIdb v3.0 represents a major update of the database. Nine of the previously included twenty-eight sources were updated. Six new resources were added, bringing the total number of sources to thirty-three. These updates and additions of sources have cumulatively resulted in 56,309 interaction claims. This has also substantially expanded the comprehensive catalogue of druggable genes and antineoplastic drug-gene interactions included in the DGIdb. Along with these content updates, v3.0 has received a major overhaul of its codebase, including an updated user interface, preset interaction search filters, consolidation of interaction information into interaction groups, greatly improved search response times, and upgrading the underlying web application framework. In addition, the expanded API features new endpoints which allow users to extract more detailed information about queried drugs, genes, and drug-gene interactions, including listings of PubMed IDs (PMIDs), interaction type, and other interaction metadata.