EU
Ece Uzun
Author with expertise in Genomic Landscape of Cancer and Mutational Signatures
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(63% Open Access)
Cited by:
7
h-index:
14
/
i10-index:
17
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Enabling the clinical application of artificial intelligence in genomics: a perspective of the AMIA Genomics and Translational Bioinformatics Workgroup

Nephi Walton et al.Nov 30, 2023
+18
C
R
N
Abstract Objective Given the importance AI in genomics and its potential impact on human health, the American Medical Informatics Association—Genomics and Translational Biomedical Informatics (GenTBI) Workgroup developed this assessment of factors that can further enable the clinical application of AI in this space. Process A list of relevant factors was developed through GenTBI workgroup discussions in multiple in-person and online meetings, along with review of pertinent publications. This list was then summarized and reviewed to achieve consensus among the group members. Conclusions Substantial informatics research and development are needed to fully realize the clinical potential of such technologies. The development of larger datasets is crucial to emulating the success AI is achieving in other domains. It is important that AI methods do not exacerbate existing socio-economic, racial, and ethnic disparities. Genomic data standards are critical to effectively scale such technologies across institutions. With so much uncertainty, complexity and novelty in genomics and medicine, and with an evolving regulatory environment, the current focus should be on using these technologies in an interface with clinicians that emphasizes the value each brings to clinical decision-making.
1
Citation4
0
Save
1

LYRUS: A Machine Learning Model for Predicting the Pathogenicity of Missense Variants

Jiaying Lai et al.May 11, 2021
+2
B
E
J
Abstract Single amino acid variations (SAVs) are a primary contributor to variations in the human genome. Identifying pathogenic SAVs can aid in the diagnosis and understanding of the genetic architecture of complex diseases, such as cancer. Most approaches for predicting the functional effects or pathogenicity of SAVs rely on either sequence or structural information. Nevertheless, previous analyses have shown that methods that depend on only sequence or structural information may have limited accuracy. Recently, researchers have attempted to increase the accuracy of their predictions by incorporating protein dynamics into pathogenicity predictions. This study presents < Lai Yang Rubenstein Uzun Sarkar > (LYRUS), a machine learning method that uses an XGBoost classifier selected by TPOT to predict the pathogenicity of SAVs. LYRUS incorporates five sequence-based features, six structure-based features, and four dynamics-based features. Uniquely, LYRUS includes a newly-proposed sequence co-evolution feature called variation number. LYRUS’s performance was evaluated using a dataset that contains 4,363 protein structures corresponding to 20,307 SAVs based on human genetic variant data from the ClinVar database. Based on our dataset, the LYRUS classifier has a higher accuracy, specificity, F-measure, and Matthews correlation coefficient (MCC) than alternative methods including PolyPhen2, PROVEAN, SIFT, Rhapsody, EVMutation, MutationAssessor, SuSPect, FATHMM, and MVP. Variation numbers used within LYRUS differ greatly between pathogenic and neutral SAVs, and have a high feature weight in the XGBoost classifier employed by this method. Applications of the method to PTEN and TP53 further corroborate LYRUS’s strong performance. LYRUS is freely available and the source code can be found at https://github.com/jiaying2508/LYRUS .
1
Citation1
0
Save
3

Somatic Mutations in Collagens are Associated with a Distinct Tumor Environment and Overall Survival in Gastric Cancer

Alexander Brodsky et al.Jan 19, 2021
+6
K
J
A
Abstract Background Gastric cancer is a heterogeneous disease with poorly understood genetic and microenvironmental factors. Mutations in collagen genes are associated with genetic diseases that compromise tissue integrity, but their role in tumor progression has not been extensively reported. Aberrant collagen expression has been long associated with malignant tumor growth, invasion, chemoresistance, and patient outcomes. We hypothesized that somatic mutations in collagens could functionally alter the tumor extracellular matrix. Methods We used publicly available datasets including The Tumor Cancer Genome Atlas (TCGA) to interrogate somatic mutations in collagens in stomach adenocarcinomas. To demonstrate that collagens were significantly mutated above background mutation rates, we used a moderated Kolmogorov-Smirnov test along with combination analysis with a bootstrap approach to define the background accounting for mutation rates. Association between mutations and clinicopathological features was evaluated by Fisher or chi-squared tests. Association with overall survival was assessed by Kaplan-Meier and the Cox-Proportional Hazards Model. Gene Set Enrichment Analysis was used to interrogate pathways. Immunohistochemistry and in situ hybridization tested expression of COL7A1 in stomach tumors. Results In stomach adenocarcinomas, we identified individual collagen genes and sets of collagen genes harboring somatic mutations at a high frequency compared to background in both microsatellite stable, and microsatellite instable tumors in TCGA. Many of the missense mutations resemble the same types of loss of function mutations in collagenopathies that disrupt tissue formation and destabilize cells providing guidance to interpret the somatic mutations. We identified combinations of somatic mutations in collagens associated with overall survival, with a distinctive tumor microenvironment marked by lower matrisome expression and immune cell signatures. Truncation mutations were strongly associated with improved outcomes suggesting that loss of expression of secreted collagens impact tumor progression and treatment response. Germline collagenopathy variants guided interpretation of impactful somatic mutations on tumors. Conclusions These observations highlight that many collagens, expressed in non-physiologically relevant conditions in tumors, harbor impactful somatic mutations in tumors, suggesting new approaches for classification and therapy development in stomach cancer. In sum, these findings demonstrate how classification of tumors by collagen mutations identified strong links between specific genotypes and the tumor environment. Research Highlights Collagen mutations are prevalent in stomach cancer Collagen somatic missense mutations resemble collagenopathy mutations Collagen mutations associate with overall survival in stomach cancer Tumors with collagen mutations have distinct molecular pathways and tumor microenvironments
3
Citation1
0
Save
1

MMR Deficiency Defines Distinct Molecular Subtype of Breast Cancer with Unique Proteomic Networks and Variable Clinical Significance

Sean Hacking et al.Apr 15, 2022
+3
Y
C
S
Abstract Mismatch repair (MMR) alterations are important prognostic and predictive biomarkers in a variety of cancer subtypes including colorectal and endometrial. However, in breast cancer (BC), the distinction and clinical significance of MMR is largely unknown. This may be due in part to the fact that genetic alterations in MMR genes are rare, and only seen to occur in around 3% of BCs. In the present study we analyzed TCGA data using a multi-sample protein-protein interactions (PPI) analysis tool, Proteinarium, and showed a distinct separation in the MMR deficient and intact specific networks. MMR deficient tumor specific networks have a highly connected cluster of histone genes, identified by unique PPI. We also found that distribution of MMR deficient breast cancer is more prevalent in HER2-enriched and triple-negative (TN) BC subtypes compared to luminal BCs. Poorer survival was seen in patients with HER2-enriched BCs with MMR deficiency, whereas an improved survival was seen in TNBCs with MMR deficiency. We recommend defining MMR deficient breast cancer by next generation sequencing (NGS) when any somatic mutation is detected in one of the 7 MMR genes found in our study. Our recommendations include labeling patients with variants of undetermined significance (VUS) as MMR deficient supported by findings from distinct clusters of patients based on our network analysis. MMR may have a role in guiding the use of immunotherapy for both TN as well as HER2-enriched BC.
1
Citation1
0
Save
0

Human neurons from Christianson syndrome iPSCs reveal allele-specific responses to rescue strategies

Sofia Lizarraga et al.Oct 16, 2018
+14
A
Q
S
Human genetic disorders provide a powerful lens to understanding the human brain. Induced pluripotent stem cells (iPSC) represent an important, new resource for mechanistic studies and therapeutic development. Christianson syndrome (CS), an X-linked neurological disorder with attenuation of brain growth postnatally (postnatal microcephaly), is caused by mutations in SLC9A6, the gene encoding endosomal Na+/H+ exchanger 6 (NHE6). We developed CS iPSC lines from patients with a mutational spectrum, as well as robust biologically-related and isogenic controls. We demonstrate that mutations in CS lead to loss of protein function by a variety of mechanisms. Regardless of mutation, all patient-derived neurons demonstrate reduced neurite growth and arborization, likely underlying diminished postnatal brain growth in patients. Additionally, phenotype rescue strategies show allele-specific responses: a gene replacement strategy shows efficacy in nonsense mutations but not in a missense mutation, whereas application of exogenous trophic factors (BDNF or IGF-1) rescues arborization phenotypes across all mutations. Our data emphasize the important principle of personalized medicine whereby success of some therapeutic strategies may be more linked to patient genotype than others.
0

Variant Graph Craft (VGC): A Comprehensive Tool for Analyzing Genetic Variation and Identifying Disease-Causing Variants.

Jennifer Li et al.Jan 1, 2023
+4
B
A
J
The Variant Call Format (VCF) file is providing a structured and comprehensive text file that contains essential information about variant positions in the genome, as well as other critical details, such as alleles, genotype calls, and quality scores. Due to its rich data and format, the VCF file has become an increasingly popular resource for researchers and clinicians alike, enabling them to interpret and understand genomic variation data. However, analyzing and visualizing these files poses significant challenges, demanding access to diverse resources and a robust set of features for in-depth exploration. We introduce Variant Graph Craft (VGC), a VCF file visualization and analysis tool offering a wide range of features for exploring genetic variations, including extraction of variant data, intuitive visualization of variants, and the provision of a graphical representation of samples, complete with genotype information. Furthermore, VGC seamlessly integrates with external resources to offer valuable insights into gene function and variant frequencies in sample data. VGC offers gene function and pathway information from Molecular Signatures Database (MSigDB) for GO terms, as well as KEGG, Biocarta, Pathway Interaction Database, and Reactome. Additionally, the tool also provides a dynamic link to gnomAD for variant information, and includes ClinVar data for pathogenic variant information. VGC operates locally, assuring users of data security and privacy by eliminating the need for cloud-based VCF uploads. It supports the Human Genome Assembly Hg37, ensuring compatibility with a wide range of data sets. With its versatility, VGC accommodates various approaches exploring genetic variation data, and can be tailored to the specific needs of the user by using optional phenotype input data. In conclusion, VGC is a useful resource for exploring genetic variation in a secure and user-friendly environment. With its user-tailored set of features, this tool enables researchers and clinicians to easily explore and understand genomic variation data in a comprehensive and accessible manner. From identifying specific genetic mutations to analyzing patterns of variation across the genome, the VCF file visualization and analysis tool is an essential tool for those working in the field of genomics. VGC is freely available at https://sites.brown.edu/gmilab/variantgraphcraft/
4

Dysregulation of The Chromatin Environment Leads to Differential Alternative Splicing as A Mechanism Of Disease In a Human Model of Autism Spectrum Disorders

Calvin Leung et al.Sep 9, 2022
+8
B
S
C
ABSTRACT Autism spectrum disorder (ASD) affects 1 in 44 children. Chromatin regulatory proteins are overrepresented among genes that contain high risk variants in ASD. Disruption of the chromatin environment leads to widespread dysregulation of gene expression, which is traditionally thought as a mechanism of disease pathogenesis associated with ASD. Alternatively, alterations in chromatin dynamics could also lead to dysregulation of alternative splicing, which is understudied as a mechanism of ASD pathogenesis. The anticonvulsant valproic acid (VPA) is a well-known environmental risk factor for ASD that acts as a class I histone deacetylase (HDAC) inhibitor. However, the precise molecular mechanisms underlying defects in human neuronal development associated with exposure to VPA are understudied. To dissect how VPA exposure and subsequent chromatin hyperacetylation influence molecular signatures involved in ASD pathogenesis, we conducted RNA sequencing (RNA-seq) in human cortical neurons that were treated with VPA. We observed that differentially expressed genes (DEGs) were enriched for mRNA splicing, mRNA processing, histone modification, and metabolism related gene sets. Furthermore, we observed widespread increase in the number and the type of alternative splicing events. Analysis of differential transcript usage (DTU) showed that exposure to VPA induces extensive alterations in transcript isoform usage across neurodevelopmentally important genes. Finally, we find that DEGs and genes that display DTU overlap with known ASD-risk genes. Together, these findings suggest that, in addition to differential gene expression, changes in alternative splicing correlated with alterations in the chromatin environment could act as an additional mechanism of disease in ASD.
0

VarStack: a Web Tool for Data Retrieval to Interpret Somatic Variants in Cancer

Morgan Howard et al.Mar 11, 2020
+3
M
B
M
Background and objective: Advances in tumor genome sequencing created an urgent need for bioinformatics tools to support the interpretation of the clinical significance of the variants detected. VarStack is a web tool which is a base to retrieve somatic variant data in cancer from existing databases. Methods: VarStack incorporates data from several publicly available databases and presents them with an easy-to-navigate user-interface. It currently supports data from the Catalogue of Somatic Mutations in Cancer (COSMIC), gnomAD, cBioPortal, ClinVar, OncoKB and UCSC Genome browser. It retrieves the data from these databases and returns back to the user in a fraction of the time it would take to manually navigate each site independently. Results: Users submit a variant with gene symbol, peptide change, and coding sequence change. They may select a variety of tumor specific studies in cBioportal to search through in addition to their original query. The results from the databases are presented in tabs. Users can export the results as a CSV file. VarStack also has the batch search feature in which user submits a list of variants and download a CSV file with the data from the databases. With the batch search and data download options users can easily incorporate VarStack into their workflow or tools. VarStack saves time by providing variant data to the user from multiple databases in an easy-to-export and interpretable format. Availability: VarStack is freely available under https://varstack.brown.edu.