KR
Kimberly Robasky
Author with expertise in Standards and Guidelines for Genetic Variant Interpretation
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(63% Open Access)
Cited by:
486
h-index:
11
/
i10-index:
11
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

A public resource facilitating clinical use of genomes

Mad Ball et al.Jul 13, 2012
Rapid advances in DNA sequencing promise to enable new diagnostics and individualized therapies. Achieving personalized medicine, however, will require extensive research on highly reidentifiable, integrated datasets of genomic and health information. To assist with this, participants in the Personal Genome Project choose to forgo privacy via our institutional review board- approved “open consent” process. The contribution of public data and samples facilitates both scientific discovery and standardization of methods. We present our findings after enrollment of more than 1,800 participants, including whole-genome sequencing of 10 pilot participant genomes (the PGP-10). We introduce the Genome-Environment-Trait Evidence (GET-Evidence) system. This tool automatically processes genomes and prioritizes both published and novel variants for interpretation. In the process of reviewing the presumed healthy PGP-10 genomes, we find numerous literature references implying serious disease. Although it is sometimes impossible to rule out a late-onset effect, stringent evidence requirements can address the high rate of incidental findings. To that end we develop a peer production system for recording and organizing variant evaluations according to standard evidence guidelines, creating a public forum for reaching consensus on interpretation of clinically relevant variants. Genome analysis becomes a two-step process: using a prioritized list to record variant evaluations, then automatically sorting reviewed variants using these annotations. Genome data, health and trait information, participant samples, and variant interpretations are all shared in the public domain—we invite others to review our results using our participant samples and contribute to our interpretations. We offer our public resource and methods to further personalized medical research.
0
Citation233
0
Save
0

FAIRshake: toolkit to evaluate the findability, accessibility, interoperability, and reusability of research digital resources

Daniel Clarke et al.Jun 3, 2019
As more datasets, tools, workflows, APIs, and other digital resources are produced by the research community, it is becoming increasingly difficult to harmonize and organize these efforts for maximal synergistic integrated utilization. The Findable, Accessible, Interoperable, and Reusable (FAIR) guiding principles have prompted many stakeholders to consider strategies for tackling this challenge by making these digital resources follow common standards and best practices so that they can become more integrated and organized. Faced with the question of how to make digital resources more FAIR, it has become imperative to measure what it means to be FAIR. The diversity of resources, communities, and stakeholders have different goals and use cases and this makes assessment of FAIRness particularly challenging. To begin resolving this challenge, the FAIRshake toolkit was developed to enable the establishment of community-driven FAIR metrics and rubrics paired with manual, semi- and fully-automated FAIR assessment capabilities. The FAIRshake toolkit contains a database that lists registered digital resources, with their associated metrics, rubrics, and assessments. The FAIRshake toolkit also has a browser extension and a bookmarklet that enables viewing and submitting assessments from any website. The FAIR assessment results are visualized as an insignia that can be viewed on the FAIRshake website, or embedded within hosting websites. Using FAIRshake, a variety of bioinformatics tools, datasets listed on dbGaP, APIs registered in SmartAPI, workflows in Dockstore, and other biomedical digital resources were manually and automatically assessed for FAIRness. In each case, the assessments revealed room for improvement, which prompted enhancements that significantly upgraded FAIRness scores of several digital resources.
1

Transfer learning improves outcome predictions for ASD from gene expression in blood

Kimberly Robasky et al.Jun 29, 2021
Abstract Background Predicting outcomes on human genetic studies is difficult because the number of variables (genes) is often much larger than the number of observations (human subject tissue samples). We investigated means for improving model performance on the types of under-constrained problems that are typical in human genetics, where the number of strongly correlated genes (features) may exceed 10,000, and the number of study participants (observations) may be limited to under 1,000. Methods We created ‘train’, ‘validate’ and ‘test’ datasets from 240 microarray observations from 127 subjects diagnosed with autism spectrum disorder (ASD) and 113 ‘typically developing’ (TD) subjects. We trained a neural network model (a.k.a., the ‘naive’ model) on 10,422 genes using the ‘train’ dataset, composed of 70 ASD and 65 TD subjects, and we restricted the model to one, fully-connected hidden layer to minimize the number of trainable parameters, including a dropout layer to help prevent overfitting. We experimented with alternative network architectures and tuned the hyperparameters using the ‘validate’ dataset, and performed a single, final evaluation using the holdout ‘test’ dataset. Next, we trained a neural network model using the identical architecture and identical genes to predict tissue type in GTEx data. We transferred that learning by replacing the top layer of the GTEx model with a layer to predict ASD outcome and we retrained the new layer on the ASD dataset, again using the identical 10,422 genes. Findings The ‘naive’ neural network model had AUROC=0.58 for the task of predicting ASD outcomes, which saw a statistically significant 7.8% improvement from transfer learning. Interpretation We demonstrated that neural network learning could be transferred from models trained on large RNA-Seq gene expression to a model trained on a small, microarray gene expression dataset with clinical utility for mitigating over-training on small sample sizes. Incidentally, we built a highly accurate classifier of tissue type with which to perform the transfer learning. Funding This work was supported in part by NIMH R01-MH110558 (E.C., N.E.L.) Author Summary Image recognition and natural language processing have enjoyed great success in reusing the computational efforts and data sources to overcome the problem of over-training a neural network on a limited dataset. Other domains using deep learning, including genomics and clinical applications, have been slower to benefit from transfer learning. Here we demonstrate data preparation and modeling techniques that allow genomics researchers to take advantage of transfer learning in order to increase the utility of limited clinical datasets. We show that a non-pre-trained, ‘naive’ model performance can be improved by 7.8% by transferring learning from a highly performant model trained on GTEx data to solve a similar problem.
19

What does your cell really do? Model-based assessment of mammalian cells metabolic functionalities using omics data

Anne Richelle et al.Apr 28, 2020
Abstract Large-scale omics experiments have become standard in biological studies, leading to a deluge of data. However, researchers still face the challenge of connecting changes in the omics data to changes in cell functions, due to the complex interdependencies between genes, proteins and metabolites. Here we present a novel framework that begins to overcome this problem by allowing users to infer how metabolic functions change, based on omics data. To enable this, we curated and standardized lists of metabolic tasks that mammalian cells can accomplish. We then used genome-scale metabolic networks to define gene modules responsible for each specific metabolic task. We further developed a framework to overlay omics data on these modules to predict pathway usage for each metabolic task. The proposed approach allows one to directly predict how changes in omics experiments change cell or tissue function. We further demonstrated how this new approach can be used to leverage the metabolic functions of biological entities from the single cell to their organization in tissues and organs using multiple transcriptomic datasets (human and mouse). Finally, we created a web-based CellFie module that has been integrated into the list of tools available in GenePattern ( www.genepattern.org ) to enable adoption of the approach.
0

TAS2R38 predisposition to bitter taste associated with differential changes in vegetable intake in response to a community-based dietary intervention

Larissa Calancie et al.Jan 18, 2018
Background: Although vegetable consumption is associated with decreased risk for a variety of chronic diseases, few Americans meet the CDC recommendations for vegetable intake. The TAS2R38 gene encodes a taste receptor that confers bitter taste sensing from chemicals found in some vegetables. Common polymorphisms in TAS2R38, including rs713598, rs1726866, and rs10246939, lead to coding substitutions that alter receptor function and result in the loss of bitter taste perception. Objective: Our study examines whether bitter taste perception TAS2R38 diplotypes were associated with vegetable consumption in participants enrolled in either an enhanced or a minimal nutrition counseling intervention within a community-based dietary intervention. Methods: DNA was isolated from the peripheral blood cells of study participants (N = 497) and analyzed for polymorphisms using genotyping arrays. The Block Fruit and Vegetable screener was used to determine frequency of vegetable consumption. Mixed effects models were used to test differences in frequency of vegetable consumption between intervention and genotype groups over time. Results: There was no association between baseline vegetable consumption frequency and the bitter taste diplotype (p = 0.937), however after six months of the intervention, we observed an interaction between bitter taste diplotypes and time (p = 0.046). Participants in the enhanced intervention increased their vegetable consumption frequency (p = 0.020) and within this intervention group, the non-bitter and intermediate-bitter tasting participants had the largest increase in vegetable consumption. In contrast, in the minimal intervention group, the bitter tasting participants reported a decrease in vegetable consumption. Conclusions: Non- and intermediate-bitter taste blind participants increased vegetable consumption in either intervention group more than those who perceive bitterness. Future applications of precision medicine could consider genetic variation in bitter taste perception genes when designing dietary interventions.
0

Semantic Integration of Clinical Laboratory Tests from Electronic Health Records for Deep Phenotyping and Biomarker Discovery

Xingmin Zhang et al.Jan 13, 2019
Electronic Health Record (EHR) systems typically define laboratory test results using the Laboratory Observation Identifier Names and Codes (LOINC) and can transmit them using Fast Healthcare Interoperability Resource (FHIR) standards. LOINC has not yet been semantically integrated with computational resources for phenotype analysis. Here, we provide a method for mapping LOINC-encoded laboratory test results transmitted in FHIR standards to the Human Phenotype Ontology (HPO) terms. We annotated the medical implications of 2421 commonly used laboratory tests with HPO terms. Using these annotations, a software assesses laboratory test results and converts each into an HPO term. We validated our approach with EHR data from 15,681 patients with respiratory complaints and identified known biomarkers for asthma. Finally, we provide a freely available SMART on FHIR application that can be used within EHR systems. Our approach allows reusing readily available laboratory tests in EHR for deep phenotyping and using the hierarchical structure of HPO for association studies with medical outcomes and genomics.