SC
Shane Canon
Author with expertise in Technologies for Biofuel Production from Biomass
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
5
(60% Open Access)
Cited by:
1,735
h-index:
16
/
i10-index:
19
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

KBase: The United States Department of Energy Systems Biology Knowledgebase

Adam Arkin et al.Jul 6, 2018
To the Editor: Over the past two decades, the scale and complexity of genomics technologies and data have advanced from sequencing genomes of a few organisms to generating metagenomes, genome variation, gene expression, metabolites, and phenotype data for thousands of organisms and their communities.A major challenge in this data-rich age of biology is integrating heterogeneous and distributed data into predictive models of biological function, ranging from a single gene to entire organisms and their ecologies.The US Department of Energy (DOE) has invested substantially in efforts to understand the complex interplay between biological and abiotic processes that influence soil, water, and environmental dynamics of our biosphere.The community that has grown around these efforts recognizes the need for scientists of diverse backgrounds to have access to sophisticated computational tools that enable them to analyze complex and heterogeneous data sets and integrate their data and results effectively with the work of others.In this way, new data and conclusions can be rapidly propagated across existing, related analyses and easily discovered by the community for evaluation and comparison with previous results 1-3 .Here we present the DOE Systems Biology Knowledgebase (KBase, http://kbase.us),an open-source software and data platform that enables data sharing, integration, and analysis of microbes, plants, and their communities.KBase maintains an internal reference database that consolidates information from widely used external data repositories.This includes over 90,000 microbial genomes from RefSeq 4 , over 50 plant genomes from Phytozome 5 , over 300 Biolog media formulations 6 , and >30,000 reactions and compounds from KEGG 7 , BIGG 8 , and MetaCyc 9 .These public data are available for integration with user data where appropriate (e.g., genome comparison or building species trees).KBase links these diverse data types with a range of analytical functions within a web-based user interface.This extensive community resource facilitates large-scale analyses on scalable computing infrastructure and has
0

The ModelSEED Database for the integration of metabolic annotations and the reconstruction, comparison, and analysis of metabolic models for plants, fungi, and microbes

Samuel Seaver et al.Apr 1, 2020
Introduction: For over ten years, the ModelSEED has been a primary resource for researchers endeavoring to construct draft genome-scale metabolic models based on annotated microbial or plant genomes. As described here, and now being released, the ModelSEED biochemistry database serves as the foundation of biochemical data underlying the ModelSEED and KBase. Objectives: The ModelSEED biochemistry database embodies several properties that, taken together, distinguish it from other published biochemistry resources by being: (i) a database to serve metabolic modeling by including compartmentalization, transport reactions, charged molecules, proton balancing on reactions, and templates for model species; (ii) extensible by the user community, with all data stored in GitHub; and (iii) designed as a biochemical "Rosetta Stone" to facilitate comparison and integration of annotations from many different tools and databases. Methods: The ModelSEED was constructed by combining chemistry from many resources, applying standard transformations to data, identifying overlapping compounds and reactions, and computing thermodynamic properties. The ModelSEED biochemistry is continually tested using flux balance analysis to ensure the biochemical network is modeling-ready and capable of simulating diverse phenotypes. We also develop ontologies designed to aid in comparing and reconciling metabolic reconstructions that differ in how they represent various metabolic pathways. Results: The current ModelSEED includes 33,978 compounds and 36,645 reactions, made available in an extensible set of files on GitHub, and visualized via the web from the ModelSEED and KBase. Conclusion: This database serves as a transparent source of biochemistry data to broadly support mechanistic modeling and data integration.