AR
Anders Riutta
Author with expertise in Analysis of Gene Interaction Networks
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(75% Open Access)
Cited by:
2,135
h-index:
10
/
i10-index:
10
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

WikiPathways: a multifaceted pathway database bridging metabolomics to other omics research

De Sl et al.Oct 25, 2017
WikiPathways (wikipathways.org) captures the collective knowledge represented in biological pathways. By providing a database in a curated, machine readable way, omics data analysis and visualization is enabled. WikiPathways and other pathway databases are used to analyze experimental data by research groups in many fields. Due to the open and collaborative nature of the WikiPathways platform, our content keeps growing and is getting more accurate, making WikiPathways a reliable and rich pathway database. Previously, however, the focus was primarily on genes and proteins, leaving many metabolites with only limited annotation. Recent curation efforts focused on improving the annotation of metabolism and metabolic pathways by associating unmapped metabolites with database identifiers and providing more detailed interaction knowledge. Here, we report the outcomes of the continued growth and curation efforts, such as a doubling of the number of annotated metabolite nodes in WikiPathways. Furthermore, we introduce an OpenAPI documentation of our web services and the FAIR (Findable, Accessible, Interoperable and Reusable) annotation of resources to increase the interoperability of the knowledge encoded in these pathways and experimental omics data. New search options, monthly downloads, more links to metabolite databases, and new portals make pathway knowledge more effortlessly accessible to individual researchers and research communities.
19

25 Years of Pathway Figures

Kristina Hanspers et al.May 31, 2020
Background: Pathway diagrams are fundamental tools for describing biological processes in all aspects of science, including training, generating hypotheses, describing new knowledge and ultimately as communication tools in published work. Thousands of pathway diagrams are published each year as figures in papers. But as static images the pathway knowledge represented in figures is not accessible to researchers for computational queries and analyses. In this study, we aimed to identify pathway figures published in the past 25 years, to characterize the human gene content in figures by optical character recognition, and to describe their utility as a resource for pathway knowledge. Approach: To identify pathway figures representing 25 years of published research, we trained a machine learning service on manually-classified figures and applied it to 235,081 image query results from PubMed Central. Our previously described pipeline was utilized to extract human genes from the pathway figure images. These figures were characterized in terms of their parent papers, human gene content and enriched disease terms. Diverse use cases were explored for this newly accessible pathway resource. Results: We identified 64,643 pathway figures published between 1995 and 2019, depicting 1,112,551 instances of human genes (13,464 unique NCBI Genes) in various interactions and contexts. This represents more genes than found in the text of the same papers, as well as genes not found in any pathway database. We developed an interactive web tool to explore the results from the 65k set of figures, and used this tool to explore the history of scientific discovery of the Hippo Signaling pathway. We also defined a filtered set of 32k pathway figures useful for enrichment analysis.
0

Identifying Genes in Published Pathway Figure Images

Anders Riutta et al.Jul 29, 2018
BACKGROUND. Pathway figures are commonly found in the biomedical literature providing intuitive models of complex processes in a visually concise format. The contents of a pathway figure often reflect the key findings and relevant context of an article. Unfortunately, the vast majority of pathway figures are drawn as one-off static images despite freely available pathway tools and resources, thus rendering their contents inaccessible to search, data mining and downstream analysis. APPROACH. Leveraging advances in optical character recognition and domain expertise in pathway modeling, we devised an approach to identify genes in published pathway figures. The approach was optimized against a set of figure images obtained from PubMed Central and tested against a set of 400 curated pathways with known content from WikiPathways (F-measure 95.2%). RESULTS. Applied to 3982 published pathway figures spanning a four year period, our approach identified 29,189 gene symbols representing 4159 unique gene identifiers. The gene content unlocked from just this small sample of published figures includes novel and diverse pathway associations unmatched by any pathway database. Our approach over doubled the number of genes associated with the articles containing these figures as compared to combined annotations available from PubMed and PubTator. Encouraged by these initial results, we plan to scale the approach to make the molecular contents of the continuing stream of published pathway figures more accessible.