AW
Andra Waagmeester
Author with expertise in Analysis of Gene Interaction Networks
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
13
(46% Open Access)
Cited by:
14,934
h-index:
21
/
i10-index:
28
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

WikiPathways: a multifaceted pathway database bridging metabolomics to other omics research

De Sl et al.Oct 25, 2017
WikiPathways (wikipathways.org) captures the collective knowledge represented in biological pathways. By providing a database in a curated, machine readable way, omics data analysis and visualization is enabled. WikiPathways and other pathway databases are used to analyze experimental data by research groups in many fields. Due to the open and collaborative nature of the WikiPathways platform, our content keeps growing and is getting more accurate, making WikiPathways a reliable and rich pathway database. Previously, however, the focus was primarily on genes and proteins, leaving many metabolites with only limited annotation. Recent curation efforts focused on improving the annotation of metabolism and metabolic pathways by associating unmapped metabolites with database identifiers and providing more detailed interaction knowledge. Here, we report the outcomes of the continued growth and curation efforts, such as a doubling of the number of annotated metabolite nodes in WikiPathways. Furthermore, we introduce an OpenAPI documentation of our web services and the FAIR (Findable, Accessible, Interoperable and Reusable) annotation of resources to increase the interoperability of the knowledge encoded in these pathways and experimental omics data. New search options, monthly downloads, more links to metabolite databases, and new portals make pathway knowledge more effortlessly accessible to individual researchers and research communities.
0

FAIR Principles: Interpretations and Implementation Considerations

Annika Jacobsen et al.Nov 1, 2019
The FAIR principles have been widely cited, endorsed and adopted by a broad range of stakeholders since their publication in 2016. By intention, the 15 FAIR guiding principles do not dictate specific technological implementations, but provide guidance for improving Findability, Accessibility, Interoperability and Reusability of digital resources. This has likely contributed to the broad adoption of the FAIR principles, because individual stakeholder communities can implement their own FAIR solutions. However, it has also resulted in inconsistent interpretations that carry the risk of leading to incompatible implementations. Thus, while the FAIR principles are formulated on a high level and may be interpreted and implemented in different ways, for true interoperability we need to support convergence in implementation choices that are widely accessible and (re)-usable. We introduce the concept of FAIR implementation considerations to assist accelerated global participation and convergence towards accessible, robust, widespread and consistent FAIR implementations. Any self-identified stakeholder community may either choose to reuse solutions from existing implementations, or when they spot a gap, accept the challenge to create the needed solution, which, ideally, can be used again by other communities in the future. Here, we provide interpretations and implementation considerations (choices and challenges) for each FAIR principle.
0
Paper
Citation278
0
Save
0

Understanding signaling and metabolic paths using semantified and harmonized information about biological interactions

Ryan Miller et al.Aug 3, 2020
Abstract Background To grasp the complexity of biological processes, the biological knowledge is often translated into schematic diagrams of biological pathways, such as signalling and metabolic pathways. These pathway diagrams describe relevant connections between biological entities and incorporate domain knowledge in a visual format that is easier for humans to interpret. It has already been established that these diagrams can be represented in machine readable formats, as done in KEGG, Reactome, and WikiPathways. However, while humans are good at interpreting the message of the creator of such a diagram, algorithms struggle when the diversity in drawing approaches increases. WikiPathways supports multiple drawing styles, and therefore needs to harmonize this to offer semantically enriched access via the Resource Description Framework format. Particularly challenging in the normalization of diagrams are the interactions between the biological entities, so that we can glean information about the connectivity of the entities represented. These interactions include information about the type of interaction (metabolic conversion, inhibition, etc.), the direction, and the participants. Availability of the interactions in a semantic and harmonized format enables searching the full network of biological interactions and integration with the linked data cloud. Results We here study how the graphically modelled biological knowledge in diagrams can be semantified and harmonized efficiently, and exemplify how the resulting data can be used to programmatically answer biological questions. We find that we can translate graphically modelled biological knowledge to a sufficient degree into a semantic model of biological knowledge and discuss some of the current limitations. Furthermore, we show how this interaction knowledge base can be used to answer specific biological questions. Conclusion This paper demonstrates that most of the graphical biological knowledge from WikiPathways is modelled in the semantic layer of WikiPathways with the semantic information intact and connectivity information preserved. The usability of the WikiPathways pathway and connectivity information has shown to be useful and has been integrated into other platforms. Being able to evaluate how biological elements affect each other is useful and allows, for example, the identification of up or downstream targets that will have a similar effect when modified.
0

Centralizing content and distributing labor: a community model for curating the very long tail of microbial genomes.

Tim Putman et al.Nov 12, 2015
The last 20 years of advancement in DNA sequencing technologies have led to the sequencing of thousands of microbial genomes, creating mountains of genetic data. While our efficiency in generating the data improves almost daily, applying meaningful relationships between the taxonomic and genetic entities on this scale requires a structured and integrative approach. Currently, the knowledge is distributed across a fragmented landscape of resources from government-funded institutions such as NCBI and UniProt to topic-focused databases like the ODB3 database of prokaryotic operons, to the supplemental table of a primary publication. A major drawback to large scale, expert curated databases is the expense of maintaining and extending them over time. No entity apart from a major institution with stable long term funding can consider this, and their scope is limited considering the magnitude of microbial data being generated daily. Wikidata is an, openly editable, semantic web compatible framework for knowledge representation. It is a project of the Wikimedia Foundation and offers knowledge integration capabilities ideally suited to the challenge of representing the exploding body of information about microbial genomics. We are developing a microbial specific data model, based on Wikidata's semantic web compatibility, that represents bacterial species, strains and the gene and gene products that define them. Currently, we have loaded 1736 gene items and 1741 protein items for two strains of the human pathogenic bacteria Chlamydia trachomatis and used this subset of data as an example of the empowering utility of this model. In our next phase of development, we will expand by adding another 118 bacterial genomes and their gene and gene products, totaling over 900,000 additional entities. This aggregation of knowledge will be a platform for community-driven collaboration, allowing the networking of microbial genetic data through the sharing of knowledge by both the data and domain expert.
Load More