MC
Mikaela Cashman
Author with expertise in Analysis of Gene Interaction Networks
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
5
(60% Open Access)
Cited by:
1
h-index:
6
/
i10-index:
6
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

MENTOR: Multiplex Embedding of Networks for Team-Based Omics Research

Kyle Sullivan et al.Jul 22, 2024
+6
A
J
K
Abstract While the proliferation of data-driven omics technologies has continued to accelerate, methods of identifying relationships among large-scale changes from omics experiments have stagnated. It is therefore imperative to develop methods that can identify key mechanisms among one or more omics experiments in order to advance biological discovery. To solve this problem, here we describe the network-based algorithm MENTOR - Multiplex Embedding of Networks for Team-Based Omics Research. We demonstrate MENTOR’s utility as a supervised learning approach to successfully partition a gene set containing multiple ontological functions into their respective functions. Subsequently, we used MENTOR as an unsupervised learning approach to identify important biological functions pertaining to the host genetic architectures in Populus trichocarpa associated with microbial abundance of multiple taxa. Moreover, as open source software designed with scientific teams in mind, we demonstrate the ability to use the output of MENTOR to facilitate distributed interpretation of omics experiments.
3

A Molecular Communication model for cellular metabolism

Zahmeeth Sakkaff et al.Jun 30, 2023
+6
J
A
Z
Abstract Understanding cellular engagement with its environment is essential to control and monitor metabolism. Molecular Communication theory (MC) offers a computational means to identify environmental perturbations that direct or signify cellular behaviors by quantifying the information about a molecular environment that is transmitted through a metabolic system. We developed an model that integrates conventional flux balance analysis metabolic modeling (FBA) and MC to mechanistically expand the scope of MC, and thereby uniquely blends mechanistic biology and information theory to understand how substrate consumption is captured reaction activity, metabolite excretion, and biomass growth. This is enabled by defining several channels through which environmental information transmits in a metabolic network. The information flow in bits that is calculated through this workflow further determines the maximal metabolic effect of environmental perturbations on cellular metabolism and behaviors, since FBA simulates maximal efficiency of the metabolic system. We exemplify this method on two intestinal symbionts – Bacteroides thetaiotaomicron and Methanobrevibacter smithii – and visually consolidated the results into constellation diagrams that facilitate interpretation of information flow from given environments and thereby cultivate the design of controllable biological systems. The unique confluence of metabolic modeling and information theory in this model advances basic understanding of cellular metabolism and has applied value for the Internet of Bio-Nano Things, synthetic biology, microbial ecology, and autonomous laboratories.
0

RWRtoolkit: multi-omic network analysis using random walks on multiplex networks in any species

David Kainer et al.Jul 19, 2024
+21
K
M
D
Leveraging the use of multiplex multi-omic networks, key insights into genetic and epigenetic mechanisms supporting biofuel production have been uncovered. Here, we introduce RWRtoolkit, a multiplex generation, exploration, and statistical package built for R and command line users. RWRtoolkit enables the efficient exploration of large and highly complex biological networks generated from custom experimental data and/or from publicly available datasets, and is species agnostic. A range of functions can be used to find topological distances between biological entities, determine relationships within sets of interest, search for topological context around sets of interest, and statistically evaluate the strength of relationships within and between sets. The command-line interface is designed for parallelisation on high performance cluster systems, which enables high throughput analysis such as permutation testing. Several tools in the package have also been made available for use in reproducible workflows via the KBase web application.
1

Dissecting Complexity: The Hidden Impact of Application Parameters on Bioinformatics Research

Mikaela Cashman et al.Dec 21, 2022
R
A
M
M
Abstract Biology is a quest; an ongoing inquiry about the nature of life. How do the different forms of life interact? What makes up an ecosystem? How does a tiny bacterium work? To answer these questions biologists turn increasingly to sophisticated computational tools. Many of these tools are highly configurable, allowing customization in support of a wide range of uses. For example, algorithms can be tuned for precision, efficiency, type of inquiry, or for specific categories of organisms or their component subsystems. Ideally, configurability provides useful flexibility. However, the complex landscape of configurability may be fraught with pitfalls. This paper examines that landscape in bioinformatics tools. We propose a methodology, SOMATA, to facilitate systematic exploration of the vast choice of application parameters, and apply it to three different tools on a range of scientific inquires. We further argue that the tools themselves are complex ecosystems. If biologists explore these, ask questions, and experiment just as they do with their biological counterparts, they will benefit by both finding improved solutions to their problems as well as increasing repeatability and transparency. We end with a call to the community for an increase in shared responsibility and communication between tool developers and the biologists that use them in the context of complex system decomposition.
1

Climatic clustering and longitudinal analysis with impacts on food, bioenergy, and pandemics

John Lagergren et al.Oct 1, 2021
+8
V
M
J
Abstract Predicted growth in world population will put unparalleled stress on the need for sustainable energy and global food production, as well as increase the likelihood of future pandemics. In this work, we identify high-resolution environmental zones in the context of a changing climate and predict longitudinal processes relevant to these challenges. We do this using exhaustive vector comparison methods that measure the climatic similarity between all locations on earth at high geospatial resolution. The results are captured as networks, in which edges between geolocations are defined if their historical climates exceed a similarity threshold. We then apply Markov clustering and our novel Correlation of Correlations method to the resulting climatic networks, which provides unprecedented agglomerative and longitudinal views of climatic relationships across the globe. The methods performed here resulted in the fastest (9.37 × 10 18 operations/sec) and one of the largest (168.7 × 10 21 operations) scientific computations ever performed, with more than 100 quadrillion edges considered for a single climatic network. Correlation and network analysis methods of this kind are widely applicable across computational and predictive biology domains, including systems biology, ecology, carbon cycles, biogeochemistry, and zoonosis research.