MF
Maxwell Farrell
Author with expertise in Emerging Zoonotic Diseases and One Health Approach
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
8
(75% Open Access)
Cited by:
39
h-index:
18
/
i10-index:
27
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Optimizing predictive models to prioritize viral discovery in zoonotic reservoirs

Daniel Becker et al.May 23, 2020
Abstract Despite global investment in One Health disease surveillance, it remains difficult—and often very costly—to identify and monitor the wildlife reservoirs of novel zoonotic viruses. Statistical models can be used to guide sampling prioritization, but predictions from any given model may be highly uncertain; moreover, systematic model validation is rare, and the drivers of model performance are consequently under-documented. Here, we use bat hosts of betacoronaviruses as a case study for the data-driven process of comparing and validating predictive models of likely reservoir hosts. In the first quarter of 2020, we generated an ensemble of eight statistical models that predict host-virus associations and developed priority sampling recommendations for potential bat reservoirs and potential bridge hosts for SARS-CoV-2. Over more than a year, we tracked the discovery of 40 new bat hosts of betacoronaviruses, validated initial predictions, and dynamically updated our analytic pipeline. We find that ecological trait-based models perform extremely well at predicting these novel hosts, whereas network methods consistently perform roughly as well or worse than expected at random. These findings illustrate the importance of ensembling as a buffer against variation in model quality and highlight the value of including host ecology in predictive models. Our revised models show improved performance and predict over 400 bat species globally that could be undetected hosts of betacoronaviruses. Although 20 species of horseshoe bats ( Rhinolophus spp.) are known to be the primary reservoir of SARS-like viruses, we find at least three-fourths of plausible betacoronavirus reservoirs in this bat genus might still be undetected. Our study is the first to demonstrate through systematic validation that machine learning models can help optimize wildlife sampling for undiscovered viruses and illustrates how such approaches are best implemented through a dynamic process of prediction, data collection, validation, and updating.
1
Paper
Citation18
0
Save
67

Data proliferation, reconciliation, and synthesis in viral ecology

Rory Gibb et al.Jan 16, 2021
Abstract The fields of viral ecology and evolution have rapidly expanded in the last two decades, driven by technological improvements, and motivated by efforts to discover potentially zoonotic wildlife viruses under the rubric of pandemic prevention. One consequence has been a massive proliferation of host-virus association data, which comprise the backbone of research in viral macroecology and zoonotic risk prediction. These data remain fragmented across numerous data portals and projects, each with their own scope, structure, and reporting standards. Here, we propose that synthesis of host-virus association data is a central challenge to improve our understanding of the global virome and develop foundational theory in viral ecology. To illustrate this, we build an open reconciled mammal-virus database from four key published datasets, applying a standardized taxonomy and metadata. We show that reconciling these datasets provides a substantially richer view of the mammal virome than that offered by any one individual database. We argue for a shift in best practice towards the incremental development and use of synthetic datasets in viral ecology research, both to improve comparability and replicability across studies, and to facilitate future efforts to use machine learning to predict the structure and dynamics of the global virome.
67
Citation16
0
Save
152

The Global Virome in One Network (VIRION): an atlas of vertebrate-virus associations

Colin Carlson et al.Aug 9, 2021
Abstract Data cataloguing viral diversity on Earth have been fragmented across sources, disciplines, formats, and various degrees of open collation, posing challenges for research on macroecology, evolution, and public health. Here, we solve this problem by establishing a dynamically-maintained database of vertebrate-virus associations, called The Global Virome in One Network (VIRION). The VIRION database has been assembled through both reconciliation of static datasets and integration of dynamically-updated databases. These data sources are all harmonized against one taxonomic backbone, including metadata on host and virus taxonomic validity and higher classification; additional metadata on sampling methodology and evidence strength are also available in a harmonized format. In total, the VIRION database is the largest open-source, open-access database of its kind, with roughly half a million unique records that include 9,521 resolved virus “species” (of which 1,661 are ICTV ratified), 3,692 resolved vertebrate host species, and 23,147 unique interactions between taxonomically-valid organisms. Together, these data cover roughly a quarter of mammal diversity, a tenth of bird diversity, and ~6% of the estimated total diversity of vertebrates, and a much larger proportion of their virome than any previous database. We show how these data can be used to test hypotheses about microbiology, ecology, and evolution, and make suggestions for best practices that address the unique mix of evidence that coexists in these data.
152
Citation4
0
Save
0

Environmental DNA as a management tool for tracking artificial waterhole use in savanna ecosystems

Maxwell Farrell et al.Nov 5, 2020
Abstract Game parks are the last preserve of many large mammals, and in savanna ecosystems, management of surface waters poses a conservation challenge. In arid and semi-arid regions, water can be a scarce resource during dry seasons and drought. Artificial waterholes are common in parks and reserves across Africa, but can alter mammal community composition by favoring drought intolerant species, with consequences for disease dynamics, and population viability of drought-tolerant species. Analysis of waterborne environmental DNA (eDNA) is increasingly used to inform conservation of rare and invasive species, and conduct large-scale biodiversity assessments. To explore the reliability of eDNA as an indicator of mammal waterhole use in savannas, we compare eDNA metabarcoding and camera traps for documenting artificial waterhole use in the Kruger National Park, South Africa, a global hotspot for mammal diversity. We show that eDNA metabarcoding can recover the majority of mammal species detected by camera traps, including a number of endangered species, but DNA signatures of mammal visitation are temporally limited, with best performance when tracking water-dependent large bodied mammals visiting within two days of sampling. Our results highlight limitation of eDNA based monitoring in these systems, including the lack of long-term eDNA persistence in small and highly utilized waterholes, and variability in detection rates among species. However, we demonstrate that eDNA-based approaches can be used to track mammals of conservation concern, and reflect patterns of recent waterhole use and co-occurrence across water-dependent species, both of which are crucial for making evidence-based decisions regarding water management and provisioning.
0
Paper
Citation1
0
Save
0

Disease mortality in domesticated animals is predicted by host evolutionary relationships

Maxwell Farrell et al.Oct 8, 2018
Infectious diseases of domesticated animals impact human well-being via food insecurity, loss of livelihoods, and human infections. While much research has focused on parasites that infect single host species, most parasites of domesticated mammals infect multiple species. The impact of multi-host parasites varies across hosts; some rarely result in death, whereas others are nearly always fatal. Despite their high ecological and societal costs, we currently lack theory for predicting the lethality of multi-host parasites. Here, using a global dataset of over 4000 case-fatality rates for 65 infectious diseases (caused by micro and macro-parasites) and 12 domesticated host species, we show that the average evolutionary distance from an infected host to other mammal host species is a strong predictor of disease-induced mortality. We find that as parasites infect species outside of their documented phylogenetic host range, they are more likely to result in lethal infections, with the odds of death doubling for each additional 10 million years of evolutionary distance. Our results for domesticated animal diseases reveal patterns in the evolution of highly lethal parasites that are difficult to observe in the wild, and further suggest that the severity of infectious diseases may be predicted from evolutionary relationships among hosts.
0

Large language models help facilitate the automated synthesis of information on potential pest controllers

Daan Scheepens et al.Jan 15, 2024
The body of ecological literature, which informs much of our knowledge of the global loss of biodiversity, has been experiencing rapid growth in recent decades. The increasing difficulty to synthesise this literature manually has simultaneously resulted in a growing demand for automated text mining methods. Within the domain of deep learning, large language models (LLMs) have been the subject of considerable attention in recent years by virtue of great leaps in progress and a wide range of potential applications, however, quantitative investigation into their potential in ecology has so far been lacking. In this work, we analyse the ability of GPT-4 to extract information about invertebrate pests and pest controllers from abstracts of a body of literature on biological pest control, using a bespoke, zero-shot prompt. Our results show that the performance of GPT-4 is highly competitive with other state-of-the-art tools used for taxonomic named entity recognition and geographic location extraction tasks. On a held-out test set, we show that species and geographic locations are extracted with F1-scores of 99.8% and 95.3%, respectively, and highlight that the model is able to distinguish very effectively between the primary roles of interest (predators, parasitoids and pests). Moreover, we demonstrate the ability of the model to effectively extract and predict taxonomic information across various taxonomic ranks, and to automatically correct spelling mistakes. However, we do report a small number of cases of fabricated information (hallucinations). As a result of the current lack of specialised, pre-trained ecological language models, general-purpose LLMs may provide a promising way forward in ecology. Combined with tailored prompt engineering, such models can be employed for a wide range of text mining tasks in ecology, with the potential to greatly reduce time spent on manual screening and labelling of the literature.