MD
Maria Doyle
Author with expertise in Genomic Landscape of Cancer and Mutational Signatures
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(63% Open Access)
Cited by:
1,697
h-index:
30
/
i10-index:
43
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
117

Interfacing Seurat with the R tidy universe

Stefano Mangiola et al.Mar 29, 2021
Abstract Motivation Seurat is one of the most popular software suites for the analysis of single-cell RNA sequencing data. Considering the popularity of the tidyverse ecosystem, which offers a large set of data display, query, manipulation, integration and visualisation utilities, a great opportunity exists to interface the Seurat object with the tidyverse. This gives the large data science community of tidyverse users the possibility to operate with a familiar grammar. Results In order to provide Seurat with a tidyverse-oriented interface without compromising on efficiency, we developed tidyseurat, a light-weight adapter to the tidyverse. Cell information is automatically displayed as a tibble abstraction, which interfaces Seurat with dplyr, tidyr, ggplot2 and plotly packages powering efficient data manipulation, integration and visualisation. Iterative analyses on data subsets is enabled by interfacing with the popular nest-map framework. Availability and implementation The software is freely available at cran.r-project.org/web/packages/tidyseurat/ and github.com/stemangiola/tidyseurat Contact Stefano Mangiola ( mangiola.s@wehi.edu.au ) and Anthony T Papenfuss ( papenfuss@wehi.edu.au ).
33

A single-cell RNA-seq Training and Analysis Suite using the Galaxy Framework

Mehmet Tekman et al.Jun 8, 2020
Abstract Background The vast ecosystem of single-cell RNA-seq tools has until recently been plagued by an excess of diverging analysis strategies, inconsistent file formats, and compatibility issues between different software suites. The uptake of 10x Genomics datasets has begun to calm this diversity, and the bioinformatics community leans once more towards the large computing requirements and the statistically-driven methods needed to process and understand these ever-growing datasets. Results Here we outline several Galaxy workflows and learning resources for scRNA-seq, with the aim of providing a comprehensive analysis environment paired with a thorough user learning experience that bridges the knowledge gap between the computational methods and the underlying cell biology. The Galaxy reproducible bioinformatics framework provides tools, workflows and trainings that not only enable users to perform one-click 10x preprocessing, but also empowers them to demultiplex raw sequencing from custom tagged and full-length sequencing protocols. The downstream analysis supports a wide range of high-quality interoperable suites separated into common stages of analysis: inspection, filtering, normalization, confounder removal and clustering. The teaching resources cover an assortment of different concepts from computer science to cell biology. Access to all resources is provided at the singlecell.usegalaxy.eu portal. Conclusions The reproducible and training-oriented Galaxy framework provides a sustainable HPC environment for users to run flexible analyses on both 10x and alternative platforms. The tutorials from the Galaxy Training Network along with the frequent training workshops hosted by the Galaxy Community provide a means for users to learn, publish and teach scRNA-seq analysis. Key Points Single-cell RNA-seq has stabilised towards 10x Genomics datasets. Galaxy provides rich and reproducible scRNA-seq workflows with a wide range of robust tools. The Galaxy Training Network provides tutorials for the processing of both 10x and non-10x datasets.
33
Paper
Citation4
0
Save
65

Galaxy Training: A Powerful Framework for Teaching!

Saskia Hiltemann et al.Jun 3, 2022
Abstract There is an ongoing explosion of scientific datasets being generated, brought on by recent technological advances in many areas of the natural sciences. As a result, the life sciences have become increasingly computational in nature, and bioinformatics has taken on a central role in research studies. However, basic computational skills, data analysis and stewardship are still rarely taught in life science educational programs [1], resulting in a skills gap in many of the researchers tasked with analysing these big datasets. In order to address this skills gap and empower researchers to perform their own data analyses, the Galaxy Training Network (GTN) has previously developed the Galaxy Training Platform ( https://training.galaxyproject.org ); an open access, community-driven framework for the collection of FAIR training materials for data analysis utilizing the user-friendly Galaxy framework as its primary data analysis platform [2]. Since its inception, this training platform has thrived, with the number of tutorials and contributors growing rapidly, and the range of topics extending beyond life sciences to include topics such as climatology, cheminformatics and machine learning. While initially aimed at supporting researchers directly, the GTN framework has proven to be an invaluable resource for educators as well. We have focused our efforts in recent years on adding increased support for this growing community of instructors. New features have been added to facilitate the use of the materials in a classroom setting, simplifying the contribution flow for new materials, and have added a set of train-the-trainer lessons. Here, we present the latest developments in the GTN project, aimed at facilitating the use of the Galaxy Training materials by educators, and its usage in different learning environments.
65
Paper
Citation2
0
Save
91

Optimizing Short-format Training: an International Consensus on Effective, Inclusive, and Career-spanning Professional Development in the Life Sciences and Beyond

Jason Williams et al.Mar 13, 2023
ABSTRACT Science, technology, engineering, mathematics, and medicine (STEMM) fields change rapidly and are increasingly interdisciplinary. Commonly, STEMM practitioners use short-format training (SFT) such as workshops and short courses for upskilling and reskilling, but unaddressed challenges limit SFT’s effectiveness and inclusiveness. Prior work, including the NSF 2026 Reinventing Scientific Talent proposal, called for addressing SFT challenges, and a diverse international group of experts in education, accessibility, and life sciences came together to do so. This paper describes the phenomenography and content analyses that produced a set of 14 actionable recommendations to systematically strengthen SFT. Recommendations were derived from findings in the educational sciences and the experiences of several of the largest life science SFT programs. Recommendations cover the breadth of SFT contexts and stakeholder groups and include actions for instructors (e.g., make equity and inclusion an ethical obligation), programs (e.g., centralize infrastructure for assessment and evaluation), as well as organizations and funders (e.g., professionalize training SFT instructors; deploy SFT to counter inequity). Recommendations are aligned into a purpose-built framework— “The Bicycle Principles”—that prioritizes evidenced-based teaching, inclusiveness, and equity, as well as the ability to scale, share, and sustain SFT. We also describe how the Bicycle Principles and recommendations are consistent with educational change theories and can overcome systemic barriers to delivering consistently effective, inclusive, and career-spanning SFT. SIGNIFICANCE STATEMENT STEMM practitioners need sustained and customized professional development to keep up with innovations. Short-format training (SFT) such as workshops and short-courses are relied upon widely but have unaddressed limitations. This project generated principles and recommendations to make SFT consistently effective, inclusive, and career-spanning. Optimizing SFT could broaden participation in STEMM by preparing practitioners more equitably with transformative skills. Better SFT would also serve members of the STEMM workforce who have several decades of productivity ahead, but who may not benefit from education reforms that predominantly focus on undergraduate STEMM. The Bicycle Principles and accompanying recommendations apply to any SFT instruction and may be especially useful in rapidly evolving and multidisciplinary fields such as artificial intelligence, genomics, and precision medicine.