AK
Andrey Kartashov
Author with expertise in Genomic Landscape of Cancer and Mutational Signatures
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
6
(50% Open Access)
Cited by:
393
h-index:
18
/
i10-index:
22
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

CWL-Airflow: a lightweight pipeline manager supporting Common Workflow Language

Michael Kotliar et al.Jan 17, 2018
Abstract Background Massive growth in the amount of research data and computational analysis has led to increased utilization of pipeline managers in biomedical computational research. However, each of more than 100 such managers uses its own way to describe pipelines, leading to difficulty porting workflows to different environments and therefore poor reproducibility of computational studies. For this reason, the Common Workflow Language (CWL) was recently introduced as a specification for platform-independent workflow description, and work began to transition existing pipelines and workflow managers to CWL. Findings Here, we present CWL-Airflow, an extension for the Apache Airflow pipeline manager supporting CWL. CWL-Airflow utilizes CWL v1.0 specification and can be used to run workflows on standalone MacOS/Linux servers, on clusters, or on a variety of cloud platforms. A sample CWL pipeline for processing of ChIP-Seq data is provided. Conclusions CWL-Airflow will provide users with the features of a fully-fledged pipeline manager and an ability to execute CWL workflows anywhere Airflow can run—from a laptop to cluster or cloud environment. Availability CWL-Airflow is available under Apache license v.2 and can be downloaded from https://barski-lab.github.io/cwl-airflow , http://doi.org/10.5281/zenodo.2669582 , RRID: SCR_017196.
0

BioWardrobe: an integrated platform for analysis of epigenomics and transcriptomics data

Andrey Kartashov et al.Dec 18, 2014
Development of next-generation sequencing has revolutionized molecular biology by enhancing the ability to perform genome-wide studies. However, due to the need for bioinformatic expertise and the size of resulting datasets, use of these technologies is still beyond the capabilities of many laboratories. Herein, we present the Wardrobe Experiment Management System, which allows users to store, visualize and analyze epigenomic and transcriptomic next-generation sequencing data using a biologist-friendly, web-based graphical user interface without the need for programming expertize. Wardrobe can be installed on consumer-class hardware within an institutional local network. Analysis capabilities include predefined pipelines that allow the user to download data from either institutional core facilities or public databases, perform quality control, map reads and visualize data on a built-in mirror of the University of California, Santa Cruz (UCSC) genome browser. Reads per kilobase of transcript per million reads mapped (RPKMs) are calculated for RNA sequencing (RNA-Seq), and islands of enrichment are identified for chromatin immunoprecipitation sequencing (ChIP-Seq) and similar datasets. Advanced analysis capabilities include analyzing differential gene expression and binding and creating average tag density profiles and heatmaps. The Wardrobe package and documentation is available at https://biowardrobe.com. A limited functionality demo-version is available at http://demo.biowardrobe.com