PP
Paul Pyl
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(75% Open Access)
Cited by:
19,684
h-index:
9
/
i10-index:
9
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

HTSeq—a Python framework to work with high-throughput sequencing data

Simon Anders et al.Sep 25, 2014
W
P
S
Abstract Motivation: A large choice of tools exists for many standard tasks in the analysis of high-throughput sequencing (HTS) data. However, once a project deviates from standard workflows, custom scripts are needed. Results: We present HTSeq, a Python library to facilitate the rapid development of such scripts. HTSeq offers parsers for many common data formats in HTS projects, as well as classes to represent data, such as genomic coordinates, sequences, sequencing reads, alignments, gene model information and variant calls, and provides data structures that allow for querying via genomic coordinates. We also present htseq-count, a tool developed with HTSeq that preprocesses RNA-Seq data for differential expression analysis by counting the overlap of reads with genes. Availability and implementation: HTSeq is released as an open-source software under the GNU General Public Licence and available from http://www-huber.embl.de/HTSeq or from the Python Package Index at https://pypi.python.org/pypi/HTSeq . Contact: sanders@fs.tum.de
0

Recovery of gut microbiota of healthy adults following antibiotic exposure

Albert Pallejà et al.Oct 17, 2018
+20
S
K
A
To minimize the impact of antibiotics, gut microorganisms harbour and exchange antibiotics resistance genes, collectively called their resistome. Using shotgun sequencing-based metagenomics, we analysed the partial eradication and subsequent regrowth of the gut microbiota in 12 healthy men over a 6-month period following a 4-day intervention with a cocktail of 3 last-resort antibiotics: meropenem, gentamicin and vancomycin. Initial changes included blooms of enterobacteria and other pathobionts, such as Enterococcus faecalis and Fusobacterium nucleatum, and the depletion of Bifidobacterium species and butyrate producers. The gut microbiota of the subjects recovered to near-baseline composition within 1.5 months, although 9 common species, which were present in all subjects before the treatment, remained undetectable in most of the subjects after 180 days. Species that harbour β-lactam resistance genes were positively selected for during and after the intervention. Harbouring glycopeptide or aminoglycoside resistance genes increased the odds of de novo colonization, however, the former also decreased the odds of survival. Compositional changes under antibiotic intervention in vivo matched results from in vitro susceptibility tests. Despite a mild yet long-lasting imprint following antibiotics exposure, the gut microbiota of healthy young adults are resilient to a short-term broad-spectrum antibiotics intervention and their antibiotics resistance gene carriage modulates their recovery processes. Here the authors show that the human gut microbiome can recover after a clinically relevant, broad-spectrum antibiotic treatment and characterization of the resistome indicates that antibiotic resistance genes can impact the recovery process.
0
Citation581
0
Save
0

Analysing high-throughput sequencing data in Python with HTSeq 2.0

Givanna Putri et al.Mar 18, 2022
+2
P
S
G
Abstract Summary HTSeq 2.0 provides a more extensive application programming interface including a new representation for sparse genomic data, enhancements for htseq-count to suit single-cell omics, a new script for data using cell and molecular barcodes, improved documentation, testing and deployment, bug fixes and Python 3 support. Availability and implementation HTSeq 2.0 is released as an open-source software under the GNU General Public License and is available from the Python Package Index at https://pypi.python.org/pypi/HTSeq. The source code is available on Github at https://github.com/htseq/htseq. Supplementary information Supplementary data are available at Bioinformatics online.
0

The Genomic and Transcriptomic Landscape of a HeLa Cell Line

Jonathan Landry et al.Mar 28, 2013
+11
T
P
J
Abstract HeLa is the most widely used model cell line for studying human cellular and molecular biology. To date, no genomic reference for this cell line has been released, and experiments have relied on the human reference genome. Effective design and interpretation of molecular genetic studies performed using HeLa cells require accurate genomic information. Here we present a detailed genomic and transcriptomic characterization of a HeLa cell line. We performed DNA and RNA sequencing of a HeLa Kyoto cell line and analyzed its mutational portfolio and gene expression profile. Segmentation of the genome according to copy number revealed a remarkably high level of aneuploidy and numerous large structural variants at unprecedented resolution. Some of the extensive genomic rearrangements are indicative of catastrophic chromosome shattering, known as chromothripsis. Our analysis of the HeLa gene expression profile revealed that several pathways, including cell cycle and DNA repair, exhibit significantly different expression patterns from those in normal human tissues. Our results provide the first detailed account of genomic variants in the HeLa genome, yielding insight into their impact on gene expression and cellular function as well as their origins. This study underscores the importance of accounting for the strikingly aberrant characteristics of HeLa cells when designing and interpreting experiments, and has implications for the use of HeLa as a model of human biology.
0
Citation418
0
Save
5

”Evolution of ipsilateral breast cancer decoded by proteogenomics”

Tommaso Marchi et al.Jul 14, 2022
+13
M
P
T
Abstract Ipsilateral breast tumor recurrence (IBTR) is a clinically important event, where an isolated in-breast recurrence is a potentially curable event but also associated with an increased risk of distant metastases and breast cancer death. It currently remains unclear if IBTRs are associated with molecular changes that can be explored as a resource for precision medicine strategies targeting locally recurring breast cancer. Here, we employed a recently developed proteogenomics workflow to analyze a cohort of 27 primary breast cancers and their matched IBTRs by whole genome sequencing, RNA sequencing, and mass spectrometry-based proteomics to define proteogenomic features of tumor evolution. Analysis of mutational signatures, copy number changes, and cancer specific mutations revealed a relationship with estrogen and progesterone receptor statuses and increased levels of genetic change. This in turn altered the re-programming of the transcriptome and proteome towards a recurring molecular disease phenotype with high replicating capacity and a higher degree of genomic instability possibly enhanced by high expression of APOBEC3B . In conclusion, this study defines how primary breast tumors differentially evolve into different ipsilateral recurrent malignancies depending on their key biomarker status, suggesting that further enhancing the genomic instability in some tumors could serve as an alternative treatment option.
1

“A Proteogenomic workflow reveals distinct molecular phenotypes related to breast cancer appearance”

Tommaso Marchi et al.May 7, 2020
+5
M
P
T
Abstract Proteogenomics approaches have enabled the generation of extensive information levels when compared to single omics technology studies, although burdened by massive experimental efforts. Here, we developed four improvements of a data independent acquisition mass spectrometry proteogenomics workflow to reveal distinct molecular phenotypes related to breast cancer appearance. We confirm mutational processes detectable at the protein level and highlight quantitation and pathway complementarity between RNA and protein data. Our analyses also validated previously established enrichments of estrogen receptor-dependent molecular features relating to transcription factor expression, and provided evidence for molecular differences related to the presence of mammographic appearances in spiculated tumors. In addition, several transcript-protein pairs displayed radically different abundance correlations depending on the overall clinical and pathological properties of the tumor. These results demonstrate that there are differentially regulated protein networks in clinically relevant sample groups, and that these protein networks influence both cancer biology as well as the abundance of potential biomarkers and drug targets.
5

Cerebrospinal fluid proteome maps detect pathogen-specific host response patterns in meningitis

Anahita Bakochi et al.Sep 18, 2020
+3
P
T
A
Abstract Meningitis is a potentially life-threatening infection characterized by the inflammation of the leptomeningeal membranes. Many different viral and bacterial pathogens can cause meningitis, with differences in mortality rates, risk of developing neurological sequelae and treatment options. Here we constructed a compendium of digital cerebrospinal fluid (CSF) proteome maps to define pathogen-specific host response patterns in meningitis. The results revealed a drastic and pathogen-type specific influx of tissue-, cell- and plasma proteins in the CSF, where in particular a large increase of neutrophil derived proteins in the CSF correlated with acute bacterial meningitis. Additionally, both acute bacterial and viral meningitis result in marked reduction of brain-enriched proteins. Generation of a multi-protein LASSO regression model resulted in an 18-protein panel of cell and tissue associated proteins capable of classifying acute bacterial meningitis and viral meningitis. The same protein panel also enabled classification of tick-borne encephalitis, a subgroup of viral meningitis, with high sensitivity and specificity. The work provides insights into pathogen specific host response patterns in CSF from different disease etiologies to support future classification of pathogen-type based on host response patterns in meningitis.
0

HTSeq - A Python framework to work with high-throughput sequencing data

Simon Anders et al.Feb 20, 2014
W
P
S
Motivation: A large choice of tools exists for many standard tasks in the analysis of high-throughput sequencing (HTS) data. However, once a project deviates from standard work flows, custom scripts are needed. Results: We present HTSeq, a Python library to facilitate the rapid development of such scripts. HTSeq offers parsers for many common data formats in HTS projects, as well as classes to represent data such as genomic coordinates, sequences, sequencing reads, alignments, gene model information, variant calls, and provides data structures that allow for querying via genomic coordinates. We also present htseq-count, a tool developed with HTSeq that preprocesses RNA-Seq data for differential expression analysis by counting the overlap of reads with genes. Availability: HTSeq is released as open-source software under the GNU General Public Licence and available from http://www-huber.embl.de/HTSeq or from the Python Package Index, https://pypi.python.org/pypi/HTSeq