IE
Ingo Ebersberger
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
20
(65% Open Access)
Cited by:
2,647
h-index:
39
/
i10-index:
75
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Improved software detection and extraction of ITS1 and ITS2 from ribosomal ITS sequences of fungi and other eukaryotes for analysis of environmental sequencing data

Johan Bengtsson‐Palme et al.Jul 19, 2013
Summary The nuclear ribosomal internal transcribed spacer ( ITS ) region is the primary choice for molecular identification of fungi. Its two highly variable spacers ( ITS 1 and ITS 2) are usually species specific, whereas the intercalary 5.8S gene is highly conserved. For sequence clustering and blast searches, it is often advantageous to rely on either one of the variable spacers but not the conserved 5.8S gene. To identify and extract ITS 1 and ITS 2 from large taxonomic and environmental data sets is, however, often difficult, and many ITS sequences are incorrectly delimited in the public sequence databases. We introduce ITS x, a Perl‐based software tool to extract ITS 1, 5.8S and ITS 2 – as well as full‐length ITS sequences – from both Sanger and high‐throughput sequencing data sets. ITS x uses hidden Markov models computed from large alignments of a total of 20 groups of eukaryotes, including fungi, metazoans and plants, and the sequence extraction is based on the predicted positions of the ribosomal genes in the sequences. ITS x has a very high proportion of true‐positive extractions and a low proportion of false‐positive extractions. Additionally, process parallelization permits expedient analyses of very large data sets, such as a one million sequence amplicon pyrosequencing data set. ITS x is rich in features and written to be easily incorporated into automated sequence analysis pipelines. ITS x paves the way for more sensitive blast searches and sequence clustering operations for the ITS region in eukaryotes. The software also permits elimination of non‐ ITS sequences from any data set. This is particularly useful for amplicon‐based next‐generation sequencing data sets, where insidious non‐target sequences are often found among the target sequences. Such non‐target sequences are difficult to find by other means and would contribute noise to diversity estimates if left in the data set.
0
Citation1,079
0
Save
0

A Phylogenomic Approach to Resolve the Arthropod Tree of Life

Karen Meusemann et al.Jun 9, 2010
Arthropods were the first animals to conquer land and air. They encompass more than three quarters of all described living species. This extraordinary evolutionary success is based on an astoundingly wide array of highly adaptive body organizations. A lack of robustly resolved phylogenetic relationships, however, currently impedes the reliable reconstruction of the underlying evolutionary processes. Here, we show that phylogenomic data can substantially advance our understanding of arthropod evolution and resolve several conflicts among existing hypotheses. We assembled a data set of 233 taxa and 775 genes from which an optimally informative data set of 117 taxa and 129 genes was finally selected using new heuristics and compared with the unreduced data set. We included novel expressed sequence tag (EST) data for 11 species and all published phylogenomic data augmented by recently published EST data on taxonomically important arthropod taxa. This thorough sampling reduces the chance of obtaining spurious results due to stochastic effects of undersampling taxa and genes. Orthology prediction of genes, alignment masking tools, and selection of most informative genes due to a balanced taxa–gene ratio using new heuristics were established. Our optimized data set robustly resolves major arthropod relationships. We received strong support for a sister group relationship of onychophorans and euarthropods and strong support for a close association of tardigrades and cycloneuralia. Within pancrustaceans, our analyses yielded paraphyletic crustaceans and monophyletic hexapods and robustly resolved monophyletic endopterygote insects. However, our analyses also showed for few deep splits that were recently thought to be resolved, for example, the position of myriapods, a remarkable sensitivity to methods of analyses.
0
Citation318
0
Save
0

HaMStR: Profile hidden markov model based search for orthologs in ESTs

Ingo Ebersberger et al.Jan 1, 2009
EST sequencing is a versatile approach for rapidly gathering protein coding sequences. They provide direct access to an organism's gene repertoire bypassing the still error-prone procedure of gene prediction from genomic data. Therefore, ESTs are often the only source for biological sequence data from taxa outside mainstream interest. The widespread use of ESTs in evolutionary studies and particularly in molecular systematics studies is still hindered by the lack of efficient and reliable approaches for automated ortholog predictions in ESTs. Existing methods either depend on a known species tree or cannot cope with redundancy in EST data.We present a novel approach (HaMStR) to mine EST data for the presence of orthologs to a curated set of genes. HaMStR combines a profile Hidden Markov Model search and a subsequent BLAST search to extend existing ortholog cluster with sequences from further taxa. We show that the HaMStR results are consistent with those obtained with existing orthology prediction methods that require completely sequenced genomes. A case study on the phylogeny of 35 fungal taxa illustrates that HaMStR is well suited to compile informative data sets for phylogenomic studies from ESTs and protein sequence data.HaMStR extends in a standardized manner a pre-defined set of orthologs with ESTs from further taxa. In the same fashion HaMStR can be applied to protein sequence data, and thus provides a comprehensive approach to compile ortholog cluster from any protein coding data. The resulting orthology predictions serve as the data basis for a variety of evolutionary studies. Here, we have demonstrated the application of HaMStR in a molecular systematics study. However, we envision that studies tracing the evolutionary fate of individual genes or functional complexes of genes will greatly benefit from HaMStR orthology predictions as well.
0
Citation296
0
Save
0

Pancrustacean Phylogeny in the Light of New Phylogenomic Data: Support for Remipedia as the Possible Sister Group of Hexapoda

Björn Reumont et al.Nov 1, 2011
Remipedes are a small and enigmatic group of crustaceans, first described only 30 years ago. Analyses of both morphological and molecular data have recently suggested a close relationship between Remipedia and Hexapoda. If true, the remipedes occupy an important position in pancrustacean evolution and may be pivotal for understanding the evolutionary history of crustaceans and hexapods. However, it is important to test this hypothesis using new data and new types of analytical approaches. Here, we assembled a phylogenomic data set of 131 taxa, incorporating newly generated 454 expressed sequence tag (EST) data from six species of crustaceans, representing five lineages (Remipedia, Laevicaudata, Spinicaudata, Ostracoda, and Malacostraca). This data set includes all crustacean species for which EST data are available (46 species), and our largest alignment encompasses 866,479 amino acid positions and 1,886 genes. A series of phylogenomic analyses was performed to evaluate pancrustacean relationships. We significantly improved the quality of our data for predicting putative orthologous genes and for generating data subsets by matrix reduction procedures, thereby improving the signal to noise ratio in the data. Eight different data sets were constructed, representing various combinations of orthologous genes, data subsets, and taxa. Our results demonstrate that the different ways to compile an initial data set of core orthologs and the selection of data subsets by matrix reduction can have marked effects on the reconstructed phylogenetic trees. Nonetheless, all eight data sets strongly support Pancrustacea with Remipedia as the sister group to Hexapoda. This is the first time that a sister group relationship of Remipedia and Hexapoda has been inferred using a comprehensive phylogenomic data set that is based on EST data. We also show that selecting data subsets with increased overall signal can help to identify and prevent artifacts in phylogenetic analyses.
0
Citation267
0
Save
27

Combinatorial CRISPR screening reveals functional buffering in autophagy

Valentina Diehl et al.Jul 28, 2020
ABSTRACT Functional genomics studies in model organisms and human cell lines provided important insights into gene functions and their context-dependent role in genetic circuits. However, our functional understanding of many of these genes and how they combinatorically regulate key biological processes, remains limited. To enable the SpCas9-dependent mapping of gene-gene interactions in human cells, we established 3Cs multiplexing for the generation of combinatorial gRNA libraries in a distribution-unbiased manner and demonstrate its robust performance. The optimal number for combinatorial hit calling was 16 gRNA pairs and the skew of a library’s distribution was identified as a critical parameter dictating experimental scale and data quality. Our approach enabled us to investigate 247,032 gRNA-pairs targeting 12,736 gene-interactions in human autophagy. We identified novel genes essential for autophagy and provide experimental evidence that gene-associated categories of phenotypic strengths exist in autophagy. Furthermore, circuits of autophagy gene interactions reveal redundant nodes driven by paralog genes. Our combinatorial 3Cs approach is broadly suitable to investigate unexpected gene-interaction phenotypes in unperturbed and diseased cell contexts.
27
Citation3
0
Save
6

FAS: Assessing the similarity between proteins using multi-layered feature architectures

Julian Dosch et al.Sep 3, 2022
Abstract Motivation Expert curation to differentiate between functionally diverged homologs and those that may still share a similar function routinely relies on the visual interpretation of domain architecture changes. However, the size of contemporary data sets integrating homologs from hundreds to thousands of species calls for alternate solutions. Scoring schemes to evaluate domain architecture similarities can help to automatize this procedure, in principle. But existing schemes are often too simplistic in the similarity assessment, many require an a-priori resolution of overlapping domain annotations, and those that allow overlaps to extend the set of annotations sources cannot account for redundant annotations. As a consequence, the gap between the automated similarity scoring and the similarity assessment based on visual architecture comparison is still too wide to make the integration of both approaches meaningful. Results Here, we present FAS, a scoring system for the comparison of multi-layered feature architectures integrating information from a broad spectrum of annotation sources. Feature architectures are represented as directed acyclic graphs, and redundancies are resolved in the course of comparison using a score maximization algorithm. A benchmark using more than 10,000 human-yeast ortholog pairs reveals that FAS consistently outperforms existing scoring schemes. Using three examples, we show how automated architecture similarity assessments can be routinely applied in the benchmarking of orthology assignment software, in the identification of functionally diverged orthologs, and in the identification of entries in protein collections that most likely stem from a faulty gene prediction. Availability and implementation FAS is available as python package: https://pypi.org/project/greedyFAS/
6
Citation2
0
Save
8

Evolutionarily stable gene clusters shed light on the common grounds of pathogenicity in the Acinetobacter calcoaceticus-baumannii complex

Bardya Djahanschiri et al.Jan 10, 2022
Abstract Nosocomial pathogens of the Acinetobacter calcoaceticus-baumannii (ACB) complex are a cautionary example for the world-wide spread of multi- and pan-drug resistant bacteria. Aiding the urgent demand for novel therapeutic targets, comparative genomics studies between pathogens and their apathogenic relatives shed light on the genetic basis of human-pathogen interaction. Yet, existing studies are limited in taxonomic scope, sensing of the phylogenetic signal, and resolution by largely analyzing genes isolated from their functional contexts. Here, we explored more than 3,000 Acinetobacter genomes in a phylogenomic framework integrating orthology-based phylogenetic profiling and microsynteny conservation analyses. This allowed to delineate gene clusters in the type strain A. baumannii ATCC 19606 whose evolutionary conservation indicates a functional integration of the subsumed genes. These evolutionarily stable gene clusters (ESGCs) reveal metabolic pathways, transcriptional regulators residing next to their targets but also tie together sub-clusters with distinct functions to form higher-order functional modules. We shortlisted 150 ESGCs that either co-emerged with, or are found preferentially in, the pathogenic ACB clade. They unveil, at an unprecedented resolution, the genetic makeup that coincides with the manifestation of the pathogenic phenotype in the last common ancestor of the ACB clade. Key innovations are the remodeling of the regulatory-effector cascade connecting LuxR/LuxI quorum sensing via an intermediate messenger to biofilm formation, the extension of micronutrient scavenging systems, and the increase of metabolic flexibility by exploiting carbon sources that are provided by the human host. Specifically, we could show that only members of the ACB clade use kynurenine as a sole carbon and energy source, a substance produced by humans to fine-tune the antimicrobial innate immune response. In summary, this study provides a rich and unbiased set of novel testable hypotheses on how pathogenic Acinetobacter interact with and ultimately infect their human host. They disclose promising routes for future therapeutic strategies. Author Summary The spread of multi- and pan-drug resistant bacterial pathogens is a world-wide threat to human health. Understanding the genetics of host colonization and infection is essential for devising novel ways of treatment. Acinetobacter baumannii , a nosocomial pathogen ranked top by the World Health Organization in the list of bacteria for which novel therapeutic approaches are needed, is a prime example. Here, we have carved out the genetic make-up that distinguishes A. baumannii and its pathogenic next relatives comprising the A. baumannii–calcoaceticus complex from other and mostly apathogenic Acinetobacter species. We found a rich spectrum of pathways and regulatory modules that reveals how the pathogens have modified biofilm formation, iron scavenging, and their carbohydrate metabolism to adapt to their human host. Among these, the capability to metabolize kynurenine is particularly intriguing. Humans produce this substance to contain bacterial invaders and to fine-tune the innate immune response. But A. baumannii and its allies have turned the table. They feed on kynurenine, and thus most likely also dysregulate human immune response. In summary, our study substantially deepens the understanding of how a highly critical pathogen interacts with its host, which substantially eases the identification of novel targets for innovative therapeutic strategies.
8
Citation2
0
Save
0

Peptidoglycan editing provides immunity toAcinetobacter baumanniiduring bacterial warfare

Nguyen-Hung Le et al.Apr 25, 2020
Abstract Peptidoglycan (PG) is essential in most bacteria. Thus, it is often targeted by various assaults, including the host immune response, antibiotic treatment and interbacterial attacks via the type VI secretion system (T6SS). Here, we report that the Gram-negative bacterium Acinetobacter baumannii strain ATCC 17978 produces, secretes and incorporates the non-canonical D-amino acid D-Lysine into its PG during stationary phase. We show that PG editing increases the competitiveness of A. baumannii during bacterial warfare by providing immunity against peptidoglycan-targeting T6SS effectors from various bacterial competitors. We propose that PG editing has evolved as an effective strategy for bacteria to overcome T6SS attacks. In contrast, we found that D-Lys production is detrimental to pathogenesis due, at least in part, to the activity of the human enzyme D-amino acid oxidase (DAO), which degrades D-Lys producing H 2 O 2 toxic to bacteria. Phylogenetic analyses indicate that the last common ancestor of A. baumannii possessed the ability to produce D-Lys. However, this trait was independently lost multiple times, likely reflecting the evolution of A. baumannii as a human pathogen. One sentence summary Acinetobacter baumannii attains immunity against nonkin competitors during T6SS warfare by incorporating D-Lysine into its peptidoglycan.
0
Citation1
0
Save
Load More