JH
Juergen Haas
Author with expertise in Protein Structure Prediction and Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(63% Open Access)
Cited by:
1,860
h-index:
39
/
i10-index:
70
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

QMEANDisCo—distance constraints applied on model quality estimation

Gabriel Studer et al.Nov 6, 2019
+3
A
C
G
Abstract Motivation Methods that estimate the quality of a 3D protein structure model in absence of an experimental reference structure are crucial to determine a model’s utility and potential applications. Single model methods assess individual models whereas consensus methods require an ensemble of models as input. In this work, we extend the single model composite score QMEAN that employs statistical potentials of mean force and agreement terms by introducing a consensus-based distance constraint (DisCo) score. Results DisCo exploits distance distributions from experimentally determined protein structures that are homologous to the model being assessed. Feed-forward neural networks are trained to adaptively weigh contributions by the multi-template DisCo score and classical single model QMEAN parameters. The result is the composite score QMEANDisCo, which combines the accuracy of consensus methods with the broad applicability of single model approaches. We also demonstrate that, despite being the de-facto standard for structure prediction benchmarking, CASP models are not the ideal data source to train predictive methods for model quality estimation. For performance assessment, QMEANDisCo is continuously benchmarked within the CAMEO project and participated in CASP13. For both, it ranks among the top performers and excels with low response times. Availability and implementation QMEANDisCo is available as web-server at https://swissmodel.expasy.org/qmean. The source code can be downloaded from https://git.scicore.unibas.ch/schwede/QMEAN. Supplementary information Supplementary data are available at Bioinformatics online.
0
Citation691
0
Save
0

Highly Parallel SNP Genotyping

Jian‐Bing Fan et al.Jan 1, 2003
+25
R
A
J
The genetic factors underlying common disease arelargely unknown. Discovery of disease-causing genes willtransform our knowledge of the genetic contribution tohuman disease, lead to new genetic screens, and underpinresearch into new cures and improved lifestyles. The sequencing of the human genome has catalyzed efforts tosearch for disease genes by the strategy of associating sequence variants with measurable phenotypes. In particular, the Human Genome Project and follow-on efforts tocharacterize genetic variation have resulted in the discovery of millions of single-nucleotide polymorphisms(SNPs) (Patil et al. 2001; Sachidanandam et al. 2001;Reich et al. 2003). This represents a significant fraction ofcommon genetic variation in the human genome and creates an unprecedented opportunity to associate genes withphenotypes via large-scale SNP genotyping studies...
0
Citation637
0
Save
0

Codon usage limitation in the expression of HIV-1 envelope glycoprotein

Juergen Haas et al.Mar 1, 1996
B
E
J

Abstract

 Background: The expression of both the env and gag gene products of human immunodeficiency virus type 1 (HIV-1) is known to be limited by cis elements in the viral RNA that impede egress from the nucleus and reduce the efficiency of translation. Identifying these elements has proven difficult, as they appear to be disseminated throughout the viral genome. Results Here, we report that selective codon usage appears to account for a substantial fraction of the inefficiency of viral protein synthesis, independent of any effect on improved nuclear export. The codon usage effect is not specific to transcripts of HIV-1 origin. Re-engineering the coding sequence of a model protein (Thy-1) with the most prevalent HIV-1 codons significantly impairs Thy-1 expression, whereas altering the coding sequence of the jellyfish green fluorescent protein gene to conform to the favored codons of highly expressed human proteins results in a substantial increase in expression efficiency. Conclusion Codon-usage effects are a major impediment to the efficient expression of HIV-1 genes. Although mammalian genes do not show as profound a bias as do Escherichia coli genes, other proteins that are poorly expressed in mammalian cells can benefit from codon re-engineering.
0
Citation528
0
Save
0

The ELIXIR Core Data Resources: fundamental infrastructure for the life sciences

Rachel Drysdale et al.Apr 5, 2019
+15
V
R
R
Abstract Motivation Life science research in academia, industry, agriculture, and the health sector depends critically on free and open data resources. ELIXIR ( www.elixir-europe.org ), the European Research Infrastructure for life sciences data, has identified a set of Core Data Resources within Europe that are of most fundamental importance for the long-term preservation of biological data. We explore characteristics of their usage, impact and assured funding horizon to assess their value and importance as an infrastructure, to understand sustainability of the infrastructure, and to demonstrate a model for assessing Core Data Resources worldwide. Results The nineteen resources currently designated ELIXIR Core Data Resources form a data infrastructure in Europe which is a subset of the worldwide open life science data infrastructure. We show that, from 2014 to 2018, data managed by the Core Data Resources more than tripled while staff numbers increased by less than a tenth. Additionally, support for the Core Data Resources is precarious: together they have assured funding for less than a third of current staff after four years. Our findings demonstrate the importance of the ELIXIR Core Data Resources as repositories for research data and knowledge, while also demonstrating the uncertain nature of the funding environment for this infrastructure. ELIXIR is working towards longer-term support for the Core Data Resources and, through the Global Biodata Coalition, aims to ensure support for the worldwide life science data resource infrastructure of which the ELIXIR Core Data Resources are a subset. Contact rachel.drysdale@elixir-europe.org Supplementary information Supplementary data are available at Bioinformatics online.
0
Paper
Citation4
0
Save
5

ModelCIF: An extension of PDBx/mmCIF data representation for computed structure models

Brinda Vallat et al.Dec 9, 2022
+22
Y
D
B
ABSTRACT ModelCIF ( github.com/ihmwg/ModelCIF ) is a data information framework developed for and by computational structural biologists to enable delivery of Findable, Accessible, Interoperable , and Reusable ( FAIR ) data to users worldwide. It is an extension of the Protein Data Bank Exchange / macromolecular Crystallographic Information Framework (PDBx/mmCIF), which is the global data standard for representing experimentally-determined, three-dimensional (3D) structures of macromolecules and associated metadata. ModelCIF provides an extensible data representation for deposition, archiving, and public dissemination of predicted 3D models of proteins. The PDBx/mmCIF framework and its extensions ( e.g ., ModelCIF) are managed by the Worldwide Protein Data Bank partnership (wwPDB, wwpdb.org ) in collaboration with relevant community stakeholders such as the wwPDB ModelCIF Working Group ( wwpdb.org/task/modelcif ). This semantically rich and extensible data framework for representing computed structure models (CSMs) accelerates the pace of scientific discovery. Herein, we describe the architecture, contents, and governance of ModelCIF, and tools and processes for maintaining and extending the data standard. Community tools and software libraries that support ModelCIF are also described.
0

Asparagine deprivation causes a reversible inhibition of Human Cytomegalovirus acute virus replication

Chen-Hsuin Lee et al.Jul 2, 2019
+4
P
S
C
As obligate intracellular pathogens, viruses rely on the host cell machinery to replicate efficiently, with the host metabolism extensively manipulated for this purpose. High throughput siRNA screens provide a systematic approach for the identification of novel host-virus interactions. Here, we report a large-scale screen for host factors important for human cytomegalovirus (HCMV), consisting of 6,881 siRNAs. We identified 47 proviral factors and 68 antiviral factors involved in a wide range of cellular processes including the mediator complex, proteasome function and mRNA splicing. Focused characterisation of one of the hits, asparagine synthetase (ASNS), demonstrated a strict requirement for asparagine for HCMV replication which leads to an early block in virus replication before the onset of DNA amplification. This effect is specific to HCMV, as knockdown of ASNS had little effect on herpes simplex virus-1 or influenza A virus replication, suggesting the restriction is not simply due to a failure in protein production. Remarkably, virus replication could be completely rescued seven days post-infection with addition of exogenous asparagine, indicating that while virus replication is restricted at an early stage, it maintains the capacity for full replication days after initial infection. This study represents the most comprehensive siRNA screen for the identification of host factors involved in HCMV replication and identifies the non-essential amino acid, asparagine as a critical factor in regulating HCMV virus replication. These results have implications for control of viral latency and the clinical treatment of HCMV in patients.Importance HCMV accounts for more than 60% of complications associated with solid organ transplant patients. Prophylactic or preventative treatment with antivirals, such as ganciclovir, reduces the occurrence of early onset HCMV disease. However, late onset disease remains a significant problem and prolonged treatment, especially in patients with suppressed immune systems, greatly increases the risk of antiviral resistance. Very few antivirals have been developed for use against HCMV since the licensing of ganciclovir, and of these, the same viral genes are often targeted, reducing the usefulness of these drugs against resistant strains. An alternative approach is to target host genes essential for virus replication. Here we demonstrate that HCMV replication is highly dependent on levels of the amino acid asparagine and knockdown of a critical enzyme involved in asparagine synthesis results in severe attenuation of virus replication. These results suggest that reducing asparagine levels through dietary restriction or chemotherapeutic treatment could limit HCMV replication in patients.
0

Lessons Learned: Recommendations for Establishing Critical Periodic Scientific Benchmarking

Salvador Capella-Gutiérrez et al.Aug 31, 2017
+9
A
J
S
The dependence of life scientists on software has steadily grown in recent years. For many tasks, researchers have to decide which of the available bioinformatics software are more suitable for their specific needs. Additionally researchers should be able to objectively select the software that provides the highest accuracy, the best efficiency and the highest level of reproducibility when integrated in their research projects. Critical benchmarking of bioinformatics methods, tools and web services is therefore an essential community service, as well as a critical component of reproducibility efforts. Unbiased and objective evaluations are challenging to set up and can only be effective when built and implemented around community driven efforts, as demonstrated by the many ongoing community challenges in bioinformatics that followed the success of CASP. Community challenges bring the combined benefits of intense collaboration, transparency and standard harmonization. Only open systems for the continuous evaluation of methods offer a perfect complement to community challenges, offering to larger communities of users, that could extend far beyond the community of developers, a window to the developments status that they can use for their specific projects. We understand by continuous evaluation systems as those services which are always available and periodically update their data and/or metrics according to a predefined schedule keeping in mind that the performance has to be always seen in terms of each research domain. We argue here that technology is now mature to bring community driven benchmarking efforts to a higher level that should allow effective interoperability of benchmarks across related methods. New technological developments allow to overcome the limitations of the first experiences on online benchmarking e.g. EVA. We therefore describe OpenEBench, a novel infra-structure designed to establish a continuous automated benchmarking system for bioinformatics methods, tools and web services. OpenEBench is being developed so as to cater for the needs of the bioinformatics community, especially software developers who need an objective and quantitative way to inform their decisions as well as the larger community of end-users, in their search for unbiased and up-to-date evaluation of bioinformatics methods. As such OpenEBench should soon become a central place for bioinformatics software developers, community-driven benchmarking initiatives, researchers using bioinformatics methods, and funders interested in the result of methods evaluation.
9

The remarkable complexity of the brain microbiome in health and disease

Xinyue Hu et al.Feb 12, 2023
+2
J
C
X
ABSTRACT Microbes in human brain and their potential contribution to neurodegenerative conditions such as Alzheimer’s disease (AD) have long been debated. We recently developed a new method (the electronic tree of life, eToL) based on small subunit ribosomal RNA (rRNA) probes, further confirmed by large subunit rRNA analysis, to comprehensively address the spectrum of microorganisms in control and AD brain. We report a remarkable diversity of brain microbes in control brain. The most abundant are fungi, bacteria, and chloroplastida, and we report detailed identification of representative microbial species. The pattern is substantially conserved across different bilateran species from Drosophila to human. In terms of diversity, the human brain microbiome appears to be a subset (~20%) of the gut microbiome. Adenovirus type C was the major virus found in human brain; other viruses were not well represented. However, the spectrum of brain microbes differed between individuals as well as between brain regions examined from single individuals (amygdala, cingulate cortex, hippocampus, hypothalamus); of these four regions, the highest microbial burden was in cingulate cortex. There was evidence of spreading of pathogens between brain regions in single individuals. Some microbes are over-represented in AD brain according to two measures: (i) absolute number of microbes normalized to endogenous human transcripts, and (ii) the number of brain specimens showing overabundance versus control. Species over-represented in AD brain according to both measures notably include bacteria ( Streptococcus , Staphylococcus / Bacillus , Sphingomonas / Ralstonia ) and fungi ( Acrocalymma / Altenaria / Aureobasidium of the Aspergillus group; Komagataella of the Candida group, Cortinarius of the Schizophyllum group, and Tausonia of the Cryptococcus group), that are all related to known human pathogens. In addition, an uncharacterized chloroplastida (algae-related) species was more abundant in AD brain samples. Although these findings point to diverse microbial species, indicative of multiple causation, similar absolute levels of bacteria and fungi in AD brain samples could suggest synergy between pathogens. However, it is important to stress that not all AD samples were positive for these microbes, but this could be because the affected brain region(s) was not examined. These findings support the contention that infection, perhaps associated with declining immunity with age, may contribute to AD development.