WM
Wolfgang Maier
Author with expertise in RNA Sequencing Data Analysis
University of Freiburg, University of Bonn, University Hospital Bonn
+ 7 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
16
(56% Open Access)
Cited by:
54
h-index:
106
/
i10-index:
619
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
205

Selection analysis identifies unusual clustered mutational changes in Omicron lineage BA.1 that likely impact Spike function

Darren Martin et al.Oct 11, 2023
+35
A
S
D
Among the 30 non-synonymous nucleotide substitutions in the Omicron S-gene are 13 that have only rarely been seen in other SARS-CoV-2 sequences. These mutations cluster within three functionally important regions of the S-gene at sites that will likely impact (i) interactions between subunits of the Spike trimer and the predisposition of subunits to shift from down to up configurations, (ii) interactions of Spike with ACE2 receptors, and (iii) the priming of Spike for membrane fusion. We show here that, based on both the rarity of these 13 mutations in intrapatient sequencing reads and patterns of selection at the codon sites where the mutations occur in SARS-CoV-2 and related sarbecoviruses, prior to the emergence of Omicron the mutations would have been predicted to decrease the fitness of any genomes within which they occurred. We further propose that the mutations in each of the three clusters therefore cooperatively interact to both mitigate their individual fitness costs, and adaptively alter the function of Spike. Given the evident epidemic growth advantages of Omicron over all previously known SARS-CoV-2 lineages, it is crucial to determine both how such complex and highly adaptive mutation constellations were assembled within the Omicron S-gene, and why, despite unprecedented global genomic surveillance efforts, the early stages of this assembly process went completely undetected.
205
Paper
Citation38
0
Save
20

Freely accessible ready to use global infrastructure for SARS-CoV-2 monitoring

Wolfgang Maier et al.Oct 24, 2023
+14
M
S
W
The COVID-19 pandemic is the first global health crisis to occur in the age of big genomic data.Although data generation capacity is well established and sufficiently standardized, analytical capacity is not. To establish analytical capacity it is necessary to pull together global computational resources and deliver the best open source tools and analysis workflows within a ready to use, universally accessible resource. Such a resource should not be controlled by a single research group, institution, or country. Instead it should be maintained by a community of users and developers who ensure that the system remains operational and populated with current tools. A community is also essential for facilitating the types of discourse needed to establish best analytical practices. Bringing together public computational research infrastructure from the USA, Europe, and Australia, we developed a distributed data analysis platform that accomplishes these goals. It is immediately accessible to anyone in the world and is designed for the analysis of rapidly growing collections of deep sequencing datasets. We demonstrate its utility by detecting allelic variants in high-quality existing SARS-CoV-2 sequencing datasets and by continuous reanalysis of COG-UK data. All workflows, data, and documentation is available at https://covid19.galaxyproject.org .
20
Citation9
0
Save
9

Towards increased accuracy and reproducibility in SARS-CoV-2 next generation sequence analysis for public health surveillance

Ryan Connor et al.Oct 24, 2023
+22
W
D
R
During the COVID-19 pandemic, SARS-CoV-2 surveillance efforts integrated genome sequencing of clinical samples to identify emergent viral variants and to support rapid experimental examination of genome-informed vaccine and therapeutic designs. Given the broad range of methods applied to generate new viral genomes, it is critical that consensus and variant calling tools yield consistent results across disparate pipelines. Here we examine the impact of sequencing technologies (Illumina and Oxford Nanopore) and 7 different downstream bioinformatic protocols on SARS-CoV-2 variant calling as part of the NIH Accelerating COVID-19 Therapeutic Interventions and Vaccines (ACTIV) Tracking Resistance and Coronavirus Evolution (TRACE) initiative, a public-private partnership established to address the COVID-19 outbreak. Our results indicate that bioinformatic workflows can yield consensus genomes with different single nucleotide polymorphisms, insertions, and/or deletions even when using the same raw sequence input datasets. We introduce the use of a specific suite of parameters and protocols that greatly improves the agreement among pipelines developed by diverse organizations. Such consistency among bioinformatic pipelines is fundamental to SARS-CoV-2 and future pathogen surveillance efforts. The application of analysis standards is necessary to more accurately document phylogenomic trends and support data-driven public health responses.
9
Paper
Citation7
0
Save
33

The landscape of SARS-CoV-2 RNA modifications

Milad Miladi et al.Oct 24, 2023
+10
W
J
M
Abstract In 2019 the severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) caused the first documented cases of severe lung disease COVID-19. Since then, SARS-CoV-2 has been spreading around the globe resulting in a severe pandemic with over 500.000 fatalities and large economical and social disruptions in human societies. Gaining knowledge on how SARS-Cov-2 interacts with its host cells and causes COVID-19 is crucial for the intervention of novel therapeutic strategies. SARS-CoV-2, like other coronaviruses, is a positive-strand RNA virus. The viral RNA is modified by RNA-modifying enzymes provided by the host cell. Direct RNA sequencing (DRS) using nanopores enables unbiased sensing of canonical and modified RNA bases of the viral transcripts. In this work, we used DRS to precisely annotate the open reading frames and the landscape of SARS-CoV-2 RNA modifications. We provide the first DRS data of SARS-CoV-2 in infected human lung epithelial cells. From sequencing three isolates, we derive a robust identification of SARS-CoV-2 modification sites within a physiologically relevant host cell type. A comparison of our data with the DRS data from a previous SARS-CoV-2 isolate, both raised in monkey renal cells, reveals consistent RNA modifications across the viral genome. Conservation of the RNA modification pattern during progression of the current pandemic suggests that this pattern is likely essential for the life cycle of SARS-CoV-2 and represents a possible target for drug interventions.
33
0
Save
0

varVAMP: automated pan-specific primer design for tiled full genome sequencing and qPCR of highly diverse viral pathogens.

Jonas Fuchs et al.May 28, 2024
+21
M
J
J
Time- and cost-saving surveillance of viral pathogens is achieved by tiled sequencing in which a viral genome is amplified in overlapping PCR amplicons and qPCR. However, designing pan-specific primers for viral pathogens that have high genomic variability represents a major challenge. Here, we present a bioinformatics command-line tool, called varVAMP (variable virus amplicons). It relies on multiple sequence alignments of highly variable virus sequences and enables automatic pan-specific primer design for qPCR or tiled amplicon whole genome sequencing. The varVAMP software guarantees pan-specificity by two means: it designs primers in regions with minimal variability and introduces degenerate nucleotides into primer sequences to compensate for common sequence variations. We demonstrate varVAMPs utility by designing and evaluating novel pan-specific primer schemes suitable for sequencing the genomes of SARS-CoV-2, Hepatitis E virus, rat Hepatitis E virus, Hepatitis A virus, Borna-disease-virus-1, and Poliovirus. Moreover, we established highly sensitive and specific Poliovirus qPCR assays that could potentially simplify current Poliovirus surveillance. Importantly, wet-lab and bioinformatic techniques established for SARS-CoV-2 tiled amplicon sequencing were readily transferable to these new primer schemes and will allow sequencing laboratories to extend their established methodology to other human pathogens.
0

A contribution of novel CNVs to schizophrenia from a genome-wide study of 41,321 subjects

Christian Marshall et al.May 6, 2020
+265
D
D
C
Genomic copy number variants (CNVs) have been strongly implicated in the etiology of schizophrenia (SCZ). However, apart from a small number of risk variants, elucidation of the CNV contribution to risk has been difficult due to the rarity of risk alleles, all occurring in less than 1% of cases. We sought to address this obstacle through a collaborative effort in which we applied a centralized analysis pipeline to a SCZ cohort of 21,094 cases and 20,227 controls. We observed a global enrichment of CNV burden in cases (OR=1.11, P=5.7e-15), which persisted after excluding loci implicated in previous studies (OR=1.07, P=1.7e-6). CNV burden is also enriched for genes associated with synaptic function (OR = 1.68, P = 2.8e-11) and neurobehavioral phenotypes in mouse (OR = 1.18, P= 7.3e-5). We identified genome-wide significant support for eight loci, including 1q21.1, 2p16.3 (NRXN1), 3q29, 7q11.2, 15q13.3, distal 16p11.2, proximal 16p11.2 and 22q11.2. We find support at a suggestive level for nine additional candidate susceptibility and protective loci, which consist predominantly of CNVs mediated by non-allelic homologous recombination (NAHR).
0

Cross-validation of technologies for genotyping CYP2D6 and CYP2C19

Beatriz Henriques et al.May 7, 2020
+17
X
A
B
Background: CYP2D6 and CYP2C19 are cytochrome P450 enzymes involved in the metabolism of many medications from multiple therapeutic classes. The genes encoding them, CYP2D6 and CYP2C19, have multiple functional variants that have been associated with different levels of enzyme activity. There is evidence that methodology for identifying such variants (genotyping) effectively and efficiently could lead to substantial health care costs savings. There are various genotyping technologies available; we cross-validated several against each other. Methods: Ninety-six samples with a variety of CYP2D6 and CYP2C19 genotypes according to prior AmpliChip CYP450 and TaqMan CYP2C19*17 data were selected from the Genome-based therapeutic drugs for depression (GENDEP) study. Genotyping was performed with TaqMan copy number variant (CNV) analysis using probes specific for three different regions (CYP2D6 only), the next generation sequencing-based Ion S5 AmpliSeq Pharmacogenomics Panel, PharmacoScan, and long-range polymerase chain reaction (XL-PCR) followed by TaqMan single nucleotide variant (SNV) analysis or the Agena MassARRAY. Variant to star allele translation was automated. Results: The inter-platform concordance for CYP2C19 was high (94-98%). For CYP2D6, the IonS5-PharmacoScan concordance was 94% for a range of variants tested apart from those with at least one extra copy of a CYP2D6 gene (occurring at a frequency of 3.8%, 33/853), or a pseudogene-gene conversion (2%, 18/853). Conclusions: Inter-platform concordance for CYP2C19 was high, and, moreover, the Ion S5 and PharmacoScan data were 100% concordant with that from a TaqMan CYP2C19*2 assay. The level of concordance was also good for CYP2D6, apart from those with at least one extra copy of a CYP2D6 gene or a pseudogene-gene conversion. We have also demonstrated feasibility of using a NGS platform for genotyping CYP2D6 and CYP2C19, with automated data interpretation methodology. CYP2D6 and CYP2C19 genotyping may thereby become much more readily accessible, with potential substantial savings in health care costs and public benefit.
0

Genome-wide association study of 40,000 individuals identifies two novel loci associated with bipolar disorder

Liping Hou et al.May 6, 2020
+136
N
S
L
Bipolar disorder (BD) is a genetically complex mental illness characterized by severe oscillations of mood and behavior. Genome-wide association studies (GWAS) have identified several risk loci that together account for a small portion of the heritability. To identify additional risk loci, we performed a two-stage meta-analysis of >9 million genetic variants in 9,784 bipolar disorder patients and 30,471 controls, the largest GWAS of BD to date. In this study, to increase power we used ~2,000 lithium-treated cases with a long-term diagnosis of BD from the Consortium on Lithium Genetics, excess controls, and analytic methods optimized for markers on the X-chromosome. In addition to four known loci, results revealed genome-wide significant associations at two novel loci: an intergenic region on 9p21.3 (rs12553324, p = 5.87×10-9; odds ratio = 1.12) and markers within ERBB2 (rs2517959, p = 4.53×10-9; odds ratio = 1.13). No significant X-chromosome associations were detected and X-linked markers explained very little BD heritability. The results add to a growing list of common autosomal variants involved in BD and illustrate the power of comparing well-characterized cases to an excess of controls in GWAS.
65

Galaxy Training: A Powerful Framework for Teaching!

Saskia Hiltemann et al.Oct 24, 2023
+30
S
H
S
Abstract There is an ongoing explosion of scientific datasets being generated, brought on by recent technological advances in many areas of the natural sciences. As a result, the life sciences have become increasingly computational in nature, and bioinformatics has taken on a central role in research studies. However, basic computational skills, data analysis and stewardship are still rarely taught in life science educational programs [1], resulting in a skills gap in many of the researchers tasked with analysing these big datasets. In order to address this skills gap and empower researchers to perform their own data analyses, the Galaxy Training Network (GTN) has previously developed the Galaxy Training Platform ( https://training.galaxyproject.org ); an open access, community-driven framework for the collection of FAIR training materials for data analysis utilizing the user-friendly Galaxy framework as its primary data analysis platform [2]. Since its inception, this training platform has thrived, with the number of tutorials and contributors growing rapidly, and the range of topics extending beyond life sciences to include topics such as climatology, cheminformatics and machine learning. While initially aimed at supporting researchers directly, the GTN framework has proven to be an invaluable resource for educators as well. We have focused our efforts in recent years on adding increased support for this growing community of instructors. New features have been added to facilitate the use of the materials in a classroom setting, simplifying the contribution flow for new materials, and have added a set of train-the-trainer lessons. Here, we present the latest developments in the GTN project, aimed at facilitating the use of the Galaxy Training materials by educators, and its usage in different learning environments.
7

Single molecule long-read real-time amplicon-based sequencing of CYP2D6: a proof-of-concept with hybrid haplotypes

Rachael Dong et al.Oct 24, 2023
+17
J
M
R
Abstract CYP2D6 is a widely expressed human xenobiotic metabolizing enzyme, best known for its role in the hepatic phase I cytochrome P450 enzyme system, where it metabolizes ∼20% of medications. It is also expressed in other organs including the brain, where its potential role in physiology and mental health traits and disorders is under further investigation. Owing to the presence of homologous pseudogenes in the CYP2D locus and transposable repeat elements in the intergenic regions, the gene encoding the CYP2D6 enzyme, CYP2D6 , is one of the most hypervariable known human genes - with more than 165 core haplotypes. Haplotypes include structural variants, with a subtype of these known as hybrid haplotypes or fusion genes comprising part of CYP2D6 and part of its adjacent pseudogene, CYP2D7 . The fusion genes are particularly challenging to identify. High fidelity (HiFi) single molecule real-time (SMRT) long-read sequencing can cover whole CYP2D6 haplotypes in a single continuous sequence, and is therefore ideal for structural variant detection. In addition, it is highly accurate and suitable for novel haplotype identification, which is necessary as new CYP2D6 haplotypes are continuously being discovered, and many more likely remain to be identified in relatively understudied populations such as Indigenous Peoples. The aim of the present work was to develop an efficient and accurate HiFi SMRT amplicon-based method capable of detecting the full range of CYP2D6 haplotypes including fusion genes. We report proof-of-concept for 24 amplicons including three positive controls, aligned to fusion gene haplotypes, with prior cross-validation data. Amplicons with CYP2D7-D6 fusion genes, including positive controls, aligned to the *13 subhaplotypes predicted ( *13F, *13A2 ) with 100% accuracy, with the exception of one that aligned at 99.9%. Alignment of the *68 was 100% and above 99.9% to the CYP2D6*68 partial sequences EU5300606 and JF307779, respectively. The best alignments for the remaining CYP2D6-2D7 fusion genes were ≥99.7% (to 3 significant figures). Lower percentage alignment for CYP2D6-2D7 fusion genes may reflect imperfect PCR optimization and/or the possibility that we may have haplotypes not yet in public databases. Further work on these is in progress. Moreover, we have adapted this method for non-hybrid haplotypes. This technique could therefore suffice for the characterization of the full range of CYP2D6 haplotypes. The method that we have developed could be extended to other complex loci and to other species in a multiplexed high throughput assay.
Load More