MS
Maximilian Strauss
Author with expertise in Mass Spectrometry Techniques with Proteins
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
19
(84% Open Access)
Cited by:
1,281
h-index:
35
/
i10-index:
49
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Programmable self-assembly of three-dimensional nanostructures from 10,000 unique components

Luvena Ong et al.Dec 6, 2017
DNA bricks with binding domains of 13 nucleotides instead of the typical 8 make it possible to self-assemble gigadalton-scale, three-dimensional nanostructures consisting of tens of thousands of unique components. DNA self-assembly is widely used to produce nanoscale structures of ever increasing complexity. The largest structures that can be assembled reliably contain hundreds of individual DNA strands. Peng Yin and colleagues now show that a new generation of DNA bricks—short DNA strands that fold into brick-like shapes and self-assemble according to specific inter-brick interactions—makes it possible to assemble large DNA nanostructures containing a few tens of thousands of individual bricks. One structure, consisting of 10,000 bricks and having 20,000 uniquely addressable 'nano-voxels'—the three-dimensional equivalents of pixels—is used as a molecular analogue of clay to sculpt three-dimensional objects such as letters, a complex helicoid (a shape similar to a spiral staircase) and a teddy bear. With further optimization, the method might produce even larger assemblies that could find use as scaffolds or for positioning functional components. Three related papers is this issue report further advances in DNA origami, and all four are summarized in a News & Views. Nucleic acids (DNA and RNA) are widely used to construct nanometre-scale structures with ever increasing complexity1,2,3,4,5,6,7,8,9,10,11,12,13,14, with possible application in fields such as structural biology, biophysics, synthetic biology and photonics. The nanostructures are formed through one-pot self-assembly, with early kilodalton-scale examples containing typically tens of unique DNA strands. The introduction of DNA origami4, which uses many staple strands to fold one long scaffold strand into a desired structure, has provided access to megadalton-scale nanostructures that contain hundreds of unique DNA strands6,7,10,11,12,13,14. Even larger DNA origami structures are possible15,16, but manufacturing and manipulating an increasingly long scaffold strand remains a challenge. An alternative and more readily scalable approach involves the assembly of DNA bricks, which each consist of four short binding domains arranged so that the bricks can interlock8,9. This approach does not require a scaffold; instead, the short DNA brick strands self-assemble according to specific inter-brick interactions. First-generation bricks used to create three-dimensional structures are 32 nucleotides long, consisting of four eight-nucleotide binding domains. Protocols have been designed to direct the assembly of hundreds of distinct bricks into well formed structures, but attempts to create larger structures have encountered practical challenges and had limited success9. Here we show that DNA bricks with longer, 13-nucleotide binding domains make it possible to self-assemble 0.1–1-gigadalton, three-dimensional nanostructures from tens of thousands of unique components, including a 0.5-gigadalton cuboid containing about 30,000 unique bricks and a 1-gigadalton rotationally symmetric tetramer. We also assembled a cuboid that contains around 10,000 bricks and about 20,000 uniquely addressable, 13-base-pair ‘voxels’ that serves as a molecular canvas for three-dimensional sculpting. Complex, user-prescribed, three-dimensional cavities can be produced within this molecular canvas, enabling the creation of shapes such as letters, a helicoid and a teddy bear. We anticipate that with further optimization of structure design, strand synthesis and assembly procedure even larger structures could be accessible, which could be useful for applications such as positioning functional components.
0
Paper
Citation354
0
Save
55

AlphaPept, a modern and open framework for MS-based proteomics

Maximilian Strauss et al.Jul 26, 2021
ABSTRACT In common with other omics technologies, mass spectrometry (MS)-based proteomics produces ever-increasing amounts of raw data, making their efficient analysis a principal challenge. There is a plethora of different computational tools that process the raw MS data and derive peptide and protein identification and quantification. During the last decade, there has been dramatic progress in computer science and software engineering, including collaboration tools that have transformed research and industry. To leverage these advances, we developed AlphaPept, a Python-based open-source framework for efficient processing of large high-resolution MS data sets. Using Numba for just-in-time machine code compilation on CPU and GPU, we achieve hundred-fold speed improvements while maintaining clear syntax and rapid development speed. AlphaPept uses the Python scientific stack of highly optimized packages, reducing the code base to domain-specific tasks while providing access to the latest advances in machine learning. We provide an easy on-ramp for community validation and contributions through the concept of literate programming, implemented in Jupyter Notebooks of the different modules. A framework for continuous integration, testing, and benchmarking enforces solid software engineering principles. Large datasets can rapidly be processed as shown by the analysis of hundreds of cellular proteomes in minutes per file, many-fold faster than the data acquisiton. The AlphaPept framework can be used to build automated processing pipelines using efficient HDF5 based file formats, web-serving functionality and compatibility with downstream analysis tools. Easy access for end-users is provided by one-click installation of the graphical user interface, for advanced users via a modular Python library, and for developers via a fully open GitHub repository.
36

AlphaViz: Visualization and validation of critical proteomics data directly at the raw data level

Eugenia Voytik et al.Jul 13, 2022
ABSTRACT Although current mass spectrometry (MS)-based proteomics identifies and quantifies thousands of proteins and (modified) peptides, only a minority of them are subjected to in-depth downstream analysis. With the advent of automated processing workflows, biologically or clinically important results within a study are rarely validated by visualization of the underlying raw information. Current tools are often not integrated into the overall analysis nor readily extendable with new approaches. To remedy this, we developed AlphaViz, an open-source Python package to superimpose output from common analysis workflows on the raw data for easy visualization and validation of protein and peptide identifications. AlphaViz takes advantage of recent breakthroughs in the deep learning-assisted prediction of experimental peptide properties to allow manual assessment of the expected versus measured peptide result. We focused on the visualization of the 4-dimensional data cuboid provided by Bruker TimsTOF instruments, where the ion mobility dimension, besides intensity and retention time, can be predicted and used for verification. We illustrate how AlphaViz can quickly validate or invalidate peptide identifications regardless of the score given to them by automated workflows. Furthermore, we provide a ‘predict mode’ that can locate peptides present in the raw data but not reported by the search engine. This is illustrated the recovery of missing values from experimental replicates. Applied to phosphoproteomics, we show how key signaling nodes can be validated to enhance confidence for downstream interpretation or follow-up experiments. AlphaViz follows standards for open-source software development and features an easy-to-install graphical user interface for end-users and a modular Python package for bioinformaticians. Validation of critical proteomics results should now become a standard feature in MS-based proteomics.
1

Transparent exploration of machine learning for biomarker discovery from proteomics and omics data

Furkan Torun et al.Mar 6, 2021
Abstract Biomarkers are of central importance for assessing the health state and to guide medical interventions and their efficacy, but they are lacking for most diseases. Mass spectrometry (MS)-based proteomics is a powerful technology for biomarker discovery, but requires sophisticated bioinformatics to identify robust patterns. Machine learning (ML) has become indispensable for this purpose, however, it is sometimes applied in an opaque manner, generally requires expert knowledge and complex and expensive software. To enable easy access to ML for biomarker discovery without any programming or bioinformatic skills, we developed ‘OmicLearn’ ( https://OmicLearn.com ), an open-source web-based ML tool using the latest advances in the Python ML ecosystem. We host a web server for the exploration of the researcher’s results that can readily be cloned for internal use. Output tables from proteomics experiments are easily uploaded to the central or a local webserver. OmicLearn enables rapid exploration of the suitability of various ML algorithms for the experimental datasets. It fosters open science via transparent assessment of state-of-the-art algorithms in a standardized format for proteomics and other omics sciences. Graphical Abstract Highlights OmicLearn is an open-source platform allows researchers to apply machine learning (ML) for biomarker discovery The ready-to-use structure of OmicLearn enables accessing state-of-the-art ML algorithms without requiring any prior bioinformatics knowledge OmicLearn’s web-based interface provides an easy-to-follow platform for classification and gaining insights into the dataset Several algorithms and methods for preprocessing, feature selection, classification and cross-validation of omics datasets are integrated All results, settings and method text can be exported in publication-ready formats
46

Urinary proteome profiling for stratifying patients with familial Parkinson’s disease

Sebastian Winter et al.Aug 10, 2020
SUMMARY The prevalence of Parkinson’s disease (PD) is increasing but the development of novel treatment strategies and therapeutics altering the course of the disease would benefit from specific, sensitive and non-invasive biomarkers to detect PD early. Here, we describe a scalable and sensitive mass spectrometry (MS)-based proteomic workflow for urinary proteome profiling. Our workflow enabled the reproducible quantification of more than 2,000 proteins in more than 200 urine samples using minimal volumes from two independent patient cohorts. The urinary proteome was significantly different between PD patients and healthy controls, as well as between LRRK2 G2019S carriers and non-carriers in both cohorts. Interestingly, our data revealed lysosomal dysregulation in individuals with the LRRK2 G2019S mutation. When combined with machine learning, the urinary proteome data alone was sufficient to classify mutation status and disease manifestation in mutation carriers remarkably well, identifying VGF, ENPEP and other PD-associated proteins as the most discriminating features. Taken together, our results validate urinary proteomics as a valuable strategy for biomarker discovery and patient stratification in PD.
46
Citation6
0
Save
62

The social architecture of an in-depth cellular protein interactome

André Michaelis et al.Oct 26, 2021
Nearly all cellular functions are mediated by protein-protein interactions and mapping the interactome provides fundamental insights into the regulation and structure of biological systems. In principle, affinity purification coupled to mass spectrometry (AP-MS) is an ideal and scalable tool, however, it has been difficult to identify low copy number complexes, membrane complexes and those disturbed by protein-tagging. As a result, our current knowledge of the interactome is far from complete, and assessing the reliability of reported interactions is challenging. Here we develop a sensitive, high-throughput, and highly reproducible AP-MS technology combined with a quantitative two-dimensional analysis strategy for comprehensive interactome mapping of Saccharomyces cerevisiae . We reduced required cell culture volumes thousand-fold and employed 96-well formats throughout, allowing replicate analysis of the endogenous green fluorescent protein (GFP) tagged library covering the entire expressed yeast proteome. The 4159 pull-downs generated a highly structured network of 3,909 proteins connected by 29,710 interactions. Compared to previous large-scale studies, we double the number of proteins (nodes in the network) and triple the number of reliable interactions (edges), including very low abundant epigenetic complexes, organellar membrane complexes and non-taggable complexes interfered by abundance correlation. This nearly saturated interactome reveals that the vast majority of yeast proteins are highly connected, with an average of 15 interactors, the majority of them unreported so far. Similar to social networks between humans, the average shortest distance is 4.2 interactions. A web portal ( www.yeast-interactome.org ) enables exploration of our dataset by the network and biological communities and variations of our AP-MS technology can be employed in any organism or dynamic conditions.
62
Citation4
0
Save
Load More