IP
Igor Paron
Author with expertise in Mass Spectrometry Techniques with Proteins
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
6
(67% Open Access)
Cited by:
7,052
h-index:
20
/
i10-index:
21
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Accurate Proteome-wide Label-free Quantification by Delayed Normalization and Maximal Peptide Ratio Extraction, Termed MaxLFQ

Jürgen Cox et al.Jun 19, 2014
Protein quantification without isotopic labels has been a long-standing interest in the proteomics field. However, accurate and robust proteome-wide quantification with label-free approaches remains a challenge. We developed a new intensity determination and normalization procedure called MaxLFQ that is fully compatible with any peptide or protein separation prior to LC-MS analysis. Protein abundance profiles are assembled using the maximum possible information from MS signals, given that the presence of quantifiable peptides varies from sample to sample. For a benchmark dataset with two proteomes mixed at known ratios, we accurately detected the mixing ratio over the entire protein expression range, with greater precision for abundant proteins. The significance of individual label-free quantifications was obtained via a t test approach. For a second benchmark dataset, we accurately quantify fold changes over several orders of magnitude, a task that is challenging with label-based methods. MaxLFQ is a generic label-free quantification technology that is readily applicable to many biological questions; it is compatible with standard statistical analysis workflows, and it has been validated in many and diverse biological projects. Our algorithms can handle very large experiments of 500+ samples in a manageable computing time. It is implemented in the freely available MaxQuant computational proteomics platform and works completely seamlessly at the click of a button. Protein quantification without isotopic labels has been a long-standing interest in the proteomics field. However, accurate and robust proteome-wide quantification with label-free approaches remains a challenge. We developed a new intensity determination and normalization procedure called MaxLFQ that is fully compatible with any peptide or protein separation prior to LC-MS analysis. Protein abundance profiles are assembled using the maximum possible information from MS signals, given that the presence of quantifiable peptides varies from sample to sample. For a benchmark dataset with two proteomes mixed at known ratios, we accurately detected the mixing ratio over the entire protein expression range, with greater precision for abundant proteins. The significance of individual label-free quantifications was obtained via a t test approach. For a second benchmark dataset, we accurately quantify fold changes over several orders of magnitude, a task that is challenging with label-based methods. MaxLFQ is a generic label-free quantification technology that is readily applicable to many biological questions; it is compatible with standard statistical analysis workflows, and it has been validated in many and diverse biological projects. Our algorithms can handle very large experiments of 500+ samples in a manageable computing time. It is implemented in the freely available MaxQuant computational proteomics platform and works completely seamlessly at the click of a button. Mass-spectrometry-based proteomics has become an increasingly powerful technology not only for the identification of large numbers of proteins, but also for their quantification (1.Aebersold R. Mann M. Mass spectrometry-based proteomics.Nature. 2003; 422: 198-207Crossref PubMed Scopus (5585) Google Scholar, 2.Ong S.E. Mann M. Mass spectrometry-based proteomics turns quantitative.Nat. Chem. Biol. 2005; 1: 252-262Crossref PubMed Scopus (1317) Google Scholar, 3.Bantscheff M. Schirle M. Sweetman G. Rick J. Kuster B. Quantitative mass spectrometry in proteomics: a critical review.Anal. Bioanal. Chem. 2007; 389: 1017-1031Crossref PubMed Scopus (1256) Google Scholar). Modern mass spectrometer hardware, in combination with increasingly sophisticated bioinformatics software for data analysis, is now ready to tackle the proteome on a global, comprehensive scale and in a quantitative fashion (4.Cox J. Mann M. Is proteomics the new genomics?.Cell. 2007; 130: 395-398Abstract Full Text Full Text PDF PubMed Scopus (342) Google Scholar, 5.Altelaar A.F. Munoz J. Heck A.J. Next-generation proteomics: towards an integrative view of proteome dynamics.Nat. Rev. Genet. 2013; 14: 35-48Crossref PubMed Scopus (521) Google Scholar, 6.Mann M. Kulak N.A. Nagaraj N. Cox J. The coming age of complete, accurate, and ubiquitous proteomes.Mol. Cell. 2013; 49: 583-590Abstract Full Text Full Text PDF PubMed Scopus (285) Google Scholar). Stable isotope-based labeling methods are the gold standard for quantification. However, despite their success, they inherently entail extra preparation steps, whereas label-free quantification is by its nature the simplest and most economical approach. Label-free quantification is in principle applicable to any kind of sample, including materials that cannot be directly metabolically labeled (for instance, many clinical samples). In addition, there is no limit on the number of samples that can be compared, in contrast to the finite number of "plexes" available for label-based methods (7.Dephoure N. Gygi S.P. Hyperplexing: a method for higher-order multiplexed quantitative proteomics provides a map of the dynamic response to rapamycin in yeast.Sci. Signal. 2012; 5: rs2Crossref PubMed Scopus (121) Google Scholar). A vast literature on label-free quantification methods, reviewed in Ref. 3.Bantscheff M. Schirle M. Sweetman G. Rick J. Kuster B. Quantitative mass spectrometry in proteomics: a critical review.Anal. Bioanal. Chem. 2007; 389: 1017-1031Crossref PubMed Scopus (1256) Google Scholar and Refs. 8.Listgarten J. Emili A. Statistical and computational methods for comparative proteomic profiling using liquid chromatography-tandem mass spectrometry.Mol. Cell. Proteomics. 2005; 4: 419-434Abstract Full Text Full Text PDF PubMed Scopus (243) Google Scholar, 9.Domon B. Aebersold R. Mass spectrometry and protein analysis.Science. 2006; 312: 212-217Crossref PubMed Scopus (1610) Google Scholar, 10.Mueller L.N. Brusniak M.Y. Mani D.R. Aebersold R. An assessment of software solutions for the analysis of mass spectrometry based quantitative proteomics data.J. Proteome Res. 2008; 7: 51-61Crossref PubMed Scopus (380) Google Scholar, 11.Nahnsen S. Bielow C. Reinert K. Kohlbacher O. Tools for label-free peptide quantification.Mol. Cell. Proteomics. 2012; 12: 549-556Abstract Full Text Full Text PDF PubMed Scopus (171) Google Scholar, 12.Bantscheff M. Lemeer S. Savitski M.M. Kuster B. Quantitative mass spectrometry in proteomics: critical review update from 2007 to the present.Anal. Bioanal. Chem. 2012; 404: 939-965Crossref PubMed Scopus (581) Google Scholar, 13.Matzke M.M. Brown J.N. Gritsenko M.A. Metz T.O. Pounds J.G. Rodland K.D. Shukla A.K. Smith R.D. Waters K.M. McDermott J.E. Webb-Robertson B.J. A comparative analysis of computational approaches to relative protein quantification using peptide peak intensities in label-free LC-MS proteomics experiments.Proteomics. 2013; 13: 493-503Crossref PubMed Scopus (61) Google Scholar, and associated software projects (14.Mueller L.N. Rinner O. Schmidt A. Letarte S. Bodenmiller B. Brusniak M.Y. Vitek O. Aebersold R. Muller M. SuperHirn—a novel tool for high resolution LC-MS-based peptide/protein profiling.Proteomics. 2007; 7: 3470-3480Crossref PubMed Scopus (274) Google Scholar, 15.Bellew M. Coram M. Fitzgibbon M. Igra M. Randolph T. Wang P. May D. Eng J. Fang R. Lin C. Chen J. Goodlett D. Whiteaker J. Paulovich A. McIntosh M. A suite of algorithms for the comprehensive analysis of complex protein mixtures using high-resolution LC-MS.Bioinformatics. 2006; 22: 1902-1909Crossref PubMed Scopus (225) Google Scholar, 16.Rauch A. Bellew M. Eng J. Fitzgibbon M. Holzman T. Hussey P. Igra M. Maclean B. Lin C.W. Detter A. Fang R. Faca V. Gafken P. Zhang H. Whiteaker J. States D. Hanash S. Paulovich A. McIntosh M.W. Computational Proteomics Analysis System (CPAS): an extensible, open-source analytic system for evaluating and publishing proteomic data and high throughput biological experiments.J. Proteome Res. 2006; 5: 112-121Crossref PubMed Scopus (176) Google Scholar, 17.May D. Fitzgibbon M. Liu Y. Holzman T. Eng J. Kemp C.J. Whiteaker J. Paulovich A. McIntosh M. A platform for accurate mass and time analyses of mass spectrometry data.J. Proteome Res. 2007; 6: 2685-2694Crossref PubMed Scopus (72) Google Scholar, 18.Jaffe J.D. Mani D.R. Leptos K.C. Church G.M. Gillette M.A. Carr S.A. PEPPeR, a platform for experimental proteomic pattern recognition.Mol. Cell. Proteomics. 2006; 5: 1927-1941Abstract Full Text Full Text PDF PubMed Scopus (126) Google Scholar, 19.Kohlbacher O. Reinert K. Gropl C. Lange E. Pfeifer N. Schulz-Trieglaff O. Sturm M. TOPP—the OpenMS proteomics pipeline.Bioinformatics. 2007; 23: e191-e197Crossref PubMed Scopus (214) Google Scholar, 20.Palagi P.M. Walther D. Quadroni M. Catherinet S. Burgess J. Zimmermann-Ivol C.G. Sanchez J.C. Binz P.A. Hochstrasser D.F. Appel R.D. MSight: an image analysis software for liquid chromatography-mass spectrometry.Proteomics. 2005; 5: 2381-2384Crossref PubMed Scopus (118) Google Scholar, 21.Johansson C. Samskog J. Sundstrom L. Wadensten H. Bjorkesten L. Flensburg J. Differential expression analysis of Escherichia coli proteins using a novel software for relative quantitation of LC-MS/MS data.Proteomics. 2006; 6: 4475-4485Crossref PubMed Scopus (91) Google Scholar, 22.Roy S.M. Becker C.H. Quantification of proteins and metabolites by mass spectrometry without isotopic labeling.Methods Mol. Biol. 2007; 359: 87-105Crossref PubMed Google Scholar, 23.Katajamaa M. Miettinen J. Oresic M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data.Bioinformatics. 2006; 22: 634-636Crossref PubMed Scopus (610) Google Scholar, 24.Leptos K.C. Sarracino D.A. Jaffe J.D. Krastins B. Church G.M. MapQuant: open-source software for large-scale protein quantification.Proteomics. 2006; 6: 1770-1782Crossref PubMed Scopus (95) Google Scholar, 25.Smith R.D. Anderson G.A. Lipton M.S. Pasa-Tolic L. Shen Y. Conrads T.P. Veenstra T.D. Udseth H.R. An accurate mass tag strategy for quantitative and high-throughput proteome measurements.Proteomics. 2002; 2: 513-523Crossref PubMed Scopus (404) Google Scholar, 26.Old W.M. Meyer-Arendt K. Aveline-Wolf L. Pierce K.G. Mendoza A. Sevinsky J.R. Resing K.A. Ahn N.G. Comparison of label-free methods for quantifying human proteins by shotgun proteomics.Mol. Cell. Proteomics. 2005; 4: 1487-1502Abstract Full Text Full Text PDF PubMed Scopus (1017) Google Scholar, 27.Sturm M. Bertsch A. Gropl C. Hildebrandt A. Hussong R. Lange E. Pfeifer N. Schulz-Trieglaff O. Zerck A. Reinert K. Kohlbacher O. OpenMS—an open-source software framework for mass spectrometry.BMC Bioinformatics. 2008; 9: 163Crossref PubMed Scopus (486) Google Scholar, 28.Listgarten J. Neal R.M. Roweis S.T. Wong P. Emili A. Difference detection in LC-MS data for protein biomarker discovery.Bioinformatics. 2007; 23: e198-e204Crossref PubMed Scopus (70) Google Scholar, 29.Park S.K. Venable J.D. Xu T. Yates 3rd, J.R. A quantitative analysis software tool for mass spectrometry-based proteomics.Nat. Methods. 2008; 5: 319-322Crossref PubMed Scopus (319) Google Scholar, 30.Bridges S.M. Magee G.B. Wang N. Williams W.P. Burgess S.C. Nanduri B. ProtQuant: a tool for the label-free quantification of MudPIT proteomics data.BMC Bioinformatics. 2007; 8: S24Crossref PubMed Scopus (46) Google Scholar, 31.Weisser H. Nahnsen S. Grossmann J. Nilse L. Quandt A. Brauer H. Sturm M. Kenar E. Kohlbacher O. Aebersold R. Malmstrom L. An automated pipeline for high-throughput label-free quantitative proteomics.J. Proteome Res. 2013; Crossref PubMed Scopus (125) Google Scholar) already exist. These computational methods include simple additive prescriptions to combine peptide intensities (32.Ning K. Fermin D. Nesvizhskii A.I. Comparative analysis of different label-free mass spectrometry based protein abundance estimates and their correlation with RNA-Seq gene expression data.J. Proteome Res. 2012; 11: 2261-2271Crossref PubMed Scopus (109) Google Scholar, 33.Cheng F.Y. Blackburn K. Lin Y.M. Goshe M.B. Williamson J.D. Absolute protein quantification by LC/MS(E) for global analysis of salicylic acid-induced plant protein secretion responses.J. Proteome Res. 2009; 8: 82-93Crossref PubMed Scopus (115) Google Scholar), reference-peptide-based estimates (34.Polpitiya A.D. Qian W.J. Jaitly N. Petyuk V.A. Adkins J.N. Camp 2nd, D.G. Anderson G.A. Smith R.D. DAnTE: a statistical tool for quantitative analysis of -omics data.Bioinformatics. 2008; 24: 1556-1558Crossref PubMed Scopus (328) Google Scholar), and statistical frameworks utilizing additive linear models (35.Karpievitch Y. Stanley J. Taverner T. Huang J. Adkins J.N. Ansong C. Heffron F. Metz T.O. Qian W.J. Yoon H. Smith R.D. Dabney A.R. A statistical framework for protein quantitation in bottom-up MS-based proteomics.Bioinformatics. 2009; 25: 2028-2034Crossref PubMed Scopus (119) Google Scholar, 36.Clough T. Key M. Ott I. Ragg S. Schadow G. Vitek O. Protein quantification in label-free LC-MS experiments.J. Proteome Res. 2009; 8: 5275-5284Crossref PubMed Scopus (76) Google Scholar). However, major bottlenecks remain: Most methods require measurement of samples under uniform conditions with strict adherence to standard sample-handling procedures, with minimal fractionation and in tight temporal sequence. Also, many methods are tailored toward a specific biological question, such as the detection of protein interactions (37.Choi H. Glatter T. Gstaiger M. Nesvizhskii A.I. SAINT-MS1: protein-protein interaction scoring using label-free intensity data in affinity purification-mass spectrometry experiments.J. Proteome Res. 2012; 11: 2619-2624Crossref PubMed Scopus (46) Google Scholar), and are therefore not suitable as generic tools for quantification at a proteome scale. Finally, the modest accuracy of their quantitative readouts relative to those obtained with stable-isotope-based methods often prohibits their use for biological questions that require the detection of small changes, such as proteome changes upon stimulus. Metabolic labeling methods such as SILAC 1The abbreviations used are: SILAC, stable isotope labeling by amino acids in cell culture; MS, mass spectrometry; LC-MS, liquid chromatography–mass spectrometry; MS/MS, tandem mass spectrometry; XIC, extracted ion current; LFQ, label-free quantification; UPS, universal protein standard; FDR, false discovery rate. 1The abbreviations used are: SILAC, stable isotope labeling by amino acids in cell culture; MS, mass spectrometry; LC-MS, liquid chromatography–mass spectrometry; MS/MS, tandem mass spectrometry; XIC, extracted ion current; LFQ, label-free quantification; UPS, universal protein standard; FDR, false discovery rate. (38.Ong S.E. Blagoev B. Kratchmarova I. Kristensen D.B. Steen H. Pandey A. Mann M. Stable isotope labeling by amino acids in cell culture, SILAC, as a simple and accurate approach to expression proteomics.Mol. Cell. Proteomics. 2002; 1: 376-386Abstract Full Text Full Text PDF PubMed Scopus (4569) Google Scholar) excel because of their unparalleled accuracy and robustness, which are mainly due to stability with regard to variability in sample processing and analysis steps. When isotope labels are introduced early in the workflow, samples can be mixed, and any sample-handling issues equally affect all proteins or peptides. This allows complex biochemical workflows without loss of quantitative accuracy. Conversely, any up-front separation of proteins or peptides potentially poses serious problems in a label-free approach, because the partitioning into fractions is prone to change slightly in the analysis of different samples. Chemical labeling (39.Gygi S.P. Rist B. Gerber S.A. Turecek F. Gelb M.H. Aebersold R. Quantitative analysis of complex protein mixtures using isotope-coded affinity tags.Nat. Biotechnol. 1999; 17: 994-999Crossref PubMed Scopus (4341) Google Scholar, 40.Ross P.L. Huang Y.N. Marchese J.N. Williamson B. Parker K. Hattan S. Khainovski N. Pillai S. Dey S. Daniels S. Purkayastha S. Juhasz P. Martin S. Bartlet-Jones M. He F. Jacobson A. Pappin D.J. Multiplexed protein quantitation in Saccharomyces cerevisiae using amine-reactive isobaric tagging reagents.Mol. Cell. Proteomics. 2004; 3: 1154-1169Abstract Full Text Full Text PDF PubMed Scopus (3680) Google Scholar, 41.Boersema P.J. Aye T.T. van Veen T.A. Heck A.J. Mohammed S. Triplex protein quantification based on stable isotope labeling by peptide dimethylation applied to cell and tissue lysates.Proteomics. 2008; 8: 4624-4632Crossref PubMed Scopus (186) Google Scholar) is in principle universally applicable, but because the labels are introduced later in the sample processing, some of the advantages in robustness are lost. Depending on the label used, it can also be uneconomical for large studies. High mass resolution and accuracy and high peptide identification rates have been key ingredients in the success of isotope-label-based methods. These factors contribute similarly to the quality of label-free quantification. An increased identification rate directly improves label-free quantification because it increases the number of data points and allows "pairing" of corresponding peptides across runs. Although high mass accuracy aids in the identification of peptides (42.Cox J. Mann M. MaxQuant enables high peptide identification rates, individualized p.p.b.-range mass accuracies and proteome-wide protein quantification.Nat. Biotechnol. 2008; 26: 1367-1372Crossref PubMed Scopus (9150) Google Scholar), it is the high mass resolution that is crucial to accurate quantification. This is because the accurate determination of extracted ion currents (XICs) of peptides is critical for comparison between samples (43.Andersen J.S. Wilkinson C.J. Mayor T. Mortensen P. Nigg E.A. Mann M. Proteomic characterization of the human centrosome by protein correlation profiling.Nature. 2003; 426: 570-574Crossref PubMed Scopus (1051) Google Scholar). At low mass resolution, XICs of peptides are often contaminated by nearby peptide signals, preventing accurate intensity readouts. In the past, this has led many researchers to use counts of identified MS/MS spectra as a proxy for the ion intensity or protein abundance (44.Ishihama Y. Oda Y. Tabata T. Sato T. Nagasu T. Rappsilber J. Mann M. Exponentially modified protein abundance index (emPAI) for estimation of absolute protein amount in proteomics by the number of sequenced peptides per protein.Mol. Cell. Proteomics. 2005; 4: 1265-1272Abstract Full Text Full Text PDF PubMed Scopus (1635) Google Scholar). Although the abundance of proteins and the probability of their peptides being selected for MS/MS sequencing are correlated to some extent, XIC-based methods should clearly be superior to spectral counting given sufficient resolution and optimal algorithms. These advantages are most prominent for low-intensity protein/peptide species, for which a continuous intensity readout is more information-rich than discrete counts of spectra. Therefore, we here apply the term "label-free quantification" strictly to XIC-based approaches and not to spectral counting. In this manuscript, we describe the MaxLFQ algorithms, part of the MaxQuant software suite, that solve two of the main problems of label-free protein quantification. We introduce "delayed normalization," which makes label-free quantification fully compatible with any up-front separation. Furthermore, we implemented a novel approach to protein quantification that extracts the maximum ratio information from peptide signals in arbitrary numbers of samples to achieve the highest possible accuracy of quantification. MaxLFQ is a generic method for label-free quantification that can be combined with standard statistical tests of quantification accuracy for each of thousands of quantified proteins. MaxLFQ has been available as part of the MaxQuant software suite for some time and has already been successfully applied to a variety of biological questions by us and other groups. It has delivered excellent performance in benchmark comparisons with other software solutions (31.Weisser H. Nahnsen S. Grossmann J. Nilse L. Quandt A. Brauer H. Sturm M. Kenar E. Kohlbacher O. Aebersold R. Malmstrom L. An automated pipeline for high-throughput label-free quantitative proteomics.J. Proteome Res. 2013; Crossref PubMed Scopus (125) Google Scholar). An Escherichia coli K12 strain was grown in standard LB medium, harvested, washed in PBS, and lysed in BugBuster (Novagen Merck Chemicals, Schwalbach, Germany) according to the manufacturer's protocol. HeLa S3 cells were grown in standard RPMI 1640 medium supplemented with glutamine, antibiotics, and 10% FBS. After being washed with PBS, cells were lysed in cold modified RIPA buffer (50 mm Tris-HCl, pH 7.5, 1 mm EDTA, 150 mm NaCl, 1% N-octylglycoside, 0.1% sodium deoxycholate, complete protease inhibitor mixture (Roche)) and incubated for 15 min on ice. Lysates were cleared by centrifugation, and after precipitation with chloroform/methanol, proteins were resuspended in 6 m urea, 2 m thiourea, 10 mm HEPES, pH 8.0. Prior to in-solution digestion, 60-μg protein samples from HeLa S3 lysates were spiked with either 10 μg or 30 μg of E. coli K12 lysates based on protein amount (Bradford assay). Both batches were reduced with dithiothreitol and alkylated with iodoacetamide. Proteins were digested with LysC (Wako Chemicals, GmbH, Neuss, Germany) for 4 h and then trypsin digested overnight (Promega, GmbH, Mannheim, Germany). Digestion was stopped by the addition of 2% trifluroacetic acid. Peptides were separated by isoelectric focusing into 24 fractions on a 3100 OFFGEL Fractionator (Agilent, GmbH, Böblingen, Germany) as described in Ref. 45.Hubner N.C. Ren S. Mann M. Peptide separation with immobilized pI strips is an attractive alternative to in-gel protein digestion for proteome analysis.Proteomics. 2008; (Dec. 8): 4862-4872Crossref PubMed Scopus (147) Google Scholar. Each fraction was purified with C18 StageTips (46.Rappsilber J. Ishihama Y. Mann M. Stop and go extraction tips for matrix-assisted laser desorption/ionization, nanoelectrospray, and LC/MS sample pretreatment in proteomics.Anal. Chem. 2003; 75: 663-670Crossref PubMed Scopus (1795) Google Scholar) and analyzed via liquid chromatography combined with electrospray tandem mass spectrometry on an LTQ Orbitrap (Thermo Fisher) with lock mass calibration (47.Olsen J.V. de Godoy L.M. Li G. Macek B. Mortensen P. Pesch R. Makarov A. Lange O. Horning S. Mann M. Parts per million mass accuracy on an Orbitrap mass spectrometer via lock mass injection into a C-trap.Mol. Cell. Proteomics. 2005; 4: 2010-2021Abstract Full Text Full Text PDF PubMed Scopus (1241) Google Scholar). All raw files were searched against the human and E. coli complete proteome sequences obtained from UniProt (version from January 2013) and a set of commonly observed contaminants. MS/MS spectra were filtered to contain at most eight peaks per 100 mass unit intervals. The initial MS mass tolerance was 20 ppm, and MS/MS fragment ions could deviate by up to 0.5 Da (48.Cox J. Hubner N.C. Mann M. How much peptide sequence information is contained in ion trap tandem mass spectra?.J. Am. Soc. Mass Spectrom. 2008; 19: 1813-1820Crossref PubMed Scopus (25) Google Scholar). For quantification, intensities can be determined alternatively as the full peak volume or as the intensity maximum over the retention time profile, and the latter method was used here as the default. Intensities of different isotopic peaks in an isotope pattern are always summed up for further analysis. MaxQuant offers a choice of the degree of uniqueness required in order for peptides to be included for quantification: "all peptides," "only unique peptides," and "unique plus razor peptides" (42.Cox J. Mann M. MaxQuant enables high peptide identification rates, individualized p.p.b.-range mass accuracies and proteome-wide protein quantification.Nat. Biotechnol. 2008; 26: 1367-1372Crossref PubMed Scopus (9150) Google Scholar). Here we chose the latter, because it is a good compromise between the two competing interests of using only peptides that undoubtedly belong to a protein and using as many peptide signals as possible. The distribution of peptide ions over fractions and samples is shown in supplemental Fig. S1. The E. coli K12 strain was grown in standard LB medium, harvested, washed in PBS, and lysed in 4% SDS, 100 mm Tris, pH 8.5. Lysates were briefly boiled and DNA sheared using a Sonifier (Branson Model 250). Lysates were cleared by centrifugation at 15,000 × g for 15 min and precipitated with acetone. Proteins were resuspended in 8 m urea, 25 mm Tris, pH 8.5, 10 mm DTT. After 30 min of incubation, 20 mm iodoacetamide was added for alkylation. The sample was then diluted 1:3 with 50 mm ammonium bicarbonate buffer, and the protein concentration was estimated via tryptophan fluorescence emission assay. After 5 h of digestion with LysC (Wako Chemicals) at room temperature, the sample was further diluted 1:3 with ammonium bicarbonate buffer, and trypsin (Promega) digestion was performed overnight (protein-to-enzyme ratio of 60:1 in each case). E. coli peptides were then purified by using a C18 Sep Pak cartridge (Waters, Milford, MA) according to the manufacturer's instructions. UPS1 and UPS2 standards (Sigma-Aldrich) were resuspended in 30 μl of 8 m urea, 25 mm Tris, pH 8.5, 10 mm DTT and reduced, alkylated, and digested in an analogous manner, but with a lower protein-to-enzyme ratio (12:1 for UPS1 and 10:1 for UPS2, both LysC and trypsin). UPS peptides were then purified using C18 StageTips. E. coli and UPS peptides were quantified based on absorbance at 280 nm using a NanoDrop spectrophotometer (Fisher Scientific). For each run, 2 μg of E. coli peptides were then spiked with 0.15 μg of either UPS1 or UPS2 peptides, and about 1.6 μg of the mix was then analyzed via liquid chromatography combined with mass spectrometry on a Q Exactive (Thermo Fisher). Data were analyzed with MaxQuant as described above for the proteome dataset. All files were searched against the E. coli complete proteome sequences plus those of the UPS proteins and common contaminants. To increase the number of peptides that can be used for quantification beyond those that have been sequenced and identified by an MS/MS database search engine, one can transfer peptide identifications to unsequenced or unidentified peptides by matching their mass and retention times ("match-between-runs" feature in MaxQuant). A prerequisite for this is that retention times between different LC-MS runs be made comparable via alignment. The order in which LC-MS runs are aligned is determined by hierarchical clustering, which allows one to avoid reliance on a single master run. The terminal branches of the tree from the hierarchical clustering typically connect LC-MS runs of the same or neighboring fractions or replicate runs, as they are the most similar. These cases are aligned first. Moving along the tree structure, increasingly dissimilar runs are integrated. The calibration functions that are needed to completely align LC-MS runs are usually time-dependent in a nonlinear way. Every pair-wise alignment step is performed via two-dimensional Gaussian kernel smoothing of the mass matches between the two runs. Following the ridge of the highest density region determines the recalibration function. At each tree node the resulting recalibration function is applied to one of the two subtrees, and the other is left unaltered. Unidentified LC-MS features are then assigned to peptide identifications in other runs that match based on their accurate masses and aligned retention times. In complex proteomes, the high mass accuracy on current Orbitrap instruments is still insufficient for an unequivocal peptide identification based on the peptide mass alone. However, when comparing peptides in similar LC-MS runs, the information contained in peptide mass and recalibrated retention time is enough to transfer identifications with a sufficiently low FDR (in the range of 1%), which one can estimate by comparing the density of matches inside the match time window to the density outside this window (49.Geiger T. Wehner A. Schaab C. Cox J. Mann M. Comparative proteomic analysis of eleven common cell lines reveals ubiquitous but varying expression of most proteins.Mol. Cell. Proteomics. 2012; 11Abstract Full Text Full Text PDF Scopus (577) Google Scholar). The matching procedure takes into account the up-front separation, in this case isoelectric focusing of peptides into 24 fractions. Identifications are only transferred into adjacent fractions. If, for instance, for a given peptide sequenced in fraction 7, isotope patterns are found to match by mass and retention time in fractions 6, 8, and 17, the matches in fraction 17 are discarded because they have a much greater probability of being false. The same strategy can be applied to any other up-front peptide or protein separation (e.g. one-dimensional gel electrophoresis). All matches with retention time differences of less than 0.5 min after recalibration are accepted. Further details on the alignment and matching algorithms, including how to control the FDR of matching, will be described in a future manuscript. The label-free software MaxLFQ is completely integrated into the MaxQuant software (42.Cox J. Mann M. MaxQuant enables high peptide identification rates, individualized p.p.b.-range mass accuracies and proteome-wide protein quantification.Nat. Biotechnol. 2008; 26: 1367-1372Crossref PubMed Scopus (9150) Google Scholar) and can be activated by one additional click. It is freely available to academic and commercial users as part of MaxQuant and can be downloaded via the Internet. MaxQuant runs on Windows desktop computers with Vista or newer operating systems, preferably the 64-bit versions. There is a lar
1

Multilevel proteomics reveals host perturbations by SARS-CoV-2 and SARS-CoV

Alexey Stukalov et al.Apr 12, 2021
The emergence and global spread of SARS-CoV-2 has resulted in the urgent need for an in-depth understanding of molecular functions of viral proteins and their interactions with the host proteome. Several individual omics studies have extended our knowledge of COVID-19 pathophysiology1–10. Integration of such datasets to obtain a holistic view of virus–host interactions and to define the pathogenic properties of SARS-CoV-2 is limited by the heterogeneity of the experimental systems. Here we report a concurrent multi-omics study of SARS-CoV-2 and SARS-CoV. Using state-of-the-art proteomics, we profiled the interactomes of both viruses, as well as their influence on the transcriptome, proteome, ubiquitinome and phosphoproteome of a lung-derived human cell line. Projecting these data onto the global network of cellular interactions revealed crosstalk between the perturbations taking place upon infection with SARS-CoV-2 and SARS-CoV at different levels and enabled identification of distinct and common molecular mechanisms of these closely related coronaviruses. The TGF-β pathway, known for its involvement in tissue fibrosis, was specifically dysregulated by SARS-CoV-2 ORF8 and autophagy was specifically dysregulated by SARS-CoV-2 ORF3. The extensive dataset (available at https://covinet.innatelab.org ) highlights many hotspots that could be targeted by existing drugs and may be used to guide rational design of virus- and host-directed therapies, which we exemplify by identifying inhibitors of kinases and matrix metalloproteases with potent antiviral effects against SARS-CoV-2. Multi-omics profiling of effects of SARS-CoV-2 and SARS-CoV on A549, a lung-derived human cell line, produces a dataset enabling identification of common and virus-specific mechanisms of infection.
1
Citation567
0
Save
1

A Novel LC System Embeds Analytes in Pre-formed Gradients for Rapid, Ultra-robust Proteomics

Nicolai Bache et al.Aug 13, 2018
To further integrate mass spectrometry (MS)-based proteomics into biomedical research and especially into clinical settings, high throughput and robustness are essential requirements. They are largely met in high-flow rate chromatographic systems for small molecules but these are not sufficiently sensitive for proteomics applications. Here we describe a new concept that delivers on these requirements while maintaining the sensitivity of current nano-flow LC systems. Low-pressure pumps elute the sample from a disposable trap column, simultaneously forming a chromatographic gradient that is stored in a long storage loop. An auxiliary gradient creates an offset, ensuring the re-focusing of the peptides before the separation on the analytical column by a single high-pressure pump. This simplified design enables robust operation over thousands of sample injections. Furthermore, the steps between injections are performed in parallel, reducing overhead time to a few minutes and allowing analysis of more than 200 samples per day. From fractionated HeLa cell lysates, deep proteomes covering more than 130,000 sequence unique peptides and close to 10,000 proteins were rapidly acquired. Using this data as a library, we demonstrate quantitation of 5200 proteins in only 21 min. Thus, the new system - termed Evosep One - analyzes samples in an extremely robust and high throughput manner, without sacrificing in depth proteomics coverage.
159

Multilevel proteomics reveals host perturbations by SARS-CoV-2 and SARS-CoV

Alexey Stukalov et al.Jun 17, 2020
Summary The global emergence of SARS-CoV-2 urgently requires an in-depth understanding of molecular functions of viral proteins and their interactions with the host proteome. Several individual omics studies have extended our knowledge of COVID-19 pathophysiology 1–10 . Integration of such datasets to obtain a holistic view of virus-host interactions and to define the pathogenic properties of SARS-CoV-2 is limited by the heterogeneity of the experimental systems. We therefore conducted a concurrent multi-omics study of SARS-CoV-2 and SARS-CoV. Using state-of-the-art proteomics, we profiled the interactome of both viruses, as well as their influence on transcriptome, proteome, ubiquitinome and phosphoproteome in a lung-derived human cell line. Projecting these data onto the global network of cellular interactions revealed crosstalk between the perturbations taking place upon SARS-CoV-2 and SARS-CoV infections at different layers and identified unique and common molecular mechanisms of these closely related coronaviruses. The TGF-β pathway, known for its involvement in tissue fibrosis, was specifically dysregulated by SARS-CoV-2 ORF8 and autophagy by SARS-CoV-2 ORF3. The extensive dataset (available at https://covinet.innatelab.org ) highlights many hotspots that can be targeted by existing drugs and it can guide rational design of virus- and host-directed therapies, which we exemplify by identifying kinase and MMPs inhibitors with potent antiviral effects against SARS-CoV-2.
0

A novel LC system embeds analytes in pre-formed gradients for rapid, ultra-robust proteomics

Nicolai Bache et al.May 15, 2018
To further integrate mass spectrometry (MS)-based proteomics into biomedical research and especially into clinical settings, high throughput and robustness are essential requirements. They are largely met in high-flow rate chromatographic systems for small molecules but these are not sufficiently sensitive for proteomics applications. Here we describe a new concept that delivers on these requirements while maintaining the sensitivity of current nano-flow LC systems. Low-pressure pumps elute the sample from a disposable trap column, simultaneously forming a chromatographic gradient that is stored in a long storage loop. An auxiliary gradient creates an offset, ensuring the re-focusing of the peptides before the separation on the analytical column by a single high-pressure pump. This simplified design enables robust operation over thousands of sample injections. Furthermore, the steps between injections are performed in parallel, reducing overhead time to a few minutes and allowing analysis of more than 200 samples per day. From fractionated HeLa cell lysates, deep proteomes covering more than 130,000 sequence unique peptides and close to 10,000 proteins were rapidly acquired. Using this data as a library, we demonstrate quantitation of 5200 proteins in only 21 min. Thus, the new system - termed Evosep One - analyzes samples in an extremely robust and high throughput manner, without sacrificing in depth proteomics coverage.