NA
N. Anderson
Author with expertise in Mass Spectrometry Techniques with Proteins
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
6
(67% Open Access)
Cited by:
3,776
h-index:
52
/
i10-index:
91
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Multi-site assessment of the precision and reproducibility of multiple reaction monitoring–based measurements of proteins in plasma

Terri Addona et al.Jun 28, 2009
Although multiple reaction monitoring (MRM) mass spectrometry holds considerable promise for quantifying candidate protein biomarkers in blood, transferability of MRM assays between laboratories has never been shown. Addona et al. assess the reproducibility, dynamic range and limits of detection and quantification of MRM across multiple sites. Verification of candidate biomarkers relies upon specific, quantitative assays optimized for selective detection of target proteins, and is increasingly viewed as a critical step in the discovery pipeline that bridges unbiased biomarker discovery to preclinical validation. Although individual laboratories have demonstrated that multiple reaction monitoring (MRM) coupled with isotope dilution mass spectrometry can quantify candidate protein biomarkers in plasma, reproducibility and transferability of these assays between laboratories have not been demonstrated. We describe a multilaboratory study to assess reproducibility, recovery, linear dynamic range and limits of detection and quantification of multiplexed, MRM-based assays, conducted by NCI-CPTAC. Using common materials and standardized protocols, we demonstrate that these assays can be highly reproducible within and across laboratories and instrument platforms, and are sensitive to low μg/ml protein concentrations in unfractionated plasma. We provide data and benchmarks against which individual laboratories can compare their performance and evaluate new technologies for biomarker verification in plasma.
0

The Human Plasma Proteome

N. Anderson et al.Jan 13, 2004
We have merged four different views of the human plasma proteome, based on different methodologies, into a single nonredundant list of 1175 distinct gene products. The methodologies used were 1) literature search for proteins reported to occur in plasma or serum; 2) multidimensional chromatography of proteins followed by two-dimensional electrophoresis and mass spectroscopy (MS) identification of resolved proteins; 3) tryptic digestion and multidimensional chromatography of peptides followed by MS identification; and 4) tryptic digestion and multidimensional chromatography of peptides from low-molecular-mass plasma components followed by MS identification. Of 1,175 nonredundant gene products, 195 were included in more than one of the four input datasets. Only 46 appeared in all four. Predictions of signal sequence and transmembrane domain occurrence, as well as Genome Ontology annotation assignments, allowed characterization of the nonredundant list and comparison of the data sources. The “nonproteomic” literature (468 input proteins) is strongly biased toward signal sequence-containing extracellular proteins, while the three proteomics methods showed a much higher representation of cellular proteins, including nuclear, cytoplasmic, and kinesin complex proteins. Cytokines and protein hormones were almost completely absent from the proteomics data (presumably due to low abundance), while categories like DNA-binding proteins were almost entirely absent from the literature data (perhaps unexpected and therefore not sought). Most major categories of proteins in the human proteome are represented in plasma, with the distribution at successively deeper layers shifting from mostly extracellular to a distribution more like the whole (primarily cellular) proteome. The resulting nonredundant list confirms the presence of a number of interesting candidate marker proteins in plasma and serum. We have merged four different views of the human plasma proteome, based on different methodologies, into a single nonredundant list of 1175 distinct gene products. The methodologies used were 1) literature search for proteins reported to occur in plasma or serum; 2) multidimensional chromatography of proteins followed by two-dimensional electrophoresis and mass spectroscopy (MS) identification of resolved proteins; 3) tryptic digestion and multidimensional chromatography of peptides followed by MS identification; and 4) tryptic digestion and multidimensional chromatography of peptides from low-molecular-mass plasma components followed by MS identification. Of 1,175 nonredundant gene products, 195 were included in more than one of the four input datasets. Only 46 appeared in all four. Predictions of signal sequence and transmembrane domain occurrence, as well as Genome Ontology annotation assignments, allowed characterization of the nonredundant list and comparison of the data sources. The “nonproteomic” literature (468 input proteins) is strongly biased toward signal sequence-containing extracellular proteins, while the three proteomics methods showed a much higher representation of cellular proteins, including nuclear, cytoplasmic, and kinesin complex proteins. Cytokines and protein hormones were almost completely absent from the proteomics data (presumably due to low abundance), while categories like DNA-binding proteins were almost entirely absent from the literature data (perhaps unexpected and therefore not sought). Most major categories of proteins in the human proteome are represented in plasma, with the distribution at successively deeper layers shifting from mostly extracellular to a distribution more like the whole (primarily cellular) proteome. The resulting nonredundant list confirms the presence of a number of interesting candidate marker proteins in plasma and serum. The human plasma proteome is likely to contain most, if not all, human proteins, as well as proteins derived from some viruses, bacteria, and fungi. Many of the human proteins, introduced by low-level tissue leakage, ought to be present at very low concentrations (≪pg/ml), while others, such as albumin, are present in very large amounts (≫mg/ml). Numerous post-translationally modified forms of each protein are likely to be present, along with literally millions of distinct clonal immunoglobulin (Ig) 1The abbreviations used are: Ig, immunoglobulin; MS, mass spectrometry; GO, Genome Ontology; 2DE, two-dimensional electrophoresis; NR, nonredundant; TM, transmembrane; LC, liquid chromatography; MS/MS, tandem MS; IT, ion trap.1The abbreviations used are: Ig, immunoglobulin; MS, mass spectrometry; GO, Genome Ontology; 2DE, two-dimensional electrophoresis; NR, nonredundant; TM, transmembrane; LC, liquid chromatography; MS/MS, tandem MS; IT, ion trap. sequences. This complexity and enormous dynamic range make plasma the most difficult specimen to be dealt with by proteomics (1Anderson N.L. Anderson N.G. The human plasma proteome: History, character, and diagnostic prospects..Mol. Cell. Proteomics. 2002; 1: 845-867Google Scholar). At the same time, plasma is the most generally informative proteome from a medical viewpoint. Almost all cells in the body communicate with plasma directly or through extracellular or cerebrospinal fluids, and many release at least part of their contents into plasma upon damage or death. Some medical conditions, such as myocardial infarction, are officially defined based on the increase of a specific protein in the plasma (e.g. cardiac troponin-T), and it is difficult to argue convincingly that there is any disease state that does not produce some specific pattern of protein change in the body’s working fluid. This immense diagnostic potential has spurred a rapid acceleration in the search for protein disease markers by a wide variety of proteomics strategies. Current methods of proteomics are only beginning to catalog the contents of plasma. Two-dimensional electrophoresis was able to resolve 40 distinct plasma proteins in 1976 (2Anderson L. Anderson N.G. High resolution two-dimensional electrophoresis of human plasma proteins..Proc. Natl. Acad. Sci. U. S. A. 1977; 74: 5421-5425Google Scholar), but, because of the dynamic range problem, this number had only grown to 60 in 1992 (3Hughes G.J. Frutiger S. Paquet N. Ravier F Pasquali C. Sanchez J.C. James R. Tissot J.D. Bjellqvist B. Hochstrasser D.F. Plasma protein map: An update by microsequencing..Electrophoresis. 1992; 13: 707-714Google Scholar) and is substantially unchanged today, a quarter century later. It is now clear that more than two dimensions of conventional resolution are required to progress beyond this point. Recently, several truly multidimensional survey efforts have been mounted, with the result that the number of distinct proteins detected has increased dramatically. Additional dimensions of separation can be introduced at any of three levels: a) separation of intact proteins, either by specific binding (e.g. subtraction of defined high-abundance proteins) or continuous resolution (e.g. electrophoresis or chromatography); b) separation of peptides derived from plasma proteins, either by specific binding (e.g. capture by anti-peptide antibodies) or continuous resolution (e.g. chromatography); and c) separation of peptides, and particularly their fragments, by mass spectrometry (MS). Many possible combinations of these dimensions can be implemented, the only limitations being the effort, cost, and time of analyzing many fractions or runs instead of one. In this article, we have compared and combined data from three different multi-dimensional strategies with data from a fourth, classical source (the protein biochemistry and clinical chemistry literature) to provide a meta-level overview of both the contents and the rate of discovery of new components in plasma. The three experimental datasets are derived from 1) whole protein separation by a three-dimensional process (immunosubtraction/ion exchange/size exclusion) followed by two-dimensional electrophoresis (2DE) followed by MS identification of resolved spots (4Pieper R. Su Q. Gatlin C.L. Huang S.T. Anderson N.L. Steiner S. Multi-component immunoaffinity subtraction chromatography: An innovative step towards a comprehensive survey of the human plasma proteome..Proteomics. 2003; 3: 422-432Google Scholar); 2) Ig subtraction followed by trypsin digestion followed by two-dimensional liquid chromatography (LC) (ion exchange/reversed phase) followed by tandem MS (MS/MS) (5Adkins J.N. Varnum S.M. Auberry K.J. Moore R.J. Angell N.H. Smith R.D. Springer D.L. Pounds J.G. Toward a human blood serum proteome: Analysis by multidimensional separation coupled with mass spectrometry..Mol. Cell. Proteomics. 2002; 1: 947-955Google Scholar); and 3) molecular mass fractionation, followed by trypsin digestion followed by two-dimensional LC (cation exchange/reversed phase) followed by MS/MS (6Tirumalai R.S. Chan K.C. Prieto D.A. Issaq H.J. Conrads T.P. Veenstra T.D. Characterization of the low molecular weight human serum proteome..Mol. Cell. Proteomics. 2003; 2: 1096-1103Google Scholar). These three experimental approaches have two features in common (the removal of most Igs, by specific subtraction or size, and the use of MS for molecular identification) but otherwise they span the gamut of proteomics discovery approaches: separation at the protein level, separation at the tryptic peptide level, and a hybrid. Combining experimental data with literature search results on proteins detected in plasma (representing a large body of accumulated “nonproteomics” data) should provide a broad perspective on plasma contents. Because the same proteins detected by various methods can be referred to by different names or accession numbers, we have used a sequence-based approach to eliminate redundancy and cluster all occurrences of the same protein. The resulting list makes it possible to examine the overlap between the various approaches and to see whether they are biased toward particular classes of proteins. In addition, a pooled nonredundant list should provide a relatively unbiased survey of the kinds of proteins present in plasma, which could have important diagnostic implications. Finally, a large list of proteins actually observed in plasma paves the way for top-down, targeted proteomics approaches to the discovery of disease markers: the development of accurate high-throughput specific assays for selected candidates from this list, as a supplement to the use of single methods for marker discovery in small sample sets. In the longer term, proteins with strong, mechanistic disease relationships may be viable therapeutic candidates as well. Manual Medline searches were performed searching for titles or abstracts containing human plasma or serum proteins, excluding articles on membranes, stimulation, drug, and dose. A total of 468 entries were collected, of which 458 had a human sequence accession number in one or more of the major databases. Intact proteins were fractionated by chromatography and 2DE and identified by MS, generating the dataset described by Pieper et al. (7Pieper R. Gatlin C.L. Makusky A.J. Russo P.S. Schatz C.R. Miller S.S. Su Q. McGrath A.M. Estock M.A. Parmar P.P. Zhao M. Huang S.T. Zhou J. Wang F. Esquer-Blasco R. Anderson N.L. Taylor J. Steiner S. The human serum proteome: Display of nearly 3700 chromatographically separated protein spots on two-dimensional electrophoresis gels and identification of 325 distinct proteins..Proteomics. 2003; 3: 1345-1364Google Scholar). Briefly, human blood sera were obtained in equal volumes from two healthy male donors (ages 40 and 80). Albumin, haptoglobin, transferrin, transthyretin, α-1-anti trypsin, α-1-acid glycoprotein, hemopexin, and α-2-macroglobulin were removed by immunoaffinity chromatography. The immunoaffinity-subtracted serum concentrate was fractionated further by sequential anion exchange and size exclusion chromatography. The resulting 66 samples were individually subjected to 2DE. All visible Coomassie Blue R250 spots were cut out, destained, reduced, alkylated, and digested with trypsin. All extracted peptides were analyzed by matrix-assisted laser desorption/ionization time-of-flight (MALDI-TOF) on a Bruker Biflex or Autoflex mass spectrometer (Bruker, Billerica, MA) and searched against Swiss-Prot. Those samples that did not give positive identification by MALDI-TOF where subjected to LC-MS/MS analysis by ion trap (IT) MS (Thermo Finnegan LCQ, Woburn, MA) and searched against the National Center for Biotechnology Information (NCBI) database using SEQUEST. A published dataset prepared by Adkins et al., (5Adkins J.N. Varnum S.M. Auberry K.J. Moore R.J. Angell N.H. Smith R.D. Springer D.L. Pounds J.G. Toward a human blood serum proteome: Analysis by multidimensional separation coupled with mass spectrometry..Mol. Cell. Proteomics. 2002; 1: 947-955Google Scholar) was used. Briefly, human blood serum was obtained from a healthy anonymous female donor. Igs were depleted by affinity adsorption chromatography using protein A/G. The resulting Ig-depleted plasma was digested with trypsin and separated by strong cation exchange on a polysulfoethyl A column followed by reverse-phase separation on a capillary C18 column. The capillary column was interfaced to an IT-MS (Thermo Finnigan LCQ Deca XP) using electrospray ionization. The IT-MS was configured to perform MS/MS scans on the three most intense precursor masses from a single MS scan. All samples were measured over a mass/charge (m/z) range of 400–2,000, with fractions containing high complexity being measured with segmented m/z ranges. Tandem mass spectra were analyzed by SEQUEST as described using the NCBI May 2002 database. The fourth dataset is that described by Tirumalai et al. (6Tirumalai R.S. Chan K.C. Prieto D.A. Issaq H.J. Conrads T.P. Veenstra T.D. Characterization of the low molecular weight human serum proteome..Mol. Cell. Proteomics. 2003; 2: 1096-1103Google Scholar), focused on the lower-molecular-mass plasma proteome. Briefly standard human serum was purchased from the National Institute of Standards and Technology. High-molecular-mass proteins were removed in the presence of acetonitrile using Centriplus centrifugal filters with a molecular mass cutoff of 30 kDa. The low-molecular-mass filtrate was reduced, alkylated, and digested with trypsin. The digested sample was fractionated by strong cation exchange chromatography on a polysulfoethyl A column. Reversed-phase LC was subsequently performed on 300A Jupiter C-18 column coupled on line to an IT-MS (Thermo Finnegan LCQ Deca XP). Each full MS scan was followed by three MS/MS scans where the three most abundant peptide molecular ions were selected. MS/MS spectra were searched against the a human protein database using SEQUEST. The Blastp protein comparison algorithm (8Altschul S.F. Gish W. Miller W. Myers E.W. Lipman D.J. Basic local alignment search tool..J. Mol. Biol. 1990; 215: 403-410Google Scholar, 9Altschul S.F. Madden T.L. Schaffer A.A. Zhang J. Zhang Z. Miller W. Lipman D.J. Gapped blast and psi-blast: A new generation of protein database search programs..Nucleic Acids Res. 1997; 25: 3389-3402Google Scholar) was used to query the sequence of each protein identified against a database containing the aggregate sequences of all proteins identified by any method. Sequences sharing greater than 95% identity over an aligned region were grouped into “unique sequence clusters.” Sequences were unmasked, and the minimum alignment length considered was 15 aa. This similarity-based approach was sufficient to group identical sequences, sequence fragments, and splice variants. Annotation in the nonredundant table was reported for the “best annotated” protein in the cluster set. Signal peptides were predicted using the commercially available SignalP version 2.0 neural net and hidden Markov model (HMM) algorithms (10Nielsen H. Engelbrecht J. Brunak S. von Heijne G. Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites..Protein Eng. 1997; 10: 1-6Google Scholar) and sigmask (11Swindells M. Rae M. Pearce M. Moodie S. Miller R. Leach P. Application of high-throughput computing in bioinformatics..Philos. Transact. Ser. A. Math. Phys. Eng. Sci. 2002; 360: 1179-1189Google Scholar) signal masking program developed as part of Inpharmatica’s Biopendium (12Michalovich D. Overington J. Fagan R. Protein sequence analysis in silico: Application of structure-based bioinformatics to genomic initiatives..Curr. Opin. Pharmacol. 2002; 2: 574-580Google Scholar) protein annotation database. Each sequence received a score of +1 for a statistically significant positive signal peptide prediction from any of the three algorithms. The scores 0, 1, 2, and 3 for a particular sequence were then converted to qualitative terms “no,” “possible signal,” “signal,” or “signal confident,” respectively. Transmembrane (TM) regions were predicted using the commercial version of TMHMM version 2.0 algorithm (13Krogh A. Larsson B. von Heijne G. Sonnhammer E.L. Predicting transmembrane protein topology with a hidden Markov model: Application to complete genomes..J. Mol. Biol. 2001; 305: 567-580Google Scholar). The total number of TM helices predicted per sequence was reported for each protein sequence. When a predicted TM region overlapped a predicted signal sequence (as it did in 40 cases in H_Plasma_NR_v2), this was interpreted as a signal sequence only. Sequences were scanned against a library of BioPendium and iPSI-BLAST (9Altschul S.F. Madden T.L. Schaffer A.A. Zhang J. Zhang Z. Miller W. Lipman D.J. Gapped blast and psi-blast: A new generation of protein database search programs..Nucleic Acids Res. 1997; 25: 3389-3402Google Scholar, 11Swindells M. Rae M. Pearce M. Moodie S. Miller R. Leach P. Application of high-throughput computing in bioinformatics..Philos. Transact. Ser. A. Math. Phys. Eng. Sci. 2002; 360: 1179-1189Google Scholar)-like protein profiles constructed from SCOP (14Murzin A.G. Brenner S.E. Hubbard T. Chothia C. SCOP: A structural classification of proteins database for the investigation of sequences and structures..J. Mol. Biol. 1995; 247: 536-540Google Scholar), PFAM (15Bateman A. Birney E. Cerruti L. Durbin R. Etwiller L. Eddy S.R. Griffiths-Jones S. Howe K.L. Marshall M. Sonnhammer E.L. The pfam protein families database..Nucleic Acids Res. 2002; 30: 276-280Google Scholar), PRINTS (16Attwood T.K. Bradley P. Flower D.R. Gaulton A. Maudling N. Mitchell A.L. Moulton G. Nordle A. Paine K. Taylor P. Uddin A. Zygouri C. Prints and its automatic supplement, preprints..Nucleic Acids Res. 2003; 31: 400-402Google Scholar), and PROSITE (17Sigrist C.J. Cerutti L. Hulo N. Gattiker A. Falquet L. Pagni M. Bairoch A. Bucher P. PROSITE: A documented database using patterns and profiles as motif descriptors..Brief Bioinform. 2002; 3: 265-274Google Scholar) domain families. Hits to these profiles were reported at a statistical e-value cut-off of 1e-5. This cut-off was chosen to maximize profile coverage and minimize the occurrence of false positives. Sequences were not masked for low complexity or coiled coils prior to profile scanning. NCBI GI number accessions for the sequences were matched to their SPTR (18Boeckmann B. Bairoch A. Apweiler R. Blatter M.C. Estreicher A. Gasteiger E. Martin M.J. Michoud K. O’Donovan C. Phan I. Pilbout S. Schneider M. The Swiss-Prot protein knowledgebase and its supplement TrEMBL in 2003..Nucleic Acids Res. 2003; 31: 365-370Google Scholar) equivalents based on sequences sharing >95% sequence identity over 90% of the query sequence length. GO (19Ashburner M. Ball C.A. Blake J.A. Botstein D. Butler H. Cherry J.M. Davis A.P. Dolinski K. Dwight S.S. Eppig J.T. Harris M.A. Hill D.P. Issel-Tarver L. Kasarskis A. Lewis S. Matese J.C. Richardson J.E. Ringwald M. Rubin G.M. Sherlock G. Gene Ontology: Tool for the unification of biology. The Gene Ontology Consortium..Nat. Genet. 2000; 25: 25-29Google Scholar) component, process, and function terms were then extracted from text-based annotation files available for download from the GO database ftp site: ftp.geneontology.org/pub/go/gene-associations/gene_association.goa_human. For graphical reporting, a series of GO terms in each category were extracted by text searching of relevant keywords (indicated by the category names on plots) through all the assigned GO definitions. A GO component summary for the whole human proteome was prepared by applying the same approach to the complete GO human database referred to above. The nonredundant (NR) plasma database was assembled as a series of tables in a PostgreSQL relational database and queried to derive summary statistics for tables and figures shown here. Four sets of accession numbers for proteins occurring in plasma (468 from Lit, 319 from 2DEMS, 607 [reported as 490 nonredundant accessions] from LCMS1, and 341 from LCMS2) were combined to yield 1,735 total initial accessions (Table I). A total of 55 of the input accessions referred to nonhuman sequences, and these were not considered further in the present analysis. A very conservative method of selecting distinct proteins was used in order to avoid counting sequence variants, splice variants, or cleavage products of one gene product as different: any sequences that shared a region larger than 15 aa with greater than 95% sequence identity were assigned to the same cluster and reported as a single entry in the nonredundant set. Fig. 1 shows one result of applying these criteria, in this case resulting in the assignment of 10 initial accessions to a single cluster for haptoglobin, a major plasma protein found in all four initial datasets and whose three separate subunit types are derived from a single translation product. This case also highlights the general observation that not all datasets used the same primary accession database (NCBI GI, Swiss-Prot, or RefSeq as examples). The largest cluster (109 “redundant” entries) is accounted for by Igs, where all the Ig heavy and light chains of all types were clustered together as one entry arbitrarily chosen as S40354 (an Ig κ chain sequence). Thus 6.2% of the input accessions were Igs, despite the fact that each of the experimental methods included steps to remove these molecules.Table IProtein redundancy within and between datasetsLitLCMS1LCMS22DEMSTotalBeginning accessions4686073413191735Minus nonhuman4585803303121680Minus intrasource redundancy and nonhuman accessions4334753182831509Unique to source in NR284334221141980Total combined NR list––––1175 Open table in a new tab This approach is more conservative (fewer distinct proteins reported) than the methods used in some of the input data sources, which accounts for the decrease in each set when intra-set redundancy is removed (1,509 human accessions remain). When inter-set redundancies are removed (making the full list nonredundant by the criteria described above), a total of 1,175 distinct proteins remain. The entire nonredundant set, here abbreviated H_Plasma_NR_v2 (H_Plasma_NR_v1 being Table I of Ref. 1Anderson N.L. Anderson N.G. The human plasma proteome: History, character, and diagnostic prospects..Mol. Cell. Proteomics. 2002; 1: 845-867Google Scholar), is provided as a supplemental data table. Of these, a total of 980 occur in only one source. Because so many entries occur only once, and given the non-zero frequency of false MS identifications, independent confirmation will be required to validate most of this list as true plasma components. Of the 1,175 nonredundant human proteins in H_Plasma_NR_v2, 195 entries, or 17%, were present in more than one dataset (set H_Plasma_195: Fig. 2 and Table II). Only 46 (4%) were found in all four sets of accessions (Total_sources = 4, shown in bold type in Table II). Of these only one (inter-α trypsin inhibitor heavy chain H1) is predicted to have even a single transmembrane domain, and only one (the hemoglobin β chain presumably released from red cell lysis) is predicted not to have a signal sequence. These characteristics (presence of signal sequence and absence of transmembrane domains) are those expected for major plasma proteins secreted by organs such as the liver.Table IIPlasma proteins detected in at least two datasetsAccessionLit2DEMSLCMS1LCMS2Total_accessionsTotal_sourcesSignalTMDescriptionP10809101133No060-kDa heat shock protein, mitochondrial precursor (Hsp60) (60-kDa chaperonin) (CPN60) (Heat shock protein 60) (HSP-60) (mitochondrial matrix protein P1) (P60 lymphocyte protein) (hucha60)AAB27045001122Possible signal070-kDa peroxisomal membrance protein homolog (internal fragment)P02570240283No0Actin, cytoplasmic 1 (β-actin)Q15848110022Signal confident0Adiponectin precursor (30-kDa adipocyte complement-related protein) (ACRP30) (adipose most abundant gene transcript 1) (apm-1) (gelatin-binding protein)NP_001124011022Signal confident0Afamin precursor; α-albumin (Homo sapiens)P02763111033Signal confident0α-1-acid glycoprotein 1 precursor (AGP 1) (orosomucoid 1) (OMD 1)P01011112043Signal confident0α-1-antichymotrypsin precursor (ACT)P01009111144Signal confident0α-1-antitrypsin precursor (α-1 protease inhibitor) (α-1-antiproteinase) (PRO0684/PRO2209)P04217111033No0α-1B-glycoprotein precursor (α-1-B glycoprotein)P08697111144Signal0α-2-antiplasmin precursor (α-2-plasmin inhibitor) (α-2-PI) (α-2-AP)P02765111144Signal confident0α-2-HS-glycoprotein precursor (Fetuin-A) (α-2-Z-globulin) (Ba-α-2-glycoprotein) (PRO2743)P01023112154Signal confident0α-2-macroglobulin precursor (α-2-M)P02760111033Signal confident0AMBP protein precursor [contains α-1-microglobulin (protein HC) (complex-forming glycoprotein heterogeneous in charge) (α-1 microglycoprotein); inter-α-trypsin inhibitor light chain (ITI-LC) (bikunin) (HI-30)]P01019111144Signal0Angiotensinogen precursor [contains angiotensin I (Ang I); angiotensin II (Ang II); angiotensin III (Ang III) (Des-Asp[1]-angiotensin II)]P01008111144Signal0Antithrombin-III precursor (ATIII) (PRO0309)P02647112264Signal confident0Apolipoprotein A-I precursor (Apo-AI)P02652111144Signal confident0Apolipoprotein A-II precursor (Apo-AII) (apoa-II)P06727111254Signal confident0Apolipoprotein A-IV precursor (Apo-AIV)P04114112043Signal confident0Apolipoprotein B-100 precursor (Apo B-100) [contains: apolipoprotein B-48 (Apo B-48)]P02655111144Signal confident0Apolipoprotein C-II precursor (Apo-CII)P02656111144Signal confident0Apolipoprotein C-III precursor (Apo-CIII)P05090111144Signal confident0Apolipoprotein D precursor (Apo-D) (apod)P02649132174Signal confident0Apolipoprotein E precursor (Apo-E)Q13790111144Signal confident0Apolipoprotein F precursor (Apo-F)O14791111144Signal0Apolipoprotein L1 precursor (apolipoprotein L-I) (apolipoprotein L) (apol-I) (Apo-L) (apol)P08519101022Signal0Apolipoprotein(a) precursor (EC 3.4.21.−) (Apo(a)) (Lp(a))P06576011022Possible signal0ATP synthase β chain, mitochondrial precursor (EC 3.6.3.14)P01160101022Signal confident0Atrial natriuretic factor precursor (ANF) (atrial natriuretic peptide) (ANP) (prepronatriodilatin) [contains: cardiodilatin-related peptide (CDP)]P02749111144Signal confident0β-2-glycoprotein I precursor (apolipoprotein H) (Apo-H) (B2GPI) (β(2)GPI) (activated protein C-binding protein) (APC inhibitor)P01884100122Signal confident0β-2-microglobulin precursorI39467001122No0Bullous pemphigoid antigen, human (fragment)P04003111033Signal0C4b-binding protein α chain precursor (c4bp) (proline-rich protein) (PRP)P20851110022Signal confident0C4b-binding protein β chain precursorP05109110022No0Calgranulin A (Migration inhibitory factor-related protein 8) (MRP-8) (cystic fibrosis antigen) (CFAG) (P8) (leukocyte L1 complex light chain) (S100 calcium-binding protein A8) (calprotectin L1L subunit)NP_001729011022No0Carbonic anhydrase I; carbonic dehydratase (Homo sapiens)P22792111033No0Carboxypeptidase N 83-kDa chain (carboxypeptidase N regulatory subunit) (fragment)P15169110022Signal0Carboxypeptidase N catalytic chain precursor (EC 3.4.17.3) (arginine carboxypeptidase) (kinase 1) (serum carboxypeptidase N) (SCPN) (anaphylatoxin inactivator) (plasma carboxypeptidase B)P07339110022Signal confident0Cathepsin D precursor (EC 3.4.23.5)P07711110022Signal confident0Cathepsin L precursor (EC 3.4.22.15) (major excreted protein) (MEP)P25774010122Signal confident0Cathepsin S precursor (EC 3.4.22.27)NP_005185001122No0CCAAT/enhancer binding protein β, interleukin 6-dependentO43866110022Signal confident0CD5 antigen-like precursor (SP-α) (CT-2) (igm-associated peptide)NP_005187002132No0Centromere protein F (350/400kd, mitosin); mitosin; centromereP00450111144Signal confident0Ceruloplasmin precursor (EC 1.16.3.1) (ferroxidase)NP_006421001122No0Chaperonin containing TCP1, subunit 4 (δ); chaperoninNP_004061001122No10Chloride channel Ka; chloride channel, kidney, A; hclc-Ka (Homo sapiens)P06276110022Signal confident1Cholinesterase precursor (EC 3.1.1.8) (acylcholine acylhydrolase) (choline esterase II) (butyrylcholine esterase) (pseudocholinesterase)P10909111144Signal confident0Clusterin precursor (complement-associated protein SP-40,40) (complement cytolysis inhibitor) (CLI) (NA1 and NA2) (apolipoprotein J) (Apo-J) (TRPM-2)P00740110133Signal0Coagulation factor IX precursor (EC 3.4.21.22) (Christmas factor)P12259101133Signal confident0Coagulation factor V precursor (activated protein C cofactor)P00451101022Signal0Coagulation factor VIII precursor (procoagulant component) (antihemophilic factor) (AHF)P00742110022Signal confident0Coagulation factor X precursor (EC 3.4.21.6) (Stuart factor)P00748111144Signal confident0Coagulation factor XII precursor (EC 3.4.21.38) (Hageman factor) (HAF)P00488110133No0Coagulation factor XIII A chain precursor (EC 2.3.2.13) (protein-glutamine γ-glutamyltransferase A chain) (transglutaminase A chain)P05160111033Signal confident0Coagulation facto
0

Mass Spectrometric Quantitation of Peptides and Proteins Using Stable Isotope Standards and Capture by Anti-Peptide Antibodies (SISCAPA)

N. Anderson et al.Feb 6, 2004
A method (denoted SISCAPA) for quantitation of peptides in complex digests is described. In the method, anti-peptide antibodies immobilized on 100 nanoliter nanoaffinity columns are used to enrich specific peptides along with spiked stable-isotope-labeled internal standards of the same sequence. Upon elution from the anti-peptide antibody supports, electrospray mass spectrometry is used to quantitate the peptides (natural and labeled). In a series of pilot experiments, tryptic test peptides were chosen for four proteins of human plasma (hemopexin, α1 antichymotrypsin, interleukin-6, and tumor necrosis factor-α) from a pool of 10 203 in silico tryptic peptide candidates representing 237 known plasma components. Rabbit polyclonal antibodies raised against the chosen peptide sequences were affinity purified and covalently immobilized on POROS supports. Binding and elution from these supports was shown to provide an average 120-fold enrichment of the antigen peptide relative to others, as measured by selected ion monitoring (SIM) or selected reaction monitoring (SRM) electrospray mass spectrometry. The columns could be recycled with little loss in binding capacity, and generated peptide ion current measurements with cycle-to-cycle coefficients of variation near 5%. Anti-peptide antibody enrichment will contribute to increased sensitivity of MS-based assays, particularly for lower abundance proteins in plasma, and may ultimately allow substitution of a rapid bind/elute process for the time-consuming reverse phase separation now used as a prelude to online MS peptide assays. The method appears suitable for rapid generation of assays for defined proteins, and should find application in the validation of diagnostic protein panels in large sample sets. Keywords: peptide quantitation • mass spectrometry • anti-peptide antibody • stable isotope • affinity chromatography
0

The human serum proteome: Display of nearly 3700 chromatographically separated protein spots on two‐dimensional electrophoresis gels and identification of 325 distinct proteins

Rembert Pieper et al.Jul 1, 2003
Plasma, the soluble component of the human blood, is believed to harbor thousands of distinct proteins, which originate from a variety of cells and tissues through either active secretion or leakage from blood cells or tissues. The dynamic range of plasma protein concentrations comprises at least nine orders of magnitude. Proteins involved in coagulation, immune defense, small molecule transport, and protease inhibition, many of them present in high abundance in this body fluid, have been functionally characterized and associated with disease processes. For example, protein sequence mutations in coagulation factors cause various serious disease states. Diagnosing and monitoring such diseases in blood plasma of affected individuals has typically been conducted by use of enzyme-linked immunosorbent assays, which using a specific antibody quantitatively measure only the affected protein in the tested plasma samples. The discovery of protein biomarkers in plasma for diseases with no known correlations to genetic mutations is challenging. It requires a highly parallel display and quantitation strategy for proteins. We fractionated blood serum proteins prior to display on two-dimensional electrophoresis (2-DE) gels using immunoaffinity chromatography to remove the most abundant serum proteins, followed by sequential anion-exchange and size-exclusion chromatography. Serum proteins from 74 fractions were displayed on 2-DE gels. This approach succeeded in resolving approximately 3700 distinct protein spots, many of them post-translationally modified variants of plasma proteins. About 1800 distinct serum protein spots were identified by mass spectrometry. They collapsed into 325 distinct proteins, after sequence homology and similarity searches were carried out to eliminate redundant protein annotations. Although a relatively insensitive dye, Coomassie Brilliant Blue G-250, was used to visualize protein spots, several proteins known to be present in serum in < 10 ng/mL concentrations were identified such as interleukin-6, cathepsins, and peptide hormones. Considering that our strategy allows highly parallel protein quantitation on 2-DE gels, it holds promise to accelerate the discovery of novel serum protein biomarkers.
0
Citation508
0
Save
0

Multiple Reaction Monitoring-based, Multiplexed, Absolute Quantitation of 45 Proteins in Human Plasma

Michael Kuzyk et al.May 3, 2009
Mass spectrometry-based multiple reaction monitoring (MRM) quantitation of proteins can dramatically impact the discovery and quantitation of biomarkers via rapid, targeted, multiplexed protein expression profiling of clinical samples. A mixture of 45 peptide standards, easily adaptable to common plasma proteomics work flows, was created to permit absolute quantitation of 45 endogenous proteins in human plasma trypsin digests. All experiments were performed on simple tryptic digests of human EDTA-plasma without prior affinity depletion or enrichment. Stable isotope-labeled standard peptides were added immediately following tryptic digestion because addition of stable isotope-labeled standard peptides prior to trypsin digestion was found to generate elevated and unpredictable results. Proteotypic tryptic peptides containing isotopically coded amino acids ([13C6]Arg or [13C6]Lys) were synthesized for all 45 proteins. Peptide purity was assessed by capillary zone electrophoresis, and the peptide quantity was determined by amino acid analysis. For maximum sensitivity and specificity, instrumental parameters were empirically determined to generate the most abundant precursor ions and y ion fragments. Concentrations of individual peptide standards in the mixture were optimized to approximate endogenous concentrations of analytes and to ensure the maximum linear dynamic range of the MRM assays. Excellent linear responses (r > 0.99) were obtained for 43 of the 45 proteins with attomole level limits of quantitation (<20% coefficient of variation) for 27 of the 45 proteins. Analytical precision for 44 of the 45 assays varied by <10%. LC-MRM/MS analyses performed on 3 different days on different batches of plasma trypsin digests resulted in coefficients of variation of <20% for 42 of the 45 assays. Concentrations for 39 of the 45 proteins are within a factor of 2 of reported literature values. This mixture of internal standards has many uses and can be applied to the characterization of trypsin digestion kinetics and plasma protein expression profiling because 31 of the 45 proteins are putative biomarkers of cardiovascular disease. Mass spectrometry-based multiple reaction monitoring (MRM) quantitation of proteins can dramatically impact the discovery and quantitation of biomarkers via rapid, targeted, multiplexed protein expression profiling of clinical samples. A mixture of 45 peptide standards, easily adaptable to common plasma proteomics work flows, was created to permit absolute quantitation of 45 endogenous proteins in human plasma trypsin digests. All experiments were performed on simple tryptic digests of human EDTA-plasma without prior affinity depletion or enrichment. Stable isotope-labeled standard peptides were added immediately following tryptic digestion because addition of stable isotope-labeled standard peptides prior to trypsin digestion was found to generate elevated and unpredictable results. Proteotypic tryptic peptides containing isotopically coded amino acids ([13C6]Arg or [13C6]Lys) were synthesized for all 45 proteins. Peptide purity was assessed by capillary zone electrophoresis, and the peptide quantity was determined by amino acid analysis. For maximum sensitivity and specificity, instrumental parameters were empirically determined to generate the most abundant precursor ions and y ion fragments. Concentrations of individual peptide standards in the mixture were optimized to approximate endogenous concentrations of analytes and to ensure the maximum linear dynamic range of the MRM assays. Excellent linear responses (r > 0.99) were obtained for 43 of the 45 proteins with attomole level limits of quantitation (<20% coefficient of variation) for 27 of the 45 proteins. Analytical precision for 44 of the 45 assays varied by <10%. LC-MRM/MS analyses performed on 3 different days on different batches of plasma trypsin digests resulted in coefficients of variation of <20% for 42 of the 45 assays. Concentrations for 39 of the 45 proteins are within a factor of 2 of reported literature values. This mixture of internal standards has many uses and can be applied to the characterization of trypsin digestion kinetics and plasma protein expression profiling because 31 of the 45 proteins are putative biomarkers of cardiovascular disease. MS is capable of sensitive and accurate protein quantitation based on the quantitation of proteolytic peptides as surrogates for the corresponding intact proteins. Over the past 10 years, MS-based protein quantitation based on the analysis of peptides (in other words, based on “bottom-up” proteomics) has had a profound impact on how biological problems can be addressed (1Ackermann B.L. Berna M.J. Coupling immunoaffinity techniques with MS for quantitative analysis of low-abundance protein biomarkers.Expert Rev. Proteomics. 2007; 4: 175-186Crossref PubMed Scopus (151) Google Scholar, 2Ong S.E. Mann M. Mass spectrometry-based proteomics turns quantitative.Nat. Chem. Biol. 2005; 1: 252-262Crossref PubMed Scopus (1321) Google Scholar). Although advances in MS instrumentation have contributed to the improvement of MS-based protein quantitation, the use of stable isotopes in quantitative work flows has arguably had the greatest impact in improving the quality and reproducibility of MS-based protein quantitation (3Aggarwal K. Choe L.H. Lee K.H. Quantitative analysis of protein expression using amine-specific isobaric tags in Escherichia coli cells expressing rhsA elements.Proteomics. 2005; 5: 2297-2308Crossref PubMed Scopus (71) Google Scholar, 4Aebersold R. Mann M. Mass spectrometry-based proteomics.Nature. 2003; 422: 198-207Crossref PubMed Scopus (5639) Google Scholar, 5Ong S.E. Foster L.J. Mann M. Mass spectrometric-based approaches in quantitative proteomics.Methods. 2003; 29: 124-130Crossref PubMed Scopus (393) Google Scholar). The ongoing development of untargeted MS-based quantitation work flows has focused on increasingly exhaustive sample prefractionation methods, at both the protein and peptide levels, with the goal of detecting and quantifying entire proteomes (6Wei J. Sun J. Yu W. Jones A. Oeller P. Keller M. Woodnutt G. Short J.M. Global proteome discovery using an online three-dimensional LC-MS/MS.J. Proteome Res. 2005; 4: 801-808Crossref PubMed Scopus (86) Google Scholar). Although untargeted MS-based quantitation work flows have their utility, they are costly in terms of lengthy MS data acquisition and analysis times, and as a result, they are often limited to quantifying differences between small sample sets (n < 10). To facilitate rapid quantitation of larger, clinically relevant sample sets (n > 100) there is a need to both simplify sample preparation and reduce MS analysis time. Multiple reaction monitoring (MRM) 1The abbreviations used are:MRMmultiple reaction monitoringCEcollision energyCVcoefficient of variationCZEcapillary zone electrophoresisDPdeclustering potentialLOQlimit of quantitationQ1quadrupole 1Q3quadrupole 3SISstable isotope-labeled standardXICextracted ion chromatogramiTRAQisobaric tags for relative and absolute quantitation. is a tandem MS (MS/MS) scan mode unique to triple quadrupole MS instrumentation that is capable of rapid, sensitive, and specific quantitation of analytes in highly complex sample matrices (7Kondrat R.W. McClusky G.A. Cooks R.G. Multiple reaction monitoring in mass spectrometry/mass spectrometry for direct analysis of complex mixtures.Anal. Chem. 1978; 50: 2017-2021Crossref Scopus (134) Google Scholar). MRM is a targeted approach that requires knowledge of the molecular weight of an analyte and its fragmentation behavior under CID. MRM is capable of highly reproducible concentration determination when stable isotope-labeled internal standards are included in work flows and has been used for decades for the quantitation of low molecular mass analytes (<1000 Da) in pharmaceutical, clinical, and environmental applications (7Kondrat R.W. McClusky G.A. Cooks R.G. Multiple reaction monitoring in mass spectrometry/mass spectrometry for direct analysis of complex mixtures.Anal. Chem. 1978; 50: 2017-2021Crossref Scopus (134) Google Scholar, 8Gergov M. Ojanperä I. Vuori E. Simultaneous screening for 238 drugs in blood by liquid chromatography-ion spray tandem mass spectrometry with multiple-reaction monitoring.J. Chromatogr. B Analyt. Technol. Biomed. Life Sci. 2003; 795: 41-53Crossref PubMed Scopus (165) Google Scholar). multiple reaction monitoring collision energy coefficient of variation capillary zone electrophoresis declustering potential limit of quantitation quadrupole 1 quadrupole 3 stable isotope-labeled standard extracted ion chromatogram isobaric tags for relative and absolute quantitation. The combination of triple quadrupole MS instrumentation with nanoliter flow rate high performance LC and nanoelectrospray ionization provides the necessary sensitivity for detection and quantitation of biological molecules such as peptides in complex samples such as plasma by MRM. When combined with the use of isotopically labeled synthetic peptide standards, MRM analysis is capable of sensitive (attomole level) and absolute determination of peptide concentrations across a wide concentration scale spanning a dynamic range of 103–104 (1Ackermann B.L. Berna M.J. Coupling immunoaffinity techniques with MS for quantitative analysis of low-abundance protein biomarkers.Expert Rev. Proteomics. 2007; 4: 175-186Crossref PubMed Scopus (151) Google Scholar, 9Kamiie J. Ohtsuki S. Iwase R. Ohmine K. Katsukura Y. Yanai K. Sekine Y. Uchida Y. Ito S. Terasaki T. Quantitative atlas of membrane transporter proteins: development and application of a highly sensitive simultaneous LC/MS/MS method combined with novel in-silico peptide selection criteria.Pharm. Res. 2008; 25: 1469-1483Crossref PubMed Scopus (423) Google Scholar, 10Barnidge D.R. Goodmanson M.K. Klee G.G. Muddiman D.C. Absolute quantification of the model biomarker prostate-specific antigen in serum by LC-Ms/MS using protein cleavage and isotope dilution mass spectrometry.J. Proteome Res. 2004; 3: 644-652Crossref PubMed Scopus (243) Google Scholar, 11Kuhn E. Wu J. Karl J. Liao H. Zolg W. Guild B. Quantification of C-reactive protein in the serum of patients with rheumatoid arthritis using multiple reaction monitoring mass spectrometry and 13C-labeled peptide standards.Proteomics. 2004; 4: 1175-1186Crossref PubMed Scopus (369) Google Scholar, 12Zhang F. Bartels M.J. Stott W.T. Quantitation of human glutathione S-transferases in complex matrices by liquid chromatography/tandem mass spectrometry with signature peptides.Rapid Commun. Mass Spectrom. 2004; 18: 491-498Crossref PubMed Scopus (39) Google Scholar, 13Kirkpatrick D.S. Gerber S.A. Gygi S.P. The absolute quantification strategy: a general procedure for the quantification of proteins and post-translational modifications.Methods. 2005; 35: 265-273Crossref PubMed Scopus (486) Google Scholar). Several recent studies involving MRM-based analysis of plasma proteins have focused on increasing MRM detection sensitivity by fractionating plasma using either multidimensional liquid chromatography, affinity depletion of high abundance proteins (11Kuhn E. Wu J. Karl J. Liao H. Zolg W. Guild B. Quantification of C-reactive protein in the serum of patients with rheumatoid arthritis using multiple reaction monitoring mass spectrometry and 13C-labeled peptide standards.Proteomics. 2004; 4: 1175-1186Crossref PubMed Scopus (369) Google Scholar, 14Anderson L. Hunter C.L. Quantitative mass spectrometric multiple reaction monitoring assays for major plasma proteins.Mol. Cell. Proteomics. 2006; 5: 573-588Abstract Full Text Full Text PDF PubMed Scopus (1085) Google Scholar, 15Keshishian H. Addona T. Burgess M. Kuhn E. Carr S.A. Quantitative, multiplexed assays for low abundance proteins in plasma by targeted mass spectrometry and stable isotope dilution.Mol. Cell. Proteomics. 2007; 6: 2212-2229Abstract Full Text Full Text PDF PubMed Scopus (575) Google Scholar), or affinity enrichment of low abundance peptides (16Anderson N.L. Anderson N.G. Haines L.R. Hardie D.B. Olafson R.W. Pearson T.W. Mass spectrometric quantitation of peptides and proteins using stable isotope standards and capture by anti-peptide antibodies (SISCAPA).J. Proteome Res. 2004; 3: 235-244Crossref PubMed Scopus (697) Google Scholar, 17Stahl-Zeng J. Lange V. Ossola R. Eckhardt K. Krek W. Aebersold R. Domon B. High sensitivity detection of plasma proteins by multiple reaction monitoring of N-glycosites.Mol. Cell. Proteomics. 2007; 6: 1809-1817Abstract Full Text Full Text PDF PubMed Scopus (313) Google Scholar). Anderson and Hunter (14Anderson L. Hunter C.L. Quantitative mass spectrometric multiple reaction monitoring assays for major plasma proteins.Mol. Cell. Proteomics. 2006; 5: 573-588Abstract Full Text Full Text PDF PubMed Scopus (1085) Google Scholar) have shown that LC-MRM/MS analysis is capable of detecting 47 moderate to high abundance proteins in plasma without depletion even though ∼90% of the total protein by weight in trypsin-digested plasma can be attributed to 10 high abundance proteins (18Anderson L. Candidate-based proteomics in the search for biomarkers of cardiovascular disease.J. Physiol. 2005; 563: 23-60Crossref PubMed Scopus (316) Google Scholar). Relative abundance of a protein does not preclude its involvement in disease. In fact, 32 of the 47 plasma proteins detected by Anderson and Hunter (14Anderson L. Hunter C.L. Quantitative mass spectrometric multiple reaction monitoring assays for major plasma proteins.Mol. Cell. Proteomics. 2006; 5: 573-588Abstract Full Text Full Text PDF PubMed Scopus (1085) Google Scholar) have been implicated as putative markers for cardiovascular disease. The ability to rapidly quantify proteins in a highly multiplexed manner using MRM and internal standard peptides expands the potential application of MRM quantitation beyond biomarker validation and into the field of biomarker discovery. Targeted, simultaneous quantitation of hundreds of proteins in a single analysis will enable rapid protein expression profiling of large (n > 100) clinically relevant sample sets in a manner similar to DNA microarray expression profiling. By allowing researchers to look at patterns of expression levels of a large number of proteins in a large number of samples (as opposed to looking at the expression levels of only a single protein), multiplexed MRM-based quantitation will allow the correlation of expression patterns with particular diseases. Once these characteristic patterns have been established, physicians will be able to use these protein expression patterns to diagnose diseases in the same way they currently use blood chemistry panels or comprehensive metabolic panels. When considering the clinical utility of MS-based assays, direct comparisons are often made to ELISA, which is considered the “gold standard” for protein quantitation in clinical samples. Attributes of ELISAs, such as “time to first result” (1–2 h (19Kingsmore S.F. Multiplexed protein measurement: technologies and applications of protein and antibody arrays.Nat. Rev. Drug Discov. 2006; 5: 310-320Crossref PubMed Scopus (604) Google Scholar)) and the ability to quantify 96 or 384 samples in parallel because of their microtiter plate-based format, are currently difficult to match with MS-based protein assays. However, MRM protein assays may surpass ELISA in the rapid development of clinically useful, multiplexed protein assays. The impact of multiplexed assays in the field of genomics has increased interest in multiplexed quantitation of many proteins in individual clinical samples (19Kingsmore S.F. Multiplexed protein measurement: technologies and applications of protein and antibody arrays.Nat. Rev. Drug Discov. 2006; 5: 310-320Crossref PubMed Scopus (604) Google Scholar). Development and characterization of MRM-based protein assays using isotopically labeled peptides is rapid and inexpensive compared with the time and cost associated with the generation and characterization of antibodies for ELISA development. In this study, we describe the creation of a customizable mixture of concentration-balanced stable isotope-labeled standard (SIS) peptides representing an initial panel of 45 human plasma proteins. We used this mixture of SIS peptides to develop a suite of multiplexed, rapid, and reproducible MRM-based assays for expression profiling of these 45 proteins in simple tryptic digests of whole plasma. Additionally we characterized the analytical performance of these MRM peptide assays with respect to their reproducibility, and we demonstrated their utility for absolute protein concentration determination. Multiplexed MRM quantitation of peptides for protein quantitation has the potential to replace iTRAQ or other isotope label and label-free quantitative proteomics approaches because the approach is much faster than these other methods (30–60 min per analysis compared with 4 days for LC-MALDI-based iTRAQ), has greater reproducibility (CV <5% versus iTRAQ CV >20%), and enables absolute quantitation (concentration and copy number versus only x-fold up- or down-regulated). Additionally MRM-based quantitation with SIS peptides does not “miss” peptides because the SIS peptide must be detected in every sample: this means that if an endogenous peptide is not observed then it is below the limit of detection. All reagents were American Chemical Society (ACS) grade or higher. All solvents used, including water, were LC/MS grade. Isotopically labeled peptide standards were synthesized at a 5-µmol scale using Fmoc (N-(9-fluorenyl)methoxycarbonyl) chemistry with a Protein Technologies Prelude peptide synthesizer (Tucson, AZ). Isotopically labeled amino acids, [13C6]Lys (98% isotopic enrichment) and [13C6]Arg (98% isotopic enrichment), were purchased from Cambridge Isotope Laboratories (Andover, MA) and were conjugated to TentaGel R resin by Rapp Polymere (Tubingen, Germany). Subsequent amino acid residues (100 mm) were double coupled using 20% piperidine as the deprotector and 1H-benzotriazolium 1-[bis(dimethylamino)methylene]-5-chloro-,hexafluorophosphate (1-),3-oxide (HCTU) as the activator. The cleavage was performed with 95:2.5:2.5 TFA:water:triisopropylsilane. The cleaved peptides were removed from the synthesizer, and the TFA was evaporated under a stream of nitrogen. Ether was added to precipitate the peptides, and after centrifugation at 3000 × g for 5 min, the ether layer was decanted. Peptides were resolubilized in 0.1% TFA and purified by reversed-phase HPLC (Ultimate 3000, Dionex) while monitoring the peptide elution at 230 nm. The crude peptides were separated using a Vydac C18 column (10 × 250 mm, 10-µm resin) with a linear gradient of 0.1% TFA in water (v/v) and 0.085% TFA in 50% acetonitrile (v/v) at a flow rate of 4 ml/min over 60 min. Fractions of interest were spotted onto stainless steel MALDI plates and measured by MALDI-TOF (Applied Biosystems/MDS Sciex, Concord, Ontario, Canada) mass spectrometry. Fractions containing greater than 80% of the target peptide by MALDI-TOF analysis were pooled and lyophilized. Lyophilized peptides were resolubilized in 30% acetonitrile, 0.1% formic acid, and peptide concentrations were subjected to acid hydrolysis and amino acid analysis. Purity of the HPLC-purified peptides was determined by capillary zone electrophoresis (CZE) using a P/ACETM MDQ System (Beckman Coulter, Fullerton, CA) equipped with a UV detector monitored at 200 nm. All separations were performed at 25 °C in a bare fused silica capillary (Polymicro Technologies, Phoenix, AZ) of dimensions 50-µm inner diameter × 360-µm outer diameter, 60-cm total length, and 50-cm effective length. The applied voltage was 15 kV, and the background electrolyte was 50 mm sodium phosphate adjusted to pH 2.5 with phosphoric acid. The capillary was rinsed at 20 p.s.i. with 1 m NaOH for 1 min, Millipore-purified water for 1 min, 1 m HCl for 2 min, 0.1 m HCl for 3 min, and finally with background electrolyte (n-butyl glycidyl ether) for 3 min between each separation. Injection of 20 nl of each peptide solution (ranging from 4 to 10 pmol/µl in 30% (v/v) ACN, 0.1% FA) was accomplished by application of 0.5 p.s.i. for 20 s at the inlet end of the capillary. Purity was assessed by peak height for a given concentration of peptide injected relative to signal to noise of the background signal. The limit of quantitation was determined to be ∼150 nmol/µl. The absolute concentration of each synthetic SIS peptide was determined by amino acid analysis. These absolute concentrations were adjusted by the percent purity of each synthetic peptide as determined by CZE. This corrects for any possible contribution from incorrect or partial synthesis products. Isotopically labeled peptides were diluted to 1 pmol/µl (1 mm) in 30% acetonitrile, 0.1% formic acid for infusion at a flow rate of 300 nl/min using a Harvard PicoPlus 11 syringe pump (Harvard Apparatus, Holliston, MA). Infused peptide solutions were analyzed by nanoelectrospray using a 4000 QTRAP hybrid triple quadrupole/linear ion trap mass spectrometer (Applied Biosystems/MDS Sciex) equipped with a nanospray ionization source. MS analysis was conducted in the positive ion mode with ion spray voltages in the 1800–2000-V range. The declustering potential was ramped (0–120 V in 2-V increments) during Q1 scans centered on 10-Da-wide mass ranges. MRM scans for optimization of MRM Q1/Q3 ion pairs were conducted with both Q1 and Q3 set to unit resolution (0.6–0.8-Da full width at half-height) while the collision energy was ramped (5–120 V in 2-V increments). An MS operating pressure of 3.5 × 10−5 torr was used during all MRM scans. Plasma was collected from a healthy male donor who fasted for 16 h prior to blood collection. Blood was collected by venous puncture using a 21-gauge BD Vacutainer Multiple Sample Needle (reference number 367213, BD Biosciences). A total of 60 ml of blood was collected into 20 × 3.0-ml BD Vacutainer lavender tubes with 5.4 mg of K2-EDTA (reference number 367856, BD Biosciences). Immediately following blood collection and mixing with the EDTA in the tubes, the samples were centrifuged at 1000 × g for 15 min at 22 °C to pellet the cells. Plasma was collected and centrifuged again to remove any remaining cells. The plasma was then divided into 1.0-ml aliquots in sterile cryotubes and immediately frozen at −80 °C for storage. Total elapsed time from collection to storage was 1 h. Plasma analyzed in the experiments described in this study had been stored at −80 °C for 4–8 weeks. Plasma tryptic digests were prepared by diluting 5 µl of whole plasma (∼350 µg of total protein) 1:10 with 25 mm ammonium bicarbonate prior to denaturation with 50 µl of sodium deoxycholate (10% (w/v) in 25 mm ammonium bicarbonate). Denatured plasma samples were reduced for 30 min at 60 °C with 5 mm tris(2-carboxyethyl)phosphine (net 22.5-fold excess over the ∼26 mm concentration of protein cysteine in plasma computed from known protein concentrations). Reduced plasma samples were alkylated for 30 min at 37 °C in the dark with 10 mm iodoacetamide (net 50-fold excess over plasma protein cysteine). Ammonium bicarbonate (25 mm) was added to the digests to reduce the sodium deoxycholate concentration to 1% (w/v) and to achieve a 500-µl digest volume containing a 1:100 dilution of plasma upon addition of trypsin. Modified, sequencing grade trypsin (Promega, Madison, WI) was added to the samples at a 20:1 substrate:enzyme ratio. Digestion was carried out for 16 h at 37 °C. Samples were acidified by adding an equal volume of 1% (v/v) formic acid to stop digestion. For quantitation of unknown samples, a concentration-balanced mixture of 45 isotopically labeled internal standard peptides (0.1% (v/v) formic acid) was added to each plasma digest at a ratio of 1 volume of SIS peptide mixture to 4 volumes of acidified plasma trypsin digest. This came to 50 µl of SIS peptide mixture added per 1-µl equivalent of neat plasma. Samples were desalted and concentrated prior to MS analysis by solid phase extraction using Waters Oasis reversed-phase 10-mg HLB cartridges (Waters, Milford, MA) following the manufacturer's recommended protocol. Samples were eluted with 200 µl of 50% (v/v) acetonitrile, 0.1% (v/v) formic acid. The eluted samples were frozen and lyophilized to dryness. Prior to LC-MRM/MS analysis, samples were reconstituted in 0.1% formic acid to a concentration of ∼1 µg/µl based on an initial plasma protein concentration of 70 mg/ml. An Eksigent NanoLC-1Dplus HPLC was used for the injection of desalted plasma digest samples (1 µl) onto reversed-phase capillary columns (75 µm × 15 cm) packed in house using Magic C18AQ (5-µm diameter particles, 100-Å pore size; Michrom, Auburn, CA). A flow rate of 300 nl/min solvent A (2% acetonitrile, 0.1% formic acid) was used for 6 min. Separations were performed using a flow rate of 300 nl/min with a 32-min linear gradient from 0 to 23% solvent B (98% acetonitrile, 0.1% formic acid) followed by a 9-min linear gradient from 23 to 43% solvent B. An Applied Biosystems/MDS Sciex 4000 QTRAP with a nanoelectrospray ionization source controlled by Analyst 1.5 software (Applied Biosystems) was used for all LC-MRM/MS analyses. All acquisition methods used the following parameters: 1900–2000-V ion spray voltage, a curtain gas setting of 25 p.s.i., a 200 °C interface heater temperature, a collision-activated dissociation pressure at 3.5 × 10−5 torr, and Q1 and Q3 set to unit resolution (0.6–0.8-Da full width at half-height). Spray stability was improved and lifespan of the uncoated fused silica emitter tips (20-µm inner diameter, 10-µm tip; New Objective, Woburn, MA) was improved by use of 3–5-p.s.i. sheath gas and postcolumn, prespray addition of makeup solvent (80% (v/v) isopropanol) at a flow rate of 100 nl/min using a PicoPlus 11 syringe pump (Harvard Apparatus). MRM acquisition methods were constructed using 90 MRM ion pairs with peptide-specific tuned declustering potential (DP), collision energy (CE) voltages, and retention time constraints. A default collision cell exit potential of 23 V was used for all MRM ion pairs, and the scheduled MRM option was used for all data acquisition with a target scan time of 2 s and an 8-min MRM detection window. All MRM data were processed using MultiQuant 1.0 (Applied Biosystems) with the MQL algorithm for peak integration. A 2-min retention time window with “report largest peak” enabled and a three-point smooth with a peak splitting factor of 2 was used. The default MultiQuant values for noise percentage and base-line subtraction window were used. All data were manually inspected to ensure correct peak detection and accurate integration. Linear regression of all calibration curves was performed using a standard 1/x (x = concentration ratio) weighting option to aid in covering a wide dynamic range (20Chace D.H. Barr J.R. Duncan M.W. Matern D. Morris M.R. Palmer-Toy D.E. Rockwood A.L. Siuzdak G. Urbani A. Yergey A.L. Chan Y.M. Mass Spectrometry in the Clinical Laboratory: General Principles and Guidance; Approved Guideline. Clinical and Laboratory Standards Institute, Wayne, PA2006Google Scholar). Raw data files for these analyses are available from the ProteomeCommons Tranche network (http://www.proteomecommons.org/data-downloader.jsp?fileName=O3Hbto5xoHSurD7i5FYQMe6IKixjYxsB8ao8W/gpnNmIxQX2hNxoHXJORjyDg9s5x1mVmm+7+J33b8FaEUBB7MuoGMAAAAAAAAAUXA==) using hash codes. Development of protein assays based on proteolytic peptide surrogates requires that the peptides selected are both detectable in every sample and reproducibly observed between sample preparations. Because of differing peptide ionization efficiencies and susceptibilities to CID, selection of a peptide to represent a protein in an MRM assay is a crucial step that dramatically affects the ultimate sensitivity and specificity of an assay. When selecting a peptide, several critical factors must be considered. 1) The peptide amino acid sequence must be unique to the target protein and contain no missed cleavage sites, 2) the peptide should be reproducibly observed in proteolytic digests, and 3) the peptide should not contain amino acids that are susceptible to chemical modification (Cys and Met). When working with a species for which the genome has been sequenced and widely studied, as it has been for Homo sapiens, publicly accessible MS/MS spectra databases such as the Global Proteome Machine and Peptide Atlas are useful for determining which tryptic peptides of proteins are frequently observed by MS/MS analysis (21Craig R. Cortens J.P. Beavis R.C. Open source system for analyzing, validating, and storing protein identification data.J. Proteome Res. 2004; 3: 1234-1242Crossref PubMed Scopus (582) Google Scholar, 22Deutsch E.W. Lam H. Aebersold R. PeptideAtlas: a resource for target selection for emerging targeted proteomics workflows.EMBO Rep. 2008; 9: 429-434Crossref PubMed Scopus (447) Google Scholar). The concept of using “proteotypic” peptides for MS-based protein identification and quantitation is gaining wider acceptance, and bioinformatics tools are emerging to assist in their computational prediction (23Craig R. Cortens J.P. Beavis R.C. The use of proteotypic peptide libraries for protein identification.Rapid Commun. Mass Spectrom. 2005; 19: 1844-1850Crossref PubMed Scopus (143) Google Scholar, 24Mallick P. Schirle M. Chen S.S. Flory M.R. Lee H. Martin D. Ranish J. Raught B. Schmitt R. Werner T. Kuster B. Aebersold R. Computational prediction of proteotypic peptides for quantitative proteomics.Nat. Biotechnol. 2007; 25: 125-131Crossref PubMed Scopus (573) Google Scholar, 25Sanders W.S. Bridges S.M. McCarthy F.M. Nanduri B. Burgess S.C. Prediction of peptides observable by mass spectrometry applied at the experimental set level.BMC Bioinformatics. 2007; 8 (S