JC
Joseph Catanese
Author with expertise in Ribosome Structure and Translation Mechanisms
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
6
(100% Open Access)
Cited by:
4,370
h-index:
45
/
i10-index:
74
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

A Missense Single-Nucleotide Polymorphism in a Gene Encoding a Protein Tyrosine Phosphatase (PTPN22) Is Associated with Rheumatoid Arthritis

Ann Begovich et al.Jun 29, 2004
Rheumatoid arthritis (RA) is the most common systemic autoimmune disease, affecting ∼1% of the adult population worldwide, with an estimated heritability of 60%. To identify genes involved in RA susceptibility, we investigated the association between putative functional single-nucleotide polymorphisms (SNPs) and RA among white individuals by use of a case-control study design; a second sample was tested for replication. Here we report the association of RA susceptibility with the minor allele of a missense SNP in PTPN22 (discovery-study allelic P=6.6×10−4; replication-study allelic P=5.6×10−8), which encodes a hematopoietic-specific protein tyrosine phosphatase also known as “Lyp.” We show that the risk allele, which is present in ∼17% of white individuals from the general population and in ∼28% of white individuals with RA, disrupts the P1 proline-rich motif that is important for interaction with Csk, potentially altering these proteins' normal function as negative regulators of T-cell activation. The minor allele of this SNP recently was implicated in type 1 diabetes, suggesting that the variant phosphatase may increase overall reactivity of the immune system and may heighten an individual carrier’s risk for autoimmune disease. Rheumatoid arthritis (RA) is the most common systemic autoimmune disease, affecting ∼1% of the adult population worldwide, with an estimated heritability of 60%. To identify genes involved in RA susceptibility, we investigated the association between putative functional single-nucleotide polymorphisms (SNPs) and RA among white individuals by use of a case-control study design; a second sample was tested for replication. Here we report the association of RA susceptibility with the minor allele of a missense SNP in PTPN22 (discovery-study allelic P=6.6×10−4; replication-study allelic P=5.6×10−8), which encodes a hematopoietic-specific protein tyrosine phosphatase also known as “Lyp.” We show that the risk allele, which is present in ∼17% of white individuals from the general population and in ∼28% of white individuals with RA, disrupts the P1 proline-rich motif that is important for interaction with Csk, potentially altering these proteins' normal function as negative regulators of T-cell activation. The minor allele of this SNP recently was implicated in type 1 diabetes, suggesting that the variant phosphatase may increase overall reactivity of the immune system and may heighten an individual carrier’s risk for autoimmune disease. Rheumatoid arthritis (RA [MIM 180300]) is characterized by immune cell–mediated destruction of the joint architecture and is two to three times more common in women than in men (Firestein Firestein, 2003Firestein GS Evolving concepts of rheumatoid arthritis.Nature. 2003; 423: 356-361Crossref PubMed Scopus (2573) Google Scholar). A strong genetic component is indicated (Seldin et al. Seldin et al., 1999Seldin MF Amos CI Ward R Gregersen PK The genetics revolution and the assault on rheumatoid arthritis.Arthritis Rheum. 1999; 42: 1071-1079Crossref PubMed Scopus (240) Google Scholar; MacGregor et al. MacGregor et al., 2000MacGregor AJ Snieder H Rigby AS Koskenvuo M Kaprio J Aho K Silman AJ Characterizing the quantitative genetic contribution to rheumatoid arthritis using data from twins.Arthritis Rheum. 2000; 43: 30-37Crossref PubMed Scopus (807) Google Scholar), and genome scans have identified multiple regions linked to disease (Cornelis et al. Cornelis et al., 1998Cornelis F Faure S Martinez M Prud’homme JF Fritz P Dib C Alves H et al.New susceptibility locus for rheumatoid arthritis suggested by a genome-wide linkage study.Proc Natl Acad Sci USA. 1998; 95: 10746-10750Crossref PubMed Scopus (436) Google Scholar; Shiozawa et al. Shiozawa et al., 1998Shiozawa S Hayashi S Tsukamoto Y Goko H Kawasaki H Wada T Shimizu K Yasuda N Kamatani N Takasugi K Tanaka Y Shiozawa K Imura S Identification of the gene loci that predispose to rheumatoid arthritis.Int Immunol. 1998; 10: 1891-1895Crossref PubMed Scopus (181) Google Scholar; Jawaheer et al. Jawaheer et al., 2001Jawaheer D Seldin MF Amos CI Chen WV Shigeta R Monteiro J Kern M Criswell LA Albani S Nelson JL Clegg DO Pope R Schroeder Jr, HW Bridges Jr, SL Pisetsky DS Ward R Kastner DL Wilder RL Pincus T Callahan LF Flemming D Wener MH Gregersen PK A genomewide screen in multiplex rheumatoid arthritis families suggests genetic overlap with other autoimmune diseases.Am J Hum Genet. 2001; 68: 927-936Abstract Full Text Full Text PDF PubMed Scopus (308) Google Scholar, Jawaheer et al., 2003Jawaheer D Seldin MF Amos CI Chen WV Shigeta R Etzel C Damle A et al.Screening the genome for rheumatoid arthritis susceptibility genes: a replication study and combined analysis of 512 multicase families.Arthritis Rheum. 2003; 48: 906-916Crossref PubMed Scopus (190) Google Scholar; MacKay et al. MacKay et al., 2002MacKay K Eyre S Myerscough A Milicic A Barton A Laval S Barrett J Lee D White S John S Brown MA Bell J Silman A Ollier W Wordsworth P Worthington J Whole-genome linkage analysis of rheumatoid arthritis susceptibility loci in 252 affected sibling pairs in the United Kingdom.Arthritis Rheum. 2002; 46: 632-639Crossref PubMed Scopus (179) Google Scholar; Fisher et al. Fisher et al., 2003Fisher SA Lanchbury JS Lewis CM Meta-analysis of four rheumatoid arthritis genome-wide linkage studies: confirmation of a susceptibility locus on chromosome 16.Arthritis Rheum. 2003; 48: 1200-1206Crossref PubMed Scopus (60) Google Scholar). Although interesting associations have been reported (Suzuki et al. Suzuki et al., 2003Suzuki A Yamada R Chang X Tokuhiro S Sawada T Suzuki M Nagasaki M Nakayama-Hamada M Kawaida R Ono M Ohtsuki M Furukawa H Yoshino S Yukioka M Tohma S Matsubara T Wakitani S Teshima R Nishioka Y Sekine A Iida A Takahashi A Tsunoda T Nakamura Y Yamamoto K Functional haplotypes of PADI4 encoding citrullinating enzyme peptidylarginine deaminase 4, are associated with rheumatoid arthritis.Nat Genet. 2003; 34: 395-402Crossref PubMed Scopus (864) Google Scholar; Tokuhiro et al. Tokuhiro et al., 2003Tokuhiro S Yamada R Chang X Suzuki A Kochi Y Sawada T Suzuki M Nagasaki M Ohtsuki M Ono M Furukawa H Nagashima M Yoshino S Mabuchi A Sekine A Saito S Takahashi A Tsunoda T Nakamura Y Yamamoto K An intronic SNP in a RUNX1 binding site of SLC22A4 encoding an organic cation transporter is associated with rheumatoid arthritis.Nat Genet. 2003; 35: 341-348Crossref PubMed Scopus (484) Google Scholar), only alleles at the HLA-DRB1 locus have consistently demonstrated both linkage and association (Seldin et al 1999). To identify genes involved in genetic predisposition to RA, we performed a case-control association study (called “discovery study”) with assays for 87 putative functional SNPs (Botstein and Risch Botstein and Risch, 2003Botstein D Risch N Discovering genotypes underlying human phenotypes: past successes for mendelian disease, future approaches for complex disease.Nat Genet. 2003; : 228-237Crossref PubMed Scopus (1159) Google Scholar) in RA candidate genes and/or linkage regions. The discovery study, consisting of 475 individuals with RA and 475 individually matched controls, was obtained by Genomics Collaborative, Inc. (GCI). Case samples were collected from throughout the United States, and they met the 1987 American College of Rheumatology (ACR) diagnostic criteria for RA. All case samples were from white individuals with an age at onset of RA of between 18 and 68 years and a positive rheumatoid factor of ⩾20 IU. Individuals with psoriasis, systemic lupus erythematosus (SLE), ankylosing spondylitis, or Reiter syndrome were excluded. Control samples were taken from a pool of healthy white individuals from the United States with no medical history of RA or of any of the autoimmune disorders listed above. A single control was matched to each case on the basis of sex, age (±5 years), and ethnicity (grandparental country/region of origin). All protocols and recruitment sites have been approved by national and/or local institutional review boards, and all subjects were enrolled with informed written consent. We found association with the minor allele (T) of a missense SNP (R620W [rs2476601, 1858C→T]) in the protein tyrosine phosphatase non-receptor type 22 gene (PTPN22) (allele frequency 13.8% in cases, 8.8% in controls) (P=6.6×10−4, allelic odds ratio [OR] 1.65, 95% CI 1.23–2.20). Replication in a second study (called the “replication study”) confirmed association. Cases in the replication study were obtained by the North American Rheumatoid Arthritis Consortium (NARAC) and consisted of members of white multiplex families. For this study, DNA was available for 840 individuals with RA from 463 families. These families were recruited from throughout the United States through the 12 participating recruitment centers of NARAC (NARAC Web site). Informed written consent was obtained from every subject, including all participating family members, and the local institutional review board’s approval was secured at each recruitment site. The enrollment criteria for family participation are described in detail elsewhere (Jawaheer et al. Jawaheer et al., 2001Jawaheer D Seldin MF Amos CI Chen WV Shigeta R Monteiro J Kern M Criswell LA Albani S Nelson JL Clegg DO Pope R Schroeder Jr, HW Bridges Jr, SL Pisetsky DS Ward R Kastner DL Wilder RL Pincus T Callahan LF Flemming D Wener MH Gregersen PK A genomewide screen in multiplex rheumatoid arthritis families suggests genetic overlap with other autoimmune diseases.Am J Hum Genet. 2001; 68: 927-936Abstract Full Text Full Text PDF PubMed Scopus (308) Google Scholar). In brief, at least two siblings must satisfy the 1987 ACR criteria for RA, at least one sibling must have documented erosions on hand radiographs, and at least one sibling must have disease onset between the ages of 18 and 60 years. The presence of psoriasis, inflammatory bowel disease, or SLE was an exclusionary criterion for the sib pair. Controls were selected from 20,000 individuals who are part of the New York Cancer Project (NYCP), a population-based prospective study of the genetic and environmental factors that cause disease (New York Cancer Project Web site). Two control individuals were matched to a single randomly chosen affected sib on the basis of sex, age (birth decade), and ethnicity (grandparental country/region of origin). These 463 independent cases (referred to as “single sibs”) and their 926 matched controls were used for all analyses reported in this study, except where noted. The association for single sibs was as follows: allele frequency 15.8% in cases and 8.7% in controls (P=5.6×10−8, allelic OR 1.97, 95% CI 1.55–2.50). An increase of the risk allele frequency was apparent when all affected siblings (n=840) were analyzed (allele frequency 16.8%). Genotypic analyses produced similar results, showing increased frequencies of both TT and TC genotypes in the cases, compared with the controls (table 1).Table 1Frequency of PTPN22 Genotypes in Individuals with RA and Matched Controls in Two Independent Sample SetsFrequency of (No. of Individuals with)PTPN22Genotype inDiscovery StudyReplication StudyGenotypeControls (n=475)Cases (n=475)Controls (n=926)Single SibsaIndependent cases comprising one randomly selected sib per NARAC family. (n=463)All SibsbAll affected individuals in NARAC. (n=840)TT.006 (3).013 (6).010 (9).021 (10).025 (21)TC.164 (78).251 (119).154 (143).273 (126).287 (241)CC.830 (394).737 (350).836 (774).706 (327).688 (578)Note.—Genotypes were generated by use of kinetic, allele-specific PCR (Germer et al. Germer et al., 2000Germer S Holland MJ Higuchi R High-throughput SNP allele-frequency determination in pooled DNA samples by kinetic PCR.Genome Res. 2000; 10: 258-266Crossref PubMed Scopus (361) Google Scholar): 0.3 ng of DNA in a 15−μl reaction containing the allele-specific primers 5′-CCTCCACTTCCTGTAT/C and a common primer, 5′-CCCATCCCACACTTTATTTTATAC. Genotyping accuracy was 100%, as determined by internal comparisons by use of a different assay (Iannone et al. Iannone et al., 2000Iannone MA Taylor JD Chen J Li MS Rivers P Slentz-Kesler KA Weiner MP Multiplexed single nucleotide polymorphism genotyping by oligonucleotide ligation and flow cytometry.Cytometry. 2000; 39: 131-140Crossref PubMed Scopus (187) Google Scholar) for the same marker on ∼6% of the samples. All case and control populations were in Hardy-Weinberg equilibrium.a Independent cases comprising one randomly selected sib per NARAC family.b All affected individuals in NARAC. Open table in a new tab Note.— Genotypes were generated by use of kinetic, allele-specific PCR (Germer et al. Germer et al., 2000Germer S Holland MJ Higuchi R High-throughput SNP allele-frequency determination in pooled DNA samples by kinetic PCR.Genome Res. 2000; 10: 258-266Crossref PubMed Scopus (361) Google Scholar): 0.3 ng of DNA in a 15−μl reaction containing the allele-specific primers 5′-CCTCCACTTCCTGTAT/C and a common primer, 5′-CCCATCCCACACTTTATTTTATAC. Genotyping accuracy was 100%, as determined by internal comparisons by use of a different assay (Iannone et al. Iannone et al., 2000Iannone MA Taylor JD Chen J Li MS Rivers P Slentz-Kesler KA Weiner MP Multiplexed single nucleotide polymorphism genotyping by oligonucleotide ligation and flow cytometry.Cytometry. 2000; 39: 131-140Crossref PubMed Scopus (187) Google Scholar) for the same marker on ∼6% of the samples. All case and control populations were in Hardy-Weinberg equilibrium. We used contingency tables and conditional-logistic regression (CLR) (Breslow and Day Breslow and Day, 1980Breslow NE Day NE Statistical methods in cancer research, volume I: the analysis of case-control studies.IARC Sci Publ. 1980; 32: 5-338PubMed Google Scholar) to assess the association of the PTPN22 R620W genotype with RA (table 2). In the discovery study, both the TC (ORCLR 1.69, P=.0012) and TT (ORCLR 2.26, P value not significant) genotypes conferred an increased risk for disease compared with the CC genotype. Further adjustment for the HLA-DRB1 genotype, the strongest known genetic risk factor (Seldin et al. Seldin et al., 1999Seldin MF Amos CI Ward R Gregersen PK The genetics revolution and the assault on rheumatoid arthritis.Arthritis Rheum. 1999; 42: 1071-1079Crossref PubMed Scopus (240) Google Scholar), had little impact on risk estimates. Similar results were observed in the replication study. The susceptible TT and TC genotypes were strongly associated with rheumatoid factor–positive (RF+) disease, even after adjustment for the HLA genotype (P=.0197 in discovery study, P=.0005 in replication study) (table 3); however, there was no evidence for association with rheumatoid factor–negative (RF−) disease. This interesting observation has been replicated in an additional cohort of patients with recent-onset RA (A. T. Lee and P. K. Gregersen, unpublished data). There was no consistent sex difference in association of the risk allele with RA (data not shown).Table 2Association of PTPN22 with RAResults forCrude AnalysisaValues were calculated by use of standard contingency tables (or two-tailed Fisher’s Exact Test).CLRbCLR was performed as described elsewhere (Breslow and Day 1980) to account for individual matching of controls to cases.CLR, Adjusted for HLAcTo assess whether the observed associations were independent of the HLA-DRB1 genotype, we further adjusted for this known risk factor. HLA-DRB1 genotyping was performed as described elsewhere (Jawaheer et al. 2002), and, for this analysis, samples were binned according to their HLA-DRB1 genotype: high risk, two shared epitopes (HR-2SE); high risk, one shared epitope (HR-1SE; 4K,X; or 4R,X); low risk, one shared epitope (LR-1SE; 1R,X; or 10,X); and low risk, zero shared epitopes (LR-0SE; X,X) (Fries et al. 2002).Data Set and GenotypeNo. of CasesNo. of ControlsORdORs were calculated relative to the major allele homozygote (CC).95% CIPORdORs were calculated relative to the major allele homozygote (CC).95% CIPORdORs were calculated relative to the major allele homozygote (CC).95% CIPDiscovery: TT632.25.56–9.07.32eP value calculated by use of Fisher’s Exact Test.2.26.56–9.14.252.39.35–16.43.38 TC119781.721.25–2.36.0011.691.23–2.32.0011.531.05–2.23.03 TT+TCfBecause of the infrequency of the TT genotype, we combined it with the TC genotype and repeated the analysis.125811.741.27–2.38.00051.711.25–2.34.00081.551.07–2.25.02 CC350394………………………Replication: TT1092.631.06–6.53.032.551.03–6.31.043.261.03–10.28.04 TC1261432.091.59–2.74<.00012.081.58–2.74<.00011.71.19–2.42.004 TT+TCfBecause of the infrequency of the TT genotype, we combined it with the TC genotype and repeated the analysis.1361522.121.62–2.76<.00012.111.62–2.76<.00011.781.26–2.51.001 CC327774………………………a Values were calculated by use of standard contingency tables (or two-tailed Fisher’s Exact Test).b CLR was performed as described elsewhere (Breslow and Day Breslow and Day, 1980Breslow NE Day NE Statistical methods in cancer research, volume I: the analysis of case-control studies.IARC Sci Publ. 1980; 32: 5-338PubMed Google Scholar) to account for individual matching of controls to cases.c To assess whether the observed associations were independent of the HLA-DRB1 genotype, we further adjusted for this known risk factor. HLA-DRB1 genotyping was performed as described elsewhere (Jawaheer et al. Jawaheer et al., 2002Jawaheer D Li W Graham RR Chen W Damle A Xiao X Monteiro J Khalili H Lee A Lundsten R Begovich A Bugawan T Erlich H Elder JT Criswell LA Seldin MF Amos CI Behrens TW Gregersen PK Dissecting the genetic complexity of the association between human leukocyte antigens and rheumatoid arthritis.Am J Hum Genet. 2002; 71: 585-594Abstract Full Text Full Text PDF PubMed Scopus (153) Google Scholar), and, for this analysis, samples were binned according to their HLA-DRB1 genotype: high risk, two shared epitopes (HR-2SE); high risk, one shared epitope (HR-1SE; 4K,X; or 4R,X); low risk, one shared epitope (LR-1SE; 1R,X; or 10,X); and low risk, zero shared epitopes (LR-0SE; X,X) (Fries et al. Fries et al., 2002Fries JF Wolfe F Apple R Erlich H Bugawan T Holmes T Bruce B HLA-DRB1 genotype associations in 793 white patients from a rheumatoid arthritis inception cohort: frequency, severity, and treatment bias.Arthritis Rheum. 2002; 46: 2320-2329Crossref PubMed Scopus (72) Google Scholar).d ORs were calculated relative to the major allele homozygote (CC).e P value calculated by use of Fisher’s Exact Test.f Because of the infrequency of the TT genotype, we combined it with the TC genotype and repeated the analysis. Open table in a new tab Table 3Association of PTPN22 with RF+ and RF− DiseaseResults forCrude AnalysisaValues were calculated by use of standard contingency tables.CLRbCLR was performed as described elsewhere (Breslow and Day 1980) to account for individual matching of controls to cases.CLR, Adjusted for HLAcTo assess whether the observed associations were independent of the HLA-DRB1 genotype, we further adjusted for this known risk factor. For this analysis, samples were binned according to their HLA-DRB1 genotype: high risk, two shared epitopes (HR-2SE); high risk, one shared epitope (HR-1SE; 4K,X; or 4R,X); low risk, one shared epitope (LR-1SE; 1R,X; or 10,X); and low risk, zero shared epitopes (LR-0SE; X,X) (Fries et al. 2002).Data Set and GenotypeRF StatusNo. of CasesNo. of ControlsORdORs were calculated relative to the major allele homozygote (CC).95% CIPORdORs were calculated relative to the major allele homozygote (CC).95% CIPORdORs were calculated relative to the major allele homozygote (CC).95% CIPDiscovery:eAll patients in the discovery cohort are RF+. TT+TCfBecause of the infrequency of the TT genotype, we combined it with the TC genotype for these analyses.RF+125811.741.27–2.38.00051.711.25–2.34.00081.551.07–2.25.02 CCRF+350394………………………Replication: TT+TCfBecause of the infrequency of the TT genotype, we combined it with the TC genotype for these analyses.RF+1191222.381.78–3.18<.00012.361.76–3.16<.000121.35–2.97.0005 CCRF+266648……………………… TT+TCfBecause of the infrequency of the TT genotype, we combined it with the TC genotype for these analyses.RF−17301.17.60–2.29.641.17.60–2.31.641.09.51–2.36.82 CCRF−61126………………………a Values were calculated by use of standard contingency tables.b CLR was performed as described elsewhere (Breslow and Day Breslow and Day, 1980Breslow NE Day NE Statistical methods in cancer research, volume I: the analysis of case-control studies.IARC Sci Publ. 1980; 32: 5-338PubMed Google Scholar) to account for individual matching of controls to cases.c To assess whether the observed associations were independent of the HLA-DRB1 genotype, we further adjusted for this known risk factor. For this analysis, samples were binned according to their HLA-DRB1 genotype: high risk, two shared epitopes (HR-2SE); high risk, one shared epitope (HR-1SE; 4K,X; or 4R,X); low risk, one shared epitope (LR-1SE; 1R,X; or 10,X); and low risk, zero shared epitopes (LR-0SE; X,X) (Fries et al. Fries et al., 2002Fries JF Wolfe F Apple R Erlich H Bugawan T Holmes T Bruce B HLA-DRB1 genotype associations in 793 white patients from a rheumatoid arthritis inception cohort: frequency, severity, and treatment bias.Arthritis Rheum. 2002; 46: 2320-2329Crossref PubMed Scopus (72) Google Scholar).d ORs were calculated relative to the major allele homozygote (CC).e All patients in the discovery cohort are RF+.f Because of the infrequency of the TT genotype, we combined it with the TC genotype for these analyses. Open table in a new tab To evaluate putative modes of inheritance, we combined the two data sets and used the likelihood-ratio test (Breslow and Day Breslow and Day, 1980Breslow NE Day NE Statistical methods in cancer research, volume I: the analysis of case-control studies.IARC Sci Publ. 1980; 32: 5-338PubMed Google Scholar) on the basis of CLR models. Although we could exclude a recessive mode of inheritance (P<.0001), the data are consistent with either additive or dominant modes of inheritance. We also generated estimates of the population-attributable fraction (0.11 for discovery study [95% CI 0.05–0.17]; 0.16 for replication study [95% CI 0.10–0.21]) (Schlesselman Schlesselman, 1982Schlesselman JJ Case-control studies: design, conduct, analysis. Oxford University Press, New York1982Google Scholar; Yang et al. Yang et al., 2003Yang Q Khoury MJ Friedman JM Flanders WD On the use of population attributable fraction to determine sample size for case-control studies of gene-environment interaction.Epidemiology. 2003; 14: 161-167PubMed Google Scholar). However, these estimates should be interpreted with caution, since our cases were selected to have relatively severe disease and thus are not representative of the full clinical spectrum of RA. PTPN22 is located on chromosome 1p13, ∼9 Mb centromeric to a microsatellite marker, D1S1631, that shows linkage to RA in the NARAC sib pairs (SIBPAL P=.0011) (Jawaheer et al. Jawaheer et al., 2003Jawaheer D Seldin MF Amos CI Chen WV Shigeta R Etzel C Damle A et al.Screening the genome for rheumatoid arthritis susceptibility genes: a replication study and combined analysis of 512 multicase families.Arthritis Rheum. 2003; 48: 906-916Crossref PubMed Scopus (190) Google Scholar) from which our replication study was drawn. Linkage analysis using Allegro (Gudbjartsson et al. Gudbjartsson et al., 2000Gudbjartsson DF Jonasson K Frigge ML Kong A Allegro, a new computer program for multipoint linkage analysis.Nat Genet. 2000; 25: 12-13Crossref PubMed Scopus (650) Google Scholar) yielded an insignificant LOD score of 0.15 for PTPN22 R620W in these sib pairs, indicating that R620W is not solely responsible for the linkage seen at D1S1631. We then conducted stratified analyses based on PTPN22 R620W genotypes of the probands. Among 7, 76, and 193 affected sib pairs for which the proband had the TT, TC, or CC genotype, respectively, the respective mean identity-by-descent–sharing values were 0.598, 0.505, and 0.486, and the respective nonparametric linkage (NPL) scores were 0.94, 0.35, and −0.46 (Allegro) (Gudbjartsson et al. Gudbjartsson et al., 2000Gudbjartsson DF Jonasson K Frigge ML Kong A Allegro, a new computer program for multipoint linkage analysis.Nat Genet. 2000; 25: 12-13Crossref PubMed Scopus (650) Google Scholar). These results suggested that R620W has a weak effect on the 1p13 linkage signal. Li et al. (Li et al., 2004Li C Scott LJ Boehnke M Assessing whether an allele can account in part for a linkage signal: the Genotype-IBD Sharing Test (GIST).Am J Hum Genet. 2004; 74: 418-431Abstract Full Text Full Text PDF PubMed Scopus (49) Google Scholar) have recently shown that there is large variability in NPL scores when families are stratified by the genotype of a single, randomly selected sib, and they developed a program (Genotype-IBD Sharing Test [GIST]) in which families are weighted on the basis of the genotypes of all family members. GIST analysis that was conditional on the T allele indicated significant evidence for linkage (P<.0001). The apparent difference between the significance of the stratified analysis and the GIST results may reflect the increased power of the GIST algorithm, or, alternatively, the rarity of the TT genotype may lead to poor convergence of the GIST test statistic to the asymptotic distribution. Taken together, all these data suggest that, whereas the SNP may account for a small part of the linkage signal seen on 1p, it is clearly not responsible for the entire signal. We also genotyped this SNP in several additional control populations (table 4). The observed frequency of the risk allele in 560 additional white subjects (8.4%) was consistent with results in our two RA control populations. When all three control data sets of whites (n=1,961) were combined, the T allele was present in 16.7% of individuals at an allele frequency of 8.7%. The T allele frequency was lower in 99 Mexican Americans (3.5%) and 409 African Americans (2.4%). This allele was not detected in 100 Han Chinese or 21 Africans. A Fisher's Exact Test showed that these differences in allele frequencies were highly significant (P<1×10−10). It will be important to expand these studies to determine whether presence of the T allele in the African American and Mexican American populations is due to admixture with whites.Table 4Frequency of the PTPN22 Risk Allele in Discovery and Replication Control Samples and Other PopulationsPopulationNo. of IndividualsRisk Allele FrequencyDiscovery controls (white)475.088Replication controls (white)926.087Additional whitesaIncluding samples from 360 whites from throughout the United States (obtained by GCI), 147 North American whites (obtained from the National Institute of General Medical Sciences [NIGMS] Human Variation Panels [HVP]), 10 northern Europeans (NIGMS HVP), 9 Italians (NIGMS HVP), 8 Greeks (NIGMS HVP), 20 independent CEPH individuals from Utah (NIGMS), 1 CEPH individual from France (NIGMS), and 5 Adygei (an indigenous Circassian people; NIGMS). GCI obtained informed written consent from all participants and local institutional review board approval at all recruitment sites.560.084African AmericansbIncluding samples from 369 African Americans from throughout the United States obtained by GCI (see footnote a for comments on consent/IRB approval) and 40 African Americans (NIGMS HVP).409.024AfricanscIncluding samples from 9 sub-Saharan Africans (NIGMS HVP), 7 northern Africans (north of the Sahara) (NIGMS HVP), and 5 Pygmies (NIGMS).210Mexican AmericansdIncluding samples from 99 Mexican Americans from Los Angeles (NIGMS HVP).99.035Han ChineseeIncluding samples from 100 Han Chinese from Los Angeles (NIGMS HVP).1000a Including samples from 360 whites from throughout the United States (obtained by GCI), 147 North American whites (obtained from the National Institute of General Medical Sciences [NIGMS] Human Variation Panels [HVP]), 10 northern Europeans (NIGMS HVP), 9 Italians (NIGMS HVP), 8 Greeks (NIGMS HVP), 20 independent CEPH individuals from Utah (NIGMS), 1 CEPH individual from France (NIGMS), and 5 Adygei (an indigenous Circassian people; NIGMS). GCI obtained informed written consent from all participants and local institutional review board approval at all recruitment sites.b Including samples from 369 African Americans from throughout the United States obtained by GCI (see footnote aIncluding samples from 360 whites from throughout the United States (obtained by GCI), 147 North American whites (obtained from the National Institute of General Medical Sciences [NIGMS] Human Variation Panels [HVP]), 10 northern Europeans (NIGMS HVP), 9 Italians (NIGMS HVP), 8 Greeks (NIGMS HVP), 20 independent CEPH individuals from Utah (NIGMS), 1 CEPH individual from France (NIGMS), and 5 Adygei (an indigenous Circassian people; NIGMS). GCI obtained informed written consent from all participants and local institutional review board approval at all recruitment sites. for comments on consent/IRB approval) and 40 African Americans (NIGMS HVP).c Including samples from 9 sub-Saharan Africans (NIGMS HVP), 7 northern Africans (north of the Sahara) (NIGMS HVP), and 5 Pygmies (NIGMS).d Including samples from 99 Mexican Americans from Los Angeles (NIGMS HVP).e Including samples from 100 Han Chinese from Los Angeles (NIGMS HVP). Open table in a new tab PTPN22 encodes a 110-kD cytoplasmic protein tyrosine phosphatase that consists of an N-terminal phosphatase domain and a long C-terminal region containing several proline-rich motifs (Cohen et al. Cohen et al., 1999Cohen S Dadi H Shaoul E Sharfe N Roifman CM Cloning and characterization of a lymphoid-specific, inducible human pro
0
Citation1,482
0
Save
0

A Large-Scale Genetic Association Study Confirms IL12B and Leads to the Identification of IL23R as Psoriasis-Risk Genes

Michele Cargill et al.Jan 19, 2007
We performed a multitiered, case-control association study of psoriasis in three independent sample sets of white North American individuals (1,446 cases and 1,432 controls) with 25,215 genecentric single-nucleotide polymorphisms (SNPs) and found a highly significant association with an IL12B 3′-untranslated-region SNP (rs3212227), confirming the results of a small Japanese study. This SNP was significant in all three sample sets (odds ratio [OR]common 0.64, combined P [Pcomb]=7.85×10−10). A Monte Carlo simulation to address multiple testing suggests that this association is not a type I error. The coding regions of IL12B were resequenced in 96 individuals with psoriasis, and 30 additional IL12B-region SNPs were genotyped. Haplotypes were estimated, and genotype-conditioned analyses identified a second risk allele (rs6887695) located ∼60 kb upstream of the IL12B coding region that exhibited association with psoriasis after adjustment for rs3212227. Together, these two SNPs mark a common IL12B risk haplotype (ORcommon 1.40, Pcomb=8.11×10−9) and a less frequent protective haplotype (ORcommon 0.58, Pcomb=5.65×10−12), which were statistically significant in all three studies. Since IL12B encodes the common IL-12p40 subunit of IL-12 and IL-23, we individually genotyped 17 SNPs in the genes encoding the other chains of these cytokines (IL12A and IL23A) and their receptors (IL12RB1, IL12RB2, and IL23R). Haplotype analyses identified two IL23R missense SNPs that together mark a common psoriasis-associated haplotype in all three studies (ORcommon 1.44, Pcomb=3.13×10−6). Individuals homozygous for both the IL12B and the IL23R predisposing haplotypes have an increased risk of disease (ORcommon 1.66, Pcomb=1.33×10−8). These data, and the previous observation that administration of an antibody specific for the IL-12p40 subunit to patients with psoriasis is highly efficacious, suggest that these genes play a fundamental role in psoriasis pathogenesis. We performed a multitiered, case-control association study of psoriasis in three independent sample sets of white North American individuals (1,446 cases and 1,432 controls) with 25,215 genecentric single-nucleotide polymorphisms (SNPs) and found a highly significant association with an IL12B 3′-untranslated-region SNP (rs3212227), confirming the results of a small Japanese study. This SNP was significant in all three sample sets (odds ratio [OR]common 0.64, combined P [Pcomb]=7.85×10−10). A Monte Carlo simulation to address multiple testing suggests that this association is not a type I error. The coding regions of IL12B were resequenced in 96 individuals with psoriasis, and 30 additional IL12B-region SNPs were genotyped. Haplotypes were estimated, and genotype-conditioned analyses identified a second risk allele (rs6887695) located ∼60 kb upstream of the IL12B coding region that exhibited association with psoriasis after adjustment for rs3212227. Together, these two SNPs mark a common IL12B risk haplotype (ORcommon 1.40, Pcomb=8.11×10−9) and a less frequent protective haplotype (ORcommon 0.58, Pcomb=5.65×10−12), which were statistically significant in all three studies. Since IL12B encodes the common IL-12p40 subunit of IL-12 and IL-23, we individually genotyped 17 SNPs in the genes encoding the other chains of these cytokines (IL12A and IL23A) and their receptors (IL12RB1, IL12RB2, and IL23R). Haplotype analyses identified two IL23R missense SNPs that together mark a common psoriasis-associated haplotype in all three studies (ORcommon 1.44, Pcomb=3.13×10−6). Individuals homozygous for both the IL12B and the IL23R predisposing haplotypes have an increased risk of disease (ORcommon 1.66, Pcomb=1.33×10−8). These data, and the previous observation that administration of an antibody specific for the IL-12p40 subunit to patients with psoriasis is highly efficacious, suggest that these genes play a fundamental role in psoriasis pathogenesis. Psoriasis is a common, chronic, T-cell–mediated inflammatory disease of the skin, affecting ∼2%–3% of whites of European descent. Although this disease is found in all populations, its prevalence is lower in Asians and African Americans and also declines at lower latitudes.1Lebwohl M Psoriasis.Lancet. 2003; 361: 1197-1204Abstract Full Text Full Text PDF PubMed Scopus (564) Google Scholar The most common form, psoriasis vulgaris, is characterized by varying numbers of red, raised, scaly skin patches that can be present on any body surface but that most often appear on the elbows, knees, and scalp. The onset of disease usually occurs early in life (ages 15–30 years) and affects males and females equally. Up to 30% of individuals with psoriasis will develop an inflammatory arthritis, which can affect the peripheral joints of the hands and feet, large joints, or the central axial skeleton.2Bowcock AM The genetics of psoriasis and autoimmunity.Annu Rev Genomics Hum Genet. 2005; 6: 93-122Crossref PubMed Scopus (112) Google Scholar, 3Gladman DD Antoni C Mease P Clegg DO Nash P Psoriasis arthritis: epidemiology, clinical features, course, and outcome.Ann Rheum Dis. 2005; 64: ii14-ii17Crossref PubMed Scopus (1027) Google Scholar Pathologically, psoriasis is characterized by vascular changes, hyperproliferation of keratinocytes, altered epidermal differentiation, and inflammation.4Bhalerao J Bowcock AM The genetics of psoriasis: a complex disorder of the skin and immune system.Hum Mol Genet. 1998; 7: 1537-1545Crossref PubMed Scopus (230) Google Scholar In particular, the reaction of cells in the epidermis to type 1 effector molecules produced by T-cells results in the characteristic pathology of the plaques.5Bowcock AM Krueger JG Getting under the skin: the immunogenetics of psoriasis.Nat Rev Immunol. 2005; 5: 699-711Crossref PubMed Scopus (379) Google Scholar The genetics of psoriasis are complex, and this disease is highly heritable, as evidenced by an increased rate of concordance in MZ versus DZ twins (35%–72% vs. 12%–23%, respectively) and a substantially increased incidence in family members of affected individuals (e.g., 6% for first-degree relatives); however, it is clear that environmental effects are also responsible for disease susceptibility.5Bowcock AM Krueger JG Getting under the skin: the immunogenetics of psoriasis.Nat Rev Immunol. 2005; 5: 699-711Crossref PubMed Scopus (379) Google Scholar Ten genomewide linkage scans have resulted in strong evidence of a susceptibility locus (PSORS1 [MIM 177900]) in the major histocompatibility complex (MHC) on 6p21 but have not yielded consistent evidence for other regions (for a review, see the work of Bowcock and Kreuger5Bowcock AM Krueger JG Getting under the skin: the immunogenetics of psoriasis.Nat Rev Immunol. 2005; 5: 699-711Crossref PubMed Scopus (379) Google Scholar). Linkage and association in the MHC (6p21) are thought to be due to human leukocyte antigen (HLA)–C. In particular, psoriasis-susceptibility effects are thought to be caused by the *0602 allele,6Helms C Saccone NL Cao L Daw JA Cao K Hsu TM Taillon-Miller P Duan S Gordon D Pierce B et al.Localization of PSORS1 to a haplotype block harboring HLA-C and distinct from corneodesmosin and HCR.Hum Genet. 2005; 118: 466-476Crossref PubMed Scopus (55) Google Scholar, 7Nair RP Stuart PE Nistor I Hiremagalore R Chia NV Jenisch S Weichenthal M Abecasis GR Lim HW Christophers E et al.Sequence and haplotype analysis supports HLA-C as the psoriasis susceptibility 1 gene.Am J Hum Genet. 2006; 78: 827-851Abstract Full Text Full Text PDF PubMed Scopus (432) Google Scholar although other candidate genes in the region may also contribute to disease predisposition. Association studies have identified three gene regions under linkage peaks with considerable evidence of linkage disequilibrium (LD) with psoriasis—namely, SLC9A3R1/NAT9 and RAPTOR (KIAA1303) in 17q25 and SLC12A8 in 3q21.8Helms C Cao L Krueger JG Wijsman EM Chamian F Gordon D Heffernan M Daw JA Robarge J Ott J et al.A putative RUNX1 binding site variant between SLC9A3R1 and NAT9 is associated with susceptibility to psoriasis.Nat Genet. 2003; 35: 349-356Crossref PubMed Scopus (255) Google Scholar, 9Hewett D Samuelsson L Polding J Enlund F Smart D Cantone K See CG Chadha S Inerot A Enerback C et al.Identification of a psoriasis susceptibility candidate gene by linkage disequilibrium mapping with a localized single nucleotide polymorphism map.Genomics. 2002; 79: 305-314Crossref PubMed Scopus (91) Google Scholar Several other genes—including IL12B (MIM 161561), VDR, MMP2, IL10, IL1RN, and IRF2 (Genetic Association Database)—have been associated with psoriasis in sample sets of varying sizes and of different ethnicities; however, without more data from additional independent studies, it is difficult to draw statistically sound conclusions about whether or not they are true disease genes. Genomewide association studies have been promoted as a powerful method for the mapping of complex traits, and both direct (i.e., with use of protein-altering markers) and indirect (i.e., with tag SNPs or spaced markers) strategies have been proposed.10Hirschhorn JN Daly MJ Genome-wide association studies for common diseases and complex traits.Nat Rev Genet. 2005; 6: 95-108Crossref PubMed Scopus (2018) Google Scholar, 11Long AD Langley CH The power of association studies to detect the contribution of candidate genetic loci to variation in complex traits.Genome Res. 1999; 9: 720-731PubMed Google Scholar, 12Risch N Merikangas K The future of genetic studies of complex human diseases.Science. 1996; 273: 1516-1517Crossref PubMed Scopus (4160) Google Scholar We undertook a large, genecentric association study that focused primarily on putative functional SNPs, to identify psoriasis-susceptibility markers in white North American case-control samples, and attempted to replicate significant markers in a second independent case-control sample set. During this process, we observed significant association of a SNP (rs3212227) in the 3′ UTR of IL12B with psoriasis in both case-control sample sets, confirming the results observed in a single Japanese study.13Tsunemi Y Saeki H Nakamura K Sekiya T Hirai K Fujita H Asano N Kishimoto M Tanida Y Kakinuma T et al.Interleukin-12 p40 gene (IL12B) 3′-untranslated region polymorphism is associated with susceptibility to atopic dermatitis and psoriasis vulgaris.J Dermatol Sci. 2002; 30: 161-166Abstract Full Text Full Text PDF PubMed Scopus (165) Google Scholar To explore the role of IL12B in the genetics of psoriasis and to identify potentially causative variants, we genotyped additional markers in and around IL12B and performed further analyses, including haplotype analyses. Because IL12B encodes the IL-12p40 subunit of two distinct heterodimeric cytokines—IL-12 and IL-2314Oppmann B Lesley R Blom B Timans JC Xu Y Hunte B Vega F Yu N Wang J Singh K et al.Novel p19 protein engages IL12p40 to form a cytokine, IL-23, with biological activities similar as well as distinct from IL-12.Immunity. 2000; 13: 715-725Abstract Full Text Full Text PDF PubMed Scopus (2157) Google Scholar—we analyzed SNPs in IL12A, IL23A (encoding the IL-12p35 and IL-23p19 subunits, respectively), and the genes encoding the receptors of IL-12 and IL-23 (IL12RB1, IL12RB2, and IL23R [MIM 607562]), to determine if polymorphisms within these IL12B-related genes also play a role in psoriasis susceptibility. Finally, we replicated all interesting findings in a third independent white North American sample set. We conducted three sequential case-control studies (i.e., discovery, replication 1, and replication 2), to identify SNPs associated with psoriasis. In the discovery study, DNA samples from individuals with (cases) and without (controls) psoriasis were genotyped for 25,215 SNPs, with the use of disease-phenotype–based pooled DNA samples, to increase genotyping throughput and to minimize DNA consumption. The allele frequency of each SNP was determined as described elsewhere,15Germer S Holland MJ Higuchi R High-throughput SNP allele-frequency determination in pooled DNA samples by kinetic PCR.Genome Res. 2000; 10: 258-266Crossref PubMed Scopus (362) Google Scholar and SNPs associated with psoriasis at the .05 significance level were evaluated in an independent sample set (replication 1 study), by use of a similar pooling strategy. Non–MHC-linked SNPs that were associated with psoriasis in the replication 1 study (P<.05) and had the same risk allele as in the discovery study were then individually genotyped in both the discovery and the replication 1 sample sets, to verify the results from the pooled DNA studies. SNPs that were still significant (P<.05) were then interrogated in a third independent sample set (replication 2 study). Here, we report the results of the most significant non-MHC SNP. The discovery samples consisted of 467 white individuals with psoriasis and 500 white individuals who served as controls. All subjects are of northern European ancestry and reside in Utah or in adjacent regions of southern Idaho, the area served by the University of Utah Hospital and Clinics. The individuals with psoriasis were recruited from the University of Utah Department of Dermatology clinics, as part of the Utah Psoriasis Initiative (UPI), and had a diagnosis of psoriasis confirmed by a UPI investigator. A full clinical workup and a questionnaire were available for each individual with psoriasis, and samples from first- or second-degree relatives were not included in the study. Samples from 500 white individuals matched for sex and ethnicity were selected from the CEPH Utah (CEU) population (n=112 grandparents) and from other University of Utah research studies (n=388) to serve as controls. The other research studies include those of colon cancer, restless legs, smoking addiction, epilepsy, and retinal disorders, and all control subjects used in the study described here were either control subjects in these other research studies or were unrelated spouses from family studies. The 112 control subjects from the CEU population were ascertained without regard to disease status. For the remaining 388 individuals, information about autoimmune disease status was available from 53%, and any individual with psoriasis or another autoimmune disease was excluded. Information about autoimmune disease status was not available for the remaining 47%; however, we expect the frequency of psoriasis and other autoimmune diseases in this control population to be similar to that of the general Utah population. Note that, if any of these control subjects carry, with increased frequency, alleles for autoimmune diseases that are also found for psoriasis, the significance of the results reported here would increase if those controls were removed. The replication 1 sample set was collected by the Genomics Collaborative Division of SeraCare Life Sciences (GCI). Samples were included from 498 unrelated white North American individuals with a dermatologist-confirmed diagnosis of psoriasis and a Psoriasis Area and Severity Index (PASI) score and from 498 unrelated white North American individuals without a history of psoriasis or other autoimmune disorders and individually matched to the cases by sex and age. The replication 2 sample set, consisting of samples from 481 unrelated white North American individuals with a dermatologist-confirmed diagnosis of psoriasis and from 424 unrelated white North Americans without psoriasis, was used to confirm results from the two previous sample sets; samples from 293 individuals with psoriasis and 292 individuals without psoriasis were provided by GCI and met the criteria described above. BioCollections Worldwide provided an additional 188 samples from individuals with psoriasis who met the same criteria described above, as well as samples from 132 white North Americans without psoriasis. All individuals included in this study were 18 years or older at the time they were enrolled in the sample collections. In addition, none of the subjects had undergone a bone-marrow transplant. All protocols were approved by national and/or local institutional review boards, and informed written consent was obtained from all subjects. A detailed breakdown of the clinical characteristics of the discovery and replication 1 sample sets is provided in table 1. Detailed clinical information for all individuals with psoriasis in the replication 2 sample set was limited. The female:male sex ratio was 0.89, and the average (±SD) age of onset was 28 ± 16 years.Table 1.Demographic and Clinical InformationSample SetSubphenotypeaData for certain subphenotypes were not available for all patients.DiscoveryReplication 1Genetic backgroundWhite (Utah)White (North America)No. of cases467498No. of controls500498Female:male sex ratio1.21.2Average age at onset (years)28 ± 1729 ± 15Percentage with family history of psoriasis62.70%46.60%No. of cases with: Psoriatic arthritis and psoriasis for at least 10 years (yes/no)125/23998/143 National Psoriasis Foundation score <7.5/7.5–12.5/>12.5124/132/129… PASI score <10/10–50/>50…364/103/4a Data for certain subphenotypes were not available for all patients. Open table in a new tab Allele-specific, kinetic PCR assays were developed for a collection of 25,215 genecentric SNPs curated from dbSNP, the Applera Genome Initiative,16Shiffman D Ellis SG Rowland CM Malloy MJ Luke MM Iakoubova OA Pullinger CR Cassano J Aouizerat BE Fenwick RG et al.Identification of four gene variants associated with myocardial infarction.Am J Hum Genet. 2005; 77: 596-605Abstract Full Text Full Text PDF PubMed Scopus (139) Google Scholar, 17Bustamante CD Fledel-Alon A Williamson S Nielsen R Hubisz MT Glanowski S Tanenbaum DM White TJ Sninsky JJ Hernandez RD et al.Natural selection on protein-coding genes in the human genome.Nature. 2005; 437: 1153-1157Crossref PubMed Scopus (566) Google Scholar and the literature. SNPs were selected for inclusion if they appeared in more than one database and had a minor-allele frequency (MAF) ⩾1%. Of the SNPs, ∼70% are missense polymorphisms predicted to modify the amino acid sequences encoded by the genes. The majority of the remaining 30% of SNPs were splice-site acceptors or donors, putative transcription-factor binding sites, etc. Of the SNPs, ∼75% have MAFs ⩾5%. SNP allele frequencies in pooled DNA samples were determined by allele-specific, kinetic PCR, as described elsewhere.15Germer S Holland MJ Higuchi R High-throughput SNP allele-frequency determination in pooled DNA samples by kinetic PCR.Genome Res. 2000; 10: 258-266Crossref PubMed Scopus (362) Google Scholar, 16Shiffman D Ellis SG Rowland CM Malloy MJ Luke MM Iakoubova OA Pullinger CR Cassano J Aouizerat BE Fenwick RG et al.Identification of four gene variants associated with myocardial infarction.Am J Hum Genet. 2005; 77: 596-605Abstract Full Text Full Text PDF PubMed Scopus (139) Google Scholar In brief, 3 ng of pooled DNA was amplified using allele-specific primers and allele frequencies calculated from the two allele-specific PCR amplification curves, each determined in duplicate. Individual genotyping was performed using allele-specific kinetic PCR on 0.3 ng of DNA, and the data were hand curated before statistical analysis, without knowledge of case-control status. Genotyping calls were made on >99% of samples, for all SNPs genotyped. Previous analyses suggest a genotyping accuracy of >99%.18Li Y Tacey K Doil L van Luchene R Garcia V Rowland C Schrodi S Leong D Lau K Cantanese J et al.Association of ABCA1 with late-onset Alzheimer’s disease is not observed in a case-control study.Neurosci Lett. 2004; 366: 268-271Crossref PubMed Scopus (46) Google Scholar, 19Carlton VEH Hu X Chokkalingam AP Schrodi SJ Brandon R Alexander HC Chang M Catanese JJ Leong DU Ardlie KG et al.PTPN22 genetic variation: evidence for multiple variants associated with rheumatoid arthritis.Am J Hum Genet. 2005; 77: 567-581Abstract Full Text Full Text PDF PubMed Scopus (184) Google Scholar Genotyping of the four most interesting SNPs described here (i.e., rs3212227, rs6887695, rs7530311, and rs11209026) in 320 of the psoriasis study samples, with use of an unrelated technology—a multiplexed oligoligation assay—showed >99.8% concordance. HLA-C genotypes were determined for the discovery samples by high-resolution sequence-based typing (performed by Atria Genetics). HLA-C genotypes were not available for the other two sample sets. Pools were constructed using an orthogonal design in which an individual DNA sample was arrayed into multiple pools on the basis of clinically relevant phenotypes. For the unstratified analyses (i.e., all cases vs. all controls), the allele-frequency measurements in each stratum were combined and averaged on the basis of the formulafrequency=12n∑j[(2lj)∑ifipij] ,where lj is the number of pools in which sample j appears, pij=1 if sample j belongs to pool i and is 0 otherwise, fi is the allele-frequency estimate in pool i, and n is the number of distinct samples across all pools. By using an orthogonal pooling strategy based on clinically relevant phenotypes and by collapsing all the strata into an analysis of all cases versus all controls, we were essentially taking repeated measurements and were able to reduce measurement error for the comparison of all cases versus all controls. To identify novel variants of IL12B, we selected DNA for resequencing from 96 randomly chosen individuals with psoriasis in the replication 1 sample set. Sequence data from all eight annotated exons and from the 5,000 bp upstream of the 5′-most exon of IL12B, which spans ∼17 kb, were extracted from the R27 draft of the Celera human genome sequence (Entrez Nucleotide [accession number NW_922784]). Primers were designed using the Primer3 program20Rozen S Skaletsky H Primer3 on the WWW for general users and for biologist programmers.in: Krawetz S Misener S Bioinformatics methods and protocols: methods in molecular biology. Humana Press, Totowa, NJ2000: 365-386Google Scholar and included the M13 forward (5′ primer) or reverse (3′ primer) universal sequencing primer-binding sequence at their 5′ ends. PCR amplification and sequencing were performed as described elsewhere.19Carlton VEH Hu X Chokkalingam AP Schrodi SJ Brandon R Alexander HC Chang M Catanese JJ Leong DU Ardlie KG et al.PTPN22 genetic variation: evidence for multiple variants associated with rheumatoid arthritis.Am J Hum Genet. 2005; 77: 567-581Abstract Full Text Full Text PDF PubMed Scopus (184) Google Scholar Tag SNPs for follow-up genotyping were selected by downloading the CEU HapMap genotypes between positions 158,464,177 and 158,828,966 on chromosome 5 from the HapMap Web site (release 12, October 2004) and by running the computer program Redigo.21Hu X Schrodi SJ Ross DA Cargill M Selecting tagging SNPs for association studies using power calculations from genotype data.Hum Hered. 2004; 57: 156-170Crossref PubMed Scopus (21) Google Scholar The approach used by this program maximizes the statistical power to detect truly associated SNPs, while minimizing the number of SNPs that are genotyped, and does not use measures of LD to select the SNPs. For the power calculations, we set the following parameters: 500 cases, 500 controls, 0.95 power threshold, disease prevalence 0.01, and a conservative disease model (additive mode of inheritance with genotypic relative risk [GRR] 1.5). As described by Hu and colleagues,21Hu X Schrodi SJ Ross DA Cargill M Selecting tagging SNPs for association studies using power calculations from genotype data.Hum Hered. 2004; 57: 156-170Crossref PubMed Scopus (21) Google Scholar use of a conservative disease model produces a tag SNP set that can exhibit moderate-to-substantial LD between pairs of selected SNPs and is also robust to changes in disease models. The LD measure r2 was calculated from unphased data with use of the LDMAX program in the GOLD package.22Abecasis GR Cookson WO GOLD—graphical overview of linkage disequilibrium.Bioinformatics. 2000; 16: 182-183Crossref PubMed Scopus (673) Google Scholar Spotfire software was used to generate graphical representations of the r2 LD matrix. A pseudo-Gibbs sampling algorithm from the program SNPAnalyzer version 1.023Yoo J Seo B Kim Y SNPAnalyzer: a web-based integrated workbench for single-nucleotide polymorphism analysis.Nucleic Acids Res. 2005; 33: W483-W488Crossref PubMed Scopus (48) Google Scholar was used to estimate haplotype and diplotype frequencies from unphased data. Cases and controls were treated separately in this process. The Haplo.Stats package, which calculates global P values (P values that test the null hypothesis of independence between disease status and all the haplotypes) as well as P values for each individual predicted haplotype, was used to test for association between haplotypes and disease status.24Schaid DJ Rowland CM Tines DE Jacobson RM Poland GA Score tests for association between traits and haplotypes when linkage phase is ambiguous.Am J Hum Genet. 2002; 70: 425-434Abstract Full Text Full Text PDF PubMed Scopus (1539) Google Scholar The Haplo.Stats package is particularly useful for unphased data, since it adjusts the variance on the test statistic for haplotype estimation error. A test of independence between allelic counts and disease status was performed using Fisher’s exact test.25Fisher RA Statistical methods for research workers. 12th ed. Oliver and Boyd, Edinburgh1954Google Scholar For larger contingency tables, the Williams-corrected G test was applied, to evaluate the null hypothesis of independence between genotype counts and psoriasis status,26Sokal RR Rohlf FJ Biometry. 3rd ed. W. H. Freeman and Company, New York1995Google Scholar except when the data were sparse. In that situation, a Monte Carlo simulation approach was used to obtain appropriate P values. To explore the extent of deviation from Hardy-Weinberg equilibrium (HWE), Weir’s exact test for HWE was calculated.27Weir BS Genetic data analysis II. Sinauer, Sunderland, MA1996Google Scholar Since many disease models will predict a difference in pairwise LD between samples from affected individuals and samples from unaffected individuals, we used the LD contrast test, described by Nielsen and colleagues,28Nielsen DM Ehm MG Zaykin DV Weir BS Effect of two- and three-locus linkage disequilibrium on the power to detect marker/phenotype associations.Genetics. 2004; 168: 1029-1040Crossref PubMed Scopus (53) Google Scholar to test for differences in LD patterns between cases and controls. We employed Fisher’s combined P value to perform a joint analysis across independent studies. A Mantel-Haenszel common odds ratio (OR) was calculated across independent studies.26Sokal RR Rohlf FJ Biometry. 3rd ed. W. H. Freeman and Company, New York1995Google Scholar GRR estimates (denoted as γ) were calculated using a Bayesian approach modeling (i) the prevalence of disease as a beta distribution having an expected disease prevalence of 2.3% and (ii) the genotype counts as multinomially distributed with parameters estimated from the empirical data. The Breslow-Day statistic29Breslow NE Day NE Statistical methods in cancer research.The analysis of case-control studies. Vol I. International Agency for Research on Cancer, Lyon1980Google Scholar was used to determine whether SNPs exhibited significant heterogeneity of ORs across subphenotypes. Estimates of the population-attributable fraction were calculated as described by Walter30Walter SD The distribution of Levin’s measure of attributable risk.Biometrika. 1975; 62: 371-374Crossref Scopus (96) Google Scholar and Schlesselman.31Schlesselman JJ Case-control studies: design, conduct, analysis. Oxford University Press, New York1982Google Scholar Since false-positive results can be problematic in any large-scale experiment in which modest nominal significance levels are used, we performed a Monte Carlo simulation to obtain the distribution of combined P values across the two studies. Two null hypotheses were considered, and the results were presented under each hypothesis. Under the first model, which assumed independence between the cases and controls and a uniform distribution of P values, we generated 26,000 stochastically independent P values, retaining the top 1,500 most significant. A second set of 1,500 P values were then generated under a uniform distribution, to simulate P values for the replication data set, and the two P values for each replicate were combined using Fisher’s combined P value. The entire in silico experiment was repeated 1,000 times. The single most significant P value from each in silico experiment was then used to generate a distribution of the 1,000 most significant experimentwide P values. This is analogous to results obtained under the Dunn-Sidak–corrected significance level (similar to a Bonferroni correction).26Sokal RR Rohlf FJ Biometry. 3rd ed. W. H. Freeman and Company, New York1995Google Scholar For the second model, we took a similar approach, except that we used the results from the pooled discovery samples to model the distribution of null P values. This approach is typically more conservative and is described in detail by Schrodi.32Schrodi SJ A probabilistic approach to large-scale association scans: a semi-Bayesian method to detect disease-predisposing alleles.Stat Appl Genet Mol Biol. 2005; 4: Article31PubMed Google Scholar The resulting gamma-null model was defined by scale and shape parameters of 1.2032 and 0.8517, respectively. Similar to other empirically based methods used in large-scale studies to obtain null or alternative models,33Efron B Tibshirani R Storey JD Tusher V Empirical Bayes analysis of a microarray experiment.J Am Stat Assoc. 2001; 96: 1151-1160Crossref Scopus (1091) Google Scholar this gamma-model method concurrently adj
0
Citation1,070
0
Save
0

Genetic variants at CD28, PRDM1 and CD2/CD58 are associated with rheumatoid arthritis risk

Soumya Raychaudhuri et al.Nov 8, 2009
Soumya Raychaudhuri and colleagues demonstrate the utility of GRAIL, a software program used to prioritize results from genome-wide association studies for further replication, applied here to rheumatoid arthritis. The authors seek replication of their predictions in additional independent cohorts and report three new genetic loci associated with RA susceptibility. To discover new rheumatoid arthritis (RA) risk loci, we systematically examined 370 SNPs from 179 independent loci with P < 0.001 in a published meta-analysis of RA genome-wide association studies (GWAS) of 3,393 cases and 12,462 controls1. We used Gene Relationships Across Implicated Loci (GRAIL)2, a computational method that applies statistical text mining to PubMed abstracts, to score these 179 loci for functional relationships to genes in 16 established RA disease loci1,3,4,5,6,7,8,9,10,11. We identified 22 loci with a significant degree of functional connectivity. We genotyped 22 representative SNPs in an independent set of 7,957 cases and 11,958 matched controls. Three were convincingly validated: CD2-CD58 (rs11586238, P = 1 × 10−6 replication, P = 1 × 10−9 overall), CD28 (rs1980422, P = 5 × 10−6 replication, P = 1 × 10−9 overall) and PRDM1 (rs548234, P = 1 × 10−5 replication, P = 2 × 10−8 overall). An additional four were replicated (P < 0.0023): TAGAP (rs394581, P = 0.0002 replication, P = 4 × 10−7 overall), PTPRC (rs10919563, P = 0.0003 replication, P = 7 × 10−7 overall), TRAF6-RAG1 (rs540386, P = 0.0008 replication, P = 4 × 10−6 overall) and FCGR2A (rs12746613, P = 0.0022 replication, P = 2 × 10−5 overall). Many of these loci are also associated to other immunologic diseases.
0
Citation327
0
Save
0

A 7 gene signature identifies the risk of developing cirrhosis in patients with chronic hepatitis C†

Hongjin Huang et al.Apr 26, 2007
Clinical factors such as age, gender, alcohol use, and age-at-infection influence the progression to cirrhosis but cannot accurately predict the risk of developing cirrhosis in patients with chronic hepatitis C (CHC). The aim of this study was to develop a predictive signature for cirrhosis in Caucasian patients. All patients had well-characterized liver histology and clinical factors; DNA was extracted from whole blood for genotyping. We validated all significant markers from a genome scan in the training cohort, and selected 361 markers for the signature building. Using a "machine learning" approach, a signature consisting of markers most predictive for cirrhosis risk in Caucasian patients was developed in the training set (N = 420). The Cirrhosis Risk Score (CRS) was calculated to estimate the risk of developing cirrhosis for each patient. The CRS performance was then tested in an independently enrolled validation cohort of 154 Caucasian patients. A CRS signature consisting of 7 markers was developed for Caucasian patients. The area-under-the-ROC curves (AUC) of the CRS was 0.75 in the training cohort. In the validation cohort, AUC was only 0.53 for clinical factors, increased to 0.73 for CRS, and 0.76 when CRS and clinical factors were combined. A low CRS cutoff of <0.50 to identify low-risk patients would misclassify only 10.3% of high-risk patients, while a high cutoff of >0.70 to identify high-risk patients would misclassify 22.3% of low-risk patients. Conclusion: CRS is a better predictor than clinical factors in differentiating high-risk versus low-risk for cirrhosis in Caucasian CHC patients. Prospective studies should be conducted to further validate these findings. (HEPATOLOGY 2007.)
0
Citation297
0
Save