DN
Deborah Nickerson
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
64
(72% Open Access)
Cited by:
33,140
h-index:
28
/
i10-index:
64
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Selecting a Maximally Informative Set of Single-Nucleotide Polymorphisms for Association Analyses Using Linkage Disequilibrium

Christopher Carlson et al.Jan 1, 2004
Common genetic polymorphisms may explain a portion of the heritable risk for common diseases. Within candidate genes, the number of common polymorphisms is finite, but direct assay of all existing common polymorphism is inefficient, because genotypes at many of these sites are strongly correlated. Thus, it is not necessary to assay all common variants if the patterns of allelic association between common variants can be described. We have developed an algorithm to select the maximally informative set of common single-nucleotide polymorphisms (tagSNPs) to assay in candidate-gene association studies, such that all known common polymorphisms either are directly assayed or exceed a threshold level of association with a tagSNP. The algorithm is based on the r2 linkage disequilibrium (LD) statistic, because r2 is directly related to statistical power to detect disease associations with unassayed sites. We show that, at a relatively stringent r2 threshold (r2>0.8), the LD-selected tagSNPs resolve >80% of all haplotypes across a set of 100 candidate genes, regardless of recombination, and tag specific haplotypes and clades of related haplotypes in nonrecombinant regions. Thus, if the patterns of common variation are described for a candidate gene, analysis of the tagSNP set can comprehensively interrogate for main effects from common functional variation. We demonstrate that, although common variation tends to be shared between populations, tagSNPs should be selected separately for populations with different ancestries. Common genetic polymorphisms may explain a portion of the heritable risk for common diseases. Within candidate genes, the number of common polymorphisms is finite, but direct assay of all existing common polymorphism is inefficient, because genotypes at many of these sites are strongly correlated. Thus, it is not necessary to assay all common variants if the patterns of allelic association between common variants can be described. We have developed an algorithm to select the maximally informative set of common single-nucleotide polymorphisms (tagSNPs) to assay in candidate-gene association studies, such that all known common polymorphisms either are directly assayed or exceed a threshold level of association with a tagSNP. The algorithm is based on the r2 linkage disequilibrium (LD) statistic, because r2 is directly related to statistical power to detect disease associations with unassayed sites. We show that, at a relatively stringent r2 threshold (r2>0.8), the LD-selected tagSNPs resolve >80% of all haplotypes across a set of 100 candidate genes, regardless of recombination, and tag specific haplotypes and clades of related haplotypes in nonrecombinant regions. Thus, if the patterns of common variation are described for a candidate gene, analysis of the tagSNP set can comprehensively interrogate for main effects from common functional variation. We demonstrate that, although common variation tends to be shared between populations, tagSNPs should be selected separately for populations with different ancestries.
0
Citation1,591
0
Save
0

Analysis of 6,515 exomes reveals the recent origin of most human protein-coding variants

Wenqing Fu et al.Nov 27, 2012
Resequencing of genes from individuals of European and African American ancestry indicates that approximately 73% of all protein-coding SNVs and approximately 86% of SNVs predicted to be deleterious arose in the past 5,000–10,000 years, and that European Americans carry an excess of deleterious variants in essential and Mendelian disease genes compared to African Americans. As part of the NHLBI Exome Sequencing Project, the exomes of more than 6,500 individuals of European American and African American ancestry have been sequenced. Using these data, the authors estimate that about 73% of all protein-coding single nucleotide variants (SNVs) and 86% of SNVs predicted to be deleterious arose in the past 5,000–10,000 years, a short span in evolutionary time that coincides with a period of accelerated population growth. Around 86% of changes predicted to be harmful arose within the same timeframe, with European Americans harbouring more harmful variants in essential and Mendelian disease genes than African Americans. The data suggest that the increased mutational capacity of recent human populations has influenced the burden of Mendelian disorders, but is also likely to promote beneficial genetic changes that will be selected in future generations to come. More practically, the results will be of use in prioritizing potential disease-causing variants in gene-mapping studies. Establishing the age of each mutation segregating in contemporary human populations is important to fully understand our evolutionary history1,2 and will help to facilitate the development of new approaches for disease-gene discovery3. Large-scale surveys of human genetic variation have reported signatures of recent explosive population growth4,5,6, notable for an excess of rare genetic variants, suggesting that many mutations arose recently. To more quantitatively assess the distribution of mutation ages, we resequenced 15,336 genes in 6,515 individuals of European American and African American ancestry and inferred the age of 1,146,401 autosomal single nucleotide variants (SNVs). We estimate that approximately 73% of all protein-coding SNVs and approximately 86% of SNVs predicted to be deleterious arose in the past 5,000–10,000 years. The average age of deleterious SNVs varied significantly across molecular pathways, and disease genes contained a significantly higher proportion of recently arisen deleterious SNVs than other genes. Furthermore, European Americans had an excess of deleterious variants in essential and Mendelian disease genes compared to African Americans, consistent with weaker purifying selection due to the Out-of-Africa dispersal. Our results better delimit the historical details of human protein-coding variation, show the profound effect of recent human history on the burden of deleterious SNVs segregating in contemporary populations, and provide important practical information that can be used to prioritize variants in disease-gene discovery.
0
Citation956
0
Save
Load More