SS
S. Schaffner
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
38
(63% Open Access)
Cited by:
25,094
h-index:
79
/
i10-index:
221
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The Structure of Haplotype Blocks in the Human Genome

Stacey Gabriel et al.Jun 21, 2002
+15
H
S
S
Haplotype-based methods offer a powerful approach to disease gene mapping, based on the association between causal mutations and the ancestral haplotypes on which they arose. As part of The SNP Consortium Allele Frequency Projects, we characterized haplotype patterns across 51 autosomal regions (spanning 13 megabases of the human genome) in samples from Africa, Europe, and Asia. We show that the human genome can be parsed objectively into haplotype blocks: sizable regions over which there is little evidence for historical recombination and within which only a few common haplotypes are observed. The boundaries of blocks and specific haplotypes they contain are highly correlated across populations. We demonstrate that such haplotype frameworks provide substantial statistical power in association studies of common genetic variation across each region. Our results provide a foundation for the construction of a haplotype map of the human genome, facilitating comprehensive genetic association studies of human disease.
0
Citation5,681
0
Save
0

A map of human genome sequence variation containing 1.42 million single nucleotide polymorphisms

Ravi Sachidanandam et al.Feb 15, 2001
+39
S
D
R
We describe a map of 1.42 million single nucleotide polymorphisms (SNPs) distributed throughout the human genome, providing an average density on available sequence of one SNP every 1.9 kilobases. These SNPs were primarily discovered by two projects: The SNP Consortium and the analysis of clone overlaps by the International Human Genome Sequencing Consortium. The map integrates all publicly available SNPs with described genes and other genomic features. We estimate that 60,000 SNPs fall within exon (coding and untranslated regions), and 85% of exons are within 5 kb of the nearest SNP. Nucleotide diversity varies greatly across the genome, in a manner broadly consistent with a standard population genetic model of human history. This high-density SNP map provides a public resource for defining haplotype variation across the genome, and should help to identify biomedically important genes for diagnosis and therapy.
0
Citation2,928
0
Save
0

Integrating common and rare genetic variation in diverse human populations

David Green et al.Aug 31, 2010
+65
L
R
D
Despite great progress in identifying genetic variants that influence human disease, most inherited risk remains unexplained. A more complete understanding requires genome-wide studies that fully examine less common alleles in populations with a wide range of ancestry. To inform the design and interpretation of such studies, we genotyped 1.6 million common single nucleotide polymorphisms (SNPs) in 1,184 reference individuals from 11 global populations, and sequenced ten 100-kilobase regions in 692 of these individuals. This integrated data set of common and rare alleles, called ‘HapMap 3’, includes both SNPs and copy number polymorphisms (CNPs). We characterized population-specific differences among low-frequency variants, measured the improvement in imputation accuracy afforded by the larger reference panel, especially in imputing SNPs with a minor allele frequency of ≤5%, and demonstrated the feasibility of imputing newly discovered CNPs and SNPs. This expanded public resource of genome variants in global populations supports deeper interrogation of genomic variation and its role in human disease, and serves as a step towards a high-resolution map of the landscape of human genetic variation. The International HapMap Consortium, established to develop a haplotype map of the human genome describing the common patterns of DNA sequence variation, has now reached its third incarnation. HapMap1, published in 2005 (go.nature.com/gJisDm), contained more than a million SNP (single nucleotide polymorphism) genotypes generated in 269 individuals from four geographically diverse populations. Two years later, HapMap2 (go.nature.com/WttNWX) added more than 2.1 million SNPs to the original map in the same 269 individuals. With the aim of providing a resource for the latest wave of genome-wide studies focused on disease linkages, HapMap3 casts the net wider. About 1.6 million common SNPs were genotyped in 1,184 individuals from 11 global populations, and ten 100-kilobase regions were sequenced in 692 of these individuals. Here, the analysis of 'HapMap 3' is reported — a public data set of genomic variants in human populations. The resource integrates common and rare single nucleotide polymorphisms (SNPs) and copy number polymorphisms (CNPs) from 11 global populations, providing insights into population-specific differences among variants. It also demonstrates the feasibility of imputing newly discovered rare SNPs and CNPs.
0
Citation2,892
0
Save
0

Detecting recent positive selection in the human genome from haplotype structure

Pardis Sabeti et al.Oct 1, 2002
+14
J
D
P
0
Citation1,992
0
Save
0

High-resolution haplotype structure in the human genome

Mark Daly et al.Oct 1, 2001
+2
S
J
M
0
Citation1,741
0
Save
0

Genomic surveillance elucidates Ebola virus origin and transmission during the 2014 outbreak

Stephen Gire et al.Aug 29, 2014
+55
K
L
S
Evolution of Ebola virus over time The high rate of mortality in the current Ebola epidemic has made it difficult for researchers to collect samples of the virus and study its evolution. Gire et al. describe Ebola epidemiology on the basis of 99 whole-genome sequences, including samples from 78 affected individuals. The authors analyzed changes in the viral sequence and conclude that the current outbreak probably resulted from the spread of the virus from central Africa in the past decade. The outbreak started from a single transmission event from an unknown animal reservoir into the human population. Two viral lineages from Guinea then spread from person to person into Sierra Leone. Science , this issue p. 1369
0
Citation1,213
0
Save
0

Genetic Signatures of Strong Recent Positive Selection at the Lactase Gene

Todd Bersaglieri et al.May 10, 2004
+6
N
P
T
In most human populations, the ability to digest lactose contained in milk usually disappears in childhood, but in European-derived populations, lactase activity frequently persists into adulthood (Scrimshaw and Murray Scrimshaw and Murray, 1988Scrimshaw N Murray E The acceptability of milk and milk products in populations with a high prevalence of lactose intolerance.Am J Clin Nutr. 1988; 48: 1079-1159PubMed Google Scholar). It has been suggested (Cavalli-Sforza Cavalli-Sforza, 1973Cavalli-Sforza L Analytic review: some current problems of population genetics.Am J Hum Genet. 1973; 25: 82-104PubMed Google Scholar; Hollox et al. Hollox et al., 2001Hollox EJ Poulter M Zvarik M Ferak V Krause A Jenkins T Saha N Kozlov AI Swallow DM Lactase haplotype diversity in the Old World.Am J Hum Genet. 2001; 68: 160-172Abstract Full Text Full Text PDF PubMed Scopus (134) Google Scholar; Enattah et al. Enattah et al., 2002Enattah NS Sahi T Savilahti E Terwilliger JD Peltonen L Jarvela I Identification of a variant associated with adult-type hypolactasia.Nat Genet. 2002; 30: 233-237Crossref PubMed Scopus (768) Google Scholar; Poulter et al. Poulter et al., 2003Poulter M Hollox E Harvey CB Mulcare C Peuhkuri K Kajander K Sarner M Korpela R Swallow DM The causal element for the lactase persistence/non-persistence polymorphism is located in a 1 Mb region of linkage disequilibrium in Europeans.Ann Hum Genet. 2003; 67: 298-311Crossref PubMed Scopus (103) Google Scholar) that a selective advantage based on additional nutrition from dairy explains these genetically determined population differences (Simoons Simoons, 1970Simoons F Primary adult lactose intolerance and the milking habit: a problem in biologic and cultural interrelations. II. A culture historical hypothesis.Am J Dig Dis. 1970; 15: 695-710Crossref PubMed Scopus (203) Google Scholar; Kretchmer Kretchmer, 1971Kretchmer N Memorial lecture: lactose and lactase—a historical perspective.Gastroenterology. 1971; 61: 805-813Abstract Full Text PDF PubMed Google Scholar; Scrimshaw and Murray Scrimshaw and Murray, 1988Scrimshaw N Murray E The acceptability of milk and milk products in populations with a high prevalence of lactose intolerance.Am J Clin Nutr. 1988; 48: 1079-1159PubMed Google Scholar; Enattah et al. Enattah et al., 2002Enattah NS Sahi T Savilahti E Terwilliger JD Peltonen L Jarvela I Identification of a variant associated with adult-type hypolactasia.Nat Genet. 2002; 30: 233-237Crossref PubMed Scopus (768) Google Scholar), but formal population-genetics–based evidence of selection has not yet been provided. To assess the population-genetics evidence for selection, we typed 101 single-nucleotide polymorphisms covering 3.2 Mb around the lactase gene. In northern European–derived populations, two alleles that are tightly associated with lactase persistence (Enattah et al. Enattah et al., 2002Enattah NS Sahi T Savilahti E Terwilliger JD Peltonen L Jarvela I Identification of a variant associated with adult-type hypolactasia.Nat Genet. 2002; 30: 233-237Crossref PubMed Scopus (768) Google Scholar) uniquely mark a common (∼77%) haplotype that extends largely undisrupted for >1 Mb. We provide two new lines of genetic evidence that this long, common haplotype arose rapidly due to recent selection: (1) by use of the traditional FST measure and a novel test based on pexcess, we demonstrate large frequency differences among populations for the persistence-associated markers and for flanking markers throughout the haplotype, and (2) we show that the haplotype is unusually long, given its high frequency—a hallmark of recent selection. We estimate that strong selection occurred within the past 5,000–10,000 years, consistent with an advantage to lactase persistence in the setting of dairy farming; the signals of selection we observe are among the strongest yet seen for any gene in the genome. In most human populations, the ability to digest lactose contained in milk usually disappears in childhood, but in European-derived populations, lactase activity frequently persists into adulthood (Scrimshaw and Murray Scrimshaw and Murray, 1988Scrimshaw N Murray E The acceptability of milk and milk products in populations with a high prevalence of lactose intolerance.Am J Clin Nutr. 1988; 48: 1079-1159PubMed Google Scholar). It has been suggested (Cavalli-Sforza Cavalli-Sforza, 1973Cavalli-Sforza L Analytic review: some current problems of population genetics.Am J Hum Genet. 1973; 25: 82-104PubMed Google Scholar; Hollox et al. Hollox et al., 2001Hollox EJ Poulter M Zvarik M Ferak V Krause A Jenkins T Saha N Kozlov AI Swallow DM Lactase haplotype diversity in the Old World.Am J Hum Genet. 2001; 68: 160-172Abstract Full Text Full Text PDF PubMed Scopus (134) Google Scholar; Enattah et al. Enattah et al., 2002Enattah NS Sahi T Savilahti E Terwilliger JD Peltonen L Jarvela I Identification of a variant associated with adult-type hypolactasia.Nat Genet. 2002; 30: 233-237Crossref PubMed Scopus (768) Google Scholar; Poulter et al. Poulter et al., 2003Poulter M Hollox E Harvey CB Mulcare C Peuhkuri K Kajander K Sarner M Korpela R Swallow DM The causal element for the lactase persistence/non-persistence polymorphism is located in a 1 Mb region of linkage disequilibrium in Europeans.Ann Hum Genet. 2003; 67: 298-311Crossref PubMed Scopus (103) Google Scholar) that a selective advantage based on additional nutrition from dairy explains these genetically determined population differences (Simoons Simoons, 1970Simoons F Primary adult lactose intolerance and the milking habit: a problem in biologic and cultural interrelations. II. A culture historical hypothesis.Am J Dig Dis. 1970; 15: 695-710Crossref PubMed Scopus (203) Google Scholar; Kretchmer Kretchmer, 1971Kretchmer N Memorial lecture: lactose and lactase—a historical perspective.Gastroenterology. 1971; 61: 805-813Abstract Full Text PDF PubMed Google Scholar; Scrimshaw and Murray Scrimshaw and Murray, 1988Scrimshaw N Murray E The acceptability of milk and milk products in populations with a high prevalence of lactose intolerance.Am J Clin Nutr. 1988; 48: 1079-1159PubMed Google Scholar; Enattah et al. Enattah et al., 2002Enattah NS Sahi T Savilahti E Terwilliger JD Peltonen L Jarvela I Identification of a variant associated with adult-type hypolactasia.Nat Genet. 2002; 30: 233-237Crossref PubMed Scopus (768) Google Scholar), but formal population-genetics–based evidence of selection has not yet been provided. To assess the population-genetics evidence for selection, we typed 101 single-nucleotide polymorphisms covering 3.2 Mb around the lactase gene. In northern European–derived populations, two alleles that are tightly associated with lactase persistence (Enattah et al. Enattah et al., 2002Enattah NS Sahi T Savilahti E Terwilliger JD Peltonen L Jarvela I Identification of a variant associated with adult-type hypolactasia.Nat Genet. 2002; 30: 233-237Crossref PubMed Scopus (768) Google Scholar) uniquely mark a common (∼77%) haplotype that extends largely undisrupted for >1 Mb. We provide two new lines of genetic evidence that this long, common haplotype arose rapidly due to recent selection: (1) by use of the traditional FST measure and a novel test based on pexcess, we demonstrate large frequency differences among populations for the persistence-associated markers and for flanking markers throughout the haplotype, and (2) we show that the haplotype is unusually long, given its high frequency—a hallmark of recent selection. We estimate that strong selection occurred within the past 5,000–10,000 years, consistent with an advantage to lactase persistence in the setting of dairy farming; the signals of selection we observe are among the strongest yet seen for any gene in the genome.
0
Citation1,111
0
Save
0

Structural and Functional Analysis of the D614G SARS-CoV-2 Spike Protein Variant

Leonid Yurkovetskiy et al.Sep 15, 2020
+19
K
H
L
The SARS-CoV-2 spike (S) protein variant D614G supplanted the ancestral virus worldwide, reaching near fixation in a matter of months. Here we show that D614G was more infectious than the ancestral form on human lung cells, colon cells, and on cells rendered permissive by ectopic expression of human ACE2 or of ACE2 orthologs from various mammals, including Chinese rufous horseshoe bat and Malayan pangolin. D614G did not alter S protein synthesis, processing, or incorporation into SARS-CoV-2 particles, but D614G affinity for ACE2 was reduced due to a faster dissociation rate. Assessment of the S protein trimer by cryo-electron microscopy showed that D614G disrupts an interprotomer contact and that the conformation is shifted toward an ACE2 binding-competent state, which is modeled to be on pathway for virion membrane fusion with target cells. Consistent with this more open conformation, neutralization potency of antibodies targeting the S protein receptor-binding domain was not attenuated.
0

Calibrating a coalescent simulation of human genome sequence variation

S. Schaffner et al.Oct 26, 2005
+3
S
C
S
Population genetic models play an important role in human genetic research, connecting empirical observations about sequence variation with hypotheses about underlying historical and biological causes. More specifically, models are used to compare empirical measures of sequence variation, linkage disequilibrium (LD), and selection to expectations under a “null” distribution. In the absence of detailed information about human demographic history, and about variation in mutation and recombination rates, simulations have of necessity used arbitrary models, usually simple ones. With the advent of large empirical data sets, it is now possible to calibrate population genetic models with genome-wide data, permitting for the first time the generation of data that are consistent with empirical data across a wide range of characteristics. We present here the first such calibrated model and show that, while still arbitrary, it successfully generates simulated data (for three populations) that closely resemble empirical data in allele frequency, linkage disequilibrium, and population differentiation. No assertion is made about the accuracy of the proposed historical and recombination model, but its ability to generate realistic data meets a long-standing need among geneticists. We anticipate that this model, for which software is publicly available, and others like it will have numerous applications in empirical studies of human genetics.
0
Citation645
0
Save
0

Searching for missing heritability: Designing rare variant association studies

Or Zuk et al.Jan 17, 2014
+7
K
S
O
Significance Discovering the genetic basis of common diseases, such as diabetes, heart disease, and schizophrenia, is a key goal in biomedicine. Genomic studies have revealed thousands of common genetic variants underlying disease, but these variants explain only a portion of the heritability. Rare variants are also likely to play an important role, but few examples are known thus far, and initial discovery efforts with small sample sizes have had only limited success. In this paper, we describe an analytical framework for the design of rare variant association studies of disease. It provides guidance with respect to sample size, as well as the roles of selection, disruptive and missense alleles, gene-specific allele frequency thresholds, isolated populations, gene sets, and coding vs. noncoding regions.
0
Citation636
0
Save
Load More