SS
Sriram Sankararaman
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
60
(65% Open Access)
Cited by:
8,441
h-index:
41
/
i10-index:
70
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The Simons Genome Diversity Project: 300 genomes from 142 diverse populations

Swapan Mallick et al.Sep 20, 2016
Here we report the Simons Genome Diversity Project data set: high quality genomes from 300 individuals from 142 diverse populations. These genomes include at least 5.8 million base pairs that are not present in the human reference genome. Our analysis reveals key features of the landscape of human genome variation, including that the rate of accumulation of mutations has accelerated by about 5% in non-Africans compared to Africans since divergence. We show that the ancestors of some pairs of present-day human populations were substantially separated by 100,000 years ago, well before the archaeologically attested onset of behavioural modernity. We also demonstrate that indigenous Australians, New Guineans and Andamanese do not derive substantial ancestry from an early dispersal of modern humans; instead, their modern human ancestry is consistent with coming from the same source as that of other non-Africans. Deep whole-genome sequencing of 300 individuals from 142 diverse populations provides insights into key population genetic parameters, shows that all modern human ancestry outside of Africa including in Australasians is consistent with descending from a single founding population, and suggests a higher rate of accumulation of mutations in non-Africans compared to Africans since divergence. Three international collaborations reporting in this issue of Nature describe 787 high-quality genomes from individuals from geographically diverse populations. David Reich and colleagues analysed whole-genome sequences of 300 individuals from 142 populations. Their findings include an accelerated estimated rate of accumulation of mutations in non-Africans compared to Africans since divergence, and that indigenous Australians, New Guineans and Andamanese do not derive substantial ancestry from an early dispersal of modern humans but from the same source as that of other non-Africans. Eske Willerlsev and colleagues obtained whole-genome data for 83 Aboriginal Australians and 25 Papuans from the New Guinea Highlands. They estimate that Aboriginal Australians and Papuans diverged from Eurasian populations 51,000–72,000 years ago, following a single out-of-Africa dispersal. Luca Pagani et al. report on a dataset of 483 high-coverage human genomes from 148 populations worldwide, including 379 new genomes from 125 populations. Their analyses support the model by which all non-African populations derive most of their genetic ancestry from a single recent migration out of Africa, although a Papuan contribution suggests a trace of an earlier human expansion.
0
Citation1,413
0
Save
0

The genomic landscape of Neanderthal ancestry in present-day humans

Sriram Sankararaman et al.Jan 28, 2014
In the modern human genome, elevated Neanderthal ancestry is found at genes affecting keratin filaments, suggesting that gene flow with Neanderthals helped modern humans to adapt to non-African environments; deficiencies of Neanderthal ancestry are also found, particularly on the X chromosome and in genes expressed highly in testes, suggesting that some Neanderthal mutations were not tolerated on a modern human genetic background as they reduced male fertility. The modern human genome contains traces of Neanderthal ancestry. But is Neanderthal DNA distributed uniformly across the human genome, or is it concentrated more in some parts than in others? Sriram Sankararaman et al. show that parts of the human genome enriched for genes affecting keratin filaments (in hair, for example) also contain a relatively high concentration of Neanderthal DNA, suggesting that this DNA helped modern humans adapt to the chillier non-African environment. On the downside, many Neanderthal-derived alleles are associated with disease risk. Other parts of the human genome contain a deficiency of Neanderthal alleles, implying their active removal in evolution. Among the 'lost' genes are a number expressed in the testis and on the X chromosome, implying that Neanderthal DNA reduced human fertility when moved to a modern human genetic background. Genomic studies have shown that Neanderthals interbred with modern humans, and that non-Africans today are the products of this mixture1,2. The antiquity of Neanderthal gene flow into modern humans means that genomic regions that derive from Neanderthals in any one human today are usually less than a hundred kilobases in size. However, Neanderthal haplotypes are also distinctive enough that several studies have been able to detect Neanderthal ancestry at specific loci1,3,4,5,6,7,8. We systematically infer Neanderthal haplotypes in the genomes of 1,004 present-day humans9. Regions that harbour a high frequency of Neanderthal alleles are enriched for genes affecting keratin filaments, suggesting that Neanderthal alleles may have helped modern humans to adapt to non-African environments. We identify multiple Neanderthal-derived alleles that confer risk for disease, suggesting that Neanderthal alleles continue to shape human biology. An unexpected finding is that regions with reduced Neanderthal ancestry are enriched in genes, implying selection to remove genetic material derived from Neanderthals. Genes that are more highly expressed in testes than in any other tissue are especially reduced in Neanderthal ancestry, and there is an approximately fivefold reduction of Neanderthal ancestry on the X chromosome, which is known from studies of diverse species to be especially dense in male hybrid sterility genes10,11,12. These results suggest that part of the explanation for genomic regions of reduced Neanderthal ancestry is Neanderthal alleles that caused decreased fertility in males when moved to a modern human genetic background.
0
Citation1,047
0
Save
1

Colocalization of GWAS and eQTL Signals Detects Target Genes

Farhad Hormozdiari et al.Nov 17, 2016
The vast majority of genome-wide association study (GWAS) risk loci fall in non-coding regions of the genome. One possible hypothesis is that these GWAS risk loci alter the individual's disease risk through their effect on gene expression in different tissues. In order to understand the mechanisms driving a GWAS risk locus, it is helpful to determine which gene is affected in specific tissue types. For example, the relevant gene and tissue could play a role in the disease mechanism if the same variant responsible for a GWAS locus also affects gene expression. Identifying whether or not the same variant is causal in both GWASs and expression quantitative trail locus (eQTL) studies is challenging because of the uncertainty induced by linkage disequilibrium and the fact that some loci harbor multiple causal variants. However, current methods that address this problem assume that each locus contains a single causal variant. In this paper, we present eCAVIAR, a probabilistic method that has several key advantages over existing methods. First, our method can account for more than one causal variant in any given locus. Second, it can leverage summary statistics without accessing the individual genotype data. We use both simulated and real datasets to demonstrate the utility of our method. Using publicly available eQTL data on 45 different tissues, we demonstrate that eCAVIAR can prioritize likely relevant tissues and target genes for a set of glucose- and insulin-related trait loci.
1
Citation620
0
Save
0

Estimating and interpreting FST: The impact of rare variants

Gaurav Bhatia et al.Jul 16, 2013
In a pair of seminal papers, Sewall Wright and Gustave Malécot introduced F ST as a measure of structure in natural populations. In the decades that followed, a number of papers provided differing definitions, estimation methods, and interpretations beyond Wright's. While this diversity in methods has enabled many studies in genetics, it has also introduced confusion regarding how to estimate F ST from available data. Considering this confusion, wide variation in published estimates of F ST for pairs of HapMap populations is a cause for concern. These estimates changed—in some cases more than twofold—when comparing estimates from genotyping arrays to those from sequence data. Indeed, changes in F ST from sequencing data might be expected due to population genetic factors affecting rare variants. While rare variants do influence the result, we show that this is largely through differences in estimation methods. Correcting for this yields estimates of F ST that are much more concordant between sequence and genotype data. These differences relate to three specific issues: (1) estimating F ST for a single SNP, (2) combining estimates of F ST across multiple SNPs, and (3) selecting the set of SNPs used in the computation. Changes in each of these aspects of estimation may result in F ST estimates that are highly divergent from one another. Here, we clarify these issues and propose solutions.
0
Citation540
0
Save
0

Sequence variants in SLC16A11 are a common risk factor for type 2 diabetes in Mexico

A. Amy et al.Dec 24, 2013
A risk haplotype for type 2 diabetes is identified with four amino acid substitutions in SLC16A11, which is present at ∼50% frequency in Native American samples and ∼10% in east Asian samples, but is rare in European and African samples; SLC16A11 may alter hepatic lipid metabolism, causing an increase in triacylglycerol levels. Genome-wide association studies (GWASs) have discovered thousands of genetic variants associated with common disease. This study demonstrates the potential of a comparative approach, whereby analysis of genetic variation in diverse populations can identify disease risk alleles that are common in one population but rare in others, with the potential to illuminate pathophysiology, health disparities, and the population genetic origins of disease alleles. The SIGMA Type 2 Diabetes Genetics Consortium undertook a GWAS for propensity to type 2 diabetes in more than 8,000 samples in a Latin American population. They identified a risk haplotype, SLC16A11, with four amino acid substitutions in the solute carrier SLC16A11, which is present at about 50% frequency in Native American samples and 10% in East Asian, but rare in European and African samples. SLC16A11 appears to alter lipid metabolism, causing an increase in intracellular triacylglycerol levels. Intriguingly, the haplotype was introduced into the modern human population via admixture with Neanderthals. Performing genetic studies in multiple human populations can identify disease risk alleles that are common in one population but rare in others1, with the potential to illuminate pathophysiology, health disparities, and the population genetic origins of disease alleles. Here we analysed 9.2 million single nucleotide polymorphisms (SNPs) in each of 8,214 Mexicans and other Latin Americans: 3,848 with type 2 diabetes and 4,366 non-diabetic controls. In addition to replicating previous findings2,3,4, we identified a novel locus associated with type 2 diabetes at genome-wide significance spanning the solute carriers SLC16A11 and SLC16A13 (P = 3.9 × 10−13; odds ratio (OR) = 1.29). The association was stronger in younger, leaner people with type 2 diabetes, and replicated in independent samples (P = 1.1 × 10−4; OR = 1.20). The risk haplotype carries four amino acid substitutions, all in SLC16A11; it is present at ∼50% frequency in Native American samples and ∼10% in east Asian, but is rare in European and African samples. Analysis of an archaic genome sequence indicated that the risk haplotype introgressed into modern humans via admixture with Neanderthals. The SLC16A11 messenger RNA is expressed in liver, and V5-tagged SLC16A11 protein localizes to the endoplasmic reticulum. Expression of SLC16A11 in heterologous cells alters lipid metabolism, most notably causing an increase in intracellular triacylglycerol levels. Despite type 2 diabetes having been well studied by genome-wide association studies in other populations, analysis in Mexican and Latin American individuals identified SLC16A11 as a novel candidate gene for type 2 diabetes with a possible role in triacylglycerol metabolism.
0
Citation467
0
Save
0

The Combined Landscape of Denisovan and Neanderthal Ancestry in Present-Day Humans

Sriram Sankararaman et al.Mar 28, 2016

Summary

 Some present-day humans derive up to ∼5% [1] of their ancestry from archaic Denisovans, an even larger proportion than the ∼2% from Neanderthals [2]. We developed methods that can disambiguate the locations of segments of Denisovan and Neanderthal ancestry in present-day humans and applied them to 257 high-coverage genomes from 120 diverse populations, among which were 20 individual Oceanians with high Denisovan ancestry [3]. In Oceanians, the average size of Denisovan fragments is larger than Neanderthal fragments, implying a more recent average date of Denisovan admixture in the history of these populations (p = 0.00004). We document more Denisovan ancestry in South Asia than is expected based on existing models of history, reflecting a previously undocumented mixture related to archaic humans (p = 0.0013). Denisovan ancestry, just like Neanderthal ancestry, has been deleterious on a modern human genetic background, as reflected by its depletion near genes. Finally, the reduction of both archaic ancestries is especially pronounced on chromosome X and near genes more highly expressed in testes than other tissues (p = 1.2 × 10−7 to 3.2 × 10−7 for Denisovan and 2.2 × 10−3 to 2.9 × 10−3 for Neanderthal ancestry even after controlling for differences in level of selective constraint across gene classes). This suggests that reduced male fertility may be a general feature of mixtures of human populations diverged by >500,000 years.
0
Citation446
0
Save
0

Evidence of widespread selection on standing variation in Europe at height-associated SNPs

Michael Turchin et al.Aug 19, 2012
Joel Hirschhorn and colleagues examine height-associated SNPs in northern- and southern-European populations. They report evidence of widespread weak selection on standing variation for height in humans. Strong signatures of positive selection at newly arising genetic variants are well documented in humans1,2,3,4,5,6,7,8, but this form of selection may not be widespread in recent human evolution9. Because many human traits are highly polygenic and partly determined by common, ancient genetic variation, an alternative model for rapid genetic adaptation has been proposed: weak selection acting on many pre-existing (standing) genetic variants, or polygenic adaptation10,11,12. By studying height, a classic polygenic trait, we demonstrate the first human signature of widespread selection on standing variation. We show that frequencies of alleles associated with increased height, both at known loci and genome wide, are systematically elevated in Northern Europeans compared with Southern Europeans (P < 4.3 × 10−4). This pattern mirrors intra-European height differences and is not confounded by ancestry or other ascertainment biases. The systematic frequency differences are consistent with the presence of widespread weak selection (selection coefficients ∼10−3–10−5 per allele) rather than genetic drift alone (P < 10−15).
0
Citation348
0
Save
Load More