JK
John Kamm
Author with expertise in Genomic Analysis of Ancient DNA
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
11
(64% Open Access)
Cited by:
2,037
h-index:
23
/
i10-index:
32
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Robust and scalable inference of population history from hundreds of unphased whole genomes

Jonathan Terhorst et al.Dec 26, 2016
Yun Song and colleagues present SMC++, a statistical method for population history inference capable of analyzing unphased whole genomes and sample sizes much larger than can be analyzed by current methods. The authors apply SMC++ to sequence data from human, Drosophila and finch populations. It has recently been demonstrated that inference methods based on genealogical processes with recombination can uncover past population history in unprecedented detail. However, these methods scale poorly with sample size, limiting resolution in the recent past, and they require phased genomes, which contain switch errors that can catastrophically distort the inferred history. Here we present SMC++, a new statistical tool capable of analyzing orders of magnitude more samples than existing methods while requiring only unphased genomes (its results are independent of phasing). SMC++ can jointly infer population size histories and split times in diverged populations, and it employs a novel spline regularization scheme that greatly reduces estimation error. We apply SMC++ to analyze sequence data from over a thousand human genomes in Africa and Eurasia, hundreds of genomes from a Drosophila melanogaster population in Africa, and tens of genomes from zebra finch and long-tailed finch populations in Australia.
0
Citation672
0
Save
0

Terminal Pleistocene Alaskan genome reveals first founding population of Native Americans

J. Moreno-Mayar et al.Jan 1, 2018
Despite broad agreement that the Americas were initially populated via Beringia, the land bridge that connected far northeast Asia with northwestern North America during the Pleistocene epoch, when and how the peopling of the Americas occurred remains unresolved. Analyses of human remains from Late Pleistocene Alaska are important to resolving the timing and dispersal of these populations. The remains of two infants were recovered at Upward Sun River (USR), and have been dated to around 11.5 thousand years ago (ka). Here, by sequencing the USR1 genome to an average coverage of approximately 17 times, we show that USR1 is most closely related to Native Americans, but falls basal to all previously sequenced contemporary and ancient Native Americans. As such, USR1 represents a distinct Ancient Beringian population. Using demographic modelling, we infer that the Ancient Beringian population and ancestors of other Native Americans descended from a single founding population that initially split from East Asians around 36 ± 1.5 ka, with gene flow persisting until around 25 ± 1.1 ka. Gene flow from ancient north Eurasians into all Native Americans took place 25-20 ka, with Ancient Beringians branching off around 22-18.1 ka. Our findings support a long-term genetic structure in ancestral Native Americans, consistent with the Beringian 'standstill model'. We show that the basal northern and southern Native American branches, to which all other Native Americans belong, diverged around 17.5-14.6 ka, and that this probably occurred south of the North American ice sheets. We also show that after 11.5 ka, some of the northern Native American populations received gene flow from a Siberian population most closely related to Koryaks, but not Palaeo-Eskimos, Inuits or Kets, and that Native American gene flow into Inuits was through northern and not southern Native American groups. Our findings further suggest that the far-northern North American presence of northern Native Americans is from a back migration that replaced or absorbed the initial founding population of Ancient Beringians.
0
Citation342
0
Save
0

Model-based detection and analysis of introgressed Neanderthal ancestry in modern humans

Matthias Steinrücken et al.Dec 1, 2017
Abstract Genetic evidence has revealed that the ancestors of modern human populations outside of Africa and their hominin sister groups, notably the Neanderthals, exchanged genetic material in the past. The distribution of these introgressed sequence-tracts along modern-day human genomes provides insight into the ancient structure and migration patterns of these archaic populations. Furthermore, it facilitates studying the selective processes that lead to the accumulation or depletion of introgressed genetic variation. Recent studies have developed methods to localize these introgressed regions, reporting long regions that are depleted of Neanderthal introgression and enriched in genes, suggesting negative selection against the Neanderthal variants. On the other hand, enriched Neanderthal ancestry in hair- and skin-related genes suggests that some introgressed variants facilitated adaptation to new environments. Here, we present a model-based method called diCal-admix and apply it to detect tracts of Neanderthal introgression in modern humans. We demonstrate its efficiency and accuracy through extensive simulations. We use our method to detect introgressed regions in modern human individuals from the 1000 Genomes Project, using a high coverage genome from a Neanderthal individual from the Altai mountains as reference. Our introgression detection results and findings concerning their functional implications are largely concordant with previous studies, and are consistent with weak selection against Neanderthal ancestry. We find some evidence that selection against Neanderthal ancestry was due to higher genetic load in Neanderthals, resulting from small effective population size, rather than Dobzhansky-Müller incompatibilities. Finally, we investigate the role of the X-chromosome in the divergence between Neanderthals and modern humans.
0
Citation1
0
Save
0

Efficiently inferring the demographic history of many populations with allele count data

John Kamm et al.Mar 23, 2018
The sample frequency spectrum (SFS), or histogram of allele counts, is an important summary statistic in evolutionary biology, and is often used to infer the history of population size changes, migrations, and other demographic events affecting a set of populations. The expected multipopulation SFS under a given demographic model can be efficiently computed when the populations in the model are related by a tree, scaling to hundreds of populations. Admixture, back-migration, and introgression are common natural processes that violate the assumption of a tree-like population history, however, and until now the expected SFS could be computed for only a handful of populations when the demographic history is not a tree. In this article, we present a new method for efficiently computing the expected SFS and linear functionals of it, for demographies described by general directed acyclic graphs. This method can scale to more populations than previously possible for complex demographic histories including admixture. We apply our method to an 8-population SFS to estimate the timing and strength of a proposed "basal Eurasian" admixture event in human history. We implement and release our method in a new open-source software package momi2.
0

Investigating Transfusion-Related Sepsis using Culture-Independent Metagenomic Sequencing

Emily Crawford et al.May 30, 2019
Background Transfusion-related sepsis remains an important hospital infection control challenge. Investigating septic transfusion events is often restricted by the limitations of bacterial culture in terms of time requirements and low yield in the setting of prior antibiotic administration.Methods In three Gram-negative septic transfusion cases, we performed mNGS of direct clinical blood specimens in addition to standard culture-based approaches utilized for infection control investigations. Pathogen detection leveraged IDSeq, a new open-access microbial bioinformatics portal. Phylogenetic analysis was performed to assess microbial genetic relatedness and understand transmission events.Results mNGS of direct clinical blood specimens afforded precision detection of pathogens responsible for each case of transfusion-related sepsis, and enabled discovery of a novel Acinetobacter species in a platelet product that had become contaminated despite photochemical pathogen reduction. In each case, longitudinal assessment of pathogen burden elucidated the temporal sequence of events associated with each transfusion-transmitted infection. We found that informative data could be obtained from culture-independent mNGS of residual platelet products and leftover blood specimens that were either unsuitable or unavailable for culture, or that failed to grow due to prior antibiotic administration. We additionally developed methods to enhance accuracy for detecting transfusion-associated pathogens sharing taxonomic similarity to contaminants commonly found in mNGS library preparations.Conclusions Culture-independent mNGS of blood products afforded rapid and precise assessment of pathogen identity, abundance and genetic relatedness. Together, these challenging cases demonstrated the potential for metagenomics to advance existing methods for investigating transfusion-transmitted infections.
3

Insights into human genetic variation and population history from 929 diverse genomes

Anders Bergström et al.Jun 27, 2019
Genome sequences from diverse human groups are needed to understand the structure of genetic variation in our species and the history of, and relationships between, different populations. We present 929 high-coverage genome sequences from 54 diverse human populations, 26 of which are physically phased using linked-read sequencing. Analyses of these genomes reveal an excess of previously undocumented private genetic variation in southern and central Africa and in Oceania and the Americas, but an absence of fixed, private variants between major geographical regions. We also find deep and gradual population separations within Africa, contrasting population size histories between hunter-gatherer and agriculturalist groups in the last 10,000 years, a potentially major population growth episode after the peopling of the Americas, and a contrast between single Neanderthal but multiple Denisovan source populations contributing to present-day human populations. We also demonstrate benefits to the study of population relationships of genome sequences over ascertained array genotypes. These genome sequences are freely available as a resource with no access or analysis restrictions.
Load More