DL
Daniel Lawson
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
30
(80% Open Access)
Cited by:
4,299
h-index:
36
/
i10-index:
64
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Inference of Population Structure using Dense Haplotype Data

Daniel Lawson et al.Jan 26, 2012
The advent of genome-wide dense variation data provides an opportunity to investigate ancestry in unprecedented detail, but presents new statistical challenges. We propose a novel inference framework that aims to efficiently capture information on population structure provided by patterns of haplotype similarity. Each individual in a sample is considered in turn as a recipient, whose chromosomes are reconstructed using chunks of DNA donated by the other individuals. Results of this "chromosome painting" can be summarized as a "coancestry matrix," which directly reveals key information about ancestral relationships among individuals. If markers are viewed as independent, we show that this matrix almost completely captures the information used by both standard Principal Components Analysis (PCA) and model-based approaches such as STRUCTURE in a unified manner. Furthermore, when markers are in linkage disequilibrium, the matrix combines information across successive markers to increase the ability to discern fine-scale population structure using PCA. In parallel, we have developed an efficient model-based approach to identify discrete populations using this matrix, which offers advantages over PCA in terms of interpretability and over existing clustering algorithms in terms of speed, number of separable populations, and sensitivity to subtle population structure. We analyse Human Genome Diversity Panel data for 938 individuals and 641,000 markers, and we identify 226 populations reflecting differences on continental, regional, local, and family scales. We present multiple lines of evidence that, while many methods capture similar information among strongly differentiated groups, more subtle population structure in human populations is consistently present at a much finer level than currently available geographic labels and is only captured by the haplotype-based approach. The software used for this article, ChromoPainter and fineSTRUCTURE, is available from http://www.paintmychromosomes.com/.
0
Citation1,109
0
Save
0

The fine-scale genetic structure of the British population

Stephen Leslie et al.Mar 1, 2015
Fine-scale genetic variation between human populations is interesting as a signature of historical demographic events and because of its potential for confounding disease studies. We use haplotype-based statistical methods to analyse genome-wide single nucleotide polymorphism (SNP) data from a carefully chosen geographically diverse sample of 2,039 individuals from the United Kingdom. This reveals a rich and detailed pattern of genetic differentiation with remarkable concordance between genetic clusters and geography. The regional genetic differentiation and differing patterns of shared ancestry with 6,209 individuals from across Europe carry clear signals of historical demographic events. We estimate the genetic contribution to southeastern England from Anglo-Saxon migrations to be under half, and identify the regions not carrying genetic material from these migrations. We suggest significant pre-Roman but post-Mesolithic movement into southeastern England from continental Europe, and show that in non-Saxon parts of the United Kingdom, there exist genetically differentiated subgroups rather than a general ‘Celtic’ population. Extensive genetic analysis of over 2,000 individuals from different locations in Britain reveals striking fine-scale patterns of population structure; comparisons with similar genetic data from the European continent reveal the legacy of earlier population migrations and information about the ancestry of current populations in specific geographic regions. Genetic data have been used widely to inform our understanding of population history and migrations. Now with the advent of genome-wide analysis of single nucleotide polymorphism (SNP) data — cataloguing variation between individuals at a single position in the genome sequence — fine-scale genetic variation between human populations can be used as a signature of historical demographic events. Peter Donnelly and colleagues use such data from a selected geographically diverse sample of more than 2,000 individuals from the United Kingdom to reveal remarkable concordance between genetic clusters and geography. The results throw new light on several aspects of the peopling of Britain. For instance the genetic contribution to southeastern England from Anglo-Saxon migrations is under half, suggesting significant pre-Roman but post-Mesolithic population movement from the European continent. The data also reveal that non-Saxon regions contain genetically differentiated subgroups rather than a general 'Celtic' population.
0
Citation480
0
Save
0

Genomic analyses inform on migration events during the peopling of Eurasia

Luca Pagani et al.Sep 20, 2016
Whole-genome sequencing of individuals from 125 populations provides insight into patterns of genetic diversity, natural selection and human demographic history during the peopling of Eurasia and finds evidence for genetic vestiges of an early expansion of modern humans out of Africa in Papuans. Three international collaborations reporting in this issue of Nature describe 787 high-quality genomes from individuals from geographically diverse populations. David Reich and colleagues analysed whole-genome sequences of 300 individuals from 142 populations. Their findings include an accelerated estimated rate of accumulation of mutations in non-Africans compared to Africans since divergence, and that indigenous Australians, New Guineans and Andamanese do not derive substantial ancestry from an early dispersal of modern humans but from the same source as that of other non-Africans. Eske Willerlsev and colleagues obtained whole-genome data for 83 Aboriginal Australians and 25 Papuans from the New Guinea Highlands. They estimate that Aboriginal Australians and Papuans diverged from Eurasian populations 51,000–72,000 years ago, following a single out-of-Africa dispersal. Luca Pagani et al. report on a dataset of 483 high-coverage human genomes from 148 populations worldwide, including 379 new genomes from 125 populations. Their analyses support the model by which all non-African populations derive most of their genetic ancestry from a single recent migration out of Africa, although a Papuan contribution suggests a trace of an earlier human expansion. High-coverage whole-genome sequence studies have so far focused on a limited number1 of geographically restricted populations2,3,4,5, or been targeted at specific diseases, such as cancer6. Nevertheless, the availability of high-resolution genomic data has led to the development of new methodologies for inferring population history7,8,9 and refuelled the debate on the mutation rate in humans10. Here we present the Estonian Biocentre Human Genome Diversity Panel (EGDP), a dataset of 483 high-coverage human genomes from 148 populations worldwide, including 379 new genomes from 125 populations, which we group into diversity and selection sets. We analyse this dataset to refine estimates of continent-wide patterns of heterozygosity, long- and short-distance gene flow, archaic admixture, and changes in effective population size through time as well as for signals of positive or balancing selection. We find a genetic signature in present-day Papuans that suggests that at least 2% of their genome originates from an early and largely extinct expansion of anatomically modern humans (AMHs) out of Africa. Together with evidence from the western Asian fossil record11, and admixture between AMHs and Neanderthals predating the main Eurasian expansion12, our results contribute to the mounting evidence for the presence of AMHs out of Africa earlier than 75,000 years ago.
0
Citation378
0
Save
0

VEuPathDB: the eukaryotic pathogen, vector and host bioinformatics resource center

B. Amos et al.Oct 6, 2021
Abstract The Eukaryotic Pathogen, Vector and Host Informatics Resource (VEuPathDB, https://veupathdb.org) represents the 2019 merger of VectorBase with the EuPathDB projects. As a Bioinformatics Resource Center funded by the National Institutes of Health, with additional support from the Welllcome Trust, VEuPathDB supports &gt;500 organisms comprising invertebrate vectors, eukaryotic pathogens (protists and fungi) and relevant free-living or non-pathogenic species or hosts. Designed to empower researchers with access to Omics data and bioinformatic analyses, VEuPathDB projects integrate &gt;1700 pre-analysed datasets (and associated metadata) with advanced search capabilities, visualizations, and analysis tools in a graphic interface. Diverse data types are analysed with standardized workflows including an in-house OrthoMCL algorithm for predicting orthology. Comparisons are easily made across datasets, data types and organisms in this unique data mining platform. A new site-wide search facilitates access for both experienced and novice users. Upgraded infrastructure and workflows support numerous updates to the web interface, tools, searches and strategies, and Galaxy workspace where users can privately analyse their own data. Forthcoming upgrades include cloud-ready application architecture, expanded support for the Galaxy workspace, tools for interrogating host-pathogen interactions, and improved interactions with affiliated databases (ClinEpiDB, MicrobiomeDB) and other scientific resources, and increased interoperability with the Bacterial & Viral BRC.
0
Paper
Citation346
0
Save
Load More