DH
Daniel Harris
Author with expertise in Genomic Analysis of Ancient DNA
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
6
(67% Open Access)
Cited by:
1,690
h-index:
21
/
i10-index:
25
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Sequencing of 53,831 diverse genomes from the NHLBI TOPMed Program

Daniel Taliun et al.Feb 10, 2021
Abstract The Trans-Omics for Precision Medicine (TOPMed) programme seeks to elucidate the genetic architecture and biology of heart, lung, blood and sleep disorders, with the ultimate goal of improving diagnosis, treatment and prevention of these diseases. The initial phases of the programme focused on whole-genome sequencing of individuals with rich phenotypic data and diverse backgrounds. Here we describe the TOPMed goals and design as well as the available resources and early insights obtained from the sequence data. The resources include a variant browser, a genotype imputation server, and genomic and phenotypic data that are available through dbGaP (Database of Genotypes and Phenotypes) 1 . In the first 53,831 TOPMed samples, we detected more than 400 million single-nucleotide and insertion or deletion variants after alignment with the reference genome. Additional previously undescribed variants were detected through assembly of unmapped reads and customized analysis in highly variable loci. Among the more than 400 million detected variants, 97% have frequencies of less than 1% and 46% are singletons that are present in only one individual (53% among unrelated individuals). These rare variants provide insights into mutational processes and recent human evolutionary history. The extensive catalogue of genetic variation in TOPMed studies provides unique opportunities for exploring the contributions of rare and noncoding sequence variants to phenotypic variation. Furthermore, combining TOPMed haplotypes with modern imputation methods improves the power and reach of genome-wide association studies to include variants down to a frequency of approximately 0.01%.
1
Citation1,370
0
Save
0

The Mobile Element Locator Tool (MELT): population-scale mobile element discovery and biology

Eugene Gardner et al.Aug 30, 2017
Mobile element insertions (MEIs) represent ∼25% of all structural variants in human genomes. Moreover, when they disrupt genes, MEIs can influence human traits and diseases. Therefore, MEIs should be fully discovered along with other forms of genetic variation in whole genome sequencing (WGS) projects involving population genetics, human diseases, and clinical genomics. Here, we describe the Mobile Element Locator Tool (MELT), which was developed as part of the 1000 Genomes Project to perform MEI discovery on a population scale. Using both Illumina WGS data and simulations, we demonstrate that MELT outperforms existing MEI discovery tools in terms of speed, scalability, specificity, and sensitivity, while also detecting a broader spectrum of MEI-associated features. Several run modes were developed to perform MEI discovery on local and cloud systems. In addition to using MELT to discover MEIs in modern humans as part of the 1000 Genomes Project, we also used it to discover MEIs in chimpanzees and ancient (Neanderthal and Denisovan) hominids. We detected diverse patterns of MEI stratification across these populations that likely were caused by (1) diverse rates of MEI production from source elements, (2) diverse patterns of MEI inheritance, and (3) the introgression of ancient MEIs into modern human genomes. Overall, our study provides the most comprehensive map of MEIs to date spanning chimpanzees, ancient hominids, and modern humans and reveals new aspects of MEI biology in these lineages. We also demonstrate that MELT is a robust platform for MEI discovery and analysis in a variety of experimental settings.
0
Citation318
0
Save
0

Evolution of Hominin Polyunsaturated Fatty Acid Metabolism: From Africa to the New World

Daniel Harris et al.Aug 10, 2017
Background: The metabolic conversion of dietary omega-3 and omega-6 18 carbon (18C) to long chain (> 20 carbon) polyunsaturated fatty acids (LC-PUFAs) is vital for human life. Fatty acid desaturase (FADS) 1 and 2 catalyze the rate-limiting steps in the biosynthesis of LC-PUFAs. The FADS region contains two haplotypes; ancestral and derived, where the derived haplotypes are associated with more efficient LC-PUFA biosynthesis and is nearly fixed in Africa. In addition, Native American populations appear to be nearly fixed for the lesser efficient ancestral haplotype, which could be a public health problem due to associated low LC-PUFA levels, while Eurasia is polymorphic. This haplotype frequency distribution is suggestive of archaic re-introduction of the ancestral haplotype to non-African populations or ancient polymorphism with differential selection patterns across the globe. Therefore, we tested the FADS region for archaic introgression or ancient polymorphism. We specifically addressed the genetic architecture of the FADS region in Native American populations to better understand this potential public health impact. Results: We confirmed Native American ancestry is nearly fixed for the ancestral haplotype and is under positive selection. The ancestral haplotype frequency is also correlated to Siberian populations' geographic location further suggesting the ancestral haplotype's role in cold weather adaptation and leading to the high haplotype frequency within Native American populations'. We also find that the Neanderthal is more closely related to the derived haplotypes while the Denisovan clusters closer to the ancestral haplotypes. In addition, the derived haplotypes have a time to the most recent common ancestor of 688,474 years ago which is within the range of the modern-archaic hominin divergence. Conclusions: These results support an ancient polymorphism forming in the FADS gene region with differential selection pressures acting on the derived and ancestral haplotypes due to the old age of the derived haplotypes and the ancestral haplotype being under positive selection in Native American ancestry populations. Further, the near fixation of the less efficient ancestral haplotype in Native American ancestry suggests the need for future studies to explore the potential health risk of associated low LC-PUFA levels in Native American ancestry populations.
0

Sequencing of 53,831 diverse genomes from the NHLBI TOPMed Program

Daniel Taliun et al.Mar 6, 2019
The Trans-Omics for Precision Medicine (TOPMed) program seeks to elucidate the genetic architecture and disease biology of heart, lung, blood, and sleep disorders, with the ultimate goal of improving diagnosis, treatment, and prevention. The initial phases of the program focus on whole genome sequencing of individuals with rich phenotypic data and diverse backgrounds. Here, we describe TOPMed goals and design as well as resources and early insights from the sequence data. The resources include a variant browser, a genotype imputation panel, and sharing of genomic and phenotypic data via dbGaP. In 53,581 TOPMed samples, >400 million single-nucleotide and insertion/deletion variants were detected by alignment with the reference genome. Additional novel variants are detectable through assembly of unmapped reads and customized analysis in highly variable loci. Among the >400 million variants detected, 97% have frequency <1% and 46% are singletons. These rare variants provide insights into mutational processes and recent human evolutionary history. The nearly complete catalog of genetic variation in TOPMed studies provides unique opportunities for exploring the contributions of rare and non-coding sequence variants to phenotypic variation. Furthermore, combining TOPMed haplotypes with modern imputation methods improves the power and extends the reach of nearly all genome-wide association studies to include variants down to ~0.01% in frequency.