HY
Harry Yeh
Author with expertise in Genomic Analysis of Ancient DNA
Oregon State University, Nanyang Technological University, University of Maryland, College Park
+ 7 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
8
(75% Open Access)
Cited by:
40
h-index:
34
/
i10-index:
73
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The Genomic Formation of Human Populations in East Asia

Chuan‐Chao Wang et al.May 6, 2020
+74
A
H
C
The deep population history of East Asia remains poorly understood due to a lack of ancient DNA data and sparse sampling of present-day people. We report genome-wide data from 191 individuals from Mongolia, northern China, Taiwan, the Amur River Basin and Japan dating to 6000 BCE – 1000 CE, many from contexts never previously analyzed with ancient DNA. We also report 383 present-day individuals from 46 groups mostly from the Tibetan Plateau and southern China. We document how 6000-3600 BCE people of Mongolia and the Amur River Basin were from populations that expanded over Northeast Asia, likely dispersing the ancestors of Mongolic and Tungusic languages. In a time transect of 89 Mongolians, we reveal how Yamnaya steppe pastoralist spread from the west by 3300-2900 BCE in association with the Afanasievo culture, although we also document a boy buried in an Afanasievo barrow with ancestry entirely from local Mongolian hunter-gatherers, representing a unique case of someone of entirely non-Yamnaya ancestry interred in this way. The second spread of Yamnaya-derived ancestry came via groups that harbored about a third of their ancestry from European farmers, which nearly completely displaced unmixed Yamnaya-related lineages in Mongolia in the second millennium BCE, but did not replace Afanasievo lineages in western China where Afanasievo ancestry persisted, plausibly acting as the source of the early-splitting Tocharian branch of Indo-European languages. Analyzing 20 Yellow River Basin farmers dating to ∼3000 BCE, we document a population that was a plausible vector for the spread of Sino-Tibetan languages both to the Tibetan Plateau and to the central plain where they mixed with southern agriculturalists to form the ancestors of Han Chinese. We show that the individuals in a time transect of 52 ancient Taiwan individuals spanning at least 1400 BCE to 600 CE were consistent with being nearly direct descendants of Yangtze Valley first farmers who likely spread Austronesian, Tai-Kadai and Austroasiatic languages across Southeast and South Asia and mixing with the people they encountered, contributing to a four-fold reduction of genetic differentiation during the emergence of complex societies. We finally report data from Jomon hunter-gatherers from Japan who harbored one of the earliest splitting branches of East Eurasian variation, and show an affinity among Jomon, Amur River Basin, ancient Taiwan, and Austronesian-speakers, as expected for ancestry if they all had contributions from a Late Pleistocene coastal route migration to East Asia.
0
Paper
Citation31
0
Save
6

Genomic insights into the differentiated population admixture structure and demographic history of North East Asians

Guanglin He et al.Oct 24, 2023
+23
X
M
G
ABSTRACT North China and South Siberia, mainly populated by Altaic-speaking populations, possess extensive ethnolinguistic diversity and serve as the crossroad for the initial peopling of America and western-eastern trans-continental communication. Yet, the complex scenarios of genetic origin, population structure, and admixture history of North-East Asia remain to be fully characterized, especially for Mongolic people in China with a genome-wide perspective. Thus, we genotyped genome-wide SNPs for 510 individuals from 38 Chinese Mongolic, Tungusic, and Sinitic populations to explore the sharing alleles and haplotypes within the studied groups and following merged it with 3508 modern and ancient Eurasian individuals to reconstruct the deep evolutionary and natural selection history of northern East Asians. We identified significant substructures within Altaic-speaking populations with the primary common ancestry linked to the Neolithic northern East Asians: Western Turkic people harbored more western Eurasian ancestry; Northern Mongolic people in Siberia and eastern Tungusic people in Amur River Basin (ARB) possessed dominant Neolithic Mongolian Plateau (MP) or ARB ancestry; Southern Mongolic people in China owned obvious genetic impact from Neolithic Yellow River Basin (YRB) farmers. Additionally, we found the differentiated admixture history between western and eastern Mongolians and geographically close Northeast Hans: the former received a genetic impact from western Eurasians and the latter retained the dominant YRB and ARB Neolithic ancestry. Moreover, we demonstrated that Kalmyk people from the northern Caucasus Mountain possessed a strong genetic affinity with Neolithic MP people, supporting the hypothesis of their eastern Eurasian origin and long-distance migration history. We also illuminated that historic pastoral empires in the MP contributed considerably to the gene pool of northern Mongolic people but rarely to southern ones. We finally found natural signatures in Mongolians associated with alcohol metabolism. Generally, our results not only illuminated that complex population migration and admixture of Neolithic ancestral sources from the MP or ARB played an important role in the spread of Altaic-speaking populations and Proto-Altaic language, which partly supported the Northeast Asia-origin hypothesis, but also demonstrated that the observed multi-sources of genetic diversity contributed significantly to the modern existing extensive ethnolinguistic diversity in North-East Asia.
6
Citation4
0
Save
3

The northern gene flow into southeastern East Asians inferred from genome-wide array genotyping

Guanglin He et al.Oct 24, 2023
+22
X
Y
G
ABSTRACT The population history of Southeast China remains poorly understood due to the sparse sampling of present-day populations and far less modeling with ancient genomic data. We here newly reported genome-wide genotyping data from 207 present-day Han Chinese and Hmong-Mien-speaking She people from Fujian and Taiwan, southeast China. We co-analyzed with 66 early-Neolithic to Iron-Age ancient Fujian and Taiwan individuals obtained from literature to explore the genetic continuity and admixture based on the genetic variations of high-resolution time transect. We found the genetic differentiation between northern and southern East Asians defined by a north-south East Asian genetic cline and the studied southern East Asians were clustered in the southern end of this cline. We also found that southeastern coastal continental modern East Asians harbored the genetic differentiation with other southern Tai-Kadai, Hmong-Mien, Austronesian and Austroasiatic speakers, as well as geographically close Neolithic-to-Iron Age populations, but relatedly close to post-Neolithic Yellow River ancients, which suggested the influence of southward gene flow on the modern southern coastal gene pool. Besides, we also identified one new Hmong-Mien genetic cline in East Asia with the coastal Fujian She localizing at the intersection position between Hmong-Mien and Han clines in the principal component analysis. She people show stronger genetic affinity with southern East Asian indigenous populations with the main ancestry deriving from Hanben-related populations. The southeastern Han Chinese could be modeled with the primary ancestry deriving from the group related to the Yellow River Basin millet farmers and the remaining from groups related to southeastern ancient indigenous rice farmers, which was consistent with the northern China origin of modern southeastern Han Chinese and in line with the historically and archaeologically attested southward migrations of Han people and their ancestors. Interestingly, f 4 -statistics and three-way admixture model results showed both coastal ancient sources related to Austronesian speakers and inland ancient sources related to Austroasiatic speakers complexed the modern observed fine-scale genetic structure here. Our estimated north-south admixture time ranges based on the decay of the linkage disequilibrium spanned from the Bronze age to historic periods, suggesting the recent large-scale population migrations and subsequent admixture participated in the formation of modern Han in Southeast Asia.
2

Demographic model and biological adaptation inferred from the genome-wide SNP data reveal tripartite origins of southernmost Chinese Huis

Guanglin He et al.Oct 24, 2023
+11
X
Z
G
The culturally unique Sanya Hui (SYH) people are regarded as the descendants of ancient Cham people in Central Vietnam (CV) and exhibit a scenario of complex migration and admixture history, who were likely to first migrate from Central and South Asia (CSA) to CV and then to South Hainan and finally assimilated with indigenous populations and resided in the tropical island environments since then. A long-standing hypothesis posits that SYH derives from different genetic and cultural origins, which hypothesizes that SYH people are different from the genetically attested admixture history of northern Hui people possessing major Han-related ancestry and minor western Eurasian ancestry. However, the effect of the cultural admixture from CSA and East Asia (EA) on the genetic admixture of SYH people remains unclear. Here, we reported the first batch of genome-wide SNP data from 94 SYH people from Hainan and comprehensively characterized their genetic structure, origin, and admixture history. Our results found that SYH people were genetically different from the northern Chinese Hui people and harbored a close genomic affinity with indigenous Vietnamese but a distinct relationship with Cham, which confirmed the hypothesis of documented recent historical migration from CV and assimilation with Hainan indigenous people. The fitted admixture models and reconstructed demographic frameworks revealed an additional influx of CSA and EA ancestries during the historical period, consisting of the frequent cultural communication along the Southern Maritime Silk Road and extensive interaction with EA. Analyses focused on natural-selected signatures of SYH people revealed a similar pattern with mainland East Asians, which further confirmed the possibility of admixture-induced biological adaptation of island environments. Generally, three genetically attested ancestries from CV, EA, and CSA in modern SYH people supported their tripartite model of genomic origins.
2
Citation2
0
Save
1

Genomic insights into the population history and biological adaptation of Southwestern Chinese Hmong-Mien people

Yan Liu et al.Oct 24, 2023
+12
M
J
Y
Abstract Hmong-Mien-speaking (HM) populations, widely distributed in South China, North of Thailand, Laos and Vietnam, have experienced different settlement environments, dietary habits and pathogen exposure. However, their specific biological adaptation also remained largely uncharacterized, which is important in the population evolutionary genetics and Trans-Omics for regional Precision Medicine. Besides, the origin and genetic diversity of HM people and their phylogenetic relationship with surrounding modern and ancient populations are unknown. Here, we reported genome-wide SNPs in 52 representative Miao people and combined them with 144 HM people from 13 geographically representative populations to characterize the full genetic admixture and adaptive landscape of HM speakers. We found that obvious genetic substructures existed in geographically different HM populations and also identified one new ancestral lineage specifically exited in HM people, which spatially distributed from Sichuan and Guizhou in the North to Thailand in the South and temporally dated to at least 500 years. The sharing patterns of the newly-identified homogeneous ancestry component combined the estimated admixture times via the decay of Linkage Disequilibrium and haplotype sharing in GLOBETROTTER suggested that the modern HM-speaking populations originated from Southwest China and migrated southward recently, which is consistent with the reconstructed phenomena of linguistic and archeological documents. Additionally, we identified specific adaptive signatures associated with several important human nervous system biological functions. Our pilot work emphasized the importance of anthropologically-informed sampling and deeply genetic structure reconstruction via whole-genome sequencing in the next step in the deep Chinese population genomic diversity project (CPGDP), especially in the ethnolinguistic regions.
2

Massively parallel sequencing of 165 ancestry-informative SNPs and forensic biogeographical ancestry inference in three southern Chinese Sinitic/Tai-Kadai populations

Guanglin He et al.Dec 29, 2020
+7
M
J
G
Ancestry informative markers (AIMs), which are distributed throughout the human genome, harbor significant allele frequency differences among diverse ethnic groups. The use of sets of AIMs to reconstruct population history and genetic relationships is attracting interest in the forensic community, because biogeographic ancestry information for a casework sample can potentially be predicted and used to guide the investigative process. However, subpopulation ancestry inference within East Asia remains in its infancy due to a lack of population reference data collection and incomplete validation work on newly developed or commercial AIM sets. In the present study, 316 Chinese persons, including 85 Sinitic-speaking Haikou Han, 120 Qiongzhong Hlai and 111 Daozhen Gelao individuals belonging to Tai-Kadai-speaking populations, were analyzed using the Precision ID Ancestry Panel (165 AISNPs). Combined with our previous 165-AISNP data (375 individuals from 6 populations), the 1000 Genomes Project and forensic literature, comprehensive population genetic comparisons and ancestry inference were further performed via ADMIXTURE, TreeMix, PCA, -statistics and N-J tree. Although several nonpolymorphic loci were identified in the three southern Chinese populations, the forensic parameters of this ancestry inference panel were better than those for the 23 STR-based Huaxia Platinum System, which is suitable for use as a robust tool in forensic individual identification and parentage testing. The results based on the ancestry assignment and admixture proportion evaluation revealed that this panel could be used successfully to assign individuals at a continental scale but also possessed obvious limitations in discriminatory power in intercontinental individuals, especially for European-Asian admixed Uyghurs or in populations lacking reference databases. Population genetic analyses further revealed five continental population clusters and three East Asian-focused population subgroups, which is consistent with linguistic affiliations. Ancestry composition and multiple phylogenetic analysis further demonstrated that the geographically isolated Qiongzhong Hlai harbored a close phylogenetic relationship with Austronesian speakers and possessed a homogenous Tai-Kadai-dominant ancestry, which could be used as the ancestral source proxy in population history reconstruction of Tai-Kadai-speaking populations and as one of the representatives for forensic database establishment. In summary, more population-specific AIM sets focused on East Asian subpopulations, comprehensive algorithms and high-coverage population reference data should be developed and validated in the next step.
0

The Genomic Formation of Human Populations in East Asia

Chuan‐Chao Wang et al.Oct 24, 2023
+75
H
C
3月26日,我校社会与人类学院王传超教授作为第一作者和通讯作者,与哈佛医学院、哈佛大学人类学系、德国马普人类历史科学研究所、南洋理工大学人文学院、复旦大学、俄罗斯远东联邦大学科学博物馆、西安交通大学、蒙古国国家博物馆研究中心、乌兰巴托国立大学考古系、维也纳大学进化人类学系、华盛顿大学人类学系、台湾成功大学考古所、加州大学人类学系等全球41个单位的77位共同作者组成的国际合作团队在bioRxiv上发表预印本论文“The Genomic Formation of Human Populations in East Asia”,发布了东亚地区最大规模的古人基因组研究,包含了191个距今8000到1000年前古人基因组捕获测序,涵盖了陕北新石器时代五庄果墚遗址、台湾新石器到铁器时代汉本和公馆遗址、蒙古国50余个考古遗址、俄罗斯远东地区Boisman、Yankovsky和黑水靺鞨等遗址、日本绳文人遗址等,研究人员还报道了46个现代族群的383个样本的芯片分型数据以及94个考古碳十四测年数据,首次通过古DNA精细解析东亚人群8000年来的起源、迁徙和混合历史,也改变了东亚地区尤其是中国境内考古基因组学研究长期滞后的局面。
1

Genetic admixture history and forensic characteristics of Tibeto-Burman-speaking Qiang people explored via the newly developed Y-STR panel and genome-wide SNP data

Guanglin He et al.Oct 24, 2023
+7
M
A
G
ABSTRACT Fine-scale patterns of population genetic structure and diversity of ethnolinguistically diverse populations are important for biogeographical ancestry inference, kinship testing and also for the development and validation of new kits focused on forensic personal identification. Analyses focused on forensic markers and genome-wide SNP data can provide new insights into the origin, admixture processes and forensic characteristics of targeted populations. Qiang people with a large sample size among Tibeto-Burman-speaking populations widely reside in the middle latitude of the Tibetan Plateau. However, their genetic structure and forensic features have remained uncharacterized due to the paucity of comprehensive genetic analyses. Here, we first developed and validated the AGCU-Y30 Y-STR panel, which contains slowly and moderately mutating Y-STRs, and then we conducted comprehensive population genetic analyses based on Y-STRs and genome-wide SNPs to explore the admixture history of Qiang people and their neighbours. The validated results of this panel showed that the new Y-STR kit was sensitive and robust enough for forensic applications. Haplotype diversity (HD) ranging from 0.9932 to 0.9996 and allelic frequencies ranging from 0.001946 to 0.8326 in 514 Qiang people demonstrated that all included markers were highly polymorphic in Tibeto-Burman people. Population genetic analyses based on Y-STRs (R ST , F ST , MDS, NJ, PCA and MJNs) revealed that the Qiang people harboured a paternally close relationship with lowland Tibetan-Yi corridor populations. Furthermore, we made a comprehensive population admixture analysis among Eurasian modern and ancient populations based on the shared alleles. We determined that the Qiang people were a genetically admixed population and showed the closest relationship with Tibetan and Neolithic Yellow River farmers. Admixture modelling showed that Qiang people shared the primary ancestry with Tibetan and was derived from North China, supporting the hypothesis of common origin between Tibetan and Qiang people.