HY
Hui‐Yuan Yeh
Author with expertise in Genomic Analysis of Ancient DNA
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
11
(73% Open Access)
Cited by:
66
h-index:
24
/
i10-index:
40
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The Genomic Formation of Human Populations in East Asia

Chuan‐Chao Wang et al.Mar 25, 2020
+82
H
A
C
The deep population history of East Asia remains poorly understood due to a lack of ancient DNA data and sparse sampling of present-day people. We report genome-wide data from 191 individuals from Mongolia, northern China, Taiwan, the Amur River Basin and Japan dating to 6000 BCE – 1000 CE, many from contexts never previously analyzed with ancient DNA. We also report 383 present-day individuals from 46 groups mostly from the Tibetan Plateau and southern China. We document how 6000-3600 BCE people of Mongolia and the Amur River Basin were from populations that expanded over Northeast Asia, likely dispersing the ancestors of Mongolic and Tungusic languages. In a time transect of 89 Mongolians, we reveal how Yamnaya steppe pastoralist spread from the west by 3300-2900 BCE in association with the Afanasievo culture, although we also document a boy buried in an Afanasievo barrow with ancestry entirely from local Mongolian hunter-gatherers, representing a unique case of someone of entirely non-Yamnaya ancestry interred in this way. The second spread of Yamnaya-derived ancestry came via groups that harbored about a third of their ancestry from European farmers, which nearly completely displaced unmixed Yamnaya-related lineages in Mongolia in the second millennium BCE, but did not replace Afanasievo lineages in western China where Afanasievo ancestry persisted, plausibly acting as the source of the early-splitting Tocharian branch of Indo-European languages. Analyzing 20 Yellow River Basin farmers dating to ∼3000 BCE, we document a population that was a plausible vector for the spread of Sino-Tibetan languages both to the Tibetan Plateau and to the central plain where they mixed with southern agriculturalists to form the ancestors of Han Chinese. We show that the individuals in a time transect of 52 ancient Taiwan individuals spanning at least 1400 BCE to 600 CE were consistent with being nearly direct descendants of Yangtze Valley first farmers who likely spread Austronesian, Tai-Kadai and Austroasiatic languages across Southeast and South Asia and mixing with the people they encountered, contributing to a four-fold reduction of genetic differentiation during the emergence of complex societies. We finally report data from Jomon hunter-gatherers from Japan who harbored one of the earliest splitting branches of East Eurasian variation, and show an affinity among Jomon, Amur River Basin, ancient Taiwan, and Austronesian-speakers, as expected for ancestry if they all had contributions from a Late Pleistocene coastal route migration to East Asia.
0
Citation31
0
Save
0

The Genomic Formation of Human Populations in East Asia

Chuan‐Chao Wang et al.Mar 25, 2020
+83
H
A
C
3月26日,我校社会与人类学院王传超教授作为第一作者和通讯作者,与哈佛医学院、哈佛大学人类学系、德国马普人类历史科学研究所、南洋理工大学人文学院、复旦大学、俄罗斯远东联邦大学科学博物馆、西安交通大学、蒙古国国家博物馆研究中心、乌兰巴托国立大学考古系、维也纳大学进化人类学系、华盛顿大学人类学系、台湾成功大学考古所、加州大学人类学系等全球41个单位的77位共同作者组成的国际合作团队在bioRxiv上发表预印本论文“The Genomic Formation of Human Populations in East Asia”,发布了东亚地区最大规模的古人基因组研究,包含了191个距今8000到1000年前古人基因组捕获测序,涵盖了陕北新石器时代五庄果墚遗址、台湾新石器到铁器时代汉本和公馆遗址、蒙古国50余个考古遗址、俄罗斯远东地区Boisman、Yankovsky和黑水靺鞨等遗址、日本绳文人遗址等,研究人员还报道了46个现代族群的383个样本的芯片分型数据以及94个考古碳十四测年数据,首次通过古DNA精细解析东亚人群8000年来的起源、迁徙和混合历史,也改变了东亚地区尤其是中国境内考古基因组学研究长期滞后的局面。
0
Citation22
0
Save
6

Genomic insights into the differentiated population admixture structure and demographic history of North East Asians

Guanglin He et al.Jul 20, 2021
+25
X
M
G
ABSTRACT North China and South Siberia, mainly populated by Altaic-speaking populations, possess extensive ethnolinguistic diversity and serve as the crossroad for the initial peopling of America and western-eastern trans-continental communication. Yet, the complex scenarios of genetic origin, population structure, and admixture history of North-East Asia remain to be fully characterized, especially for Mongolic people in China with a genome-wide perspective. Thus, we genotyped genome-wide SNPs for 510 individuals from 38 Chinese Mongolic, Tungusic, and Sinitic populations to explore the sharing alleles and haplotypes within the studied groups and following merged it with 3508 modern and ancient Eurasian individuals to reconstruct the deep evolutionary and natural selection history of northern East Asians. We identified significant substructures within Altaic-speaking populations with the primary common ancestry linked to the Neolithic northern East Asians: Western Turkic people harbored more western Eurasian ancestry; Northern Mongolic people in Siberia and eastern Tungusic people in Amur River Basin (ARB) possessed dominant Neolithic Mongolian Plateau (MP) or ARB ancestry; Southern Mongolic people in China owned obvious genetic impact from Neolithic Yellow River Basin (YRB) farmers. Additionally, we found the differentiated admixture history between western and eastern Mongolians and geographically close Northeast Hans: the former received a genetic impact from western Eurasians and the latter retained the dominant YRB and ARB Neolithic ancestry. Moreover, we demonstrated that Kalmyk people from the northern Caucasus Mountain possessed a strong genetic affinity with Neolithic MP people, supporting the hypothesis of their eastern Eurasian origin and long-distance migration history. We also illuminated that historic pastoral empires in the MP contributed considerably to the gene pool of northern Mongolic people but rarely to southern ones. We finally found natural signatures in Mongolians associated with alcohol metabolism. Generally, our results not only illuminated that complex population migration and admixture of Neolithic ancestral sources from the MP or ARB played an important role in the spread of Altaic-speaking populations and Proto-Altaic language, which partly supported the Northeast Asia-origin hypothesis, but also demonstrated that the observed multi-sources of genetic diversity contributed significantly to the modern existing extensive ethnolinguistic diversity in North-East Asia.
6
Citation4
0
Save
2

Demographic model and biological adaptation inferred from the genome-wide SNP data reveal tripartite origins of southernmost Chinese Huis

Guanglin He et al.Oct 19, 2021
+12
H
X
G
The culturally unique Sanya Hui (SYH) people are regarded as the descendants of ancient Cham people in Central Vietnam (CV) and exhibit a scenario of complex migration and admixture history, who were likely to first migrate from Central and South Asia (CSA) to CV and then to South Hainan and finally assimilated with indigenous populations and resided in the tropical island environments since then. A long-standing hypothesis posits that SYH derives from different genetic and cultural origins, which hypothesizes that SYH people are different from the genetically attested admixture history of northern Hui people possessing major Han-related ancestry and minor western Eurasian ancestry. However, the effect of the cultural admixture from CSA and East Asia (EA) on the genetic admixture of SYH people remains unclear. Here, we reported the first batch of genome-wide SNP data from 94 SYH people from Hainan and comprehensively characterized their genetic structure, origin, and admixture history. Our results found that SYH people were genetically different from the northern Chinese Hui people and harbored a close genomic affinity with indigenous Vietnamese but a distinct relationship with Cham, which confirmed the hypothesis of documented recent historical migration from CV and assimilation with Hainan indigenous people. The fitted admixture models and reconstructed demographic frameworks revealed an additional influx of CSA and EA ancestries during the historical period, consisting of the frequent cultural communication along the Southern Maritime Silk Road and extensive interaction with EA. Analyses focused on natural-selected signatures of SYH people revealed a similar pattern with mainland East Asians, which further confirmed the possibility of admixture-induced biological adaptation of island environments. Generally, three genetically attested ancestries from CV, EA, and CSA in modern SYH people supported their tripartite model of genomic origins.
2
Citation2
0
Save
3

The northern gene flow into southeastern East Asians inferred from genome-wide array genotyping

Guanglin He et al.Jul 26, 2021
+26
H
X
G
ABSTRACT The population history of Southeast China remains poorly understood due to the sparse sampling of present-day populations and far less modeling with ancient genomic data. We here newly reported genome-wide genotyping data from 207 present-day Han Chinese and Hmong-Mien-speaking She people from Fujian and Taiwan, southeast China. We co-analyzed with 66 early-Neolithic to Iron-Age ancient Fujian and Taiwan individuals obtained from literature to explore the genetic continuity and admixture based on the genetic variations of high-resolution time transect. We found the genetic differentiation between northern and southern East Asians defined by a north-south East Asian genetic cline and the studied southern East Asians were clustered in the southern end of this cline. We also found that southeastern coastal continental modern East Asians harbored the genetic differentiation with other southern Tai-Kadai, Hmong-Mien, Austronesian and Austroasiatic speakers, as well as geographically close Neolithic-to-Iron Age populations, but relatedly close to post-Neolithic Yellow River ancients, which suggested the influence of southward gene flow on the modern southern coastal gene pool. Besides, we also identified one new Hmong-Mien genetic cline in East Asia with the coastal Fujian She localizing at the intersection position between Hmong-Mien and Han clines in the principal component analysis. She people show stronger genetic affinity with southern East Asian indigenous populations with the main ancestry deriving from Hanben-related populations. The southeastern Han Chinese could be modeled with the primary ancestry deriving from the group related to the Yellow River Basin millet farmers and the remaining from groups related to southeastern ancient indigenous rice farmers, which was consistent with the northern China origin of modern southeastern Han Chinese and in line with the historically and archaeologically attested southward migrations of Han people and their ancestors. Interestingly, f 4 -statistics and three-way admixture model results showed both coastal ancient sources related to Austronesian speakers and inland ancient sources related to Austroasiatic speakers complexed the modern observed fine-scale genetic structure here. Our estimated north-south admixture time ranges based on the decay of the linkage disequilibrium spanned from the Bronze age to historic periods, suggesting the recent large-scale population migrations and subsequent admixture participated in the formation of modern Han in Southeast Asia.
3
Citation2
0
Save
4

Genomic history and forensic characteristics of Sherpa highlanders on the Tibetan Plateau inferred from high-resolution genome-wide InDels and SNPs

Mengge Wang et al.Jun 24, 2021
+16
X
Y
M
Abstract Sherpa people, one of the high-altitude hypoxic adaptive populations, mainly reside in Nepal and the southern Tibet Autonomous Region. The genetic origin and detailed evolutionary profiles of Sherpas remain to be further explored and comprehensively characterized. Here we analyzed the newly-generated InDel genotype data from 628 Dingjie Sherpa people by merging with 4222 worldwide InDel profiles and collected genome-wide SNP data (approximately 600K SNPs) from 3324 individuals in 382 modern and ancient populations to explore and reconstruct the fine-scale genetic structure of Sherpas and their relationships with nearby modern and ancient East Asians based on the shared alleles and haplotypes. The forensic parameters of 57 autosomal InDels (A-InDels) included in our used new-generation InDel amplification system showed that this updated InDel panel is informative and polymorphic in Sherpas, suggesting that it can be used as the supplementary tool for forensic personal identification and parentage testing in the highland East Asians. Descriptive findings from the PCA, ADMIXTURE and TreeMix-based phylogeny suggested that Sherpas showed excess allele sharing with neighboring Tibeto-Burman Tibetans. Furthermore, patterns of allele sharing in f -statistics demonstrated that Sherpa people had a different evolutionary history compared with their neighbors from Nepal (Newar and Gurung) but showed genetic similarity with 2700-year-old Chokhopani and modern Tibet Tibetans. QpAdm/qpGraph -based admixture sources and models further showed that Sherpa, core Tibetans and Chokhopani formed one clade which could be fitted as having the main ancestry from late Neolithic Qijia millet farmers and other deep ancestries from early Asians. Chromosome painting profiles and shared IBD fragments inferred from FineStructure and ChromoPainter not only confirmed the abovementioned genomic affinity patterns but also revealed the fine-scale microstructures among Sino-Tibetan speakers. Finally, natural-selection signals revealed via iHS, nSL, and iHH12 showed signatures associated with disease susceptibility in Sherpa people. Generally, we provided the comprehensive landscape of admixture and evolutionary history of Sherpa people based on the shared alleles and haplotypes from the low-density forensic markers and high-density genome-wide SNP data. The more detailed genetic landscape of Sherpa people should be further confirmed and characterized via ancient genomes or single-molecule real-time sequencing technology.
4
Citation2
0
Save
1

Genomic insights into the population history and biological adaptation of Southwestern Chinese Hmong-Mien people

Yan Liu et al.Oct 16, 2021
+13
C
M
Y
Abstract Hmong-Mien-speaking (HM) populations, widely distributed in South China, North of Thailand, Laos and Vietnam, have experienced different settlement environments, dietary habits and pathogen exposure. However, their specific biological adaptation also remained largely uncharacterized, which is important in the population evolutionary genetics and Trans-Omics for regional Precision Medicine. Besides, the origin and genetic diversity of HM people and their phylogenetic relationship with surrounding modern and ancient populations are unknown. Here, we reported genome-wide SNPs in 52 representative Miao people and combined them with 144 HM people from 13 geographically representative populations to characterize the full genetic admixture and adaptive landscape of HM speakers. We found that obvious genetic substructures existed in geographically different HM populations and also identified one new ancestral lineage specifically exited in HM people, which spatially distributed from Sichuan and Guizhou in the North to Thailand in the South and temporally dated to at least 500 years. The sharing patterns of the newly-identified homogeneous ancestry component combined the estimated admixture times via the decay of Linkage Disequilibrium and haplotype sharing in GLOBETROTTER suggested that the modern HM-speaking populations originated from Southwest China and migrated southward recently, which is consistent with the reconstructed phenomena of linguistic and archeological documents. Additionally, we identified specific adaptive signatures associated with several important human nervous system biological functions. Our pilot work emphasized the importance of anthropologically-informed sampling and deeply genetic structure reconstruction via whole-genome sequencing in the next step in the deep Chinese population genomic diversity project (CPGDP), especially in the ethnolinguistic regions.
1
Citation1
0
Save
6

New insights from the combined discrimination of modern/ancient genome-wide shared alleles and haplotypes: Differentiated demographic history reconstruction of Tai-Kadai and Sinitic people in South China

Mengge Wang et al.Jun 22, 2021
+18
X
G
M
Abstract Southern China was a region with mixed rice-millet farming during the Middle Neolithic period and also suggested to be the homeland of Tai-Kadai-speaking (TK) people. The archaeological evidence of animal and plant domestication has demonstrated that southern Chinese rice agriculturalists dispersed from the Yangtze River basin with the dissemination of TK, Austroasiatic (AA), Austronesian (AN) and Hmong-Mien (HM) languages. However, the formations of the inland TK-speaking people, central/southern Han Chinese and their relationships with Neolithic farmers from the Yangtze and Yellow Rivers (YR) basins are far from clear due to the limited sampling of South China. Here, we revealed the spatiotemporal demographic history of southern China by analyzing newly generated genome-wide data of 70 southeastern mainland TK speakers including Dong, Gelao and Bouyei and 45 southwestern Han Chinese together with comprehensive modern/ancient reference datasets. Southwest Han Chinese and Gelao demonstrated a closer genomic affinity to Neolithic YR farmers, while inland TKs (Dong and Bouyei) demonstrated a closer genomic affinity to coastal TK/AN-speaking islanders and Neolithic Yangtze farmers and their descendants. The shared genetic drift between inland TK/AN speaker highlighted a common origin of AN/TK groups, which may be descended from Tanshishan people or their predecessors (Xitoucun). Additionally, we found that inland TK/Sinitic could be modelled as an admixture of ancestral northern East Asian (ANEA) and ancestral southern East Asian (ASEA) sources with different proportions, in which the ANEA was phylogenetically closer to Neolithic millet farmers deriving from the YR Basin and the ASEA was phylogenetically closer to Coastal Neolithic-to-modern southern East Asians. Finally, we discovered genetic differentiation among TK people from southern China and Southeast Asia and obvious substructures between northern and southern inland Chinese TK people. The observed patterns of the spatiotemporal distribution of the northern and southern East Asian lineages in Central/southern China were also compatible with the scenario of bi-directional gene flow events from ANEA and ASEA. Conclusively, multiple lines of genomic evidence indicated millet farmers deriving from the YR basin and rice farmers deriving from the Yangtze River basin substantially contributed to the present-day mainland TK speakers and Central/southern Han Chinese, and formed the modern dual genetic admixture profile.
6
Citation1
0
Save
2

Massively parallel sequencing of 165 ancestry-informative SNPs and forensic biogeographical ancestry inference in three southern Chinese Sinitic/Tai-Kadai populations

Guanglin He et al.Dec 6, 2020
+8
H
X
G
Ancestry informative markers (AIMs), which are distributed throughout the human genome, harbor significant allele frequency differences among diverse ethnic groups. The use of sets of AIMs to reconstruct population history and genetic relationships is attracting interest in the forensic community, because biogeographic ancestry information for a casework sample can potentially be predicted and used to guide the investigative process. However, subpopulation ancestry inference within East Asia remains in its infancy due to a lack of population reference data collection and incomplete validation work on newly developed or commercial AIM sets. In the present study, 316 Chinese persons, including 85 Sinitic-speaking Haikou Han, 120 Qiongzhong Hlai and 111 Daozhen Gelao individuals belonging to Tai-Kadai-speaking populations, were analyzed using the Precision ID Ancestry Panel (165 AISNPs). Combined with our previous 165-AISNP data (375 individuals from 6 populations), the 1000 Genomes Project and forensic literature, comprehensive population genetic comparisons and ancestry inference were further performed via ADMIXTURE, TreeMix, PCA, -statistics and N-J tree. Although several nonpolymorphic loci were identified in the three southern Chinese populations, the forensic parameters of this ancestry inference panel were better than those for the 23 STR-based Huaxia Platinum System, which is suitable for use as a robust tool in forensic individual identification and parentage testing. The results based on the ancestry assignment and admixture proportion evaluation revealed that this panel could be used successfully to assign individuals at a continental scale but also possessed obvious limitations in discriminatory power in intercontinental individuals, especially for European-Asian admixed Uyghurs or in populations lacking reference databases. Population genetic analyses further revealed five continental population clusters and three East Asian-focused population subgroups, which is consistent with linguistic affiliations. Ancestry composition and multiple phylogenetic analysis further demonstrated that the geographically isolated Qiongzhong Hlai harbored a close phylogenetic relationship with Austronesian speakers and possessed a homogenous Tai-Kadai-dominant ancestry, which could be used as the ancestral source proxy in population history reconstruction of Tai-Kadai-speaking populations and as one of the representatives for forensic database establishment. In summary, more population-specific AIM sets focused on East Asian subpopulations, comprehensive algorithms and high-coverage population reference data should be developed and validated in the next step.
Load More