YC
Yi Cai
Author with expertise in Genomic Selection in Plant and Animal Breeding
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
7
(57% Open Access)
Cited by:
4
h-index:
41
/
i10-index:
154
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
5

Long divergent haplotypes introgressed from wild sheep are associated with distinct morphological and adaptive characteristics in domestic sheep

Hong Cheng et al.May 18, 2022
Abstract The worldwide sheep population comprises more than 1000 breeds. Together, these exhibit a considerable morphological diversity, which has not been extensively investigated at the molecular level. Here, we analyze whole-genome sequencing individuals of 1,098 domestic sheep from 154 breeds, and 69 wild sheep from seven Ovis species. On average, we detected 6.8%, 1.0% and 0.2% introgressed sequence in domestic sheep originating from Iranian mouflon, urial and argali, respectively, with rare introgressions from other wild species. Interestingly, several introgressed haplotypes contributed to the morphological differentiations across sheep breeds, such as a RXFP2 haplotype from Iranian mouflon conferring the spiral horn trait, a MSRB3 haplotype from argali strongly associated with ear morphology, and a VPS13B haplotype probably originating from urial and mouflon possibly associated with facial traits. Our results reveal that introgression events from wild Ovis species contributed to the high rate of morphological differentiation in sheep breeds, but also to individual variation within breeds. We propose that long divergent haplotypes are a ubiquitous source of phenotypic variation that allows adaptation to a variable environment, and that these remain intact in the receiving population due to reduced recombination.
5
Citation2
0
Save
7

Ancient genomes redate the extinction of Sussemionus, a subgenus of Equus, to late Holocene

Dawei Cai et al.Sep 16, 2021
Abstract The exceptionally-rich fossil record available for the equid family has provided textbook examples of macroevolutionary changes. Horses, asses and zebras represent three extant subgenus of Equus lineage, while the Sussemionus subgenus is another remarkable Equus lineage ranging from North America to Ethiopia in Pleistocene. We sequenced 26 archaeological specimens from northern China in Holocene showing morphological features reminiscent of Equus ovodovi , a species representative of Sussemionus , and further confirmed them as this species by genetic analyses. Thus, we present the first high-quality complete genome of the Sussemionus that we sequenced to 12.0× depth-of-coverage and demonstrate that it survived until ∼3,500 years ago, despite the continued demographic collapse during the Last Glacial Maximum and the great human expansion in East Asia. We also confirmed the Equus phylogenetic tree, and found Sussemionus diverged from the ancestor of non-caballine equids ∼2.3-2.7 Million years ago and admixture events could have taken place between them. Our works suggest the small genetic diversity but not the enhanced inbreeding mainly limited the chances of survival of the species, and illustrates how ancient DNA can inform on extinction dynamics and the long-term resilience of species surviving in cryptic population pockets.
7
Citation2
0
Save
0

Genome sequencing of 'Fuji' apple clonal varieties reveals evolutionary history and genetic mechanism of the spur-type morphology

Yi Cai et al.May 20, 2024
Somatic variations arising during asexual reproduction can lead to the emergence of bud sports exhibiting advantageous traits, forming the basis for bud sport breeding in perennial plants. Here, we report a near-complete, fully phased genome assembly of 'Fuji' apple, enabling comprehensive identification of somatic variants across 74 clonally propagated 'Fuji' varieties. Phylogenetic analysis of 'Fuji' sport varieties indicates that the emergence of spur-type and early maturation traits results from multiple independent formation events. A number of putative functional somatic variants are identified, including one spur-type specific deletion located in the promoter of the TCP transcription factor gene MdTCP11. DNA methylation level of the deletion-associated miniature inverted-repeat transposable element is lower in the spur-type varieties compared to the standard-type varieties, while the expression of MdTCP11 is significantly higher. Overexpression of MdTCP11 in apple decreases the plant height, highlighting its important role in the development of spur-type apple varieties. This study sheds light on the 80-year cloning history of 'Fuji' and provides valuable candidate causative mutations for apple breeding.
0

Predicting protein subcellular location using learned distributed representations from a protein-protein network

Xiaoyong Pan et al.Sep 15, 2019
Functions of proteins are in general related to their subcellular locations. To identify the functions of a protein, we first need know where this protein is located. Interacting proteins tend to locate in the same subcellular location. Thus, it is imperative to take the protein-protein interactions into account for computational identification of protein subcellular locations.In this study, we present a deep learning-based method, node2loc, to predict protein subcellular location. node2loc first learns distributed representations of proteins in a protein-protein network using node2vec, which acquires representations from unlabeled data for downstream tasks. Then the learned representations are further fed into a recurrent neural network (RNN) to predict subcellular locations. Considering the severe class imbalance of different subcellular locations, Synthetic Minority Over-sampling Technique (SMOTE) is applied to artificially boost subcellular locations with few proteins.We construct a benchmark dataset with 16 subcellular locations and evaluate node2loc on this dataset. node2loc yields a Matthews correlation coefficient (MCC) value of 0.812, which outperforms other baseline methods. The results demonstrate that the learned presentations from a protein-protein network have strong discriminate ability for classifying protein subcellular locations and the RNN is a more powerful classifier than traditional machine learning models.