YZ
Yaping Zhang
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
15
(47% Open Access)
Cited by:
23
h-index:
90
/
i10-index:
785
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

A simple modification of library length for highly divergent gene capture

Changying Xing et al.Oct 13, 2016
+10
K
X
C
Abstract Hybridization capture is considered very cost- and time-effective method for enriching a massive amount of target loci distributed separately in a whole genome. However, divergent loci are difficult to enrich for the sequence mismatch between probes and target DNA. After analysis the distributional pattern of divergent loci in mitochondrial genomes (mitogenomes), we notice that the relatively variable regions are intercept by the relatively conservative regions. We propose to extend the length of library to overcome the problem. By using a home-made probe set to bait amphibian mitogeneomes DNA, we demonstrate that using 2 kb DNA libraries generate high sequence coverage in the highly variable regions than using 400 bp DNA libraries. These suggest that longer fragments in the library generally contain both relatively variable regions and relatively conservative regions. The divergent part DNA along with conservative part DNA is captured during hybridization. We present a protocol that allows users to overcome the gap problem for highly divergent gene capture.
0
Citation9
0
Save
6

Dog10K_Boxer_Tasha_1.0: A long-read assembly of the dog reference genome

Vidhya Jagannathan et al.May 5, 2021
+12
Y
Y
V
Abstract The domestic dog has evolved to be an important biomedical model for studies regarding the genetic basis of disease, morphology and behavior. Genetic studies in the dog have relied on a draft reference genome of a purebred female boxer dog named “Tasha” initially published in 2005. Derived from a Sanger whole genome shotgun sequencing approach coupled with limited clone-based sequencing, the initial assembly and subsequent updates have served as the predominant resource for canine genetics for 15 years. While the initial assembly produced a good quality draft, as with all assemblies produced at the time it contained gaps, assembly errors and missing sequences, particularly in GC-rich regions, which are found at many promoters and in the first exons of protein coding genes. Here we present Dog10K_Boxer_Tasha_1.0, an improved chromosome-level highly contiguous genome assembly of Tasha created with long-read technologies, that increases sequence contiguity >100-fold, closes >23,000 gaps of the Canfam3.1 reference assembly and improves gene annotation by identifying >1200 new protein-coding transcripts. The assembly and annotation are available at NCBI under the accession GCF_000002285.5.
6
Citation8
0
Save
11

Worldwide tracing of mutations and the evolutionary dynamics of SARS-CoV-2

Zhongyin Zhou et al.Aug 10, 2020
+12
Y
H
Z
Abstract Understanding the mutational and evolutionary dynamics of SARS-CoV-2 is essential for treating COVID-19 and the development of a vaccine. Here, we analyzed publicly available 15,818 assembled SARS-CoV-2 genome sequences, along with 2,350 raw sequence datasets sampled worldwide. We investigated the distribution of inter-host single nucleotide polymorphisms (inter-host SNPs) and intra-host single nucleotide variations (iSNVs). Mutations have been observed at 35.6% (10,649/29,903) of the bases in the genome. The substitution rate in some protein coding regions is higher than the average in SARS-CoV-2 viruses, and the high substitution rate in some regions might be driven to escape immune recognition by diversifying selection. Both recurrent mutations and human-to-human transmission are mechanisms that generate fitness advantageous mutations. Furthermore, the frequency of three mutations (S protein, F400L; ORF3a protein, T164I; and ORF1a protein, Q6383H) has gradual increased over time on lineages, which provides new clues for the early detection of fitness advantageous mutations. Our study provides theoretical support for vaccine development and the optimization of treatment for COVID-19. We call researchers to submit raw sequence data to public databases.
11
Citation5
0
Save
3

Single-cell RNA-sequencing reveals thoracolumbar vertebra heterogeneity and rib-genesis in pigs

Jianbo Li et al.May 26, 2021
+16
J
D
J
Abstract Thoracolumbar vertebra (TLV) and rib primordium (RP) development is a common evolutionary feature across vertebrates although whole-organism analysis of TLV and RP gene expression dynamics has been lacking. Here we investigated the single-cell transcriptomic landscape of thoracic vertebra (TV), lumbar vertebra (LV), and RP cells from a pig embryo at 27 days post-fertilization (dpf) and identified six cell types with distinct gene-expression signatures. In-depth dissection of the gene-expression dynamics and RNA velocity revealed a coupled process of osteogenesis and angiogenesis during TLV and rib development. Further analysis of cell-type-specific and strand-specific expression uncovered the extremely high levels of HOXA10 3’-UTR sequence specific to osteoblast of LV cells, which may function as anti- HOXA10 -antisense by counteracting the HOXA10 -antisense effect to determine TLV transition. Thus, this work provides a valuable resource for understanding embryonic osteogenesis and angiogenesis underlying vertebrate TLV and RP development at the cell-type-specific resolution, which serves as a comprehensive view on the transcriptional profile of animal embryo development.
3
Citation1
0
Save
1

Social Behavior Atlas: A computational framework for tracking and mapping 3D close interactions of free-moving animals

Yaning Han et al.Mar 6, 2023
+21
Y
K
Y
Abstract The study of social behaviors in animals is essential for understanding their survival and reproductive strategies. However, accurately tracking and analyzing the social interactions of free-moving animals has remained a challenge. Existing multi-animal pose estimation techniques suffer from drawbacks such as the need for extensive manual annotation and difficulty in discriminating between similar-looking animals in close social interactions. In this paper, we present the Social Behavior Atlas (SBeA), a novel computational framework that solves these challenges by employing a deep learning-based video instance segmentation model, 3D pose reconstruction, and unsupervised dynamic behavioral clustering. SBeA framework also involves a multi-camera setup to prevent occlusion, and a novel approach to identify individual animals in close social interactions. We demonstrate the effectiveness of SBeA in tracking and mapping the 3D close interactions of free-moving animals using the example of genetic mutant mice, birds, and dogs. Our results show that SBeA is capable of identifying subtle social interaction abnormalities, and the models and frameworks developed can be applied to a wide range of animal species. SBeA is a powerful tool for researchers in the fields of neuroscience and ecology to study animal social behaviors with a high degree of accuracy and reliability.
0

Decoding genetic architecture of dog complex traits by constructing fine-scale genomic ancestry of admixture

Shilei Zhao et al.Jan 1, 2023
+3
L
Y
S
Domestic animals and plants exhibit remarkable phenotypic diversity in terms of morphology, behavior, and physiology, which can be attributed to the complex interbreeding process of various breeds and artificial selection. Here we develop a method that can efficiently construct fine-scale interbreeding history of local segments along the genome. Since ancestral breeds usually exhibit diverse phenotypes, the method provides a valuable approach for unraveling the genetic architecture of complex traits in admixed breeds. Simulated data demonstrates that the method performs well, even in scenarios involving complex interbreeding with up to 19 ancestral breeds. The method is applied to analyze three mixed dog breeds, Irish Wolfhound, Giant Schnauzer, and Miniature Schnauzer, representing instances of body-size enlargement and miniaturization. Numerous novel ancestor breed-specific genes determining body size are identified, including FGFR2, WDR11, and FARS2. We also validate genes reported in previous GWAS or genomic sweep scans, such as LCORL, STC2, NPR2, and FGF4. These findings highlight the validity of the method as a valuable tool for investigating the genetic basis underlying ancestry-specific traits in domestic animals and plants with complex interbreeding histories.
0

Canine transmissible venereal tumor genome reveals ancient introgression from coyotes to arctic sled dogs

Xuan Wang et al.Jun 19, 2018
+9
M
A
X
Canine transmissible venereal tumor (CTVT), the oldest known somatic cell line, is a living fossil, originating from cancer cells transmitted from a host to other canids during the mating process. In the present study, we creatively used ancient genome analysis method to decipher the genetic component of the ancient founder of CTVT. The results showed that the CTVT founder came from an arctic sled dog population that possessed introgression from another species, coyote. It revealed that CTVT not only plays important role in cancer evolution study, but also can be treated as living fossils to study ancient evolutionary history of dogs.
0

Integrating Genomic and Transcriptomic Data to Reveal Genetic Mechanisms Underlying Piao Chicken Rumpless Trait

Yun-Mei Wang et al.Mar 6, 2020
+11
S
S
Y
Piao chicken, a rare Chinese native poultry breed, lacks primary tail structures, such as pygostyle, caudal vertebra, uropygial gland and tail feathers. So far, the molecular mechanisms underlying tail absence in this breed have remained unclear. We employed comprehensive comparative transcriptomic and genomic analyses to unravel potential genetic underpinnings of rumplessness in the Piao chicken. Our results reveal many biological factors involved in tail development and several genomic regions under strong positive selection in this breed. These regions contain candidate genes associated with rumplessness, including IRX4 , IL-18 , HSPB2 , and CRYAB . Retrieval of quantitative trait loci (QTL) and gene functions implied that rumplessness might be consciously or unconsciously selected along with the high-yield traits in Piao chicken. We hypothesize that strong selection pressures on regulatory elements might lead to gene activity changes in mesenchymal stem cells of the tail bud and eventually result in tail truncation by impeding differentiation and proliferation of the stem cells. Our study provides fundamental insights into early initiation and genetic bases of the rumpless phenotype in Piao chicken.
0

Identity-By-Descent Refines Mapping Of Candidate Regions For Preaxial Polydactyly In A Large Chinese Pedigree

Xingyan Yang et al.May 22, 2017
+4
X
Q
X
Preaxial polydactyly (PPD) is congenital hand malformation characterized by the duplication of digit. Herein, we scan the genome-wide SNPs for a large Chinese family with PPD-II/III. We employ the refined IBD algorithm to identify the identity-by-decent (IBD) segments and compare the frequency among the patients and normal relatives. A total of 72 markers of 0.01 percentile of the permutation are identified as the peak signals. Among of them, 57 markers locate on chromosome 7q36 which is associated with PPD. Further analyses refine the mapping of candidate region in chromosome 7q36 into two 380 Kb fragments within LMBR1 and SHH respectively. IBD approach is a suitable method for mapping cause gene of human disease. Target-enrichment sequencing as well as functional experiments are required to illustrate the pathogenic mechanisms for PPD in the future.
0

Genomic approaches reveal an endemic sub-population of gray wolves in Southern China

Guodong Wang et al.Jan 8, 2019
+10
P
X
G
Despite being one of the most widely distributed terrestrial mammals, the history of gray wolves (Canis lupus) in China is not well understood as their habitats have been destroyed with growing economic development. Using six specimens from wolf skins in Chinese Natural History museums, we sequenced their genome using a modified ancient DNA procedure. Using whole genome sequence analysis, we showed that gray wolves from Southern China (SC) derive from a single lineage, distinct from gray wolves from the Tibetan Plateau (Canis lupus chanco) and Northern China, suggesting that SC gray wolves may form a distinct sub-population. Of SC gray wolves, one wolf from Zhejiang carries a genetic component from a canid that must have diverged earlier from other wolves than jackals did, perhaps through gene flow from a population related to or further diverged from wolves than the dhole, a species distributed in Southern China and Southeast Asia. This may indicate that interspecific gene flow likely played an important role in shaping the speciation patterns and population structure in the genus Canis. Our study is the first to survey museum genomes of gray wolves from Southern China, revealing the presence of an endemic population with ancient interspecific gene flow from a population related to the dhole, and highlighting how sequencing the paleogenome from museum specimens can help us to study extinct species.
Load More