YP
Yuhong Pang
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(63% Open Access)
Cited by:
4
h-index:
1
/
i10-index:
0
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
8

Ancient DNA Reveals China as a Historical Genetic Melting Pot in Tiger Evolution

Xin Sun et al.Sep 17, 2022
Abstract The contrast between the tiger’s ( Panthera tigris ) 2-3 My age and extant tigers’ coalescence approximately 110,000 years ago suggests an ancient demographic bottleneck. Here we collected over 60 extinct specimens across mainland Asia and generated whole genome sequences from a 10,600-year-old Russian Far East (RFE) specimen (RUSA21, 8ξ coverage), 14 South China tigers (0.1-12ξ), three Caspian tigers (4-8ξ), plus 17 new mitogenomes. RUSA21 clustered within modern Northeast Asian phylogroups and partially derived from an extinct Late Pleistocene lineage. While some 8,000-10,000-year-old RFE mitogenomes are basal to all tigers, one 2,000-year-old specimen resembles present Amur tigers. The Caspian tiger likely dispersed from an ancestral Northeast Asian population and experienced gene flow from southern Bengal tigers. Lastly, genome-wide monophyly supported the South China tiger as a distinct subspecies, albeit with mitochondrial paraphyly, hence resolving its longstanding taxonomic controversy. The distribution of mitochondrial haplogroups corroborated by biogeographical modeling suggested Southwest China was a Late Pleistocene refugium for a relic basal lineage. As suitable habitat returned, Eastern China became a genetic melting pot to foster divergent lineages to merge into South China tigers and other subsequent northern subspecies to develop. Genomic information retrieved from ancient tigers hence sheds light on the species’ full evolutionary history leading to nine modern subspecies and resolves the natural history of surviving tigers.
8
Citation2
0
Save
0

A Fuzzy sequencer for rapid DNA fragment counting and genotyping

Wenxiong Zhou et al.Oct 27, 2023
Abstract High-throughput sequencing technologies generate a vast number of DNA sequence reads simultaneously, which are subsequently analyzed using the information contained within these fragmented reads. The assessment of sequencing technology relies on information efficiency, which measures the amount of information entropy produced per sequencing reaction cycle. In this study, we propose a fuzzy sequencing strategy that exhibits information efficiency more than twice of currently prevailing cyclic reversible terminator sequencing methods. To validate our approach, we developed a fully functional and high-throughput fuzzy sequencer. This sequencer implements a highly efficient fluorogenic sequencing-by-synthesis chemistry and underwent testing across various application scenarios, including copy-number variation detection, noninvasive prenatal testing, transcriptome profiling, mutation genotyping, and metagenomic profling. Our findings unequivocally demonstrate that the fuzzy sequencing strategy outperforms existing methods in terms of information efficiency and delivers accurate resequencing results with faster turnaround times. One Sentence Summary A fuzzy sequencer can exceed current limit of information efficiency of DNA sequencers for resequencing applications.
0

Data quality assurance practices in research data repositories—A systematic literature review

Besiki Stvilia et al.Aug 7, 2024
Abstract Data quality issues can significantly hinder research reproducibility, data sharing, and reuse. At the forefront of addressing data quality issues are research data repositories (RDRs). This study conducted a systematic analysis of data quality assurance (DQA) practices in RDRs, guided by activity theory and data quality literature, resulting in conceptualizing a data quality assurance model (DQAM) for RDRs. DQAM outlines a DQA process comprising evaluation, intervention, and communication activities and categorizes 17 quality dimensions into intrinsic and product‐level data quality. It also details specific improvement actions for data products and identifies the essential roles, skills, standards, and tools for DQA in RDRs. By comparing DQAM with existing DQA models, the study highlights its potential to improve these models by adding a specific DQA activity structure. The theoretical implication of the study is a systematic conceptualization of DQA work in RDRs that is grounded in a comprehensive analysis of the literature and offers a refined conceptualization of DQA integration into broader frameworks of RDR evaluation. In practice, DQAM can inform the design and development of DQA workflows and tools. As a future research direction, the study suggests applying and evaluating DQAM across various domains to validate and refine this model further.
0

PRISM: Multiplexed Profiling of RNA In-Situ through Single-round of Imaging in Three-Dimensional Tissue

Tianyi Chang et al.Jul 2, 2024
Abstract To resolve many RNA species in situ, cyclic reactions are typically necessary to increase the multiplexity since conventional fluorescence microscopy is often limited to five channels. Therefore, sophisticated instrumentation is needed to perform in-situ sequencing or sequential fluorescence insitu hybridization imaging, restricting the widespread adoption of spatial RNA imaging methods among biological research communities. Here, we present ‘Profiling of RNA In-situ through Single-round of iMaging’ (PRISM), which leverages the spectral intensity levels to expand the coding capacity. With a radius vector coding strategy to ensure the orthogonality of codewords, PRISM can reach up to 64-plex RNA imaging in a single imaging shot with conventional microscopes. As a panel-based spatial transcriptomic imaging approach, the entire experimental process can be completed within one day. We verified PRISM’s versatility on various tissues, such as mouse brains, mouse embryos, and human hepatocellular carcinoma (HCC) samples, generating more than 5.7 million annotated cells. We performed quasi-3D spatial landscapes to track major cell types in different organs during embryonic development from E12.5 to E14.5. We also revealed the critical role of cancer-associated fibroblasts (CAFs) on immune infiltration and immune response heterogeneity within and between tumor microenvironments. We extended PRISM to 100-µm thick mouse brain slices to generate accurate 3D cell atlas and subcellular RNA localization landscapes. PRISM is robust and easy to operate, with a fast turnaround time and sub-cellular resolution, offering a new transcriptomic imaging toolbox for all biologists.
7

Rapid and sensitive single cell RNA sequencing with SHERRY2

Lin Di et al.Dec 25, 2021
Abstract Prevalent single cell transcriptomic profiling (scRNA-seq) mechods are mainly based on synthesis and enrichment of full-length double-stranded complementary DNA. These approaches are challenging to generate accurate quantification of transcripts when their abundance is low or their full-length amplifications are difficult. Based on our previous finding that Tn5 transposase can directly cut-and-tag DNA/RNA hetero-duplexes, we present SHERRY2, a specifically optimized protocol for scRNA-seq without second strand cDNA synthesis. SHERRY2 is free of pre-amplification and eliminates the sequence-dependent bias. In comparison with other widely-used scRNA-seq methods, SHERRY2 exhibits significantly higher sensitivity and accuracy even for single nuclei. Besides, SHERRY2 is simple and robust, and can be easily scaled up to high-throughput experiments. When testing single lymphocytes and neuron nuclei, SHERRY2 not only obtained accurate countings of transcription factors and long non-coding RNAs, but also provided bias-free results that enriched genes in specific cellular components or functions, which outperformed other protocols. With a few thousand cells sequenced by SHERRY2, we confirmed expression and dynamics of Myc in different cell types of germinal centers, which were previously only revealed by gene-specific amplification methods. SHERRY2 is able to provide high sensitivity, high accuracy, and high throughput for those applications that require high number of genes identified in each cell. It can reveal the subtle transcriptomic difference between cells and facilitate important biological discoveries.