XW
Xiaofeng Wei
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
China National GeneBank, BGI Group (China), Southern Medical University
+ 9 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
9
(78% Open Access)
Cited by:
30
h-index:
23
/
i10-index:
32
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
8

STOmicsDB: a database of Spatial Transcriptomic data

Zhicheng Xu et al.Oct 24, 2023
+18
T
W
Z
ABSTRACT Recent technological development in spatial transcriptomics allows researchers to measure gene expression of cells and their spatial locations at the almost single-cell level, which generates detailed biological insight into biological processes. However, specialized spatial transcriptomics databases are rare. Here, we present the Spatial TranscriptOmics DataBase (STOmicsDB), a user-friendly database with multifunctions including search of relevant publications and tools, public dataset visualization, customized specialized databases, new data archive, and online analysis. The current version of STOmicsDB consists of 141 curated spatial transcript datasets covering 12 species, and includes 5,618 spatial multi-omics publications and 674 tools. STOmicsDB is freely accessible at https://db.cngb.org/stomics/ .
6

VirusDIP: Virus Data Integration Platform

Lina Wang et al.Oct 24, 2023
+23
X
F
L
Abstract Motivation The Coronavirus Disease 2019 (COVID-19) pandemic poses a huge threat to human public health. Viral sequence data plays an important role in the scientific prevention and control of epidemics. A comprehensive virus database will be vital useful for virus data retrieval and deep analysis. To promote sharing of virus data, several virus databases and related analyzing tools have been created. Results To facilitate virus research and promote the global sharing of virus data, we present here VirusDIP, a one-stop service platform for archive, integration, access, analysis of virus data. It accepts the submission of viral sequence data from all over the world and currently integrates data resources from the National GeneBank Database (CNGBdb), Global initiative on sharing all influenza data (GISAID), and National Center for Biotechnology Information (NCBI). Moreover, based on the comprehensive data resources, BLAST sequence alignment tool and multi-party security computing tools are deployed for multi-sequence alignment, phylogenetic tree building and global trusted sharing. VirusDIP is gradually establishing cooperation with more databases, and paving the way for the analysis of virus origin and evolution. All public data in VirusDIP are freely available for all researchers worldwide. Availability https://db.cngb.org/virus/ Contact weixiaofeng@cngb.org
6
Citation4
0
Save
0

CNSA: a data repository for archiving omics data

Xueqin Guo et al.May 7, 2020
+23
F
F
X
Abstract With the application and development of high-throughput sequencing technology in life and health sciences, massive multi-dimensional biological data brings the problem of efficient management and utilization. Database development and biocuration are the prerequisites for the reuse of these big data. Here, relying on China National GeneBank (CNGB), we present CNGB Sequence Archive (CNSA) for archiving omics data, including raw sequencing data and its analytical data and related metadata which are organized into six objects, namely Project, Sample, Experiment, Run, Assembly, and Variation at present. Moreover, CNSA has created the correlation model of living samples, sample information, and analytical data on some projects, so that all data can be traced throughout the life cycle from the living sample to the sample information to the analytical data. Complying with the data standards commonly used in the life sciences, CNSA is committed to building a comprehensive and curated data repository for the storage, management and sharing of omics data, improving the data standards, and providing free access to open data resources for worldwide scientific communities to support academic research and the bio-industry. Database URL: https://db.cngb.org/cnsa/
0
Citation3
0
Save
0

Study on the relationship and related factors between physical fitness and health behavior of preschool children in southwest China

Rong Zou et al.Sep 16, 2024
+3
D
K
R
Abstract Objective To investigate the physical fitness level and health behavior status of preschool children in China, explore the relationship between physical fitness and health behavior, and further reveal the main factors affecting health behavior, to provide a reference for improving the physical fitness level of preschool children and maintaining healthy behavior. Methods A total of 755 preschool children (394 boys and 361 girls, aged 4.52 ± 1.11 years) were selected from Chongqing and Liupanshui in China by cluster random sampling method for questionnaire survey and physical monitoring, and SPSS21.0 software was used to process and analyze the data. Results (1) Heart rate ( p = 0.015), protein content ( p < 0.001), and time spent on the balance beam ( p < 0.001) were significantly lower in boys than in girls, while BMI ( p = 0.012), muscle mass ( p < 0.001), and distance of standing long jump ( p < 0.001) were significantly higher in boys than in girls. Meanwhile, systolic blood pressure ( p = 0.004) and diastolic blood pressure ( p = 0.001) of rural children were significantly higher than those of urban children, while BMI ( p < 0.001) and sitting forward flexion ( p = 0.019) were significantly lower than those of urban children. (2) The light-intensity physical activity (LPA) and moderate to vigorous physical activity (MVPA) of boys were significantly higher than that of girls ( p < 0.001), and the MVPA of urban children was significantly higher than that of rural children ( p = 0.001), and the former participated in sports classes more frequently ( p < 0.001). (3) There was a significant correlation between physical activity (PA) and physical fitness indicators of preschoolers. Participating in sports interest classes was only significantly correlated with systolic blood pressure ( r = 0.08) and sitting forward flexion ( r = 0.09). (4) The PA level of preschool children was related to gender, household registration, kindergarten nature, age, residence environment, parental support, and participation degree. Participation in sports interest classes was related to gender, the nature of the kindergarten, household registration, age, and parent participation. Daily screen time was related to household registration, the nature of the kindergarten, the environment of residence, and the value perception of parents. Conclusions There were different degrees of correlation between preschool children’s physical fitness and health behaviors, and children’s health behaviors were closely related to gender, environment, parents, and other factors. Therefore, how to increase the protective factors of children’s health behaviors and controlling the risk factors may be crucial to promoting the development of good health behaviors and improving the physical fitness of preschool children.
0
Citation1
0
Save
9

Screening of cell-virus, cell-cell, gene-gene cross-talks among kingdoms of life at single cell resolution

Dongsheng Chen et al.Oct 24, 2023
+28
J
Z
D
Abstract The outbreak of severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) issued a significant and urgent threat to global health. The exact animal origin of SARS-CoV-2 remains obscure and understanding its host range is vital for preventing interspecies transmission. Previously, we have assessed the target cell profiles of SARS-CoV-2 in pets, livestock, poultry and wild animals. Herein, we expand this investigation to a wider range of animal species and viruses to provide a comprehensive source for large-scale screening of potential virus hosts. Single cell atlas for several mammalian species (alpaca, hamster, hedgehog, chinchilla etc.), as well as comparative atlas for lung, brain and peripheral blood mononuclear cells (PBMC) for various lineages of animals were constructed, from which we systemically analyzed the virus entry factors for 113 viruses over 20 species from mammalians, birds, reptiles, amphibians and invertebrates. Conserved cellular connectomes and regulomes were also identified, revealing the fundamental cell-cell and gene-gene cross-talks between these species. Overall, our study could help identify the potential host range and tissue tropism of SARS-CoV-2 and a diverse set of viruses and reveal the host-virus co-evolution footprints.
9
Paper
Citation1
0
Save
6

CDCP: a visualization and analyzing platform for single-cell datasets

Yuejiao Li et al.Oct 24, 2023
+22
T
T
Y
Abstract Advances in single-cell sequencing technology provide a unique approach to characterize the heterogeneity and distinctive functional states at single-cell resolution, leading to rapid accumulation of large-scale single-cell datasets. A big challenge undertaken by research community especially bench scientists is how to simplify the way of retrieving, processing and analyzing the huge number of datasets. Towards this end, we developed Cell-omics Data Coordinate Platform (CDCP), a platform that aims to share and integrate comprehensive single-cell datasets, and to provide a network analysis toolkit for personalized analysis. CDCP contains single-cell RNA-seq and ATAC-seq datasets of 474 572 cells from 6 459 samples in species covering humans, non-human primate models and other animals. It allows querying and visualization of interested datasets and the expression profile of distinct genes in different cell clusters and cell types. Besides, this platform provides an analysis pipeline for non-bioinformatician experimental scientists to address questions not focused by the submitters of the datasets. In summary, CDCP provides a user-friendly interface for researchers to explore, visualize, analyze, download and submit published single-cell datasets and it will be a valuable resource for investigators to explore the global transcriptome profiling at single-cell level.
0

PIRD: Pan immune repertoire database

Wei Zhang et al.May 7, 2020
+21
K
L
W
Motivation T and B cell receptors (TCRs and BCRs) play a pivotal role in the adaptive immune system by recognizing an enormous variety of external and internal antigens. Understanding these receptors is critical for exploring the process of immunoreaction and exploiting potential applications in immunotherapy and antibody drug design. Although a large number of samples have had their TCR and BCR repertoires sequenced using high-throughput sequencing in recent years, very few databases have been constructed to store these kinds of data. To resolve this issue, we developed a database.Results We developed a database, the Pan Immune Repertoire Database (PIRD), located in China National GeneBank (CNGBdb), to collect and store annotated TCR and BCR sequencing data, including from Homo sapiens and other species. In addition to data storage, PIRD also provides functions of data visualisation and interactive online analysis. Additionally, a manually curated database of TCRs and BCRs targeting known antigens (TBAdb) was also deposited in PIRD.Availability and Implementation PIRD can be freely accessed at .
0

Gene Panel Sequencing in a Chinese High-risk Breast Cancer Cohort

Xianyu Zhang et al.May 7, 2020
+23
B
X
X
Currently, over 20 genes have been defined that can confer susceptibility for high-risk breast cancer. Although research has proved the utility of multiple-gene sequencing in the assessment of breast cancer risk, there is little data from China patients. Here, we use a multiple-gene sequencing panel to identify the variant spectrum in Chinese high-risk breast cancer subjects.A total of 829 Chinese high-risk breast cancer patients participated in the research. The coding regions of 115 hereditary cancer susceptibility genes were sequenced using a next generation sequencing platform. In total, 193 pathogenic variants were identified in 45 genes from 177 patients. The pathogenic variant carrier rate is 21.4%: with 10.5% patients carrying a BRCA1 or BRCA2 mutation only, 10.0% of patients carried non-BRCA gene mutations only, while 1.0% of patients carried both a BRCA1/2 and a non-BRCA gene mutation. Variants of uncertain significance (VUS) totaling 2632 were identified in 115 genes from 787 of 829 patients: 82.5% patients carried more than one VUS, and only 5.1% patients did not carry any VUS. Families carrying pathogenic variants were tracked and adenoma was founded in three of them. Our data provide a comprehensive analysis of potential susceptibility variations of high-risk for breast cancer in a Chinese population. This data will be useful for the comparison of the susceptibility variation spectrum between different populations and to discover potential pathogenic variants to improve the prevention and treatment of high-risk breast cancer.* NCCN : National Comprehensive Cancer Network HGMD : Human Gene Mutation Database VUS : variants of uncertain significance ACMG : American College of Medical Genetics
1

Cell transcriptomic atlas of the non-human primate Macaca fascicularis

Lei Han et al.Oct 24, 2023
+74
C
X
L
Studying tissue composition and function in non-human primates (NHP) is crucial to understand the nature of our own species. Here, we present a large-scale single-cell and single-nucleus transcriptomic atlas encompassing over one million cells from 43 tissues from the adult NHP Macaca fascicularis . This dataset provides a vast, carefully annotated, resource to study a species phylogenetically close to humans. As proof of principle, we have reconstructed the cell-cell interaction networks driving Wnt signalling across the body, mapped the distribution of receptors and co-receptors for viruses causing human infectious diseases and intersected our data with human genetic disease orthologous coordinates to identify both expected and unexpected associations. Our Macaca fascicularis cell atlas constitutes an essential reference for future single-cell studies in human and NHP.