ZZ
Zhang Zhang
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
29
(76% Open Access)
Cited by:
5,557
h-index:
64
/
i10-index:
227
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The Genome Sequence Archive Family: Toward Explosive Data Growth and Diverse Data Types

Tingting Chen et al.Aug 1, 2021
The Genome Sequence Archive (GSA) is a data repository for archiving raw sequence data, which provides data storage and sharing services for worldwide scientific communities. Considering explosive data growth with diverse data types, here we present the GSA family by expanding into a set of resources for raw data archive with different purposes, namely, GSA (https://ngdc.cncb.ac.cn/gsa/), GSA for Human (GSA-Human, https://ngdc.cncb.ac.cn/gsa-human/), and Open Archive for Miscellaneous Data (OMIX, https://ngdc.cncb.ac.cn/omix/). Compared with the 2017 version, GSA has been significantly updated in data model, online functionalities, and web interfaces. GSA-Human, as a new partner of GSA, is a data repository specialized in human genetics-related data with controlled access and security. OMIX, as a critical complement to the two resources mentioned above, is an open archive for miscellaneous data. Together, all these resources form a family of resources dedicated to archiving explosive data with diverse types, accepting data submissions from all over the world, and providing free open access to all publicly available data in support of worldwide research activities.
0
Paper
Citation762
0
Save
0

Genome sequence and genetic diversity of the common carp, Cyprinus carpio

Peng Xu et al.Sep 21, 2014
Xiaowen Sun and colleagues report the whole-genome sequencing of the common carp, Cyprinus carpio. They also resequenced 33 representative accessions from a worldwide collection and provide insights into population structure and evolution. The common carp, Cyprinus carpio, is one of the most important cyprinid species and globally accounts for 10% of freshwater aquaculture production. Here we present a draft genome of domesticated C. carpio (strain Songpu), whose current assembly contains 52,610 protein-coding genes and approximately 92.3% coverage of its paleotetraploidized genome (2n = 100). The latest round of whole-genome duplication has been estimated to have occurred approximately 8.2 million years ago. Genome resequencing of 33 representative individuals from worldwide populations demonstrates a single origin for C. carpio in 2 subspecies (C. carpio Haematopterus and C. carpio carpio). Integrative genomic and transcriptomic analyses were used to identify loci potentially associated with traits including scaling patterns and skin color. In combination with the high-resolution genetic map, the draft genome paves the way for better molecular studies and improved genome-assisted breeding of C. carpio and other closely related species.
0
Citation576
0
Save
5

The Genome Sequence Archive Family: Towards Explosive Data Growth and Diverse Data Types

Tingting Chen et al.Jul 1, 2021
Abstract The Genome Sequence Archive (GSA) is a data repository for archiving raw sequence data, which provides data storing and sharing services for worldwide scientific communities. Considering explosive data growth with diverse data types, here we present the GSA family by expanding into a set of resources for raw data archive with different purposes, namely, GSA ( https://ngdc.cncb.ac.cn/gsa/ ), GSA for Human (GSA-Human, https://ngdc.cncb.ac.cn/gsa-human/ ), and Open Archive for Miscellaneous Data (OMIX, https://ngdc.cncb.ac.cn/omix/ ). Compared with the 2017 version, GSA has been significantly updated in data model, online functionalities, and web interfaces. GSA-Human, as a new partner of GSA, is a data repository specialized in human genetics-related data with controlled access and security. OMIX, as a critical complement to the two resources mentioned above, is an open archive for miscellaneous data. Together, all these resources form a family of resources dedicated to archiving explosive data with diverse types, accept data submissions from all over the world and provide free open access to all publicly available data in support of worldwide research activities.
32

The global landscape of SARS-CoV-2 genomes, variants, and haplotypes in 2019nCoVR

Shuhui Song et al.Aug 30, 2020
Abstract On 22 January 2020, the National Genomics Data Center (NGDC), part of the China National Center for Bioinformation (CNCB), created the 2019 Novel Coronavirus Resource (2019nCoVR), an open-access SARS-CoV-2 information resource. 2019nCoVR features a comprehensive integration of sequence and clinical information for all publicly available SARS-CoV-2 isolates, which are manually curated with value-added annotations and quality evaluated by our in-house automated pipeline. Of particular note, 2019nCoVR performs systematic analyses to generate a dynamic landscape of SARS-CoV-2 genomic variations at a global scale. It provides all identified variants and detailed statistics for each virus isolate, and congregates the quality score, functional annotation, and population frequency for each variant. It also generates visualization of the spatiotemporal change for each variant and yields historical viral haplotype network maps for the course of the outbreak from all complete and high-quality genomes. Moreover, 2019nCoVR provides a full collection of SARS-CoV-2 relevant literature on COVID-19 (Coronavirus Disease 2019), including published papers from PubMed as well as preprints from services such as bioRxiv and medRxiv through Europe PMC. Furthermore, by linking with relevant databases in CNCB-NGDC, 2019nCoVR offers data submission services for raw sequence reads and assembled genomes, and data sharing with National Center for Biotechnology Information. Collectively, all SARS-CoV-2 genome sequences, variants, haplotypes and literature are updated daily to provide timely information, making 2019nCoVR a valuable resource for the global research community. 2019nCoVR is accessible at https://bigd.big.ac.cn/ncov/ .
32
Citation8
0
Save
Load More