GF
Guangyi Fan
Author with expertise in RNA Sequencing Data Analysis
BGI Group (China), Botswana Geoscience Institute, University of Queensland
+ 11 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
41
(54% Open Access)
Cited by:
25
h-index:
49
/
i10-index:
99
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

A database and comprehensive analysis of the algae genomes

Chengcheng Shi et al.Oct 24, 2023
+4
K
X
C
Abstract Algae characterize their high diversity, taxonomy and morphology for wide-used studying the plant origins and terrestrialization, as well as multicellular evolution. Due to the genome assembly challenge of algae caused by symbionts with microbiome, the published algae genomes are relatively less than the terrestrial plants. Here we comprehensively collected and re-annotated 191 available algae genomes distributed in nine major lineages. We systemically investigated the genome features including genome size, assembly continuity and integrity, GC content, abundance of repetitive sequences and protein-coding gene number. We construct the phylogenetic trees using 193 algae genomes, which is consistent with the well-known evolution path that Glaucophyte is the most ancient, going through eight lineages, and finally evolved to terrestrial plants. We also examined the Horizontal Gene Transfer (HGT) genes distribution in algae genomes and provides a substantial genomic resource for functional gene origins and plant evolution.
1
Paper
Citation6
0
Save
0

Robust Benchmark Structural Variant Calls of An Asian Using the State-of-Art Long Fragment Sequencing Technologies

Xiao Du et al.Oct 24, 2023
+18
F
L
X
Abstract The importance of structural variants (SVs) on phenotypes and human diseases is now recognized. Although a variety of SV detection platforms and strategies that vary in sensitivity and specificity have been developed, few benchmarking procedures are available to confidently assess their performances in biological and clinical research. To facilitate the validation and application of those approaches, our work established an Asian reference material comprising identified benchmark regions and high-confidence SV calls. We established a high-confidence SV callset with 8,938 SVs in an EBV immortalized B lymphocyte line, by integrating four alignment-based SV callers [from 109× PacBio continuous long read (CLR), 22× PacBio circular consensus sequencing (CCS) reads, 104× Oxford Nanopore long reads, and 114× optical mapping platform (Bionano)] and one de novo assembly-based SV caller using CCS reads. A total of 544 randomly selected SVs were validated by PCR and Sanger sequencing, proofing the robustness of our SV calls. Combining trio-binning based haplotype assemblies, we established an SV benchmark for identification of false negatives and false positives by constructing the continuous high confident regions (CHCRs), which cover 1.46Gb and 6,882 SVs supported by at least one diploid haplotype assembly. Establishing high-confidence SV calls for a benchmark sample that has been characterized by multiple technologies provides a valuable resource for investigating SVs in human biology, disease, and clinical diagnosis.
0
Citation5
0
Save
1

Diversity, function and evolution of marine invertebrate genomes

Yaolei Zhang et al.Oct 24, 2023
+11
M
J
Y
Abstract Invertebrates, animals (metazoans) without backbones, encompass ∼97% of all animal yet remains understudied. They have provided insights into molecular mechanisms underlying fundamentally identical mechanisms in phylogenetically diverse animals, including vertebrates. Marine invertebrates have long fascinated researchers due to their abundance, diversity, adaptations, and impact on ecosystems and human economies. Here, we report a compendium and appraisal of 190 marine invertebrate genomes spanning 21 phyla, 43 classes, 92 orders, and 134 families. We identify a high proportion and long unit size of tandem repeats, likely contributing to reported difficulties in invertebrate genome assembly. A well-supported phylogenetic tree of marine invertebrates from 974 single-copy orthologous genes resolved topological controversies. We show that Ctenophora is at the basal phylum and Porifera is the sister group of Parahoxozoa; that Xenacoelomorpha is within Bilateria and is the sister group to Protostomia, rejecting three out of four hypotheses in the field; and that Bryozoa is at the basal position of Lophotrochozoa, not grouped into Lophophorata. We also present insights into the genetic underpinnings of metazoans from Hox genes, innate immune gene families, and nervous system gene families. Our marine invertebrate genome compendium provides a unified foundation for studies on their evolution and effects on ecological systems and human life.
1
Paper
Citation3
0
Save
1

Single-cell transcriptome landscape of zebrafish liver reveals hepatocytes and immune cell interactions in understanding nonalcoholic fatty liver disease

Yingyi Huang et al.Oct 24, 2023
+12
H
X
Y
Abstract Zebrafish have emerged as an attractive animal model for studying nonalcoholic fatty liver disease (NAFLD). However, little is known about the cell types and intercellular interactions in zebrafish liver. Here, we established a liver atlas that consists of 10 cell types using single-cell RNA sequencing. By examining the heterogeneity of hepatocytes and analyzing the expression of NAFLD-associated genes in the specific cluster, we provide a potential target cell model to study NAFLD. Additionally, our analysis identified two distinct resident macrophages with inflammatory and noninflammatory functions and characterized the successive stepwise development of T cell subtypes in the liver. Importantly, we uncovered possible molecular mechanisms and revealed the central regulation of macrophages on target cells of fatty liver by analyzing the cellular interaction between hepatocytes and immune cells. Our data provide valuable information for future research on NAFLD in zebrafish.
14

MetaTrass: High-quality metagenome assembly on the human gut microbiome by co-barcoding sequencing reads

Yanwei Qi et al.Oct 24, 2023
+9
Y
S
Y
Abstract With the development of sequencing technologies and computational analysis in metagenomics, the genetic diversity of non-conserved regions has been receiving intensive attention to unravel the human gut microbial community. However, it remains a challenge to obtain enough microbial draft genomes at a high resolution from a single sample. In this work, we presented MetaTrass with a strategy of binning first and assembling later to assemble high-quality draft genomes based on metagenomics co-barcoding reads and the public reference genomes. We applied the tool to the single tube long fragment reads datasets for four human faecal samples, and generated more high-quality draft genomes with longer contiguity and higher resolution than the common combination strategies of genome assembling and binning. A total of 178 high-quality genomes was successfully assembled by MetaTrass, but the maximum of 58 was generated by the optimal common combination strategy in our tests. These high-quality genomes paved the way for genetic diversity and lineage analysis among different samples. With the high capability of assembling high-quality genomes of metagenomics datasets, MetaTrass will facilitate the study of spatial characters and dynamics of complex microbial communities at high resolution. The open-source code of MetaTrass is available at https://github.com/BGI-Qingdao/MetaTrass .
14
Citation1
0
Save
1

Diversity, function and evolution of aquatic vertebrate genomes

Yue Song et al.Oct 24, 2023
+15
S
M
Y
Abstract Aquatic vertebrates consist of jawed fish (cartilaginous fish and bony fish), aquatic mammals, reptiles and amphibians. Here, we present a comprehensive analysis of 630 aquatic vertebrate genomes to generate a standardized compendium of genomic data. We demonstrate its value by assessing their genome features as well as illuminating gene families related to the transition from water to land, such as Hox genes and olfactory receptor genes. We found that LINEs are the major transposable element (TE) type in cartilaginous fish and aquatic mammals, while DNA transposons are the dominate type in bony fish. To our surprise, TE types are not fixed in amphibians, the first group that transitioned to living on land. These results illustrate the value of a unified resource for comparative genomic analyses of aquatic vertebrates. Our data and strategy are likely to support all evolutionary and ecological research on vertebrates.
1
Citation1
0
Save
1

Diversity, function and evolution of marine microbe genomes

Jianwei Chen et al.Oct 24, 2023
+19
Y
Y
J
Abstract Trillions of marine bacterial, archaeal and viral species contribute to the majority diversity of life on Earth. In the current study, we have done a comprehensive review of all the published studies of marine microbiome by re-analyzing most of the available high throughput sequencing data. We collected 17.59 Tb sequencing data from 8,165 metagenomic and prokaryotic samples, and systematically evaluated the genome characters, including genome size, GC content, phylogeny, and the functional and ecological roles of several typical phyla. A genome catalogue of 9,070 high quality genomes and a gene catalogue including 156,209,709 genes were constructed, representing the most integrate marine prokaryotic datasets till now. The genome size of Alphaproteobacteria and Actinobacteria was significant correlated to their GC content. A total of 44,322 biosynthetic gene clusters distributed in 53 types were detected from the reconstructed marine prokaryotic genome catalogue. Phylogenetic annotation of the 8,380 bacterial and 690 archaeal species revealed that most of the known bacterial phyla (99/111), including 62 classes and 181 orders, and four extra unclassified genomes from two candidate novel phyla were detected. In addition, taxonomically unclassified species represented a substantial fraction of 64.56% and 80.29% of the phylogenetic diversity of Bacteria and Archaea respectively. The genomic and ecological features of three groups of Cyanobacteria, luminous bacteria and methane-metabolizing archaea, including inhabitant preference, geolocation distribution and others were through discussed. Our database provides a comprehensive resource for marine microbiome, which would be a valuable reference for studies of marine life origination and evolution, ecology monitor and protection, bioactive compound development.
1
Paper
Citation1
0
Save
0

Sirenian genomes illuminate the evolution of fully aquatic species within the mammalian superorder afrotheria

Peijun Zhang et al.Sep 12, 2024
+10
H
Q
P
Abstract Sirenians of the superorder Afrotheria were the first mammals to transition from land to water and are the only herbivorous marine mammals. Here, we generated a chromosome-level dugong ( Dugong dugon ) genome. A comparison of our assembly with other afrotherian genomes reveals possible molecular adaptations to aquatic life by sirenians, including a shift in daily activity patterns (circadian clock) and tolerance to a high-iodine plant diet mediated through changes in the iodide transporter NIS ( SLC5A5 ) and its co-transporters. Functional in vitro assays confirm that sirenian amino acid substitutions alter the properties of the circadian clock protein PER2 and NIS. Sirenians show evidence of convergent regression of integumentary system (skin and its appendages) genes with cetaceans. Our analysis also uncovers gene losses that may be maladaptive in a modern environment, including a candidate gene ( KCNK18 ) for sirenian cold stress syndrome likely lost during their evolutionary shift in daily activity patterns. Genomes from nine Australian locations and the functionally extinct Okinawan population confirm and date a genetic break ~10.7 thousand years ago on the Australian east coast and provide evidence of an associated ecotype, and highlight the need for whole-genome resequencing data from dugong populations worldwide for conservation and genetic management.
0

Exploring the cobia (Rachycentron canadum) genome: unveiling putative male heterogametic regions and identification of sex-specific markers

Xiangri Shen et al.Sep 12, 2024
+13
J
J
X
Abstract Background Cobia (Rachycentron canadum) is the only member of the Rachycentridae family and exhibits considerable sexual dimorphism in growth rate. Sex determination in teleosts has been a long-standing basic biological question, and the molecular mechanisms of sex determination/differentiation in cobia are completely unknown. Results Here, we reported 2 high-quality, chromosome-level annotated male and female cobia genomes with assembly sizes of 586.51 Mb (contig/scaffold N50: 86.0 kb/24.3 Mb) and 583.88 Mb (79.9 kb/22.5 Mb), respectively. Synteny inference among perciform genomes revealed that cobia and the remora Echeneis naucrates were sister groups. Further, whole-genome resequencing of 31 males and 60 females, genome-wide association study, and sequencing depth analysis identified 3 short male-specific regions within a 10.7-kb continuous genomic region on male chromosome 18, which hinted at an undifferentiated sex chromosome system with a putative XX/XY mode of sex determination in cobia. Importantly, the only 2 genes within/between the male-specific regions, epoxide hydrolase 1 (ephx1, renamed cephx1y) and transcription factor 24 (tcf24, renamed ctcf24y), showed testis-specific/biased gene expression, whereas their counterparts cephx1x and ctf24x, located in female chromosome 18, were similarly expressed in both sexes. In addition, male-specific PCR targeting the cephx1y gene revealed that this genomic feature is conserved in cobia populations from Panama, Brazil, Australia, and Japan. Conclusion The first comprehensive genomic survey presented here is a valuable resource for future studies on cobia population structure and dynamics, conservation, and evolutionary history. Furthermore, it establishes evidence of putative male heterogametic regions with 2 genes playing a potential role in the sex determination of the species, and it provides further support for the rapid evolution of sex-determining mechanisms in teleost fish.
0
Paper
Citation1
0
Save
0

Datasets of fungal diversity and pseudo-chromosomal genomes of mangrove rhizosphere soil in China

Jianwei Chen et al.Sep 17, 2024
+11
C
L
J
With climate change and anthropic influence on the coastal ecosystems, mangrove ecosystems are disappearing at an alarming rate. Accordingly, it becomes important to track, study, record and store the mangrove microbial community considering their ecological importance and potential for biotechnological applications. Here, we provide information on mangrove fungal community composition and diversity in mangrove ecosystems with different plant species and from various locations differing in relation to anthropic influences. We describe twelve newly assembled genomes, including four chromosomal-level genomes of fungal isolates from the mangrove ecosystems coupled with functional annotations. We envisage that these data will be of value for future studies including comparative genome analysis and large-scale temporal and/or spatial research to elucidate the potential mechanisms by which mangrove fungal communities assemble and evolve. We further anticipate that the genomes represent valuable resources for bioprospecting related to industrial or clinical uses.
0
Citation1
0
Save
Load More