CS
Cheng Sun
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
12
(92% Open Access)
Cited by:
2,464
h-index:
17
/
i10-index:
21
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Sequencing of Culex quinquefasciatus Establishes a Platform for Mosquito Comparative Genomics

Peter Arensburger et al.Sep 30, 2010
Closing the Vector Circle The genome sequence of Culex quinquefasciatus offers a representative of the third major genus of mosquito disease vectors for comparative analysis. In a major international effort, Arensburger et al. (p. 86 ) uncovered divergences in the C. quinquefasciatus genome compared with the representatives of the other two genera Aedes aegypti and Anopheles gambiae . The main difference noted is the expansion of numbers of genes, particularly for immunity, oxidoreductive functions, and digestive enzymes, which may reflect specific aspects of the Culex life cycle. Bartholomay et al. (p. 88 ) explored infection-response genes in Culex in more depth and uncovered 500 immune response-related genes, similar to the numbers seen in Aedes , but fewer than seen in Anopheles or the fruit fly Drosophila melanogaster . The higher numbers of genes were attributed partly to expansions in those encoding serpins, C-type lectins, and fibrinogen-related proteins, consistent with greater immune surveillance and associated signaling needed to monitor the dangers of breeding in polluted, urbanized environments. Transcriptome analysis confirmed that inoculation with unfamiliar bacteria prompted strong immune responses in Culex . The worm and virus pathogens that the mosquitoes transmit naturally provoked little immune activation, however, suggesting that tolerance has evolved to any damage caused by replication of the pathogens in the insects.
0
Citation446
0
Save
29

Gigantic Genomes Can Provide Empirical Tests of TE Dynamics Models — An Example from Amphibians

Jie Wang et al.Aug 19, 2020
Abstract Transposable elements (TEs) are a major determinant of eukaryotic genome size. The collective properties of a genomic TE community reveal the history of TE/host evolutionary dynamics and impact present-day host structure and function, from genome to organism levels. In rare cases, TE community/genome size has greatly expanded in animals, associated with increased cell size and altered anatomy and physiology. We characterize the TE landscape of the genome and transcriptome in an amphibian with a giant genome — the caecilian Ichthyophis bannanicus , which we show has a genome size of 12.2 Gb. Amphibians are an important model system because the clade includes independent cases of genomic gigantism. The I. bannanicus genome differs compositionally from other giant amphibian genomes, but shares a low rate of ectopic-recombination-mediated deletion. We examine TE activity using expression and divergence plots; TEs account for 15% of somatic transcription, and most superfamilies appear active. We quantify TE diversity in the caecilian, as well as other vertebrates with a range of genome sizes, using diversity indices commonly applied in community ecology. We synthesize previous models integrating TE abundance, diversity, and activity, and we test whether the caecilian meets model predictions for genomes with high TE abundance. We propose thorough, consistent characterization of TEs to strengthen future comparative analyses. Such analyses will ultimately be required to reveal whether the divergent TE assemblages found across convergent gigantic genomes reflect fundamental shared features of TE/host genome evolutionary dynamics.
29
Citation3
0
Save
1

Pan-genome analysis highlights the role of structural variation in the evolution and environmental adaptation ofAsian honeybees

Li Yancan et al.Jun 15, 2023
Abstract The Asian honeybee, Apis cerana , is an ecologically and economically important pollinator. Mapping its genetic variation is key to understanding population-level health, histories, and potential capacities to respond to environmental changes. However, most efforts to date were focused on single nucleotide polymorphisms (SNPs) based on a single reference genome, thereby ignoring larger-scale genomic variation. We employed long-read sequencing technologies to generate a chromosome-scale reference genome for the ancestral group of A. cerana . Integrating this with 525 resequencing datasets, we constructed the first pan-genome of A. cerana , encompassing almost the entire gene content. We found that 31.32% of genes in the pan-genome were variably present across populations, providing a broad gene pool for environmental adaptation. We identified and characterized structural variations (SVs) and found that they were not closely linked with SNP distributions, however, the formation of SVs was closely associated with transposable elements. Furthermore, phylogenetic analysis using SVs revealed a novel A. cerana ecological group not recoverable from the SNP data. Performing environmental association analysis identified a total of 44 SVs likely to be associated with environmental adaptation. Verification and analysis of one of these, a 330 bp deletion in the Atpalpha gene, indicated that this SV may promote the cold adaptation of A. cerana by altering gene expression. Taken together, our study demonstrates the feasibility and utility of applying pan-genome approaches to map and explore genetic feature variations of honeybee populations, and in particular to examine the role of SVs in the evolution and environmental adaptation of A. cerana .
37

Genus-wide characterization of bumblebee genomes reveals variation associated with key ecological and behavioral traits of pollinators

Cheng Sun et al.May 31, 2020
Abstract Bumblebees are a diverse group of globally important pollinators in natural ecosystems and for agricultural food production. With both eusocial and solitary lifecycle phases, and some social parasite species, they are especially interesting models to understand social evolution, behavior, and ecology. Reports of many species in decline point to pathogen transmission, habitat loss, pesticide usage, and global climate change, as interconnected causes. These threats to bumblebee diversity make our reliance on a handful of well-studied species for agricultural pollination particularly precarious. To broadly sample bumblebee genomic and phenotypic diversity, we de novo sequenced and assembled the genomes of 17 species, representing all 15 subgenera, producing the first genus-wide quantification of genetic and genomic variation potentially underlying key ecological and behavioral traits. The species phylogeny resolves subgenera relationships while incomplete lineage sorting likely drives high levels of gene tree discordance. Five chromosome-level assemblies show a stable 18-chromosome karyotype, with major rearrangements creating 25 chromosomes in social parasites. Differential transposable element activity drives changes in genome sizes, with putative domestications of repetitive sequences influencing gene coding and regulatory potential. Dynamically evolving gene families and signatures of positive selection point to genus-wide variation in processes linked to foraging, diet and metabolism, immunity and detoxification, as well as adaptations for life at high altitudes. These high-quality genomic resources capture natural genetic and phenotypic variation across bumblebees, offering new opportunities to advance our understanding of their remarkable ecological success and to identify and manage current and future threats.
11

Extraordinary preservation of gene collinearity over three hundred million years revealed in homosporous lycophytes

Cheng Li et al.Jul 25, 2023
Abstract Homosporous lycophytes (Lycopodiaceae) are a deeply diverged lineage in the plant tree of life, having split from heterosporous lycophytes ( Selaginella and Isoetes ) ∼400 million years ago (MYA). Compared to the heterosporous lineage, Lycopodiaceae has markedly larger genome sizes and remains the last major plant clade for which no genomic data has been available. Here, we present chromosomal genome assemblies for two homosporous lycophyte species, the allotetraploid Huperzia asiatica and the diploid Diphasiastrum complanatum . Remarkably, despite that the two species diverged ∼350 MYA, around 30% of the genes are still in syntenic blocks. Furthermore, both genomes had undergone independent whole genome duplications and the resulting intra-genomic syntenies have likewise been preserved relatively well. Such slow genome evolution over deep time is in stark contrast to heterosporous lycophytes and is correlated with a decelerated rate of nucleotide substitution. Together, the genomes of H. asiatica and D. complanatum not only fill a crucial gap in the plant genomic landscape, but also uncover a possibly unique genomic contrast between homosporous and heterosporous species.
11

Transposable element and host silencing activity in gigantic genomes

Jie Wang et al.Dec 21, 2022
Abstract Transposable elements (TEs) and the silencing machinery of their hosts are engaged in a germline arms-race dynamic that shapes TE accumulation and, therefore, genome size. In animal species with extremely large genomes (>10 Gb), TE accumulation has been pushed to the extreme, prompting the question of whether TE silencing also deviates from typical conditions. To address this question, we characterize TE silencing via two pathways — the piRNA pathway and KRAB-ZFP transcriptional repression — in the male and female gonads of Ranodon sibiricus , a salamander species with a ∼21 Gb genome. We quantify 1) genomic TE diversity, 2) TE expression, and 3) small RNA expression and find a significant relationship between the expression of piRNAs and TEs they target for silencing in both sexes. We also quantified TE silencing pathway gene expression in R. sibiricus and 14 other vertebrates with genome sizes ranging from 1 – 130 Gb and find no association between pathway expression and genome size. Taken together, our results reveal that the gigantic R. sibiricus genome includes at least 19 putatively active TE superfamilies, all of which are targeted by the piRNA pathway in proportion to their expression levels, suggesting comprehensive piRNA-mediated silencing. Males have higher TE expression than females, suggesting that they may contribute more to the species’ high genomic TE load. We posit that apparently conflicting interpretations of TE silencing and genomic gigantism in the literature, as well as the absence of a correlation between TE silencing pathway gene expression and genome size, can be reconciled by considering whether the TE community or the host is currently “on the attack” in the arms race dynamic.
0

Tandem repeats contribute to coding sequence variation in bumblebees (Hymenoptera: Apidae)

Xiaomeng Zhao et al.Oct 11, 2017
Tandem repeats (TRs) are highly dynamic regions of the genome. Mutations at these loci represent a significant source of genetic variation and can facilitate rapid adaptation. Bumblebees are important pollinating insects occupying a wide range of habitats. However, to date, molecular mechanisms underlying the potential adaptation of bumblebees to diverse habitats are largely unknown. In the present study, we investigate how TRs contribute to genetic variation in bumblebees, thus potentially facilitating adaptation. We identified 26,595 TRs in the buff-tailed bumblebee (Bombus terrestris) genome, 66.7% of which reside in genic regions. We also compared TRs found in B. terrestris with those present in the whole genome sequence of a congener, B. impatiens. We found that a total of 1,137 TRs were variable in length between the two sequenced bumblebee species, and further analysis reveals that 101 of them are located within coding regions. The 101 TRs were responsible for coding sequence variation and corresponded to protein sequence length variation between the two bumblebee species. The variability of identified TRs in coding regions between bumblebees was confirmed by PCR amplification of a subset of loci. Functional classification of bumblebee genes where coding sequences include variable-length TRs suggests that a majority of these genes are related to transcriptional regulation. Our results show that TRs contribute to coding sequence variation in bumblebees and TRs may facilitate the adaptation of bumblebees through diversifying proteins involved in controlling gene expression.
Load More