DG
Dailu Guan
Author with expertise in Role of Long Noncoding RNAs in Cancer and Development
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
7
(86% Open Access)
Cited by:
3
h-index:
10
/
i10-index:
10
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Enriched atlas of lncRNA and protein-coding genes for the GRCg7b chicken assembly and its functional annotation across 47 tissues

Fabien Degalez et al.Aug 19, 2023
ABSTRACT Gene atlases for livestock are steadily improving thanks to new genome assemblies and new expression data improving the gene annotation. However, gene content varies across databases due to differences in RNA sequencing data and bioinformatics pipelines, especially for long non-coding RNAs (lncRNAs) which have higher tissue and developmental specificity and are harder to consistently identify compared to protein coding genes (PCGs). As done previously in 2020 for chicken assemblies galgal5 and GRCg6a, we provide a new gene atlas, lncRNA-enriched, for the latest GRCg7b chicken assembly, integrating “NCBI RefSeq”, “EMBL-EBI Ensembl/GENCODE” reference annotations and other resources such as FAANG and NONCODE. As a result, the number of PCGs increases from 18,022 (RefSeq) and 17,007 (Ensembl) to 24,102, and that of lncRNAs from 5,789 (RefSeq) and 11,944 (Ensembl) to 44,428. Using 1,400 public RNA-seq transcriptome representing 47 tissues, we provided expression evidence for 35,257 (79%) lncRNAs and 22,468 (93%) PCGs, supporting the relevance of this atlas. Further characterization including tissue-specificity, sex-differential expression and gene configurations are provided. We also identifiend conserved miRNA-hosting genes with human counterparts, suggesting common function. The annotated atlas is available at www.fragencode.org/lnchickenatlas.html .
1
Citation3
0
Save
0

Variability in porcine microRNA genes and its association with mRNA expression phenotypes

Emilio Mármol‐Sánchez et al.Apr 18, 2020
Background: Mature microRNAs (miRNAs) play an important role in repressing the expression of a wide range of protein coding transcripts by promoting their degradation or inhibiting their translation into functional proteins. The presence of segregating polymorphisms inside miRNA loci and their corresponding 3'UTR binding sites might disrupt canonical conserved miRNA-mRNA pairing, thus modifying gene expression patterns. Results: We aimed to investigate the variability of miRNA genes and their putative binding sites by analyzing whole-genome sequences from 120 pigs and wild boars from Europe and Asia. In total, 285 SNPs residing within miRNA loci were detected. From these, 221 were located in precursor regions, whereas 52 and 12 mapped to mature and seed regions, respectively. Moreover, a total of 109,724 polymorphisms were identified in 7mer-m8 miRNA binding sites within porcine 3'UTRs. A principal components analysis revealed a clear genetic divergence between Asian and European samples, which was particularly strong for 3'UTR sequences. We also observed that miRNA genes show reduced polymorphism compared with other non-miRNA regions. To assess the potential consequences of miRNA polymorphisms, we sequenced the genomes of 5 Duroc pigs and, by doing so, we identified 15 miRNA SNPs that were genotyped in the offspring (N = 345) of the five boars. Association analyses between miRNA SNPs and hepatic and muscle microarray data allowed us to identify 4 polymorphisms displaying significant associations. Particularly interesting was the rs319154814 polymorphism (G/A), located in the apical loop of the ssc-miR-326 precursor sequence. This polymorphism is predicted to cause a subtle hairpin rearrangement that improves the accessibility to processing enzymatic factors. Conclusions: Porcine miRNA genes show a reduced variability, particularly in the seed region which plays a critical role in miRNA binding. Although it is generally assumed that SNPs mapping to the seed region are the ones with the strongest consequences on mRNA expression, we show that a SNP mapping to the apical region of ssc-miR-326 is associated with the mRNA expression of several of its predicted targets. This result suggests that porcine miRNA variability mapping within and outside the seed region could have important regulatory effects on gene expression.### Competing Interest StatementThe authors have declared no competing interest.
1

The ChickenGTEx pilot analysis: a reference of regulatory variants across 28 chicken tissues

Dailu Guan et al.Jun 29, 2023
Abstract Chicken is a valuable model for understanding fundamental biology, vertebrate evolution and diseases, as well as a major source of nutrient-dense and lean-protein-enriched food globally. Although it is the first non-mammalian amniote genome to be sequenced, the chicken genome still lacks a systematic characterization of functional impacts of genetic variants. Here, through integrating 7,015 RNA-Seq and 2,869 whole-genome sequence data, the Chicken Genotype- Tissue Expression (ChickenGTEx) project presents the pilot reference of regulatory variants in 28 chicken tissue transcriptomes, including millions of regulatory effects on primary expression (including protein-coding genes, lncRNA and exon) and post-transcriptional modifications (alternative splicing and 3’ untranslated region alternative polyadenylation). We explored the tissue-sharing and context-specificity of these regulatory variants, their underlying molecular mechanisms of action, and their utility in interpreting adaptation and genome-wide associations of 108 chicken complex traits. Finally, we illustrated shared and lineage-specific features of gene regulation between chickens and mammals, and demonstrated how the ChickenGTEx resource can further assist with translating genetic findings across species. One-Sentence Summary The ChickenGTEx provides a multi-tissue reference of regulatory variants for chicken genetics and genomics, functional genomics, precision breeding, veterinary medicine, vertebrate evolution and even human biomedicine.
4

Learning functional conservation between pig and human to decipher evolutionary mechanisms underlying gene expression and complex trait

Jinghui Li et al.Jan 15, 2023
Abstract The assessment of genomic conservation between human and pig at the functional level can help understand and improve the potential of pig as a human biomedical model. To address this, we developed a Deep learning-based approach to learn the G enomic C onservation at the F unctional level (DeepGCF) between species by integrating 386 and 374 epigenome and transcriptome profiles from human and pig, respectively. DeepGCF demonstrated a better prediction performance compared to the previous functional conservation prediction method. In addition, we showed that the resulting DeepGCF score captures the functional conservation by examining DeepGCF on chromatin states, sequence ontologies, and regulatory variants. Regions with higher DeepGCF score play a more important role in regulatory activities and show heritability enrichment in human complex traits and diseases. Our DeepGCF approach shows a promising application on the comparison of cross-species functional conservation, and the model framework can be easily adapted to other species. By expanding the model to integrate the functional profiles of multiple species, including human, mouse, pig, cattle, and other livestock animals in the future, the functional conservation information will provide additional insight into the genetic and evolutionary mechanisms behind complex traits and diseases.
0

Short Communication: Comparing the microbiota diversity from the core, middle part and rind of six Spanish commercial goat cheeses

María Luigi‐Sierra et al.May 24, 2024
The cheese core has a lower oxygen saturation and salinity and a higher acidity than the rind, but there is controversy about the incidence of such factors on the magnitude of microbial diversity. The goal of the current work was to investigate the existence of differences in α-diversity between the core, middle part, and rind of six Spanish commercial cheeses through a sequencing approach. To this end, we have collected rind, middle part, and core samples from fresh (H and M), soft semi-ripened (C and P), hard semi-ripened (B) and semi-hard aged (G) goat cheeses. After purifying deoxyribonucleic acid from these 18 samples, the V3-V4 ultravariable region of the 16S rRNA gene was sequenced. The analysis of microbial composition revealed that lactic acid bacteria from the genera Lactococcus, Lactobacillus, Streptococcus, and Leuconostoc are predominant in all six goat cheeses. Furthermore, we identified several psychrophilic taxa often associated with the post-pasteurization contamination of refrigerated milk. Comparison of three α-diversity estimators (Chao1, Shannon and Faith's phylogenetic diversity indices) of microbiota in the core, middle part, and rind of all six goat cheeses did not reveal substantial differences, being only significant (at the nominal level) the comparison of rind vs middle part for the Shannon index (P-value = 0.031). Moreover, the construction of a dendrogram based on Aitchison distances revealed that cheese samples cluster according to their manufacturing characteristics, with a clear distinction between fresh vs semi-ripened or aged cheeses. We conclude that the magnitude of microbial α-diversity in the cheese core is similar to that in the rind despite their different physicochemical attributes. This result could be because physicochemical differences between cheese compartments are often attenuated during cheese ripening.
0

Evidence Supporting a Role of Alternative Splicing Participates in Melon (Cucumis melo L.) Fruit Ripening

Wenjiao Wang et al.May 28, 2024
One key post-transcriptional modification mechanism that dynamically controls a number of physiological processes in plants is alternative splicing (AS). However, the functional impacts of AS on fruit ripening remain unclear. In this research, we used RNA-seq data from climacteric (VED, Harukei 3) and non-climacteric (PI, PS) melon cultivars to explore alternative splicing (AS) in immature and mature fruit. The results revealed dramatic changes in differential AS genes (DAG) between the young and mature fruit stages, particularly in genes involved in fruit development/ripening, carotenoid and capsaicinoid biosynthesis, and starch and sucrose metabolism. Serine/arginine-rich (SR) family proteins are known as important splicing factors in AS events. From the melon genome, a total of 17 SR members were discovered in this study. These genes could be classified into eight distinct subfamilies based on gene structure and conserved motifs. Promoter analysis detected various cis-acting regulatory elements involved in hormone pathways and fruit development. Interestingly, these SR genes exhibited specific expression patterns in reproductive organs such as flowers and ovaries. Additionally, concurrent with the increase in AS levels in ripening fruit, the transcripts of these SR genes were activated during fruit maturation in both climacteric and non-climacteric melon varieties. We also found that most SR genes were under selection during domestication. These results represent a novel finding of increased AS levels and SR gene expression during fruit ripening, indicating that alternative splicing may play a role in fruit maturation.
7

A comprehensive prediction of transcript isoforms in 19 chicken tissues by Oxford Nanopore long-read sequencing

Dailu Guan et al.Jul 19, 2022
Abstract To comprehensively identify and annotate transcript isoforms in the chicken genome, we generated Nanopore long-read sequencing data from a diverse set of 19 chicken tissues comprising 68 samples collected from experimental line 6 × line 7 F 1 adult males and females. More than 23.8 million reads with mean read length of 790 bases and average quality of 18.2 were generated. The annotation and subsequent filtering resulted in identification of 55,382 transcripts with mean length of 1,700 bases at 40,547 loci, representing ∼1.4 transcripts per locus. Among them, we predicted 30,967 potential coding transcripts at 19,461 loci and 16,495 potential lncRNA transcripts at 15,512 loci. Compared to reference annotations, we found 52% of annotated transcripts could partially to fully match while 47% were novel and potentially transcribed from lncRNA loci. Based on our annotation, we quantified transcript expression across tissues and found brain tissues (i.e. cerebellum, cortex) expressed highest number of transcripts and loci. The further tissue specificity revealed that ∼22% of the transcripts displaying tissue specificity. Of them, the reproductive tissues (i.e. testis, ovary) contained the most tissue-specific transcripts. Despite sequencing 68 transcriptomes derived from 19 tissues, still ∼20% of Ensembl reference loci were not detected. This suggests that including additional samples from different cell types, developmental and physiological conditions, is needed to fully annotate the chicken genome. The application of Nanopore sequencing transcriptomes in this study demonstrated the usefulness of long-read data in discovering additional novel loci (e.g., lncRNA loci) and resolving complex transcripts (e.g., the longest transcript for the TTN locus).