WG
Weilong Guo
Author with expertise in Genetic Diversity and Breeding of Wheat
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
10
(80% Open Access)
Cited by:
374
h-index:
29
/
i10-index:
53
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

BS-Seeker2: a versatile aligning pipeline for bisulfite sequencing data

Weilong Guo et al.Nov 10, 2013
+5
W
P
W
Abstract Background DNA methylation is an important epigenetic modification involved in many biological processes. Bisulfite treatment coupled with high-throughput sequencing provides an effective approach for studying genome-wide DNA methylation at base resolution. Libraries such as whole genome bisulfite sequencing (WGBS) and reduced represented bisulfite sequencing (RRBS) are widely used for generating DNA methylomes, demanding efficient and versatile tools for aligning bisulfite sequencing data. Results We have developed BS-Seeker2, an updated version of BS Seeker, as a full pipeline for mapping bisulfite sequencing data and generating DNA methylomes. BS-Seeker2 improves mappability over existing aligners by using local alignment. It can also map reads from RRBS library by building special indexes with improved efficiency and accuracy. Moreover, BS-Seeker2 provides additional function for filtering out reads with incomplete bisulfite conversion, which is useful in minimizing the overestimation of DNA methylation levels. We also defined CGmap and ATCGmap file formats for full representations of DNA methylomes, as part of the outputs of BS-Seeker2 pipeline together with BAM and WIG files. Conclusions Our evaluations on the performance show that BS-Seeker2 works efficiently and accurately for both WGBS data and RRBS data. BS-Seeker2 is freely available at http://pellegrini.mcdb.ucla.edu/BS_Seeker2/ and the Galaxy server.
0
Citation373
0
Save
0

Tagging large CNV blocks in wheat boosts digitalization of germplasm resources by ultra-low-coverage sequencing

Sun Qixin et al.Jul 1, 2024
+12
S
W
S
Abstract Background The massive structural variations and frequent introgression highly contribute to the genetic diversity of wheat, while the huge and complex genome of polyploid wheat hinders efficient genotyping of abundant varieties towards accurate identification, management, and exploitation of germplasm resources. Results We develop a novel workflow that identifies 1240 high-quality large copy number variation blocks (CNVb) in wheat at the pan-genome level, demonstrating that CNVb can serve as an ideal DNA fingerprinting marker for discriminating massive varieties, with the accuracy validated by PCR assay. We then construct a digitalized genotyping CNVb map across 1599 global wheat accessions. Key CNVb markers are linked with trait-associated introgressions, such as the 1RS·1BL translocation and 2N v S translocation, and the beneficial alleles, such as the end-use quality allele Glu-D1d (Dx5 + Dy10) and the semi-dwarf r-e-z allele. Furthermore, we demonstrate that these tagged CNVb markers promote a stable and cost-effective strategy for evaluating wheat germplasm resources with ultra-low-coverage sequencing data, competing with SNP array for applications such as evaluating new varieties, efficient management of collections in gene banks, and describing wheat germplasm resources in a digitalized manner. We also develop a user-friendly interactive platform, WheatCNVb ( http://wheat.cau.edu.cn/WheatCNVb/ ), for exploring the CNVb profiles over ever-increasing wheat accessions, and also propose a QR-code-like representation of individual digital CNVb fingerprint. This platform also allows uploading new CNVb profiles for comparison with stored varieties. Conclusions The CNVb-based approach provides a low-cost and high-throughput genotyping strategy for enabling digitalized wheat germplasm management and modern breeding with precise and practical decision-making.
0
Citation1
0
Save
0

lcQTH: rapid quantitative trait mapping through tracing parental haplotype with ultra-low-coverage sequencing

Wenxi Wang et al.Jun 1, 2024
+8
Z
Z
W
0

Plasmid-mediated azithromycin resistance in non-typhoidal Salmonella recovered from human infections

X. Zhang et al.Aug 9, 2024
+4
S
J
X
Abstract Objectives Mechanisms of non-typhoidal Salmonella (NTS) resistance to azithromycin have rarely been reported. Here we investigate the epidemiology and genetic features of 10 azithromycin-resistant NTS isolates. Methods A total of 457 NTS isolates were collected from a tertiary hospital in Guangzhou. We performed antimicrobial susceptibility tests, conjugation experiments, efflux pump expression tests, whole-genome sequencing and bioinformatics analysis to conduct the study. Results The results showed that 10 NTS isolates (2.8%) were resistant to azithromycin with minimum inhibitory concentration values ranging from 128 to 512 mg/L and exhibited multidrug resistance. The phylogenetic tree revealed that 5 S. London isolates (AR1–AR5) recognized at different times and departments were closely related [3–74 single-nucleotide polymorphisms (SNPs)] and 2 S. Typhimurium isolates (AR7 and AR8) were clones (&lt;3 SNPs) at 3-month intervals. The azithromycin resistance was conferred by mph(A) gene found on different plasmids, including IncFIB, IncHI2, InFII, IncC and IncI plasmids. Among them, IncFIB, InFII and IncHI2 plasmids carried different IS26-class 1 integron (intI1) arrangement patterns that mediated multidrug resistance transmission. Conjugative IncC plasmid encoded resistance to ciprofloxacin, ceftriaxone and azithromycin. Furthermore, phylogenetic analysis demonstrated that mph(A)-positive plasmids closely related to 10 plasmids in this study were mainly discovered from NTS, Escherichia coli, Klebsiella pneumonia and Enterobacter hormaechei. The genetic environment of mph(A) in 10 NTS isolates was IS26-mph(A)-mrx(A)-mphR(A)-IS6100/IS26 that co-arranged with intI1 harbour multidrug-resistant (MDR) gene cassettes on diverse plasmids. Conclusions These findings highlighted that the dissemination of these plasmids carrying mph(A) and various intI1 MDR gene cassettes would seriously restrict the availability of essential antimicrobial agents for treating NTS infections.
1

Rice Gene Index (RGI): a comprehensive pan-genome database for comparative and functional genomics of Asian rice

Zhichao Yu et al.Feb 15, 2023
+13
W
M
Z
Abstract To integrate the genomic information of the rice pan-genome, we performed comparative analyses and established a user-friendly Rice Gene Index (RGI, https://riceome.hzau.edu.cn ) platform with 16 platinum standard reference genomes and supplementary transcriptome data. To logically organize and scientifically the index of 744,233 genes among rice accessions, we detected 112,658 Ortholog Gene Indices, and provide ‘GeneCard’ pages to query genomic, transcriptomic, and homology information for each gene. The RGI allows users to search for relationships and comprehensive information of genes in keyword-based, sequence-based, and relationship-based ways. Furthermore, users can visualize these relationships at local and global scales corresponding to ‘Microcollinearity’ and ‘Macrocollinearity’ modules.
0

Tracing the genetic diversity of the bread wheat D genome

Zihao Wang et al.Aug 24, 2024
+11
Y
W
Z
Bread wheat (Triticum aestivum) became a globally dominant crop after incorporating the D genome from donor species Aegilops tauschii, while evolutionary history shaping the D genome during this process remains elusive. Here, we proposed a renewed evolutionary model linking Ae. tauschii and hexaploid wheat D genome, based on an ancestral haplotype map covering a total of 762 Ae. tauschii and hexaploid wheat accessions. We dissected the evolutionary process of Ae. tauschii lineages and clarified L3 as the most ancient lineage. A few independent intermediate accessions were reported, demonstrating the low-frequent inter-sublineage geneflow enriched the diversity of Ae. tauschii. We discovered that the D genome of hexaploid wheat inherited from a unified ancestral template, but with a mosaic composition that is highly mixed by three Ae. tauschii L2 sublineages located in the Caspian coastal region, suggesting the early agricultural activities facilitate the innovation of D genome compositions that finalized the success of hexaploidization. We further found that the majority (65.6%) of polymorphisms were attributed to novel mutations absent during the spreading of bread wheat, and also identified large Ae. tauschii introgressions from wild Aegilops lineages, expanding the diversity of wheat D genome and introducing beneficial alleles. This work decoded the mystery of the wheat hexaploidization process and the evolutionary significance of the multi-layered origins of the genetic diversity of the bread wheat D genome.
3

Pangenome-based dynamic trajectories of intracellular gene transfers in Poaceae unveil a high rate of unceasing integration and selective retention in Triticeae

Yongming Chen et al.Oct 13, 2022
+13
J
Z
Y
ABSTRACT Intracellular gene transfers (IGTs) between the nucleus and organelles, including plastids and mitochondria, constantly reshapes the nuclear genome during evolution. Despite the substantial contribution of IGTs to genome variation, the dynamic trajectories of IGTs at the pangenomic level remain elusive. Here, we propose a novel approach, IGTminer, to map the evolutionary trajectories of IGTs by collinearity and gene reannotation across multiple genome assemblies. IGTminer was applied to create a nuclear organelle gene (NOG) map across 67 genomes covering 15 Poaceae species, including important crops, revealing the polymorphisms and trajectory dynamics of NOGs. The NOGs produced were verified by experimental evidence and resequencing datasets. We found that most of the NOGs were recently transferred and lineage specific, and that Triticeae species tended to have more NOGs than other Poaceae species. Wheat had a higher retention rate of NOGs than maize and rice, and the retained NOGs were likely involved in the photosynthesis and translation pathways. Large numbers of NOG clusters were aggregated in hexaploid wheat during two rounds of polyploidization and contributed to the genetic diversities among modern wheat varieties. Finally, we proposed a radiocarbon-like model illustrating the transfer and elimination dynamics of NOGs, highlighting the unceasing integration and selective retention of NOGs over evolutionary time. In addition, we implemented an interactive webserver for NOG exploration in Poaceae. In summary, this study provides new resources and clues for the roles of IGTs in shaping inter- and intraspecies genome variation and driving plant genome evolution.
0

SnpHub: an easy-to-set-up web server framework for exploring large-scale genomic variation data in the post-genomic era with applications in wheat

Wenxi Wang et al.May 16, 2019
+7
Z
X
W
Background The cost of high-throughput sequencing is rapidly decreasing, allowing researchers to investigate genomic variations across hundreds or even thousands of samples in the post-genomic era. The management and exploration of these large-scale genomic variation data require programming skills. The public genotype querying databases of many species are usually centralized and implemented independently, making them difficult to update with new data over time. Currently, there is a lack of a widely used framework for setting up user-friendly web servers for exploring new genomic variation data in diverse species.Results Here, we present SnpHub, a Shiny/R-based server framework for retrieving, analysing and visualizing the large-scale genomic variation data that be easily set up on any Linux server. After a pre-building process based on the provided VCF files and genome annotation files, the local server allows users to interactively access SNPs/INDELs and annotation information by locus or gene and for user-defined sample sets through a webpage. Users can freely analyse and visualize genomic variations in heatmaps, phylogenetic trees, haplotype networks, or geographical maps. Sample-specific sequences can be accessed as replaced by SNPs/INDELs.Conclusions SnpHub can be applied to any species, and we build up a SnpHub portal website for wheat and its progenitors based on published data in present studies. SnpHub and its tutorial are available as .
0

A k-mer-based pangenome approach for cataloging seed-storage-protein genes in wheat to facilitate genotype-to-phenotype prediction and improvement of end-use quality

Zhaoheng Zhang et al.May 24, 2024
+14
B
D
Z
Wheat is a staple food for more than 35% of the world's population, with wheat flour used to make hundreds of baked goods. Superior end-use quality is a major breeding target; however, improving it is especially time-consuming and expensive. Furthermore, genes encoding seed-storage proteins (SSPs) form multi-gene families and are repetitive, with gaps commonplace in several genome assemblies. To overcome these barriers and efficiently identify superior wheat SSP alleles, we developed "PanSK" (Pan-SSP k-mer) for genotype-to-phenotype prediction based on an SSP-based pangenome resource. PanSK uses 29-mer sequences that represent each SSP gene at the pangenomic level to reveal untapped diversity across landraces and modern cultivars. Genome-wide association studies with k-mers identified 23 SSP genes associated with end-use quality that represent novel targets for improvement. We evaluated the effect of rye secalin genes on end-use quality and found that removal of ω-secalins from 1BL/1RS wheat translocation lines is associated with enhanced end-use quality. Finally, using machine-learning-based prediction inspired by PanSK, we predicted the quality phenotypes with high accuracy from genotypes alone. This study provides an effective approach for genome design based on SSP genes, enabling the breeding of wheat varieties with superior processing capabilities and improved end-use quality.
0

Natural variation of STKc_GSK3 kinase TaSG-D1 contributes to heat stress tolerance in Indian dwarf wheat

Jie Cao et al.Mar 7, 2024
+9
G
Z
J
Heat stress threatens global wheat (Triticum aestivum) production, causing dramatic yield losses worldwide. Identifying heat tolerance genes and comprehending molecular mechanisms are essential. Here, we identify a heat tolerance gene, TaSG-D1E286K, in Indian dwarf wheat (Triticum sphaerococcum), which encodes an STKc_GSK3 kinase. TaSG-D1E286K improves heat tolerance compared to TaSG-D1 by enhancing phosphorylation and stability of downstream target TaPIF4 under heat stress condition. Additionally, we reveal evolutionary footprints of TaPIF4 during wheat selective breeding in China, that is, InDels predominantly occur in the TaPIF4 promoter of Chinese modern wheat cultivars and result in decreased expression level of TaPIF4 in response to heat stress. These sequence variations with negative effect on heat tolerance are mainly introduced from European germplasm. Our study provides insight into heat stress response mechanisms and proposes a potential strategy to improve wheat heat tolerance in future.