HH
Haifei Hu
Author with expertise in Genetic Architecture of Quantitative Traits
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
12
(92% Open Access)
Cited by:
19
h-index:
13
/
i10-index:
18
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

A pangenome analysis pipeline (PSVCP) provides insights into rice functional gene identification

Jian Wang et al.Jun 17, 2022
Abstract Background A pangenome aims to capture the complete genetic diversity within a species and reduce bias in genetic analysis inherent in using a single reference genome. However, the current linear format of most plant pangenomes limits the presentation of position information for novel sequences. Graph pangenomes have been developed to overcome this limitation. However, there is a lack of bioinformatics analysis tools for graph format genomes. Results To overcome this problem, we have developed a novel pangenome construction strategy and a downstream pangenome analysis pipeline that captures position information while maintaining a linearized layout. We applied this strategy to construct a high-quality rice pangenome using 12 representative rice genomes and analyze an international rice panel with 413 diverse accessions using the pangenome reference. Our results provide insights into rice population structure and genomic diversity. Applying the pangenome for PAV-based GWAS analysis can identify causal structural variations for rice grain weight and plant height, while SNP-based GWAS can only identify approximate genomic locations. Additionally, a new locus (qPH8-1) was found to be associated with plant height on chromosome 8 that could not be detected using the SNP-based GWAS. Conclusions Our results demonstrate that the pangenome constructed by our pipeline combined with PAV-based GWAS can provide additional power for genomic and genetic analysis. The pangenome constructed in this study and associated genome sequence data provide valuable genomic resources for future rice crop improvement.
1
Citation4
0
Save
8

Duck pan-genome reveals two transposon-derived structural variations caused bodyweight enlarging and white plumage phenotype formation during evolution

Kejun Wang et al.Jan 30, 2023
ABSTRACT Structural variations (SVs) are a major source of domestication and improvement traits, however SV profiles of duck and their phenotypic impacts largely hidden. We present the first duck pan-genome constructed using five genome assemblies capturing ∼40.98 Mb new sequences. This pan-genome together with high-depth sequencing data (∼46.5X) identified 101,041 SVs, of which substantial proportions were derived from transposable element (TE) activity. Many TE-derived SVs anchoring in a gene body or regulatory region are linked to duck’s domestication and improvement. By combining quantitative genetics with molecular experiments, we dissect how TE-derived SVs change gene expression of IGF2BP1 and generate a novel transcript of MITF , shaping bodyweight and white plumage. In the IGF2BP1 locus, the TE-derived SV explains the largest effect on bodyweight among avian species (27.61% of phenotypic variation). Our findings highlight the importance of using a pan-genome as a reference in genomics studies and explore the roles of TE-derived SVs in trait formation and in livestock breeding.
8
Citation3
0
Save
1

Wheat Panache - a pangenome graph database representing presence/absence variation across 16 bread wheat genomes

Philipp Bayer et al.Feb 25, 2022
Abstract Bread wheat is one of humanity’s most important staple crops, characterized by a large and complex genome with a high level of gene presence/absence variation between cultivars, hampering genomic approaches for crop improvement. With the growing global population and the increasing impact of climate change on crop yield, there is an urgent need to apply genomic approaches to accelerate wheat breeding. With recent advances in DNA sequencing technology, a growing number of high-quality reference genomes are becoming available, reflecting the genetic content of a diverse range of cultivars. However, information on the presence or absence of genomic regions has been hard to visualize and interrogate due to the size of these genomes and the lack of suitable bioinformatics tools. To address this limitation, we have produced a wheat pangenome graph maintained within an online database to facilitate interrogation and comparison of wheat cultivar genomes. The database allows users to visualize regions of the pangenome to assess presence/absence variation between bread wheat genomes. Database URL: http://www.appliedbioinformatics.com.au/wheat_panache
1
Citation3
0
Save
0

Adaptive diversification through structural variation in barley

Murukarthick Jayakodi et al.Feb 18, 2024
Pangenomes are collections of annotated genome sequences of multiple individuals of a species. The structural variants uncovered by these datasets are a major asset to genetic analysis in crop plants. Here, we report a pangenome of barley comprising long-read sequence assemblies of 76 wild and domesticated genomes and short-read sequence data of 1,315 genotypes. An expanded catalogue of sequence variation in the crop includes structurally complex loci that have become hot spots of gene copy number variation in evolutionarily recent times. To demonstrate the utility of the pangenome, we focus on four loci involved in disease resistance, plant architecture, nutrient release, and trichome development. Novel allelic variation at a powdery mildew resistance locus and population-specific copy number gains in a regulator of vegetative branching were found. Expansion of a family of starch-cleaving enzymes in elite malting barleys was linked to shifts in enzymatic activity in micro-malting trials. Deletion of an enhancer motif is likely to change the developmental trajectory of the hairy appendages on barley grains. Our findings indicate that rapid evolution at structurally complex loci may have helped crop plants adapt to new selective regimes in agricultural ecosystems.
0
Citation2
0
Save
1

Haplotype mapping uncovers unexplored variation in wild and domesticated soybean at the major protein locus cqProt-003

Jacob Marsh et al.Oct 13, 2021
Abstract Here, we present association and linkage analysis of 985 wild, landrace and cultivar soybean accessions in a pan genomic dataset to characterize the major high-protein/low-oil associated locus cqProt-003 located on chromosome 20. A significant trait associated region within a 173 kb linkage block was identified and variants in the region were characterised, identifying 34 high confidence SNPs, 4 insertions, 1 deletion and a larger 304 bp structural variant in the high-protein haplotype. Trinucleotide tandem repeats of variable length present in the third exon of gene 20G085100 are strongly correlated with the high-protein phenotype and likely represent causal variation. Structural variation has previously been found in the same gene, for which we report the global distribution of the 304bp deletion and have identified additional nested variation present in high-protein individuals. Mapping variation at the cqProt-003 locus across demographic groups suggests that the high-protein haplotype is common in wild accessions (94.7%), rare in landraces (10.6%) and near absent in cultivated breeding pools (4.1%), suggesting its decrease in frequency primarily correlates with domestication and continued during subsequent improvement. However, the variation that has persisted in under-utilized wild and landrace populations holds high breeding potential for breeders willing to forego seed oil to maximise protein content. The results of this study include the identification of distinct haplotype structures within the high-protein population, and a broad characterization of the genomic context and linkage patterns of cqProt-003 across global populations, supporting future functional characterisation and modification. Key message The major soy protein QTL, cqProt-003, was analysed for haplotype diversity and global distribution, results indicate 304bp deletion and variable tandem repeats in protein coding regions are likely causal candidates.
1
Citation1
0
Save
0

GWAS and Transcriptomic Analysis Identify OsRING315 as a New Candidate Gene Controlling Amylose Content and Gel Consistency in Rice

Shuai Nie et al.Jun 8, 2024
Abstract Cooking quality is the main factor determining the market value of rice. Although several major genes and a certain number of QTLs controlling cooking quality have been identified, the genetic complexity and environmental susceptibility limit the further improvement for cooking quality by molecular breeding. This research conducted a genome-wide association study to elucidate the QTLs related to cooking quality including amylose content (AC), gel consistency (GC) and alkali spreading value (ASV) by using 450 rice accessions consisting of 300 indica and 150 japonica accessions in two distinct environments. A total of 54 QTLs were identified, including 25 QTLs for AC, 12 QTLs for GC and 17 QTLs for ASV. Among them, 10 QTLs were consistently observed by the same population in both environments. Six QTLs were co-localized with the reported QTLs or cloned genes. The Wx gene for AC and GC, and the ALK gene for ASV were identified in every population across the two environments. The qAC9-2 for AC and the qGC9-2 for GC were defined to the same interval. The OsRING315 gene, encoding an E3 ubiquitin ligase, was considered as the candidate gene for both qAC9-2 and qGC9-2 . The higher expression of OsRING315 corresponded to the lower AC and higher GC. Three haplotypes of OsRING315 were identified. The Hap 1 mainly existed in the japonica accessions and had lower AC. The Hap 2 and Hap 3 were predominantly present in the indica accessions, associated with higher AC. Meanwhile, the GC of accessions harboring Hap 1 was higher than that of accessions harboring Hap 3. In addition, the distribution of the three haplotypes in several rice-growing regions was unbalanced. The three traits of cooking quality are controlled by both major and minor genes and susceptible to environmental factors. The expression level of OsRING315 is related to both AC and GC, and this gene can be a promising target in quality improvement by using the gene editing method. Moreover, the haplotypes of OsRING315 differentiate between indica and japonica , and reveal the differences in GC and AC between indica and japonica rice.
0

A Novel Function of GW5 on Controlling the Early Growth Vigor and its Haplotype Effect on Shoot Dry Weight and Grain Size in Rice (Oryza sativa L.)

Tifeng Yang et al.Aug 10, 2024
Strong early growth vigor is an essential target in both direct seeded rice breeding and high-yielding rice breeding for rice varieties with relatively short growth duration in the double-cropping region. Shoot dry weight (SDW) is one of the important traits associated with early growth vigor, and breeders have been working to improve this trait. Finding stable QTLs or functional genes for SDW is crucial for improving the early growth vigor by implementing molecular breeding in rice. Here, a genome-wide association analysis revealed that the QTL for SDW, qSDW-5, was stably detected in the three cultivation methods commonly used in production practice. Through gene-based haplotype analysis of the annotated genes within the putative region of qSDW-5, and validated by gene expression and knockout transgenic experiments, LOC_Os05g09520, which is identical to the reported GW5/GSE5 controlling grain width (GW) and thousand grain weight (TGW) was identified as the causal gene for qSDW-5. Five main haplotypes of LOC_Os05g09520 were identified in the diverse international rice collection used in this study and their effects on SDW, GW and TGW were analyzed. Phenotypic comparisons of the major haplotypes of LOC_Os05g09520 in the three subpopulations (indica, japonica and aus) revealed the same patterns of wider GW and higher TGW along with higher SDW. Furtherly, the haplotype analysis of 138 rice varieties/lines widely used in southern China showed that 97.8% of the cultivars/lines carry Hap2
Load More