HH
Haixiao Hu
Author with expertise in Genetic Architecture of Quantitative Traits
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
6
(100% Open Access)
Cited by:
8
h-index:
14
/
i10-index:
18
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
10

Multi-omics prediction of oat agronomic and seed nutritional traits across environments and in distantly related populations

Haixiao Hu et al.May 3, 2021
+13
T
M
H
ABSTRACT Multi-omics prediction has been shown to be superior to genomic prediction with genome-wide DNA-based genetic markers (G) for predicting phenotypes. However, most of the existing studies were based on historical datasets from one environment; therefore, they were unable to evaluate the efficiency of multi-omics prediction in multi-environment trials and distantly-related populations. To fill those gaps, we designed a systematic experiment to collect omics data and evaluate 17 traits in two oat breeding populations planted in single and multiple environments. In the single-environment trial, transcriptomic BLUP (T), metabolomic BLUP (M), G+T, G+M and G+T+M models showed greater prediction accuracy than GBLUP for 5, 10, 11, 17 and 17 traits, respectively, and metabolites generally performed better than transcripts when combined with SNPs. In the multi-environment trial, multi-trait models with omics data outperformed both counterpart multi-trait GBLUP models and single-environment omics models, and the highest prediction accuracy was achieved when modeling genetic covariance as an unstructured covariance model. We also demonstrated that omics data can be used to prioritize loci from one population with omics data to improve genomic prediction in a distantly-related population using a two-kernel linear model that accommodated both likely casual loci with large-effect and loci that explain little or no phenotypic variance. We propose that the two-kernel linear model is superior to most genomic prediction models that assume each variant is equally likely to affect the trait and can be used to improve prediction accuracy for any trait with prior knowledge of genetic architecture.
10
Citation3
0
Save
15

Translating insights from the seed metabolome into improved prediction for healthful compounds in oat (Avena sativa L.)

Malachy Campbell et al.Jul 7, 2020
+6
T
H
M
Abstract Oat ( Avena sativa L.) seed is a rich resource of beneficial lipids, soluble fiber, protein, and antioxidants, and is considered a healthful food for humans. Despite these characteristics, little is known regarding the genetic controllers of variation for these compounds in oat seed. We sought to characterize natural variation in the mature seed metabolome using untargeted metabolomics on 367 diverse lines and leverage this information to improve prediction for seed quality traits. We used a latent factor approach to define unobserved variables that may drive covariance among metabolites. One hundred latent factors were identified, of which 21% were enriched for compounds associated with lipid metabolism. Through a combination of whole-genome regression and association mapping, we show that latent factors that generate covariance for many metabolites tend to have a complex genetic architecture. Nonetheless, we recovered significant associations for 23% of the latent factors. These associations were used to inform a multi-kernel genomic prediction model, which was used to predict seed lipid and protein traits in two independent studies. Predictions for eight of the 12 traits were significantly improved compared to genomic best linear unbiased prediction when this prediction model was informed using associations from lipid-enriched factors. This study provides new insights into variation in the oat seed metabolome and provides genomic resources for breeders to improve selection for health-promoting seed quality traits. More broadly, we outline an approach to distill high-dimensional ‘omics’ data to a set of biologically-meaningful variables and translate inferences on these data into improved breeding decisions.
15
Citation2
0
Save
0

Heritable temporal gene expression patterns correlate with metabolomic seed content in developing hexaploid oat seed

Haixiao Hu et al.Jul 28, 2019
+6
X
J
H
Summary Oat ranks sixth in world cereal production and has a higher content of health-promoting compounds compared to other cereals. However, there is neither a robust oat reference genome nor transcriptome. Using deeply sequenced full-length mRNA libraries of oat cultivar Ogle-C, a de novo high-quality and comprehensive oat seed transcriptome was assembled. With this reference transcriptome and QuantSeq 3’ mRNA sequencing, gene expression was quantified during seed development from 22 diverse lines across six time points. Transcript expression showed higher correlations between adjacent time points. Based on differentially expressed genes, we identified 22 major temporal co-expression (TCoE) patterns of gene expression and revealed enriched gene ontology biological processes. Within each TCoE set, highly correlated transcripts, putatively commonly affected by genetic background, were clustered, and termed genetic co-expression (GCoE) sets. 17 of the 22 TCoE sets had GCoE sets with median heritabilities higher than 0.50, and these heritability estimates were much higher than that estimated from permutation analysis, with no divergence observed in cluster sizes between permutation and non-permutation analyses. Linear regression between 634 metabolites from mature seeds and the PC1 score of each of the GCoE sets showed significantly lower p-values than permutation analysis. Temporal expression patterns of oat avenanthramides and lipid biosynthetic genes were concordant with previous studies of avenanthramide biosynthetic enzyme activity and lipid accumulation. This study expands our understanding of physiological processes that occur during oat seed maturation and provides plant breeders the means to change oat seed composition through targeted manipulation of key pathways.
0
Citation1
0
Save
1

Selection for seed size has indirectly shaped specialized metabolite abundance in oat (Avena sativaL.)

Lauren Brzozowski et al.Aug 19, 2021
+7
M
H
L
Summary Plant breeding strategies to optimize metabolite profiles are necessary to develop health-promoting food crops. In oats ( Avena sativa L.), seed metabolites are of interest for their antioxidant properties and their agronomic role in mitigating disease severity, yet have not been a direct target of selection in breeding. In a diverse oat germplasm panel spanning a century of breeding, we investigated the degree of variation of these specialized metabolites and how it has been molded by selection for other traits, like yield components. We also ask if these patterns of variation persist in modern breeding pools. Integrating genomic, transcriptomic, metabolomic and phenotypic analyses for three types of seed specialized metabolites – avenanthramides, avenacins, and avenacosides – we found reduced genetic variation in modern germplasm compared to diverse germplasm, in part due to increased seed size associated with more intensive breeding. Specifically, we found that abundance of avenanthramides increases with seed size, but additional variation is attributable to expression of biosynthetic enzymes, but avenacoside abundance decreases with seed size and plant breeding intensity. Overall, we show that increased seed size associated with plant breeding has uneven effects on the seed metabolome, and broadly contributes to understanding how selection shapes plant specialized metabolism.
1
Citation1
0
Save
17

Allele-specific expression reveals multiple paths to highland adaptation in maize

Haixiao Hu et al.Jul 16, 2022
+8
S
T
H
Abstract Maize is a staple food of smallholder farmers living in highland regions up to 4,000 meters above sea level worldwide. Mexican and South American highlands are two major highland maize growing regions, and population genetic data suggests the maize’s adaptation to these regions occurred largely independently, providing a case study for parallel evolution. To better understand the mechanistic basis of highland adaptation, we crossed maize landraces from 108 highland and lowland sites of Mexico and South America with the inbred line B73 to produce F 1 hybrids and grew them in both highland and lowland sites in Mexico. We identified thousands of genes with divergent expression between highland and lowland populations. Hundreds of these genes show patterns of convergent evolution between Mexico and South America. To dissect the genetic architecture of the divergent gene expression, we developed a novel allele-specific expression analysis pipeline to detect genes with divergent functional cis- regulatory variation between highland and lowland populations. We identified hundreds of genes with divergent cis- regulation between highland and lowland landrace alleles, with 20 in common between regions, further suggesting convergence in the genes underlying highland adaptation. Further analyses suggest multiple mechanisms contribute to this convergence. Our findings reveal a complex genetic architecture of cis -regulatory alleles underlying adaptation to highlands in maize. Although the vast majority of evolutionary changes associated with highland adaptation were region-specific, our findings highlight an important role for convergence at the gene expression and gene regulation levels as well.
17
Citation1
0
Save
0

MegaLMM improves genomic predictions in new environments using environmental covariates

Haixiao Hu et al.Mar 11, 2024
D
R
H
ABSTRACT Multi-environment trials (METs) are crucial for identifying varieties that perform well across a target population of environments (TPE). However, METs are typically too small to sufficiently represent all relevant environment-types, and face challenges from changing environment-types due to climate change. Statistical methods that enable prediction of variety performance for new environments beyond the METs are needed. We recently developed MegaLMM, a statistical model that can leverage hundreds of trials to significantly improve genetic value prediction accuracy within METs. Here, we extend MegaLMM to enable genomic prediction in new environments by learning regressions of latent factor loadings on Environmental Covariates (ECs) across trials. We evaluated the extended MegaLMM using the maize Genome-To-Fields dataset, consisting of 4402 varieties cultivated in 195 trials with 87.1% of phenotypic values missing, and demonstrated its high accuracy in genomic prediction under various breeding scenarios. Furthermore, we showcased MegaLMM’s superiority over univariate GBLUP in predicting trait performance of experimental genotypes in new environments. Finally, we explored the use of higher-dimensional quantitative ECs and discussed when and how detailed environmental data can be leveraged for genomic prediction from METs. We propose that MegaLMM can be applied to plant breeding of diverse crops and different fields of genetics where large-scale linear mixed models are utilized.