JH
John Hickey
Author with expertise in Genomic Selection in Plant and Animal Breeding
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
42
(43% Open Access)
Cited by:
1,253
h-index:
41
/
i10-index:
80
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Genomic prediction in CIMMYT maize and wheat breeding programs

José Crossa et al.Apr 10, 2013
Genomic selection (GS) has been implemented in animal and plant species, and is regarded as a useful tool for accelerating genetic gains. Varying levels of genomic prediction accuracy have been obtained in plants, depending on the prediction problem assessed and on several other factors, such as trait heritability, the relationship between the individuals to be predicted and those used to train the models for prediction, number of markers, sample size and genotype × environment interaction (GE). The main objective of this article is to describe the results of genomic prediction in International Maize and Wheat Improvement Center's (CIMMYT's) maize and wheat breeding programs, from the initial assessment of the predictive ability of different models using pedigree and marker information to the present, when methods for implementing GS in practical global maize and wheat breeding programs are being studied and investigated. Results show that pedigree (population structure) accounts for a sizeable proportion of the prediction accuracy when a global population is the prediction problem to be assessed. However, when the prediction uses unrelated populations to train the prediction equations, prediction accuracy becomes negligible. When genomic prediction includes modeling GE, an increase in prediction accuracy can be achieved by borrowing information from correlated environments. Several questions on how to incorporate GS into CIMMYT's maize and wheat programs remain unanswered and subject to further investigation, for example, prediction within and between related bi-parental crosses. Further research on the quantification of breeding value components for GS in plant breeding populations is required.
0
Citation389
0
Save
0

Genomic prediction unifies animal and plant breeding programs to form platforms for biological discovery

John Hickey et al.Sep 1, 2017
Wayne Powell and colleagues compare the different tools and approaches used by the plant breeding community versus the animal breeding community for crop and livestock improvement. They argue that the two disciplines can be united via adoption of genomic selection along with the exchange of resources and techniques between the two areas. The rate of annual yield increases for major staple crops must more than double relative to current levels in order to feed a predicted global population of 9 billion by 2050. Controlled hybridization and selective breeding have been used for centuries to adapt plant and animal species for human use. However, achieving higher, sustainable rates of improvement in yields in various species will require renewed genetic interventions and dramatic improvement of agricultural practices. Genomic prediction of breeding values has the potential to improve selection, reduce costs and provide a platform that unifies breeding approaches, biological discovery, and tools and methods. Here we compare and contrast some animal and plant breeding approaches to make a case for bringing the two together through the application of genomic selection. We propose a strategy for the use of genomic selection as a unifying approach to deliver innovative 'step changes' in the rate of genetic gain at scale.
0
Citation307
0
Save
0

Effectiveness of Genomic Prediction of Maize Hybrid Performance in Different Breeding Populations and Environments

Vanessa Windhausen et al.Nov 1, 2012
Abstract Genomic prediction is expected to considerably increase genetic gains by increasing selection intensity and accelerating the breeding cycle. In this study, marker effects estimated in 255 diverse maize (Zea mays L.) hybrids were used to predict grain yield, anthesis date, and anthesis-silking interval within the diversity panel and testcross progenies of 30 F2-derived lines from each of five populations. Although up to 25% of the genetic variance could be explained by cross validation within the diversity panel, the prediction of testcross performance of F2-derived lines using marker effects estimated in the diversity panel was on average zero. Hybrids in the diversity panel could be grouped into eight breeding populations differing in mean performance. When performance was predicted separately for each breeding population on the basis of marker effects estimated in the other populations, predictive ability was low (i.e., 0.12 for grain yield). These results suggest that prediction resulted mostly from differences in mean performance of the breeding populations and less from the relationship between the training and validation sets or linkage disequilibrium with causal variants underlying the predicted traits. Potential uses for genomic prediction in maize hybrid breeding are discussed emphasizing the need of (1) a clear definition of the breeding scenario in which genomic prediction should be applied (i.e., prediction among or within populations), (2) a detailed analysis of the population structure before performing cross validation, and (3) larger training sets with strong genetic relationship to the validation set.
0
Citation260
0
Save
0

Genomic Prediction in Maize Breeding Populations with Genotyping-by-Sequencing

José Crossa et al.Sep 11, 2013
Abstract Genotyping-by-sequencing (GBS) technologies have proven capacity for delivering large numbers of marker genotypes with potentially less ascertainment bias than standard single nucleotide polymorphism (SNP) arrays. Therefore, GBS has become an attractive alternative technology for genomic selection. However, the use of GBS data poses important challenges, and the accuracy of genomic prediction using GBS is currently undergoing investigation in several crops, including maize, wheat, and cassava. The main objective of this study was to evaluate various methods for incorporating GBS information and compare them with pedigree models for predicting genetic values of lines from two maize populations evaluated for different traits measured in different environments (experiments 1 and 2). Given that GBS data come with a large percentage of uncalled genotypes, we evaluated methods using nonimputed, imputed, and GBS-inferred haplotypes of different lengths (short or long). GBS and pedigree data were incorporated into statistical models using either the genomic best linear unbiased predictors (GBLUP) or the reproducing kernel Hilbert spaces (RKHS) regressions, and prediction accuracy was quantified using cross-validation methods. The following results were found: relative to pedigree or marker-only models, there were consistent gains in prediction accuracy by combining pedigree and GBS data; there was increased predictive ability when using imputed or nonimputed GBS data over inferred haplotype in experiment 1, or nonimputed GBS and information-based imputed short and long haplotypes, as compared to the other methods in experiment 2; the level of prediction accuracy achieved using GBS data in experiment 2 is comparable to those reported by previous authors who analyzed this data set using SNP arrays; and GBLUP and RKHS models with pedigree with nonimputed and imputed GBS data provided the best prediction correlations for the three traits in experiment 1, whereas for experiment 2 RKHS provided slightly better prediction than GBLUP for drought-stressed environments, and both models provided similar predictions in well-watered environments.
0
Citation239
0
Save
36

Genomic selection strategies for clonally propagated crops

Christian Werner et al.Jun 15, 2020
Abstract For genomic selection in clonal breeding programs to be effective, crossing parents should be selected based on genomic predicted cross performance unless dominance is negligible. Genomic prediction of cross performance enables a balanced exploitation of the additive and dominance value simultaneously. Here, we compared different strategies for the implementation of genomic selection in clonal plant breeding programs. We used stochastic simulations to evaluate six combinations of three breeding programs and two parent selection methods. The three breeding programs included i) a breeding program that introduced genomic selection in the first clonal testing stage, and ii) two variations of a two-part breeding program with one and three crossing cycles per year, respectively. The two parent selection methods were i) selection of parents based on genomic estimated breeding values, and ii) selection of parents based on genomic predicted cross performance. Selection of parents based on genomic predicted cross performance produced faster genetic gain than selection of parents based on genomic estimated breeding values because it substantially reduced inbreeding when the dominance degree increased. The two-part breeding programs with one and three crossing cycles per year using genomic prediction of cross performance always produced the most genetic gain unless dominance was negligible. We conclude that i) in clonal breeding programs with genomic selection, parents should be selected based on genomic predicted cross performance, and ii) a two-part breeding program with parent selection based on genomic predicted cross performance to rapidly drive population improvement has great potential to improve breeding clonally propagated crops.
36
Citation14
0
Save
1

AlphaImpute2: Fast and accurate pedigree and population based imputation for hundreds of thousands of individuals in livestock populations

Andrew Whalen et al.Sep 17, 2020
Abstract In this paper we present a new imputation algorithm, AlphaImpute2, which performs fast and accurate pedigree and population based imputation for livestock populations of hundreds of thousands of individuals. Genetic imputation is a tool used in genetics to decrease the cost of genotyping a population, by genotyping a small number of individuals at high-density and the remaining individuals at low-density. Shared haplotype segments between the high-density and low-density individuals can then be used to fill in the missing genotypes of the low-density individuals. As the size of genetics datasets have grown, the computational cost of performing imputation has increased, particularly in agricultural breeding programs where there might be hundreds of thousands of genotyped individuals. To address this issue, we present a new imputation algorithm, AlphaImpute2, which performs population imputation by using a particle based approximation to the Li and Stephens which exploits the Positional Burrows Wheeler Transform, and performs pedigree imputation using an approximate version of multi-locus iterative peeling. We tested AlphaImpute2 on four simulated datasets designed to mimic the pedigrees found in a real pig breeding program. We compared AlphaImpute2 to AlphaImpute, AlphaPeel, findhap version 4, and Beagle 5.1. We found that AlphaImpute2 had the highest accuracy, with an accuracy of 0.993 for low-density individuals on the pedigree with 107,000 individuals, compared to an accuracy of 0.942 for Beagle 5.1, 0.940 for AlphaImpute, and 0.801 for findhap. AlphaImpute2 was also the fastest software tested, with a runtime of 105 minutes a pedigree of 107,000 individuals and 5,000 markers was 105 minutes, compared to 190 minutes for Beagle 5.1, 395 minutes for findhap, and 7,859 minutes AlphaImpute. We believe that AlphaImpute2 will enable fast and accurate large scale imputation for agricultural populations as they scale to hundreds of thousands or millions of genotyped individuals.
1
Citation13
0
Save
2

Optimal cross selection for long-term genetic gain in two-part programs with rapid recurrent genomic selection

Gregor Gorjanc et al.Dec 18, 2017
Abstract This study evaluates optimal cross selection for balancing selection and maintenance of genetic diversity in two-part plant breeding programs with rapid recurrent genomic selection. The two-part program reorganizes a conventional breeding program into population improvement component with recurrent genomic selection to increase the mean of germplasm and product development component with standard methods to develop new lines. Rapid recurrent genomic selection has a large potential, but is challenging due to genotyping costs or genetic drift. Here we simulate a wheat breeding program for 20 years and compare optimal cross selection against truncation selection in the population improvement with one to six cycles per year. With truncation selection we crossed a small or a large number of parents. With optimal cross selection we jointly optimised selection, maintenance of genetic diversity, and cross allocation with AlphaMate program. The results show that the two-part program with optimal cross selection delivered the largest genetic gain that increased with the increasing number of cycles. With four cycles per year optimal cross selection had 78% (15%) higher long-term genetic gain than truncation selection with a small (large) number of parents. Higher genetic gain was achieved through higher efficiency of converting genetic diversity into genetic gain; optimal cross selection quadrupled (doubled) efficiency of truncation selection with a small (large) number of parents. Optimal cross selection also reduced the drop of genomic selection accuracy due to the drift between training and prediction populations. In conclusion, optimal cross-selection enables optimal management and exploitation of population improvement germplasm in two-part programs. Key message Optimal cross selection increases long-term genetic gain of two-part programs with rapid recurrent genomic selection. It achieves this by optimising efficiency of converting genetic diversity into genetic gain through reducing the loss of genetic diversity and reducing the drop of genomic prediction accuracy with rapid cycling.
2
Citation12
0
Save
0

Genomic data enables genetic evaluation using data recorded on low-middle income country smallholder dairy farms

Owen Powell et al.Nov 2, 2019
Abstract Background Genetic evaluation is a central component of a breeding program. In advanced economies, most genetic evaluations depend on large quantities of data that are recorded on commercial farms. Large herd sizes and widespread use of artificial insemination create strong genetic connectedness that enables the genetic and environmental effects of an individual animal’s phenotype to be accurately separated. In contrast to this, herds are neither large nor have strong genetic connectedness in smallholder dairy production systems of many low to middle-income countries (LMIC). This limits genetic evaluation, and furthermore, the pedigree information needed for traditional genetic evaluation is typically unavailable. Genomic information keeps track of shared haplotypes rather than shared relatives. This information could capture and strengthen genetic connectedness between herds and through this may enable genetic evaluations for LMIC smallholder dairy farms. The objective of this study was to use simulation to quantify the power of genomic information to enable genetic evaluation under such conditions. Results The results from this study show: (i) the genetic evaluation of phenotyped cows using genomic information had higher accuracy compared to pedigree information across all breeding designs; (ii) the genetic evaluation of phenotyped cows with genomic information and modelling herd as a random effect had higher or equal accuracy compared to modelling herd as a fixed effect; (iii) the genetic evaluation of phenotyped cows from breeding designs with strong genetic connectedness had higher accuracy compared to breeding designs with weaker genetic connectedness; (iv) genomic prediction of young bulls was possible using marker estimates from the genetic evaluations of their phenotyped dams. For example, the accuracy of genomic prediction of young bulls from an average herd size of 1 (μ=1.58) was 0.40 under a breeding design with 1,000 sires mated per generation and a training set of 8,000 phenotyped and genotyped cows. Conclusions This study demonstrates the potential of genomic information to be an enabling technology in LMIC smallholder dairy production systems by facilitating genetic evaluations with in-situ records collected from farms with herd sizes of four cows or less. Across a range of breeding designs, genomic data enabled accurate genetic evaluation of phenotyped cows and genomic prediction of young bulls using data sets that contained small herds with weak genetic connections. The use of smallholder dairy data in genetic evaluations would enable the establishment of breeding programs to improve in-situ germplasm and, if required, would enable the importation of the most suitable external germplasm. This could be individually tailored for each target environment. Together this would increase the productivity, profitability and sustainability of LMIC smallholder dairy production systems. However, data collection, including genomic data, is expensive and business models will need to be carefully constructed so that the costs are sustainably offset.
0
Citation5
0
Save
0

Parentage assignment with genotyping-by-sequencing data

Andrew Whalen et al.Feb 23, 2018
Abstract In this paper we evaluate using genotype-by-sequencing (GBS) data to perform parentage assignment in lieu of traditional array data. The use of GBS data raises two issues: First, for low-coverage GBS data, it may not be possible to call the genotype at many loci, a critical first step for detecting opposing homozygous markers. Second, the amount of sequencing coverage may vary across individuals, making it challenging to directly compare the likelihood scores between putative parents. To address these issues we extend the probabilistic framework of Huisman (2017) and evaluate putative parents by comparing their (potentially noisy) genotypes to a series of proposal distributions. These distributions describe the expected genotype probabilities for the relatives of an individual. We assign putative parents as a parent if they are classified as a parent (as opposed to e.g., an unrelated individual), and if the assignment score passes a threshold. We evaluated this method on simulated data and found that (1) high-coverage GBS data performs similarly to array data and requires only a small number of markers to correctly assign parents and (2) low-coverage GBS data (as low as 0.1x) can also be used, provided that it is obtained across a large number of markers. When analysing the low-coverage GBS data, we also found a high number of false positives if the true parent is not contained within the list of candidate parents, but that this false positive rate can be greatly reduced by hand tuning the assignment threshold. We provide this parentage assignment method as a standalone program called AlphaAssign.
0
Citation3
0
Save
Load More