JW
John Woolliams
Author with expertise in Genomic Selection in Plant and Animal Breeding
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
12
(50% Open Access)
Cited by:
2,183
h-index:
57
/
i10-index:
216
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Genome-Wide Survey of SNP Variation Uncovers the Genetic Structure of Cattle Breeds

Richard Gibbs et al.Apr 23, 2009
+87
C
J
R
A survey of genetic diversity of cattle suggests two domestication events in Asia and selection by husbandry.
0
Citation796
0
Save
0

The Impact of Genetic Architecture on Genome-Wide Evaluation Methods

Hans Daetwyler et al.Apr 21, 2010
J
B
R
H
Abstract The rapid increase in high-throughput single-nucleotide polymorphism data has led to a great interest in applying genome-wide evaluation methods to identify an individual's genetic merit. Genome-wide evaluation combines statistical methods with genomic data to predict genetic values for complex traits. Considerable uncertainty currently exists in determining which genome-wide evaluation method is the most appropriate. We hypothesize that genome-wide methods deal differently with the genetic architecture of quantitative traits and genomes. A genomic linear method (GBLUP), and a genomic nonlinear Bayesian variable selection method (BayesB) are compared using stochastic simulation across three effective population sizes and a wide range of numbers of quantitative trait loci (NQTL). GBLUP had a constant accuracy, for a given heritability and sample size, regardless of NQTL. BayesB had a higher accuracy than GBLUP when NQTL was low, but this advantage diminished as NQTL increased and when NQTL became large, GBLUP slightly outperformed BayesB. In addition, deterministic equations are extended to predict the accuracy of both methods and to estimate the number of independent chromosome segments (Me) and NQTL. The predictions of accuracy and estimates of Me and NQTL were generally in good agreement with results from simulated data. We conclude that the relative accuracy of GBLUP and BayesB for a given number of records and heritability are highly dependent on Me, which is a property of the target genome, as well as the architecture of the trait (NQTL).
0
Citation705
0
Save
0

Accuracy of Predicting the Genetic Risk of Disease Using a Genome-Wide Approach

Hans Daetwyler et al.Oct 13, 2008
J
B
H
Background The prediction of the genetic disease risk of an individual is a powerful public health tool. While predicting risk has been successful in diseases which follow simple Mendelian inheritance, it has proven challenging in complex diseases for which a large number of loci contribute to the genetic variance. The large numbers of single nucleotide polymorphisms now available provide new opportunities for predicting genetic risk of complex diseases with high accuracy. Methodology/Principal Findings We have derived simple deterministic formulae to predict the accuracy of predicted genetic risk from population or case control studies using a genome-wide approach and assuming a dichotomous disease phenotype with an underlying continuous liability. We show that the prediction equations are special cases of the more general problem of predicting the accuracy of estimates of genetic values of a continuous phenotype. Our predictive equations are responsive to all parameters that affect accuracy and they are independent of allele frequency and effect distributions. Deterministic prediction errors when tested by simulation were generally small. The common link among the expressions for accuracy is that they are best summarized as the product of the ratio of number of phenotypic records per number of risk loci and the observed heritability. Conclusions/Significance This study advances the understanding of the relative power of case control and population studies of disease. The predictions represent an upper bound of accuracy which may be achievable with improved effect estimation methods. The formulae derived will help researchers determine an appropriate sample size to attain a certain accuracy when predicting genetic risk.
0
Citation673
0
Save
36

SNP heritability: What are we estimating?

Konrad Rawlik et al.Sep 16, 2020
A
J
O
K
The SNP heritability has become a central concept in the study of complex traits. Estimation of based on genomic variance components in a linear mixed model using restricted maximum likelihood has been widely adopted as the method of choice were individual level data are available. Empirical results have suggested that this approach is not robust if the population of interest departs from the assumed statistical model. Prolonged debate of the appropriate model choice has yielded a number of approaches to account for frequency- and linkage disequilibrium dependent genetic architectures. Here we analytically resolve the question of how these estimates relate to of the population from which samples are drawn. In particular, we show that the correct model for the purpose of inference about does not require knowledge of the true genetic architecture of a trait. More generally, our results provide a complete perspective of these class of estimators of , highlighting practical shortcomings of current practise. We illustrate our theoretical results using simulations and data from UK Biobank.
36
Citation7
0
Save
0

Conifers concentrate large numbers of NLR immune receptor genes on one chromosome

Yannick Woudstra et al.May 24, 2024
+11
J
T
Y
Nucleotide-binding domain and leucine-rich repeat (NLR) immune receptor genes form a major line of defense in plants, acting in both pathogen recognition and resistance machinery activation. NLRs are reported to form large gene clusters in limber pine (Pinus flexilis), but it is unknown how widespread this genomic architecture may be among the extant species of conifers (Pinophyta). We used comparative genomic analyses to assess patterns in the abundance, diversity, and genomic distribution of NLR genes. Chromosome-level whole genome assemblies and high-density linkage maps in the Pinaceae, Cupressaceae, Taxaceae, and other gymnosperms were scanned for NLR genes using existing and customized pipelines. The discovered genes were mapped across chromosomes and linkage groups and analyzed phylogenetically for evolutionary history. Conifer genomes are characterized by dense clusters of NLR genes, highly localized on one chromosome. These clusters are rich in TNL-encoding genes, which seem to have formed through multiple tandem duplication events. In contrast to angiosperms and nonconiferous gymnosperms, genomic clustering of NLR genes is ubiquitous in conifers. NLR-dense genomic regions are likely to influence a large part of the plant's resistance, informing our understanding of adaptation to biotic stress and the development of genetic resources through breeding.
0
Citation2
0
Save
1

High-density genetic linkage mapping in Sitka spruce advances the integration of genomic resources in conifers

Hayley Tumas et al.Aug 22, 2023
+13
S
J
H
Abstract In species with large and complex genomes such as conifers, dense linkage maps are a useful for supporting genome assembly and laying the genomic groundwork at the structural, populational and functional levels. However, most of the 600+ extant conifer species still lack extensive genotyping resources, which hampers the development of high-density linkage maps. In this study, we developed a linkage map relying on 21,570 SNP makers in Sitka spruce ( Picea sitchensis [Bong.] Carr.), a long-lived conifer from western North America that is widely planted for productive forestry in the British Isles. We used a single-step mapping approach to efficiently combine RAD-Seq and genotyping array SNP data for 528 individuals from two full-sib families. As expected for spruce taxa, the saturated map contained 12 linkages groups with a total length of 2,142 cM. The positioning of 5,414 unique gene coding sequences allowed us to compare our map with that of other Pinaceae species, which provided evidence for high levels of synteny and gene order conservation in this family. We then developed an integrated map for P. sitchensis and P. glauca based on 27,052 makers and 11,609 gene sequences. Altogether, these two linkage maps, the accompanying catalog of 286,159 SNPs and the genotyping chip developed herein opens new perspectives for a variety of fundamental and more applied research objectives, such as for the improvement of spruce genome assemblies, or for marker-assisted sustainable management of genetic resources in Sitka spruce and related species.
0

DISSECT: A new tool for analyzing extremely large genomic datasets

Oriol Canela‐Xandri et al.Jun 5, 2015
+2
A
A
O
Computational tools are quickly becoming the main bottleneck to analyze large-scale genomic and genetic data. This big-data problem, affecting a wide range of fields, is becoming more acute with the fast increase of data available. To address it, we developed DISSECT, a new, easy to use, and freely available software able to exploit the parallel computer architectures of supercomputers to perform a wide range of genomic and epidemiologic analyses which currently can only be carried out on reduced sample sizes or in restricted conditions. We showcased our new tool by addressing the challenge of predicting phenotypes from genotype data in human populations using Mixed Linear Model analysis. We analyzed simulated traits from half a million individuals genotyped for 590,004 SNPs using the combined computational power of 8,400 processor cores. We found that prediction accuracies in excess of 80% of the theoretical maximum could be achieved with large numbers of training individuals.
0

Accurate genetic profiling of anthropometric traits using a big data approach

Oriol Canela‐Xandri et al.Dec 1, 2015
A
J
K
O
Genome-wide association studies (GWAS) promised to translate their findings into clinically beneficial improvements of patient management by tailoring disease management to the individual through the prediction of disease risk. However, the ability to translate genetic findings from GWAS into predictive tools that are of clinical utility and which may inform clinical practice has, so far, been encouraging but limited. Here we propose to use a more powerful statistical approach that enables the prediction of multiple medically relevant phenotypes without the costs associated with developing a genetic test for each of them. As a proof of principle, we used a common panel of 319,038 SNPs to train the prediction models in 114,264 unrelated White-British for height and four obesity related traits (body mass index, basal metabolic rate, body fat percentage, and waist-to-hip ratio). We obtained prediction accuracies that ranged between 46% and 75% of the maximum achievable given their explained heritable component. This represents an improvement of up to 75% over the phenotypic variance explained by the predictors developed through large collaborations, which used more than twice as many training samples. Across-population predictions in White non-British individuals were similar to those of White-British whilst those in Asian and Black individuals were informative but less accurate. The genotyping of circa 500,000 UK Biobank participants will yield predictions ranging between 66% and 83% of the maximum. We anticipate that our models and a common panel of genetic markers, which can be used across multiple traits and diseases, will be the starting point to tailor disease management to the individual. Ultimately, we will be able to capitalise on whole-genome sequence and environmental risk factors to realise the full potential of genomic medicine.
0

Genetic differences in host infectivity affect disease spread and survival in epidemics

Osvaldo Anacleto et al.Nov 30, 2018
+4
B
S
O
Survival during an epidemic is partly determined by host genetics. While quantitative genetic studies typically consider survival as an indicator for disease resistance (an individuals propensity to avoid becoming infected or diseased), mortality rates of populations undergoing an epidemic are also affected by endurance (the propensity of diseased individual to survive the infection) and infectivity (i.e. the propensity of an infected individual to transmit disease). Few studies have demonstrated genetic variation in disease endurance, and no study has demonstrated genetic variation in host infectivity, despite strong evidence for considerable phenotypic variation in this trait. Here we propose an experimental design and statistical models for estimating genetic diversity in all three host traits. Using an infection model in fish we provide, for the first time, direct evidence for genetic variation in host infectivity, in addition to variation in resistance and endurance. We also demonstrate how genetic differences in these three traits contribute to survival. Our results imply that animals can evolve different disease response types affecting epidemic survival rates, with important implications for understanding and controlling epidemics.
0

Genomic dissection of maternal, additive and non-additive genetic effects for growth and carcass traits in Nile tilapia

Rajesh Joshi et al.Mar 18, 2019
+2
T
J
R
Background: The availability of both pedigree and genomic sources of information for animal breeding and genetics has created new challenges in understanding how best they may be utilized and how they may be interpreted. This study computed the variance components obtained using genomic information and compared these to the variances obtained using pedigree in a population generated to estimate non-additive genetic variance. Further, the impact of assumptions concerning Hardy-Weinberg Equilibrium (HWE) on the component estimates was examined. The magnitude of inbreeding depression for important commercial traits in Nile tilapia was estimated for the first time, here using genomic data. Results: The non-additive genetic variance in a Nile tilapia population was estimated from full-sib families and, where present, was found to be almost entirely additive by additive epistatic variance, although in pedigree studies this source is commonly assumed to arise from dominance. For body depth (BD) and body weight at harvest (BWH), the estimates of the additive by additive epistatic ratio (P<0.05) were found to be 0.15 and 0.17 in the current breeding population using genomic data. In addition, we found maternal variance (P<0.05) for BD, BWH, body length (BL) and fillet weight (FW), explaining approximately 10% of the observed phenotypic variance, which are comparable to the pedigree-based estimates. This study also disclosed detrimental effects of inbreeding in commercial traits of tilapia, which were estimated to cause 1.1%, 0.9%, 0.4% and 0.3% decrease in the trait value with 1% increase in the individual homozygosity for FW, BWH, BD and BL, respectively. The inbreeding depression and lack of dominance variance was consistent with an infinitesimal dominance model. Conclusions: An eventual utilisation of non-additive genetic effects in breeding schemes is not evident or straightforward from our findings, but inbreeding depression suggests for cross-breeding, although commercially this conclusion will depend on cost structures. However, the creation of maternal lines in Tilapia breeding schemes may be a possibility if this variation is found to be heritable.
Load More