MG
Michael Goddard
Author with expertise in Genomic Selection in Plant and Animal Breeding
University of Melbourne, University of Oxford, AgriBio
+ 7 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
29
(34% Open Access)
Cited by:
44
h-index:
102
/
i10-index:
270
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
3

A Saturated Map of Common Genetic Variants Associated with Human Height from 5.4 Million Individuals of Diverse Ancestries

Loïc Yengo et al.Jan 12, 2022
+554
E
S
L
ABSTRACT Common SNPs are predicted to collectively explain 40-50% of phenotypic variation in human height, but identifying the specific variants and associated regions requires huge sample sizes. Here we show, using GWAS data from 5.4 million individuals of diverse ancestries, that 12,111 independent SNPs that are significantly associated with height account for nearly all of the common SNP-based heritability. These SNPs are clustered within 7,209 non-overlapping genomic segments with a median size of ~90 kb, covering ~21% of the genome. The density of independent associations varies across the genome and the regions of elevated density are enriched for biologically relevant genes. In out-of-sample estimation and prediction, the 12,111 SNPs account for 40% of phenotypic variance in European ancestry populations but only ~10%-20% in other ancestries. Effect sizes, associated regions, and gene prioritization are similar across ancestries, indicating that reduced prediction accuracy is likely explained by linkage disequilibrium and allele frequency differences within associated regions. Finally, we show that the relevant biological pathways are detectable with smaller sample sizes than needed to implicate causal genes and variants. Overall, this study, the largest GWAS to date, provides an unprecedented saturated map of specific genomic regions containing the vast majority of common height-associated variants.
41

Leveraging functional genomic annotations and genome coverage to improve polygenic prediction of complex traits within and between ancestries

Zhili Zheng et al.Oct 24, 2023
+11
J
S
Z
Abstract We develop a new method, SBayesRC, that integrates GWAS summary statistics with functional genomic annotations to improve polygenic prediction of complex traits. Our method is scalable to whole-genome variant analysis and refines signals from functional annotations by allowing them to affect both causal variant probability and causal effect distribution. We analyse 28 traits in the UK Biobank using ∼7 million common SNPs and 96 annotations. SBayesRC improves prediction accuracy by 14% in European ancestry and by up to 33% in trans-ancestry prediction, compared to the baseline method SBayesR which does not use annotations, and outperforms state-of-the-art methods LDpred-funct, PolyPred-S and PRS-CSx by 12-15%. Investigation of factors affecting prediction accuracy identified a significant interaction between SNP density and annotation information, encouraging future use of whole-genome sequence variants for prediction. Functional partitioning analysis highlights a major contribution of evolutionary constrained regions to prediction accuracy and the largest per-SNP contribution from non-synonymous SNPs.
0

Conditional GWAS analysis identifies putative disorder-specific SNPs for psychiatric disorders

Enda Byrne et al.May 7, 2020
+16
T
Z
E
Abstract Substantial genetic liability is shared across psychiatric disorders but less is known about risk variants that are specific to a given disorder. We used multi-trait conditional and joint analysis (mtCOJO) to adjust GWAS summary statistics of one disorder for the effects of genetically correlated traits to identify putative disorder-specific SNP associations. We applied mtCOJO to summary statistics for five psychiatric disorders from the Psychiatric Genomics Consortium – schizophrenia (SCZ), bipolar disorder (BIP), major depression (MD), attention-deficit hyperactivity disorder (ADHD) and autism (AUT). Most genom-wide significant variants for these disorders had evidence of pleiotropy (i.e., impact on multiple psychiatric disorders) and hence have reduced mtCOJO conditional effect sizes. However, subsets of genome-wide significant variants had larger conditional effect sizes consistent with disorder-specific effects: 15 of 130 genome-wide significant variants for schizophrenia, 5 of 40 for major depression, 3 of 11 for ADHD and 1 of 2 for autism. In addition, we identified a number of variants that approached genome-wide significance in the original GWAS and have larger conditional effect sizes after conditioning on the other disorders. We show that decreased expression of VPS29 in the brain may increase risk to SCZ only and increased expression of CSE1L is associated with SCZ and MD, but not with BIP. Likewise, decreased expression of PCDHA7 in the brain is linked to increased risk of MD but decreased risk of SCZ and BIP.
1

Estimation of non-additive genetic variance in human complex traits from a large sample of unrelated individuals

Valentin Hivert et al.Oct 24, 2023
+5
F
J
V
Abstract Non-additive genetic variance for complex traits is traditionally estimated from data on relatives. It is notoriously difficult to estimate without bias in non-laboratory species, including humans, because of possible confounding with environmental covariance among relatives. In principle, non-additive variance attributable to common DNA variants can be estimated from a random sample of unrelated individuals with genome-wide SNP data. Here, we jointly estimate the proportion of variance explained by additive , dominance and additive-by-additive genetic variance in a single analysis model. We first show by simulations that our model leads to unbiased estimates and provide new theory to predict standard errors estimated using either least squares or maximum likelihood. We then apply the model to 70 complex traits using 254,679 unrelated individuals from the UK Biobank and 1.1M genotyped and imputed SNPs. We found strong evidence for additive variance (average across traits . In contrast, the average estimate of across traits was 0.001, implying negligible dominance variance at causal variants tagged by common SNPs. The average epistatic variance across the traits was 0.058, not significantly different from zero because of the large sampling variance. Our results provide new evidence that genetic variance for complex traits is predominantly additive, and that sample sizes of many millions of unrelated individuals are needed to estimate epistatic variance with sufficient precision.
16

Genetic score omics regression and multi-trait meta-analysis detect widespread cis-regulatory effects shaping bovine complex traits

Ruidong Xiang et al.Oct 24, 2023
+6
S
L
R
Abstract To complete the genome-to-phenome map, transcriptome-wide association studies (TWAS) are performed to correlate genetically predicted gene expression with observed phenotypic measurements. However, the relatively small training population assayed with gene expression could limit the accuracy of TWAS. We propose Genetic Score Omics Regression (GSOR) correlating observed gene expression with genetically predicted phenotype, i.e., genetic score. The score, calculated using variants near genes with assayed expression, provides a powerful association test between cis- effects on gene expression and the trait. In simulated and real data, GSOR outperforms TWAS in detecting causal/informative genes. Applying GSOR to transcriptomes of 16 tissue (N∼5000) and 37 traits in ∼120,000 cattle, multi-trait meta-analyses of omics-associations (MTAO) found that, on average, each significant gene expression and splicing mediates cis -genetic effects on 8∼10 traits. Supported by Mendelian Randomisation, MTAO prioritised genes/splicing show increased evolutionary constraints. Many newly discovered genes/splicing regions underlie previously thought single-gene loci to influence multiple traits.
16
Paper
Citation3
0
Save
1

Mutant alleles differentially shape cattle complex traits and fitness

Ruidong Xiang et al.Oct 24, 2023
+4
S
E
R
Abstract Classical mutant alleles (MAs), with large effects on phenotype, tend to be deleterious to traits and fitness. Is this the case for mutations with small effects? We infer MAs for 8 million sequence variants in 113k cattle and quantify the effects of MA on 37 complex traits. Heterozygosity for variants at genomic sites conserved across 100 vertebrates increase fertility, stature, and milk production, positively associating these traits with fitness. MAs decrease stature and fat and protein concentration in milk, but increase gestation length and somatic cell count in milk (the latter indicative of mastitis). However, the allele frequency of MAs that decrease fat and protein concentration and stature and increase gestation length and somatic cell count is lower than the allele frequency of MAs with the opposite effect. These results suggest bias in the direction of effect of mutation (e.g. towards reduced protein in milk), but selection operating to reduce the frequency of these MAs. Taken together, our results imply two classes of genomic sites subject to long-term selection: sites conserved across vertebrates show hybrid vigour while sites subject to less long-term selection show a bias in mutation towards alleles that are selected against.
1
Paper
Citation2
0
Save
5

Bayesian genome-wide analysis of cattle traits using variants with functional and evolutionary significance

Ruidong Xiang et al.Oct 24, 2023
+2
C
E
R
Abstract Context Functional genomics studies have revealed genomic regions with regulatory and evolutionary significance. Such information independent of association analysis may benefit fine-mapping and genomic selection of economically important traits. However, systematic evaluation of the use of functional information in mapping, and genomic selection of cattle traits is lacking. Also, Single Nucleotide Polymorphisms (SNPs) from the high-density (HD) panel are known to tag informative variants, but the performance of genomic prediction using HD SNPs together with variants supported by different functional genomics is unknown. Aims We selected six sets of functionally important variants and modelled each set together with HD SNPs in Bayesian models to map and predict protein, fat, and milk yield as well as mastitis, somatic cell count and temperament of dairy cattle. Methods Two models were used: 1) BayesR which includes priors of four distribution of variant-effects, and 2) BayesRC which includes additional priors of different functional classes of variants. Bayesian models were trained in 3 breeds of 28,000 cows of Holstein, Jersey and Australian Red and predicted into 2,600 independent bulls. Key results Adding functionally important variants significantly increased the enrichment of genetic variance explained for mapped variants, suggesting improved genome-wide mapping precision. Such improvement was significantly higher when the same set of variants were modelled by BayesRC than by BayesR. Combining functional variant sets with HD SNPs improves genomic prediction accuracy in the majority of the cases and such improvement was more common and stronger for non-Holstein breeds and traits like mastitis, somatic cell count and temperament. In contrast, adding a large number of random sequence variants to HD SNPs reduces mapping precision and has a worse or similar prediction accuracy, compared to using HD SNPs alone to map or predict. While BayesRC tended to have better genomic prediction accuracy than BayesR, the overall difference in prediction accuracy between the two models was insignificant. Conclusions Our findings demonstrate the usefulness of functional data in genomic mapping and prediction. Implications We highlight the need for effective tools exploiting complex functional datasets to improve genomic prediction.
5
Paper
Citation1
0
Save
0

Improved polygenic prediction by Bayesian multiple regression on summary statistics

Luke Lloyd‐Jones et al.May 6, 2020
+12
J
J
L
The capacity to accurately predict an individual's phenotype from their DNA sequence is one of the great promises of genomics and precision medicine. Recently, Bayesian methods for generating polygenic predictors have been successfully applied in human genomics but require the individual level data, which are often limited in their access due to privacy or logistical concerns, and are computationally very intensive. This has motivated methodological frameworks that utilise publicly available genome-wide association studies (GWAS) summary data, which now for some traits include results from greater than a million individuals. In this study, we extend the established summary statistics methodological framework to include a class of point-normal mixture prior Bayesian regression models, which have been shown to generate optimal genetic predictions and can perform heritability estimation, variant mapping and estimate the distribution of the genetic effects. In a wide range of simulations and cross-validation using 10 real quantitative traits and 1.1 million variants on 350,000 individuals from the UK Biobank (UKB), we establish that our summary based method, SBayesR, performs similarly to methods that use the individual level data and outperforms other state-of-the-art summary statistics methods in terms of prediction accuracy and heritability estimation at a fraction of the computational resources. We generate polygenic predictors for body mass index and height in two independent data sets and show that by exploiting summary statistics on 1.1 million variants from the largest GWAS meta-analysis (n ≈ 700, 000) that the SBayesR prediction R2 improved on average across traits by 6.8% relative to that estimated from an individual-level data BayesR analysis of data from the UKB (n ≈ 450, 000). Compared with commonly used state-of-the-art summary- based methods, SBayesR improved the prediction R2 by 4.1% relative to LDpred and by 28.7% relative to clumping and p-value thresholding. SBayesR gave comparable prediction accuracy to the recent RSS method, which has a similar model, but at a computational time that is two orders of magnitude smaller. The methodology is implemented in a very efficient and user-friendly software tool titled GCTB.
0

Bayesian analysis of GWAS summary data reveals differential signatures of natural selection across human complex traits and functional genomic categories

Jian Zeng et al.May 7, 2020
+10
L
A
J
Understanding how natural selection has shaped the genetic architecture of complex traits and diseases is of importance in medical and evolutionary genetics. Bayesian methods have been developed using individual-level data to estimate multiple features of genetic architecture, including signatures of natural selection. Here, we present an enhanced method (SBayesS) that only requires GWAS summary statistics and incorporates functional genomic annotations. We analysed GWAS data with large sample sizes for 155 complex traits and detected pervasive signatures of negative selection with diverse estimates of SNP-based heritability and polygenicity. Projecting these estimates onto a map of genetic architecture obtained from evolutionary simulations revealed relatively strong natural selection on genetic variants associated with cardiorespiratory and cognitive traits and relatively small number of mutational targets for diseases. Averaging across traits, the joint distribution of SNP effect size and MAF varied across functional genomic regions (likely to be a consequence of natural selection), with enrichment in both the number of associated variants and the magnitude of effect sizes in regions such as transcriptional start sites, coding regions and 5'- and 3'-UTRs.
0

Imprint of Assortative Mating on the Human Genome

Loïc Yengo et al.May 6, 2020
+11
M
M
L
Non-random mate-choice with respect to complex traits is widely observed in humans, but whether this reflects true phenotypic assortment, environment (social homogamy) or convergence after choosing a partner is not known. Understanding the causes of mate choice is important, because assortative mating (AM) if based upon heritable traits, has genetic and evolutionary consequences. AM is predicted under Fisher's classical theory1 to induce a signature in the genome at trait-associated loci that can be detected and quantified. Here, we develop and apply a method to quantify AM on a specific trait by estimating the correlation (θ) between genetic predictors of the trait from SNPs on odd versus even chromosomes. We show by theory and simulation that the effect of AM can be distinguished from population stratification. We applied this approach to 32 complex traits and diseases using SNP data from ~400,000 unrelated individuals of European ancestry. We found significant evidence of AM for height (θ=3.2%) and educational attainment (θ=2.7%), both consistent with theoretical predictions. Overall, our results imply that AM involves multiple traits, affects the genomic architecture of loci that are associated with these traits and that the consequence of mate choice can be detected from a random sample of genomes.
Load More