MK
Matthew Keller
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
8
(38% Open Access)
Cited by:
94
h-index:
31
/
i10-index:
47
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
200

Within-sibship GWAS improve estimates of direct genetic effects

Laurence Howe et al.Mar 7, 2021
+86
T
M
L
Abstract Estimates from genome-wide association studies (GWAS) represent a combination of the effect of inherited genetic variation (direct effects), demography (population stratification, assortative mating) and genetic nurture from relatives (indirect genetic effects). GWAS using family-based designs can control for demography and indirect genetic effects, but large-scale family datasets have been lacking. We combined data on 159,701 siblings from 17 cohorts to generate population (between-family) and within-sibship (within-family) estimates of genome-wide genetic associations for 25 phenotypes. We demonstrate that existing GWAS associations for height, educational attainment, smoking, depressive symptoms, age at first birth and cognitive ability overestimate direct effects. We show that estimates of SNP-heritability, genetic correlations and Mendelian randomization involving these phenotypes substantially differ when calculated using within-sibship estimates. For example, genetic correlations between educational attainment and height largely disappear. In contrast, analyses of most clinical phenotypes (e.g. LDL-cholesterol) were generally consistent between population and within-sibship models. We also report compelling evidence of polygenic adaptation on taller human height using within-sibship data. Large-scale family datasets provide new opportunities to quantify direct effects of genetic variation on human traits and diseases.
200
Citation65
0
Save
0

Subtle stratification confounds estimates of heritability from rare variants

Gaurav Bhatia et al.Apr 13, 2016
+16
P
A
G
Abstract Genome-wide significant associations generally explain only a small proportion of the narrow-sense heritability of complex disease ( h 2 ). While considerably more heritability is explained by all genotyped SNPs ( h g 2 ), for most traits, much heritability remains missing ( h g 2 < h 2 ). Rare variants, poorly tagged by genotyped SNPs, are a major potential source of the gap between h g 2 and h 2 . Recent efforts to assess the contribution of both sequenced and imputed rare variants to phenotypes suggest that substantial heritability may lie in these variants. Here we analyze sequenced SNPs, imputed SNPs and haploSNPs— haplotype variants constructed from within a sample, without using a reference panel— and show that studies of heritability from these variants may be strongly confounded by subtle population stratification. For example, when meta-analyzing heritability estimates from 22 randomly ascertained case-control traits from the GERA cohort, we observe a statistically significant increase in heritability explained by imputed SNPs even after correcting for principal components (PCs) from genotyped (or imputed) SNPs. However, this increase is eliminated when correcting for stratification using PCs from a larger number of haploSNPs. We note that subtle stratification may also impact estimates of heritability from array SNPs, although we find that this is generally a less severe problem. Overall, our results suggest that estimating the heritability explained by rare variants for case-control traits requires exquisite control for population stratification, but current methods may not provide this level of control.
0
Citation23
0
Save
185

Correlations between human mating partners: a comprehensive meta-analysis of 22 traits and raw data analysis of 133 traits in the UK Biobank

Tanya Horwitz et al.Mar 20, 2022
M
K
J
T
Abstract Positive correlations between human mating partners are consistently observed across traits. Such correlations can increase phenotypic variation and, to the extent that they reflect genetic similarity in co-parents, can also increase prevalence for rare phenotypes and bias estimates in genetic designs. We conducted the largest set of meta-analyses on human partner correlations to date, incorporating 480 partner correlations across 22 traits. We also calculated 133 trait correlations between up to 79,074 male-female couples in the UK Biobank (UKB). Estimates of the mean meta-analyzed correlations ranged from r meta =.08 for extraversion to r meta = .58 for political values. UKB correlations ranged from r UKB =-.18 for chronotype to r UKB =.87 for birth year. Overall, attitudes, education, and substance use traits mostly showed the highest correlations, while psychological and biological traits generally yielded lower but still positive correlations. We observed high between-study heterogeneity for most meta-analyzed traits, likely because of both systematic differences between samples and true differences in partner correlations across populations.
185
Citation6
0
Save
0

Genomic dissection of bipolar disorder and schizophrenia including 28 subphenotypes

Douglas Ruderfer et al.Aug 8, 2017
+541
A
S
D
Schizophrenia (SCZ) and bipolar disorder (BD) are highly heritable disorders that share a significant proportion of common risk variation. Understanding the genetic factors underlying the specific symptoms of these disorders will be crucial for improving diagnosis, intervention and treatment. In case-control data consisting of 53,555 cases (20,129 BD, 33,426 SCZ) and 54,065 controls, we identified 114 genome-wide significant loci (GWS) when comparing all cases to controls, of which 41 represented novel findings. Two genome-wide significant loci were identified when comparing SCZ to BD and a third was found when directly incorporating functional information. Regional joint association identified a genomic region of overlapping association in BD and SCZ with disease-independent causal variants indicating a fourth region contributing to differences between these disorders. Regional SNP-heritability analyses demonstrated that the estimated heritability of BD based on the SCZ GWS regions was significantly higher than that based on the average genomic region (91 regions, p = 1.2x10-6) while the inverse was not significant (19 regions, p=0.89). Using our BD and SCZ GWAS we calculated polygenic risk scores and identified several significant correlations with: 1) SCZ subphenotypes: negative symptoms (SCZ, p=3.6x10-6) and manic symptoms (BD, p=2x10-5), 2) BD subphenotypes: psychotic features (SCZ p=1.2x10-10, BD p=5.3x10-5) and age of onset (SCZ p=7.9x10-4). Finally, we show that psychotic features in BD has significant SNP-heritability (h2snp=0.15, SE=0.06), and a significant genetic correlation with SCZ (rg=0.34) in addition there is a significant sign test result between SCZ GWAS and a GWAS of BD cases contrasting those with and without psychotic features (p=0.0038, one-side binomial test). For the first time, we have identified specific loci pointing to a potential role of 4 genes (DARS2, ARFGEF2, DCAKD and GATAD2A) that distinguish between BD and SCZ, providing an opportunity to understand the biology contributing to clinical differences of these disorders. Our results provide the best evidence so far of genomic components distinguishing between BD and SCZ that contribute directly to specific symptom dimensions.
0

Testing the moderation of quantitative gene by environment interactions in unrelated individuals

Rasool Tahmasbi et al.Sep 19, 2017
M
E
L
R
The environment can moderate the effect of genes - a phenomenon called gene-environment (GxE) interaction. There are two broad types of GxE modeled in human behavior - qualitative GxE, where the effects of individual genetic variants differ depending on some environmental moderator, and quantitative GxE, where the additive genetic variance changes as a function of an environmental moderator. Tests of both qualitative and quantitative GxE have traditionally relied on comparing the covariances between twins and close relatives, but recently there has been interest in testing such models on unrelated individuals measured on genomewide data. However, to date, there has been no ability to test quantitative GxE effects in unrelated individuals using genomewide data because standard software cannot solve nonlinear constraints. Here, we introduce a maximum likelihood approach with parallel constrained optimization to fit such models. We use simulation to estimate the accuracy, power, and type I error rates of our method and to gauge its computational performance, and then apply this method to IQ data measured on 40,172 individuals with whole-genome SNP data from the UK Biobank. We found that the additive genetic variation of IQ tagged by SNPs increases as socioeconomic status (SES) decreases, opposite the direction found by several twin studies conducted in the U.S. on adolescents, but consistent with several studies from Europe and Australia on adults.
0

Narrow-sense heritability estimation of complex traits using identity-by-descent information.

Luke Evans et al.Jul 17, 2017
+130
D
G
L
Heritability is a fundamental parameter in genetics. Traditional estimates based on family or twin studies can be biased due to shared environmental or non-additive genetic variance. Alternatively, those based on genotyped or imputed variants typically underestimate narrow-sense heritability contributed by rare or otherwise poorly-tagged causal variants. Identical-by-descent (IBD) segments of the genome share all variants between pairs of chromosomes except new mutations that have arisen since the last common ancestor. Therefore, relating phenotypic similarity to degree of IBD sharing among classically unrelated individuals is an appealing approach to estimating the near full additive genetic variance while avoiding biases that can occur when modeling close relatives. We applied an IBD-based approach (GREML-IBD) to estimate heritability in unrelated individuals using phenotypic simulation with thousands of whole genome sequences across a range of stratification, polygenicity levels, and the minor allele frequencies of causal variants (CVs). IBD-based heritability estimates were unbiased when using unrelated individuals, even for traits with extremely rare CVs, but stratification led to strong biases in IBD-based heritability estimates with poor precision. We used data on two traits in ~120,000 people from the UK Biobank to demonstrate that, depending on the trait and possible confounding environmental effects, GREML-IBD can be applied successfully to very large genetic datasets to infer the contribution of very rare variants lost using other methods. However, we observed apparent biases in this real data that were not predicted from our simulation, suggesting that more work may be required to understand factors that influence IBD-based estimates.
0

Comparison of methods that use whole genome data to estimate the heritability and genetic architecture of complex traits.

Luke Evans et al.Mar 9, 2017
+10
D
J
L
Heritability, h2, is a foundational concept in genetics, critical to understanding the genetic basis of complex traits. Recently-developed methods that estimate heritability from genotyped SNPs, h2SNP, explain substantially more genetic variance than genome-wide significant loci, but less than classical estimates from twins and families. However, h2SNP estimates have yet to be comprehensively compared under a range of genetic architectures, making it difficult to draw conclusions from sometimes conflicting published estimates. Here, we used thousands of real whole genome sequences to simulate realistic phenotypes under a variety of genetic architectures, including those from very rare causal variants. We compared the performance of ten methods across different types of genotypic data (commercial SNP array positions, whole genome sequence variants, and imputed variants) and under differing causal variant frequencies, levels of stratification, and relatedness thresholds. These results provide guidance in interpreting past results and choosing optimal approaches for future studies. We then chose two methods (GREML-MS and GREML-LDMS) that best estimated overall h2SNP and the causal variant frequency spectra to six phenotypes in the UK Biobank using imputed genome-wide variants. Our results suggest that as imputation reference panels become larger and more diverse, estimates of the frequency distribution of causal variants will become increasingly unbiased and the vast majority of trait narrow-sense heritability will be accounted for.
0

A contribution of novel CNVs to schizophrenia from a genome-wide study of 41,321 subjects

Christian Marshall et al.Feb 23, 2016
+269
P
D
C
Genomic copy number variants (CNVs) have been strongly implicated in the etiology of schizophrenia (SCZ). However, apart from a small number of risk variants, elucidation of the CNV contribution to risk has been difficult due to the rarity of risk alleles, all occurring in less than 1% of cases. We sought to address this obstacle through a collaborative effort in which we applied a centralized analysis pipeline to a SCZ cohort of 21,094 cases and 20,227 controls. We observed a global enrichment of CNV burden in cases (OR=1.11, P=5.7e-15), which persisted after excluding loci implicated in previous studies (OR=1.07, P=1.7e-6). CNV burden is also enriched for genes associated with synaptic function (OR = 1.68, P = 2.8e-11) and neurobehavioral phenotypes in mouse (OR = 1.18, P= 7.3e-5). We identified genome-wide significant support for eight loci, including 1q21.1, 2p16.3 (NRXN1), 3q29, 7q11.2, 15q13.3, distal 16p11.2, proximal 16p11.2 and 22q11.2. We find support at a suggestive level for nine additional candidate susceptibility and protective loci, which consist predominantly of CNVs mediated by non-allelic homologous recombination (NAHR).