RW
Raymond Walters
Author with expertise in Genomic Studies and Association Analyses
Massachusetts General Hospital, Harvard University, Broad Institute
+ 7 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
19
(21% Open Access)
Cited by:
32
h-index:
34
/
i10-index:
56
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
97

Multi-Ancestry Meta-Analysis yields novel genetic discoveries and ancestry-specific associations

Patrick Turley et al.Oct 23, 2023
+23
G
A
P
ABSTRACT We present a new method, Multi-Ancestry Meta-Analysis (MAMA), which combines genome-wide association study (GWAS) summary statistics from multiple populations to produce new summary statistics for each population, identifying novel loci that would not have been discovered in either set of GWAS summary statistics alone. In simulations, MAMA increases power with less bias and generally lower type-1 error rate than other multi-ancestry meta-analysis approaches. We apply MAMA to 23 phenotypes in East-Asian- and European-ancestry populations and find substantial gains in power. In an independent sample, novel genetic discoveries from MAMA replicate strongly.
71

Patterns of item nonresponse behavior to survey questionnaires are systematic and have a genetic basis

Gianmarco Mignogna et al.Oct 24, 2023
+8
R
C
G
ABSTRACT Response to survey questionnaires is vital for social and behavioral research, and most analyses assume full and accurate response by survey participants. However, nonresponse is common and impedes proper interpretation and generalizability of results. We examined item nonresponse behavior across 109 questionnaire items from the UK Biobank (UKB) (N=360,628). Phenotypic factor scores for two participant-selected nonresponse answers, “Prefer not to answer” (PNA) and “I don’t know” (IDK), each predicted participant nonresponse in follow-up surveys, controlling for education and self-reported general health. We performed genome-wide association studies on these factors and identified 39 genome-wide significant loci, and further validated these effects with polygenic scores in an independent study (N=3,414), gaining information that we could not have had from phenotypic data alone. PNA and IDK were highly genetically correlated with one another and with education, health, and income, although unique genetic effects were also observed for both PNA and IDK. We discuss how these effects may bias studies of traits correlated with nonresponse and how genetic analyses can further enhance our understanding of nonresponse behaviors in survey research, for instance by helping to correct for nonresponse bias.
67

Examining sex-differentiated genetic effects across neuropsychiatric and behavioral traits

Joanna Martin et al.Oct 24, 2023
+29
S
E
J
Abstract Background The origin of sex differences in prevalence and presentation of neuropsychiatric and behavioral traits is largely unknown. Given established genetic contributions and correlations across these traits, we tested for a sex-differentiated genetic architecture within and between traits. Methods Using genome-wide association study (GWAS) summary statistics for 20 neuropsychiatric and behavioral traits, we tested for differences in SNP-based heritability (h 2 ) and genetic correlation (r g <1) between sexes. For each trait, we computed z-scores from sex-stratified GWAS regression coefficients and identified genes with sex-differentiated effects. We calculated Pearson correlation coefficients between z-scores for each trait pair, to assess whether specific pairs share variants with sex-differentiated effects. Finally, we tested for sex differences in between-trait genetic correlations. Results With current sample sizes (and power), we found no significant, consistent sex differences in SNP-based h 2 . Between-sex, within-trait genetic correlations were consistently high, although significantly less than 1 for educational attainment and risk-taking behavior. We identified genome-wide significant genes with sex-differentiated effects for eight traits. Several trait pairs shared sex-differentiated effects. The top 0.1% of genes with sex-differentiated effects across traits overlapped with neuron- and synapse-related gene sets. Most between-trait genetic correlation estimates were similar across sex, with several exceptions (e.g. educational attainment & risk-taking behavior). Conclusions Sex differences in the common autosomal genetic architecture of neuropsychiatric and behavioral phenotypes are small and polygenic, requiring large sample sizes. Genes with sex-differentiated effects are enriched for neuron-related gene sets. This work motivates further investigation of genetic, as well as environmental, influences on sex differences.
0

Common risk variants identified in autism spectrum disorder

Jakob Grove et al.May 6, 2020
+71
T
S
J
Autism spectrum disorder (ASD) is a highly heritable and heterogeneous group of neurodevelopmental phenotypes diagnosed in more than 1% of children. Common genetic variants contribute substantially to ASD susceptibility, but to date no individual variants have been robustly associated with ASD. With a marked sample size increase from a unique Danish population resource, we report a genome-wide association meta-analysis of 18,381 ASD cases and 27,969 controls that identifies five genome-wide significant loci. Leveraging GWAS results from three phenotypes with significantly overlapping genetic architectures (schizophrenia, major depression, and educational attainment), seven additional loci shared with other traits are identified at equally strict significance levels. Dissecting the polygenic architecture we find both quantitative and qualitative polygenic heterogeneity across ASD subtypes, in contrast to what is typically seen in other complex disorders. These results highlight biological insights, particularly relating to neuronal function and corticogenesis and establish that GWAS performed at scale will be much more productive in the near term in ASD, just as it has been in a broad range of important psychiatric and diverse medical phenotypes.
0

Genetic analyses identify widespread sex-differential participation bias

Nicola Pirastu et al.May 6, 2020
+26
P
M
N
Genetic association results are often interpreted with the assumption that study participation does not affect downstream analyses. Understanding the genetic basis of this participation bias is challenging as it requires the genotypes of unseen individuals. However, we demonstrate that it is possible to estimate comparative biases by performing GWAS contrasting one subgroup versus another. For example, we show that sex exhibits autosomal heritability in the presence of sex-differential participation bias. By performing a GWAS of sex in ~3.3 million males and females, we identify over 150 autosomal loci significantly associated with sex and highlight complex traits underpinning differences in study participation between sexes. For example, the body mass index (BMI) increasing allele at the FTO locus was observed at higher frequency in males compared to females (OR 1.02 [1.02-1.03], P=4.4x10-36). Finally, we demonstrate how these biases can potentially lead to incorrect inferences in downstream analyses and propose a conceptual framework for addressing such biases. Our findings highlight a new challenge that genetic studies may face as sample sizes continue to grow.
0

MTAG: Multi-Trait Analysis of GWAS

Patrick Turley et al.May 6, 2020
+15
O
R
P
We introduce Multi-Trait Analysis of GWAS (MTAG), a method for joint analysis of summary statistics from GWASs of different traits, possibly from overlapping samples. We apply MTAG to summary statistics for depressive symptoms (Neff = 354,862), neuroticism (N = 168,105), and subjective well-being (N = 388,538). Compared to 32, 9, and 13 genome-wide significant loci in the single-trait GWASs (most of which are themselves novel), MTAG increases the number of loci to 64, 37, and 49, respectively. Moreover, association statistics from MTAG yield more informative bioinformatics analyses and increase variance explained by polygenic scores by approximately 25%, matching theoretical expectations.
0

RICOPILI: Rapid Imputation for COnsortias PIpeLIne

Max Lam et al.May 7, 2020
+16
H
S
M
Motivation: Genome-wide association study (GWAS) analyses, at sufficient sample sizes and power, have successfully revealed biological insights for several complex traits. RICOPILI, an open sourced Perl-based pipeline was developed to address the challenges of rapidly processing large scale multi-cohort GWAS studies including quality control, imputation and downstream analyses. The pipeline is computationally efficient with portability to a wide range of high-performance computing (HPC) environments. Summary: RICOPILI was created as the Psychiatric Genomics Consortium (PGC) pipeline for GWAS and has been adopted by other users. The pipeline features i) technical and genomic quality control in case-control and trio cohorts ii) genome-wide phasing and imputation iv) association analysis v) meta-analysis vi) polygenic risk scoring and vii) replication analysis. Notably, a major differentiator from other GWAS pipelines, RICOPILI leverages on automated parallelization and cluster job management approaches for rapid production of imputed genome-wide data. A comprehensive meta-analysis of simulated GWAS data has been incorporated demonstrating each step of the pipeline. This includes all of the associated visualization plots, to allow ease of data interpretation and manuscript preparation. Simulated GWAS datasets are also packaged with the pipeline for user training tutorials and developer work. Availability and Implementation: RICOPILI has a flexible architecture to allow for ongoing development and incorporation of newer available algorithms and is adaptable to various HPC environments (QSUB, BSUB, SLURM and others). Specific links for genomic resources are either directly provided in this paper or via tutorials and external links. The central location hosting scripts and tutorials is found at this URL: https://sites.google.com/a/broadinstitute.org/RICOPILI/home .
0

Human demographic history impacts genetic risk prediction across diverse populations

Alicia Martin et al.May 6, 2020
+6
R
C
A
The vast majority of genome-wide association studies are performed in Europeans, and their transferability to other populations is dependent on many factors (e.g. linkage disequilibrium, allele frequencies, genetic architecture). As medical genomics studies become increasingly large and diverse, gaining insights into population history and consequently the transferability of disease risk measurement is critical. Here, we disentangle recent population history in the widely-used 1000 Genomes Project reference panel, with an emphasis on populations underrepresented in medical studies. To examine the transferability of single-ancestry GWAS, we used published summary statistics to calculate polygenic risk scores for six well-studied traits and diseases. We identified directional inconsistencies in all scores; for example, height is predicted to decrease with genetic distance from Europeans, despite robust anthropological evidence that West Africans are as tall as Europeans on average. To gain deeper quantitative insights into GWAS transferability, we developed a complex trait coalescent-based simulation framework considering effects of polygenicity, causal allele frequency divergence, and heritability. As expected, correlations between true and inferred risk were typically highest in the population from which summary statistics were derived. We demonstrated that scores inferred from European GWAS were biased by genetic drift in other populations even when choosing the same causal variants, and that biases in any direction were possible and unpredictable. This work cautions that summarizing findings from large-scale GWAS may have limited portability to other populations using standard approaches, and highlights the need for generalized risk prediction methods and the inclusion of more diverse individuals in medical genomics.
0

The landscape of gene loss and missense variation across the mammalian tree informs on gene essentiality

Calwing Liao et al.May 28, 2024
+11
F
R
C
Background: The degree of gene and sequence preservation across species provides valuable insights into the relative necessity of genes from the perspective of natural selection. Here, we developed novel interspecies metrics across 462 mammalian species, GISMO (Gene identity score of mammalian orthologs) and GISMO-mis (GISMO-missense), to quantify gene loss traversing millions of years of evolution. GISMO is a measure of gene loss across mammals weighed by evolutionary distance relative to humans, whereas GISMO-mis quantifies the ratio of missense to synonymous variants across mammalian species for a given gene. Rationale: Despite large sample sizes, current human constraint metrics are still not well calibrated for short genes. Traversing over 100 million years of evolution across hundreds of mammals can identify the most essential genes and improve gene-disease association. Beyond human genetics, these metrics provide measures of gene constraint to further enable mammalian genetics research. Results: Our analyses showed that both metrics are strongly correlated with measures of human gene constraint for loss-of-function, missense, and copy number dosage derived from upwards of a million human samples, which highlight the power of interspecies constraint. Importantly, neither GISMO nor GISMO-mis are strongly correlated with coding sequence length. Therefore both metrics can identify novel constrained genes that were too small for existing human constraint metrics to capture. We also found that GISMO scores capture rare variant association signals across a range of phenotypes associated with decreased fecundity, such as schizophrenia, autism, and neurodevelopmental disorders. Moreover, common variant heritability of disease traits are highly enriched in the most constrained deciles of both metrics, further underscoring the biological relevance of these metrics in identifying functionally important genes. We further showed that both scores have the lowest duplication and deletion rate in the most constrained deciles for copy number variants in the UK Biobank, suggesting that it may be an important metric for dosage sensitivity. We additionally demonstrate that GISMO can improve prioritization of recessive disorder genes and captures homozygous selection. Conclusions Overall, we demonstrate that the most constrained genes for gene loss and missense variation capture the largest fraction of heritability, GISMO can help prioritize recessive disorder genes, and identify the most conserved genes across the mammalian tree.
0

Trans-ancestral GWAS of alcohol dependence reveals common genetic underpinnings with psychiatric disorders

Raymond Walters et al.May 6, 2020
+160
A
M
R
Liability to alcohol dependence (AD) is heritable, but little is known about its complex polygenic architecture or its genetic relationship with other disorders. To discover loci associated with AD and characterize the relationship between AD and other psychiatric and behavioral outcomes, we carried out the largest GWAS to date of DSM-IV diagnosed AD. Genome-wide data on 14,904 individuals with AD and 37,944 controls from 28 case/control and family-based studies were meta-analyzed, stratified by genetic ancestry (European, N = 46,568; African; N = 6,280). Independent, genome-wide significant effects of different ADH1B variants were identified in European (rs1229984; p = 9.8E-13) and African ancestries (rs2066702; p = 2.2E-9). Significant genetic correlations were observed with schizophrenia, ADHD, depression, and use of cigarettes and cannabis. There was only modest genetic correlation with alcohol consumption and inconsistent associations with problem drinking. The genetic underpinnings of AD only partially overlap with those for alcohol consumption, underscoring the genetic distinction between pathological and non-pathological drinking behaviors.
Load More