BN
Benjamin Neale
Author with expertise in Genomic Studies and Association Analyses
Massachusetts General Hospital, Broad Institute, Foundation Center
+ 11 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
111
(32% Open Access)
Cited by:
180
h-index:
136
/
i10-index:
402
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Nuclear genetic control of mtDNA copy number and heteroplasmy in humans

Rahul Gupta et al.Mar 12, 2024
+9
T
M
R
Abstract Mitochondrial DNA (mtDNA) is a maternally inherited, high-copy-number genome required for oxidative phosphorylation 1 . Heteroplasmy refers to the presence of a mixture of mtDNA alleles in an individual and has been associated with disease and ageing. Mechanisms underlying common variation in human heteroplasmy, and the influence of the nuclear genome on this variation, remain insufficiently explored. Here we quantify mtDNA copy number (mtCN) and heteroplasmy using blood-derived whole-genome sequences from 274,832 individuals and perform genome-wide association studies to identify associated nuclear loci. Following blood cell composition correction, we find that mtCN declines linearly with age and is associated with variants at 92 nuclear loci. We observe that nearly everyone harbours heteroplasmic mtDNA variants obeying two principles: (1) heteroplasmic single nucleotide variants tend to arise somatically and accumulate sharply after the age of 70 years, whereas (2) heteroplasmic indels are maternally inherited as mixtures with relative levels associated with 42 nuclear loci involved in mtDNA replication, maintenance and novel pathways. These loci may act by conferring a replicative advantage to certain mtDNA alleles. As an illustrative example, we identify a length variant carried by more than 50% of humans at position chrM:302 within a G-quadruplex previously proposed to mediate mtDNA transcription/replication switching 2,3 . We find that this variant exerts cis -acting genetic control over mtDNA abundance and is itself associated in- trans with nuclear loci encoding machinery for this regulatory switch. Our study suggests that common variation in the nuclear genome can shape variation in mtCN and heteroplasmy dynamics across the human population.
0
Citation28
0
Save
97

Multi-Ancestry Meta-Analysis yields novel genetic discoveries and ancestry-specific associations

Patrick Turley et al.Oct 23, 2023
+23
G
A
P
ABSTRACT We present a new method, Multi-Ancestry Meta-Analysis (MAMA), which combines genome-wide association study (GWAS) summary statistics from multiple populations to produce new summary statistics for each population, identifying novel loci that would not have been discovered in either set of GWAS summary statistics alone. In simulations, MAMA increases power with less bias and generally lower type-1 error rate than other multi-ancestry meta-analysis approaches. We apply MAMA to 23 phenotypes in East-Asian- and European-ancestry populations and find substantial gains in power. In an independent sample, novel genetic discoveries from MAMA replicate strongly.
38

Incorporating family history of disease improves polygenic risk scores in diverse populations

Margaux Hujoel et al.Oct 24, 2023
A
B
P
M
Abstract Polygenic risk scores derived from genotype data (PRS) and family history of disease (FH) both provide valuable information for predicting disease risk, enhancing prospects for clinical utility. PRS perform poorly when applied to diverse populations, but FH does not suffer this limitation. Here, we explore methods for combining both types of information (PRS-FH). We analyzed 10 complex diseases from the UK Biobank for which family history (parental and sibling history) was available for most target samples. PRS were trained using all British individuals ( N =409K), and target samples consisted of unrelated non-British Europeans ( N =42K), South Asians ( N =7K), or Africans ( N =7K). We evaluated PRS, FH, and PRS-FH using liability-scale R 2 , focusing on three well-powered diseases (type 2 diabetes, hypertension, depression) with R 2 > 0.05 for PRS and/or FH in each target population. Averaging across these three diseases, PRS attained average prediction R 2 of 5.8%, 4.0%, and 0.53% in non-British Europeans, South Asians, and Africans, confirming poor cross-population transferability. In contrast, PRS-FH attained average prediction R 2 of 13%, 12%, and 10%, respectively, representing a large improvement in Europeans and an extremely large improvement in Africans; for each disease and each target population, the improvement was highly statistically significant. PRS-FH methods based on a logistic model and a liability threshold model performed similarly when covariates were not included in predictions (consistent with simulations), but the logistic model outperformed the liability threshold model when covariates were included. In conclusion, including family history greatly improves the accuracy of polygenic risk scores, particularly in diverse populations.
0

Comparative genetic architectures of schizophrenia in East Asian and European populations

Max Lam et al.May 6, 2020
+55
Z
C
M
Author summary Schizophrenia is a severe psychiatric disorder with a lifetime risk of about 1% world-wide. Most large schizophrenia genetic studies have studied people of primarily European ancestry, potentially missing important biological insights. Here we present a study of East Asian participants (22,778 schizophrenia cases and 35,362 controls), identifying 21 genome-wide significant schizophrenia associations in 19 genetic loci. Over the genome, the common genetic variants that confer risk for schizophrenia have highly similar effects in those of East Asian and European ancestry (r g =0.98), indicating for the first time that the genetic basis of schizophrenia and its biology are broadly shared across these world populations. A fixed-effect meta-analysis including individuals from East Asian and European ancestries revealed 208 genome-wide significant schizophrenia associations in 176 genetic loci (53 novel). Trans-ancestry fine-mapping more precisely isolated schizophrenia causal alleles in 70% of these loci. Despite consistent genetic effects across populations, polygenic risk models trained in one population have reduced performance in the other, highlighting the importance of including all major ancestral groups with sufficient sample size to ensure the findings have maximum relevance for all populations.
0

Linkage disequilibrium dependent architecture of human complex traits reveals action of negative selection

Steven Gazal et al.May 6, 2020
+8
N
H
S
Abstract Recent work has hinted at the linkage disequilibrium (LD) dependent architecture of human complex traits, where SNPs with low levels of LD (LLD) have larger per-SNP heritability after conditioning on their minor allele frequency (MAF). However, this has not been formally assessed, quantified or biologically interpreted. Here, we analyzed summary statistics from 56 complex diseases and traits (average N = 101,401) by extending stratified LD score regression to continuous annotations. We determined that SNPs with low LLD have significantly larger per-SNP heritability. Roughly half of the LLD signal can be explained by functional annotations that are negatively correlated with LLD, such as DNase I hypersensitivity sites (DHS). The remaining signal is largely driven by our finding that common variants that are more recent tend to have lower LLD and to explain more heritability ( P = 2.38 × 10 −104 ); the youngest 20% of common SNPs explain 3.9x more heritability than the oldest 20%, consistent with the action of negative selection. We also inferred jointly significant effects of other LD-related annotations and confirmed via forward simulations that these annotations jointly predict deleterious effects. Our results are consistent with the action of negative selection on deleterious variants that affect complex traits, complementing efforts to learn about negative selection by analyzing much smaller rare variant data sets.
0
Citation11
0
Save
44

Improving fine-mapping by modeling infinitesimal effects

Ran Cui et al.Oct 24, 2023
+6
M
R
R
Abstract Fine-mapping aims to identify causal variants for phenotypes. Bayesian fine-mapping algorithms (e.g.: SuSiE, FINEMAP, ABF, and COJO-ABF) are widely used, but assessing posterior probability calibration remains challenging in real data, where model misspecification likely exists, and true causal variants are unknown. We introduce Replication Failure Rate (RFR), a metric to assess fine-mapping consistency by down-sampling. SuSiE, FINEMAP and COJO-ABF show high RFR, indicating potential under-conservative mis-calibration. Simulations reveal that non-sparse genetic architecture can lead to miscalibration, while imputation noise, non-uniform distribution of causal variants, and QC filters have minimal impact. We present SuSiE-inf and FINEMAP-inf, novel fine-mapping methods modeling infinitesimal effects alongside fewer larger causal effects. Our methods exhibit improved calibration, RFR and functional enrichment, competitive recall and computational efficiency. Notably, using our methods’ posterior effect sizes substantially increases PRS accuracy over SuSiE and FINEMAP. Our work improves causal variants identification for complex traits, a fundamental goal of human genetics.
0

Mapping and characterization of structural variation in 17,795 human genomes

Haley Abel et al.Sep 14, 2024
+97
A
D
H
0

New mutations, old statistical challenges

Jeffrey Barrett et al.May 6, 2020
+11
K
J
J
Based on targeted sequencing of 208 genes in 11,730 neurodevelopmental disorder cases, Stessman et al. report the identification of 91 genes associated (at a False Discovery Rate [FDR] of 0.1) with autism spectrum disorders (ASD), intellectual disability (ID), and developmental delay (DD)-including what they characterize as 38 novel genes, not previously reported as connected with these diseases. If true, this would represent a substantial step forward. Unfortunately, each of the two discovery analyses (1. De novo mutation analysis and, 2. a comparison of private mutations with public control data) contain critical statistical flaws. When one accounts for these problems, fewer than half of the genes - and very few, if any, of the novel findings - survive. These errors have implications for how future analyses should be conducted, for understanding the genetic basis of these disorders, and for genomic medicine.
0
Paper
Citation9
0
Save
0

Characterising the loss-of-function impact of 5’ untranslated region variants in whole genome sequence data from 15,708 individuals

Konrad Karczewski et al.May 6, 2020
+161
S
X
K
Abstract Upstream open reading frames (uORFs) are important tissue-specific cis -regulators of protein translation. Although isolated case reports have shown that variants that create or disrupt uORFs can cause disease, genetic sequencing approaches typically focus on protein-coding regions and ignore these variants. Here, we describe a systematic genome-wide study of variants that create and disrupt human uORFs, and explore their role in human disease using 15,708 whole genome sequences collected by the Genome Aggregation Database (gnomAD) project. We show that 14,897 variants that create new start codons upstream of the canonical coding sequence (CDS), and 2,406 variants disrupting the stop site of existing uORFs, are under strong negative selection. Furthermore, variants creating uORFs that overlap the CDS show signals of selection equivalent to coding loss-of-function variants, and uORF-perturbing variants are under strong selection when arising upstream of known disease genes and genes intolerant to loss-of-function variants. Finally, we identify specific genes where perturbation of uORFs is likely to represent an important disease mechanism, and report a novel uORF frameshift variant upstream of NF2 in families with neurofibromatosis. Our results highlight uORF-perturbing variants as an important and under-recognised functional class that can contribute to penetrant human disease, and demonstrate the power of large-scale population sequencing data to study the deleteriousness of specific classes of non-coding variants.
0
Paper
Citation8
0
Save
66

Low-coverage sequencing cost-effectively detects known and novel variation in underrepresented populations

Alicia Martin et al.Oct 24, 2023
+36
S
E
A
Abstract Background Genetic studies of biomedical phenotypes in underrepresented populations identify disproportionate numbers of novel associations. However, current genomics infrastructure--including most genotyping arrays and sequenced reference panels--best serves populations of European descent. A critical step for facilitating genetic studies in underrepresented populations is to ensure that genetic technologies accurately capture variation in all populations. Here, we quantify the accuracy of low-coverage sequencing in diverse African populations. Results We sequenced the whole genomes of 91 individuals to high-coverage (≥20X) from the Neuropsychiatric Genetics of African Population-Psychosis (NeuroGAP-Psychosis) study, in which participants were recruited from Ethiopia, Kenya, South Africa, and Uganda. We empirically tested two data generation strategies, GWAS arrays versus low-coverage sequencing, by calculating the concordance of imputed variants from these technologies with those from deep whole genome sequencing data. We show that low-coverage sequencing at a depth of ≥4X captures variants of all frequencies more accurately than all commonly used GWAS arrays investigated and at a comparable cost. Lower depths of sequencing (0.5-1X) performed comparable to commonly used low-density GWAS arrays. Low-coverage sequencing is also sensitive to novel variation, with 4X sequencing detecting 45% of singletons and 95% of common variants identified in high-coverage African whole genomes. Conclusion These results indicate that low-coverage sequencing approaches surmount the problems induced by the ascertainment of common genotyping arrays, including those that capture variation most common in Europeans and Africans. Low-coverage sequencing effectively identifies novel variation (particularly in underrepresented populations), and presents opportunities to enhance variant discovery at a similar cost to traditional approaches.
66
Citation8
0
Save
Load More