DH
Daniel Howrigan
Author with expertise in Standards and Guidelines for Genetic Variant Interpretation
Broad Institute, Massachusetts General Hospital, Harvard University
+ 12 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
15
(13% Open Access)
Cited by:
10
h-index:
38
/
i10-index:
58
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Mapping and characterization of structural variation in 17,795 human genomes

Haley Abel et al.Sep 14, 2024
+97
A
D
H
0

Analysis of protein-coding genetic variation in 60,706 humans

Monkol Lek et al.May 6, 2020
+76
E
K
M
Large-scale reference data sets of human genetic variation are critical for the medical and functional interpretation of DNA sequence changes. Here we describe the aggregation and analysis of high-quality exome (protein-coding region) sequence data for 60,706 individuals of diverse ethnicities generated as part of the Exome Aggregation Consortium (ExAC). The resulting catalogue of human genetic diversity contains an average of one variant every eight bases of the exome, and provides direct evidence for the presence of widespread mutational recurrence. We show that this catalogue can be used to calculate objective metrics of pathogenicity for sequence variants, and to identify genes subject to strong selection against various classes of mutation; we identify 3,230 genes with near-complete depletion of truncating variants, 72% of which have no currently established human disease phenotype. Finally, we demonstrate that these data can be used for the efficient filtering of candidate disease-causing variants, and for the discovery of human knockout variants in protein-coding genes.
0
0
Save
0

Common risk variants identified in autism spectrum disorder

Jakob Grove et al.May 6, 2020
+71
T
S
J
Autism spectrum disorder (ASD) is a highly heritable and heterogeneous group of neurodevelopmental phenotypes diagnosed in more than 1% of children. Common genetic variants contribute substantially to ASD susceptibility, but to date no individual variants have been robustly associated with ASD. With a marked sample size increase from a unique Danish population resource, we report a genome-wide association meta-analysis of 18,381 ASD cases and 27,969 controls that identifies five genome-wide significant loci. Leveraging GWAS results from three phenotypes with significantly overlapping genetic architectures (schizophrenia, major depression, and educational attainment), seven additional loci shared with other traits are identified at equally strict significance levels. Dissecting the polygenic architecture we find both quantitative and qualitative polygenic heterogeneity across ASD subtypes, in contrast to what is typically seen in other complex disorders. These results highlight biological insights, particularly relating to neuronal function and corticogenesis and establish that GWAS performed at scale will be much more productive in the near term in ASD, just as it has been in a broad range of important psychiatric and diverse medical phenotypes.
0

Blended Genome Exome (BGE) as a Cost Efficient Alternative to Deep Whole Genomes or Arrays

Matthew DeFelice et al.May 28, 2024
+16
D
J
M
Genomic scientists have long been promised cheaper DNA sequencing, but deep whole genomes are still costly, especially when considered for large cohorts in population-level studies. More affordable options include microarrays + imputation, whole exome sequencing (WES), or low-pass whole genome sequencing (WGS) + imputation. WES + array + imputation has recently been shown to yield 99% of association signals detected by WGS. However, a method free from ascertainment biases of arrays or the need for merging different data types that still benefits from deeper exome coverage to enhance novel coding variant detection does not exist. We developed a new, combined, "Blended Genome Exome" (BGE) in which a whole genome library is generated, an aliquot of that genome is amplified by PCR, the exome regions are selected and enriched, and the genome and exome libraries are combined back into a single tube for sequencing (33% exome, 67% genome). This creates a single CRAM with a low-coverage whole genome (2-3x) combined with a higher coverage exome (30-40x). This BGE can be used for imputing common variants throughout the genome as well as for calling rare coding variants. We tested this new method and observed >99% r 2 concordance between imputed BGE data and existing 30x WGS data for exome and genome variants. BGE can serve as a useful and cost-efficient alternative sequencing product for genomic researchers, requiring ten-fold less sequencing compared to 30x WGS without the need for complicated harmonization of array and sequencing data.
0
0
Save
0

Refining the role of de novo protein truncating variants in neurodevelopmental disorders using population reference samples

Jack Kosmicki et al.May 6, 2020
+13
D
K
J
Recent research has uncovered an important role for de novo variation in neurodevelopmental disorders. Using aggregated data from 9246 families with autism spectrum disorder, intellectual disability, or developmental delay, we show ~1/3 of de novo variants are independently observed as standing variation in the Exome Aggregation Consortium's cohort of 60,706 adults, and these de novo variants do not contribute to neurodevelopmental risk. We further use a loss-of-function (LoF)-intolerance metric, pLI, to identify a subset of LoF-intolerant genes that contain the observed signal of associated de novo protein truncating variants (PTVs) in neurodevelopmental disorders. LoF-intolerant genes also carry a modest excess of inherited PTVs; though the strongest de novo impacted genes contribute little to this, suggesting the excess of inherited risk resides lower-penetrant genes. These findings illustrate the importance of population-based reference cohorts for the interpretation of candidate pathogenic variants, even for analyses of complex diseases and de novo variation.
0

Functional equivalence of genome sequencing analysis pipelines enables harmonized variant calling across human genetics projects

Allison Regier et al.May 6, 2020
+17
D
Y
A
Hundreds of thousands of human whole genome sequencing (WGS) datasets will be generated over the next few years to interrogate a broad range of traits, across diverse populations. These data are more valuable in aggregate: joint analysis of genomes from many sources increases sample size and statistical power for trait mapping, and will enable studies of genome biology, population genetics and genome function at unprecedented scale. A central challenge for joint analysis is that different WGS data processing and analysis pipelines cause substantial batch effects in combined datasets, necessitating computationally expensive reprocessing and harmonization prior to variant calling. This approach is no longer tenable given the scale of current studies and data volumes. Here, in a collaboration across multiple genome centers and NIH programs, we define WGS data processing standards that allow different groups to produce "functionally equivalent" (FE) results suitable for joint variant calling with minimal batch effects. Our approach promotes broad harmonization of upstream data processing steps, while allowing for diverse variant callers. Importantly, it allows each group to continue innovating on data processing pipelines, as long as results remain compatible. We present initial FE pipelines developed at five genome centers and show that they yield similar variant calling results — including single nucleotide (SNV), insertion/deletion (indel) and structural variation (SV) — and produce significantly less variability than sequencing replicates. Residual inter-pipeline variability is concentrated at low quality sites and repetitive genomic regions prone to stochastic effects. This work alleviates a key technical bottleneck for genome aggregation and helps lay the foundation for broad data sharing and community-wide "big-data" human genetics studies.
0

Schizophrenia risk conferred by protein-coding de novo mutations

Daniel Howrigan et al.May 7, 2020
+21
K
S
D
Protein-coding de novo mutations (DNMs) in the form of single nucleotide changes and short insertions/deletions are significant genetic risk factors for autism, intellectual disability, developmental delay, and epileptic encephalopathy. In contrast, the burden of DNMs has thus far only had a modest documented impact on schizophrenia (SCZ) risk. Here, we analyze whole-exome sequence from 1,695 SCZ affected parent-offspring trios from Taiwan along with DNMs from 1,077 published SCZ trios to better understand the contribution of coding DNMs to SCZ risk. Among 2,772 SCZ affected probands, the increased burden of DNMs is modest. Gene set analyses show that the modest increase in risk from DNMs in SCZ probands is concentrated in genes that are either highly brain expressed, under strong evolutionary constraint, and/or overlap with genes identified as DNM risk factors in other neurodevelopmental disorders. No single gene meets the criteria for genome-wide significance, but we identify 16 genes that are recurrently hit by a protein-truncating DNM, which is a 3.15-fold higher rate than mutation model expectation of 5.1 genes (permuted 95% CI=1-10 genes, permuted p=3e-5). Overall, DNMs explain only a small fraction of SCZ risk, and this risk is polygenic in nature suggesting that coding variation across many different genes will be a risk factor for SCZ in the population.
0

Discovery Of The First Genome-Wide Significant Risk Loci For ADHD

Ditte Demontis et al.May 6, 2020
+68
J
R
D
Attention-Deficit/Hyperactivity Disorder (ADHD) is a highly heritable childhood behavioral disorder affecting 5% of school-age children and 2.5% of adults. Common genetic variants contribute substantially to ADHD susceptibility, but no individual variants have been robustly associated with ADHD. We report a genome-wide association meta-analysis of 20,183 ADHD cases and 35,191 controls that identifies variants surpassing genome-wide significance in 12 independent loci, revealing new and important information on the underlying biology of ADHD. Associations are enriched in evolutionarily constrained genomic regions and loss-of-function intolerant genes, as well as around brain-expressed regulatory marks. These findings, based on clinical interviews and/or medical records are supported by additional analyses of a self-reported ADHD sample and a study of quantitative measures of ADHD symptoms in the population. Meta-analyzing these data with our primary scan yielded a total of 16 genome-wide significant loci. The results support the hypothesis that clinical diagnosis of ADHD is an extreme expression of one or more continuous heritable traits.
0

Evaluation of copy number burden in specific epilepsy types from a genome-wide study of 18,564 subjects

Lisa‐Marie Niestroj et al.May 7, 2020
+6
E
D
L
Rare and large copy number variants (CNVs) around known genomic hotspots are strongly implicated in epilepsy etiology. But it remains unclear whether the observed associations are specific to an epilepsy phenotype, and if additional risk signal can be found outside hotspots. Here, we present the largest CNV burden and first CNV breakpoint level association analysis in epilepsy to date with 11,246 European epilepsy cases and 7,318 ancestry-matched controls. We studied five epilepsy phenotypes: genetic generalized epilepsy, lesional focal epilepsy, non-acquired focal epilepsy, epileptic encephalopathy, and unclassified epilepsy. We discovered novel epilepsy-associated CNV loci and further characterized the CNV burden enrichment among phenotype-specific epilepsies. Finally, we provide evidence for deletion burden outside of known hotspot regions and show that CNVs play a significant role in the genetic architecture of lesional focal epilepsies.
0

Ultra-rare genetic variation in the epilepsies: a whole-exome sequencing study of 17,606 individuals

Yen‐Chen Feng et al.May 6, 2020
+230
L
D
Y
Sequencing-based studies have identified novel risk genes for rare, severe epilepsies and revealed a role of rare deleterious variation in common epilepsies. To identify the shared and distinct ultra-rare genetic risk factors for rare and common epilepsies, we performed a whole-exome sequencing (WES) analysis of 9,170 epilepsy-affected individuals and 8,364 controls of European ancestry. We focused on three phenotypic groups; the rare but severe developmental and epileptic encephalopathies (DEE), and the commoner phenotypes of genetic generalized epilepsy (GGE) and non-acquired focal epilepsy (NAFE). We observed that compared to controls, individuals with any type of epilepsy carried an excess of ultra-rare, deleterious variants in constrained genes and in genes previously associated with epilepsy, with the strongest enrichment seen in DEE and the least in NAFE. Moreover, we found that inhibitory GABAA receptor genes were enriched for missense variants across all three classes of epilepsy, while no enrichment was seen in excitatory receptor genes. The larger gene groups for the GABAergic pathway or cation channels also showed a significant mutational burden in DEE and GGE. Although no single gene surpassed exome-wide significance among individuals with GGE or NAFE, highly constrained genes and genes encoding ion channels were among the top associations, including CACNA1G, EEF1A2, and GABRG2 for GGE and LGI1, TRIM3, and GABRG2 for NAFE. Our study confirms a convergence in the genetics of common and rare epilepsies associated with ultra-rare coding variation and highlights a ubiquitous role for GABAergic inhibition in epilepsy etiology in the largest epilepsy WES study to date.
Load More