HH
Hailiang Huang
Author with expertise in Genomic Studies and Association Analyses
Massachusetts General Hospital, Harvard University, Broad Institute
+ 7 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
26
(42% Open Access)
Cited by:
25
h-index:
58
/
i10-index:
131
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Comparative genetic architectures of schizophrenia in East Asian and European populations

Max Lam et al.May 6, 2020
+55
Z
C
M
Author summary Schizophrenia is a severe psychiatric disorder with a lifetime risk of about 1% world-wide. Most large schizophrenia genetic studies have studied people of primarily European ancestry, potentially missing important biological insights. Here we present a study of East Asian participants (22,778 schizophrenia cases and 35,362 controls), identifying 21 genome-wide significant schizophrenia associations in 19 genetic loci. Over the genome, the common genetic variants that confer risk for schizophrenia have highly similar effects in those of East Asian and European ancestry (r g =0.98), indicating for the first time that the genetic basis of schizophrenia and its biology are broadly shared across these world populations. A fixed-effect meta-analysis including individuals from East Asian and European ancestries revealed 208 genome-wide significant schizophrenia associations in 176 genetic loci (53 novel). Trans-ancestry fine-mapping more precisely isolated schizophrenia causal alleles in 70% of these loci. Despite consistent genetic effects across populations, polygenic risk models trained in one population have reduced performance in the other, highlighting the importance of including all major ancestral groups with sufficient sample size to ensure the findings have maximum relevance for all populations.
1

Genome-wide maps of enhancer regulation connect risk variants to disease genes

Joseph Nasser et al.Oct 24, 2023
+27
C
D
J
Abstract Genome-wide association studies have now identified tens of thousands of noncoding loci associated with human diseases and complex traits, each of which could reveal insights into biological mechanisms of disease. Many of the underlying causal variants are thought to affect enhancers, but we have lacked genome-wide maps of enhancer-gene regulation to interpret such variants. We previously developed the Activity-by-Contact (ABC) Model to predict enhancer-gene connections and demonstrated that it can accurately predict the results of CRISPR perturbations across several cell types. Here, we apply this ABC Model to create enhancer-gene maps in 131 cell types and tissues, and use these maps to interpret the functions of fine-mapped GWAS variants. For inflammatory bowel disease (IBD), causal variants are >20-fold enriched in enhancers in particular cell types, and ABC outperforms other regulatory methods at connecting noncoding variants to target genes. Across 72 diseases and complex traits, ABC links 5,036 GWAS signals to 2,249 unique genes, including a class of 577 genes that appear to influence multiple phenotypes via variants in enhancers that act in different cell types. Guided by these variant-to-function maps, we show that an enhancer containing an IBD risk variant regulates the expression of PPIF to tune mitochondrial membrane potential. Together, our study reveals insights into principles of genome regulation, illuminates mechanisms that influence IBD, and demonstrates a generalizable strategy to connect common disease risk variants to their molecular and cellular functions.
1
Citation10
0
Save
22

Polygenic prediction across populations is influenced by ancestry, genetic architecture, and methodology

Ying Wang et al.Oct 24, 2023
+9
T
M
Y
Summary Polygenic risk scores (PRS) developed from multi-ancestry genome-wide association studies (GWAS), PRS multi , hold promise for improving PRS accuracy and generalizability across populations. To establish best practices for leveraging the increasing diversity of genomic studies, we investigated how various factors affect the performance of PRS multi compared to PRS constructed from single-ancestry GWAS (PRS single ). Through extensive simulations and empirical analyses, we showed that PRS multi overall outperformed PRS single in understudied populations, except when the understudied population represented a small proportion of the multi-ancestry GWAS. Notably, for traits with large-effect ancestry-enriched variants, such as mean corpuscular volume, using substantially fewer samples from Biobank Japan achieved comparable accuracies to a much larger European cohort. Furthermore, integrating PRS based on local ancestry-informed GWAS and large-scale European-based PRS improved predictive performance in understudied African populations, especially for less polygenic traits with large ancestry-enriched variants. Our work highlights the importance of diversifying genomic studies to achieve equitable PRS performance across ancestral populations and provides guidance for developing PRS from multiple studies.
1

Non-rapid eye movement sleep and wake neurophysiology in schizophrenia

Nataliia Kozhemiako et al.Oct 24, 2023
+24
J
J
N
Abstract Motivated by the potential of objective neurophysiological markers to index thalamocortical function in patients with severe psychiatric illnesses, we comprehensively characterized key NREM sleep parameters across multiple domains, their interdependencies, and their relationship to waking event-related potentials and symptom severity. In 130 schizophrenia (SCZ) patients and controls, we confirmed a marked reduction in sleep spindle density in SCZ and extended these findings to show that only slow spindles predicted symptom severity, and that fast and slow spindle properties were largely uncorrelated. We also describe a novel measure of slow oscillation and spindle interaction that was attenuated in SCZ. The main sleep findings were replicated in a demographically distinct sample, and a joint model, based on multiple NREM components, predicted disease status in the replication cohort. Although also altered in patients, auditory event-related potentials elicited during wake were unrelated to NREM metrics. Consistent with a growing literature implicating thalamocortical dysfunction in SCZ, our characterization identifies independent NREM and wake EEG biomarkers that may index distinct aspects of SCZ pathophysiology and point to multiple neural mechanisms underlying disease heterogeneity. This study lays the groundwork for evaluating these neurophysiological markers, individually or in combination, to guide efforts at treatment and prevention as well as identifying individuals most likely to benefit from specific interventions.
0

RICOPILI: Rapid Imputation for COnsortias PIpeLIne

Max Lam et al.May 7, 2020
+16
H
S
M
Motivation: Genome-wide association study (GWAS) analyses, at sufficient sample sizes and power, have successfully revealed biological insights for several complex traits. RICOPILI, an open sourced Perl-based pipeline was developed to address the challenges of rapidly processing large scale multi-cohort GWAS studies including quality control, imputation and downstream analyses. The pipeline is computationally efficient with portability to a wide range of high-performance computing (HPC) environments. Summary: RICOPILI was created as the Psychiatric Genomics Consortium (PGC) pipeline for GWAS and has been adopted by other users. The pipeline features i) technical and genomic quality control in case-control and trio cohorts ii) genome-wide phasing and imputation iv) association analysis v) meta-analysis vi) polygenic risk scoring and vii) replication analysis. Notably, a major differentiator from other GWAS pipelines, RICOPILI leverages on automated parallelization and cluster job management approaches for rapid production of imputed genome-wide data. A comprehensive meta-analysis of simulated GWAS data has been incorporated demonstrating each step of the pipeline. This includes all of the associated visualization plots, to allow ease of data interpretation and manuscript preparation. Simulated GWAS datasets are also packaged with the pipeline for user training tutorials and developer work. Availability and Implementation: RICOPILI has a flexible architecture to allow for ongoing development and incorporation of newer available algorithms and is adaptable to various HPC environments (QSUB, BSUB, SLURM and others). Specific links for genomic resources are either directly provided in this paper or via tutorials and external links. The central location hosting scripts and tutorials is found at this URL: https://sites.google.com/a/broadinstitute.org/RICOPILI/home .
0

Mitochondrial reverse electron transport in myeloid cells perpetuates neuroinflammation

Luca Peruzzotti‐Jametti et al.May 27, 2024
+18
R
C
L
ABSTRACT Sustained smouldering, or low grade, activation of myeloid cells is a common hallmark of several chronic neurological diseases, including multiple sclerosis (MS) 1 . Distinct metabolic and mitochondrial features guide the activation and the diverse functional states of myeloid cells 2 . However, how these metabolic features act to perpetuate neuroinflammation is currently unknown. Using a multiomics approach, we identified a new molecular signature that perpetuates the activation of myeloid cells through mitochondrial complex II (CII) and I (CI) activity driving reverse electron transport (RET) and the production of reactive oxygen species (ROS). Blocking RET in pro-inflammatory myeloid cells protected the central nervous system (CNS) against neurotoxic damage and improved functional outcomes in animal disease models in vivo . Our data show that RET in myeloid cells is a potential new therapeutic target to foster neuroprotection in smouldering inflammatory CNS disorders 3 .
0

Blended Genome Exome (BGE) as a Cost Efficient Alternative to Deep Whole Genomes or Arrays

Matthew DeFelice et al.May 28, 2024
+16
D
J
M
Genomic scientists have long been promised cheaper DNA sequencing, but deep whole genomes are still costly, especially when considered for large cohorts in population-level studies. More affordable options include microarrays + imputation, whole exome sequencing (WES), or low-pass whole genome sequencing (WGS) + imputation. WES + array + imputation has recently been shown to yield 99% of association signals detected by WGS. However, a method free from ascertainment biases of arrays or the need for merging different data types that still benefits from deeper exome coverage to enhance novel coding variant detection does not exist. We developed a new, combined, "Blended Genome Exome" (BGE) in which a whole genome library is generated, an aliquot of that genome is amplified by PCR, the exome regions are selected and enriched, and the genome and exome libraries are combined back into a single tube for sequencing (33% exome, 67% genome). This creates a single CRAM with a low-coverage whole genome (2-3x) combined with a higher coverage exome (30-40x). This BGE can be used for imputing common variants throughout the genome as well as for calling rare coding variants. We tested this new method and observed >99% r 2 concordance between imputed BGE data and existing 30x WGS data for exome and genome variants. BGE can serve as a useful and cost-efficient alternative sequencing product for genomic researchers, requiring ten-fold less sequencing compared to 30x WGS without the need for complicated harmonization of array and sequencing data.
0
0
Save
0

Meta-analysis of 375,000 individuals identifies 38 susceptibility loci for migraine

Padhraig Gormley et al.May 6, 2020
+100
B
V
P
Migraine is a debilitating neurological disorder affecting around 1 in 7 people worldwide, but its molecular mechanisms remain poorly understood. Some debate exists over whether migraine is a disease of vascular dysfunction, or a result of neuronal dysfunction with secondary vascular changes. Genome-wide association (GWA) studies have thus far identified 13 independent loci associated with migraine. To identify new susceptibility loci, we performed the largest genetic study of migraine to date, comprising 59,674 cases and 316,078 controls from 22 GWA studies. We identified 45 independent single nucleotide polymorphisms (SNPs) significantly associated with migraine risk (P < 5 x 10-8) that map to 38 distinct genomic loci, including 28 loci not previously reported and the first locus identified on chromosome X. Furthermore, a subset analysis for migraine without aura (MO) identified seven of the same loci as from the full sample, whereas no loci reached genome-wide significance in the migraine with aura (MA) subset. In subsequent computational analyzes, the identified loci showed enrichment for genes expressed in vascular and smooth muscle tissues, consistent with a predominant theory of migraine that highlights vascular etiologies.
0

A contribution of novel CNVs to schizophrenia from a genome-wide study of 41,321 subjects

Christian Marshall et al.May 6, 2020
+265
D
D
C
Genomic copy number variants (CNVs) have been strongly implicated in the etiology of schizophrenia (SCZ). However, apart from a small number of risk variants, elucidation of the CNV contribution to risk has been difficult due to the rarity of risk alleles, all occurring in less than 1% of cases. We sought to address this obstacle through a collaborative effort in which we applied a centralized analysis pipeline to a SCZ cohort of 21,094 cases and 20,227 controls. We observed a global enrichment of CNV burden in cases (OR=1.11, P=5.7e-15), which persisted after excluding loci implicated in previous studies (OR=1.07, P=1.7e-6). CNV burden is also enriched for genes associated with synaptic function (OR = 1.68, P = 2.8e-11) and neurobehavioral phenotypes in mouse (OR = 1.18, P= 7.3e-5). We identified genome-wide significant support for eight loci, including 1q21.1, 2p16.3 (NRXN1), 3q29, 7q11.2, 15q13.3, distal 16p11.2, proximal 16p11.2 and 22q11.2. We find support at a suggestive level for nine additional candidate susceptibility and protective loci, which consist predominantly of CNVs mediated by non-allelic homologous recombination (NAHR).
0

Population-specific causal disease effect sizes in functionally important regions impacted by selection

Huwenbo Shi et al.May 7, 2020
+11
M
S
H
Many diseases and complex traits exhibit population-specific causal effect sizes with trans-ethnic genetic correlations significantly less than 1, limiting trans-ethnic polygenic risk prediction. We developed a new method, S-LDXR, for stratifying squared trans-ethnic genetic correlation across genomic annotations, and applied S-LDXR to genome-wide association summary statistics for 30 diseases and complex traits in East Asians (EAS) and Europeans (EUR) (average N EAS=93K, N EUR=274K) with an average trans-ethnic genetic correlation of 0.83 (s.e. 0.01). We determined that squared trans-ethnic genetic correlation was 0.81× (s.e. 0.01) smaller than the genome-wide average at SNPs in the top quintile of background selection statistic, implying more population-specific causal effect sizes. Accordingly, causal effect sizes were more population-specific in functionally important regions, including coding, conserved, and regulatory regions. In analyses of regions surrounding specifically expressed genes, causal effect sizes were most population-specific for skin and immune genes and least population-specific for brain genes. Our results could potentially be explained by stronger gene-environment interaction at loci impacted by selection, particularly positive selection.
Load More