HZ
Hongyu Zhao
Author with expertise in Genomic Studies and Association Analyses
Yale University, VA Connecticut Healthcare System, Dalian University of Technology
+ 14 more
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
57
(58% Open Access)
Cited by:
274
h-index:
100
/
i10-index:
528
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
2

A reservoir of stem-like CD8 + T cells in the tumor-draining lymph node preserves the ongoing antitumor immune response

Kelli Connolly et al.Feb 15, 2022
+19
A
M
K
Tumor-specific CD8 + T cells in stable tumor-draining lymph node reservoir are clonally and developmentally related to those in tumors.
154

Androgen Regulates SARS-CoV-2 Receptor Levels and Is Associated with Severe COVID-19 Symptoms in Men

Zaniar Ghazizadeh et al.Oct 13, 2023
+10
M
H
Z
Severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) infection has led to a global health crisis, and yet our understanding of the disease pathophysiology and potential treatment options remains limited. SARS-CoV-2 infection occurs through binding and internalization of the viral spike protein to angiotensin converting enzyme 2 (ACE2) on the host cell membrane. Lethal complications are caused by damage and failure of vital organs that express high levels of ACE2, including the lungs, the heart and the kidneys. Here, we established a high-throughput drug screening strategy to identify therapeutic candidates that reduce ACE2 levels in human embryonic stem cell (hESC) derived cardiac cells. Drug target analysis of validated hit compounds, including 5 alpha reductase inhibitors, revealed androgen signaling as a key modulator of ACE2 levels. Treatment with the 5 alpha reductase inhibitor dutasteride reduced ACE2 levels and internalization of recombinant spike receptor binding domain (Spike-RBD) in hESC-derived cardiac cells and human alveolar epithelial cells. Finally, clinical data on coronavirus disease 2019 (COVID-19) patients demonstrated that abnormal androgen states are significantly associated with severe disease complications and cardiac injury as measured by blood troponin T levels. These findings provide important insights on the mechanism of increased disease susceptibility in male COVID-19 patients and identify androgen receptor inhibition as a potential therapeutic strategy.
154
Citation43
0
Save
0

Inherited Causes of Clonal Hematopoiesis of Indeterminate Potential in TOPMed Whole Genomes

Alexander Bick et al.May 6, 2020
+120
S
J
A
ABSTRACT Age is the dominant risk factor for most chronic human diseases; yet the mechanisms by which aging confers this risk are largely unknown. 1 Recently, the age-related acquisition of somatic mutations in regenerating hematopoietic stem cell populations was associated with both hematologic cancer incidence 2–4 and coronary heart disease prevalence. 5 Somatic mutations with leukemogenic potential may confer selective cellular advantages leading to clonal expansion, a phenomenon termed ‘Clonal Hematopoiesis of Indeterminate Potential’ (CHIP). 6 Simultaneous germline and somatic whole genome sequence analysis now provides the opportunity to identify root causes of CHIP. Here, we analyze high-coverage whole genome sequences from 97,691 participants of diverse ancestries in the NHLBI TOPMed program and identify 4,229 individuals with CHIP. We identify associations with blood cell, lipid, and inflammatory traits specific to different CHIP genes. Association of a genome-wide set of germline genetic variants identified three genetic loci associated with CHIP status, including one locus at TET2 that was African ancestry specific. In silico -informed in vitro evaluation of the TET2 germline locus identified a causal variant that disrupts a TET2 distal enhancer. Aggregates of rare germline loss-of-function variants in CHEK2 , a DNA damage repair gene, predisposed to CHIP acquisition. Overall, we observe that germline genetic variation altering hematopoietic stem cell function and the fidelity of DNA-damage repair increase the likelihood of somatic mutations leading to CHIP.
0
Citation22
0
Save
54

Local genetic correlation analysis reveals heterogeneous etiologic sharing of complex traits

Yiliang Zhang et al.Oct 23, 2023
+10
Y
Q
Y
Abstract Local genetic correlation quantifies the genetic similarity of complex traits in specific genomic regions, which could shed unique light on etiologic sharing and provide additional mechanistic insights into the genetic basis of complex traits compared to global genetic correlation. However, accurate estimation of local genetic correlation remains challenging, in part due to extensive linkage disequilibrium in local genomic regions and pervasive sample overlap across studies. We introduce SUPERGNOVA, a unified framework to estimate both global and local genetic correlations using summary statistics from genome-wide association studies. Through extensive simulations and analyses of 30 complex traits, we demonstrate that SUPERGNOVA substantially outperforms existing methods and identifies 150 trait pairs with significant local genetic correlations. In particular, we show that the positive, consistently-identified, yet paradoxical genetic correlation between autism spectrum disorder and cognitive performance could be explained by two etiologically-distinct genetic signatures with bidirectional local genetic correlations. We believe that statistically-rigorous local genetic correlation analysis could accelerate progress in complex trait genetics research.
24

Single-cell transcriptomic and proteomic analysis of Parkinson’s disease Brains

Biqing Zhu et al.Oct 24, 2023
+10
S
J
B
Abstract Parkinson’s disease (PD) is a prevalent neurodegenerative disorder where recent evidence suggests pathogenesis may be mediated by inflammatory processes. The molecular architecture of the disease remains to be fully elucidated. We performed single-nucleus transcriptomics and unbiased proteomics using postmortem tissue obtained from the prefrontal cortex of 12 individuals with late-stage PD and age-matched controls. We analyzed ∼80,000 nuclei and identified eight major cell types, including brain-resident T cells, each with distinct transcriptional changes in line with the known genetics of PD. By analyzing Lewy body pathology in the same postmortem tissue, we found that α-synuclein pathology is inversely correlated with chaperone expression in excitatory neurons. Examining cell-cell interactions, we found a selective abatement of neuron-astrocyte interactions and enhanced neuroinflammation. Proteomic analyses of the same brains identified synaptic proteins in prefrontal cortex that were preferentially downregulated in PD. Strikingly, comparing this dataset to a regionally similar published analysis for Alzheimer’s disease (AD), we found no common differentially expressed genes in neurons, but identified many shared differentially expressed genes in glial cells, suggesting that disease etiology in PD and AD are likely distinct. These data are presented as a resource for interrogating the molecular and cellular basis of PD and other neurodegenerative diseases. One Sentence Summary We provide an extensive single cell analysis profiling nearly 80,000 brain nuclei from prefrontal cortex of late-stage Parkinson’s disease brains, demonstrate that α-synuclein pathology is inversely correlated with chaperone expression in excitatory neurons, found a selective abatement of neuron-astrocyte interactions with enhanced neuroinflammation, and augmented the study with proteomic analysis and cross-comparisons with Alzheimer’s disease datasets, providing valuable insights into the pathways of neurodegeneration and a deep definition of the underlying molecular pathology for Parkinson’s disease.
24
Paper
Citation15
0
Save
32

Comparison of methods for estimating genetic correlation between complex traits using GWAS summary statistics

Yiliang Zhang et al.Oct 24, 2023
+3
W
Y
Y
Abstract Genetic correlation is the correlation of additive genetic effects on two phenotypes. It is an informative metric to quantify the overall genetic similarity between complex traits, which provides insights into their polygenic genetic architecture. Several methods have been proposed to estimate genetic correlations based on data collected from genome-wide association studies (GWAS). Due to the easy access of GWAS summary statistics and computational efficiency, methods only requiring GWAS summary statistics as input have become more popular than methods utilizing individual-level genotype data. Here, we present a benchmark study for different summary-statistics-based genetic correlation estimation methods through simulation and real data applications. We focus on two major technical challenges in estimating genetic correlation: marker dependency caused by linkage disequilibrium (LD) and sample overlap between different studies. To assess the performance of different methods in the presence of these two challenges, we first conducted comprehensive simulations with diverse LD patterns and sample overlaps. Then we applied these methods to real GWAS summary statistics for a wide spectrum of complex traits. Based on these experiments, we conclude that methods relying on accurate LD estimation are less robust in real data applications compared to other methods due to the imprecision of LD obtained from reference panels. Our findings offer a guidance on how to appropriately choose the method for genetic correlation estimation in post-GWAS analysis in interpretation.
0

Evaluating the Utilities of Large Language Models in Single-cell Data Analysis

Tianyu Li et al.May 26, 2024
+2
Y
K
T
Abstract Large Language Models (LLMs) or Foundation Models (FMs) have made significant strides in both industrial and scientific domains. In this paper, we evaluate the performance of LLMs in single-cell sequencing data analysis through comprehensive experiments across eight downstream tasks pertinent to single-cell data. By comparing seven different single-cell LLMs with task-specific methods, we found that single-cell LLMs may not consistently excel in all tasks than task-specific methods. However, the emergent abilities and the successful applications of cross-species/cross-modality transfer learning of LLMs are promising. In addition, we present a systematic evaluation of the effects of hyper-parameters, initial settings, and stability for training single-cell LLMs based on a proposed scEval framework, and provide guidelines for pre-training and fine-tuning. Our work summarizes the current state of single-cell LLMs, and points to their constraints and avenues for future developments.
1

Correcting statistical bias in correlation-based kinship estimators

Wei Jiang et al.Jan 24, 2021
+2
S
X
W
Accurate estimate of relatedness is important for genetic data analyses, such as association mapping and heritability estimation based on data collected from genome-wide association studies. Inaccurate relatedness estimates may lead to spurious associations and biased heritability estimations. Individual-level genotype data are often used to estimate kinship coefficient between individuals. The commonly used sample correlation-based genomic relationship matrix (scGRM) method estimates kinship coefficient by calculating the average sample correlation coefficient among all single nucleotide polymorphisms (SNPs), where the observed allele frequencies are used to calculate both the expectations and variances of genotypes. Although this method is widely used, a substantial proportion of estimated kinship coefficients are negative, which are difficult to interpret. In this paper, through mathematical derivation, we show that there indeed exists bias in the estimated kinship coefficient using the scGRM method when the observed allele frequencies are regarded as true frequencies. This leads to negative bias for the average estimate of kinship among all individuals, which explains the estimated negative kinship coefficients. Based on this observation, we propose an unbiased estimation method, UKin, which can reduce the bias. We justify our improved method with rigorous mathematical proof. We have conducted simulations as well as two real data analyses to demonstrate that both bias and root mean square error in kinship coefficient estimation can be reduced by using UKin. Further simulations indicate that the power in association mapping can also be improved by using our unbiased kinship estimates to adjust for cryptic relatedness.
1
Paper
Citation2
0
Save
10

A Markov Random Field Model for Network-based Differential Expression Analysis of Single-cell RNA-seq Data

Hongyu Li et al.Oct 24, 2023
+3
Z
B
H
Abstract Background Recent development of single cell sequencing technologies has made it possible to identify genes with different expression (DE) levels at the cell type level between different groups of samples. In this article, we propose to borrow information through known biological networks to increase statistical power to identify differentially expressed genes (DEGs). Results We develop MRFscRNAseq, which is based on a Markov Random Field (MRF) model to appropriately accommodate gene network information as well as dependencies among cell types to identify cell-type specific DEGs. We implement an Expectation-Maximization (EM) algorithm with mean field-like approximation to estimate model parameters and a Gibbs sampler to infer DE status. Simulation study shows that our method has better power to detect cell-type specific DEGs than conventional methods while appropriately controlling type I error rate. The usefulness of our method is demonstrated through its application to study the pathogenesis and biological processes of idiopathic pulmonary fibrosis (IPF) using a single-cell RNA-sequencing (scRNA-seq) data set, which contains 18,150 protein-coding genes across 38 cell types on lung tissues from 32 IPF patients and 28 normal controls. Conclusions The proposed MRF model is implemented in the R package MRFscRNAseq available on GitHub. By utilizing gene-gene and cell-cell networks, our method increases statistical power to detect differentially expressed genes from scRNA-seq data.
14

Live imaging reveals chromatin compaction transitions and dynamic transcriptional bursting during stem cell differentiation in vivo

Dennis May et al.Oct 24, 2023
+10
D
S
D
Abstract Stem cell differentiation requires dramatic changes in gene expression and global remodeling of chromatin architecture. How and when chromatin remodels relative to the transcriptional, behavioral, and morphological changes during differentiation remain unclear, particularly in an intact tissue context. Here, we develop a quantitative pipeline which leverages fluorescently-tagged histones and longitudinal imaging to track large-scale chromatin compaction changes within individual cells in a live mouse. Applying this pipeline to epidermal stem cells, we reveal that cell-to-cell chromatin compaction heterogeneity within the stem cell compartment emerges independent of cell cycle status, and instead is reflective of differentiation status. Chromatin compaction state gradually transitions over days as differentiating cells exit the stem cell compartment. Moreover, establishing live imaging of keratin-10 nascent RNA, which marks the onset of stem cell differentiation, we find that keratin-10 transcription is highly dynamic and largely precedes the global chromatin compaction changes associated with differentiation. Together, these analyses reveal that stem cell differentiation involves dynamic transcriptional states and gradual chromatin rearrangement.
14
Citation1
0
Save
Load More