JZ
Jian Zeng
Author with expertise in Genomic Studies and Association Analyses
University of Queensland, Heilongjiang University, China Jiliang University
+ 8 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
14
(43% Open Access)
Cited by:
21
h-index:
22
/
i10-index:
34
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
41

Leveraging functional genomic annotations and genome coverage to improve polygenic prediction of complex traits within and between ancestries

Zhili Zheng et al.Oct 24, 2023
+11
J
S
Z
Abstract We develop a new method, SBayesRC, that integrates GWAS summary statistics with functional genomic annotations to improve polygenic prediction of complex traits. Our method is scalable to whole-genome variant analysis and refines signals from functional annotations by allowing them to affect both causal variant probability and causal effect distribution. We analyse 28 traits in the UK Biobank using ∼7 million common SNPs and 96 annotations. SBayesRC improves prediction accuracy by 14% in European ancestry and by up to 33% in trans-ancestry prediction, compared to the baseline method SBayesR which does not use annotations, and outperforms state-of-the-art methods LDpred-funct, PolyPred-S and PRS-CSx by 12-15%. Investigation of factors affecting prediction accuracy identified a significant interaction between SNP density and annotation information, encouraging future use of whole-genome sequence variants for prediction. Functional partitioning analysis highlights a major contribution of evolutionary constrained regions to prediction accuracy and the largest per-SNP contribution from non-synonymous SNPs.
28

mBAT-combo: a more powerful test to detect gene-trait associations from GWAS data

Ang Li et al.Oct 24, 2023
+8
A
S
A
Abstract Gene-based association tests aggregate multiple SNP-trait associations into sets defined by gene boundaries. Since genes have a direct biological link to downstream function, gene-based test results are widely used in post-GWAS analysis. A common approach for gene-based tests is to combine SNPs associations by computing the sum of χ 2 statistics. However, this strategy ignores the directions of SNP effects, which could result in a loss of power for SNPs with masking effects (e.g., when the product of the effects of two SNPs and their linkage disequilibrium (LD) correlation is negative). Here, we introduce “mBAT-combo”, a new set-based test that is better powered than other methods to detect multi-SNP associations in the context of masking effects. We validate the method through simulations and applications to real data. We find that of 35 blood and urine biomarker traits in the UK Biobank, 34 traits show evidence for masking effects in a total of 4,175 gene-trait pairs, indicating that masking effects in complex traits is common. We further validate the improved power of our method in height, body mass index and schizophrenia with different GWAS sample sizes and show that on average 95.7% of the genes detected only by mBAT-combo with smaller sample sizes can be identified by the single-SNP approach with larger sample sizes (average sample size increased by 1.7-fold). For instance, LRRC4B is significant only in our method for schizophrenia, which has been shown to play a role in presynaptic pathology using genetic fine-mapping and evidence-based synaptic annotations. As a more powerful gene-based method, mBAT-combo is expected to improve the downstream pathway analysis or tissue and cell-type enrichment analysis that takes genes identified from GWAS data as input to understand the biological mechanisms of the trait or disease. Despite our focus on genes in this study, the framework of mBAT-combo is general and can be applied to any set of SNPs to refine trait-association signals hidden in genomic regions with complex LD structures.
6

Extend Mixed Models to Multi-layer Neural Networks for Genomic Prediction Including Intermediate Omics Data

Tianjing Zhao et al.Oct 24, 2023
H
J
T
ABSTRACT With the growing amount and diversity of intermediate omics data complementary to genomics (e.g., DNA methylation, gene expression, and protein abundance), there is a need to develop methods to incorporate intermediate omics data into conventional genomic evaluation. The omics data helps decode the multiple layers of regulation from genotypes to phenotypes, thus forms a connected multi-layer network naturally. We developed a new method named NN-LMM to model the multiple layers of regulation from genotypes to intermediate omics features, then to phenotypes, by extending conventional linear mixed models (“LMM”) to multi-layer artificial neural networks (“NN”). NN-LMM incorporates intermediate omics features by adding middle layers between genotypes and phenotypes. Linear mixed models (e.g., pedigree-based BLUP, GBLUP, Bayesian Alphabet, single-step GBLUP, or single-step Bayesian Alphabet) can be used to sample marker effects or genetic values on intermediate omics features, and activation functions in neural networks are used to capture the nonlinear relationships between intermediate omics features and phenotypes. NN-LMM had significantly better prediction performance than the recently proposed single-step approach for genomic prediction with intermediate omics data. Compared to the single-step approach, NN-LMM can handle various patterns of missing omics measures, and allows nonlinear relationships between intermediate omics features and phenotypes. NN-LMM has been implemented in an open-source package called “JWAS”.
6
Paper
Citation4
0
Save
0

Identifying gene targets for brain-related traits using transcriptomic and methylomic data from blood

Tingxiang Qi et al.May 7, 2020
+14
J
Y
T
Understanding the difference in genetic regulation of gene expression between brain and blood is important for discovering genes associated with brain-related traits and disorders. Here, we estimate the correlation of genetic effects at the top associated cis-expression (cis-eQTLs or cis-mQTLs) between brain and blood for genes expressed (or CpG sites methylated) in both tissues, while accounting for errors in their estimated effects (r_b). Using publicly available data (n = 72 to 1,366), we find that the genetic effects of cis-eQTLs (P_eQTL < 5e-8) or mQTLs (P_mQTL < 1e-10) are highly correlated between independent brain and blood samples (r_b = 0.70 with SE = 0.015 for cis-eQTL and r_b = 0.78 with SE = 0.006 for cis-mQTLs). Using meta-analyzed brain eQTL/mQTL data (n = 526 to 1,194), we identify 61 genes and 167 DNA methylation (DNAm) sites associated with 4 brain-related traits and disorders. Most of these associations are a subset of the discoveries (97 genes and 295 DNAm sites) using data from blood with larger sample sizes (n = 1,980 to 14,115). We further find that cis-eQTLs with tissue-specific effects are approximately uniformly distributed across all the functional annotation categories, and that mean difference in gene expression level between brain and blood is almost independent of the difference in the corresponding cis-eQTL effect. Our results demonstrate the gain of power in gene discovery for brain-related phenotypes using blood cis-eQTL or cis-mQTL data with large sample sizes.
0

The effect of X-linked dosage compensation on complex trait variation

Julia Sidorenko et al.May 7, 2020
+9
K
I
J
Quantitative genetics theory predicts that X-chromosome dosage compensation between sexes will have a detectable effect on the amount of genetic and therefore phenotypic trait variances at associated loci in males and females. Here, we systematically examine the role of dosage compensation in complex trait variation in humans in 20 complex traits in a sample of more than 450,000 individuals from the UK Biobank and in 1,600 gene expression traits from a sample of 2,000 individuals as well as across-tissue gene expression from the GTEx resource. We find, on average, twice as much genetic variation for complex traits due to X-linked loci in males compared to females, consistent with a negligible effect of predicted escape from X-inactivation on complex trait variation across traits and also detect biologically relevant X-linked heterogeneity between the sexes for a number of complex traits.
0

Genotype-by-environment interactions inferred from genetic effects on phenotypic variability in the UK Biobank

Huanwei Wang et al.May 6, 2020
+10
J
F
H
Genotype-by-environment interaction (GEI) is a fundamental component in understanding complex trait variation. However, it remains challenging to identify genetic variants with GEI effects in humans largely because of the small effect sizes and the difficulty of monitoring environmental fluctuations. Here, we demonstrate that GEI can be inferred from genetic variants associated with phenotypic variability in a large sample without the need of measuring environmental factors. We performed a genome-wide variance quantitative trait locus (vQTL) analysis of ~5.6 million variants on 348,501 unrelated individuals of European ancestry for 13 quantitative traits in the UK Biobank, and identified 75 significant vQTLs with P<2.0×10-9 for 9 traits, especially for those related to obesity. Direct GEI analysis with five environmental factors showed that the vQTLs were strongly enriched with GEI effects. Our results indicate pervasive GEI effects for obesity-related traits and demonstrate the detection of GEI without environmental data.
0

Genome-wide association study identifies 143 loci associated with 25 hydroxyvitamin D concentration.

Joana Revez et al.May 7, 2020
+18
Z
L
J
Vitamin D deficiency is a candidate risk factor for a range of adverse health outcomes. In a genome-wide association study of 25 hydroxyvitamin D (25OHD) concentration in 417,580 Europeans we identified 143 independent loci in 112 1-Mb regions providing new insights into the physiology of vitamin D and implicating genes involved in (a) lipid and lipoprotein metabolism, (b) dermal tissue properties, and (c) the sulphonation and glucuronidation of 25OHD. Mendelian randomization models found no robust evidence that 25OHD concentration had causal effects on candidate phenotypes (e.g. BMI, psychiatric disorders), but many phenotypes had (direct or indirect) causal effects on 25OHD concentration, clarifying the relationship between 25OHD status and health.
4

Learning functional conservation between pig and human to decipher evolutionary mechanisms underlying gene expression and complex trait

Jinghui Li et al.Oct 24, 2023
+9
D
T
J
Abstract The assessment of genomic conservation between human and pig at the functional level can help understand and improve the potential of pig as a human biomedical model. To address this, we developed a Deep learning-based approach to learn the G enomic C onservation at the F unctional level (DeepGCF) between species by integrating 386 and 374 epigenome and transcriptome profiles from human and pig, respectively. DeepGCF demonstrated a better prediction performance compared to the previous functional conservation prediction method. In addition, we showed that the resulting DeepGCF score captures the functional conservation by examining DeepGCF on chromatin states, sequence ontologies, and regulatory variants. Regions with higher DeepGCF score play a more important role in regulatory activities and show heritability enrichment in human complex traits and diseases. Our DeepGCF approach shows a promising application on the comparison of cross-species functional conservation, and the model framework can be easily adapted to other species. By expanding the model to integrate the functional profiles of multiple species, including human, mouse, pig, cattle, and other livestock animals in the future, the functional conservation information will provide additional insight into the genetic and evolutionary mechanisms behind complex traits and diseases.
0

Novel susceptibility loci and genetic regulation mechanisms for type 2 diabetes

Anke Xue et al.May 7, 2020
+11
Z
Y
A
We conducted a meta-analysis of genome-wide association studies (GWAS) with ~16 million genotyped/imputed genetic variants in 62,892 type 2 diabetes (T2D) cases and 596,424 controls of European ancestry. We identified 139 common and 4 rare (minor allele frequency < 0.01) variants associated with T2D, 42 of which (39 common and 3 rare variants) were independent of the known variants. Integration of the gene expression data from blood (n = 14,115 and 2,765) and other T2D-relevant tissues (n = up to 385) with the GWAS results identified 33 putative functional genes for T2D, three of which were targeted by approved drugs. A further integration of DNA methylation (n=1,980) and epigenomic annotations data highlighted three putative T2D genes (CAMK1D, TP53INP1 and ATP5G1) with plausible regulatory mechanisms whereby a genetic variant exerts an effect on T2D through epigenetic regulation of gene expression. We further found evidence that the T2D-associated loci have been under purifying selection.
0

Promoter-anchored chromatin interactions predicted from genetic analysis of epigenomic data

Yang Wu et al.May 7, 2020
+8
H
T
Y
Promoter-anchored chromatin interactions (PAIs) play a pivotal role in transcriptional regulation. Current high-throughput technologies for detecting PAIs, such as promoter capture Hi-C, are not scalable to large cohorts. Here, we present an analytical approach that uses summary-level data from cohort-based DNA methylation (DNAm) quantitative trait locus (mQTL) studies to predict PAIs. Using mQTL data from human peripheral blood ( n =1,980), we predicted 34,797 PAIs which showed strong overlap with the chromatin contacts identified by previous experimental assays. The promoter-interacting DNAm sites were enriched in enhancers or near expression QTLs. Genes whose promoters were involved in PAIs were more actively expressed, and gene pairs with promoter-promoter interactions were enriched for co-expression. Integration of the predicted PAIs with GWAS data highlighted interactions among 601 DNAm sites associated with 15 complex traits. This study demonstrates the use of mQTL data to predict PAIs and provides insights into the role of PAIs in complex trait variation.
0
0
Save
Load More