WJ
Wei Jiang
Author with expertise in Genomic Selection in Plant and Animal Breeding
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
10
(70% Open Access)
Cited by:
315
h-index:
26
/
i10-index:
51
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

A randomized, double-blind, placebo-controlled trial of antidepressants in Parkinson disease

I Richard et al.Apr 12, 2012
To evaluate the efficacy and safety of a selective serotonin reuptake inhibitor (SSRI) and a serotonin and norepinephrine reuptake inhibitor (SNRI) in the treatment of depression in Parkinson disease (PD).A total of 115 subjects with PD were enrolled at 20 sites. Subjects were randomized to receive an SSRI (paroxetine; n = 42), an SNRI (venlafaxine extended release [XR]; n = 34), or placebo (n = 39). Subjects met DSM-IV criteria for a depressive disorder, or operationally defined subsyndromal depression, and scored >12 on the first 17 items of the Hamilton Rating Scale for Depression (HAM-D). Subjects were followed for 12 weeks (6-week dosage adjustment, 6-week maintenance). Maximum daily dosages were 40 mg for paroxetine and 225 mg for venlafaxine XR. The primary outcome measure was change in the HAM-D score from baseline to week 12.Treatment effects (relative to placebo), expressed as mean 12-week reductions in HAM-D score, were 6.2 points (97.5% confidence interval [CI] 2.2 to 10.3, p = 0.0007) in the paroxetine group and 4.2 points (97.5% CI 0.1 to 8.4, p = 0.02) in the venlafaxine XR group. No treatment effects were seen on motor function.Both paroxetine and venlafaxine XR significantly improved depression in subjects with PD. Both medications were generally safe and well tolerated and did not worsen motor function.This study provides Class I evidence that paroxetine and venlafaxine XR are effective in treating depression in patients with PD.
32

Comparison of methods for estimating genetic correlation between complex traits using GWAS summary statistics

Yiliang Zhang et al.Oct 13, 2020
Abstract Genetic correlation is the correlation of additive genetic effects on two phenotypes. It is an informative metric to quantify the overall genetic similarity between complex traits, which provides insights into their polygenic genetic architecture. Several methods have been proposed to estimate genetic correlations based on data collected from genome-wide association studies (GWAS). Due to the easy access of GWAS summary statistics and computational efficiency, methods only requiring GWAS summary statistics as input have become more popular than methods utilizing individual-level genotype data. Here, we present a benchmark study for different summary-statistics-based genetic correlation estimation methods through simulation and real data applications. We focus on two major technical challenges in estimating genetic correlation: marker dependency caused by linkage disequilibrium (LD) and sample overlap between different studies. To assess the performance of different methods in the presence of these two challenges, we first conducted comprehensive simulations with diverse LD patterns and sample overlaps. Then we applied these methods to real GWAS summary statistics for a wide spectrum of complex traits. Based on these experiments, we conclude that methods relying on accurate LD estimation are less robust in real data applications compared to other methods due to the imprecision of LD obtained from reference panels. Our findings offer a guidance on how to appropriately choose the method for genetic correlation estimation in post-GWAS analysis in interpretation.
32
Citation7
0
Save
1

Correcting statistical bias in correlation-based kinship estimators

Wei Jiang et al.Jan 13, 2021
Accurate estimate of relatedness is important for genetic data analyses, such as association mapping and heritability estimation based on data collected from genome-wide association studies. Inaccurate relatedness estimates may lead to spurious associations and biased heritability estimations. Individual-level genotype data are often used to estimate kinship coefficient between individuals. The commonly used sample correlation-based genomic relationship matrix (scGRM) method estimates kinship coefficient by calculating the average sample correlation coefficient among all single nucleotide polymorphisms (SNPs), where the observed allele frequencies are used to calculate both the expectations and variances of genotypes. Although this method is widely used, a substantial proportion of estimated kinship coefficients are negative, which are difficult to interpret. In this paper, through mathematical derivation, we show that there indeed exists bias in the estimated kinship coefficient using the scGRM method when the observed allele frequencies are regarded as true frequencies. This leads to negative bias for the average estimate of kinship among all individuals, which explains the estimated negative kinship coefficients. Based on this observation, we propose an unbiased estimation method, UKin, which can reduce the bias. We justify our improved method with rigorous mathematical proof. We have conducted simulations as well as two real data analyses to demonstrate that both bias and root mean square error in kinship coefficient estimation can be reduced by using UKin. Further simulations indicate that the power in association mapping can also be improved by using our unbiased kinship estimates to adjust for cryptic relatedness.
1
Citation2
0
Save
11

Estimating genetic correlation jointly using individual-level and summary-level GWAS data

Yiliang Zhang et al.Aug 19, 2021
Abstract With the increasing accessibility of individual-level data from genome wide association studies, it is now common for researchers to have individual-level data of some traits in one specific population. For some traits, we can only access public released summary-level data due to privacy and safety concerns. The current methods to estimate genetic correlation can only be applied when the input data type of the two traits of interest is either both individual-level or both summary-level. When researchers have access to individual-level data for one trait and summary-level data for the other, they have to transform the individual-level data to summary-level data first and then apply summary data-based methods to estimate the genetic correlation. This procedure is computationally and statistically inefficient and introduces information loss. We introduce GENJI (Genetic correlation EstimatioN Jointly using Individual-level and summary data), a method that can estimate within-population or transethnic genetic correlation based on individual-level data for one trait and summary-level data for another trait. Through extensive simulations and analyses of real data on within-population and transethnic genetic correlation estimation, we show that GENJI produces more reliable and efficient estimation than summary data-based methods. Besides, when individual-level data are available for both traits, GENJI can achieve comparable performance than individual-level data-based methods. Downstream applications of genetic correlation can benefit from more accurate estimates. In particular, we show that more accurate genetic correlation estimation facilitates the predictability of cross-population polygenic risk scores.
11
Citation2
0
Save
1

POGZ suppresses 2C transcriptional program and retrotransposable elements

X. Sun et al.Nov 3, 2022
ABSTRACT The POGZ gene has been found frequently mutated in neurodevelopmental disorders (NDDs) such as autism spectrum disorder (ASD) and intellectual disability (ID). We have recently shown that POGZ maintains mouse embryonic stem cells (ESCs) as a chromatin regulator and a transcription factor. However, the exact mechanisms remain unclear. Here we show that POGZ plays important role in the maintenance of ESCs by silencing the Dux gene and certain endogenous retroviruses (ERVs). POGZ directly binds to the Dux gene and ERVs, and its depletion leads to up-regulation of 2C genes and the repetitive elements such as RLTR9E and IAP (the intracisternal A-type particles), resulting in transition to a 2C-like (2CLC) state and genome instability. POGZ regulates ESC heterochromatin state by association and recruiting TRIM28 and SETDB1, and its loss leads to increased H3K4me3 and H3K27ac, and decreased H3K9me3 at local chromatin. Activation of POGZ-bound ERVs is associated with up-regulation of nearby neural genes. Chimeric transcripts that are initiated within ERVs and spliced to genic exons are highly expressed in Pogz−/− ESCs. Our findings establish that POGZ is required for the maintenance of ESCs by repressing Dux and silencing ERVs, which may provide important insights into the disease pathology caused by POGZ dysfunction. Highlights POGZ depletion leads to activation of 2C genes POGZ depletion leads to deregulation of ERVs POGZ directly binds and represses Dux POGZ associates with TRIM28/SETDB1 to maintain heterochromatin state to silence ERVs Activation of POGZ-bound ERVs is associated with up-regulation of nearby neural genes
1

Causal Haplotype Block Identification in Plant Genome-Wide Association Studies

Weijie Xing et al.Oct 29, 2021
Abstract Genome wide association studies (GWAS) can play an essential role in understanding genetic basis of complex traits in plants and animals. Conventional SNP-based linear mixed models (LMM) used in many GWAS that marginally test single nucleotide polymorphisms (SNPs) have successfully identified many loci with major and minor effects. In plants, the relatively small population size in GWAS and the high genetic diversity found many plant species can impede mapping efforts on complex traits. Here we present a novel haplotype-based trait fine-mapping framework, HapFM, to supplement current GWAS methods. HapFM uses genotype data to partition the genome into haplotype blocks, identifies haplotype clusters within each block, and then performs genome-wide haplotype fine-mapping to infer the causal haplotype blocks of trait. We benchmarked HapFM, GEMMA, BSLMM, and GMMAT in both simulation and real plant GWAS datasets. HapFM consistently resulted in higher mapping power than the other GWAS methods in simulations with high polygenicity. Moreover, it resulted in higher mapping resolution, especially in regions of high LD, by identifying small causal blocks in the larger haplotype block. In the Arabidopsis flowering time (FT10) datasets, HapFM identified four novel loci compared to GEMMA’s results, and its average mapping interval of HapFM was 9.6 times smaller than that of GEMMA. In conclusion, HapFM is tailored for plant GWAS to result in high mapping power on complex traits and improved mapping resolution to facilitate crop improvement.
0

LDER-GE estimates phenotypic variance component of gene-environment interactions in human complex traits accurately with GE interaction summary statistics and full LD information

Zihan Dong et al.Jan 1, 2023
Gene-environment (GE) interactions are essential in understanding human complex traits. Identifying these interactions is necessary for deciphering the biological basis of such traits. In this study, we introduce a statistical method Linkage-Disequilibrium Eigenvalue Regression for Gene-Environment interactions (LDER-GE). LDER-GE improves the accuracy of estimating the phenotypic variance component explained by genome-wide GE interactions using large-scale biobank association summary statistics. LDER-GE leverages the complete Linkage Disequilibrium (LD) matrix, as opposed to only the diagonal squared LD matrix utilized by LDSC (Linkage Disequilibrium Score)-based methods. Our extensive simulation studies demonstrate that LDER-GE performs better than LDSC-based approaches by enhancing statistical efficiency by approximately 23%. This improvement is equivalent to a sample size increase of around 51%. Additionally, LDER-GE effectively controls type-I error rate and produces unbiased results. We conducted an analysis using UK Biobank data, comprising 307,259 unrelated European-Ancestry subjects and 966,766 variants, across 151 environmental covariate-phenotype (E-Y) pairs. LDER-GE identified 35 significant E-Y pairs while LDSC-based method only identified 25 significant E-Y pairs with 23 overlapped with LDER-GE. Furthermore, we employed LDER-GE to estimate the aggregated variance component attributed to multiple GE interactions, leading to an increase in the explained phenotypic variance with GE interactions compared to considering main genetic effects only. Our results suggest the importance of impacts of GE interactions on human complex traits.
0

Leveraging genetic correlations and multiple populations to improve genetic risk prediction for non-European populations

Leqi Xu et al.Jan 1, 2023
The disparity in genetic risk prediction accuracy between European and non-European individuals highlights a critical challenge in health inequality. To bridge this gap, we introduce JointPRS, a novel method that models multiple populations jointly to improve genetic risk predictions for non-European individuals. JointPRS has three key features. First, it encompasses all diverse populations to improve prediction accuracy, rather than relying solely on the target population with a singular auxiliary European group. Second, it autonomously estimates and leverages chromosome-wise cross-population genetic correlations to infer the effect sizes of genetic variants. Lastly, it provides an auto version that has comparable performance to the tuning version to accommodate the situation with no validation dataset. Through extensive simulations and real data applications to 22 quantitative traits and four binary traits in East Asian, nine quantitative traits and one binary trait in African, and four quantitative traits in South Asian populations, we demonstrate that JointPRS outperforms state-of-art methods, improving the prediction accuracy for both quantitative and binary traits in non-European populations.
0

Xolik: finding cross-linked peptides with maximum paired scores in linear time

Jiaan Dai et al.Jun 24, 2017
Motivation: Cross-linking technique coupled with mass spectrometry (MS) is widely used in the analysis of protein structures and protein-protein interactions. In order to identify cross-linked peptides from MS data, we need to consider all pairwise combinations of peptides, which is computationally prohibitive when the sequence database is large. To alleviate this problem, some heuristic screening strategies are used to reduce the number of peptide pairs during the identification. However, heuristic screening criteria may ignore true findings. Results: We directly tackle the combination challenge without using any screening strategies. With the additive scoring function and the data structure of double-ended queue, the proposed algorithm reduces the quadratic time complexity of exhaustive searching down to the linear time complexity. We implement the algorithm in a tool named Xolik, and the running time of Xolik is validated using databases with different number of proteins. Experiments using synthetic and empirical datasets show that Xolik outperforms existing tools in terms of running time and statistical power. Availability: Source code and binaries of Xolik are freely available at http://bioinformatics.ust.hk/Xolik.html.