ZY
Zhikai Yang
Author with expertise in Genetic Architecture of Quantitative Traits
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
7
(71% Open Access)
Cited by:
18
h-index:
4
/
i10-index:
2
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
26

Genome-wide mediation analysis: bridging the divide between genotype and phenotype via transcriptomic data in maize

Zhikai Yang et al.Apr 11, 2021
Mapping genotype to phenotype is an essential topic in genetics and genomics research. As the Omics data become increasingly available, genome-wide association study (GWAS) has been widely applied to establish the relationship between genotype and phenotype. However, signals detected by GWAS usually span broad genomic regions with many underneath candidate genes, making it challenging to interpret and validate the molecular functions of the candidate genes. Under the context of genetics research, we hypothesized a causal chain from genotype to phenotype partially mediated by intermediate molecular processes, i.e., gene expression. To test this hypothesis, we applied the high dimensional mediation analysis, a class of causal inference method with an assumed causal chain from the exposure to the mediator to the outcome, and implemented it to the maize diversity panel (N=280 lines). Using 40 publicly available agronomic traits, 66 newly generated metabolic traits, and published RNA-seq data from seven different tissues, we detected N=736 unique mediating genes, explaining an average of 12.7% phenotypic variance due to mediation. Noticeably, 83/736 (11%) genes were identified in mediating more than one trait, suggesting the prevalence of pleiotropic mediating effects. Among those pleiotropic mediators, benzox-azinone synthesis 13 ( Bx13 ), a well-characterized gene encoding a 2-oxoglutarate-dependent dioxygenase, was identified mediating 40 agronomic and metabolic traits in different tissues. Further genetic and genomic analyses of the Bx13 and adjacent mediating genes suggested a 3D co-regulation modulation likely affect their expression levels and eventually lead to phenotypic consequences. Our results suggested the genome-wide mediation analysis is a powerful tool to integrate Omics data in providing causal inference to connect genotype to phenotype.
26
Citation4
0
Save
13

Genomic selection to optimize doubled haploid-based hybrid breeding in maize

Jinlong Li et al.Sep 9, 2020
ABSTRACT Crop improvement, as a long-term endeavor, requires continuous innovations in technique from multiple perspectives. Doubled haploid (DH) technology for pure inbred production, which shaves years off of the conventional selfing approach, has been widely used for breeding. However, the final success rate of in vivo maternal DH production is determined by four factors: haploids induction, haploids identification, chromosome doubling, and successful selfing of the fertile haploid plants to produce DH seeds. Traits in each of these steps, if they can be accurately predicted using genomic selection methods, will help adjust the DH production protocol and simplify the logistics and save costs. Here, a hybrid population (N=158) was generated based on an incomplete half diallel design using 27 elite inbred lines. These hybrids were induced to create F1-derived haploid families. The hybrid materials, as well as the 27 inbreds, the inbred-derived haploids (N=200), and the F1-derived haploids (N=5,000) were planted in the field to collect four DH-production traits, three yield-related traits, and three developmental traits. Quantitative genetics analysis suggested that in both diploids and haploid families, most of the developmental traits showed high heritability, while the DH-production and developmental traits exhibited intermediate levels of heritability. By employing different genomic selection models, our results showed that the prediction accuracy ranged from 0.52 to 0.59 for the DH-production traits, 0.50 to 0.68 for the yield-related traits, and 0.44 to 0.87 for the developmental traits. Further analysis using index selection achieved the highest prediction accuracy when considering both DH production efficiency and the agronomic trait performance. Furthermore, the long-term responses through simulation confirmed that index selection would increase the genetic gain for targeted agronomic traits while maintaining the DH production efficiency. Therefore, our study provides an optimization strategy to integrate GS technology for DH-based hybrid breeding.
13
Citation4
0
Save
1

Heritable microbiome variation is correlated with source environment in locally adapted maize varieties

Xiaoming He et al.Jan 10, 2023
Abstract Beneficial interactions with microorganisms are pivotal for crop performance and resilience. However, it remains unclear how heritable the microbiome is with respect to the host plant genotype and to what extent host genetic mechanisms can modulate plant-microbe interactions in the face of environmental stress. Here, we surveyed the root and rhizosphere microbiome of 129 accessions of locally adapted Zea mays , sourced from diverse habitats and grown under control and different stress conditions. We quantified treatment and host genotype effects on the microbiome. Plant genotype and source environment were predictive of microbiome composition. Genome wide association analysis identified host genetic variants linked to both rhizosphere microbiome composition and source environment. We identified transposon insertions in a candidate gene linked to both the abundance of a keystone microbe Massilia and source total soil nitrogen, finding mutant plants to show a reduction in lateral root density. We conclude that locally adapted maize varieties exert patterns of genetic control on their root and rhizosphere microbiomes that follow variation in their home environments, consistent with a role in tolerance to prevailing stress.
1
Citation3
0
Save
1

MedDiC: high dimensional mediation analysis via difference in coefficients

Qi Zhang et al.Sep 12, 2022
Abstract High dimensional mediation analysis has been receiving increasing popularity, largely motivated by the scientific problems in genomics and biomedical imaging. Previous literature has primarily focused on mediator selection for high dimensional mediators. In this paper, we aim at the estimation and inference of overall indirect effect for high dimensional exposures and high dimensional mediators. We propose MedDiC, a novel debiased estimator of the high dimensional overall indirect effect based on difference-in-coefficients approach. We evaluate the proposed method using intensive simulations and find that MedDiC provides valid inference and offers higher power and shorter computing time than the competitors for both low dimensional and high dimensional exposures. We also apply MedDiC to a mouse f2 dataset for diabetes study and a dataset composed of diverse maize inbred lines for flowering time, and show that MedDiC yields more biologically meaningful gene lists, and the results are reproduciable across analyses using different measures of identical biological signal or related phenotype as the outcome. Upon the acceptance of the paper, the code will be available on GitHub ( https://github.com/QiZhangStat/MedDiC ).
14

Microbiome-enabled genomic selection improves prediction accuracy for nitrogen-related traits in maize

Zhikai Yang et al.Mar 3, 2023
Abstract Root-associated microbiomes in the rhizosphere (rhizobiomes) are increasingly known to play an important role in nutrient acquisition, stress tolerance, and disease resistance of plants. However, it remains largely unclear to what extent these rhizobiomes contribute to trait variation for different genotypes and if their inclusion in the genomic selection (GS) protocol can enhance prediction accuracy. To address these questions, we developed a microbiome-enabled GS (MEGS) method that incorporated host SNPs and ASVs (amplicon sequence variants) from plant rhizobiomes in a maize diversity panel under high and low nitrogen (N) field conditions. Our cross-validation results showed that the MEGS model significantly outperformed the conventional GS model for nearly all time-series traits related to plant growth and N responses, with an average relative improvement of 3.7%. The improvement was more pronounced under low N conditions (8.4% — 40.2% of relative improvement), consistent with the view that some beneficial microbes can enhance N nutrient uptake, particularly in low N fields. However, our study could not definitively rule out the possibility that the observed improvement is partially due to the ASVs being influenced by microenvironments. Using a high-dimensional mediation analysis method, our study has also identified microbial mediators that establish a link between plant genotype and phenotype. Some of the detected mediator microbes were previously reported to promote plant growth. The enhanced prediction accuracy of the MEGS models, demonstrated in a single environment, serves as a proof-of-concept for the potential application of microbiome-enabled plant breeding for sustainable agriculture.
0

Dissecting the colocalized GWAS and eQTLs with mediation analysis for high-dimensional exposures and confounders

Qi Zhang et al.Mar 27, 2024
Abstract To leverage the advancements in genome-wide association studies (GWAS) and quantitative trait loci (QTL) mapping for traits and molecular phenotypes to gain mechanistic understanding of the genetic regulation, biological researchers often investigate the expression QTLs (eQTLs) that colocalize with QTL or GWAS peaks. Our research is inspired by 2 such studies. One aims to identify the causal single nucleotide polymorphisms that are responsible for the phenotypic variation and whose effects can be explained by their impacts at the transcriptomic level in maize. The other study in mouse focuses on uncovering the cis-driver genes that induce phenotypic changes by regulating trans-regulated genes. Both studies can be formulated as mediation problems with potentially high-dimensional exposures, confounders, and mediators that seek to estimate the overall indirect effect (IE) for each exposure. In this paper, we propose MedDiC, a novel procedure to estimate the overall IE based on difference-in-coefficients approach. Our simulation studies find that MedDiC offers valid inference for the IE with higher power, shorter confidence intervals, and faster computing time than competing methods. We apply MedDiC to the 2 aforementioned motivating datasets and find that MedDiC yields reproducible outputs across the analysis of closely related traits, with results supported by external biological evidence. The code and additional information are available on our GitHub page (https://github.com/QiZhangStat/MedDiC).