A new version of ResearchHub is available.Try it now
Healthy Research Rewards
ResearchHub is incentivizing healthy research behavior. At this time, first authors of open access papers are eligible for rewards. Visit the publications tab to view your eligible publications.
Got it
XW
Xutong Wang
Author with expertise in Genetic Architecture of Quantitative Traits
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
6
(67% Open Access)
Cited by:
227
h-index:
25
/
i10-index:
48
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
6

SoyDNGP: A Web-Accessible Deep Learning Framework for Genomic Prediction in Soybean Breeding

Pengfei Gao et al.Jun 15, 2023
Abstract Soybean is a globally significant crop, playing a vital role in human nutrition and agriculture. Its complex genetic structure and wide trait variation, however, pose challenges for breeders and researchers aiming to optimize its yield and quality. Addressing this biological complexity requires innovative and accurate tools for trait prediction. In response to this challenge, we have developed SoyDNGP, a Convolutional Neural Networks (CNN)-based model that offers significant advancements in the field of soybean trait prediction. Compared to existing methods, such as DeepGS and DNNGP, SoyDNGP boasts a distinct advantage due to its lower parameter volume and superior predictive accuracy. Through rigorous performance comparison, including prediction accuracy and model complexity, SoyDNGP consistently outperformed its counterparts. Furthermore, it effectively predicted complex traits with remarkable precision, demonstrating robust performance across different sample sizes and trait complexities. We also tested the versatility of SoyDNGP across multiple crop species, including Cotton, Maize, Rice, and Tomato. Our results showed its consistent and comparable performance, emphasizing SoyDNGP’s potential as a versatile tool for genomic prediction across a broad range of crops. To enhance its accessibility to users without extensive programming experience, we have designed a user-friendly web server, available at http://xtlab.hzau.edu.cn/SoyDNGP . The server provides two primary features: â€˜Trait Lookup’, offering users the ability to access pre-existing trait predictions for over 500 soybean accessions, and â€˜Trait Prediction’, allowing for the upload of VCF files for trait estimation. By providing a high-performing, accessible tool for trait prediction and genomic analysis, SoyDNGP opens up new possibilities in the quest for efficient and optimized soybean breeding.
6
Citation1
0
Save
3

Integration of eQTL and Machine Learning Methods to Dissect Causal Genes with Pleiotropic effects in Genetic Regulation Networks of Seed Cotton Yield

Ting Zhao et al.Jun 24, 2023
Abstract Expression quantitative trait loci (eQTL) provide a powerful means of investigating the biological basis of genome-wide association study (GWAS) results and exploring complex traits or phenotypes. In addition to identifying the causal gene in cis , eQTL analysis also reveals a large number of trans-regulated genes located on different chromosomes, which form a gene regulatory network (GRN) that complements the GWAS locus. However, the dissection of a GRN and the crosstalk underlying multiple agronomical traits, along with prioritizing important genes in eQTL-derived GRNs, remains a major challenge. In this study, we generated 558 transcriptional profiles of lint-bearing ovules at one day post-anthesis (DPA) from a selective core cotton germplasm, from which we identified 12,207 eQTLs. By integrating with a GWAS catalog, we found that 66 out of 187 (35.29%) known phenotypic GWAS loci are colocalized with 1,090 eQTLs, forming 38 major functional GRNs predominantly (30 out of 38) associated with seed size-related phenotypes. Of the eGenes, 34 were shared between at least two functional GRNs, exhibiting pleiotropic effects, such as NF-YB3 , GRDP1 , and IDD7 . Narrow-sense heritability analysis showed that the heritability increased with combining the eQTLs with GRNs compared to those with previous yield trait GWAS loci. The extreme gradient boosting (XGBoost) machine learning approach was then applied to predict seed cotton yield phenotypes based on gene expression. Top-ranking eGenes ( NF-YB3 , FLA2 , and GRDP1 ) derived by XGBoost with pleiotropic effects on yield traits were validated, along with their potential roles by correlation analysis, domestication selection analysis, and transgenic plants. This study provides insights into the mining of GRNs in relation to the pleiotropy of phenotype. The combination of eQTL and machine learning approaches is efficient in improving the genetic dissection of agricultural traits.
3
Citation1
0
Save
0

Widespread transcription initiation within coding sequences marks tissue identity and accessible chromatin

Xutong Wang et al.Mar 29, 2024
Abstract Alternative transcription initiation (ATI) appears to be a ubiquitous regulatory mechanism of gene expression in eukaryotes, but the extent to which it affects the products of gene expression, and how it evolves and is regulated remain unknown. We first identified transcription start sites (TSSs) in eight soybean tissues using recently developed STRIPE-seq and then analyzed ATI in the context of tissue identity and chromatin architecture. We defined 193,579 TSS clusters/regions (TSRs) in 37,911 annotated genes, with 56.5% located in putative regulatory regions upstream of start codons and 43.5% from start codons to 3’ untranslated regions, which, together, are responsible for changes in open reading frames of 24,131 genes. Overall, duplicated genes possess more TSRs, exhibited lower degrees of tissue-specificity, and have undergone stronger purifying selection than singletons. Strikingly, 6,845 genes possess ATI within coding sequences (CDSs). These CDS-TSRs are highly tissue-specific, shorter than those located in canonical regulatory regions, and do not have TATA-boxes typical for the core promoters. Furthermore, the CDS-TSRs are embedded in nucleosome-free regions and flanked by nucleosomes with enhanced levels of active histone marks associated with transcriptionally active chromatin, suggesting that non-canonical ATI is epigenetically regulated and largely responsible for tissue-specific functions and tissue identity. Our study highlights the genomic and epigenomic factors shaping the distribution patterns and tissue-specificity of ATI in regulatory and coding sequences, as well as the significance of ATI in the alternation of proteins encoded by tissue-specifically expressed genes in the context of genome duplication and fractionation.