TL
Tzong-Yi Lee
Author with expertise in Molecular Mechanisms of Plant Development and Regulation
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
9
(78% Open Access)
Cited by:
1,507
h-index:
42
/
i10-index:
91
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

PlantPAN3.0: a new and updated resource for reconstructing transcriptional regulatory networks from ChIP-seq experiments in plants

Chi-Nga Chow et al.Oct 22, 2018
The Plant Promoter Analysis Navigator (PlantPAN; http://PlantPAN.itps.ncku.edu.tw/) is an effective resource for predicting regulatory elements and reconstructing transcriptional regulatory networks for plant genes. In this release (PlantPAN 3.0), 17 230 TFs were collected from 78 plant species. To explore regulatory landscapes, genomic locations of TFBSs have been captured from 662 public ChIP-seq samples using standard data processing. A total of 1 233 999 regulatory linkages were identified from 99 regulatory factors (TFs, histones and other DNA-binding proteins) and their target genes across seven species. Additionally, this new version added 2449 matrices extracted from ChIP-seq peaks for cis-regulatory element prediction. In addition to integrated ChIP-seq data, four major improvements were provided for more comprehensive information of TF binding events, including (i) 1107 experimentally verified TF matrices from the literature, (ii) gene regulation network comparison between two species, (iii) 3D structures of TFs and TF-DNA complexes and (iv) condition-specific co-expression networks of TFs and their target genes extended to four species. The PlantPAN 3.0 can not only be efficiently used to investigate critical cis- and trans-regulatory elements in plant promoters, but also to reconstruct high-confidence relationships among TF–targets under specific conditions.
0
Citation364
0
Save
0

KinasePhos 2.0: a web server for identifying protein kinase-specific phosphorylation sites based on sequences and coupling patterns

Yung-Hao Wong et al.May 22, 2007
Due to the importance of protein phosphorylation in cellular control, many researches are undertaken to predict the kinase-specific phosphorylation sites. Referred to our previous work, KinasePhos 1.0, incorporated profile hidden Markov model (HMM) with flanking residues of the kinase-specific phosphorylation sites. Herein, a new web server, KinasePhos 2.0, incorporates support vector machines (SVM) with the protein sequence profile and protein coupling pattern, which is a novel feature used for identifying phosphorylation sites. The coupling pattern [XdZ] denotes the amino acid coupling-pattern of amino acid types X and Z that are separated by d amino acids. The differences or quotients of coupling strength CXdZ between the positive set of phosphorylation sites and the background set of whole protein sequences from Swiss-Prot are computed to determine the number of coupling patterns for training SVM models. After the evaluation based on k-fold cross-validation and Jackknife cross-validation, the average predictive accuracy of phosphorylated serine, threonine, tyrosine and histidine are 90, 93, 88 and 93%, respectively. KinasePhos 2.0 performs better than other tools previously developed. The proposed web server is freely available at http://KinasePhos2.mbc.nctu.edu.tw/.
0

PlantPAN 2.0: an update of plant promoter analysis navigator for reconstructing transcriptional regulatory networks in plants

Chi-Nga Chow et al.Oct 17, 2015
Transcription factors (TFs) are sequence-specific DNA-binding proteins acting as critical regulators of gene expression. The Plant Promoter Analysis Navigator (PlantPAN; http://PlantPAN2.itps.ncku.edu.tw) provides an informative resource for detecting transcription factor binding sites (TFBSs), corresponding TFs, and other important regulatory elements (CpG islands and tandem repeats) in a promoter or a set of plant promoters. Additionally, TFBSs, CpG islands, and tandem repeats in the conserve regions between similar gene promoters are also identified. The current PlantPAN release (version 2.0) contains 16 960 TFs and 1143 TF binding site matrices among 76 plant species. In addition to updating of the annotation information, adding experimentally verified TF matrices, and making improvements in the visualization of transcriptional regulatory networks, several new features and functions are incorporated. These features include: (i) comprehensive curation of TF information (response conditions, target genes, and sequence logos of binding motifs, etc.), (ii) co-expression profiles of TFs and their target genes under various conditions, (iii) protein-protein interactions among TFs and their co-factors, (iv) TF-target networks, and (v) downstream promoter elements. Furthermore, a dynamic transcriptional regulatory network under various conditions is provided in PlantPAN 2.0. The PlantPAN 2.0 is a systematic platform for plant promoter analysis and reconstructing transcriptional regulatory networks.
0
Citation324
0
Save
0

PlantPAN: Plant promoter analysis navigator, for identifying combinatorial cis-regulatory elements with distance constraint in plant gene groups

Wen Chang et al.Nov 26, 2008
Abstract Background The elucidation of transcriptional regulation in plant genes is important area of research for plant scientists, following the mapping of various plant genomes, such as A. thaliana , O. sativa and Z. mays . A variety of bioinformatic servers or databases of plant promoters have been established, although most have been focused only on annotating transcription factor binding sites in a single gene and have neglected some important regulatory elements (tandem repeats and CpG/CpNpG islands) in promoter regions. Additionally, the combinatorial interaction of transcription factors (TFs) is important in regulating the gene group that is associated with the same expression pattern. Therefore, a tool for detecting the co-regulation of transcription factors in a group of gene promoters is required. Results This study develops a database-assisted system, PlantPAN (Plant Promoter Analysis Navigator), for recognizing combinatorial cis -regulatory elements with a distance constraint in sets of plant genes. The system collects the plant transcription factor binding profiles from PLACE, TRANSFAC (public release 7.0), AGRIS, and JASPER databases and allows users to input a group of gene IDs or promoter sequences, enabling the co-occurrence of combinatorial transcription factor binding sites (TFBSs) within a defined distance (20 bp to 200 bp) to be identified. Furthermore, the new resource enables other regulatory features in a plant promoter, such as CpG/CpNpG islands and tandem repeats, to be displayed. The regulatory elements in the conserved regions of the promoters across homologous genes are detected and presented. Conclusion In addition to providing a user-friendly input/output interface, PlantPAN has numerous advantages in the analysis of a plant promoter. Several case studies have established the effectiveness of PlantPAN. This novel analytical resource is now freely available at http://PlantPAN.mbc.nctu.edu.tw .
0
Citation280
0
Save
0

dbPTM in 2019: exploring disease association and cross-talk of post-translational modifications

Kai‐Yao Huang et al.Oct 19, 2018
The dbPTM (http://dbPTM.mbc.nctu.edu.tw/) has been maintained for over 10 years with the aim to provide functional and structural analyses for post-translational modifications (PTMs). In this update, dbPTM not only integrates more experimentally validated PTMs from available databases and through manual curation of literature but also provides PTM-disease associations based on non-synonymous single nucleotide polymorphisms (nsSNPs). The high-throughput deep sequencing technology has led to a surge in the data generated through analysis of association between SNPs and diseases, both in terms of growth amount and scope. This update thus integrated disease-associated nsSNPs from dbSNP based on genome-wide association studies. The PTM substrate sites located at a specified distance in terms of the amino acids encoded from nsSNPs were deemed to have an association with the involved diseases. In recent years, increasing evidence for crosstalk between PTMs has been reported. Although mass spectrometry-based proteomics has substantially improved our knowledge about substrate site specificity of single PTMs, the fact that the crosstalk of combinatorial PTMs may act in concert with the regulation of protein function and activity is neglected. Because of the relatively limited information about concurrent frequency and functional relevance of PTM crosstalk, in this update, the PTM sites neighboring other PTM sites in a specified window length were subjected to motif discovery and functional enrichment analysis. This update highlights the current challenges in PTM crosstalk investigation and breaks the bottleneck of how proteomics may contribute to understanding PTM codes, revealing the next level of data complexity and proteomic limitation in prospective PTM research.
0
Citation195
0
Save
5

KinasePhos 3.0: Redesign and Expansion of the Prediction on Kinase-specific Phosphorylation Sites

Renfei Ma et al.Nov 4, 2021
The purpose of this work is to enhance KinasePhos, a machine-learning-based kinase-specific phosphorylation site prediction tool. Experimentally verified kinase-specific phosphorylation data were collected from PhosphoSitePlus, UniProt, GPS 5.0, and Phospho.ELM. In total, 41,421 experimentally verified kinase-specific phosphorylation sites were identified. A total of 1380 unique kinases were identified, including 753 with existing classification information from KinBase and the remaining 627 annotated by building a phylogenetic tree. Based on this kinase classification, a total of 771 predictive models were built at the individual, family, and group levels, using at least 15 experimentally verified substrate sites in positive training datasets. The improved models were observed to be more effective than other prediction tools. For example, the prediction of sites phosphorylated by the Akt, CKT, and PKA families had accuracies of 94.5%, 92.5%, and 90.0%, respectively. The average prediction accuracy for all 771 models was 87.2%. For enhancing interpretability, the Shapley additive explanations (SHAP) method was employed to assess feature importance. The web interface of KinasePhos 3.0 has been redesigned with the goal of providing comprehensive annotations of kinase-specific phosphorylation sites on multiple proteins. Additionally, considering the large scale of phosphoproteomic data, a downloadable prediction tool is available at https://awi.cuhk.edu.cn/KinasePhos/index.html or https://github.com/tom-209/KinasePhos-3.0-executable-file.
5
Citation2
0
Save
1

Clinically applicable rapid susceptibility testing of multi-drug resistant Staphylococcus aureus by mass spectrometry and extreme gradient boosting machine

Zhuo Wang et al.Oct 6, 2021
Abstract Multi-drug resistant Staphylococcus aureus is one of the major causes of severe infections. Due to the delays of conventional antibiotic susceptibility test (AST), most cases were prescribed by experience with a lower recovery rate. Linking a 7-year study of over 20,000 Staphylococcus aureus infected patients, we incorporated mass spectrometry and machine learning technology to predict the susceptibilities of patients for 4 different antibiotics that can enable early antibiotic decisions. The predictive models were externally validated in an independent patient cohort, resulting in an area under the receiver operating characteristic curve of 0.94, 0.90, 0.86, 0.91 and an area under the precision-recall curve of 0.93, 0.87, 0.87, 0.81 for oxacillin (OXA), clindamycin (CLI), erythromycin (ERY) and trimethoprim-sulfamethoxazole (SXT), respectively. Moreover, our pipeline provides AST 24–36 h faster than standard workflows, reduction of inappropriate antibiotic usage with preclinical prediction, and demonstrates the potential of combining mass spectrometry with machine learning (ML) to assist early and accurate prescription. Therapies to individual patients could be tailored in the process of precision medicine.
0

Rapidly predicting vancomycin resistance of Enterococcus faecium through MALDI-TOF MS spectra obtained in real-world clinical microbiology laboratory

Hsin-Yao Wang et al.Mar 15, 2020
Enterococcus faecium is one of the leading pathogens in the world. In this study, we proposed a strategy to rapidly and accurately distinguish vancomycin-resistant Enterococcus faecium (VREfm) and vancomycin-susceptible E. faecium (VSEfm) to help doctors correctly determine the use of vancomycin by a machine learning (ML)-based algorithm. A predictive model was developed and validated to distinguish VREfm and VSEfm by analyzing MALDI-TOF MS spectra of unique E. faecium isolates from different specimen types. Firstly, 5717 mass spectra, including 2795 VREfm and 2922 VSEfm, were used to develop the algorithm. And 2280 mass spectra of isolates, namely 1222 VREfm and 1058 VSEfm, were used to externally validate the algorithm. The random forest-based algorithm demonstrated good classification performances for overall specimens, whose mean AUROC in 5-fold cross validation, time-wise validation, and external validation was all greater than 0.84. For the detection of VREfm in blood, sterile body fluid, urinary tract, and wound, the AUROC in external validation was also greater than 0.84. The predictions with algorithms were significantly more accurate than empirical antibiotic use. The accuracy of antibiotics administration could be improved by 30%. And the algorithm could provide rapid antibiotic susceptibility results at least 24 hours ahead of routine laboratory tests. The turn-around-time of antibiotic susceptibility could be reduced by 50%. In conclusion, a ML algorithm using MALDI-TOF MS spectra obtained in routine workflow accurately differentiated VREfm from VSEfm, especially in blood and sterile body fluid, which can be applied to facilitate the clinical testing process due to its accuracy, generalizability, and rapidness.
0

Guided Diffusion for molecular generation with interaction prompt

Peng Wu et al.Jan 1, 2023
Structured based drug design is a critical strategy for modern drug development. Recently, molecular generative models have demonstrated their potential in designing molecules from scratch with high binding affinities in a pre-determined protein pocket. However, the generative processes are random in current generative models and the atomic interaction information between ligand and protein are ignored. Besides that, the binding mode of ligands in proteins is crucial for drug design and the ligand has high propensity to bind with residues called hotspots. Hot spot residues contribute to the majority of the binding free energy and have been recognized as appealing targets for designing molecules. To this end, we develop an interaction prompt guided diffusion model, InterDiff to deal with the above challenges. Four kinds of atomic interactions are involved in our model and represented as learnable vector embeddings. These embeddings serve as a condition for each residue to guide the molecular generative process. Comprehensive in silico experiments evince that our model could generate molecules with desired interactions. Furthermore, we validate InterDiff on two realistic protein-based therapeutic agents and experiments show that InterDiff could design molecules with similar binding mode with known targeted drugs.