WZ
Wei Zhang
Author with expertise in Regulation of RNA Processing and Function
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
16
(75% Open Access)
Cited by:
2,227
h-index:
37
/
i10-index:
107
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Probabilistic Boolean networks: a rule-based uncertainty model for gene regulatory networks

Ilya Shmulevich et al.Feb 1, 2002
Abstract Motivation: Our goal is to construct a model for genetic regulatory networks such that the model class: (i) incorporates rule-based dependencies between genes; (ii) allows the systematic study of global network dynamics; (iii) is able to cope with uncertainty, both in the data and the model selection; and (iv) permits the quantification of the relative influence and sensitivity of genes in their interactions with other genes. Results: We introduce Probabilistic Boolean Networks (PBN) that share the appealing rule-based properties of Boolean networks, but are robust in the face of uncertainty. We show how the dynamics of these networks can be studied in the probabilistic context of Markov chains, with standard Boolean networks being special cases. Then, we discuss the relationship between PBNs and Bayesian networks—a family of graphical models that explicitly represent probabilistic relationships between variables. We show how probabilistic dependencies between a gene and its parent genes, constituting the basic building blocks of Bayesian networks, can be obtained from PBNs. Finally, we present methods for quantifying the influence of genes on other genes, within the context of PBNs. Examples illustrating the above concepts are presented throughout the paper. Contact: is@ieee.org
0
Citation1,553
0
Save
0

From Boolean to probabilistic Boolean networks as models of genetic regulatory networks

Ilya Shmulevich et al.Nov 1, 2002
Mathematical and computational modeling of genetic regulatory networks promises to uncover the fundamental principles governing biological systems in an integrative and holistic manner. It also paves the way toward the development of systematic approaches for effective therapeutic intervention in disease. The central theme in this paper is the Boolean formalism as a building block for modeling complex, large-scale, and dynamical networks of genetic interactions. We discuss the goals of modeling genetic networks as well as the data requirements. The Boolean formalism is justified from several points of view. We then introduce Boolean networks and discuss their relationships to nonlinear digital filters. The role of Boolean networks in understanding cell differentiation and cellular functional states is discussed. The inference of Boolean networks from real gene expression data is considered from the viewpoints of computational learning theory and nonlinear signal processing, touching on computational complexity of learning and robustness. Then, a discussion of the need to handle uncertainty in a probabilistic framework is presented, leading to an introduction of probabilistic Boolean networks and their relationships to Markov chains. Methods for quantifying the influence of genes on other genes are presented. The general question of the potential effect of individual genes on the global dynamical network behavior is considered using stochastic perturbation analysis. This discussion then leads into the problem of target identification for therapeutic intervention via the development of several computational tools based on first-passage times in Markov chains. Examples from biology are presented throughout the paper.
4

TP53mutations, tetraploidy and homologous recombination repair defects in early stage high-grade serous ovarian cancer

Jeremy Chien et al.Apr 27, 2015
To determine early somatic changes in high-grade serous ovarian cancer (HGSOC), we performed whole genome sequencing on a rare collection of 16 low stage HGSOCs. The majority showed extensive structural alterations (one had an ultramutated profile), exhibited high levels of p53 immunoreactivity, and harboured a TP53 mutation, deletion or inactivation. BRCA1 and BRCA2 mutations were observed in two tumors, with nine showing evidence of a homologous recombination (HR) defect. Combined Analysis with The Cancer Genome Atlas (TCGA) indicated that low and late stage HGSOCs have similar mutation and copy number profiles. We also found evidence that deleterious TP53 mutations are the earliest events, followed by deletions or loss of heterozygosity (LOH) of chromosomes carrying TP53, BRCA1 or BRCA2. Inactivation of HR appears to be an early event, as 62.5% of tumours showed a LOH pattern suggestive of HR defects. Three tumours with the highest ploidy had little genome-wide LOH, yet one of these had a homozygous somatic frame-shift BRCA2 mutation, suggesting that some carcinomas begin as tetraploid then descend into diploidy accompanied by genome-wide LOH. Lastly, we found evidence that structural variants (SV) cluster in HGSOC, but are absent in one ultramutated tumor, providing insights into the pathogenesis of low stage HGSOC.
4
Citation46
0
Save
13

An Autoantigen-ome from HS-Sultan B-Lymphoblasts Offers a Molecular Map for Investigating Autoimmune Sequelae of COVID-19

Julia Wang et al.Apr 6, 2021
Abstract To understand how COVID-19 may induce autoimmune diseases, we have been compiling an atlas of COVID-autoantigens (autoAgs). Using dermatan sulfate (DS) affinity enrichment of autoantigenic proteins extracted from HS-Sultan lymphoblasts, we identified 362 DS-affinity proteins, of which at least 201 (56%) are confirmed autoAgs. Comparison with available multi-omic COVID data shows that 315 (87%) of the 362 proteins are affected in SARS-CoV-2 infection via altered expression, interaction with viral components, or modification by phosphorylation or ubiquitination, at least 186 (59%) of which are known autoAgs. These proteins are associated with gene expression, mRNA processing, mRNA splicing, translation, protein folding, vesicles, and chromosome organization. Numerous nuclear autoAgs were identified, including both classical ANAs and ENAs of systemic autoimmune diseases and unique autoAgs involved in the DNA replication fork, mitotic cell cycle, or telomerase maintenance. We also identified many uncommon autoAgs involved in nucleic acid and peptide biosynthesis and nucleocytoplasmic transport, such as aminoacyl-tRNA synthetases. In addition, this study found autoAgs that potentially interact with multiple SARS-CoV-2 Nsp and Orf components, including CCT/TriC chaperonin, insulin degrading enzyme, platelet-activating factor acetylhydrolase, and the ezrin-moesin-radixin family. Furthermore, B-cell-specific IgM-associated ER complex (including MBZ1, BiP, heat shock proteins, and protein disulfide-isomerases) is enriched by DS-affinity and up-regulated in B-cells of COVID-19 patients, and a similar IgH-associated ER complex was also identified in autoreactive pre-B1 cells in our previous study, which suggests a role of autoreactive B1 cells in COVID-19 that merits further investigation. In summary, this study demonstrates that virally infected cells are characterized by alterations of proteins with propensity to become autoAgs, thereby providing a possible explanation for infection-induced autoimmunity. The COVID autoantigen-ome provides a valuable molecular resource and map for investigation of COVID-related autoimmune sequelae and considerations for vaccine design.
13
Citation15
0
Save
0

APA-Scan: Detection and Visualization of 3’-UTR Alternative Polyadenylation with RNA-seq and 3’-end-seq Data

Naima Fahmi et al.Feb 17, 2020
Abstract Background The eukaryotic genome is capable of producing multiple isoforms from a gene by alternative polyadenylation (APA) during pre-mRNA processing. APA in the 3’-untranslated region (3’-UTR) of mRNA produces transcripts with shorter or longer 3’-UTR. Often, 3’-UTR serves as a binding platform for microRNAs and RNA-binding proteins, which affect the fate of the mRNA transcript. Thus, 3’-UTR APA is known to modulate translation and provides a mean to regulate gene expression at the post-transcriptional level. Current bioinformatics pipelines have limited capability in profiling 3’-UTR APA events due to incomplete annotations and a low-resolution analyzing power: widely available bioinformatics pipelines do not reference actionable polyadenylation (cleavage) sites but simulate 3’-UTR APA only using RNA-seq read coverage, causing false positive identifications. To overcome these limitations, we developed APA-Scan, a robust program that identifies 3’-UTR APA events and visualizes the RNA-seq short-read coverage with gene annotations. Methods APA-Scan utilizes either predicted or experimentally validated actionable polyadenylation signals as a reference for polyadenylation sites and calculates the quantity of long and short 3’-UTR transcripts in the RNA-seq data. APA-Scan works in three major steps: (i) calculate the read coverage of the 3’-UTR regions of genes; (ii) identify the potential APA sites and evaluate the significance of the events among two biological conditions; (iii) graphical representation of user specific event with 3’-UTR annotation and read coverage on the 3’-UTR regions. APA-Scan is implemented in Python3. Source code and a comprehensive user’s manual are freely available at https://github.com/compbiolabucf/APA-Scan . Result APA-Scan was applied to both simulated and real RNA-seq datasets and compared with two widely used baselines DaPars and APAtrap. In simulation APA-Scan significantly improved the accuracy of 3’-UTR APA identification compared to the other baselines. The performance of APA-Scan was also validated by 3’-end-seq data and qPCR on mouse embryonic fibroblast cells. The experiments confirm that APA-Scan can detect unannotated 3’ -UTR APA events and improve genome annotation. Conclusion APA-Scan is a comprehensive computational pipeline to detect transcriptome-wide 3’-UTR APA events. The pipeline integrates both RNA-seq and 3’-end-seq data information and can efficiently identify the significant events with a high-resolution short reads coverage plots.
0
Citation6
0
Save
4

omicsGAT: Graph Attention Network for Cancer Subtype Analyses

Sudipto Baul et al.Jun 12, 2022
Motivation The use of high-throughput omics technologies is becoming increasingly popular in all facets of biomedical science. The mRNA sequencing (RNA-seq) method reports quantitative measures of more than tens of thousands of biological features. It provides a more comprehensive molecular perspective of studied cancer mechanisms compared to traditional approaches. Graph-based learning models have been proposed to learn important hidden representations from gene expression data and network structure to improve cancer outcome prediction, patient stratification, and cell clustering. However, these graph-based methods cannot rank the importance of the different neighbors for a particular sample in the downstream cancer subtype analyses. In this study, we introduce omicsGAT, a graph attention network (GAT) model to integrate graph-based learning with an attention mechanism for RNA-seq data analysis. The multi-head attention mechanism in omicsGAT can more effectively secure information of a particular sample by assigning different attention coefficients to its neighbors. Results Comprehensive experiments on The Cancer Genome Atlas (TCGA) breast cancer and bladder cancer bulk RNA-seq data, and primary diffuse gliomas single-cell RNA-seq data validate that (1) the proposed model can effectively integrate neighborhood information of a sample and learn an embedding vector to improve disease phenotype prediction, cancer patient stratification, and cell clustering of the sample. (2) The attention matrix generated from the multi-head attention coefficients provides more useful information compared to the sample correlation-based adjacency matrix. From the results, we can conclude that some neighbors play a more important role than others in cancer subtype analyses of a particular sample based on the attention coefficient. Availability and implementation Source code is available at: https://github.com/CompbioLabUCF/omicsGAT Supplementary information Supplementary data are available at BioRxiv online.
8

Multi-omics Data Integration by Generative Adversarial Network

Khandakar Ahmed et al.Mar 16, 2021
Accurate disease phenotype prediction plays an important role in the treatment of heterogeneous diseases like cancer in the era of precision medicine. With the advent of high throughput technologies, more comprehensive multi-omics data is now available that can effectively link the genotype to phenotype. However, the interactive relation of multi-omics datasets makes it particularly challenging to incorporate different biological layers to discover the coherent biological signatures and predict phenotypic outcomes. In this study, we introduce omicsGAN, a generative adversarial network (GAN) model to integrate two omics data and their interaction network. The model captures information from the interaction network as well as the two omics datasets and fuse them to generate synthetic data with better predictive signals. Large-scale experiments on The Cancer Genome Atlas (TCGA) breast cancer, lung cancer, and ovarian cancer datasets validate that (1) the model can effectively integrate two omics data (e.g., mRNA and microRNA expression data) and their interaction network (e.g., microRNA-mRNA interaction network). The synthetic omics data generated by the proposed model has a better performance on cancer outcome classification and patients survival prediction compared to original omics datasets. (2) The integrity of the interaction network plays a vital role in the generation of synthetic data with higher predictive quality. Using a random interaction network does not allow the framework to learn meaningful information from the omics datasets; therefore, results in synthetic data with weaker predictive signals.
8
Citation1
0
Save
9

Genome sequencing sheds light on the contribution of structural variants to Brassica oleracea diversification

Ning Guo et al.Oct 15, 2020
Abstract Brassica oleracea includes several morphologically diverse, economically important vegetable crops. Here we present high-quality chromosome-scale genome assemblies for two B. oleracea morphotypes, cauliflower and cabbage. Direct comparison of these two assemblies identifies ~120 K high-confidence structural variants (SVs). Population analysis of 271 B. oleracea accessions using these SVs clearly separates different morphotypes, suggesting the association of SVs with B. oleracea intraspecific divergence. Genes affected by SVs selected between cauliflower and cabbage are enriched with functions related to response to stress and stimulus and meristem and flower development. Furthermore, genes affected by selected SVs and involved in the switch from vegetative to generative growth that defines curd initiation, inflorescence meristem proliferation for curd formation, maintenance and enlargement, are identified, providing insights into the regulatory network of curd development. This study reveals the important roles of SVs in diversification of different morphotypes of B. oleracea , and the newly assembled genomes and the SVs provide rich resources for future research and breeding.
9
Citation1
0
Save
0

mTOR-driven widespread exon skipping renders multifaceted gene regulation and proteome complexity

Shuenn‐Ren Cheng et al.Feb 27, 2020
Mammalian target of rapamycin (mTOR) pathway is crucial in cell proliferation. Many have associated its dysregulation with numerous human pathogenic processes. Previously, we reported 3-untranslated region (UTR) length dynamics by alternative polyadenylation in the mTOR-activated transcriptome and its impact on the proteome. Here, we further explored the mTOR-activated transcriptome with regard to alternative splicing (AS) events and their functional relevance. We employed cellular models with genetic or pharmacological manipulation of mTOR activity and investigated the changes of transcriptome profile using RNA-Seq experiments and a custom-developed AS-Quant pipeline. Strikingly, we found that hyperactivation of mTOR in cells promotes transcriptome-wide exon skipping/exclusion. These AS events multifariously regulate the proteome: exon-skipping in the coding regions widely affects functional domains in the proteome; exon-skipping in the 5-UTR can control translation efficiency. Moreover, a number of these exon-skipping events affects potential ubiquitination and phosphorylation sites and produces protein isoforms with varying stabilities. Furthermore, some of these exon-skipping events can switch transcripts from being coding to non-coding or vice versa, suggesting AS as a built-in post-transcriptional molecular switch for gene expression and/or functional regulation. Notably, we found that mTOR-activated widespread exon skipping is in part facilitated by splicing factor Srsf3. Our study reveals previously unappreciated mTOR-coordinated post-transcriptional pathways that regulate cellular proteome. These findings also highlight multifaceted mechanisms of AS in controlling functional proteome.
Load More