AM
Avi Ma’ayan
Author with expertise in Analysis of Gene Interaction Networks
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
49
(76% Open Access)
Cited by:
34,441
h-index:
79
/
i10-index:
189
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Enrichr: interactive and collaborative HTML5 gene list enrichment analysis tool

Edward Chen et al.Apr 15, 2013
Abstract Background System-wide profiling of genes and proteins in mammalian cells produce lists of differentially expressed genes/proteins that need to be further analyzed for their collective functions in order to extract new knowledge. Once unbiased lists of genes or proteins are generated from such experiments, these lists are used as input for computing enrichment with existing lists created from prior knowledge organized into gene-set libraries. While many enrichment analysis tools and gene-set libraries databases have been developed, there is still room for improvement. Results Here, we present Enrichr, an integrative web-based and mobile software application that includes new gene-set libraries, an alternative approach to rank enriched terms, and various interactive visualization approaches to display enrichment results using the JavaScript library, Data Driven Documents (D3). The software can also be embedded into any tool that performs gene list analysis. We applied Enrichr to analyze nine cancer cell lines by comparing their enrichment signatures to the enrichment signatures of matched normal tissues. We observed a common pattern of up regulation of the polycomb group PRC2 and enrichment for the histone mark H3K27me3 in many cancer cell lines, as well as alterations in Toll-like receptor and interlukin signaling in K562 cells when compared with normal myeloid CD33+ cells. Such analyses provide global visualization of critical differences between normal tissues and cancer cell lines but can be applied to many other scenarios. Conclusions Enrichr is an easy to use intuitive enrichment analysis web-based tool providing various types of visualization summaries of collective functions of gene lists. Enrichr is open source and freely available online at: http://amp.pharm.mssm.edu/Enrichr .
0

Mesenchymal and haematopoietic stem cells form a unique bone marrow niche

Simón Méndez-Ferrer et al.Aug 1, 2010
The cellular constituents forming the haematopoietic stem cell (HSC) niche in the bone marrow are unclear, with studies implicating osteoblasts, endothelial and perivascular cells. Here we demonstrate that mesenchymal stem cells (MSCs), identified using nestin expression, constitute an essential HSC niche component. Nestin+ MSCs contain all the bone-marrow colony-forming-unit fibroblastic activity and can be propagated as non-adherent ‘mesenspheres’ that can self-renew and expand in serial transplantations. Nestin+ MSCs are spatially associated with HSCs and adrenergic nerve fibres, and highly express HSC maintenance genes. These genes, and others triggering osteoblastic differentiation, are selectively downregulated during enforced HSC mobilization or β3 adrenoreceptor activation. Whereas parathormone administration doubles the number of bone marrow nestin+ cells and favours their osteoblastic differentiation, in vivo nestin+ cell depletion rapidly reduces HSC content in the bone marrow. Purified HSCs home near nestin+ MSCs in the bone marrow of lethally irradiated mice, whereas in vivo nestin+ cell depletion significantly reduces bone marrow homing of haematopoietic progenitors. These results uncover an unprecedented partnership between two distinct somatic stem-cell types and are indicative of a unique niche in the bone marrow made of heterotypic stem-cell pairs. The identity of the cells that form the haematopoietic stem-cell niche in the bone marrow has been unclear. Paul Frenette and colleagues have now identified nestin-expressing mesenchymal stem cells as niche-forming cells. These cells show a close physical association with haematopoietic stem cells, express high levels of genes involved in stem-cell maintenance, and their depletion reduces bone-marrow homing of haematopoietic progenitors. This work reveals the stem-cell niche in the bone marrow as a partnership between two distinct somatic stem-cell types. The identity of the cells that form the haematopoietic stem cell (HSC) niche in bone marrow has been unclear. These authors identify nestin-expressing mesenchymal stem cells as niche-forming cells. These nestin-expressing cells show a close physical association with HSCs and express high levels of genes involved in HSC maintenance, and their depletion reduces bone marrow homing of haematopoietic progenitors.
0
Citation3,139
0
Save
0

Synaptic, transcriptional and chromatin genes disrupted in autism

Silvia Rubeis et al.Oct 29, 2014
The genetic architecture of autism spectrum disorder involves the interplay of common and rare variants and their impact on hundreds of genes. Using exome sequencing, here we show that analysis of rare coding variation in 3,871 autism cases and 9,937 ancestry-matched or parental controls implicates 22 autosomal genes at a false discovery rate (FDR) < 0.05, plus a set of 107 autosomal genes strongly enriched for those likely to affect risk (FDR < 0.30). These 107 genes, which show unusual evolutionary constraint against mutations, incur de novo loss-of-function mutations in over 5% of autistic subjects. Many of the genes implicated encode proteins for synaptic formation, transcriptional regulation and chromatin-remodelling pathways. These include voltage-gated ion channels regulating the propagation of action potentials, pacemaking and excitability–transcription coupling, as well as histone-modifying enzymes and chromatin remodellers—most prominently those that mediate post-translational lysine methylation/demethylation modifications of histones. Whole-exome sequencing in a large autism study identifies over 100 autosomal genes that are likely to affect risk for the disorder; these genes, which show unusual evolutionary constraint against mutations, carry de novo loss-of-function mutations in over 5% of autistic subjects and many function in synaptic, transcriptional and chromatin-remodelling pathways. Autism spectrum disorder (ASD) is a broad group of brain development disorders, including autism, childhood disintegrative disorder and Asperger's syndrome, characterized by impaired social interaction and communication, repetitive behaviour and restricted interests. Two groups reporting in this issue of Nature have used large-scale whole-exome sequencing to examine the contribution of inherited and germline de novo mutations to ASD risk. Silvia De Rubeis et al. analysed DNA samples from 3,871 autism cases and 9,937 ancestry-matched or parental controls and identify more than 100 autosomal genes that are likely to affect risk for the disease. De novo loss-of-function mutations were detected in more than 5% of autistic subjects. Many of the associated gene products appear to function in synaptic, transcriptional, and chromatin remodelling pathways. Ivan Iossifov et al. sequenced exomes from more than 2,500 families, each with one child with ASD. They identify 27 high-confidence gene targets and estimate that 13% of de novo missense mutations and 43% of de novo 'likely gene-disrupting' (LGD) mutations contribute to 12% and 9% of diagnoses, respectively.
0
Citation2,476
0
Save
0

Gene Set Knowledge Discovery with Enrichr

Zhuorui Xie et al.Mar 1, 2021
Profiling samples from patients, tissues, and cells with genomics, transcriptomics, epigenomics, proteomics, and metabolomics ultimately produces lists of genes and proteins that need to be further analyzed and integrated in the context of known biology. Enrichr (Chen et al., 2013; Kuleshov et al., 2016) is a gene set search engine that enables the querying of hundreds of thousands of annotated gene sets. Enrichr uniquely integrates knowledge from many high-profile projects to provide synthesized information about mammalian genes and gene sets. The platform provides various methods to compute gene set enrichment, and the results are visualized in several interactive ways. This protocol provides a summary of the key features of Enrichr, which include using Enrichr programmatically and embedding an Enrichr button on any website. © 2021 Wiley Periodicals LLC. Basic Protocol 1: Analyzing lists of differentially expressed genes from transcriptomics, proteomics and phosphoproteomics, GWAS studies, or other experimental studies Basic Protocol 2: Searching Enrichr by a single gene or key search term Basic Protocol 3: Preparing raw or processed RNA-seq data through BioJupies in preparation for Enrichr analysis Basic Protocol 4: Analyzing gene sets for model organisms using modEnrichr Basic Protocol 5: Using Enrichr in Geneshot Basic Protocol 6: Using Enrichr in ARCHS4 Basic Protocol 7: Using the enrichment analysis visualization Appyter to visualize Enrichr results Basic Protocol 8: Using the Enrichr API Basic Protocol 9: Adding an Enrichr button to a website.
0
Citation2,015
0
Save
0

Patterns and rates of exonic de novo mutations in autism spectrum disorders

Benjamin Neale et al.Apr 3, 2012
Exome sequencing of 175 autism spectrum disorder parent–child trios reveals that few de novo point mutations have a role in autism spectrum disorder and those that do are distributed across many genes and are incompletely penetrant, further supporting extreme genetic heterogeneity of this spectrum disorder. Although it is well accepted that genetics makes a strong contribution to autism spectrum disorder, most of the underlying causes of the condition remain unknown. Three groups present large-scale exome-sequencing studies of individuals with sporadic autism spectrum disorder, including many parent–child trios and unaffected siblings. The overall message from the three papers is that there is extreme locus heterogeneity among autistic individuals, with hundreds of genes involved in the condition, and with no single gene contributing to more than a small fraction of cases. Sanders et al. report the association of the gene SCN2A, previously identified in epilepsy syndromes, with the risk of autism. Neale et al. find strong evidence that CHD8 and KATNAL2 are autism risk factors. O'Roak et al. observe that a large proportion of the mutated proteins have crucial roles in fundamental developmental pathways, including β-catenin and p53 signalling. Autism spectrum disorders (ASD) are believed to have genetic and environmental origins, yet in only a modest fraction of individuals can specific causes be identified1,2. To identify further genetic risk factors, here we assess the role of de novo mutations in ASD by sequencing the exomes of ASD cases and their parents (n = 175 trios). Fewer than half of the cases (46.3%) carry a missense or nonsense de novo variant, and the overall rate of mutation is only modestly higher than the expected rate. In contrast, the proteins encoded by genes that harboured de novo missense or nonsense mutations showed a higher degree of connectivity among themselves and to previous ASD genes3 as indexed by protein-protein interaction screens. The small increase in the rate of de novo events, when taken together with the protein interaction results, are consistent with an important but limited role for de novo point mutations in ASD, similar to that documented for de novo copy number variants. Genetic models incorporating these data indicate that most of the observed de novo events are unconnected to ASD; those that do confer risk are distributed across many genes and are incompletely penetrant (that is, not necessarily sufficient for disease). Our results support polygenic models in which spontaneous coding mutations in any of a large number of genes increases risk by 5- to 20-fold. Despite the challenge posed by such models, results from de novo events and a large parallel case–control study provide strong evidence in favour of CHD8 and KATNAL2 as genuine autism risk factors.
0
Citation1,708
0
Save
0

The harmonizome: a collection of processed datasets gathered to serve and mine knowledge about genes and proteins

Andrew Rouillard et al.Jan 1, 2016
Genomics, epigenomics, transcriptomics, proteomics and metabolomics efforts rapidly generate a plethora of data on the activity and levels of biomolecules within mammalian cells. At the same time, curation projects that organize knowledge from the biomedical literature into online databases are expanding. Hence, there is a wealth of information about genes, proteins and their associations, with an urgent need for data integration to achieve better knowledge extraction and data reuse. For this purpose, we developed the Harmonizome: a collection of processed datasets gathered to serve and mine knowledge about genes and proteins from over 70 major online resources. We extracted, abstracted and organized data into ∼72 million functional associations between genes/proteins and their attributes. Such attributes could be physical relationships with other biomolecules, expression in cell lines and tissues, genetic associations with knockout mouse or human phenotypes, or changes in expression after drug treatment. We stored these associations in a relational database along with rich metadata for the genes/proteins, their attributes and the original resources. The freely available Harmonizome web portal provides a graphical user interface, a web service and a mobile app for querying, browsing and downloading all of the collected data. To demonstrate the utility of the Harmonizome, we computed and visualized gene–gene and attribute–attribute similarity networks, and through unsupervised clustering, identified many unexpected relationships by combining pairs of datasets such as the association between kinase perturbations and disease signatures. We also applied supervised machine learning methods to predict novel substrates for kinases, endogenous ligands for G-protein coupled receptors, mouse phenotypes for knockout genes, and classified unannotated transmembrane proteins for likelihood of being ion channels. The Harmonizome is a comprehensive resource of knowledge about genes and proteins, and as such, it enables researchers to discover novel relationships between biological entities, as well as form novel data-driven hypotheses for experimental validation.
0

ChEA: transcription factor regulation inferred from integrating genome-wide ChIP-X experiments

Alexander Lachmann et al.Aug 13, 2010
Abstract Motivation: Experiments such as ChIP-chip, ChIP-seq, ChIP-PET and DamID (the four methods referred herein as ChIP-X) are used to profile the binding of transcription factors to DNA at a genome-wide scale. Such experiments provide hundreds to thousands of potential binding sites for a given transcription factor in proximity to gene coding regions. Results: In order to integrate data from such studies and utilize it for further biological discovery, we collected interactions from such experiments to construct a mammalian ChIP-X database. The database contains 189 933 interactions, manually extracted from 87 publications, describing the binding of 92 transcription factors to 31 932 target genes. We used the database to analyze mRNA expression data where we perform gene-list enrichment analysis using the ChIP-X database as the prior biological knowledge gene-list library. The system is delivered as a web-based interactive application called ChIP Enrichment Analysis (ChEA). With ChEA, users can input lists of mammalian gene symbols for which the program computes over-representation of transcription factor targets from the ChIP-X database. The ChEA database allowed us to reconstruct an initial network of transcription factors connected based on shared overlapping targets and binding site proximity. To demonstrate the utility of ChEA we present three case studies. We show how by combining the Connectivity Map (CMAP) with ChEA, we can rank pairs of compounds to be used to target specific transcription factor activity in cancer cells. Availability: The ChEA software and ChIP-X database is freely available online at: http://amp.pharm.mssm.edu/lib/chea.jsp Contact: avi.maayan@mssm.edu Supplementary information: Supplementary data are available at Bioinformatics online.
0
Citation899
0
Save
Load More