NS
Nathan Salomonis
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
30
(80% Open Access)
Cited by:
2,856
h-index:
54
/
i10-index:
105
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Single-cell analysis of mixed-lineage states leading to a binary cell fate choice

André Olsson et al.Aug 30, 2016
Stem cells generate progenitors that transition through a series of dynamically unstable states with mixed-lineage gene expression, culminating in the specification of cell-fate. Single-cell analysis of gene expression during haematopoiesis has revealed the existence of intermediate cells en route to differentiation expressing mixed-lineage transcription factors, although the significance of such intermediates is still unclear. Andre Olsson et al. have developed a new analytical tool, termed iterative clustering and guide-gene selection (ICGS), to examine single-cell gene expression data. ICGS uses pairwise correlations of dynamically expressed genes to discover pattern-specific guide genes, then iteratively identifies subpopulations with coherent gene-expression patterns. By combining this analysis with a functional assessment of the subpopulations, they show that the simultaneous expression of transcription factors specific to multiple lineages is necessary to establish the gene regulatory networks leading to macrophage and neutrophil specification. Delineating hierarchical cellular states, including rare intermediates and the networks of regulatory genes that orchestrate cell-type specification, are continuing challenges for developmental biology. Single-cell RNA sequencing is greatly accelerating such research, given its power to provide comprehensive descriptions of genomic states and their presumptive regulators1,2,3,4,5. Haematopoietic multipotential progenitor cells, as well as bipotential intermediates, manifest mixed-lineage patterns of gene expression at a single-cell level6,7. Such mixed-lineage states may reflect the molecular priming of different developmental potentials by co-expressed alternative-lineage determinants, namely transcription factors. Although a bistable gene regulatory network has been proposed to regulate the specification of either neutrophils or macrophages7,8, the nature of the transition states manifested in vivo, and the underlying dynamics of the cell-fate determinants, have remained elusive. Here we use single-cell RNA sequencing coupled with a new analytic tool, iterative clustering and guide-gene selection, and clonogenic assays to delineate hierarchical genomic and regulatory states that culminate in neutrophil or macrophage specification in mice. We show that this analysis captured prevalent mixed-lineage intermediates that manifested concurrent expression of haematopoietic stem cell/progenitor and myeloid progenitor cell genes. It also revealed rare metastable intermediates that had collapsed the haematopoietic stem cell/progenitor gene expression programme, instead expressing low levels of the myeloid determinants, Irf8 and Gfi1 (refs 9, 10, 11, 12, 13). Genetic perturbations and chromatin immunoprecipitation followed by sequencing revealed Irf8 and Gfi1 as key components of counteracting myeloid-gene-regulatory networks. Combined loss of these two determinants ‘trapped’ the metastable intermediate. We propose that mixed-lineage states are obligatory during cell-fate specification, manifest differing frequencies because of their dynamic instability and are dictated by counteracting gene-regulatory networks.
0
Citation474
0
Save
0

AltAnalyze and DomainGraph: analyzing and visualizing exon expression data

Dorothea Emig et al.May 29, 2010
Alternative splicing is an important mechanism for increasing protein diversity. However, its functional effects are largely unknown. Here, we present our new software workflow composed of the open-source application AltAnalyze and the Cytoscape plugin DomainGraph. Both programs provide an intuitive and comprehensive end-to-end solution for the analysis and visualization of alternative splicing data from Affymetrix Exon and Gene Arrays at the level of proteins, domains, microRNA binding sites, molecular interactions and pathways. Our software tools include easy-to-use graphical user interfaces, rigorous statistical methods (FIRMA, MiDAS and DABG filtering) and do not require prior knowledge of exon array analysis or programming. They provide new methods for automatic interpretation and visualization of the effects of alternative exon inclusion on protein domain composition and microRNA binding sites. These data can be visualized together with affected pathways and gene or protein interaction networks, allowing a straightforward identification of potential biological effects due to alternative splicing at different levels of granularity. Our programs are available at http://www.altanalyze.org and http://www.domaingraph.de. These websites also include extensive documentation, tutorials and sample data.
0
Citation299
0
Save
40

DeepImmuno: Deep learning-empowered prediction and generation of immunogenic peptides for T cell immunity

Guangyuan Li et al.Dec 24, 2020
ABSTRACT T-cells play an essential role in the adaptive immune system by seeking out, binding and destroying foreign antigens presented on the cell surface of diseased cells. An improved understanding of T-cell immunity will greatly aid in the development of new cancer immunotherapies and vaccines for life threatening pathogens. Central to the design of such targeted therapies are computational methods to predict non-native epitopes to elicit a T cell response, however, we currently lack accurate immunogenicity inference methods. Another challenge is the ability to accurately simulate immunogenic peptides for specific human leukocyte antigen (HLA) alleles, for both synthetic biological applications and to augment real training datasets. Here, we proposed a beta-binomial distribution approach to derive epitope immunogenic potential from sequence alone. We conducted systematic benchmarking of five traditional machine learning (ElasticNet, KNN, SVM, Random Forest, AdaBoost) and three deep learning models (CNN, ResNet, GNN) using three independent prior validated immunogenic peptide collections (dengue virus, cancer neoantigen and SARS-Cov-2). We chose the CNN model as the best prediction model based on its adaptivity for small and large datasets, and performance relative to existing methods. In addition to outperforming two highly used immunogenicity prediction algorithms, DeepHLApan and IEDB, DeepImmuno-CNN further correctly predicts which residues are most important for T cell antigen recognition. Our independent generative adversarial network (GAN) approach, DeepImmuno-GAN, was further able to accurately simulate immunogenic peptides with physiochemical properties and immunogenicity predictions similar to that of real antigens. We provide DeepImmuno-CNN as source code and an easy-to-use web interface. Data Availability DeepImmuno Python3 code is available at https://github.com/frankligy/DeepImmuno . The DeepImmuno web portal is available from https://deepimmuno.herokuapp.com . The data in this article is available in GitHub and supplementary materials.
1

Guided construction of single cell reference for human and mouse lung

Minzhe Guo et al.May 20, 2022
ABSTRACT Accurate cell type identification is a key and rate-limiting step in single cell data analysis. Single cell references with comprehensive cell types, reproducible and functional validated cell identities, and common nomenclatures are much needed by the research community to optimize automated cell type annotation and facilitate data integration, sharing, and collaboration. In the present study, we developed a novel computational pipeline to utilize the LungMAP CellCards as a dictionary to consolidate single-cell transcriptomic datasets of 104 human lungs and 17 mouse lung samples and constructed “LungMAP CellRef” and “LungMAP CellRef Seed” for both normal human and mouse lungs. “CellRef Seed” has an equivalent prediction power and produces consistent cell annotation as does “CellRef” but improves computational efficiency and simplifies its utilization for fast automated cell type annotation and online visualization. This atlas set incorporates 48 human and 40 mouse well-defined lung cell types catalogued from diverse anatomic locations and developmental time points. Using independent datasets, we demonstrated the utility of our CellRefs for automated cell type annotation analysis of both normal and disease lungs. User-friendly web interfaces were developed to support easy access and maximal utilization of the LungMAP CellRefs. LungMAP CellRefs are freely available to the pulmonary research community through fast interactive web interfaces to facilitate hypothesis generation, research discovery, and identification of cell type alterations in disease conditions.
1
Citation4
0
Save
Load More