BZ
Blaž Zupan
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
5
(80% Open Access)
Cited by:
2,107
h-index:
48
/
i10-index:
115
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

iCLIP reveals the function of hnRNP particles in splicing at individual nucleotide resolution

Julian König et al.Jul 1, 2010
+6
G
K
J
Even though heterogeneous nuclear ribonucleoprotein C (hnRNP C) is among the most abundant proteins in the nucleus, its role in splicing has remained unresolved. Data obtained using a newly developed individual-nucleotide UV crosslinking and immunoprecipitation (iCLIP) technique, integrated with alternative splicing profiles, indicate how the position of hnRNP particles determines their effect on inclusion of alternative exons. In the nucleus of eukaryotic cells, nascent transcripts are associated with heterogeneous nuclear ribonucleoprotein (hnRNP) particles that are nucleated by hnRNP C. Despite their abundance, however, it remained unclear whether these particles control pre-mRNA processing. Here, we developed individual-nucleotide resolution UV cross-linking and immunoprecipitation (iCLIP) to study the role of hnRNP C in splicing regulation. iCLIP data show that hnRNP C recognizes uridine tracts with a defined long-range spacing consistent with hnRNP particle organization. hnRNP particles assemble on both introns and exons but remain generally excluded from splice sites. Integration of transcriptome-wide iCLIP data and alternative splicing profiles into an 'RNA map' indicates how the positioning of hnRNP particles determines their effect on the inclusion of alternative exons. The ability of high-resolution iCLIP data to provide insights into the mechanism of this regulation holds promise for studies of other higher-order ribonucleoprotein complexes.
0
Citation1,093
0
Save
0

Characterizing the RNA targets and position-dependent splicing regulation by TDP-43

James Tollervey et al.Feb 27, 2011
+12
B
T
J
TDP-43 is a RNA-binding protein that forms inclusion bodies in ALS. The authors show that TDP-43 preferentially binds long clusters of UG-rich sequences and that TDP-43 binding on pre-mRNAs influences alternative splicing. Many alternative mRNA isoforms regulated by TDP-43 encode proteins that regulate neuronal development or are implicated in neurological diseases. TDP-43 is a predominantly nuclear RNA-binding protein that forms inclusion bodies in frontotemporal lobar degeneration (FTLD) and amyotrophic lateral sclerosis (ALS). The mRNA targets of TDP-43 in the human brain and its role in RNA processing are largely unknown. Using individual nucleotide-resolution ultraviolet cross-linking and immunoprecipitation (iCLIP), we found that TDP-43 preferentially bound long clusters of UG-rich sequences in vivo. Analysis of RNA binding by TDP-43 in brains from subjects with FTLD revealed that the greatest increases in binding were to the MALAT1 and NEAT1 noncoding RNAs. We also found that binding of TDP-43 to pre-mRNAs influenced alternative splicing in a similar position-dependent manner to Nova proteins. In addition, we identified unusually long clusters of TDP-43 binding at deep intronic positions downstream of silenced exons. A substantial proportion of alternative mRNA isoforms regulated by TDP-43 encode proteins that regulate neuronal development or have been implicated in neurological diseases, highlighting the importance of TDP-43 for the regulation of splicing in the brain.
0
Citation1,008
0
Save
0

Embedding to Reference t-SNE Space Addresses Batch Effects in Single-Cell Classification

Pavlin Poličar et al.Jun 14, 2019
B
M
P
Abstract Dimensionality reduction techniques, such as t-SNE, can construct informative visualizations of high-dimensional data. When working with multiple data sets, a straightforward application of these methods often fails; instead of revealing underlying classes, the resulting visualizations expose data set-specific clusters. To circumvent these batch effects, we propose an embedding procedure that takes a t-SNE visualization constructed on a reference data set and uses it as a scaffold for embedding new data. The new, secondary data is embedded one data-point at the time. This prevents any interactions between instances in the secondary data and implicitly mitigates batch effects. We demonstrate the utility of this approach with an analysis of six recently published single-cell gene expression data sets containing up to tens of thousands of cells and thousands of genes. In these data sets, the batch effects are particularly strong as the data comes from different institutions and was obtained using different experimental protocols. The visualizations constructed by our proposed approach are cleared of batch effects, and the cells from secondary data sets correctly co-cluster with cells from the primary data sharing the same cell type.
4

Transcriptional milestones in Dictyostelium development

Mariko Katoh‐Kurasawa et al.May 27, 2021
+4
S
K
M
Abstract Development of the social amoeba Dictyostelium discoideum begins by starvation of single cells and ends in multicellular fruiting bodies 24 hours later. These major morphological changes are accompanied by sweeping gene expression changes, encompassing nearly half of the 13,000 genes in the genome. To explore the relationships between the transcriptome and developmental morphogenesis, we performed time-series RNA-sequencing analysis of the wild type and 20 mutant strains with altered morphogenesis. These strains exhibit arrest at different developmental stages, accelerated development, or terminal morphologies that are not typically seen in the wild type. Considering eight major morphological transitions, we identified 1,371 milestone genes whose expression changes sharply between two consecutive transitions. We also identified 1,099 genes as members of 21 regulons, which are groups of genes that remain coordinately regulated despite the genetic, temporal, and developmental perturbations in the dataset. The gene annotations in these milestones and regulons validate known transitions and reveal several new physiological and functional transitions during development. For example, we found that DNA replication genes are co-regulated with cell division genes, so they are co-expressed in mid-development even though chromosomal DNA is not replicated at that time. Altogether, the dataset includes 486 transcriptional profiles, across developmental and genetic conditions, that can be used to identify new relationships between gene expression and developmental processes and to improve gene annotations. We demonstrate the utility of this resource by showing that the cycles of aggregation and disaggregation observed in allorecognition-defective mutants involve a dedifferentiation process. We also show unexpected variability and sensitivity to genetic background and developmental conditions in two commonly used genes, act6 and act15 , and robustness of the coaA gene. Finally, we propose that gpdA should be used as a standard for mRNA quantitation because it is less sensitive to genetic background and developmental conditions than commonly used standards. The dataset is available for democratized exploration without the need for programming skills through the web application dictyExpress and the data mining environment Orange.
4
Citation1
0
Save
0

openTSNE: a modular Python library for t-SNE dimensionality reduction and embedding

Pavlin Poličar et al.Aug 12, 2019
B
M
P
Summary Point-based visualisations of large, multi-dimensional data from molecular biology can reveal meaningful clusters. One of the most popular techniques to construct such visualisations is t-distributed stochastic neighbor embedding (t-SNE), for which a number of extensions have recently been proposed to address issues of scalability and the quality of the resulting visualisations. We introduce openTSNE, a modular Python library that implements the core t-SNE algorithm and its extensions. The library is orders of magnitude faster than existing popular implementations, including those from scikit-learn. Unique to openTSNE is also the mapping of new data to existing embeddings, which can surprisingly assist in solving batch effects.Availability openTSNE is available at .Contact pavlin.policar{at}fri.uni-lj.si, blaz.zupan{at}fri.uni-lj.si