A new version of ResearchHub is available.Try it now
Healthy Research Rewards
ResearchHub is incentivizing healthy research behavior. At this time, first authors of open access papers are eligible for rewards. Visit the publications tab to view your eligible publications.
Got it
AB
Anthony Boureux
Author with expertise in Role of Long Noncoding RNAs in Cancer and Development
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(63% Open Access)
Cited by:
1,648
h-index:
17
/
i10-index:
20
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Maternal mRNA deadenylation and decay by the piRNA pathway in the early Drosophila embryo

Christel Rouget et al.Oct 1, 2010
Small RNAs of the piRNA (Piwi-associated RNA) class have various functions in the germline — repressing transposable elements, maintaining germline stem cells and promoting genome stability. Rouget et al. have now uncovered a function for piRNAs outside the germline, in the fruit fly embryo. Specifically, piRNAs that are complementary to a sequence in the 3′-untranslated region of an mRNA for the embryonic posterior morphogen Nanos facilitate adenylation of the mRNA and its subsequent decay. Without piRNAs, Nanos accumulates and developmental defects result. Piwi-associated RNAs (piRNAs) are small RNAs with several functions in the germline, such as repressing transposable elements and helping to maintain germline stem cells. Now, a function for piRNAs has been discovered outside the germline, in the fruitfly embryo. Specifically, piRNAs are required for the decay of the messenger RNA encoding the posterior morphogen Nanos. When piRNA-induced regulation is impaired, this mRNA is stabilized and developmental defects ensue. Piwi-associated RNAs (piRNAs), a specific class of 24- to 30-nucleotide-long RNAs produced by the Piwi-type of Argonaute proteins, have a specific germline function in repressing transposable elements. This repression is thought to involve heterochromatin formation and transcriptional and post-transcriptional silencing1,2,3,4,5,6. The piRNA pathway has other essential functions in germline stem cell maintenance7 and in maintaining germline DNA integrity8,9,10. Here we uncover an unexpected function of the piRNA pathway in the decay of maternal messenger RNAs and in translational repression in the early embryo. A subset of maternal mRNAs is degraded in the embryo at the maternal-to-zygotic transition. In Drosophila, maternal mRNA degradation depends on the RNA-binding protein Smaug and the deadenylase CCR411,12,13, as well as the zygotic expression of a microRNA cluster14. Using mRNA encoding the embryonic posterior morphogen Nanos (Nos) as a paradigm to study maternal mRNA decay, we found that CCR4-mediated deadenylation of nos depends on components of the piRNA pathway including piRNAs complementary to a specific region in the nos 3′ untranslated region. Reduced deadenylation when piRNA-induced regulation is impaired correlates with nos mRNA stabilization and translational derepression in the embryo, resulting in head development defects. Aubergine, one of the Argonaute proteins in the piRNA pathway, is present in a complex with Smaug, CCR4, nos mRNA and piRNAs that target the nos 3′ untranslated region, in the bulk of the embryo. We propose that piRNAs and their associated proteins act together with Smaug to recruit the CCR4 deadenylation complex to specific mRNAs, thus promoting their decay. Because the piRNAs involved in this regulation are produced from transposable elements, this identifies a direct developmental function for transposable elements in the regulation of gene expression.
0
Citation417
0
Save
0

Evolution of the Rho Family of Ras-Like GTPases in Eukaryotes

Anthony Boureux et al.Oct 11, 2006
GTPases of the Rho family are molecular switches that play important roles in converting and amplifying external signals into cellular effects.Originally demonstrated to control the dynamics of the F-actin cytoskeleton, Rho GTPases have been implicated in many basic cellular processes that influence cell proliferation, differentiation, motility, adhesion, survival, or secretion.To elucidate the evolutionary history of the Rho family, we have analyzed over 20 species covering major eukaryotic clades from unicellular organisms to mammals, including platypus and opossum, and have reconstructed the ontogeny and the chronology of emergence of the different subfamilies.Our data establish that the 20 mammalian Rho members are structured into 8 subfamilies, among which Rac is the founder of the whole family.Rho, Cdc42, RhoUV, and RhoBTB subfamilies appeared before Coelomates and RhoJQ, Cdc42 isoforms, RhoDF, and Rnd emerged in chordates.In vertebrates, gene duplications and retrotranspositions increased the size of each chordate Rho subfamily, whereas RhoH, the last subfamily, arose probably by horizontal gene transfer.Rac1b, a Rac1 isoform generated by alternative splicing, emerged in amniotes, and RhoD, only in therians.Analysis of Rho mRNA expression patterns in mouse tissues shows that recent subfamilies have tissue-specific and low-level expression that supports their implication only in narrow time windows or in differentiated metabolic functions.These findings give a comprehensive view of the evolutionary canvas of the Rho family and provide guides for future structure and evolution studies of other components of Rho signaling pathways, in particular regulators of the RhoGEF family. Materials and Methods Database SearchesWe searched genomic and/or expressed sequence tag databases for Rho GTPases using TBlastN or BlastP (v2.2.13) algorithms (Altschul et al. 1997).
0
Citation416
0
Save
1

Kmerator Suite: design of specific k-mer signatures and automatic metadata discovery in large RNA-Seq datasets

Sébastien Riquier et al.May 22, 2021
ABSTRACT The huge body of publicly available RNA-seq libraries is a treasure of functional information allowing to quantify the expression of known or novel transcripts in tissues. However, transcript quantification commonly relies on alignment methods requiring a lot of computational resources and processing time, which does not scale easily to large datasets. K-mer decomposition constitutes a new way to process RNA-seq data for the identification of transcriptional signatures, as k-mers can be used to quantify accurately gene expression in a less resource-consuming way. We present the Kmerator Suite, a set of three tools designed to extract specific k-mer signatures, quantify these k-mers into RNA-seq datasets and quickly visualize large datasets characteristics. The core tool, Kmerator, produces specific k-mers for 97% of human genes, enabling the measure of gene expression with high accuracy in simulated datasets. KmerExploR, a direct application of Kmerator, uses a set of predictor genes specific k-mers to infer metadata including library protocol, sample features or contaminations from RNA-seq datasets. KmerExploR results are visualised through a user-friendly interface. Moreover, we demonstrate that the Kmerator Suite can be used for advanced queries targeting known or new biomarkers such as mutations, gene fusions or long non coding-RNAs for human health applications.
1
Citation2
0
Save
0

Detailed analysis of public RNAseq data and long non-coding RNA: a proposed enhancement to mesenchymal stem cell characterisation

Sébastien Riquier et al.Mar 11, 2020
The development of RNA sequencing (RNAseq) and corresponding emergence of public datasets have created new avenues of transcriptional marker search. The long non-coding RNAs (lncRNAs) constitute an emerging class of transcripts with a potential for high tissue specificity and function. Using a dedicated bioinformatics pipeline, we propose to construct a cell-specific catalogue of unannotated lncRNAs and to identify the strongest cell markers. This pipeline uses ab initio transcript identification, pseudoalignment and new methodologies such as a specific k-mer approach for naive quantification of expression in numerous RNAseq data. For an application model, we focused on Mesenchymal Stem Cells (MSCs), a type of adult multipotent stem-cells of diverse tissue origins. Frequently used in clinics, these cells lack extensive characterisation. Our pipeline was able to highlight different lncRNAs with high specificity for MSCs. In silico methodologies for functional prediction demonstrated that each candidate represents one specific state of MSCs biology. Together, these results suggest an approach that can be employed to harness lncRNA as cell marker, showing different candidates as potential actors in MSCs biology, while suggesting promising directions for future experimental investigations.
0

A strong internal promoter drives massive expression of YEATS‐domain devoid MLLT3 transcripts in HSC and most lethal AML

Chloé Bessière et al.Jan 3, 2025
The AF9 (protein AF9) transcription factor, encoded by MLLT3 (mixed-lineage leukemia translocated to 3) on chromosome 9, functions as a chromatin reader. Through its N-terminal YEATS (Yaf9, ENL, AF9, Taf14, and Sas5) protein domain, it interacts with acetylated [1] or crotonylated [2] histone H3, as well as with the PAF1 (RNA polymerase II-associated factor 1 homolog) and P-TEFb (positive transcription elongation factor b) components of the super elongation complex (SEC). AF9 also interacts through its poly-serine domain (Poly-Ser) with the TFIID (Transcription factor II D) subunit of the RNA polymerase II (RNApol II) complex. In addition, its C-terminal transactivation domain, AHD (nuclear anchorage protein1 homology domain), binds other SEC components, such as AFF1 and AFF4 (ALF transcription elongation factor 1 or 4), as well as transcription regulators CBX8 (chromobox 8), DOT1L (disruptor of telomeric silencing 1 like), and BCOR (B cell lymphoma 6 corepressor), as reviewed by Kabra & Bushweller [3] (Figure 1A). Thus, MLLT3 is an integral part of the SEC, which is essential for optimizing the catalytic activity of RNApol II transcription at specific genome loci. Several studies have indicated that MLLT3 is highly and specifically expressed in hematopoietic stem cells (HSCs), but it is rapidly and significantly downregulated during normal differentiation or immediately after HSCs are placed in ex vivo culture. In both scenarios, this shutdown parallels the rapid loss of stemness. Consistently, ectopic expression of MLLT3 significantly prolongs self-renewal capacity of HSCs, suggesting that MLLT3 is a crucial factor for HSC maintenance [4]. Based on standard quantification of RNA-sequencing reads mapping to the MLLT3 locus, we first confirmed that, compared to the MLLT1 paralogue used as an internal control, MLLT3 expression was significantly higher in CD34+ cells than in mature lymphocytes, granulocytes, or monocytes from healthy samples of the Leucegene dataset (Leucegene-NH, detailed in Supplementary Information) (Figure 1B, left panel). To refine this observation, made in CD34+ cells containing a mixture of progenitors but only a few HSCs, we repeated the analysis in HSCs and various stages of progenitor cells sorted form healthy donors (IUCT-NH, detailed in Supplementary Information). The data clearly confirmed that MLLT3 is highly expressed in HSCs but rapidly declines as differentiation proceeds (Figure 1B, right panel). However, closer examination using a k-mer approach (described in Materials and Methods in Supplementary Information), which visualized RNA-sequencing read alignment along the 11 exons (E1-E11) of the reference MLLT3 transcript, revealed an unexpected profile. Strikingly, the substantial MLLT3 expression detected in HSCs was driven by a sharp and pronounced increase in reads starting precisely at the first nucleotide of exon E6 (Figure 1C). This unexpected profile was absent when examining MLLT1 expression in the hematopoietic lineage (Supplementary Figure S1). These findings suggest the expression of one or more 5' end shortened MLLT3 transcripts arising from a hematologic lineage-specific internal promoter located in MLLT3 intron 5. A new set of specific and successive k-mers covering the entire MLLT3 intron 5 revealed the presence of two novel segments retained in poly(A)+ RNAs. Apart from the 5' end of the first segment, which lacked a clearly defined starting point consistent with a probable transcription start site, consensus donor and acceptor splice sites flanked these two segments. These unexpected exons were designated as exon E6a and exon E6b/b' (Figure 1D). Additional k-mer analyses confirmed that these exons were spliced to exon E6, resulting in three possible splice variants: E6a-E6b-E6, E6a-E6b'-E6, and E6a-E6, with the E6a-E6 variant being the most predominant (Figure 1E and Supplementary Figure S2). This assortment of novel CD34+-specific alternative exons was further validated using standard Sanger sequencing following RT-PCR amplification with specific primers (Supplementary Figure S3). Next, exploration of public CHIP-Seq (chromatin immunoprecipitation followed by sequencing) and CAGE (mRNA 5' cap analysis of gene expression) datasets revealed the existence of an alternative P2 promoter in addition to the canonical P1 promoter. Associated with an active promoter H3K4me3 mark and a CAGE peak, this P2 promoter, found exclusively in immature CD34+ cells but absent in CD14+ monocytes, was predicted to drive the expression of transcripts beginning with exon E6a (Supplementary Figure S4). Transcript-specific k-mer quantifications confirmed that the exceptionally high overall level of MLLT3 observed in HSCs was primarily due to these shorter transcripts starting with exon E6a. We have collectively named these shorter transcripts s-MLLT3, in contrast to the reference full-length MLLT3 transcript, referred to as l-MLLT3 (Figure 1F). These findings revealed the existence of an HSC-specific internal promoter (P2) that drives the expression of shorter MLLT3 transcripts (s-MLLT3 mRNAs, Figure 1G). To evaluate the translational potential of these s-MLLT3 transcripts, we cloned a C-terminal myc-tagged version of the predominant E6a-E6 variant into an expression vector (Figure 1H, top), and assessed its protein expression capacity in the HEK (human embryonic kidney) cell line by western blotting. Compared with a similar vector encoding l-MLLT3, the E6a-E6 s-MLLT3 transcript produced shorter s-MLLT3 proteins, (Figure 1H, bottom left). A western blotting analysis of endogenous proteins confirmed the existence of these shorter forms in CD34+ cells but not in the K-562 leukemic cell line, which served as a low-expressing control (Figure 1H, bottom middle). Isoform-specific RT-qPCR quantification further corroborated that, compared to CD34+ cells and full-length l-MLLT3, expression of the three shorter forms (E6a-E6b, E6a-E6b', and E6a-E6) was very low in K-562 cells (Figure 1H, bottom right). These western blot results identified at least two distinct s-MLLT3 proteins, likely arising from alternative translation initiation codons (AUG2 and AUG3) located in exon 7, producing proteins that retain the C-terminal AHD transactivation domain but lack the YEATS and Poly-Ser domains (Supplementary Figure S5). Interestingly, the shorter MLLT3 alternative transcripts initiate within intron 5, which is also a frequent site of chromosomal translocation in acute myeloid leukemia (AML). Specifically, MLLT3 intron 5 is the primary site of the t(9;11) chromosomal translocation, leading to fusion with KMT2A (lysine (K) methyl transferase 2A) [5]. KMT2A is a chromatin writer that deposits epigenetic marks indicating active transcription at specific loci, particularly the HOX genes required for hematopoiesis [6]. The resulting KMT2A-MLLT3 fusion transcript encodes a chimeric protein composing the N-terminal third of KMT2A fused to the C-terminal portion of MLLT3, which lacks the YEATS domain but retains the AHD transactivation domain (Supplementary Figure S6). To investigate global MLLT3 expression in AML, we analyzed two RNA-Seq datasets: IUCT-AML [7] and Beat-AML [8] (detailed in Supplementary Information). Compared with MLLT1, the expression range of MLLT3 was broader, showing a > 120-fold amplitude across samples (Figure 1I). Isoform- specific k-mers targeting alternative (E6a-E6 + E6b/b'-E6 for s-MLLT3) and canonical (E5-E6 for l-MLLT3) exon-exon junctions revealed no correlation between s-MLLT3 and l-MLLT3 expressions. Approximately 20% of samples exhibited high s-MLLT3 levels, whereas in other samples, s-MLLT3 was undetectable despite l-MLLT3 expression (Supplementary Figure S7). This finding suggests differential regulation of the two promoters and/or the resulting transcripts in AML. We next investigated whether the ∼20% of AML samples with high s-MLLT3 expression represented a distinct clinical entity. Samples which were either MECOM+ (myelodysplasia syndrome 1 and EVI1 complex locus) or GATA2-MECOM (Supplementary Figure S8), and those with mutant RUNX1 (runt-related transcription factor 1) and/or TP53 (tumor protein p53) showed higher levels of l-MLLT3, with even greater levels of s-MLLT3 (Supplementary Figure S9, left and middle). No correlation with the KMT2A-MLLT3 translocation was observed. Conversely, NPM1 (nucleophosmin 1)-mutated samples exhibited very low levels of both transcripts (Supplementary Figure S9, left and middle). Notably, elevated s-MLLT3 or l-MLLT3 levels were associated with an adverse ELN2017 (European LeukemiaNet 2017) score (Supplementary Figure S9, right). Median expression-based group separation revealed that patients with the highest overall MLLT3 expression had worse survival outcomes (Figure 1J, left). However, given the lack of correlation between s-MLLT3 and l-MLLT3 expression in AML samples, we assessed their independent impacts on survival. Isoform-specific k-mers showed that s-MLLT3 (but not l-MLLT3) expression significantly influenced poor patient survival (Figure 1J, middle and right panels). In conclusion, these findings demonstrate the existence of an internal promoter within the MLLT3 locus, driving expression of 5'-end-shortened transcripts encoding an AF9 protein lacking the YEAST chromatin reader domain. These alternative transcripts are highly expressed in HSCs and in ∼20% of AML patients with the worst survival outcomes. These results suggest that the role of the MLLT3 locus in HSCs and in AML should be re-evaluated, considering the expression of this YEATS-domain-devoid AF9 transcription factor. Stéphane Pyronnet wrote the manuscript. Chloé Bessière, Ahmed Zamani, Sandra Dailhau, Christian Récher, Marina Bousquet, and Stéphane Pyronnet contributed to the study design, conception, and data analysis. Ahmed Zamani, Romain Pfeifer, and Marina Bousquet designed and performed biological experiments. Chloé Bessière, Sandra Dailhau, Camille Marchet, Benoit Guibert, Anthony Boureux, Raïssa Silva Da Silva, Nicolas Gilbert, and Thérèse Commes developed the k-mer-based bioinformatics tools. Fabienne Meggetto, Christian Touriol, and Marina Bousquet provided comments on and contributed to editing the manuscript. Some of the results presented in this publication are based on data generated by the Leucegene group, primarily based at IRIC in Montreal, Canada, and supported by Genome Canada and Genome Québec. This data was made possible through human AML specimens provided by the BCLQ in Montreal, Canada. Christian Récher declares a consulting or advisory role with Abbvie, Amgen, Astellas, BMS, Boehringer, Jazz Pharmaceuticals, and Servier, and has received research funding from Abbvie, Amgen, Astellas, BMS, Iqvia, and Jazz Pharmaceuticals. All other authors declare no conflict of interest. This work was funded by INSERM, Institut Universitaire du Cancer-Toulouse (IUCT), Labex Toucan, Fondation Leucémie Espoir, Ligue Régionale Contre le Cancer, Fondation ARC, Association Laurette Fugain, Agence Nationale de la Recherche (ANR-18-CE45-0020 Transipedia) and (ANR-22-CE45-0007 full-RNA). Chloé Bessière was supported by Fondation de France, Ahmed Zamani and Raïssa Silva Da Silva by Ligue Nationale Contre le Cancer, Romain Pfeifer by Ministère de l'Enseignement Supérieur et de la Recherche and Fondation ARC, Sandra Dailhau by Ministère de la Santé and Institut National du Cancer (INCA, PRT-K-2022-184CircOma). In accordance with French law, each anonymous volunteer donor or patient was informed, and the HIMIP collection has been declared to the Ministère de l'Enseignement Supérieur et de la Recherche (DC 2008-307). A transfer agreement was obtained (AC 2008-129) after approval by the local ethical committee, Comité de Protection des Personnes Sud-Ouest et Outremer II, and the local Research Ethics Committee of the Etablissement Français du Sang (Toulouse, France, agreement #21PLER2021-007). Clinical and biological annotations have also been declared to the Comité National Informatique et Libertés (CNIL). This study was conducted in accordance with the Declaration of Helsinki. The raw and processed RNA-sequencing data generated in this study have been deposited at the National Center for Biotechnology Information Gene Expression Omnibus (repository number GSE62852). Please note: The publisher is not responsible for the content or functionality of any supporting information supplied by the authors. Any queries (other than missing content) should be directed to the corresponding author for the article.