ES
Elia Stupka
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
9
(89% Open Access)
Cited by:
8,545
h-index:
41
/
i10-index:
69
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The Bioperl Toolkit: Perl Modules for the Life Sciences

Jason Stajich et al.Oct 1, 2002
+18
P
M
J
The Bioperl project is an international open-source collaboration of biologists, bioinformaticians, and computer scientists that has evolved over the past 7 yr into the most comprehensive library of Perl modules available for managing and manipulating life-science information. Bioperl provides an easy-to-use, stable, and consistent programming interface for bioinformatics application programmers. The Bioperl modules have been successfully and repeatedly used to reduce otherwise complex tasks to only a few lines of code. The Bioperl object model has been proven to be flexible enough to support enterprise-level applications such as EnsEMBL, while maintaining an easy learning curve for novice Perl programmers. Bioperl is capable of executing analyses and processing results from programs such as BLAST, ClustalW, or the EMBOSS suite. Interoperation with modules written in Python and Java is supported through the evolving BioCORBA bridge. Bioperl provides access to data stores such as GenBank and SwissProt via a flexible series of sequence input/output modules, and to the emerging common sequence data storage format of the Open Bioinformatics Database Access project. This study describes the overall architecture of the toolkit, the problem domains that it addresses, and gives specific examples of how the toolkit can be used to solve common life-sciences problems. We conclude with a discussion of how the open-source nature of the project has contributed to the development effort. [Supplemental material is available online at www.genome.org . Bioperl is available as open-source software free of charge and is licensed under the Perl Artistic License ( http://www.perl.com/pub/a/language/misc/Artistic.html ). It is available for download at http://www.bioperl.org . Support inquiries should be addressed to bioperl-l@bioperl.org .]
0
Paper
Citation1,673
0
Save
0

The Ensembl genome database project

Jim Stalker et al.Jan 1, 2002
+30
Y
G
J
The Ensembl (http://www.ensembl.org/) database project provides a bioinformatics framework to organise biology around the sequences of large genomes. It is a comprehensive source of stable automatic annotation of the human genome sequence, with confirmed gene predictions that have been integrated with external data sources, and is available as either an interactive web site or as flat files. It is also an open source software engineering project to develop a portable system able to handle very large genomes and associated requirements from sequence analysis to data storage and visualisation. The Ensembl site is one of the leading sources of human genome sequence annotation and provided much of the analysis for publication by the international human genome project of the draft genome. The Ensembl system is being installed around the world in both companies and academic sites on machines ranging from supercomputers to laptops.
0
Citation1,588
0
Save
0

Whole-Genome Shotgun Assembly and Analysis of the Genome ofFugu rubripes

Samuel Aparicio et al.Aug 23, 2002
+37
E
J
S
The compact genome of Fugu rubripes has been sequenced to over 95% coverage, and more than 80% of the assembly is in multigene-sized scaffolds. In this 365-megabase vertebrate genome, repetitive DNA accounts for less than one-sixth of the sequence, and gene loci occupy about one-third of the genome. As with the human genome, gene loci are not evenly distributed, but are clustered into sparse and dense regions. Some “giant” genes were observed that had average coding sequence sizes but were spread over genomic lengths significantly larger than those of their human orthologs. Although three-quarters of predicted human proteins have a strong match to Fugu , approximately a quarter of the human proteins had highly diverged from or had no pufferfish homologs, highlighting the extent of protein evolution in the 450 million years since teleosts and mammals diverged. Conserved linkages between Fugu and human genes indicate the preservation of chromosomal segments from the common vertebrate ancestor, but with considerable scrambling of gene order.
0
Citation1,550
0
Save
0

Lentiviral Hematopoietic Stem Cell Gene Therapy Benefits Metachromatic Leukodystrophy

Alessandra Biffi et al.Jul 12, 2013
+34
L
E
A
Next-Generation Gene Therapy Few disciplines in contemporary clinical research have experienced the high expectations directed at the gene therapy field. However, gene therapy has been challenging to translate to the clinic, often because the therapeutic gene is expressed at insufficient levels in the patient or because the gene delivery vector integrates near protooncogenes, which can cause leukemia (see the Perspective by Verma ). Biffi et al. ( 1233158 , published online 11 July) and Aiuti et al. ( 1233151 ; published online 11 July) report progress on both fronts in gene therapy trials of three patients with metachromatic leukodystrophy (MLD), a neurodegenerative disorder, and three patients with Wiskott-Aldrich syndrome (WAS), an immunodeficiency disorder. Optimized lentiviral vectors were used to introduce functional MLD or WAS genes into the patients' hematopoietic stem cells (HSCs) ex vivo, and the transduced cells were then infused back into the patients, who were then monitored for up to 2 years. In both trials, the patients showed stable engraftment of the transduced HSC and high expression levels of functional MLD or WAS genes. Encouragingly, there was no evidence of lentiviral vector integration near proto-oncogenes, and the gene therapy treatment halted disease progression in most patients. A longer follow-up period will be needed to further validate efficacy and safety.
0
Citation1,103
0
Save
0

Long non-coding antisense RNA controls Uchl1 translation through an embedded SINEB2 repeat

Claudia Carrieri et al.Oct 12, 2012
+12
M
L
C
Most of the mammalian genome is transcribed. This generates a vast repertoire of transcripts that includes protein-coding messenger RNAs, long non-coding RNAs (lncRNAs) and repetitive sequences, such as SINEs (short interspersed nuclear elements). A large percentage of ncRNAs are nuclear-enriched with unknown function. Antisense lncRNAs may form sense-antisense pairs by pairing with a protein-coding gene on the opposite strand to regulate epigenetic silencing, transcription and mRNA stability. Here we identify a nuclear-enriched lncRNA antisense to mouse ubiquitin carboxy-terminal hydrolase L1 (Uchl1), a gene involved in brain function and neurodegenerative diseases. Antisense Uchl1 increases UCHL1 protein synthesis at a post-transcriptional level, hereby identifying a new functional class of lncRNAs. Antisense Uchl1 activity depends on the presence of a 5' overlapping sequence and an embedded inverted SINEB2 element. These features are shared by other natural antisense transcripts and can confer regulatory activity to an artificial antisense to green fluorescent protein. Antisense Uchl1 function is under the control of stress signalling pathways, as mTORC1 inhibition by rapamycin causes an increase in UCHL1 protein that is associated to the shuttling of antisense Uchl1 RNA from the nucleus to the cytoplasm. Antisense Uchl1 RNA is then required for the association of the overlapping sense protein-coding mRNA to active polysomes for translation. These data reveal another layer of gene expression control at the post-transcriptional level.
0
Citation898
0
Save
0

The BioMart community portal: an innovative alternative to large, centralized data repositories

Damian Smedley et al.Apr 20, 2015
+97
S
S
D
The BioMart Community Portal (www.biomart.org) is a community-driven effort to provide a unified interface to biomedical databases that are distributed worldwide. The portal provides access to numerous database projects supported by 30 scientific organizations. It includes over 800 different biological datasets spanning genomics, proteomics, model organisms, cancer data, ontology information and more. All resources available through the portal are independently administered and funded by their host organizations. The BioMart data federation technology provides a unified interface to all the available data. The latest version of the portal comes with many new databases that have been created by our ever-growing community. It also comes with better support and extensibility for data analysis and visualization tools. A new addition to our toolbox, the enrichment analysis tool is now accessible through graphical and web service interface. The BioMart community portal averages over one million requests per day. Building on this level of service and the wealth of information that has become available, the BioMart Community Portal has introduced a new, more scalable and cheaper alternative to the large data stores maintained by specialized organizations.
0
Citation713
0
Save
0

Integrated genomic analysis identifies recurrent mutations and evolution patterns driving the initiation and progression of follicular lymphoma

Jessica Okosun et al.Dec 22, 2013
+31
J
C
J
Jessica Okosun, Csaba Bödör and colleagues performed whole-genome or whole-exome sequencing on 10 follicular lymphoma and transformed follicular lymphoma pairs, followed by deep sequencing of 28 target genes in an additional 122 cases. They identify recurrent mutations in linker histone genes and genes involved in JAK-STAT signaling, NF-κB signaling and B cell development. Follicular lymphoma is an incurable malignancy1, with transformation to an aggressive subtype representing a critical event during disease progression. Here we performed whole-genome or whole-exome sequencing on 10 follicular lymphoma–transformed follicular lymphoma pairs followed by deep sequencing of 28 genes in an extension cohort, and we report the key events and evolutionary processes governing tumor initiation and transformation. Tumor evolution occurred through either a 'rich' or 'sparse' ancestral common progenitor clone (CPC). We identified recurrent mutations in linker histone, JAK-STAT signaling, NF-κB signaling and B cell developmental genes. Longitudinal analyses identified early driver mutations in chromatin regulator genes (CREBBP, EZH2 and KMT2D (MLL2)), whereas mutations in EBF1 and regulators of NF-κB signaling (MYD88 and TNFAIP3) were gained at transformation. Collectively, this study provides new insights into the genetic basis of follicular lymphoma and the clonal dynamics of transformation and suggests that personalizing therapies to target key genetic alterations in the CPC represents an attractive therapeutic strategy.
0
Citation659
0
Save
0

Genome-wide signatures of convergent evolution in echolocating mammals

Joe Parker et al.Sep 4, 2013
+4
J
G
J
Evolution is typically thought to proceed through divergence of genes, proteins and ultimately phenotypes. However, similar traits might also evolve convergently in unrelated taxa owing to similar selection pressures. Adaptive phenotypic convergence is widespread in nature, and recent results from several genes have suggested that this phenomenon is powerful enough to also drive recurrent evolution at the sequence level. Where homoplasious substitutions do occur these have long been considered the result of neutral processes. However, recent studies have demonstrated that adaptive convergent sequence evolution can be detected in vertebrates using statistical methods that model parallel evolution, although the extent to which sequence convergence between genera occurs across genomes is unknown. Here we analyse genomic sequence data in mammals that have independently evolved echolocation and show that convergence is not a rare process restricted to several loci but is instead widespread, continuously distributed and commonly driven by natural selection acting on a small number of sites per locus. Systematic analyses of convergent sequence evolution in 805,053 amino acids within 2,326 orthologous coding gene sequences compared across 22 mammals (including four newly sequenced bat genomes) revealed signatures consistent with convergence in nearly 200 loci. Strong and significant support for convergence among bats and the bottlenose dolphin was seen in numerous genes linked to hearing or deafness, consistent with an involvement in echolocation. Unexpectedly, we also found convergence in many genes linked to vision: the convergent signal of many sensory genes was robustly correlated with the strength of natural selection. This first attempt to detect genome-wide convergent sequence evolution across divergent taxa reveals the phenomenon to be much more pervasive than previously recognized.
0
Citation358
0
Save
0

A novel truncating variant of GLI2 associated with Culler-Jones syndrome impairs Hedgehog signalling

F. Valenza et al.Jul 9, 2018
+5
E
D
F
Abstract Background GLI2 encodes for a transcription factor that controls the expression of several genes in the Hedgehog pathway. Mutations in GLI2 have been described as causative of a spectrum of clinical phenotypes, notably holoprosencephaly, hypopituitarism and postaxial polydactyl. Methods: In order to identify causative genetic variant, we performed exome sequencing of a trio from an Italian family with multiple affected individuals presenting clinical phenotypes in the Culler-Jones syndrome spectrum. We performed a series of assays, both in vitro and in ovo (Chicken model) to test the functional properties of GLI2 mutation. Results Here we report a novel deletion c.3493delC (p.P1167LfsX52) in the C-terminal activation domain of GLI2, and cell-based functional assays confirmed the pathogenicity of the identified variant and revealed a dominant-negative effect of mutant GLI2 on Hedgehog signalling. Conclusion Our results highlight the variable clinical manifestation of GLI2 mutations and emphasize the value of functional characterisation of novel gene variants to assist genetic counselling and diagnosis.
0
Citation3
0
Save