EB
Emily Bowler
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
9
(78% Open Access)
Cited by:
11,402
h-index:
13
/
i10-index:
14
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

UniProt: the universal protein knowledgebase in 2021

Alex Bateman et al.Nov 2, 2020
The aim of the UniProt Knowledgebase is to provide users with a comprehensive, high-quality and freely accessible set of protein sequences annotated with functional information. In this article, we describe significant updates that we have made over the last two years to the resource. The number of sequences in UniProtKB has risen to approximately 190 million, despite continued work to reduce sequence redundancy at the proteome level. We have adopted new methods of assessing proteome completeness and quality. We continue to extract detailed annotations from the literature to add to reviewed entries and supplement these in unreviewed entries with annotations provided by automated systems such as the newly implemented Association-Rule-Based Annotator (ARBA). We have developed a credit-based publication submission interface to allow the community to contribute publications and annotations to UniProt entries. We describe how UniProtKB responded to the COVID-19 pandemic through expert curation of relevant entries that were rapidly made available to the research community through a dedicated portal. UniProt resources are available under a CC-BY (4.0) license via the web at https://www.uniprot.org/.
0
Citation5,752
0
Save
0

UniProt: the Universal Protein Knowledgebase in 2023

Alex Bateman et al.Nov 21, 2022
Abstract The aim of the UniProt Knowledgebase is to provide users with a comprehensive, high-quality and freely accessible set of protein sequences annotated with functional information. In this publication we describe enhancements made to our data processing pipeline and to our website to adapt to an ever-increasing information content. The number of sequences in UniProtKB has risen to over 227 million and we are working towards including a reference proteome for each taxonomic group. We continue to extract detailed annotations from the literature to update or create reviewed entries, while unreviewed entries are supplemented with annotations provided by automated systems using a variety of machine-learning techniques. In addition, the scientific community continues their contributions of publications and annotations to UniProt entries of their interest. Finally, we describe our new website (https://www.uniprot.org/), designed to enhance our users’ experience and make our data easily accessible to the research community. This interface includes access to AlphaFold structures for more than 85% of all entries as well as improved visualisations for subcellular localisation of proteins.
0
Citation3,510
0
Save
0

A standardized framework for representation of ancestry data in genomics studies, with application to the NHGRI-EBI GWAS Catalog

Joannella Morales et al.Apr 21, 2017
Abstract Background The accurate description of ancestry is essential to interpret and integrate human genomics data, and to ensure that advances in the field of genomics benefit individuals from all ancestral backgrounds. However, there are no established guidelines for the consistent, unambiguous and standardized description of ancestry. To fill this gap, we provide a framework, designed for the representation of ancestry in GWAS data, but with wider application to studies and resources involving human subjects. Result Here we describe our framework and its application to the representation of ancestry data in a widely-used publically available genomics resource, the NHGRI-EBI GWAS Catalog. We present the first analyses of GWAS data using our ancestry categories, demonstrating the validity of the framework to facilitate the tracking of ancestry in big data sets. We exhibit the broader relevance and integration potential of our method by its usage to describe the well-established HapMap and 1000 Genomes reference populations. Finally, to encourage adoption, we outline recommendations for authors to implement when describing samples. Conclusions While the known bias towards inclusion of European ancestry individuals in GWA studies persists, African and Hispanic or Latin American ancestry populations contribute a disproportionately high number of associations, suggesting that analyses including these groups may be more effective at identifying new associations. We believe the widespread adoption of our framework will increase standardization of ancestry data, thus enabling improved analysis, interpretation and integration of human genomics data and furthering our understanding of disease.
0
Citation4
0
Save
1

Proteomic characterization of GSK3β knockout shows altered cell adhesion and metabolic pathway utilisation in colorectal cancer cells.

Emily Bowler et al.Jan 26, 2021
ABSTRACT Glycogen-specific kinase (GSK3β) is an integral regulator of the Wnt signalling pathway as well as many other diverse signalling pathways and processes. Dys-regulation of GSK3β is implicated in many different pathologies, including neurodegenerative disorders as well as many different tumour types. In the context of tumour development, GSK3β has been shown to play both oncogenic and tumour suppressor roles, depending upon tissue, signalling environment or disease progression. Although multiple substrates of the GSK3β kinase have been identified, the wider protein networks within which GSK3β participates are not well known, and the consequences of these interactions not well understood. In this study, LC-MS/MS expression analysis was performed using knockout GSK3β colorectal cancer cells and isogenic controls in colorectal cancer cell lines carrying dominant stabilizing mutations of β-Catenin. Consistent with the role GSK3β, we found that β-Catenin levels and canonical Wnt activity are unaffected by knockout of GSK3β and therefore use this knockout cell model to identify other processes in which GSK3β is implicated. Quantitative proteomic analysis revealed perturbation of proteins involved in cell-cell adhesion, and we characterize the phenotype and altered proteomic profiles associated with this. We also characterize the perturbation of metabolic pathways resulting from GSK3β knockout and identify defects in glycogen metabolism. In summary, using a precision colorectal cancer cell-line knockout model with constitutively activated β-Catenin we are able to identify several of the diverse pathways and processes associated with GSK3β function.
0

Deep proteomic analysis of Dnmt1 mutant/hypomorphic colorectal cancer cells reveals dys-regulation of Epithelial-Mesenchymal Transition and subcellular re-localization of Beta-Catenin

Emily Bowler et al.Feb 13, 2019
Background: DNA methyltransferase I is the primary eukaryotic DNA methyltransferase engaged in maintenance of CpG DNA methylation patterns across the genome. Alteration of CpG methylation patterns and levels is a frequent and significant occurrence across many cancers, and targeted inhibition of Dnmt1 has become an approach of choice for select malignancies. There has been significant interest both in the methyltransferase activity as well as methylation-independent functions of Dnmt1. A previously generated hypomorphic allele of Dnmt1 in HCT116 colorectal cancer cells has become an important tool for understanding Dnmt1 function and how CpG methylation patterns are modulated across the genome. Colorectal cancer cells with the Dnmt1 hypomorphic allele carry a homozygous deletion of exons 3 to 5 of Dnmt1, resulting in greatly reduced Dnmt1 protein expression whilst still exhibiting a limited functional activity and methyltransferase ability. Although this cell model of reduced Dnmt1 levels and function have been used to study the downstream effects on the epigenome and transcriptome, the broader effects of the Dnmt1 hypomorph on the proteome and wider cell signalling are largely unknown. Results: In this study, we used quantitative proteomic analysis of nuclear-enriched samples of HCT116 Dnmt1 hypomorph cells to identify signalling pathways and processes dysregulated in the hypomorph cells as compared to wild-type HCT116 cells. Unexpectedly, we observed a clear signature of increased expression of Epithelial-to-Mesenchymal (EMT) in Dnmt1 hypomorph cells. We also observed reduced expression and sub-cellular re-localization of Beta-Catenin in Dnmt1 hypomorph cells. Expression of wild-type Dnmt1 in hypomorph cells or knock-down of wild-type Dnmt1 did not recapitulate or rescue the observed protein profiles in Dnmt1 hypomorph cells suggesting that hypomorphic Dnmt1 causes changes not solely attributable to Dnmt1 protein levels. Conclusions: In summary we present the first comprehensive proteomic analysis of the widely studied Dnmt1 hypomorph colorectal cancer cells and identify redistribution of Dnmt1 and its interaction partner Beta-Catenin as well as the dysregulation of EMT related processes and signalling pathways related to the development of a cancer stem cell phenotype.
0

Meta-Analysis of Rice Phosphoproteomics Data to Understand Variation in Cell Signaling Across the Rice Pan-Genome

Kerry Ramsbottom et al.May 29, 2024
Phosphorylation is the most studied post-translational modification, and has multiple biological functions. In this study, we have reanalyzed publicly available mass spectrometry proteomics data sets enriched for phosphopeptides from Asian rice (Oryza sativa). In total we identified 15,565 phosphosites on serine, threonine, and tyrosine residues on rice proteins. We identified sequence motifs for phosphosites, and link motifs to enrichment of different biological processes, indicating different downstream regulation likely caused by different kinase groups. We cross-referenced phosphosites against the rice 3,000 genomes, to identify single amino acid variations (SAAVs) within or proximal to phosphosites that could cause loss of a site in a given rice variety and clustered the data to identify groups of sites with similar patterns across rice family groups. The data has been loaded into UniProt Knowledge-Base─enabling researchers to visualize sites alongside other data on rice proteins, e.g., structural models from AlphaFold2, PeptideAtlas, and the PRIDE database─enabling visualization of source evidence, including scores and supporting mass spectra.
0

Phosphorylation in thePlasmodium falciparumproteome: A meta-analysis of publicly available data sets

Oscar Camacho et al.Nov 20, 2023
Abstract Malaria is a deadly disease caused by Apicomplexan parasites of the Plasmodium genus. Several species of the Plasmodium genus are known to be infectious to human, of which P. falciparum is the most virulent. Post-translational modifications (PTMs) of proteins coordinate cell signalling and hence, regulate many biological processes in P. falciparum homeostasis and host infection, of which the most highly studied is phosphorylation. Phosphosites on proteins can be identified by tandem mass spectrometry (MS) performed on enriched samples (phosphoproteomics), followed by downstream computational analyses. We have performed a large-scale meta-analysis of 11 publicly available phosphoproteomics datasets, to build a comprehensive atlas of phosphosites in the P. falciparum proteome, using robust pipelines aimed at strict control of false identifications. We identified a total of 28,495 phosphorylated sites on P. falciparum proteins at 5% false localisation rate (FLR) and, of those, 18,100 at 1% FLR. We identified significant sequence motifs, likely indicative of different groups of kinases, responsible for different groups of phosphosites. Conservation analysis identified clusters of phosphoproteins that are highly conserved, and others that are evolving faster within the Plasmodium genus, and implicated in different pathways. We were also able to identify over 180,000 phosphosites within Plasmodium species beyond falciparum , based on orthologue mapping. We also explored the structural context of phosphosites, identifying a strong enrichment for phosphosites on fast evolving (low conservation) intrinsically disordered regions (IDRs) of proteins. In other species, IDRs have been shown to have an important role in modulating protein-protein interactions, particularly in signalling, and thus warranting further study for their roles in host- pathogen interactions. All data has made available via UniProtKB, PRIDE and PeptideAtlas, with visualisation interfaces for exploring phosphosites in the context of other data on Plasmodium proteins. Author Summary Plasmodium parasites continue to pose a significant global health threat, with a high proportion of the world at risk of malaria. It is imperative to gain new insights into cell signalling and regulation of biological processes in these parasites to develop effective treatments. This study focused on post- translational modifications (PTMs) of proteins, specifically phosphorylation. We conducted a meta- analysis of 11 publicly available phosphoproteomics datasets, identifying over 28,000 phosphorylated sites on P. falciparum proteins, using very rigorous statistics to avoid reporting false positives, and mapping to over 180,000 phosphorylation sites on other species of Plasmodium . The analysis revealed distinct sequence motifs associated with different groups of phosphosites (and likely indicative of different upstream kinases), and differences in the downstream pathways regulated. Conservation analysis highlighted clusters of phosphoproteins evolving at different rates within the Plasmodium genus. Notably, phosphorylation was enriched in regions of proteins lacking distinct structural elements, known as intrinsically disordered regions (IDRs), which are poorly conserved across the genus – we speculate that they are important for modulating protein interactions. The findings provide valuable insights into the molecular mechanisms of P. falciparum , with potential implications for understanding host-pathogen interactions. The comprehensive dataset generated is now publicly accessible, serving as a valuable resource for the scientific community through UniProtKB, PRIDE, and PeptideAtlas.
0

A meta-analysis of rice phosphoproteomics data to understand variation in cell signalling across the rice pan-genome

Kerry Ramsbottom et al.Jan 1, 2023
Phosphorylation is the most studied post-translational modification, and has multiple biological functions. In this study, we have re-analysed publicly available mass spectrometry proteomics datasets enriched for phosphopeptides from Asian rice (Oryza sativa). In total we identified 15,522 phosphosites on serine, threonine and tyrosine residues on rice proteins. We identified sequence motifs for phosphosites, and link motifs to enrichment of different biological processes, indicating different downstream regulation likely caused by different kinase groups. We cross-referenced phosphosites against the rice 3,000 genomes, to identify single amino acid variations (SAAVs) within or proximal to phosphosites that could cause loss of a site in a given rice variety. The data was clustered to identify groups of sites with similar patterns across rice family groups, for example those highly conserved in Japonica, but mostly absent in Aus type rice varieties - known to have different responses to drought. These resources can assist rice researchers to discover alleles with significantly different functional effects across rice varieties. The data has been loaded into UniProt Knowledge-Base - enabling researchers to visualise sites alongside other data on rice proteins e.g. structural models from AlphaFold2, PeptideAtlas and the PRIDE database - enabling visualisation of source evidence, including scores and supporting mass spectra.