SA
Shadab Ahmad
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
4
(75% Open Access)
Cited by:
9,262
h-index:
13
/
i10-index:
16
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

UniProt: the universal protein knowledgebase in 2021

Alex Bateman et al.Nov 2, 2020
The aim of the UniProt Knowledgebase is to provide users with a comprehensive, high-quality and freely accessible set of protein sequences annotated with functional information. In this article, we describe significant updates that we have made over the last two years to the resource. The number of sequences in UniProtKB has risen to approximately 190 million, despite continued work to reduce sequence redundancy at the proteome level. We have adopted new methods of assessing proteome completeness and quality. We continue to extract detailed annotations from the literature to add to reviewed entries and supplement these in unreviewed entries with annotations provided by automated systems such as the newly implemented Association-Rule-Based Annotator (ARBA). We have developed a credit-based publication submission interface to allow the community to contribute publications and annotations to UniProt entries. We describe how UniProtKB responded to the COVID-19 pandemic through expert curation of relevant entries that were rapidly made available to the research community through a dedicated portal. UniProt resources are available under a CC-BY (4.0) license via the web at https://www.uniprot.org/.
0
Citation5,752
0
Save
0

UniProt: the Universal Protein Knowledgebase in 2023

Alex Bateman et al.Nov 21, 2022
Abstract The aim of the UniProt Knowledgebase is to provide users with a comprehensive, high-quality and freely accessible set of protein sequences annotated with functional information. In this publication we describe enhancements made to our data processing pipeline and to our website to adapt to an ever-increasing information content. The number of sequences in UniProtKB has risen to over 227 million and we are working towards including a reference proteome for each taxonomic group. We continue to extract detailed annotations from the literature to update or create reviewed entries, while unreviewed entries are supplemented with annotations provided by automated systems using a variety of machine-learning techniques. In addition, the scientific community continues their contributions of publications and annotations to UniProt entries of their interest. Finally, we describe our new website (https://www.uniprot.org/), designed to enhance our users’ experience and make our data easily accessible to the research community. This interface includes access to AlphaFold structures for more than 85% of all entries as well as improved visualisations for subcellular localisation of proteins.
0
Citation3,510
0
Save
1

Non-invasive Analysis of Peptidoglycan from Living Animals

Karl Ocius et al.Jul 21, 2023
Abstract The role of the intestinal microbiota in host health is increasingly revealed in its contributions to disease states. The host-microbiome interaction is multifactorial and dynamic. One of the factors that has recently been strongly associated with host physiological responses is peptidoglycan from bacterial cell walls. Peptidoglycan from gut commensal bacteria activate peptidoglycan sensors in human cells, including the Nucleotide-binding oligomerization domain containing protein 2 (NOD2). When present in the gastrointestinal tract, both the polymeric form (sacculi) and de-polymerized fragments can modulate host physiology, including checkpoint anticancer therapy efficacy, body temperature and appetite, and postnatal growth. To leverage this growing area of biology towards therapeutic prescriptions, it will be critical to directly analyze a key feature of the host-microbiome interaction from living hosts in a reproducible and non-invasive way. Here we show that metabolically labeled peptidoglycan/sacculi can be readily isolated from fecal samples collected from both mice and humans. Analysis of fecal samples provided a non-invasive route to probe the gut commensal community including the metabolic synchronicity with the host circadian clock. Together, these results pave the way for non-invasive diagnostic tools to interrogate the causal nature of peptidoglycan in host health and disease.
0

Bolt: A new age peptide search engine for comprehensive MS/MS sequencing through vast protein databases in minutes.

Amol Prakash et al.Feb 18, 2019
The standard platform for proteomics experiments today is mass spectrometry, particularly for samples derived from complex matrices. Recent increases in mass spectrometry sequencing speed, sensitivity and resolution now permit comprehensive coverage of even the most precious and limited samples, particularly when coupled with improvements in protein extraction techniques and chromatographic separation. However, the results obtained from laborious sample extraction and expensive instrumentation are often hindered by a sub optimal data processing pipelines. One critical data processing piece is peptide sequencing which is most commonly done through database search engines. In almost all MS/MS search engines users must limit their search space due to time constraints and q-value considerations. In nearly all experiments, the search is limited to a canonical database that typically does not reflect the individual genetic variations of the organism being studied. Searching for posttranslational modifications can exponentially increase the search space thus careful consideration must be used during the selection process. In addition, engines will nearly always assume the presence of only fully tryptic peptides. Despite these stringent parameters, proteomic data searches may take hours or even days to complete and opening even one of these criteria to more realistic biological settings will lead to detrimental increases in search time on expensive and custom data processing towers. Even on high performance servers, these search engines are computationally expensive, and most users decide to dial back their search parameters. We present Bolt, a new search engine that can search more than nine hundred thousand protein sequences (canonical, isoform, mutations, and contaminants) with 31 post translation modifications and N-terminal and C-terminal partial tryptic search in a matter of minutes on a standard configuration laptop. Along with increases in speed, Bolt provides an additional benefit of improvement in high confidence identifications, as demonstrated by manual validation of unique peptides identified by Bolt that were missed with parallel searching using standard engines. When in disagreement, 67% of peptides identified by Bolt may be manually validated by strong fragmentation patterns, compared to 14% of peptides uniquely identified by SEQUEST. Bolt represents, to the best of our knowledge, the first fully scalable, cloud based quantitative proteomic solution that can be operated within a user-friendly GUI interface. Data are available via ProteomeXchange with identifier PXD012700.