QL
Qingliang Li
Author with expertise in Computational Methods in Drug Discovery
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
7
(100% Open Access)
Cited by:
6,892
h-index:
23
/
i10-index:
27
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The Small β-barrel Domain: A Survey-based Structural Analysis

Philippe Youkharibache et al.May 22, 2017
0. Abstract The small β-barrel is an ancient protein structural domain characterized by extremes: It features an extremely broad range of structural varieties, a deeply intricate evolutionary history, and it is associated with a bewildering array of biomolecular pathways and physiological functions. These and related features of this domain are described and analyzed herein. Specifically, we present a comprehensive, survey-based analysis of the structural properties of small β-barrels (SBBs). We first consider the defining characteristics of the SBB fold, as well as the various systems of nomenclature used to describe it. In order to begin elucidating how such vast functional diversity is achieved by a relatively simple protein domain, we then explore the anatomy of the SBB fold and some of its representative structural variants. Many types of SBB proteins assemble into cyclic oligomers that act as the biologically-functional entity. These oligomers exhibit a great deal of plasticity even at the quaternary structural level—including homomeric and heteromeric assemblies, rings of variable subunit stoichiometries (pentamer, hexamer, etc.), as well as higher-order oligomers (e.g., double-rings) and fibrillar polymers. We conclude with three themes that emerge from the SBB’s unique structure↔function versatility.
0
Paper
Citation3
0
Save
0

PubChem 2025 update

Sunghwan Kim et al.Nov 18, 2024
Abstract PubChem (https://pubchem.ncbi.nlm.nih.gov) is a large and highly-integrated public chemical database resource at NIH. In the past two years, significant updates were made to PubChem. With additions from over 130 new sources, PubChem contains &gt;1000 data sources, 119 million compounds, 322 million substances and 295 million bioactivities. New interfaces, such as the consolidated literature panel and the patent knowledge panel, were developed. The consolidated literature panel combines all references about a compound into a single list, allowing users to easily find, sort, and export all relevant articles for a chemical in one place. The patent knowledge panels for a given query chemical or gene display chemicals, genes, and diseases co-mentioned with the query in patent documents, helping users to explore relationships between co-occurring entities within patent documents. PubChemRDF was expanded to include the co-occurrence data underlying the literature knowledge panel, enabling users to exploit semantic web technologies to explore entity relationships based on the co-occurrences in the scientific literature. The usability and accessibility of information on chemicals with non-discrete structures (e.g. biologics, minerals, polymers, UVCBs and glycans) were greatly improved with dedicated web pages that provide a comprehensive view of all available information in PubChem for these chemicals.
0

PubChem synonym filtering process using crowdsourcing

Sunghwan Kim et al.Jun 16, 2024
Abstract PubChem ( https://pubchem.ncbi.nlm.nih.gov ) is a public chemical information resource containing more than 100 million unique chemical structures. One of the most requested tasks in PubChem and other chemical databases is to search chemicals by name (also commonly called a “chemical synonym”). PubChem performs this task by looking up chemical synonym-structure associations provided by individual depositors to PubChem. In addition, these synonyms are used for many purposes, including creating links between chemicals and PubMed articles (using Medical Subject Headings (MeSH) terms). However, these depositor-provided name-structure associations are subject to substantial discrepancies within and between depositors, making it difficult to unambiguously map a chemical name to a specific chemical structure. The present paper describes PubChem’s crowdsourcing-based synonym filtering strategy, which resolves inter- and intra-depositor discrepancies in synonym-structure associations as well as in the chemical-MeSH associations. The PubChem synonym filtering process was developed based on the analysis of four crowd-voting strategies, which differ in the consistency threshold value employed (60% vs 70%) and how to resolve intra-depositor discrepancies (a single vote vs. multiple votes per depositor) prior to inter-depositor crowd-voting. The agreement of voting was determined at six levels of chemical equivalency, which considers varying isotopic composition, stereochemistry, and connectivity of chemical structures and their primary components. While all four strategies showed comparable results, Strategy I (one vote per depositor with a 60% consistency threshold) resulted in the most synonyms assigned to a single chemical structure as well as the most synonym-structure associations disambiguated at the six chemical equivalency contexts. Based on the results of this study, Strategy I was implemented in PubChem’s filtering process that cleans up synonym-structure associations as well as chemical-MeSH associations. This consistency-based filtering process is designed to look for a consensus in name-structure associations but cannot attest to their correctness. As a result, it can fail to recognize correct name-structure associations (or incorrect ones), for example, when a synonym is provided by only one depositor or when many contributors are incorrect. However, this filtering process is an important starting point for quality control in name-structure associations in large chemical databases like PubChem.