NK
Natarajan Kannan
Author with expertise in Analysis of Gene Interaction Networks
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
24
(67% Open Access)
Cited by:
920
h-index:
42
/
i10-index:
86
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The Sorcerer II Global Ocean Sampling Expedition: Expanding the Universe of Protein Families

Shibu Yooseph et al.Mar 8, 2007
+30
D
D
S
Metagenomics projects based on shotgun sequencing of populations of micro-organisms yield insight into protein families. We used sequence similarity clustering to explore proteins with a comprehensive dataset consisting of sequences from available databases together with 6.12 million proteins predicted from an assembly of 7.7 million Global Ocean Sampling (GOS) sequences. The GOS dataset covers nearly all known prokaryotic protein families. A total of 3,995 medium- and large-sized clusters consisting of only GOS sequences are identified, out of which 1,700 have no detectable homology to known families. The GOS-only clusters contain a higher than expected proportion of sequences of viral origin, thus reflecting a poor sampling of viral diversity until now. Protein domain distributions in the GOS dataset and current protein databases show distinct biases. Several protein domains that were previously categorized as kingdom specific are shown to have GOS examples in other kingdoms. About 6,000 sequences (ORFans) from the literature that heretofore lacked similarity to known proteins have matches in the GOS data. The GOS dataset is also used to improve remote homology detection. Overall, besides nearly doubling the number of current proteins, the predicted GOS proteins also add a great deal of diversity to known protein families and shed light on their evolution. These observations are illustrated using several protein families, including phosphatases, proteases, ultraviolet-irradiation DNA damage repair enzymes, glutamine synthetase, and RuBisCO. The diversity added by GOS data has implications for choosing targets for experimental structure characterization as part of structural genomics efforts. Our analysis indicates that new families are being discovered at a rate that is linear or almost linear with the addition of new sequences, implying that we are still far from discovering all protein families in nature.
0
Citation900
0
Save
0

A resource for exploring the understudied human kinome for research and therapeutic opportunities

Nienke Moret et al.Apr 2, 2020
+9
B
C
N
ABSTRACT The functions of protein kinases have been widely studied and over 60 kinase inhibitors are FDA-approved drugs. Membership in the human kinome is nonetheless subject to multiple overlapping and inconsistent definitions and is unevenly studied, complicating functional genomics and chemical genetics. We describe objective criteria for refining the definition of the human kinome to comprise an extended set of 710 kinase domains and a more narrowly curated set of 557 protein kinase like (PKL) domains. An online tool ( www.kinome.org ) makes it possible to sort these sets on multiple structural and functional criteria. Focusing on the least studied one-third of the kinome we find that many proteins are differentially expressed, essential in multiple cell lines, and mutated in the Cancer Genome Atlas. We show that some understudied kinases are high affinity off-targets of clinical-grade compounds and approved drugs and we describe an optimized small molecule library making use of this information for selective kinome perturbation. We conclude that the understudied kinome contains physiologically important proteins, including possible targets for future drug discovery campaigns.
0
Citation12
0
Save
16

Dark kinase annotation, mining and visualization using the Protein Kinase Ontology

Saber Soleymani et al.Mar 1, 2022
+5
L
N
S
ABSTRACT The Protein Kinase Ontology (ProKinO) is an integrated knowledge graph that conceptualizes the complex relationships connecting protein kinase sequence, structure, function, and disease in a human and machine-readable format. Here we extend the scope of ProKinO as a discovery tool by including new classes and relationships capturing information on kinase ligand binding sites, expression patterns, and functional features, and demonstrate its application in uncovering new knowledge regarding understudied members of the protein kinase family. Specifically, through graph mining and aggregate SPARQL queries, we identify the p21-activated protein kinase 5 (PAK5) as one of the most frequently mutated dark kinase in human cancers with abnormal expression in multiple cancers, including an unappreciated role in acute myeloid leukemia. We identify recurrent oncogenic mutations in the PAK5 activation loop predicted to alter substrate binding and phosphorylation and identify common ligand/drug binding residues in PAK family kinases, highlighting the potential application of ProKinO in drug discovery. The updated ontology browser and a web component, ProtVista, which allows interactive mining of kinase sequence annotations in 3D structures and Alphafold models, provide a valuable resource for the signaling community. The updated ProKinO database is accessible at http://prokino.uga.edu/browser/ .
16
Citation5
0
Save
0

Multi-omics reveals new links between Fructosamine-3-Kinase (FN3K) and core metabolic pathways

Safal Shrestha et al.Jun 3, 2024
N
S
R
S
Abstract Fructosamine-3-kinases (FN3Ks) are a conserved family of repair enzymes that phosphorylate reactive sugars attached to lysine residues in peptides and proteins. Although FN3Ks are present across the Tree of Life and share detectable sequence similarity to eukaryotic protein kinases, the biological processes regulated by these kinases are largely unknown. To address this knowledge gap, we leveraged the FN3K CRISPR Knock-Out (KO) HepG2 cell line alongside an integrative multi-omics study combining transcriptomics, metabolomics, and interactomics to place these enzymes in a pathway context. The integrative analyses revealed the enrichment of pathways related to oxidative stress response, lipid biosynthesis (cholesterol and fatty acids), and carbon and co-factor metabolism. Moreover, enrichment of nicotinamide adenine dinucleotide (NAD) binding proteins and localization of human FN3K (HsFN3K) to mitochondria suggests potential links between FN3K and NAD-mediated energy metabolism and redox balance. We report specific binding of HsFN3K to NAD compounds in a metal and concentration-dependent manner and provide insight into their binding mode using modeling and experimental site-directed mutagenesis. Our studies provide a framework for targeting these understudied kinases in diabetic complications and metabolic disorders where redox balance and NAD-dependent metabolic processes are altered.
0
Citation1
0
Save
7

Nucleotide binding, evolutionary insights and interaction partners of the pseudokinase Unc-51-like kinase 4

Franziska Preuß et al.Jun 19, 2020
+7
S
D
F
Abstract Unc-51-like kinase 4 (ULK4) is a pseudokinase that has been linked to the development of several diseases. Even though sequence motifs required for ATP binding in kinases are lacking, ULK4 still tightly binds ATP and the presence of the cofactor is required for structural stability of ULK4. Here we present a high-resolution structure of a ULK4-ATPγS complex revealing a highly unusual ATP binding mode in which the lack of the canonical VAIK motif lysine is compensated by K39, located N-terminal to αC. Evolutionary analysis suggests that degradation of active site motifs in metazoan ULK4 has co-occurred with an ULK4 specific activation loop, which stabilizes the C-helix. In addition, cellular interaction studies using BioID and biochemical validation data revealed high confidence interactors of the pseudokinase and armadillo repeat domains. Many of the identified ULK4 interaction partners were centrosomal and tubulin associated proteins and several active kinases suggesting new roles for ULK4. Highlights Structure of the ULK4 ATP complex reveals a unique ATP binding mode. Disease associated mutations modulate ATP binding and ULK4 stability Degradation of active site motifs co-occurred in evolution with an ULK4 specific activation loop BioID suggests a role of ULK4 regulating centrosomal and cytoskeletal functions
7
Citation1
0
Save
1

An explainable unsupervised framework for alignment-free protein classification using sequence embeddings

Wayland Yeung et al.Feb 10, 2022
+6
L
Z
W
ABSTRACT Protein classification is a cornerstone of biology that relies heavily on alignment-based comparison of primary sequences. However, the systematic classification of large protein superfamilies is impeded by unique challenges in aligning divergent sequence datasets. We developed an alignment-free approach for sequence analysis and classification using embedding vectors generated from pre-trained protein language models that capture underlying protein structural-functional properties from unsupervised training on millions of biologically-observed sequences. We constructed embedding-based trees (with branch support) which depict hierarchical clustering of protein sequences and infer fast/slow evolving sites through interpretable sequence projections. Applied towards diverse protein superfamilies, embedding tree infers Casein Kinase 1 (CK1) as the basal protein kinase clade, identifies convergent functional motifs shared between divergent phosphatase folds, and infers evolutionary relationships between diverse radical S-Adenosyl-L-Methionine (SAM) enzyme families. Overall results indicate that embedding trees effectively capture global data structures, functioning as a general unsupervised approach for visualizing high-dimensional manifolds.
1
Citation1
0
Save
0

Quantitative Structure-Mutation-Activity Relationship Tests (QSMART) Model for Protein Kinase Inhibitor Response Prediction

Liang‐Chin Huang et al.Dec 8, 2019
+6
W
P
L
Predicting drug sensitivity profiles from genotypes is a major challenge in personalized medicine. Machine learning and deep neural network methods have shown promise in addressing this challenge, but the “black-box” nature of these methods precludes a mechanistic understanding of how and which genomic and proteomic features contribute to the observed drug sensitivity profiles. Here we provide a combination of statistical and neural network framework that not only estimates drug IC50 in cancer cell lines with high accuracy (R2 = 0.861 and RMSE = 0.818) but also identifies features contributing to the accuracy, thereby enhancing explainability. Our framework, termed QSMART, uses a multi-component approach that includes (1) collecting drug fingerprints, cancer cell line’s multi-omics features, and drug responses, (2) testing the statistical significance of interaction terms, (3) selecting features by Lasso with Bayesian information criterion, and (4) using neural networks to predict drug response. We evaluate the contribution of each of these components and use a case study to explain the biological relevance of several selected features to protein kinase inhibitor response in non-small cell lung cancer cells. Specifically, we illustrate how interaction terms that capture associations between drugs and mutant kinases quantitatively contribute to the response of two EGFR inhibitors (afatinib and lapatinib) in non-small cell lung cancer cells. Although we have tested QSMART on protein kinase inhibitors, it can be extended across the proteome to investigate the complex relationships connecting genotypes and drug sensitivity profiles.
0

Deep evolutionary analysis reveals the design principles of fold A glycosyltransferases

Rahil Taujale et al.Dec 31, 2019
+5
L
A
R
Glycosyltransferases (GTs) are prevalent across the tree of life and regulate nearly all aspects of cellular functions by catalyzing synthesis of glycosidic linkages between diverse donor and acceptor substrates. Despite the availability of GT sequences from diverse organisms, the evolutionary basis for their complex and diverse modes of catalytic and regulatory functions remain enigmatic. Here, based on deep mining of over half a million GT-A fold sequences from diverse organisms, we define a minimal core component shared among functionally diverse enzymes. We find that variations in the common core and the emergence of hypervariable loops extending from the core contributed to the evolution of catalytic and functional diversity. We provide a phylogenetic framework relating diverse GT-A fold families for the first time and show that inverting and retaining mechanisms emerged multiple times independently during the course of evolution. We identify conserved modes of donor and acceptor recognition in evolutionarily divergent families and pinpoint the sequence and structural features for functional specialization. Using the evolutionary information encoded in primary sequences, we trained a machine learning classifier to predict donor specificity with nearly 88% accuracy and deployed it for the annotation of understudied GTs in five model organisms. Our studies provide an evolutionary framework for investigating the complex relationships connecting GT-A fold sequence, structure, function and regulation.
0

Extensive non-canonical phosphorylation in human cells revealed using strong-anion exchange-mediated phosphoproteomics

Gemma Hardman et al.Oct 13, 2017
+5
Z
S
G
Protein phosphorylation is a ubiquitous post-translational modification (PTM) that regulates all aspects of life. To date, investigation of human cell signalling has focussed on canonical phosphorylation of serine (Ser), threonine (Thr) and tyrosine (Tyr) residues. However, mounting evidence suggests that phosphorylation of histidine also plays a central role in regulating cell biology. Phosphoproteomics workflows rely on acidic conditions for phosphopeptide enrichment, which are incompatible with the analysis of acid-labile phosphorylation such as histidine. Consequently, the extent of non-canonical phosphorylation is likely to be under-estimated. We report an Unbiased Phosphopeptide enrichment strategy based on Strong Anion Exchange (SAX) chromatography (UPAX), which permits enrichment of acid-labile phosphopeptides for characterisation by mass spectrometry. Using this approach, we identify extensive and positional phosphorylation patterns on histidine, arginine, lysine, aspartate and glutamate in human cell extracts, including 310 phosphohistidine and >1000 phospholysine sites of protein modification. Remarkably, the extent of phosphorylation on individual non-canonical residues vastly exceeds that of basal phosphotyrosine. Our study reveals the previously unappreciated diversity of protein phosphorylation in human cells, and opens up avenues for exploring roles of acid-labile phosphorylation in any proteome using mass spectrometry.
1

Evolutionary and cellular analysis of the dark pseudokinase PSKH2

Dominic Byrne et al.Sep 10, 2022
+4
L
S
D
Abstract Pseudokinases, so named because they lack one or more conserved canonical amino acids that define their catalytically-active relatives, have evolved a variety of biological functions in both prokaryotic and eukaryotic organisms. Human PSKH2 is closely related to the canonical kinase PSKH1, which maps to the CAMK family of protein kinases. Primates encode PSKH2 in the form of a pseudokinase, which is predicted to be catalytically inactive due to loss of the invariant catalytic Asp residue. Although the biological role(s) of vertebrate PSKH2’s remains unclear, we previously identified species-level adaptions in PSKH2 that have led to the appearance of kinase or pseudokinase variants in vertebrate genomes alongside a canonical PSKH1 paralog. In this paper we confirm that, as predicted, PSKH2 lacks detectable protein phosphotransferase activity, and exploit structural informatics, biochemistry and cellular proteomics to begin to characterise vertebrate PSKH2 orthologues. AlphaFold 2-based structural analysis predicts functional roles for both the PSKH2 N- and C-regions that flank the pseudokinase domain core, and cellular truncation analysis confirms that the N-terminal domain, which contains a conserved myristoylation site, is required for both stable human PSKH2 expression and localisation to a membrane-rich subcellular fraction containing mitochondrial proteins. Using mass spectrometry-based proteomics, we confirm that human PSKH2 is part of a cellular mitochondrial protein network, and that its expression is regulated through client-status within the HSP90/Cdc37 molecular chaperone system. HSP90 interactions are mediated through binding to the PSKH2 C-terminal tail, leading us to predict that this region might act as both a cis and trans regulatory element, driving outputs linked to the PSKH2 pseudokinase domain that are important for functional signalling.
Load More