RT
Rahil Taujale
Author with expertise in RNA Sequencing Data Analysis
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
7
(86% Open Access)
Cited by:
14
h-index:
12
/
i10-index:
14
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

A resource for exploring the understudied human kinome for research and therapeutic opportunities

Nienke Moret et al.Apr 2, 2020
+9
B
C
N
ABSTRACT The functions of protein kinases have been widely studied and over 60 kinase inhibitors are FDA-approved drugs. Membership in the human kinome is nonetheless subject to multiple overlapping and inconsistent definitions and is unevenly studied, complicating functional genomics and chemical genetics. We describe objective criteria for refining the definition of the human kinome to comprise an extended set of 710 kinase domains and a more narrowly curated set of 557 protein kinase like (PKL) domains. An online tool ( www.kinome.org ) makes it possible to sort these sets on multiple structural and functional criteria. Focusing on the least studied one-third of the kinome we find that many proteins are differentially expressed, essential in multiple cell lines, and mutated in the Cancer Genome Atlas. We show that some understudied kinases are high affinity off-targets of clinical-grade compounds and approved drugs and we describe an optimized small molecule library making use of this information for selective kinome perturbation. We conclude that the understudied kinome contains physiologically important proteins, including possible targets for future drug discovery campaigns.
0
Citation12
0
Save
1

An explainable unsupervised framework for alignment-free protein classification using sequence embeddings

Wayland Yeung et al.Feb 10, 2022
+6
L
Z
W
ABSTRACT Protein classification is a cornerstone of biology that relies heavily on alignment-based comparison of primary sequences. However, the systematic classification of large protein superfamilies is impeded by unique challenges in aligning divergent sequence datasets. We developed an alignment-free approach for sequence analysis and classification using embedding vectors generated from pre-trained protein language models that capture underlying protein structural-functional properties from unsupervised training on millions of biologically-observed sequences. We constructed embedding-based trees (with branch support) which depict hierarchical clustering of protein sequences and infer fast/slow evolving sites through interpretable sequence projections. Applied towards diverse protein superfamilies, embedding tree infers Casein Kinase 1 (CK1) as the basal protein kinase clade, identifies convergent functional motifs shared between divergent phosphatase folds, and infers evolutionary relationships between diverse radical S-Adenosyl-L-Methionine (SAM) enzyme families. Overall results indicate that embedding trees effectively capture global data structures, functioning as a general unsupervised approach for visualizing high-dimensional manifolds.
1
Citation1
0
Save
0

Multi-omics reveals new links between Fructosamine-3-Kinase (FN3K) and core metabolic pathways

Safal Shrestha et al.Jun 3, 2024
N
S
R
S
Abstract Fructosamine-3-kinases (FN3Ks) are a conserved family of repair enzymes that phosphorylate reactive sugars attached to lysine residues in peptides and proteins. Although FN3Ks are present across the Tree of Life and share detectable sequence similarity to eukaryotic protein kinases, the biological processes regulated by these kinases are largely unknown. To address this knowledge gap, we leveraged the FN3K CRISPR Knock-Out (KO) HepG2 cell line alongside an integrative multi-omics study combining transcriptomics, metabolomics, and interactomics to place these enzymes in a pathway context. The integrative analyses revealed the enrichment of pathways related to oxidative stress response, lipid biosynthesis (cholesterol and fatty acids), and carbon and co-factor metabolism. Moreover, enrichment of nicotinamide adenine dinucleotide (NAD) binding proteins and localization of human FN3K (HsFN3K) to mitochondria suggests potential links between FN3K and NAD-mediated energy metabolism and redox balance. We report specific binding of HsFN3K to NAD compounds in a metal and concentration-dependent manner and provide insight into their binding mode using modeling and experimental site-directed mutagenesis. Our studies provide a framework for targeting these understudied kinases in diabetic complications and metabolic disorders where redox balance and NAD-dependent metabolic processes are altered.
0
Citation1
0
Save
1

Evolution of functional diversity in the holozoan tyrosine kinome

Wayland Yeung et al.Aug 4, 2021
+3
R
A
W
Abstract The emergence of multicellularity is strongly correlated with the expansion of tyrosine kinases, a conserved family of signaling enzymes that regulates pathways essential for cell-to-cell communication. Although tyrosine kinases have been classified from several model organisms, a molecular-level understanding of tyrosine kinase evolution across all holozoans is currently lacking. Using a hierarchical sequence constraint-based classification of diverse holozoan tyrosine kinases, we construct a new phylogenetic tree that identifies two ancient clades of cytoplasmic and receptor tyrosine kinases separated by the presence of an extended insert segment in the kinase domain connecting the D and E helices. Present in nearly all receptor tyrosine kinases, this fast-evolving insertion imparts diverse functionalities such as post-translational modification sites and regulatory interactions. Eph and EGFR receptor tyrosine kinases are two exceptions which lack this insert, each forming an independent lineage characterized by unique functional features. We also identify common constraints shared across multiple tyrosine kinase families which warrant the designation of three new subgroups: Src Module (SrcM), Insulin Receptor Kinase-Like (IRKL), and Fibroblast, Platelet-derived, Vascular, and growth factor Receptors (FPVR). Subgroup-specific constraints reflect shared autoinhibitory interactions involved in kinase conformational regulation. Conservation analyses describe how diverse tyrosine kinase signaling functions arose through the addition of family-specific motifs upon subgroup-specific features and co-evolving protein domains. We propose the oldest tyrosine kinases, IRKL, SrcM, and Csk, originated from unicellular pre-metazoans and were co-opted for complex multicellular functions. The increased frequency of oncogenic variants in more recent tyrosine kinases suggests that lineage-specific functionalities are selectively altered in human cancers.
0

Deep evolutionary analysis reveals the design principles of fold A glycosyltransferases

Rahil Taujale et al.Dec 31, 2019
+5
L
A
R
Glycosyltransferases (GTs) are prevalent across the tree of life and regulate nearly all aspects of cellular functions by catalyzing synthesis of glycosidic linkages between diverse donor and acceptor substrates. Despite the availability of GT sequences from diverse organisms, the evolutionary basis for their complex and diverse modes of catalytic and regulatory functions remain enigmatic. Here, based on deep mining of over half a million GT-A fold sequences from diverse organisms, we define a minimal core component shared among functionally diverse enzymes. We find that variations in the common core and the emergence of hypervariable loops extending from the core contributed to the evolution of catalytic and functional diversity. We provide a phylogenetic framework relating diverse GT-A fold families for the first time and show that inverting and retaining mechanisms emerged multiple times independently during the course of evolution. We identify conserved modes of donor and acceptor recognition in evolutionarily divergent families and pinpoint the sequence and structural features for functional specialization. Using the evolutionary information encoded in primary sequences, we trained a machine learning classifier to predict donor specificity with nearly 88% accuracy and deployed it for the annotation of understudied GTs in five model organisms. Our studies provide an evolutionary framework for investigating the complex relationships connecting GT-A fold sequence, structure, function and regulation.
1

KinOrtho: a method for mapping human kinase orthologs across the tree of life and illuminating understudied kinases

Liang‐Chin Huang et al.Mar 5, 2021
+5
N
R
L
Abstract Protein kinases are among the largest druggable family of signaling proteins, involved in various human diseases, including cancers and neurodegenerative disorders. Despite their clinical relevance, nearly 30% of the 545 human protein kinases remain highly understudied. Comparative genomics is a powerful approach for predicting and investigating the functions of understudied kinases. However, an incomplete knowledge of kinase orthologs across fully sequenced kinomes severely limits the application of comparative approaches for illuminating understudied kinases. Here, we propose KinOrtho, a query- and graph-based orthology inference method that combines full-length and domain-based approaches to map one-to-one kinase orthologs across 17 thousand species. Using multiple metrics, we show that KinOrtho performed better than existing methods in identifying kinase orthologs across evolutionarily divergent species and eliminated potential false positives by flagging sequences without a proper kinase domain for further evaluation. We demonstrate the advantage of using domain-based approaches for identifying domain fusion events, highlighting a case between an understudied serine/threonine kinase TAOK1 and a metabolic kinase PIK3C2A with high co-expression in human cells. We also identify evolutionary fission events involving the understudied OBSCN kinase domains, further highlighting the value of domain-based orthology inference approaches. Using KinOrtho-defined orthologs, Gene Ontology annotations, and machine learning, we propose putative biological functions of several understudied kinases, including the role of TP53RK in cell cycle checkpoint(s), the involvement of TSSK3 and TSSK6 in acrosomal vesicle localization, and potential functions for the ULK4 pseudokinase in neuronal development. The well-curated kinome ortholog set can serve as a valuable resource for illuminating understudied kinases, and the KinOrtho framework can be extended to any gene-family of interest.
5

Mapping the glycosyltransferase fold landscape using deep learning

Rahil Taujale et al.Jul 6, 2021
+3
S
Z
R
Abstract Glycosyltransferases (GTs) play fundamental roles in nearly all cellular processes through the biosynthesis of complex carbohydrates and glycosylation of diverse protein and small molecule substrates. The extensive structural and functional diversification of GTs presents a major challenge in mapping the relationships connecting sequence, structure, fold and function using traditional bioinformatics approaches. Here, we present a convolutional neural network with attention (CNN-attention) based deep learning model that leverages simple secondary structure representations generated from primary sequences to provide GT fold prediction with high accuracy. The model learned distinguishing features free of primary sequence alignment constraints and, unlike other models, is highly interpretable and helped identify common secondary structural features shared by divergent families. The model delineated sequence and structural features characteristic of individual fold types, while classifying them into distinct clusters that group evolutionarily divergent families based on shared secondary structural features. We further extend our model to classify GT families of unknown folds and variants of known folds. By identifying families that are likely to adopt novel folds such as GT91, GT96 and GT97, our studies identify targets for future structural studies and expand the GT fold landscape.