AP
Anna Panchenko
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
13
(77% Open Access)
Cited by:
3,027
h-index:
49
/
i10-index:
98
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Database resources of the National Center for Biotechnology Information

Richa Agarwala et al.Nov 9, 2017
+70
J
T
R
The National Center for Biotechnology Information (NCBI) provides a large suite of online resources for biological information and data, including the GenBank® nucleic acid sequence database and the PubMed database of citations and abstracts for published life science journals. The Entrez system provides search and retrieval operations for most of these data from 39 distinct databases. The E-utilities serve as the programming interface for the Entrez system. Augmenting many of the Web applications are custom implementations of the BLAST program optimized to search specialized data sets. New resources released in the past year include PubMed Data Management, RefSeq Functional Elements, genome data download, variation services API, Magic-BLAST, QuickBLASTp, and Identical Protein Groups. Resources that were updated in the past year include the genome data viewer, a human genome resources page, Gene, virus variation, OSIRIS, and PubChem. All of these resources can be accessed through the NCBI home page at www.ncbi.nlm.nih.gov.
0
Citation1,351
0
Save
0

Database resources of the National Center for Biotechnology Information

Eric Sayers et al.Nov 21, 2010
+39
D
T
E
In addition to maintaining the GenBank® nucleic acid sequence database, the National Center for Biotechnology Information (NCBI) provides analysis and retrieval resources for the data in GenBank and other biological data made available through the NCBI Web site. NCBI resources include Entrez, the Entrez Programming Utilities, MyNCBI, PubMed, PubMed Central (PMC), Entrez Gene, the NCBI Taxonomy Browser, BLAST, BLAST Link (BLink), Primer-BLAST, COBALT, Electronic PCR, OrfFinder, Splign, ProSplign, RefSeq, UniGene, HomoloGene, ProtEST, dbMHC, dbSNP, dbVar, Epigenomics, Cancer Chromosomes, Entrez Genomes and related tools, the Map Viewer, Model Maker, Evidence Viewer, Trace Archive, Sequence Read Archive, Retroviral Genotyping Tools, HIV-1/Human Protein Interaction Database, Gene Expression Omnibus (GEO), Entrez Probe, GENSAT, Online Mendelian Inheritance in Man (OMIM), Online Mendelian Inheritance in Animals (OMIA), the Molecular Modeling Database (MMDB), the Conserved Domain Database (CDD), the Conserved Domain Architecture Retrieval Tool (CDART), IBIS, Biosystems, Peptidome, OMSSA, Protein Clusters and the PubChem suite of small molecule databases. Augmenting many of the Web applications are custom implementations of the BLAST program optimized to search specialized data sets. All of these resources can be accessed through the NCBI home page at www.ncbi.nlm.nih.gov .
0
Citation641
0
Save
0

Database resources of the National Center for Biotechnology Information

Eric Sayers et al.Dec 2, 2011
+40
D
T
E
In addition to maintaining the GenBank® nucleic acid sequence database, the National Center for Biotechnology Information (NCBI) provides analysis and retrieval resources for the data in GenBank and other biological data made available through the NCBI Website. NCBI resources include Entrez, the Entrez Programming Utilities, MyNCBI, PubMed, PubMed Central (PMC), Gene, the NCBI Taxonomy Browser, BLAST, BLAST Link (BLink), Primer-BLAST, COBALT, Splign, RefSeq, UniGene, HomoloGene, ProtEST, dbMHC, dbSNP, dbVar, Epigenomics, Genome and related tools, the Map Viewer, Model Maker, Evidence Viewer, Trace Archive, Sequence Read Archive, BioProject, BioSample, Retroviral Genotyping Tools, HIV-1/Human Protein Interaction Database, Gene Expression Omnibus (GEO), Probe, Online Mendelian Inheritance in Animals (OMIA), the Molecular Modeling Database (MMDB), the Conserved Domain Database (CDD), the Conserved Domain Architecture Retrieval Tool (CDART), Biosystems, Protein Clusters and the PubChem suite of small molecule databases. Augmenting many of the Web applications are custom implementations of the BLAST program optimized to search specialized data sets. All of these resources can be accessed through the NCBI home page at www.ncbi.nlm.nih.gov.
0
Citation519
0
Save
0

Database resources of the National Center for Biotechnology Information

Eric Sayers et al.Nov 12, 2009
+37
D
T
E
In addition to maintaining the GenBank® nucleic acid sequence database, the National Center for Biotechnology Information (NCBI) provides analysis and retrieval resources for the data in GenBank and other biological data made available through the NCBI web site. NCBI resources include Entrez, the Entrez Programming Utilities, MyNCBI, PubMed, PubMed Central, Entrez Gene, the NCBI Taxonomy Browser, BLAST, BLAST Link (BLink), Electronic PCR, OrfFinder, Spidey, Splign, Reference Sequence, UniGene, HomoloGene, ProtEST, dbMHC, dbSNP, Cancer Chromosomes, Entrez Genomes and related tools, the Map Viewer, Model Maker, Evidence Viewer, Trace Archive, Sequence Read Archive, Retroviral Genotyping Tools, HIV-1/Human Protein Interaction Database, Gene Expression Omnibus, Entrez Probe, GENSAT, Online Mendelian Inheritance in Man, Online Mendelian Inheritance in Animals, the Molecular Modeling Database, the Conserved Domain Database, the Conserved Domain Architecture Retrieval Tool, Biosystems, Peptidome, Protein Clusters and the PubChem suite of small molecule databases. Augmenting many of the web applications are custom implementations of the BLAST program optimized to search specialized data sets. All these resources can be accessed through the NCBI home page at www.ncbi.nlm.nih.gov.
0
Citation511
0
Save
17

Binding of regulatory proteins to nucleosomes is modulated by dynamic histone tails

Yunhui Peng et al.Oct 30, 2020
+2
A
S
Y
Abstract Despite histone tails’ critical roles in epigenetic regulation, little is known about mechanisms of how histone tails modulate the nucleosomal DNA solvent accessibility and recognition of nucleosomes by other macromolecules. Here we generate extensive atomic level conformational ensembles of histone tails in the context of the full human nucleosome, totaling 26 microseconds of molecular dynamics simulations. We explore the histone tail binding with the nucleosomal and linker DNA and observe rapid conformational transitions between bound and unbound states allowing us to estimate kinetic and thermodynamic properties of the histone tail-DNA interactions. Different histone types exhibit distinct, although conformationally heterogeneous, binding modes and each histone type occludes specific DNA regions from the solvent. Using a comprehensive set of experimental data on nucleosome structural complexes, we find that majority of the studied nucleosome-binding proteins and histone tails target mutually exclusive regions on nucleosomal or linker DNA around the super-helical locations ±1, ±2, and ±7. This finding is explained within the generalized competitive binding and tail displacement models of partners recruitment to nucleosomes. Finally, we demonstrate the crosstalk between different histone post-translational modifications, where charge-altering modifications and mutations typically suppress tail-DNA interactions and enhance histone tail dynamics.
17
Citation3
0
Save
23

Histone variant H2A.Z modulates nucleosome dynamics to promote DNA accessibility

Shuxiang Li et al.Aug 29, 2022
A
T
S
Abstract Nucleosomes containing the histone variant H2A.Z are important for gene transcription initiation and termination, chromosome segregation and DNA double-strand break repair, among other functions. However, the underlying mechanism of how H2A.Z influences nucleosome stability, dynamics and DNA accessibility remains elusive as experimental and computational evidence are inconclusive. Our modeling efforts of nucleosome stability and dynamics, along with comparisons with experimental data show that the incorporation of H2A.Z results in a substantial decrease of the energy barrier for DNA unwrapping. This leads to spontaneous DNA unwrapping of about forty base pairs in total, enhanced DNA accessibility, nucleosome gapping and histone plasticity, which otherwise is not observed for canonical nucleosomes. We demonstrate that both N- and C-terminal tails of H2A.Z play major roles in these events, whereas H3.3 variant exerts a negligible impact in modulating the DNA end unwrapping. In summary, our results indicate that H2A.Z deposition makes nucleosomes more mobile and DNA more accessible to transcriptional machinery and other chromatin components.
23
Citation2
0
Save
0

Are the Next-Generation Pathogenicity Predictors Applicable to Cancer?

Daria Ostroverkhova et al.May 10, 2024
A
Y
D
Abstract Next-generation pathogenicity predictors are designed to identify pathogenic mutations in genetic disorders but are increasingly used to detect driver mutations in cancer. Despite this, their suitability for cancer is not fully established. Here we have assessed the effectiveness of next-generation pathogenicity predictors when applied to cancer by using a comprehensive experimental benchmark of cancer driver and neutral mutations. Our findings indicate that state-of-the-art methods AlphaMissense and VARITY demonstrate commendable performance despite generally underperforming compared to cancer-specific methods. This is notable considering that these methods do not explicitly incorporate cancer-specific information in their training and have made concerted efforts to prevent data leakage from the human-curated training and test sets. Nevertheless, it should be mentioned that a significant limitation of using pathogenicity predictors for cancer arises from their inability to detect cancer potential driver mutations specific for a particular cancer type.
0

Are Next-Generation Pathogenicity Predictors Applicable to Cancer?

Daria Ostroverkhova et al.Jun 5, 2024
A
Y
D
Next-generation pathogenicity predictors are designed to identify pathogenic mutations in genetic disorders but are increasingly used to detect driver mutations in cancer. Despite this, their suitability for cancer is not fully established. Here we have assessed the effectiveness of next-generation pathogenicity predictors when applied to cancer by using a comprehensive experimental benchmark of cancer driver and neutral mutations. Our findings indicate that state-of-the-art methods AlphaMissense and VARITY demonstrate commendable performance despite generally underperforming compared to cancer-specific methods. This is notable considering that these methods do not explicitly incorporate cancer-specific information in their training and have made concerted efforts to prevent data leakage from the human-curated training and test sets. Nevertheless, it should be mentioned that a significant limitation of using pathogenicity predictors for cancer arises from their inability to detect cancer potential driver mutations specific for a particular cancer type.
0

Finding Driver Mutations in Cancer: Elucidating the Role of Background Mutational Processes

Minghui Li et al.Jun 22, 2018
A
A
A
M
Identifying driver mutations in cancer is notoriously difficult. To date, recurrence of a mutation in patients remains one of the most reliable markers of mutation driver status. However, some mutations are more likely to occur than others due to differences in background mutation rates arising from various forms of infidelity of DNA replication and repair machinery, endogenous, and exogenous mutagens.We calculated nucleotide and codon mutability to study the contribution of background processes in shaping the observed mutational spectrum in cancer. We developed and tested probabilistic pan-cancer and cancer-specific models that adjust the number of mutation recurrences in patients by background mutability in order to find mutations which may be under selection in cancer.We showed that mutations with higher mutability values had higher observed recurrence frequency, especially in tumor suppressor genes. This trend was prominent for nonsense and silent mutations or mutations with neutral functional impact. In oncogenes, however, highly recurring mutations were characterized by relatively low mutability, resulting in an inversed U-shaped trend. Mutations not yet observed in any tumor had relatively low mutability values, indicating that background mutability might limit mutation occurrence.We compiled a dataset of missense mutations from 58 genes with experimentally validated functional and transforming impacts from various studies. We found that mutability of driver mutations was lower than that of passengers and consequently adjusting mutation recurrence frequency by mutability significantly improved ranking of mutations and driver mutation prediction. Even though no training on existing data was involved, our approach performed similarly or better to the state-of-the-art methods.Availability Author Summary Cancer development and progression is associated with accumulation of mutations. However, only a small fraction of mutations identified in a patient is responsible for cellular transformations leading to cancer. These so-called drivers characterize molecular profiles of tumors and could be helpful in predicting clinical outcomes for the patients. One of the major problems in cancer research is prioritizing mutations. Recurrence of a mutation in patients remains one of the most reliable markers of its driver status. However, DNA damage and repair processes do not affect the genome uniformly, and some mutations are more likely to occur than others. Moreover, mutational probability (mutability) varies with the cancer type. We developed models that adjust the number of mutation recurrences in patients by cancer-type specific background mutability in order to prioritize cancer mutations. Using a comprehensive experimental dataset, we found that mutability of driver mutations was lower than that of passengers, and consequently adjusting mutation recurrence frequency by mutability significantly improved ranking of mutations and driver mutation prediction.
0

Integrated proteogenomic analysis of metastatic thoracic tumors identifies APOBEC mutagenesis and copy number alterations as drivers of proteogenomic tumor evolution and heterogeneity

Nitin Roper et al.Apr 14, 2018
+19
R
R
N
Elucidation of the proteogenomic evolution of metastatic tumors may offer insight into the poor prognosis of patients harboring metastatic disease. We performed whole-exome and transcriptome sequencing, copy number alterations (CNA) and mass spectrometry-based quantitative proteomics of 37 lung adenocarcinoma (LUAD) and thymic carcinoma (TC) metastases obtained by rapid autopsy and found evidence of patient-specific, multi-dimensional heterogeneity. Extreme mutational heterogeneity was evident in a subset of patients whose tumors showed increased APOBEC-signature mutations and expression of APOBEC3 region transcripts compared to patients with lesser mutational heterogeneity. TP53 mutation status was associated with APOBEC hypermutators in our cohort and in three independent LUAD datasets. In a thymic carcinoma patient, extreme heterogeneity and increased APOBEC3AB expression was associated with a high-risk germline APOBEC3AB variant allele. Patients with CNA occurring late in tumor evolution had corresponding changes in gene expression and protein abundance indicating genomic instability as a mechanism of downstream transcriptomic and proteomic heterogeneity between metastases. Across all tumors, proteomic heterogeneity was greater than copy number and transcriptomic heterogeneity. Enrichment of interferon pathways was evident both in the transcriptome and proteome of the tumors enriched for APOBEC mutagenesis despite a heterogeneous immune microenvironment across metastases suggesting a role for the immune microenvironment in the expression of APOBEC transcripts and generation of mutational heterogeneity. The evolving, heterogeneous nature of LUAD and TC, through APOBEC-mutagenesis and CNA illustrate the challenges facing treatment outcomes.
Load More