TO
Tomiko Oskotsky
Author with expertise in Diversity and Function of Gut Microbiome
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
6
(100% Open Access)
Cited by:
14
h-index:
14
/
i10-index:
16
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
10

Robust Harmonization of Microbiome Studies by Phylogenetic Scaffolding with MaLiAmPi

Samuel Minot et al.Jul 27, 2022
+6
A
B
S
Abstract Microbiome science is difficult to translate back to patients due to an inability to harmonize 16S rRNA gene-based microbiome data, as differences in the technique will result in different amplicon sequence variants (ASV) from the same microbe. Here we demonstrate that placement of ASV onto a common phylogenetic tree of full-length 16S rRNA alleles can harmonize microbiome studies. Using in silico data approximating 100 healthy human stool microbiomes we demonstrated that phylogenetic placement of ASV can recapitulate the true relationships between communities as compared closed-OTU based approaches (Spearman R 0.8 vs 0.2). Using real data from thousands of human gut and vaginal microbiota, we demonstrate phylogenetic placement, but not closed OTUs, were able to group communities by origin (stool vs vaginal) without being confounded by technique and integrate new data into existing ordination/clustering models for precision medicine. This enables meta-analysis of microbiome studies and the microbiome as a biomarker.
10
Citation7
0
Save
22

Sex-Specific Cross Tissue Meta-Analysis Identifies Immune Dysregulation in Women with Alzheimer’s Disease

Mekhala Paranjpe et al.Apr 25, 2020
+8
B
I
M
ABSTRACT In spite of evidence of females having a greater lifetime risk of developing Alzheimer’s Disease (AD) and greater apolipoprotein E4-related (apoE4) AD risk compared to males, molecular signatures underlying these findings remain elusive. We took a meta-analysis approach to study gene expression in the brains of 1,084 AD patients and age-matched controls and whole blood from 645 AD patients and age-matched controls. Gene-expression, network-based analysis and cell type deconvolution approaches revealed a consistent immune signature in the brain and blood of female AD patients that was absent in males. Machine learning-based classification of AD using gene expression from whole blood in addition to clinical features revealed an improvement in classification accuracy upon stratifying by sex, achieving an AUROC of 0.91 for females and 0.80 for males. These results help identify sex and apoE4 genotype-specific transcriptomic signatures of AD and underscore the importance of considering sex in the development of biomarkers and therapeutic strategies for AD.
22
Citation5
0
Save
1

Nurturing diversity and inclusion in AI in Biomedicine through a virtual summer program for high school students

Tomiko Oskotsky et al.Mar 8, 2021
+17
J
R
T
Abstract Artificial Intelligence (AI) has the power to improve our lives through a wide variety of applications, many of which fall into the healthcare space; however, a lack of diversity is contributing to flawed systems that perpetuate gender and racial biases, and limit how broadly AI can help people. The UCSF AI4ALL program was established in 2019 to address this issue by promoting diversity and inclusion in AI. The program targets high school students from underrepresented backgrounds in AI and gives them a chance to learn about AI with a focus on biomedicine. In 2020, the UCSF AI4ALL three-week program was held entirely online due to the COVID-19 pandemic. Thus students participated virtually to gain experience with AI, interact with diverse role models in AI, and learn about advancing health through AI. Specifically, they attended lectures in coding and AI, received an in-depth research experience through hands-on projects exploring COVID-19, and engaged in mentoring and personal development sessions with faculty, researchers, industry professionals, and undergraduate and graduate students, many of whom were women and from underrepresented racial and ethnic backgrounds. At the conclusion of the program, the students presented the results of their research projects at our final symposium. Comparison of pre- and post-program survey responses from students demonstrated that after the program, significantly more students were familiar with how to work with data and to evaluate and apply machine learning algorithms. There was also a nominally significant increase in the students’ knowing people in AI from historically underrepresented groups, feeling confident in discussing AI, and being aware of careers in AI. We found that we were able to engage young students in AI via our online training program and nurture greater inclusion in AI.
1
Citation1
0
Save
50

Transcriptomics-based drug repositioning pipeline identifies therapeutic candidates for COVID-19

Brian Le et al.Oct 23, 2020
+13
M
A
B
Abstract The novel SARS-CoV-2 virus emerged in December 2019 and has few effective treatments. We applied a computational drug repositioning pipeline to SARS-CoV-2 differential gene expression signatures derived from publicly available data. We utilized three independent published studies to acquire or generate lists of differentially expressed genes between control and SARS-CoV-2-infected samples. Using a rank-based pattern matching strategy based on the Kolmogorov-Smirnov Statistic, the signatures were queried against drug profiles from Connectivity Map (CMap). We validated sixteen of our top predicted hits in live SARS-CoV-2 antiviral assays in either Calu-3 or 293T-ACE2 cells. Validation experiments in human cell lines showed that 11 of the 16 compounds tested to date (including clofazimine, haloperidol and others) had measurable antiviral activity against SARS-CoV-2. These initial results are encouraging as we continue to work towards a further analysis of these predicted drugs as potential therapeutics for the treatment of COVID-19.
50
Citation1
0
Save
10

Large-scale placenta DNA methylation mega-analysis reveals fetal sex-specific differentially methylated CpG sites and regions

Shan Andrews et al.Mar 5, 2021
+2
I
K
S
Abstract Although male-female differences in placental structure and function have been observed, little is understood about their molecular underpinnings. Here, we present a mega-analysis of 14 publicly available placenta DNA methylation (DNAm) microarray datasets to identify individual CpGs and regions associated with fetal sex. In the discovery dataset of placentas from full term pregnancies (N = 532 samples), 5,212 CpGs met genome-wide significance (p < 1E-8) and were enriched in pathways such as keratinization (FDR p-value = 7.37E-14), chemokine activity (FDR p-value = 1.56E-2), and eosinophil migration (FDR p-value = 1.83E-2). Nine differentially methylated regions were identified (fwerArea < 0.1) including a region in the promoter of ZNF300 that showed consistent differential DNAm in samples from earlier timepoints in pregnancy and appeared to be driven predominately by effects in the trophoblast cell type. We describe the largest study of fetal sex differences in placenta DNAm performed to date, revealing genes and pathways characterizing sex-specific placenta function and health outcomes later in life.
13

Cross-Tissue Transcriptomic Analysis Leveraging Machine Learning Approaches Identifies New Biomarkers for Rheumatoid Arthritis

Dmitry Rychkov et al.Jul 26, 2020
+9
T
J
D
Abstract Background/Purpose There is an urgent need to identify effective biomarkers for early diagnosis of rheumatoid arthritis (RA) and to accurately monitor disease activity. Here we define an RA meta-profile using publicly available cross-tissue gene expression data and apply machine learning to identify putative biomarkers, which we further validate on independent datasets. Methods We carried out a comprehensive search for publicly available microarray gene expression data in the NCBI Gene Expression Omnibus database for whole blood and synovial tissues from RA patients and healthy controls. The raw data from 13 synovium datasets with 284 samples and 14 blood datasets with 1,885 samples were downloaded and processed. The datasets for each tissue were merged, batch corrected and split into training and test sets. We then developed and applied a robust feature selection pipeline to identify genes dysregulated in both tissues and highly associated with RA. From the training data, we identified a set of overlapping differentially expressed genes following the condition of co-directionality. The classification performance of each gene in the resulting set was evaluated on the testing sets using the area under a receiver operating characteristic curve. Five independent datasets were used to validate and threshold the feature selected (FS) genes. Finally, we defined the RA Score, composed of the geometric mean of the selected RA Score Panel genes, and demonstrated its clinical utility. Results This feature selection pipeline resulted in a set of 25 upregulated and 28 downregulated genes. To assess the robustness of these FS genes, we trained a Random Forest machine learning model with this set of 53 genes and then with the set of 33 overlapping genes differentially expressed in both tissues and tested on the validation cohorts. The model with FS genes outperformed the model with common DE genes with AUC 0.89 ± 0.04 vs 0.87 ± 0.04. The FS genes were further validated on the 5 independent datasets resulting in 10 upregulated genes, TNFAIP6 , S100A8 , TNFSF10 , DRAM1 , LY96 , QPCT , KYNU , ENTPD1 , CLIC1 , and ATP6V0E1 , which are involved in innate immune system pathways, including neutrophil degranulation and apoptosis. There were also three downregulated genes, HSP90AB1 , NCL , and CIRBP , that are involved in metabolic processes and T-cell receptor regulation of apoptosis. To investigate the clinical utility of the 13 validated genes, the RA Score was developed and found to be highly correlated with the disease activity score based on the 28 examined joints (DAS28) (r = 0.33 ± 0.03, p = 7e-9) and able to distinguish osteoarthritis (OA) from RA samples (OR 0.57, 95% CI [0.34, 0.80], p = 8e-10). Moreover, the RA Score was not significantly different for rheumatoid factor (RF) positive and RF-negative RA sub-phenotypes (p = 0.9) and also distinguished polyarticular juvenile idiopathic arthritis (polyJIA) from healthy individuals in 10 independent pediatric cohorts (OR 1.15, 95% CI [1.01, 1.3], p = 2e-4) suggesting the generalizability of this score in clinical applications. The RA Score was also able to monitor the treatment effect among RA patients (t-test of treated vs untreated, p = 2e-4). Finally, we performed immunoblotting analysis of 6 proteins in unstimulated PBMC lysates from an independent cohort of 8 newly diagnosed RA patients and 7 healthy controls, where two proteins, TNFAIP6/TSG6 and HSP90AB1/HSP90 , were validated and the S100A8 protein showed near significant up-regulation. Conclusion The RA Score, consisting of 13 putative biomarkers identified through a robust feature selection procedure on public data and validated using multiple independent data sets, could be useful in the diagnosis and treatment monitoring of RA.