HI
Hirotaka Iwaki
Author with expertise in Pathophysiology of Parkinson's Disease
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
19
(68% Open Access)
Cited by:
425
h-index:
27
/
i10-index:
55
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Parkinson's disease age at onset genome‐wide association study: Defining heritability, genetic loci, and α‐synuclein mechanisms

Cornelis Blauwendraat et al.Apr 7, 2019
Abstract Background Increasing evidence supports an extensive and complex genetic contribution to PD. Previous genome‐wide association studies (GWAS) have shed light on the genetic basis of risk for this disease. However, the genetic determinants of PD age at onset are largely unknown. Objectives To identify the genetic determinants of PD age at onset. Methods Using genetic data of 28,568 PD cases, we performed a genome‐wide association study based on PD age at onset. Results We estimated that the heritability of PD age at onset attributed to common genetic variation was ∼0.11, lower than the overall heritability of risk for PD (∼0.27), likely, in part, because of the subjective nature of this measure. We found two genome‐wide significant association signals, one at SNCA and the other a protein‐coding variant in TMEM175 , both of which are known PD risk loci and a Bonferroni‐corrected significant effect at other known PD risk loci, GBA , INPP5F/BAG3, FAM47E/SCARB2 , and MCCC1 . Notably, SNCA, TMEM175, SCARB2, BAG3 , and GBA have all been shown to be implicated in α‐synuclein aggregation pathways. Remarkably, other well‐established PD risk loci, such as GCH1 and MAPT , did not show a significant effect on age at onset of PD. Conclusions Overall, we have performed the largest age at onset of PD genome‐wide association studies to date, and our results show that not all PD risk loci influence age at onset with significant differences between risk alleles for age at onset. This provides a compelling picture, both within the context of functional characterization of disease‐linked genetic variability and in defining differences between risk alleles for age at onset, or frank risk for disease. © 2019 International Parkinson and Movement Disorder Society
0
Citation287
0
Save
17

Multi-Modality Machine Learning Predicting Parkinson’s Disease

Mary Makarious et al.Mar 7, 2021
SUMMARY Background Personalized medicine promises individualized disease prediction and treatment. The convergence of machine learning (ML) and available multi-modal data is key moving forward. We build upon previous work to deliver multi-modal predictions of Parkinson’s Disease (PD). Methods We performed automated ML on multi-modal data from the Parkinson’s Progression Marker Initiative (PPMI). After selecting the best performing algorithm, all PPMI data was used to tune the selected model. The model was validated in the Parkinson’s Disease Biomarker Program (PDBP) dataset. Finally, networks were built to identify gene communities specific to PD. Findings Our initial model showed an area under the curve (AUC) of 89.72% for the diagnosis of PD. The tuned model was then tested for validation on external data (PDBP, AUC 85.03%). Optimizing thresholds for classification, increased the diagnosis prediction accuracy (balanced accuracy) and other metrics. Combining data modalities outperforms the single biomarker paradigm. UPSIT was the largest contributing predictor for the classification of PD. The transcriptomic data was used to construct a network of disease-relevant transcripts. Interpretation We have built a model using an automated ML pipeline to make improved multi-omic predictions of PD. The model developed improves disease risk prediction, a critical step for better assessment of PD risk. We constructed gene expression networks for the next generation of genomics-derived interventions. Our automated ML approach allows complex predictive models to be reproducible and accessible to the community. Funding National Institute on Aging, National Institute of Neurological Disorders and Stroke, the Michael J. Fox Foundation, and the Global Parkinson’s Genetics Program. RESEARCH IN CONTEXT Evidence before this study Prior research into predictors of Parkinson’s disease (PD) has either used basic statistical methods to make predictions across data modalities, or they have focused on a single data type or biomarker model. We have done this using an open-source automated machine learning (ML) framework on extensive multi-modal data, which we believe yields robust and reproducible results. We consider this the first true multi-modality ML study of PD risk classification. Added value of this study We used a variety of linear, non-linear, kernel, neural networks, and ensemble ML algorithms to generate an accurate classification of both cases and controls in independent datasets using data that is not involved in PD diagnosis itself at study recruitment. The model built in this paper significantly improves upon our previous models that used the entire training dataset in previous work 1 . Building on this earlier work, we showed that the PD diagnosis can be refined using improved algorithmic classification tools that may yield potential biological insights. We have taken careful consideration to develop and validate this model using public controlled-access datasets and an open-source ML framework to allow for reproducible and transparent results. Implications of all available evidence Training, validating, and tuning a diagnostic algorithm for PD will allow us to augment clinical diagnoses or risk assessments with less need for complex and expensive exams. Going forward, these models can be built on remote or asynchronously collected data which may be important in a growing telemedicine paradigm. More refined diagnostics will also increase clinical trial efficiency by potentially refining phenotyping and predicting onset, allowing providers to identify potential cases earlier. Early detection could lead to improved treatment response and higher efficacy. Finally, as part of our workflow, we built new networks representing communities of genes correlated in PD cases in a hypothesis-free manner, showing how new and existing genes may be connected and highlighting therapeutic opportunities.
0

Genome-wide association study of Parkinson’s disease progression biomarkers in 12 longitudinal patients’ cohorts

Hirotaka Iwaki et al.Mar 25, 2019
Abstract Background Several reports have identified different patterns of Parkinson’s disease progression in individuals carrying missense variants in the GBA or LRRK2 genes. The overall contribution of genetic factors to the severity and progression of Parkinson’s disease, however, has not been well studied. Objectives To test the association between genetic variants and the clinical features and progression of Parkinson’s disease on a genome-wide scale. Methods We accumulated individual data from 12 longitudinal cohorts in a total of 4,093 patients with 25,254 observations over a median of 3.81 years. Genome-wide associations were evaluated for 25 cross-sectional and longitudinal phenotypes. Specific variants of interest, including 90 recently-identified disease risk variants, were also investigated for the associations with these phenotypes. Results Two variants were genome-wide significant. Rs382940(T>A), within the intron of SLC44A1 , was associated with reaching Hoehn and Yahr stage 3 or higher faster (HR 2.04 [1.58, 2.62], P-value = 3.46E-8). Rs61863020(G>A), an intergenic variant and eQTL for ADRA2A , was associated with a lower prevalence of insomnia at baseline (OR 0.63 [0,52, 0.75], P-value = 4.74E-8). In the targeted analysis, we found nine associations between known Parkinson’s risk variants and more severe motor/cognitive symptoms. Also, we replicated previous reports of GBA coding variants (rs2230288: p.E365K, rs75548401: p.T408M) being associated with greater motor and cognitive decline over time, and APOE E4 tagging variant (rs429358) being associated with greater cognitive deficits in patients. Conclusions We identified novel genetic factors associated with heterogeneity of progression in Parkinson’s disease. The results provide new insights into the pathogenesis of Parkinson’s disease as well as patient stratification for clinical trials.
0
Citation4
0
Save
15

Identification and prediction of Parkinson’s disease subtypes and progression using machine learning in two cohorts

Anant Dadu et al.Aug 6, 2022
Abstract Background The clinical manifestations of Parkinson’s disease (PD) are characterized by heterogeneity in age at onset, disease duration, rate of progression, and the constellation of motor versus non-motor features. There is an unmet need for the characterization of distinct disease subtypes as well as improved, individualized predictions of the disease course. The emergence of machine learning to detect hidden patterns in complex, multi-dimensional datasets provides unparalleled opportunities to address this critical need. Methods and Findings We used unsupervised and supervised machine learning methods on comprehensive, longitudinal clinical data from the Parkinson’s Disease Progression Marker Initiative (PPMI) (n = 294 cases) to identify patient subtypes and to predict disease progression. The resulting models were validated in an independent, clinically well-characterized cohort from the Parkinson’s Disease Biomarker Program (PDBP) (n = 263 cases). Our analysis distinguished three distinct disease subtypes with highly predictable progression rates, corresponding to slow, moderate, and fast disease progression. We achieved highly accurate projections of disease progression five years after initial diagnosis with an average area under the curve (AUC) of 0.92 (95% CI: 0.95 ± 0.01 for the slower progressing group (PDvec1), 0.87 ± 0.03 for moderate progressors, and 0.95 ± 0.02 for the fast progressing group (PDvec3). We identified serum neurofilament light (Nfl) as a significant indicator of fast disease progression among other key biomarkers of interest. We replicated these findings in an independent validation cohort, released the analytical code, and developed models in an open science manner. Conclusions Our data-driven study provides insights to deconstruct PD heterogeneity. This approach could have immediate implications for clinical trials by improving the detection of significant clinical outcomes that might have been masked by cohort heterogeneity. We anticipate that machine learning models will improve patient counseling, clinical trial design, allocation of healthcare resources, and ultimately individualized patient care.
15
Citation3
0
Save
0

GenoTools: An Open-Source Python Package for Efficient Genotype Data Quality Control and Analysis

Dan Vitale et al.Mar 29, 2024
GenoTools, a Python package, streamlines population genetics research by integrating ancestry estimation, quality control (QC), and genome-wide association studies (GWAS) capabilities into efficient pipelines. By tracking samples, variants, and quality-specific measures throughout fully customizable pipelines, users can easily manage genetics data for large and small studies. GenoTools' "Ancestry" module renders highly accurate predictions, allowing for high-quality ancestry-specific studies, and enables custom ancestry model training and serialization, specified to the user's genotyping or sequencing platform. As the genotype processing engine that powers several large initiatives, including the NIH's Center for Alzheimer's and Related Dementias (CARD) and the Global Parkinson's Genetics Program (GP2). GenoTools was used to process and analyze the UK Biobank and major Alzheimer's Disease (AD) and Parkinson's Disease (PD) datasets with over 400,000 genotypes from arrays and 5000 sequences and has led to novel discoveries in diverse populations. It has provided replicable ancestry predictions, implemented rigorous QC, and conducted genetic ancestry-specific GWAS to identify systematic errors or biases through a single command. GenoTools is a customizable tool that enables users to efficiently analyze and scale genotype data with reproducible and scalable ancestry, QC, and GWAS pipelines.
0
Citation3
0
Save
31

Large-scale pathway-specific polygenic risk, transcriptomic community networks and functional inferences in Parkinson disease

Sara Bandrés‐Ciga et al.May 6, 2020
ABSTRACT Polygenic inheritance plays a central role in Parkinson disease (PD). A priority in elucidating PD etiology lies in defining the biological basis of genetic risk. Unraveling how risk leads to disruption will yield disease-modifying therapeutic targets that may be effective. Here, we utilized a high-throughput and hypothesis-free approach to determine biological pathways underlying PD using the largest currently available cohorts of genetic data and gene expression data from International Parkinson’s Disease Genetics Consortium (IPDGC) and the Accelerating Medicines Partnership - Parkinson’s disease initiative (AMP-PD), among other sources. We placed these insights into a cellular context. We applied large-scale pathway-specific polygenic risk score (PRS) analyses to assess the role of common variation on PD risk in a cohort of 457,110 individuals by focusing on a compilation of 2,199 publicly annotated gene sets representative of curated pathways, of which we nominate 46 pathways associated with PD risk. We assessed the impact of rare variation on PD risk in an independent cohort of whole-genome sequencing data, including 4,331 individuals. We explored enrichment linked to expression cell specificity patterns using single-cell gene expression data and demonstrated a significant risk pattern for adult dopaminergic neurons, serotonergic neurons, and radial glia. Subsequently, we created a novel way of building de novo pathways by constructing a network expression community map using transcriptomic data derived from the blood of 1,612 PD patients, which revealed 54 connecting networks associated with PD. Our analyses highlight several promising pathways and genes for functional prioritization and provide a cellular context in which such work should be done.
31
Citation2
0
Save
0

Increased CSF DOPA Decarboxylase Correlates with Lower DaT‐SPECT Binding: Analyses in Biopark and PPMI Cohorts

Shervin Khosousi et al.May 26, 2024
Abstract Background Recent studies identified increased cerebrospinal fluid (CSF) DOPA decarboxylase (DDC) as a promising biomarker for parkinsonian disorders, suggesting a compensation to dying dopaminergic neurons. A correlation with 123I‐FP‐CIT‐SPECT (DaT‐SPECT) imaging could shed light on this link. Objective The objective is to assess the relationship between CSF DDC levels and DaT‐SPECT binding values. Methods A total of 51 and 72 Parkinson's disease (PD) subjects with available DaT‐SPECT and CSF DDC levels were selected from the PPMI and Biopark cohorts, respectively. DDC levels were analyzed using proximity extension assay and correlated with DaT‐SPECT striatal binding ratios (SBR). All analyses were corrected for age and sex. Results CSF DDC levels in PD patients correlated negatively with DaT‐SPECT SBR in both putamen and caudate nucleus. Additionally, SBR decreased with increased DDC levels over time in PD patients. Conclusion CSF DDC levels negatively correlate with DaT‐SPECT SBR in levodopa‐treated PD. © 2024 The Authors. Movement Disorders published by Wiley Periodicals LLC on behalf of International Parkinson and Movement Disorder Society.
0
Citation2
0
Save
0

Genetic modifiers of risk and age at onset in GBA associated Parkinson’s disease and Lewy body dementia

Cornelis Blauwendraat et al.Aug 18, 2019
Abstract Parkinson’s disease (PD) is a genetically complex disorder. Multiple genes have been shown to contribute to the risk of PD, and currently 90 independent risk variants have been identified by genome-wide association studies. Thus far, a number of genes (including SNCA , LRRK2 , and GBA ) have been shown to contain variability across a spectrum of frequency and effect, from rare, highly penetrant variants to common risk alleles with small effect sizes. Variants in GBA , encoding the enzyme glucocerebrosidase, are associated with Lewy body diseases such as PD and Lewy body dementia (LBD). These variants, which reduce or abolish enzymatic activity, confer a spectrum of disease risk, from 1.4- to >10-fold. An outstanding question in the field is what other genetic factors that influence GBA -associated risk for disease, and whether these overlap with known PD risk variants. Using multiple, large case-control datasets, totalling 217,165 individuals (22,757 PD cases, 13,431 PD proxy cases, 622 LBD cases and 180,355 controls), we identified 1,772 PD cases, 711 proxy cases and 7,624 controls with a GBA variant (p.E326K, p.T369M or p.N370S). We performed a genome-wide association study and analysed the most recent PD-associated genetic risk score to detect genetic influences on GBA risk and age at onset. We attempted to replicate our findings in two independent datasets, including the personal genetics company 23andMe, Inc. and whole-genome sequencing data. Our analysis showed that the overall PD genetic risk score modifies risk for disease and decreases age at onset in carriers of GBA variants. Notably, this effect was consistent across all tested GBA risk variants. Dissecting this signal demonstrated that variants in close proximity to SNCA and CTSB (encoding cathepsin B) are the most significant contributors. Risk variants in the CTSB locus were identified to decrease mRNA expression of CTSB . Additional analyses suggest a possible genetic interaction between GBA and CTSB and GBA p.N370S neurons were shown to have decreased Cathepsin B expression compared to controls. These data provide a genetic basis for modification of GBA -associated PD risk and age at onset and demonstrate that variability at genes implicated in lysosomal function exerts the largest effect on GBA associated risk for disease. Further, these results have important implications for selection of GBA carriers for therapeutic interventions.
0
Citation1
0
Save
1

Application of Aligned-UMAP to longitudinal biomedical studies

Anant Dadu et al.Dec 14, 2022
Abstract Longitudinal multi-dimensional biological datasets are ubiquitous and highly abundant. These datasets are essential to understanding disease progression, identifying subtypes, and drug discovery. Discovering meaningful patterns or disease pathophysiologies in these datasets is challenging due to their high dimensionality, making it difficult to visualize hidden patterns. Several methods have been developed for dimensionality reduction, but they are limited to cross-sectional datasets. Recently proposed Aligned-UMAP, an extension of the UMAP algorithm, can visualize high-dimensional longitudinal datasets. In this work, we applied Aligned-UMAP on a broad spectrum of clinical, imaging, proteomics, and single-cell datasets. Aligned-UMAP reveals time-dependent hidden patterns when color-coded with the metadata. We found that the algorithm parameters also play a crucial role and must be tuned carefully to utilize the algorithm’s potential fully. Altogether, based on its ease of use and our evaluation of its performance on different modalities, we anticipate that Aligned-UMAP will be a valuable tool for the biomedical community. We also believe our benchmarking study becomes more important as more and more high-dimensional longitudinal data in biomedical research becomes available. Highlights - explored the utility of Aligned-UMAP in longitudinal biomedical datasets - offer insights on optimal uses for the technique - provide recommendations for best practices In Brief High-dimensional longitudinal data is prevalent yet understudied in biological literature. High-dimensional data analysis starts with projecting the data to low dimensions to visualize and understand the underlying data structure. Though few methods are available for visualizing high dimensional longitudinal data, they are not studied extensively in real-world biological datasets. A recently developed nonlinear dimensionality reduction technique, Aligned-UMAP, analyzes sequential data. Here, we give an overview of applications of Aligned-UMAP on various biomedical datasets. We further provide recommendations for best practices and offer insights on optimal uses for the technique.
Load More