FF
Faraz Faghri
Author with expertise in Pathophysiology of Parkinson's Disease
National Institute on Aging, National Institutes of Health, Data Tecnica International (United States)
+ 8 more
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
22
(68% Open Access)
Cited by:
185
h-index:
27
/
i10-index:
44
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
4

Virus exposure and neurodegenerative disease risk across national biobanks

Kristin Levine et al.Jan 22, 2023
+7
C
H
K
With recent findings connecting the Epstein-Barr virus to an increased risk of multiple sclerosis and growing concerns regarding the neurological impact of the coronavirus pandemic, we examined potential links between viral exposures and neurodegenerative disease risk. Using time series data from FinnGen for discovery and cross-sectional data from the UK Biobank for replication, we identified 45 viral exposures significantly associated with increased risk of neurodegenerative disease and replicated 22 of these associations. The largest effect association was between viral encephalitis exposure and Alzheimer's disease. Influenza with pneumonia was significantly associated with five of the six neurodegenerative diseases studied. We also replicated the Epstein-Barr/multiple sclerosis association. Some of these exposures were associated with an increased risk of neurodegeneration up to 15 years after infection. As vaccines are currently available for some of the associated viruses, vaccination may be a way to reduce some risk of neurodegenerative disease.
4
Paper
Citation116
5
Save
1

A CRISPRi/a platform in iPSC-derived microglia uncovers regulators of disease states

Nina Dräger et al.Oct 24, 2023
+16
C
S
N
ABSTRACT Microglia are emerging as key drivers of neurological diseases. However, we lack a systematic understanding of the underlying mechanisms. Here, we present a screening platform to systematically elucidate functional consequences of genetic perturbations in human iPSC-derived microglia. We developed an efficient eight-day protocol for the generation of microglia-like cells based on the inducible expression of six transcription factors. We established inducible CRISPR interference and activation in this system and conducted three screens targeting the “druggable genome”. These screens uncovered genes controlling microglia survival, activation and phagocytosis, including neurodegeneration-associated genes. A screen with single-cell RNA sequencing as the readout revealed that these microglia adopt a spectrum of states mirroring those observed in human brains and identified regulators of these states. A disease-associated state characterized by SPP1 expression was selectively depleted by CSF1R inhibition. Thus, our platform can systematically uncover regulators of microglia states, enabling their functional characterization and therapeutic targeting.
1
Citation15
0
Save
1

A fully automated FAIMS-DIA proteomic pipeline for high-throughput characterization of iPSC-derived neurons

Luke Reilly et al.Oct 24, 2023
+15
E
L
L
Abstract Fully automated proteomic pipelines have the potential to achieve deep coverage of cellular proteomes with high throughput and scalability. However, it is important to evaluate performance, including both reproducibility and ability to provide meaningful levels of biological insight. Here, we present an approach combining high field asymmetric waveform ion mobility spectrometer (FAIMS) interface and data independent acquisition (DIA) proteomics approach developed as part of the induced pluripotent stem cell (iPSC) Neurodegenerative Disease Initiative (iNDI), a large-scale effort to understand how inherited diseases may manifest in neuronal cells. Our FAIMS-DIA approach identified more than 8000 proteins per mass spectrometry (MS) acquisition as well as superior total identification, reproducibility, and accuracy compared to other existing DIA methods. Next, we applied this approach to perform a longitudinal proteomic profiling of the differentiation of iPSC-derived neurons from the KOLF2.1J parental line used in iNDI. This analysis demonstrated a steady increase in expression of mature cortical neuron markers over the course of neuron differentiation. We validated the performance of our proteomics pipeline by comparing it to single cell RNA-Seq datasets obtained in parallel, confirming expression of key markers and cell type annotations. An interactive webapp of this temporal data is available for aligned-UMAP visualization and data browsing ( https://share.streamlit.io/anant-droid/singlecellumap ). In summary, we report an extensively optimized and validated proteomic pipeline that will be suitable for large-scale studies such as iNDI.
51

Genome-wide CRISPRi/a screens in human neurons link lysosomal failure to ferroptosis

Ruilin Tian et al.Oct 24, 2023
+9
J
A
R
Abstract Single-cell transcriptomics provide a systematic map of gene expression in different human cell types. The next challenge is to systematically understand cell-type specific gene function. The integration of CRISPR-based functional genomics and stem cell technology enables the scalable interrogation of gene function in differentiated human cells. Here, we present the first genomewide CRISPR interference and CRISPR activation screens in human neurons. We uncover pathways controlling neuronal response to chronic oxidative stress, which is implicated in neurodegenerative diseases. Unexpectedly, knockdown of the lysosomal protein prosaposin strongly sensitizes neurons, but not other cell types, to oxidative stress by triggering the formation of lipofuscin, a hallmark of aging, which traps iron, generating reactive oxygen species and triggering ferroptosis. We also determine transcriptomic changes in neurons following perturbation of genes linked to neurodegenerative diseases. To enable the systematic comparison of gene function across different human cell types, we establish a data commons named CRISPRbrain.
51
Paper
Citation10
0
Save
0

Analysis and Prediction of Unplanned Intensive Care Unit Readmission using Recurrent Neural Networks with Long Short-Term Memory

Yuwei Lin et al.May 6, 2020
+2
F
Y
Y
Abstract Background Unplanned readmission of a hospitalized patient is an extremely undesirable outcome as the patient may have been exposed to additional risks. The rates of unplanned readmission are, therefore, regarded as an important performance indicator for the medical quality of a hospital and healthcare system. Identifying high-risk patients likely to suffer from readmission before release benefits both the patients and the medical providers. The emergence of machine learning to detect hidden patterns in complex, multi-dimensional datasets provides unparalleled opportunities to develop efficient discharge decision-making support system for physicians. Methods and Findings We used supervised machine learning approaches for ICU readmission prediction. We used machine learning methods on comprehensive, longitudinal clinical data from the MIMIC-III to predict the ICU readmission of patients within 30 days of their discharge. We have utilized recent machine learning techniques such as Recurrent Neural Networks (RNN) with Long Short-Term Memory (LSTM), by this we have been able incorporate the multivariate features of EHRs and capture sudden fluctuations in chart event features (e.g. glucose and heart rate) that are significant in time series with temporal dependencies, which cannot be properly captured by traditional static models, but can be captured by our proposed deep neural network based model. We incorporate multiple types of features including chart events, demographic, and ICD9 embeddings. Our machine learning models identifies ICU readmissions at a higher sensitivity rate (0.742) and an improved Area Under the Curve (0.791) compared with traditional methods. We also illustrate the importance of each portion of the features and different combinations of the models to verify the effectiveness of the proposed model. Conclusion Our manuscript highlights the ability of machine learning models to improve our ICU decision making accuracy, and is a real-world example of precision medicine in hospitals. These data-driven results enable clinicians to make assisted decisions within their patient cohorts. This knowledge could have immediate implications for hospitals by improving the detection of possible readmission. We anticipate that machine learning models will improve patient counseling, hospital administration, allocation of healthcare resources and ultimately individualized clinical care.
76

A reference induced pluripotent stem cell line for large-scale collaborative studies

Caroline Pantazis et al.Oct 24, 2023
+92
E
A
C
Abstract Human induced pluripotent stem cell (iPSC) lines are a powerful tool for studying development and disease, but the considerable phenotypic variation between lines makes it challenging to replicate key findings and integrate data across research groups. To address this issue, we sub-cloned candidate iPSC lines and deeply characterised their genetic properties using whole genome sequencing, their genomic stability upon CRISPR/Cas9-based gene editing, and their phenotypic properties including differentiation to commonly-used cell types. These studies identified KOLF2.1J as an all-around well-performing iPSC line. We then shared KOLF2.1J with groups around the world who tested its performance in head-to-head comparisons with their own preferred iPSC lines across a diverse range of differentiation protocols and functional assays. On the strength of these findings, we have made KOLF2.1J and hundreds of its gene-edited derivative clones readily accessible to promote the standardization required for large-scale collaborative science in the stem cell field. Summary The authors of this collaborative study deeply characterized human induced pluripotent stem cell (iPSC) lines to rationally select a clonally-derived cell line that performs well across multiple modalities. KOLF2.1J was identified as a candidate reference cell line based on single-cell analysis of its gene expression in the pluripotent state, whole genome sequencing, genomic stability after highly efficient CRISPR-mediated gene editing, integrity of the p53 pathway, and the efficiency with which it differentiated into multiple target cell populations. Since it is deeply characterized and can be readily acquired, KOLF2.1J is an attractive reference cell line for groups working with iPSCs. Graphical abstract
0

Genome-wide association study of Parkinson’s disease progression biomarkers in 12 longitudinal patients’ cohorts

Hirotaka Iwaki et al.May 7, 2020
+42
H
C
H
Abstract Background Several reports have identified different patterns of Parkinson’s disease progression in individuals carrying missense variants in the GBA or LRRK2 genes. The overall contribution of genetic factors to the severity and progression of Parkinson’s disease, however, has not been well studied. Objectives To test the association between genetic variants and the clinical features and progression of Parkinson’s disease on a genome-wide scale. Methods We accumulated individual data from 12 longitudinal cohorts in a total of 4,093 patients with 25,254 observations over a median of 3.81 years. Genome-wide associations were evaluated for 25 cross-sectional and longitudinal phenotypes. Specific variants of interest, including 90 recently-identified disease risk variants, were also investigated for the associations with these phenotypes. Results Two variants were genome-wide significant. Rs382940(T>A), within the intron of SLC44A1 , was associated with reaching Hoehn and Yahr stage 3 or higher faster (HR 2.04 [1.58, 2.62], P-value = 3.46E-8). Rs61863020(G>A), an intergenic variant and eQTL for ADRA2A , was associated with a lower prevalence of insomnia at baseline (OR 0.63 [0,52, 0.75], P-value = 4.74E-8). In the targeted analysis, we found nine associations between known Parkinson’s risk variants and more severe motor/cognitive symptoms. Also, we replicated previous reports of GBA coding variants (rs2230288: p.E365K, rs75548401: p.T408M) being associated with greater motor and cognitive decline over time, and APOE E4 tagging variant (rs429358) being associated with greater cognitive deficits in patients. Conclusions We identified novel genetic factors associated with heterogeneity of progression in Parkinson’s disease. The results provide new insights into the pathogenesis of Parkinson’s disease as well as patient stratification for clinical trials.
17

Multi-Modality Machine Learning Predicting Parkinson’s Disease

Mary Makarious et al.Oct 24, 2023
+24
D
H
M
SUMMARY Background Personalized medicine promises individualized disease prediction and treatment. The convergence of machine learning (ML) and available multi-modal data is key moving forward. We build upon previous work to deliver multi-modal predictions of Parkinson’s Disease (PD). Methods We performed automated ML on multi-modal data from the Parkinson’s Progression Marker Initiative (PPMI). After selecting the best performing algorithm, all PPMI data was used to tune the selected model. The model was validated in the Parkinson’s Disease Biomarker Program (PDBP) dataset. Finally, networks were built to identify gene communities specific to PD. Findings Our initial model showed an area under the curve (AUC) of 89.72% for the diagnosis of PD. The tuned model was then tested for validation on external data (PDBP, AUC 85.03%). Optimizing thresholds for classification, increased the diagnosis prediction accuracy (balanced accuracy) and other metrics. Combining data modalities outperforms the single biomarker paradigm. UPSIT was the largest contributing predictor for the classification of PD. The transcriptomic data was used to construct a network of disease-relevant transcripts. Interpretation We have built a model using an automated ML pipeline to make improved multi-omic predictions of PD. The model developed improves disease risk prediction, a critical step for better assessment of PD risk. We constructed gene expression networks for the next generation of genomics-derived interventions. Our automated ML approach allows complex predictive models to be reproducible and accessible to the community. Funding National Institute on Aging, National Institute of Neurological Disorders and Stroke, the Michael J. Fox Foundation, and the Global Parkinson’s Genetics Program. RESEARCH IN CONTEXT Evidence before this study Prior research into predictors of Parkinson’s disease (PD) has either used basic statistical methods to make predictions across data modalities, or they have focused on a single data type or biomarker model. We have done this using an open-source automated machine learning (ML) framework on extensive multi-modal data, which we believe yields robust and reproducible results. We consider this the first true multi-modality ML study of PD risk classification. Added value of this study We used a variety of linear, non-linear, kernel, neural networks, and ensemble ML algorithms to generate an accurate classification of both cases and controls in independent datasets using data that is not involved in PD diagnosis itself at study recruitment. The model built in this paper significantly improves upon our previous models that used the entire training dataset in previous work 1 . Building on this earlier work, we showed that the PD diagnosis can be refined using improved algorithmic classification tools that may yield potential biological insights. We have taken careful consideration to develop and validate this model using public controlled-access datasets and an open-source ML framework to allow for reproducible and transparent results. Implications of all available evidence Training, validating, and tuning a diagnostic algorithm for PD will allow us to augment clinical diagnoses or risk assessments with less need for complex and expensive exams. Going forward, these models can be built on remote or asynchronously collected data which may be important in a growing telemedicine paradigm. More refined diagnostics will also increase clinical trial efficiency by potentially refining phenotyping and predicting onset, allowing providers to identify potential cases earlier. Early detection could lead to improved treatment response and higher efficacy. Finally, as part of our workflow, we built new networks representing communities of genes correlated in PD cases in a hypothesis-free manner, showing how new and existing genes may be connected and highlighting therapeutic opportunities.
15

Identification and prediction of Parkinson’s disease subtypes and progression using machine learning in two cohorts

Anant Dadu et al.Oct 24, 2023
+16
R
V
A
Abstract Background The clinical manifestations of Parkinson’s disease (PD) are characterized by heterogeneity in age at onset, disease duration, rate of progression, and the constellation of motor versus non-motor features. There is an unmet need for the characterization of distinct disease subtypes as well as improved, individualized predictions of the disease course. The emergence of machine learning to detect hidden patterns in complex, multi-dimensional datasets provides unparalleled opportunities to address this critical need. Methods and Findings We used unsupervised and supervised machine learning methods on comprehensive, longitudinal clinical data from the Parkinson’s Disease Progression Marker Initiative (PPMI) (n = 294 cases) to identify patient subtypes and to predict disease progression. The resulting models were validated in an independent, clinically well-characterized cohort from the Parkinson’s Disease Biomarker Program (PDBP) (n = 263 cases). Our analysis distinguished three distinct disease subtypes with highly predictable progression rates, corresponding to slow, moderate, and fast disease progression. We achieved highly accurate projections of disease progression five years after initial diagnosis with an average area under the curve (AUC) of 0.92 (95% CI: 0.95 ± 0.01 for the slower progressing group (PDvec1), 0.87 ± 0.03 for moderate progressors, and 0.95 ± 0.02 for the fast progressing group (PDvec3). We identified serum neurofilament light (Nfl) as a significant indicator of fast disease progression among other key biomarkers of interest. We replicated these findings in an independent validation cohort, released the analytical code, and developed models in an open science manner. Conclusions Our data-driven study provides insights to deconstruct PD heterogeneity. This approach could have immediate implications for clinical trials by improving the detection of significant clinical outcomes that might have been masked by cohort heterogeneity. We anticipate that machine learning models will improve patient counseling, clinical trial design, allocation of healthcare resources, and ultimately individualized patient care.
15
Paper
Citation2
0
Save
87

Parallel CRISPR-Cas9 screens reveal mechanisms of PLIN2 and lipid droplet regulation

Melissa Roberts et al.Oct 24, 2023
+13
M
K
M
ABSTRACT Lipid droplets (LDs) are lipid storage organelles that consist of a central core of neutral lipids surrounded by a phospholipid monolayer decorated with a unique set of integral and peripheral proteins. Invariably, at least one member of the perilipin family of proteins (PLIN1-5) associates with LDs in all cell types. Despite key roles of PLIN2 in governing hepatic lipid metabolism, the mechanisms that regulate PLIN2 levels remain incompletely understood. Here, we develop a set of genome-edited PLIN2 reporter cell lines that facilitate the analysis of genes that regulate PLIN2 and LD abundance. Leveraging these reporter cells in a series of CRISPR-Cas9 loss-of-function screens, we generate a comprehensive inventory of genes that influence PLIN2 levels under different metabolic conditions. Moreover, we uncouple their effects on PLIN2 expression and post-translational stability. Identified genetic modifiers include canonical genes that control LD metabolism (e.g., ACSL3 , DGAT2 , PNPLA2 , ABHD5 ) as well as genes with less characterized roles in PLIN2 and LD regulation such as ubiquitination machinery (e.g., MARCH6 , UBE2J2 ), transcription regulators (e.g., HNF4A , HDAC3 ), mitochondrial pathways (e.g., electron transport chain and mitochondrial fatty acid synthesis), and others. These CRISPR screens, and several published screens that focus on different aspects of lipid metabolism, provide the foundation for CRISPRlipid ( http://crisprlipid.org ), a versatile, online data commons for lipid-related functional genomics data. Together, our study uncovers new mechanisms of PLIN2 regulation and provides an extensive, phenotype-rich resource for the exploration of LD biology and lipid metabolism.
87
Paper
Citation2
0
Save
Load More