HA
Hervé Abdi
Author with expertise in Sensory Analysis in Food Science Research
The University of Texas at Dallas, Tampere University, University of Illinois Urbana-Champaign
+ 7 more
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
5
(20% Open Access)
Cited by:
1
h-index:
55
/
i10-index:
119
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
17

Comparing the stability and reproducibility of brain-behaviour relationships found using Canonical Correlation Analysis and Partial Least Squares within the ABCD Sample

Hajer Nakua et al.Oct 24, 2023
+7
H
J
H
Canonical Correlation Analysis (CCA) and Partial Least Squares Correlation (PLS) detect associations between two data matrices based on computing a linear combination between the two matrices (called latent variables; LVs). These LVs maximize correlation (CCA) and covariance (PLS). These different maximization criteria may render one approach more stable and reproducible than the other when working with brain and behavioural data at the population-level. This study compared the LVs which emerged from CCA and PLS analyses of brain-behaviour relationships from the Adolescent Brain Cognitive Development (ABCD) dataset and examined their stability and reproducibility.Structural T1-weighted imaging and behavioural data were accessed from the baseline Adolescent Brain Cognitive Development dataset (N > 9000, ages = 9-11 years). The brain matrix consisted of cortical thickness estimates in different cortical regions. The behavioural matrix consisted of 11 subscale scores from the parent-reported Child Behavioral Checklist (CBCL) or 7 cognitive performance measures from the NIH Toolbox. CCA and PLS models were separately applied to the brain-CBCL analysis and brain-cognition analysis. A permutation test was used to assess whether identified LVs were statistically significant. A series of resampling statistical methods were used to assess stability and reproducibility of the LVs.When examining the relationship between cortical thickness and CBCL scores, the first LV was found to be significant across both CCA and PLS models (singular value: CCA = .13, PLS = .39, p < .001). LV1 from the CCA model found that covariation of CBCL scores was linked to covariation of cortical thickness. LV1 from the PLS model identified decreased cortical thickness linked to lower CBCL scores. There was limited evidence of stability or reproducibility of LV1 for both CCA and PLS. When examining the relationship between cortical thickness and cognitive performance, there were 6 significant LVs for both CCA and PLS (p < .01). The first LV showed similar relationships between CCA and PLS and was found to be stable and reproducible (singular value: CCA = .21, PLS = .43, p < .001).CCA and PLS identify different brain-behaviour relationships with limited stability and reproducibility when examining the relationship between cortical thickness and parent-reported behavioural measures. However, both methods identified relatively similar brain-behaviour relationships that were stable and reproducible when examining the relationship between cortical thickness and cognitive performance. The results of the current study suggest that stability and reproducibility of brain-behaviour relationships identified by CCA and PLS are influenced by characteristics of the analyzed sample and the included behavioural measurements when applied to a large pediatric dataset.
17
Paper
Citation1
0
Save
0

A generalization of partial least squares regression and correspondence analysis for categorical and mixed data: An application with the ADNI data

Derek Beaton et al.May 7, 2020
H
G
D
The present and future of large scale studies of human brain and behavior—in typical and disease populations—is “mutli-omics”, “deep-phenotyping”, or other types of multi-source and multi-domain data collection initiatives. These massive studies rely on highly interdisciplinary teams that collect extremely diverse types of data across numerous systems and scales of measurement (e.g., genetics, brain structure, behavior, and demographics). Such large, complex, and heterogeneous data requires relatively simple methods that allow for flexibility in analyses without the loss of the inherent properties of various data types. Here we introduce a method designed specifically to address these problems: partial least squares-correspondence analysis-regression (PLS-CA-R). PLS-CA-R generalizes PLS regression for use with virtually any data type (e.g., continuous, ordinal, categorical, non-negative values). Though the primary emphasis here is on a PLS-regression approach generalized for data types, we also show that PLS-CA-R leads to additional generalizations of many routine “two-table” multivariate techniques and their respective algorithms, such as various PLS approaches, canonical correlation analysis, and redundancy analysis (a.k.a. reduced rank regression).
0

Generalization of the minimum covariance determinant algorithm for categorical and mixed data types

Derek Beaton et al.May 7, 2020
+7
B
K
D
The minimum covariance determinant (MCD) algorithm is one of the most common techniques to detect anomalous or outlying observations. The MCD algorithm depends on two features of multivariate data: the determinant of a matrix (i.e., geometric mean of the eigenvalues) and Mahalanobis distances (MD). While the MCD algorithm is commonly used, and has many extensions, the MCD is limited to analyses of quantitative data and more specifically data assumed to be continuous. One reason why the MCD does not extend to other data types such as categorical or ordinal data is because there is not a well-defined MD for data types other than continuous data. To address the lack of MCD-like techniques for categorical or mixed data we present a generalization of the MCD. To do so, we rely on a multivariate technique called correspondence analysis (CA). Through CA we can define MD via singular vectors and also compute the determinant from CA’s eigenvalues. Here we define and illustrate a generalized MCD on categorical data and then show how our generalized MCD extends beyond categorical data to accommodate mixed data types (e.g., categorical, ordinal, and continuous). We illustrate this generalized MCD on data from two large scale projects: the Ontario Neurodegenerative Disease Research Initiative (ONDRI) and the Alzheimer’s Disease Neuroimaging Initiative (ADNI), with genetics (categorical), clinical instruments and surveys (categorical or ordinal), and neuroimaging (continuous) data. We also make R code and toy data available in order to illustrate our generalized MCD.
0

Multivariate genotypic analyses that identify specific genotypes to characterize disease and control groups in ADNI

Derek Beaton et al.May 7, 2020
H
F
J
D
INTRODUCTION: Genetic contributions to Alzheimer's Disease (AD) are likely polygenic and not necessarily explained by uniformly applied linear and additive effects. In order to better understand the genetics of AD, we require statistical techniques to address both polygenic and possible non-additive effects. METHODS: We used partial least squares-correspondence analysis (PLS-CA)---a method designed to detect multivariate genotypic effects. We used ADNI-1 (N = 756) as a discovery sample with two forms of PLS-CA: diagnosis-based and ApoE-based. We used ADNI-2 (N = 791) as a validation sample with a diagnosis-based PLS-CA. RESULTS: With PLS-CA we identified some expected genotypic effects (e.g., APOE/TOMM40, and APP) and a number of new effects that include, for examples, risk-associated genotypes in RBFOX1 and GPC6 and control-associated genotypes in PTPN14 and CPNE5. DISCUSSION: Through the use of PLS-CA, we were able to detect complex (multivariate, genotypic) genetic contributions to AD, which included many non-additive and non-linear risk and possibly protective effects.
0

The Latent Semantic Space and Corresponding Brain Regions of the Functional Neuroimaging Literature

Fahd Alhazmi et al.May 7, 2020
H
D
F
The functional neuroimaging literature has become increasingly complex and thus difficult to navigate. This complexity arises from the rate at which new studies are published and from the terminology that varies widely from study-to-study and even more so from discipline-to-discipline. One way to investigate and manage this problem is to build a "semantic space" that maps the different vocabulary used in functional neuroimaging literature. Such a semantic space will also help identify the primary research domains of neuroimaging and their most commonly reported brain regions. In this work, we analyzed the multivariate semantic structure of abstracts in Neurosynth and found that there are six primary domains of the functional neuroimaging literature, each with their own preferred reported brain regions. Our analyses also highlight possible semantic sources of reported brain regions within and across domains because some research topics (e.g., memory disorders, substance use disorder) use heterogeneous terminology. Furthermore, we highlight the growth and decline of the primary domains over time. Finally, we note that our techniques and results form the basis of a "recommendation engine" that could help readers better navigate the neuroimaging literature.