Nassim DehoucheVerified
Verified Account
Verified
Computer Science PhD, Université Paris-Dauphine (Paris IX)
Member for 4 years, 1 month and 19 days
Achievements
Cited Author
Open Access Advocate
Active user
Key Stats
Upvotes received:
28
Publications:
25
(72% Open Access)
Cited by:
561
h-index:
6
/
i10-index:
6
Reputation
Health Informatics
76%
Sociology And Political Science
76%
Cognitive Neuroscience
51%
Show more
How is this calculated?
Publications
1

Plagiarism in the age of massive Generative Pre-trained Transformers (GPT-3)

Nassim DehoucheMar 25, 2021
As if 2020 was not a peculiar enough year, its fifth month saw the relatively quiet publication of a preprint describing the most powerful natural language processing (NLP) system to date—GPT-3 (Generative Pre-trained Transformer-3)—created by the Silicon Valley research firm OpenAI. Though the software implementation of GPT-3 is still in its initial beta release phase, and its full capabilities are still unknown as of the time of this writing, it has been shown that this artificial intelligence can comprehend prompts in natural language, on virtually any topic, and generate relevant original text content that is indistinguishable from human writing. Moreover, access to these capabilities, in a limited yet worrisome enough extent, is available to the general public. This paper presents examples of original content generated by the author using GPT-3. These examples illustrate some of the capabilities of GPT-3 in comprehending prompts in natural language and generating convincing content in response. I use these examples to raise specific fundamental questions pertaining to the intellectual property of this content and the potential use of GPT-3 to facilitate plagiarism. The goal is to instigate a sense of urgency, as well as a sense of present tardiness on the part of the academic community in addressing these questions.
1

The injury severity score: an operations perspective

Nassim DehoucheFeb 20, 2022
The statistical evaluation of aggregation functions for trauma grades, such as the Injury Severity Score (ISS), is largely based on measurements of their Pearson product-moment correlation with mortality. However, correlation analysis makes assumptions about the nature of the involved random variables (cardinality) and their relationship (linearity) that may not be applicable to ordinal scores such as the ISS. Moreover, using correlation as a sole evaluation criterion neglects the dynamic properties of these aggregation functions scores.We analyze the domain and ordinal properties of the ISS comparatively to arbitrary linear and cubic aggregation functions. Moreover, we investigate the axiomatic properties of the ISS as a multicriteria aggregation procedure. Finally, we use a queuing simulation with various empirical distributions of Abbreviated Injury Scale (AIS) grades reported in the literature, to evaluate the queuing performance of the three aggregation functions.We show that the assumptions required for the computation of Pearson's product-moment correlation coefficients are not applicable to the analysis of the association between the ISS and mortality. We suggest the use of Mutual Information, a information-theoretic statistic that is able to assess general dependence rather than a specialized, linear view based on curve-fitting. Using this metric on the same data set as the seminal study that introduced the ISS, we show that the sum of cubes conveys more information on mortality than the ISS. Moreover, we highlight some unintended, undesirable axiomatic properties of the ISS that can lead to bias in its use as a patient triage criterion. Lastly, our queuing simulation highlights the sensitivity of the queuing performance of different aggregation procedures to the underlying distribution of AIS grades among patients.Viewing the ISS, and other possible aggregation functions for multiple AIS scores, as mere operational indicators of the priority of care, rather than cardinal measures of the response of the human body to multiple injuries (as was conjectured in the seminal study introducing the ISS) offers a perspective for their construction and evaluation on more robust grounds than the correlation coefficient. In this regard, Mutual Information appears as a more appropriate measure for the study of the association between injury severity and mortality, and queuing simulations as an actionable way to adapt the choice of an aggregation function to the underlying distribution of AIS scores.
1

Implicit Stereotypes in Pre-Trained Classifiers

Nassim DehoucheJan 1, 2021
Pre-trained deep learning models underpin many public-facing applications, and their propensity to reproduce implicit racial and gender stereotypes is an increasing source of concern.The risk of large-scale, unfair outcomes resulting from their use thus raises the need for technical tools to test and audit these systems.In this work, a dataset of 10, 000 portrait photographs was generated and classified, using CLIP (Contrastive Language-Image Pretraining), according to six pairs of opposing labels describing a subject's gender, ethnicity, attractiveness, friendliness, wealth, and intelligence.Label correlation was analyzed and significant associations, corresponding to common implicit stereotypes in culture and society, were found at the 99% significance level.A strong positive correlation was notably found between labels Female and Attractive, Male and Rich, as well as White Person and Attractive.These results are used to highlight the risk of more innocuous labels being used as partial euphemisms for protected attributes.Moreover, some limitations of common definitions of algorithmic fairness as they apply to general-purpose, pre-trained systems are analyzed, and the idea of controlling for bias at the point of deployment of these systems rather than during data collection and training is put forward as a possible circumvention.
Load More