DP
Denis Pelli
Author with expertise in Neural Mechanisms of Visual Perception and Processing
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
13
(62% Open Access)
Cited by:
14,107
h-index:
43
/
i10-index:
67
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The VideoToolbox software for visual psychophysics: transforming numbers into movies

Denis PelliJan 1, 1997
D
The VideoToolbox is a free collection of two hundred C subroutines for Macintosh computers that calibrates and controls the computer-display interface to create accurately specified visual stimuli. High-level platform-independent languages like MATLAB are best for creating the numbers that describe the desired images. Low-level, computer-specific VideoToolbox routines control the hardware that transforms those numbers into a movie. Transcending the particular computer and language, we discuss the nature of the computer-display interface, and how to calibrate and control it.
0

Crowding is unlike ordinary masking: Distinguishing feature integration from detection

Denis Pelli et al.Dec 30, 2004
N
M
D
A letter in the peripheral visual field is much harder to identify in the presence of nearby letters. This is "crowding." Both crowding and ordinary masking are special cases of "masking," which, in general, refers to any effect of a "mask" pattern on the discriminability of a signal. Here we characterize crowding, and propose a diagnostic test to distinguish it from ordinary masking. In ordinary masking, the signal disappears. In crowding, it remains visible, but is ambiguous, jumbled with its neighbors. Masks are usually effective only if they overlap the signal, but the crowding effect extends over a large region. The width of that region is proportional to signal eccentricity from the fovea and independent of signal size, mask size, mask contrast, signal and mask font, and number of masks. At 4 deg eccentricity, the threshold contrast for identification of a 0.32 deg signal letter is elevated (up to six-fold) by mask letters anywhere in a 2.3 deg region, 7 times wider than the signal. In ordinary masking, threshold contrast rises as a power function of mask contrast, with a shallow log-log slope of 0.5 to 1, whereas, in crowding, threshold is a sigmoidal function of mask contrast, with a steep log-log slope of 2 at close spacing. Most remarkably, although the threshold elevation decreases exponentially with spacing, the threshold and saturation contrasts of crowding are independent of spacing. Finally, ordinary masking is similar for detection and identification, but crowding occurs only for identification, not detection. More precisely, crowding occurs only in tasks that cannot be done based on a single detection by coarsely coded feature detectors. These results (and observers' introspections) suggest that ordinary masking blocks feature detection, so the signal disappears, while crowding (like "illusory conjunction") is excessive feature integration - detected features are integrated over an inappropriately large area because there are no smaller integration fields - so the integrated signal is ambiguous, jumbled with the mask. In illusory conjunction, observers see an object that is not there made up of features that are. A survey of the illusory conjunction literature finds that most of the illusory conjunction results are consistent with the spatial crowding described here, which depends on spatial proximity, independent of time pressure. The rest seem to arise through a distinct phenomenon that one might call "temporal crowding," which depends on time pressure ("overloading attention"), independent of spatial proximity.
0

Uncertainty explains many aspects of visual contrast detection and discrimination

Denis PelliSep 1, 1985
D
More than 20 years ago, Tanner [ Ann. N.Y. Acad. Sci.89, 752 ( 1961)] noted that observers asked to detect a signal act as though they are uncertain about the physical characteristics of the signal to be detected. The popular assumptions of probability summation and decision variable, taken together, imply this uncertainty. This paper defines an uncertainty model of visual detection that assumes that the observer is uncertain among many signals and chooses the likeliest. With only four parameters, the uncertainty model explains why d′ is approximately a power function of contrast ("nonlinear transduction") and accurately predicts effects of summation, facilitation, noise, subjective criterion, and task for near-threshold contrasts. Thus the uncertainty model offers a synthesis of much of our current understanding of visual contrast detection and discrimination.
0

Psychophysics of reading—I. Normal vision

Gordon Legge et al.Jan 1, 1985
M
G
D
G
This paper is about the visual requirements for reading with normal vision. It is the first in a series devoted to the psychophysics of reading with normal and low vision. We have measured reading rates for text scanned across the face of a TV monitor while varying parameters that are important in current theories of pattern vision. Our results provide estimates of the stimulus parameters required for optimal reading of scanned text. We have found that maximum reading rates are achieved for characters subtending 0.32 to 22. Contrast polarity (black-on-white vs white-on-black text) has no effect. Reading rate increases with field size, but only up to 4 characters, independent of character size. When text is low-pass spatial-frequency filtered, reading rate increases with bandwidth, but only up to two cycles/character, independent of character size. When text is matrix sampled, reading rate increases with sample density, but only up to a critical sample density which depends on character size. The critical sample density increases from about 4 × 4 samples/character for 0.12 characters to more than 20 × 20 samples/character for 24 characters. We suggest that one spatial-frequency channel suffices for reading.
0
Citation543
0
Save
0

Accurate control of contrast on microcomputer displays

Denis Pelli et al.Jan 1, 1991
L
D
Off-the-shelf microcomputers can now display arbitrary 8-bit images, but accurate control of these images requires dealing with several undesirable properties of real digital to analog converters (DACs) and analog video monitors. The limitations of DACs and video monitors are presented in the form of a model for their calibration and use in vision experiments. Low contrasts can be accurately rendered by summing a small accurate a.c. signal and a large less-accurate d.c. signal (Watson et al., 1986; Behavior Research, Method, Instrument and Computers, 18, 587–594). Exploiting that idea, this note presents an easy-to-build passive resistor network, a video attenuator, that combines the outputs of three 8-bit DACs to render low contrasts with 12-bit accuracy at the display. Measurements confirm the 12-bit accuracy.
0

Psychophysics of reading—II. Low vision

Gordon Legge et al.Jan 1, 1985
M
D
G
G
Very little is known about the effects of visual impairment on reading. We used psychophysical methods to study reading by 16 low-vision observers. Reading rates were measured for text scanned across the face of a TV monitor while varying parameters that are likely to be important in low vision: angular character size, number of characters in the field, number of dots composing each character, contrast polarity (white-on-black vs black-on-white text), and character spacing. Despite diverse pathologies and degrees of vision loss in our sample, several major generalizations emerged. There is a wide variation in peak reading rates among low-vision observers, but 64% of the variance can be accounted for by two major distinctions: intact central fields vs central-field loss and cloudy vs clear ocular media. Peak reading rates for observers with central-field loss were very low (median 25 words/minute), while peak reading rates for observers with intact central fields were at least 90 words/minute (median 130 words/minute). Most low-vision readers require magnification to obtain characters of optimal size. Sloan M acuity was a better predictor of optimal character size than Snellen acuity, accounting for 72% of the variance. Low-vision reading is similar to normal reading in several respects. For example, both show the same dependence on the number of characters in the field. Our results provide estimates of the best reading performance to be expected from low-vision observers with characteristic forms of vision loss, and the stimulus parameters necessary for optimal performance. These results will be useful in the development of clinical tests of low vision, and in the design of low-vision reading aids.
0
Citation432
0
Save
0

Feature detection and letter identification

Denis Pelli et al.Jul 4, 2006
D
B
C
D
Seeking to understand how people recognize objects, we have examined how they identify letters. We expected this 26-way classification of familiar forms to challenge the popular notion of independent feature detection ("probability summation"), but find instead that this theory parsimoniously accounts for our results. We measured the contrast required for identification of a letter briefly presented in visual noise. We tested a wide range of alphabets and scripts (English, Arabic, Armenian, Chinese, Devanagari, Hebrew, and several artificial ones), three- and five-letter words, and various type styles, sizes, contrasts, durations, and eccentricities, with observers ranging widely in age (3 to 68) and experience (none to fluent). Foreign alphabets are learned quickly. In just three thousand trials, new observers attain the same proficiency in letter identification as fluent readers. Surprisingly, despite this training, the observers-like clinical letter-by-letter readers-have the same meager memory span for random strings of these characters as observers seeing them for the first time. We compare performance across tasks and stimuli that vary in difficulty by pitting the human against the ideal observer, and expressing the results as efficiency. We find that efficiency for letter identification is independent of duration, overall contrast, and eccentricity, and only weakly dependent on size, suggesting that letters are identified by a similar computation across this wide range of viewing conditions. Efficiency is also independent of age and years of reading. However, efficiency does vary across alphabets and type styles, with more complex forms yielding lower efficiencies, as one might expect from Gestalt theories of perception. In fact, we find that efficiency is inversely proportional to perimetric complexity (perimeter squared over "ink" area) and nearly independent of everything else. This, and the surprisingly fixed ratio of detection and identification thresholds, indicate that identifying a letter is mediated by detection of about 7 visual features.
0
Citation413
0
Save
8

The Bouma law accounts for crowding in fifty observers

Jan Kurzawski et al.Apr 14, 2021
+3
D
A
J
Abstract Crowding is the failure to recognize an object due to surrounding clutter. Our visual crowding survey measured 13 crowding distances (or “critical spacings”) twice in each of 50 observers. The survey included three eccentricities (0, 5, and 10 deg), four cardinal meridians, two orientations (radial and tangential), and two fonts (Sloan and Pelli). The survey also tested foveal acuity, twice. Remarkably, fitting a two-parameter model, the well- known Bouma law — crowding distance grows linearly with eccentricity — explains 82% of the variance for all 13 × 50 measured log crowding distances, cross-validated. An enhanced Bouma law, with factors for meridian, crowding orientation, target kind, and observer, explains 94% of the variance, again cross-validated. These additional factors reveal several asymmetries, consistent with previous reports, which can be expressed as crowding- distance ratios: 0.62 horizontal:vertical, 0.79 lower:upper, 0.78 right:left, 0.55 tangential:radial, and 0.78 Sloan font:Pelli font. Across our observers, peripheral crowding is independent of foveal crowding and acuity. Evaluation of the Bouma factor b (the slope of the Bouma law) as a biomarker of visual health would be easier if there were a way to compare results across crowding studies that use different methods. We define a standardized Bouma factor b’ that corrects for differences from Bouma’s 25 choice alternatives, 75% threshold criterion, and linearly symmetric flanker placement. For radial crowding on the right meridian, the standardized Bouma factor b’ is 0.24 for this study, 0.35 for Bouma (1970), and 0.30 for the geometric mean across five representative modern studies, including this one, showing good agreement across labs, including Bouma’s. We found that guaranteeing fixation by gaze-contingent display halved the standard deviation across observers of the estimated log b . The reduction in standard deviation is explained by a “peeking” model in which the observer looked near an anticipated target location in 50% of unmonitored -fixation trials. Individual differences are robust, as evidenced by the much larger 0.08 SD of log b across observers than the 0.03 SD of test-retest within observers. Crowding’s ease of measurement enhances its promise as a biomarker for dyslexia and visual health.
6

Cross-dataset reproducibility of human retinotopic maps

Marc Himmelberg et al.Apr 14, 2021
+3
N
J
M
Abstract Population receptive field (pRF) models fit to fMRI data are used to non-invasively measure retinotopic maps in human visual cortex, and these maps are a fundamental component of visual neuroscience experiments. Here, we examined the reproducibility of retinotopic maps across two datasets: a newly acquired retinotopy dataset from New York University (NYU) (n=44) and a public dataset from the Human Connectome Project (HCP) (n=181). Our goal was to assess the degree to which pRF properties are similar across datasets, despite substantial differences in their experimental protocols. The two datasets simultaneously differ in their stimulus apertures, participant pool, fMRI protocol, MRI field strength, and preprocessing pipeline. We assessed the cross-dataset reproducibility of the two datasets in terms of the similarity of vertex-wise pRF estimates and in terms of large-scale polar angle asymmetries in cortical magnification. Within V1, V2, V3, and hV4, the group-median NYU and HCP vertex-wise polar angle estimates were nearly identical. Both eccentricity and pRF size estimates were also strongly correlated between the two datasets, but with a slope different from 1; the eccentricity and pRF size estimates were systematically greater in the NYU data. Next, to compare large-scale map properties, we quantified two polar angle asymmetries in V1 cortical magnification previously identified in the HCP data. The NYU dataset confirms earlier reports that more cortical surface area represents horizontal than vertical visual field meridian, and lower than upper vertical visual field meridian. Together, our findings show that the retinotopic properties of V1, V2, V3, and hV4 can be reliably measured across two datasets, despite numerous differences in their experimental design. fMRI-derived retinotopic maps are reproducible because they rely on an explicit computational model of the fMRI response. In the case of pRF mapping, the model is grounded in physiological evidence of how visual receptive fields are organized, allowing one to quantitatively characterize the BOLD signal in terms of stimulus properties (i.e., location and size). The new NYU Retinotopy Dataset will serve as a useful benchmark for testing hypotheses about the organization of visual areas and for comparison to the HCP 7T Retinotopy Dataset.
1

EasyEyes — Accurate fixation for online vision testing of crowding and beyond

Jan Kurzawski et al.Jul 18, 2023
+4
A
M
J
Online methods allow testing of larger, more diverse populations, with much less effort than in-lab testing. However, many psychophysical measurements, including visual crowding, require accurate eye fixation, which is classically achieved by testing only experienced observers who have learned to fixate reliably, or by using a gaze tracker to restrict testing to moments when fixation is accurate. Alas, both approaches are impractical online since online observers tend to be inexperienced, and online gaze tracking, using the built-in webcam, has a low precision (±4 deg, Papoutsaki et al., 2016). The EasyEyes open-source software reliably measures peripheral thresholds online with accurate fixation achieved in a novel way, without gaze tracking. EasyEyes tells observers to use the cursor to track a moving crosshair. At a random time during successful tracking, a brief target is presented in the periphery. The observer responds by identifying the target. To evaluate EasyEyes fixation accuracy and thresholds, we tested 12 naive observers in three ways in a counterbalanced order: first, in the lab, using gaze-contingent stimulus presentation (Kurzawski et al., 2023; Pelli et al., 2016); second, in the lab, using EasyEyes while independently monitoring gaze; third, online at home, using EasyEyes. We find that crowding thresholds are consistent (no significant differences in mean and variance of thresholds across ways) and individual differences are conserved. The small root mean square (RMS) fixation error (0.6 deg) during target presentation eliminates the need for gaze tracking. Thus, EasyEyes enables fixation-dependent measurements online, for easy testing of larger and more diverse populations.
Load More