Vous êtes sur la page 1sur 170

PERCEPCIN Y ATENCIN

Andrs Catena

Tema 1: INTRODUCCIN

1. Sensacin y percepcin
2. Cuestiones perceptuales
3. Niveles de anlisis perceptual
4. Funciones visuales bsicas

BIBLIOGRAFA
Goldstein (Caps. 1, 2, 3, 4)
Matlin y Foley, (Caps. 1, 3, 4)
Vergs, C. (2002). La percepcin visual. Qu vemos y cmo vemos. Microciruga
Ocular, 4. http://www.oftalmo.com/secoir/secoir2002/rev02-4/02d-02.htm

Necesidad de usar informacin sobre el medio para conocerlo, comprenderlo y


adaptarse mejor a l es precisa una maquinaria que transforme energa del
medio en conocimiento.
Sensacin: experiencias bsicas provocadas por estmulos aislados
(dimensiones). Tienen modalidad, pero no significado (intensidad luminosa ->
brillo).
Percepcin: proceso por el cual las sensaciones se integran y organizan,
produciendo el reconocimiento de objetos y escenas.

La intensidad luminosa e una traduccin del estmulo. La sensacin de brillo no nos


permite un componente adaptativo sin ms.
El proceso perceptual

OBJETO
EXTERNO

rganos
sensoriales

Cerebro Msculos

OBJETO
EXTERNO

Empieza siempre en un objeto externo. Slo existe si est ese objeto, que afecta de
alguna manera a los rganos sensoriales (ojos). Ese estmulo enva hacia nuestros
rganos sensoriales una determinada informacin. Esa energa es transducida por los
rganos sensoriales. La transduccin es pasar de un tipo de energa a otra. Es el primer
paso de la percepcin. Los rganos sensoriales realizan algunas operaciones que son
completadas. Es el inicio de todos los procesos internos que van a dar lugar al
reconocimiento del objeto. Esa serie de transformaciones culminan una orden para que
el cuerpo realice una actividad para dirigirse al propio objeto. Es un proceso circular
reiniciado por el objeto externo. La identificacin es utilizada para programar una
respuesta adecuada al objeto.
Realismo ingenuo. La percepcin se produce porque las cosas son como son: las
cualidades preceptales estn ya en los objetos. Lo que nosotros hacemos es capturar lo
que las cosas son , nosotros funcionamos como meros detectores de las cualidades que
ya estn presentes en los objetos.
Por qu rechazar el realismo ingenuo?
Diferencias entre el estmulo fsico (distal) y el estmulo efectivo, su
representacin en el rgano sensorial (proximal).
Explicar la percepcin a partir del estmulo proximal (en visin,
tambin el patrn ptico).
El estimulo proximal depende de la posicin del sujeto ante el objeto
que hace que la proyeccin cambie. Si el estmulo proximal cambia
es segn la posicin del sujeto. Lo que nosotros tenemos que tener en
cuenta es el estmulo distal.
Razones fundamentales
Fenmenos perceptuales en visin
Filtro sensorial
Diferencias entre observadores
Diferencias intraobservador
El estmulo cercano tiene un patrn de proyeccin dependiente del punto de vista del
observador.
Distal-Proximal

La constancia perceptual pone en evidencia la necesidad de entender la percepcin a


partir del procesamiento posterior al estmulo proximal.

Fenmenos perceptuales:
i) imgenes diferentes son interpretadas de igual forma

La maquinaria perceptual aade cosas. Desde el punto de vista perceptual la sombra y la


no sombra son del mismo color. Si el sistema perceptual captara las cosas tal como son
en el globo diramos que es rojo y negro. Imgenes diferentes pueden dar lugar al
mismo precepto.

ii) Imgenes idnticas pueden dar lugar a perceptos diferentes

Ilusin de la luna: Basada en la estimacin de distancia que se da entre el objeto


y el observador. La imagen retiniana es idntica, siendo el estmulo distal idntico.

Nosotros vemos la luna ms grande cuando est en el horizonte que la que est en el
znit. La maquinaria aade a la distancia a lo que ve el ojo que est la luna.
Jarrn con caras: Unas veces apreciamos caras y otras veces el jarrn.

iii) Ilusiones perceptuales

Los vemos diferentes aunque son iguales.


iv) e incluso se perciben elementos no presentes en la escena

Antropoide
marciano

Retcula de Hering

Tringulo de Kanisza

En las clulas ganglionares se han producido la creacin de puntos difusos que


no existen ( Retcula de Hering) .

La maquinaria ha aadido algo en la propia retina, est aadiendo algo desde el


inicio.
Tringulo de Kanisza: Estamos haciendo una inferencia. Esta inferencia est
basada en supuestos razonables.

Filtro sensorial

Somos sensibles slo a porciones de todo el rango de estimulacin fsica


posible. Procesamos solamente una parte de la informacin total
disponible.
- Algunas especies son capaces de
capturar frecuencias de sonido
inaudibles para la especie humana.
Gato domstico 100-32,000 Hz
Perro domstico 40-46,000 Hz
Elefante Africano
16-12,000 Hz
Murcilago
1000-150,000 Hz
Roedores
70-150,000 Hz
Humanos
20-20,000 Hz

- Algunos animales son


sensibles a la porcin infrarroja
del espectro, nosotros no.
Serpientes como la vbora,
la pitn o la boa constrictor
son sensibles al infrarrojo

El filtro sensorial es importante porque lo que percibimos es lo que somos capaces de


captar.
Diferencias interindividuales

Dentro de la misma
especie. El mundo visual
es ms borroso para los
recin nacidos y bebs
que para los adultos.
Deficiencias perceptuales
debidas a lesiones (p.ej.:
acromatopsias, agnosias).

Visin normal: ocho


Dficit en el rojo-verde: tres
Ceguera al color: no nmero

Cuando se produce en el envejecimiento se produce diferencias en la periferia del


sistema. El cristalino deja de poder abombarse. Hay tambin factores de carcter
peritorio , como lesiones por golpes, hemorragias cerebrales, etc.

Los bebs perciben 8 ciclos por grado de ngulo visual. A los 3 aos son ms elevadas,
18 ciclos por grado de ngulo visual. A medida que el nio se desarrolla el mundo
visual aumenta. Conforme vamos madurando va incrementando la agudeza, al principio
el mundo visual es bastante borroso.
Agnosias: Lesin en el crtex circular que le produce dificultad para reconocer objetos.
Si no falla en la variable tctil es agnosia. Pone de manifiesto que la visin depende de
muchas circunstancias ( lesin parieto-temporooccipitales).
Diferencias intraobservador.

En un mismo individuo los


perceptos de un mismo
objeto pueden cambiar,
aunque el objeto mismo no
cambie.
El cambio puede depender
del contexto del objeto, de
lo que se sepa sobre l e
incluso del tiempo que se lo
est observando.

Qu es lo que hace que el gris se vea diferente siendo igual? El contexto . Un cambio
en esto puede determinar como lo percibimos.

Conclusin:
- El realismo ingenuo es rechazable:
o Porque el estmulo relevante para comprender como percibimos es el
proximal, no el distal.
o Porque la maquinaria perceptual no es irrelevante para comprender como
percibimos.
La maquinaria capta
La maquinaria aade
2. Cuestiones perceptuales
- A pesar de las numerosas dificultades, lo impresionante es la veracidad general de
nuestra percepcin.

Para explicarla es preciso contestar a dos cuestiones, una sobre ejecucin


perceptual y la otra sobre competencia perceptual
Ejecucin perceptual

Gibson (1950), Koffka (1935). Por qu las cosas parecen lo que son?

Respuesta trivial: porque el sistema perceptual est construido como lo


est.
Respuesta constructiva: Cules son los factores que hacen que las cosas
parezcan lo que son?

Factores internos: Arquitectura perceptual

las primitivas perceptuales (building blocks): Rasgos,


Segmentos de borde, Frecuencias Espaciales, ?

el substrato neural: Retina, reas visuales cerebrales


el resultado perceptual: la experiencia subjetiva.

Factores externos:

Caractersticas fsicas de los estmulos (color, textura, )


Forma de presentacin.

MESA

XXXX
MESA

No enmascarada

Enmascarada

Competencia perceptual

Marr (1982): Qu significa ver?

Gibson (1979). Ver es estar sintonizado a ciertas caractersticas


invariantes del patrn ptico. Y estar preparado para comportarse de
cierta forma ante la estimulacin Objetos como los tringulos de
Kanisza son irrelevantes (ecolgicamente invlidos) para estudiar la
percepcin.
Estar preparado para captar el gradiente de densidad de textura. Slo cambia
cuando el sujeto cambia el estado de la superficie que se acerca o aleja del
individuo

Marr (1982). Ver es construir una representacin del ambiente. Las


tareas perceptuales (reconocer, navegar,...) se solucionan por inferencias
(computacin) a partir de esas representaciones.

La percepcin como un problema inverso: reconstruir los


objetos y eventos a partir de sus proyecciones bidimensionales.
Indeterminacin.

Es lo que hace que seamos capaces de detectar la profundidad y la distancia.


-Marr: La percepcin sin inferencia es un proceso insoluble. La cantidad de datos que
tenemos disponibles son la proyeccin retiniana, que es insuficiente para saber
reconocer objetos. Adoptar supuestos sobre los objetos posibles, restringir las
interpretaciones posibles del mundo y determinar que es lo que hay presente.
Importante: Percibir es un proceso absolutamente indeterminado.
Una representacin mental que nos sirve para comportarnos de manera adaptativa.
Cualquier tarea perceptual requiere un paso, es un paso inferencial (requiere un
razonamiento). Esto no significa que sean conscientes.
Frecuentemente en la realidad no interpretamos un crculo como tal, sino de manera
tridimensional. Para percibir es necesario inferir, y en esto el conocimiento previo es
muy importante. Se computa de forma inconsciente.

3. Niveles de anlisis
De qu forma van a obtenerse los datos necesarios para comprender la
percepcin?
Es necesario adoptar distintos niveles de anlisis. Distinguimos tres
(Sekuler y Blake, 1994): psicolgico, biolgico y terico.
Psicolgico: Evala el comportamiento ante los estmulos (TR, la
precisin de la conducta, ...)
Naturalista/fenomnico: recoleccin y organizacin de
experiencias perceptuales ante estmulos naturales. La
expresin verbal de esas experiencias como dato.
Sndrome de Anton (ceguera completa negada):
experiencias perceptuales y conocimiento son
cosas distintas (c.fr. Nisbett y Wilson, 1977)
Experimental: Control y manipulacin de los factores
para provocar efectos.
Sndrome de Antn: Puede ser consecuencia de un traumatismo. La consecuencia del
individuo est tambin falseada. Hay una disociacin entre lo que el individuo cree que
ve y lo que est pasando a nivel perceptual.
La experiencia perceptual. El sujeto niega que sea ciego. En un relato de este tipo puede
ser un dato interesante. El procedimiento de obtencin del dato no garantiza la
veracidad del dato.
- Controlamos los factores asociados al estmulo y a la respuesta. Son datos ms fiables
que los tipos subjetivos. Es el que se usa actualmente.

Biolgico. Percibir es un proceso biolgico: hay que conocer los circuitos


anatmico-funcionales implicados en la percepcin. Distintas tcnicas:

Lesin cerebral/neuropsicologa. qu problemas de inferencia?


El efecto de una lesin tiene como consecuencia que un rea que no se
activa en condiciones normales si se activa. Slo es capaz de identificar
por la luz que predomina. El sujeto normal identifica correctamente los
colores independientemente de la luz que predomina.
Zeki et al (1999). PB ve dependiendo de cmo est iluminado el objeto.
Puede percibir perfectamente si el iluminante es mayor en ese color que
del otro. Para ver luz roja tiene que haber ms verde que azul. Lo que
predomina es la que ve.
Una lesin puede afectar un proceso perceptual clarsimamente. Si hay
una lesin en una zona: hay un dficit perceptual, esa zona est
encargada de ese procesamiento. Segn Zeki el V4 es la zona de
percepcin del color.

Potenciales evocados. Actividad elctrica cerebral en respuesta a un


estmulo (actividad masiva).
Si est registrando actividad de la corteza cerebral, la est registrando
con una resolucin temporal enorme, y por eso estamos en condiciones
ptimas para el registro por muy breve que sea.

Tcnicas de exploracin (fMRI, PET, CAT). Imaginera cerebral


mecnica.
Es la contraparte al EEG en cuanto a la resolucin. Escaneado del
cerebro en funcionamiento. Resolucin espacial muy alta. rea cerebral
que est implicada en el proceso con bastante definicin.

Registros unicelulares. Qu sujetos experimentales?

Terico. La explicacin completa de cualquier proceso psicolgico tiene


que explicitar (Marr, D. (1982). Visin) tres niveles:

Implementacin. Soporte fsico (biolgico)


Algortmico. Representacin para la entrada y la salida del proceso
(PSICOLGICO).
Computacional: Qu hace el sistema perceptivo? Porqu lo hace?
Teoras de la percepcin. Hay que indicar el propsito de todo
proceso Para qu? El objetivo del proceso perceptual es la
adaptacin. Es aplicable a la percepcin y a la ingeniera de
computadoras.

Nota:
Loreta. Roberto Pascual Marqui. Sabemos el rea cerebral el origen que es la encargada
de activar: potenciales evocados.
Tcnicas de extrapolacin: Leer en braile palabras concretas o palabras abstractas Hay
diferencias al procesar?
Si tenemos 2 o 1 nivel la comprensin es parcial.
9

Enfoque empirista. Berkeley (1709): el aprendizaje hace que las experiencias


sensoriales se combinen para producir la percepcin. Helmholtz, Marr: la tarea
perceptual implica inferencia (inconsciente).
Enfoque de la Gestalt. Fundamentacin racionalista (Descartes, Kant). La
relacin entre los elementos es lo que crea una forma, una configuracin que no
se entiende a partir de la suma de las partes aisladas. Holismo e isomorfismo.
Enfoque de la teora del estmulo. Es verdad que la informacin
proporcionada por el estmulo es ambigua e insuficiente? La percepcin es
directa porque el organismo captura invariantes perceptuales (Gibson, 1979).
Enfoque del procesamiento de la informacin. Es ms una manera de hacer
teora que una teora en s. Representaciones y procesos. Se caracteriza porque
por primera vez el proceso perceptual se subvine en procesos componentes, es
una explicacin analtica, descompongo el problema en partes y hago un anlisis
de las partes.

Explicar la percepcin es reducible a explicar los procesos internos:


1)
2)
3)
4)

Comprender lo que es una imagen perceptual.


A partir de la imagen se construye el esbozo primitivo.
Imagen tridimensional 2 D.
Representacin autnticamente tridimensional.

- Enfoque computacional de Marr. Etapas del proceso: imagen, esbozo primitivo,


esbozo 2-D y Representacin 3-D.
Cuando consideramos la textura de la superficie, lo que est claro es que el
dibujo es ms denso cuanto ms se aleja de nosotros. Si captamos la
densidad de la textura captamos la distancia. El estmulo puede dar
informacin no ambigua y adecuada para que hagamos una percepcin
correcta. Gibson 3er enfoque.

Las etapas de la percepcin visual

Imagen retiniana. Matriz bidimensional cuyos elementos representan niveles


de intensidad luminosa. (Matriz: Conjunto de nmeros ordenados en filas y
columnas).
En 1 imagen que se forma en un plano. Entendemos las imgenes como
intensidades y podemos entenderla como cuantificable. La imagen es un conjunto de
nmeros que representan intensidad luminosa (Matriz de nmeros).

Etapa basada en la imagen (Corresponde con el esbozo primario de Marr)


Objetivos:
Identificacin de lmites, lneas, terminaciones y manchas.

10

Agrupacin local de elementos.


Emparejamiento de elementos entre las dos proyecciones
retinianas.
Primitivas de la imagen:
Estructura de luminancia de la imagen.
Geometra bidimensional.
La imagen es una matriz de dos dimensiones.
Marco de referencia retiniano.
Las coordenadas de los elementos primitivos estn centradas en
la retina.
Etapa basada en las superficies

Qu caractersticas de las superficies produjeron las propiedades observadas


en la imagen?

Representacin en tres dimensiones de las superficies visibles.


Corresponde con la 2.5D de Marr.
Primitivas de la superficie:

Parches 2-D localizados segn pendiente de la superficie y


distancia al observador.

Geometra tridimensional
Marco de referencia centrado en el observador.

Las coordenadas estn referidas a la posicin espacial del


observador.

Dividir la escena en trozos


(parches). Una vez dividida
voy a determinar si cada
parche est ms cerca o ms
lejos de m en cada parche. Si
yo calculo su distancia a mi
de cada parche tengo
informacin de profundidad.
Si no todos estn a la misma
distancia de mi es que es una
escena 3D.

11

Etapa basada en el objeto

Representacin tridimensional de superficies visibles y ocluidas (que no


podemos ver). El objetivo es determinar la curvatura y la distancia de los
objetivos. Curvatura: Seleccionamos regiones de la superficie que se llaman
parches. Es una representacin subjetiva y puede ser inconveniente para el
proceso.

Perspectiva volumtrica:

Primitivas volumtricas:

Las formas se construyen mediante la agregacin de partes 3D con


coordenadas centradas en el propio objeto.

volmenes realmente tridimensionales, v.gr.: conos generalizados

Geometra tridimensional.
Marco de referencia centrado en el objeto.

Es un crculo con un eje, lo desplazamos el crculo hacia arriba a lo largo del eje y lo
que obtenemos es un cono generalizado o un cilindro.
Las coordenadas son tridimensionales.
Es posible determinar el eje. Podemos ver las coordenadas de cualquier objeto.
Etapa basada en la identidad

Recuperar las propiedades funcionales de los objetos.

Pueden
emanar directamente de las propiedades visibles (affordances:
puede cogerse?).
Tambin
pueden producirse de modo indirecto, primero se clasifica el
objeto como miembro de una clase y luego se accede a sus propiedades.
12

4. Funciones visuales bsicas

Estmulo luminoso
Medidas
Sistema visual
Formacin de la imagen en la retina
Movimientos oculares

EL ESTIMULO
- La luz es la proporcin del espectro electromagntico a la cual somos sensibles:
entre 350 y 750 nm.
o Somos insensibles a la inmensa mayora del espectro. Cuando ms nos
situamos cerca de los 300 nm nos acercamos al azul y a 750 nm al rojo (
en medio se encuentran los dems colores).
En funcin de la longitud de onda de la luz percibimos diferentes colores.
Para explicar la percepcin del color necesitamos conocer los parmetros
para describir la luz.
ESTIMULOS ELEMENTALES
Enrejados sinusoidales. Graduacin de grises en el eje horizontal. Ms intensidad en las
zonas claras y menos en las zonas oscuras, segn el eje horizontal (Perfil de
luminancia). Nos dice la intensidad del eje horizontal. Perfil de intensidad luminosa del
estmulo (funcin trigonomtrica).
Eje horizontal: desplazamiento en el espacio.
Eje vertical: Intensidad luminosa.

Perfil de luminancia: Cuando nos situamos en la parte izquierda de parche la intensidad


es bastante alta y a partir de hay decrece.

13

Enrejados Sinusoidales

Perfil de
luminancia

Enrejados de onda cuadrada


Estmulo Compuesto

En una funcin coseno, una


funcin trigonomtrica. Lo
podemos describir como una
onda. La distancia entre los
mximos de luz es constante, en
trminos ondulatorios eso es la
longitud de onda.
2) La periodicidad de este parche
es mayor. Tiene 3 ciclos. Cuando
cambiamos la intensidad
luminosa lo que hacemos es
reducir el desplazamiento de la
onda, la amplitud de onda.

2) En este vara el perfil de luminancia. Hay una diferencia obvia y la distancia


entre pico y vale es la misma en uno que en otro, pero hay una diferencia y es que el
nmero de barras es superior entre el patrn que otro. Uno se repite ms a menudo que
en otro, hay ms diferencia.
3) Eje horizontal: Es igual al otro pero las barras negras en su mxima
ENREJADOS DE ONDA CUADRADA
No es una onda cosenoidal, sino cuadrada.
Los patrones de enrejado donde la divisin es perfecta se pueden obtener funciones
sinusoidales punto a punto. Cualquier patrn luminoso lo podemos describir utilizando
funciones sinusoidales.
Si cogemos dos ondas y las uno punto a punto obtenemos un enrejado.
Si medimos la intensidad luminosa a lo largo del eje horizontal la funcin del perfil de
luminancia sera rectangular. Es un enrejado de onda cuadrada, no es describible. Slo
con una funcin seno, la transicin en la intensidad luminosa es suave.
Cmo se puede construir un enrejado de onda cuadrada?
- Para conseguir el 3 enrejado lo obtengo con suma simple de intensidades
luminosas. Variando un solo de los enrejados el cambio resultante cambia.
Podemos sumar patrones elementales para obtener en otro ms complejo.
- Sumando un conjunto de enrejado sinusoidales infinito obtenemos un enrejado
de onda cuadrada.
Un estmulo complejo se puede obtener sumando simples sinusoidales.

14

Modulacin sinusoidal. Parmetros

Diferencia entre funcin coseno (empieza en un mximo) y la seno est desplazada a la


derecha.
Seno: La longitud de onda es la distancia entre picos consecutivos, se expresa en
nanmetros.
Funcin seno: Alcanza su primer mximo despus de que lo ha alcanzado la otra
funcin.
Funcin coseno:
Las dos funciones son absolutamente idnticas pero solo hay una diferencia en
desplazamiento lateral.
Hay una distancia entre un pico y un valle de la misma onda, distancia en el eje vertical,
es la amplitud total del eje ondulatorio, si la dividimos por dos estamos obteniendo la
distancia entre la lnea horizontal y la zona de reposo.
Intensidad: Suele medirse en escala de Belios. Es una escala relativa ( una intensidad
respecto a otras),.
Longitud de onda: Se mide en metros. Habitualmente se expresa en nanmetros (mil
milsima de metro). Es simplemente la distancia entre dos picos consecutivos de la
funcin, expresad en nanmetros.
Frecuencia: Si el eje horizontal representa tiempo, entonces no hablamos de estmulo
luminoso sino de sonido. La frecuencia en este caso es el nmero de veces que se
presenta el patrn sinusoidal por unidad de tiempo. Nmero de ciclos por unidad de
tiempo. Ciclos por segundo o hercios.

15

2 ciclos por seg: 2 hercios


Si en ese espacio hablamos de frecuencia espacial, que tambin se mide teniendo en
cuenta el nmero de ciclos de la funcin N de ciclos por unidad de longitud es
arbitraria (metros, centmetros).
Frecuencia:
Si la abcisa es tiempo; se mide en hercios (Hz). Un hz es un ciclo por segundo.
Si la abscisa es espacio: Frecuencia espacial. Se mide en ciclo por unidad de longitud.
Amplitud;
Intensidad. Suele medirse en escala de Belios. Es una escala relativa (una intensidad
respecto de otra).
N de belios: log (I / I)
Distancia en ciclo de reposo y cuando la unidad alcanza el mximo.
Sonido: Suele medirse en escalas los arrtmicas o decibelio.
Fase:
Distancia entre el origen de la modulacin sinusoidal y el primer mximo.
La forma de medir el desplazamiento lateral. Cuando una diferencia a recorrido 270 la
diferencia de fase entre seno y coseno en este caso sera 90 (entre seno y coseno
simple). La fase es distancia al origen en 1 grado.
Desfase; Diferencia de fases entre dos modulaciones sinusoidales.
El seno est desplazado 90 del coseno. Eso es el desfase.
Frecuencia: N de ciclos por segundo.
(Sonido: 20 Hz: 20 ciclos por unidad de tiempo).
La frecuencia en luz se va a expresar por nmero de ciclos por unidad de longitud.
Expresar la frecuencia de ciclos por unidad de longitud sino se tiene en cuenta la
distancia que hay entre el observador y el objeto.
ANGULO VISUAL

tag ( / 2) =

S
2d

=>2/(2*600)
Supongamos:
=> 0.19 gav
S = 2 cms y d= 6 metros
Qu g.a.v. subtiende el objeto?

Podemos medir el ngulo


visual?
Si conocemos el tamao del objeto y la distancia entre el objeto y el observador.
Frecuencia Espacial:

Ciclos por grado de ngulo visual o Ciclos


por unidad de longitud (c/cm)

16

d: distancia entre el objeto y el observador.


s: tamao del objeto.
La tangente de la mitad del ngulo es el tamao del objeto partido por el doble de la
distancia.
Si lo expresamos por ciclos por longitud tendr diferente valor dependiendo de la
distancia.
La pila Cuntos grados de ngulo visual?

6 cms

1)

2)
Desfase de 180 entre 1 y 2

3)

Desfase de 90 /2 entre 1 y
3
Qu frecuencia espacial tienen?

Si estuviesen situados a 4 m c/gav?

1 y 2) => 2 /6 cms = 0.33 c/cm


3) => 1.75/5.25 =0.33 c/cm

gav => 0.859 2/0.859 = 2.33 c/gav


?

Frecuencia: Expresada en ciclos/ cms y ciclos por g.a.v.


Sabiendo que el observador est situado a 4cm.
1y 2) 2/6 cms: 0.33 c/cm
3) 1.75/ 5.25= 0.33 c/ cm
g.a.v: 0,859: 2/ 0.859= 2.33 c/ g.a.v

Diferencias en orientacin de la modulacin sinusoidal

17

Los enrejados sinusoidales difieren en su intensidad como un enrejado sinusoidal


cualquiera.
En el segundo caso no es igual. Si en el 1 enrejado no cambia la intensidad a lo largo
del eje vertical, en el 2 caso si.
Orientacin: Nmero de grados que tenemos que rotar un enrejado para convertirlo en
un enrejado vertical sinusoidal.

El ngulo que se encuentra entre el eje oblicuo de la modulacin y el eje


horizontal es la orientacin de la modulacin sinusoidal. (Transparencias)
Las medidas de la amplitud luminosa son de dos tipos bsicamente:
- Radiomtricas: tienen en cuenta toda la potencia emitida por la fuente
luminosa y se basan en:
Flujo radiante, que se mide en watios. 1W = 25,9 lm luz de 450
nm.
Intensidad radiante: W/Sr
Irradiancia: W/m2. 1W/cm2 =6.83 por 106 lux/m2
Radiancia: W/ cm2/ Sr. 1W/ cm2/ Sr = 6.83 cd/m2 a 555 nm.
- Fotomtricas: tienen en cuenta slo la potencia en el espectro visible,
la curva de sensibilidad espectral:
Flujo luminoso: Lumen. Bombilla de 60w = 900 lm.
Intensidad luminosa: candelas = Lm/ Sr. 1W/Sr = 683 cand si
555 nm.
Iluminancia. Lux =lm/ m2. Luna llena 0.2 0.3 lux
Luminancia. Candelas/ m2. Luz de 100w = 150 cd.
La cantidad de luz que llega a una superficie es la iluminancia y la cantidad de
luz que es reflejada por esa superficie es la luminancia.
El flujo es la cantidad de luz emitida solamente.
Lumen: Flujo total de luz emitido por una fuente luminosa.
En una direccin concreta del espacio y en un lugar determinado del espacio.
Iluminacia:
Es la cantidad de energa luminosa por metro cuadrado de superficie iluminancia.
Cantidad de luz que llega a una superficie.
La unidad es de luz: 1 lumen por m2
Luna llena: o.2 -0.3 lux
Luminancia:
Es la cantidad de luz reflejada por una superficie. La unidad que se emplea es la candela
por metro cuadrado.

18

Otra medida sera situar una superficie a una cierta distancia de la fuente luminosa. Si
hacemos eso tendremos una medida de Irradiancia o Iluminancia: la cantidad de luz que
llega a una superficie plantea situarla a cierta distancia. La unidad es el lux: lumen por
metro cuadrado.
Luminancia: La radiancia es lo mismo pero con todo el espectro.
Superficie a cierta distancia: Refleja luz ms o menos y por tanto esa superficie se
convierte en una fuente luminosa. Esa fuente luminosa es una superficie se llama
tambin fuente de luz difusa.
Luminancia: La cantidad de luz emitida por una fuente difusa se mide en candelas por
metro cuadrado.
A los psiclogos slo nos interesan las medidas fotomtricas y en concreto las dos
ltimas.
Sol: 10.000.000.000. Cd/m2
Bombilla de 100w. 150 cd/ m2
Si medimos una esfera estamos midiendo el flujo.
La relacin entre luminosa e iluminacia nos puede describir como percibimos el brillo
de las cosas:

19

Campo visual: Regin del espacio exterior al individuo que proyecta a la retina del
individuo. Es asimtrico. En la horizontal tenemos 180 y en la vertical 130.
El punto del espacio al que mira el observador es el punto de fijacin. El rea total que
afecta a las retinas se distribuye de la siguiente manera.
Campo visual derecho: A la derecha del punto de fijacin o hemicampo visual derecho.
Si lo dividimos en la vertical una lnea pasa por el punto de fijacin de campo visual, se
llama cuadrante.
Cuadrante superior izquierdo. A la izquierda del punto de fijacin y encima de este.
Cuando nos estamos mirando hay un punto determinado del campo visual o punto de
fijacin. Es importante porque divide el campo visual en dos mitades: izquierdo y
derecho. Tambin lo divide en la vertical: desde el punto de fijacin hacia arriba tiene el
campo visual superior y del punto de fijacin hacia abajo el campo visual inferior.
En las retinas se forma el estmulo proximal que viaja hacia el cortex visual pasando por
los nervios pticos, cruzamiento en el quiasma ptico y de hay a los tractos pticos.
Ncleos geniculados laterales y cortex visual.
El campo visual proyecta en el cortex al revs en la horizontal tal y en la vertical
invertida.
Lo que est en el campo
visual izquierdo acaba a la
derecha y la derecha a la
izquierda Por que? Cada ojo
tiene un campo visual propio.
Todo el campo visual no se
proyecta ambas retinas. Hay
parte que se proyecta
H.
exclusivamente a un ojo y
H.
H.
TEMPORAL
H.
TEMPORAL NASAL
NASAL
parte a otro. Hay una parte
que es especfica a cada ojo y
parte que se proyecta
binocularmente.
Se invierte de izquierda
a derecha y de arriba
abajo.
Nota:
Estimulo visual--------- Retina----------Quiasma
laterales------ Corteza Estriada V1

ptico-----Cuerpos

geniculados

Tlamo
Colculo pulvinar

Lo que se proyecta en el hemisferio temporal contina su viaje en el mismo hemisferio,


la nasal cruza al otro hemisferio.

20

RETINA

Lugar
donde se produce
la transduccin
sensorial.

Estructuralmente
compuesta de capas:
fotorreceptores,
horizontales, bipolares,
amacrinas y
ganglionares

La pupila es responsable de que la luz cambie de camino a lo largo del ojo.


Crnea: Cristalino: Humor vtreo: Retina: En ella es dnde se produce la transduccin:
coroides: esclertica.
Transduccin: Se transforma en energa electroqumica.
El cristalino tiene 2 caras: anterior lo que pega a la pupila y posterior pega al humor
vtreo. Tiene la capacidad de cambiar su curvatura anterior.

Retina: Est en la parte posterior del ojo y realiza el primer procesamiento de estimulo
sensorial, transduccin de luz a energa nerviosa.
Podemos distinguir varias capas. La ms importante es la de fotorreceptores con la capa
de salida de la retina. (Clulas ganglionares). Sus axones forman el nervio ptico.

21

Conos, bastones: La siguiente capa son las clulas bipolares que conectan los
fotorreceptores con la capa de salida de la retina (clulas ganglionares) Sus axones
forman el nervio ptico.
FOTORRECEPTORES
Conos: 10 veces menos sensibles a la luz que los bastones. Pueden diferenciarse en
varios subtipos.
Visin fotpica, diurna.
Se encuentran en la fovea preferentemente, centro ptico del ojo, y slo hay conos en la
parte central del a fovea o foveola.
- Sensibilidad a todas las longitudes de onda pero hay y conos
especializados, se activan ms ante determinadas longitudes.
- Conos de onda corta. 440 nm (cono del azul). Cono S. Necesita muy
poca cantidad de luz azul para activarse. Tienen un pico de actividad
en longitud de onda alrededor del azul.
-

Cono de onda media.530 nm. Cono M. ( cono verde)


Cono de onda larga. 560 nm. Cono L. (Cono del rojo).
Unos 8 millones por ojo.

Son muy frecuentes en la fovea, en su centro slo hay conos.

BASTONES
Visin nocturna y se caracteriza porque son mucho ms sensibles a la luz que los conos.
Necesitamos menos intensidad luminosa para activar un bastn.
Hay ms bastones que conos.
-

Fuera de la fovea los bastones son ms que los conos. A 17 de la


fovea la densidad de bastones es mayor y a partir de hay va
disminuyendo.
Son sensibles a todas la longitudes de onda de 350 nm -750 nm, pero
no son sensibles por igual a todas ellas, son ms sensibles a la gama
de colores entre el azul verde.

22

Todos tienen la misma curva de sensibilidad.


Visin escotpica/ nocturna.
Unas 10 veces ms sensibles que los conos.
Slo hay un tipo.
Unos 120 millones/ojo.

Cualquier bastn de la retina va a responder de la misma manera cuando le cambiamos


la longitud de onda. Su respuesta si depende de la longitud de onda. Son muy sensibles
a longitudes medias. Abundan por doquier en la retina excepto en la fovea. Vas
descendiendo la cantidad conforme nos acercamos a la periferia.
EL 15 respecto a la fovea no hay fotorreceptores (punto ciego) o disco ptico.
- Una 10 veces ms sensibles.
Los conos estarn encargados de la visin durante el da. (Fotpicas) mientras que los
bastones estn en condiciones escotpicas. En la foveola la densidad de bastones es
cero. Conforme nos alejamos a ambos lados la densidad aumenta.

Curvas de sensibilidad espectral: En el eje


horizontal tenemos longitudes de onda. La
longitud de onda es psicolgicamente el color. La
curva sirve para todos los bastones de la retina, e
indica que son muy sensibles a longitudes de
onda situadas a los 500 nm. Hay un solo tipo de
bastn y cuando lo alejamos de hay la
sensibilidad decrece, lo que significa es que
tenemos que percibir una intensidad muy alta
para que se pueda ver.
Hay tres tipos de conos. Azules, verdes y rojos. Conforme nos alejamos la sensibilidad
es cada vez menor.
3 Esta regin del amarillo (cono rojo). La sensibilidad mayor no es del rojo, sino del
verde- amarillo.
La distancia entre picos de cono verde-rojo es muy pequea, mientras que el azul la
distancia es muy grande.
Los conos azules no estn presentes en la fovea, el resto si.
CONVERGENCIA
En promedio hay una ganglionar por cada 130 fotorreceptores, esto es convergencia.
Se traduce necesariamente en prdida de informacin, lo que se pierde es resolucin
espacial, o lo mismo, agudeza visual.
Lleva a la prdida de informacin.
Cmo se produce sin que pierda informacin sustantiva?
Cmo se consigue mantener una sensibilidad y una resolucin adecuadas? Teora de la
duplicidad ( 0.03 cd/m2).

23

-Sensibilidad: Deteccin de cantidades mnimas de luz.


Se maximiza por que la retina la integra espacio-temporalmente. Cuanta menos cantidad
de luz necesite el sistema es ms sensible. Es necesario que el sistema tenga resolucin,
si presento dos luces el sistema debe ser capaz de determinar que hay dos luces.
Cmo se puede conseguir un equilibrio entre sensibilidad y resolucin=
El sistema de alta resolucin sera poco sensible, lo que reaccionar en situaciones de
alta sensibilidad luminosa. Un sistema funciona asi, y otro sistema que va a funcionar
como intensidad luminosa baja: El lmite entre un sistema y otro est situado 0.03
cd/m2 por encima actuara el de alta sensibilidad y por debajo en baja.
Cmo se consigue un sistema que tenga alta sensibilidad y otro que tenga alta
resolucin? El sistema de alta resolucin ser poco ms sensible.
Es un sistema doble, que trabaja con alta resolucin y con alta sensibilidad. Teora de la
duplicidad.
La consigue porque es capaz de integrar la informacin a lo largo del tiempo y del
espacio.

SUMACIN ESPACIAL Y TEMPORAL


-

Espacial: Ley de Ricco. Dentro de cierto rango de tamao. (dimetros


crticos de 0.06, fotpica, y 0.5 escotpica).

I x A= constante
I: intensidad del umbral
A: rea del estmulo
Un sistema altamente convergente la integra de modo natural, si es de baja convergencia
solamente en reas reducidas.
Se transmite a una ganglionar a travs de reas extensas de la retina.
Si medimos la I. luminosa mnima necesaria para que el sujeto detecte que la luz ese
umbral adquiere un valor.
La relacin entre Intensidad y rea es multiplicativa. Esta ley slo se mantiene en ciertas
condiciones.
Dentro de cierto rango de tamao (decmetros crticos de 0.06 fotpica y 0.5
escotpica).
La ganglionar produce una tasa de respuesta, independientemente de los fotorreceptores
estimulados.
Toda informacin que cae en los fotorreceptores se diluye en la ganglionar y slo queda
si ha habido o no estimulacin. Si incrementamos el rea tenemos que incrementar el
tamao del objeto.

24

Temporal: Ley de Bloch. Dentro de cierto rango de duraciones


(crticas de 20 mseg, fotpica, 150 seg. Escotpica).

I x D: constante
I es la intensidad del umbral, D es la duracin del estmulo.
La retina suma a travs del tiempo la informacin que se le est proyectando. Si estamos
en visin fotpica la duracin mxima es de 20mgs: visin fotpica, el rango de tiempo
es bastante mayor en escotpica, 150 seg.
Esta sumacin temporal, si nos salimos del rango crtico no produce integracin.
Si incrementamos la intensidad tenemos que disminuir la duracin.
Si queremos mantenernos en el umbral, y viceversa.
Si no integramos informacin a travs del tiempo no podramos ver.
El sistema es capaz de esperar a activarse un cierto tiempo. La cantidad de tiempo
depende si es de da o es de noche. Dentro de cierto rango de duraciones (crticas de 20
ms, fotpica 150 ms, escotpica).
En el umbral el sujeto percibe la mitad de las veces. Si en el umbral disminuimos la
duracin el sujeto deja de percibir.

TEORA DUAL: EQUILIBRIO SENSIBILIDAD-RESOLUCIN.


-

La convergencia mejora la sensibilidad (por la sumacin), pero


reduce la resolucin: la extensin en el tiempo o en el espacio
deteriora la determinacin del momento y el lugar en que la
estimulacin ocurre.
Una resolucin a este problema: usar dos sistemas fotorreceptores:
uno sensible (que integra espacio-temporalmente) y el otro con alto
grado de resolucin espacial y temporal (que necesita mucha energa
para funcionar, pero es fino).
Evidencia acerca de los dos sistemas: adaptacin a la oscuridad y
efecto Purkinge.

ADAPTACIN A LA OSCURIDAD
- Incremento en la sensibilidad visual que se produce como consecuencia de la
permanencia en oscuridad, tras una exposicin a la luz:
Procedimiento:
-

Exposicin a la luz intensa durante un tiempo corto.


Exposicin a ambiente oscuro donde se presentarn los estmulos
para la medicin del umbral. Mtodo de lmites.
Slo series ascendentes.

25

Obtencin de una curva que pone en relacin la mnima energa


detectable con el tiempo en la oscuridad.

La curva de adaptacin a la oscuridad:


-

Temporal: Bajo: conos


Tiempo de permanencia mayor de 10 min. Bastones.

La exposicin a luz solar ( ej: playa) hace ms lenta la


adaptacin e incrementa el umbral.

Por ms que permanezca en la oscuridad del sujeto la adaptacin a la luz es la misma. Si


proyectamos a 15 grados de la fovea, la curva sera 1. Primero se adaptan los conos y
despus los bastones.
Cuando cambiamos de luz a la oscuridad siguen funcionando los conos y a partir de
unos segundos pasan al funcionar los bastones (7-10 min) cuando disminuye la
intensidad luminosa en el atardecer ocurre lo mismo. Cuando empieza a funcionar los
bastones vemos bastante mal.
La exposicin a la luz solar durante ms tiempo lo hace ms lenta, tardamos ms en
llegar a la mxima adaptacin y nos hace menos sensibles de forma permanente.
A los pilotos de avin se le recomienda que durante el da lleven gafas de sol.
EFECTO PURKINJE: Sensibilidad diferencial de conos y bastones.
- Conos y bastones son sensibles a casi todas las longitudes de la luz. Sin embargo, en
cada caso no es la misma para cada una de ellas. (Por ejemplo son ms brillantes
durante la noche o durante el da).
Cuando la iluminacin ambiental decrece hay colores que dejan de identificarse antes
que otros, el primero es el rojo, que tiende a desaparecer. Sin embargo el verde y el azul
siguen vindose durante ms tiempo.
Cambio aparente de los colores cuando cambia la luz.
Onda larga: rojos, ms brillantes cuando aumenta la luz drsticamente.
Onda media-corta: Ms brillantes cuando disminuye la luz drsticamente ( ej . verde).

26

E. Purkinge: Cambio en la deteccin de colores cuando la situacin ambiental cambia,


perdida en la deteccin de colores.

Conos y bastones son sensibles


a casi todas las de la luz. Sin
embargo, en cada caso no es la
misma para cada una de ellas.

Da

Noche

Qu recomendara a un piloto de avin para que se adaptase a la luz durante la tarde?

Ceguera nocturna: Deficiencia de Vitamina A, alcoholismo, glaucoma, drogas, desrdenes


hereditarios. Miopa. Edad

Cuando llega la noche pasamos de visin fotpica a escotpica (nocturna). No hay


suficiente luz para que se activen los conos, que son los que procesan el color rojo (
onda larga) , as los procesarn los bastones pero se ver con ms o menos brillo. Y las
longitudes medias bajas se vern ms brillantes con menos luz porque los procesan los
bastones.
Los conos estn ligados a la visin del color.
En general los conos son ms sensibles, pero hay casos en las que no. El pico de
mxima sensibilidad de los conos esta en 500 y los bastones en 530 (regin del verde).
Respecto de los conos que son los encargados en la visin del color son ms sensibles al
verde, por lo que necesitan ms intensidad luminosa para percibirse.
Los bastones son literalmente insensibles en la regin del rojo (onda larga).
Qu recomendara a un piloto de avin para que se adapte a la luz durante la tarde?
Caer en la cuenta de que la alta sensibilidad pertenece a los bastones, si nosotros
filtramos una luz diurna con unas gafas adecuadas vamos a poder seguir viendo durante
el da para que los conos se adapten (gafas rojas).

27

DE LA RETINA A LOS NGL


Las clulas ganglionares M (magno, grandes) se ubican fundamentalmente en la
periferia de la retina, codifica donde estn los objetos y proyectan en su mayora al
ncleo geniculado lateral (NGL) aunque tambin a otras estructuras, como los colculos
superiores. Los colculos estn encargados del control de la direccin de la mirada.
Las clulas ganglionares P (parvo, pequeas) se ubican especialmente en la fvea y
proyectan al ncleo geniculado lateral.

Los ncleos geniculados laterales envan al crtex visual


informacin sobre donde estn los objetos (clulas M) y
que son clulas P, parvo y que color tienen.
Las clulas magno envan informacin sobre
localizacin de los objetos parvo capas 3-4-5-6 de los
ncleos geniculados ligadas a la forma color del
objeto.
En los ncleos geniculados laterales entre las clulas
parvo estn las clulas K envan informacin del
procesamiento del color.
De los ncleos geniculados laterales envan informacin
al crtex. La informacin (de un rea) procedente de la
parafovea est representada en el crtex.
El crtex visual primario est estructurado en 6 capas, 4 de las es la capa de entrada de
4c aunque los axones procedentes de las clulas conio llegan a las capas 2 y 3.
A la capa 4 llegan los axones procedentes de los NGL.
Las capas superiores e inferiores a 4c reciben informacin procedente de 4C.

y el crtex

V1

tiene 6 capas:
A la capa 4C llegan los axones
procedentes de los NGL (excepto K).
Las capas superiores e inferiores a 4C
reciben informacin procedente de 4C.
V1 tiene organizacin retinotpica
(Kaas y Collins, 2001)

Capa 1
Capa 4c
Capa 6

V1 tiene organizacin retinotpica (Kaas y Collins, 2001)

28

V1 est compuesto por un conjunto de


prismas, llamados hipercolumnas.
Cada hipercolumna contiene las 6 capas
de clulas, y analiza la informacin de un
rea de la retina. Hipercolumnas
adyacentes analizan reas adyacentes en
la retina. Cada hipercolumna contiene una
columna por cada ojo.

V1
est
compuesto por un
conjunto
de
prismas, llamados
hipercolumnas.
Hipercolumna
contiene las 6
capas de clulas, y
Clulas binoculares (en capas
En el centro de cada
En disposicin radial
diferentes de 4C). Cada
columna una gota
analiza
la
respecto de los blobs
columna tiene dominancia
(blob) analiza el color,
hay clulas simples y
informacin
de
un
ocular. La estimulacin
mediante clulas doble
complejas agrupadas
concurrente de ambas
oponente centrorea de la retina.
radialmente que
conduce a la estereopsis.
periferia
detectan orientacin.
Hipercolumnas
adyacentes analizan reas adyacentes en la retina. Cada hipercolumna contiene una
columna por cada ojo.
Clulas binoculares (en capas diferentes de 4c). Cada columna tiene dominancia ocular.
La estimulacin concurrente de ambas produce la esterepsis (3 dimensiones). Se
produce porque hay clulas binoculares en las hipercolumnas y si se activan
simultneamente se produce esterepsis.
- En el centro de cada columna hay una gota (blob) analiza el color mediante clulas
doble oponente centro-periferia.
- En disposicin radial respecto de los blobs hay clulas simples y complejas agrupadas
radialmente que detectan orientacin.
- Blob dentro estn las clulas de campo receptivo de doble oponente.
En el cortex visual primario se extrae informacin sobre esterepsis, color y orientacin.
Despus del rea visual primario se extrae informacin sobre esterepsis, color y
orientacin.
Despus del rea visual primaria viaja en direccin anterior del cerebro, atraviesa V2,
V3, V4 Y V5.
Las vas visuales son, bsicamente, dos:
Va ventral qu : sus lesiones producen fallos de reconocimiento:
- Agnosia visual: fracaso en el reconocimiento. Puede ser de dos tipos:
asociativa, en la que no se reconocen los nombres de las cosas, y
aperceptiva, la forma. Incapacidad de copiar objetos. Aperceptiva.
Tiene un problema en la identificacin de la forma del objeto.
- Prosopagnosia: no se reconocen las caras. Lesin en la regin del giro
fusiforme.
Va dorsal dnde: las lesiones parietales producen fallos en la localizacin
de objetos y en la gua de la accin.
- Ataxia ptica: buena localizacin pero no alcance. (Sndrome de
BALINTSimultagnosia y ataxia). Lesin en el parietal superiorataxia ptica , si hay varios objetos presentes en la escena slo puede
localizar al que estn atendiendo ( simultagnosia). Es un problema
que implica atencin y percepcin.
- Neglect: es espacial.

29

Negligencia (neglect)

Agnosia
Copia
1990)

Test Barcelona

Emparejamiento (Farah,

Cul tiene la misma


funcin que el de abajo?
Coloca los nmeros en la esfera
del reloj

Iguales o diferentes?

CAMPO RECEPTIVO
-

El rea de la retina cuya estimulacin afecta a la actividad de una


neurona (cambia su actividad).
Es el rea del campo visual en la que cuando se presenta un estmulo
cambia la actividad de la zona a la que implica.
Se han descrito una gran variedad de campos receptivos a lo larga de
la va visual. El que ms nos interesa es el de las clulas ganglionares
ms frecuentes: el centro- periferia.
Los campos centro- periferia: simetra circular, regiones antagnicas.
El antagonismo se llama tambin inhibicin lateral. El centro y la
periferia tienen funciones contrapuestas y as pueden cancelar su
accin: antagonismo lateral o inhibicin lateral. Dos tipos:

( El campo receptivo tambin es la regin donde presentamos el E, la actividad de la


neurona cambia. Esta regin donde la actividad cambia es el campo receptivo).
-

Las clulas ON-OFF: Tienen centro excitador y periferia inhibidora.


Responden ms cuando la luz incide en su centro.
Las clulas OFF-ON: Tienen centro inhibidor y periferia excitadora.
Responden ms cuando la luz incide en su periferia. Cuando la luz
incide sobre el centro la actividad de la neurona se reduce.

30

V1 tiene cuatro tipos fundamentales de clulas,


segn su campo receptivo:
Centro-periferia, igual que en NGL

Simples, con campos receptivos elongados,


que se activan mximamente cuando una
lnea de una orientacin y anchura
particulares incide sobre la regin
correspondiente de la retina.

Complejas, con campos receptivos


similares a los de las simples, aunque las
lneas pueden incidir en un rea ms
extensa (muestran invarianza posicional), y
disparan ms a lneas en movimiento.

Tambin hay clulas hipercomplejas, que


responden a ngulos y a segmentos que
terminan dentro del campo receptivo

Qu funciones desempean las clulas centroperiferia?


Codificar el tamao: las clulas responden mejor a
estmulos que se ajustan bien a su campo receptivo.

+
-

A
B

+
-

B: Esta clula recibe


luz en el centro y en la
periferia por tanto no
se altera la actividad
base.
A: Esta clula
incrementar su tasa
de disparo por parte de
la periferia no recibe
luz.

C
D

Codificar la anchura de la barra luminosa. Es lo mismo que decir


que las clulas centro-periferia codifican la frecuencia espacial.
D: A su tasa de disparo.
C: Centro y periferia reciben luz y oscuridad. As la clula no
altera su tasa.
Ay D funcionaran como un detector de barras luminosas de determinada anchura ( A:
anchas, D : estrechas).
Codifican el tamao de la barra.

31

Si la frecuencia espacial es alta ( del enrejado )las barras sern estrechas ( clula D) y si
es baja sern anchas ( clula A).
No son detectores muy especficos. Si podemos la barra de la clula A ms ancha o ms
estrecha , pero no demasiado ( dentro de 1 rango)

A seguir activndose para


detectarlas. Estos detectores son insensibles a la orientacin del enrejado.

Insensibles a la orientacin del estmulo.

Deteccin de bordes: El antagonismo centro periferia es pobre para


detectar cantidad de luz, pero excelente para indicar la presencia de lmites,
bordes, contornos o contrastes en la escena visual. Ej.: Bandas de Mach.

+
-

+
-

+
-

+
-

Perfil de luminancia y brillo


percibido

La rejilla de Hermann.

+
B

A
C

A: Centro-Periferia (C-P) se cancelan.


Actividad base.
B: Mayor cancelacin que A. Menor
actividad.
C: Menor cancelacin que D. Mayor
actividad que D.
D: C-P se cancelan. Actividad base
i) Los puntos entre las intersecciones no
focalizadas se perciben oscuros.
ii) Desaparecen cuando se intenta
enfocarlos.
iii) Los campos receptores foveales son
pequeos (hay poca convergencia). Los
campos receptores peri y parafoveales son
mayores.

La actividad de A debe ser mayor que la de B (C-P se cancelan menos). La


respuesta de C y D debe ser prcticamente idntica y baja

32

Las clulas C-D procesan tamao, son insensibles en la orientacin y son


especialmente buenas para detectar bien los cambios de intensidad luminosa, algo que
ayuda mucha a percibir la forma.
-

La activacin de A debe ser mayor que B. C- D se cancelan menos.


La respuesta de C y D debe ser prcticamente idntica y baja.

A, B llega ms luz que hasta A, por tanto hay ms cancelacin. Al realizar el


procesamiento de los bordes es cuando vemos los puntos negros entre los cuadros
aunque no sean reales.
Funciones de clulas
simples y complejas

Sekuler & Blake (2004)

Hay clulas simples que son detectoras de barra.


Hay otras simples que son detectoras de bordes.
Las complejas son detectoras de orientacin del Estmulo. No pueden distinguirse zonas
excitatorias o inhibitorias. Parecen estar mezcladas al azar relativamente porque hay
una preferencia.

33

La formacin de la imagen en la retina

El ojo es un medio ptico.


La luz en un medio ptico
sufre:
- La luz puede ser
absorbida por el
medio ptico.
- Puede ocurrir
tambin que la luz
sea refractada en la
crnea, y ah se
diluye (dentro de
la cornea). La
atmsfera es azul
por la dispersin y
las que ms se
dispersan son las
longitudes de onda
cortas.

El rayo tambin puede ser transmitido.


El rayo tambin puede ser reflejado por la superficie del medio ptico
( se refleja luz en los ojos).

El ojo es un medio ptico. La luz en un medio ptico


sufre:

Rayos
refractados
Rayo
Rayo
absorbido dispersado

Rayo
Transmitido

Rayo
reflejado

Siempre cambian de trayectoria.

34

DISPERSIN: Cambio de trayectoria de los rayos luminosos debido a las molculas


suspendidas en el aire. Es mayor cuanto mayor es la capa de medio. Contribuye a la
borrosidad de la imagen retiniana.

Cuanto ms lejos del observador ms tonicidad que adquieren (onda corta) y se


adquieren con mayor borrosidad. Es la clave que se utiliza para la profundidad.
Para que nosotros seamos capaces de ver los objetos es importante que la luz incida
sobre ellos y la refleje. Cuando la atmsfera esta sucia es un medio ptico que produce
mucha cantidad de dispersin y el efecto es la borrosidad de la escena. Es una escena
que es difcil de procesar. Cuanto menor es la longitud de onda menor es la dispersin.
La longitud de onda que ms se dispersa es el azul, por eso vemos el cielo azul.
Difraccin
Es tambin un cambio de trayectoria, pero producido por interaccin con un cuerpo
opaco cercano. La pupila es su causante principal. Contribuye a la borrosidad de la
imagen. Conforme nos alejamos en cualquier direccin vemos imgenes secundarias,
indeseables en la retina. La consecuencia de la difraccin es la borrosidad de la imagen.
La difraccin slo se produce en el borde. Si el haz luminoso es ms pequeo que la
pupila entonces no sufre difraccin. Si el haz luminoso es ms pequeo que la pupila
entonces no se produce refraccin.
La DIFRACCIN es tambin un cambio de trayectoria, pero producido
por la interaccin con un cuerpo opaco cercano. La pupila es su causante
principal. Contribuye a la borrosidad de la imagen.

Todas las superficies REFLEJAN al menos parte de la luz que incide sobre ellas. La
REFLECTANCIA es su capacidad para reflejar la luz. Se obtiene dividiendo la cantidad
reflejada (luminancia) por la recibida (iluminancia).
35

R=L/I
Superficie mate

Espejo

Para nosotros no hay ninguna consecuencia determinada. El punto de vista de la imagen


retiniana. La reflexin es importante para que nosotros podamos ver, que la luz que
refleje los objetos hacia nosotros.
Tipos de superficie:
Superficies pulidas: El extremo mximo en el espejo que refleja la luz de una forma
predecible. La trayectoria depende del ngulo de reflexin igual siempre al ngulo de
incidencia.
Superficie mate: Puede reflejar la luz en cualquier direccin. Se explica porque la
superficie mate es rugosa y el ngulo de incidencia cambia y por eso cambia el ngulo
de reflexin.
En esta los ngulos de incidencia pueden cambiar infinitamente. El sistema visual est
esencialmente diseado para percibir esos cambios, para medir la reflectancia.
Luminaria: Cantidad de luz emitida por una superficie. Reflexin:
Se mide como un cociente:
Luminaria
Iluminancia
La REFRACCIN es un cambio en la trayectoria que se produce en el lmite entre dos
medios transparentes
El cambio de trayectoria se produce cuando hay un cambio de medio ptico, que pasa
siempre en la visin (interior del ojo). Es especialmente importante en la visin porque
es la responsable de que la imagen de la escena se forme ntida en la escena. Sin ella no
hay visin, lo hay una visin borrosa.

36

Normal
N1=1.00

Se produce cuando la velocidad de la


luz es diferente de un medio a otro.
El cambio de trayectoria es explicado
por la ley de Snell:
n1 sen 1= n2 sen 2
El ndice refractivo (n) de un medio es
el cociente entre la velocidad de la luz
en el vaco (c) y su velocidad en ese
medio.

N2=1.336

2
El cristalino humano tiene un ndice
refractivo de 1.413

La luz que respecto de la superficie del medio ptico tiene inclinada. Hay que
medir la cantidad de inclinacin, normal superficial o normal a la superficie en un
punto. La normal es una perpendicular a la superficie plana (ngulo de 90) . El ngulo
de incidencia se mide: el ngulo que forma el rayo luminoso con la normal superficial Z
o como es el ngulo en el primer medio ptico lo llamamos Z.
Si la luz viaja a la misma velocidad en el medio uno que en el medio dos entonces no
habra refraccin.
Si la luz viaja a la luz diferente en un medio que en otro, la refractancia produce que la
luz viaje en un medio diferente velocidad que en el otro. El incide refractivo es un
cociente entre la velocidad de la luz en el vaci y la velocidad de la luz en ese medio.
El producto del ndice refractivo ( n) de un medio entre la velocidad de la luz en el vaco
( c) y su velocidad en ese medio.

REFRACCIN Y CURVATURA
La refraccin depende tambin de la curvatura del lmite entre los dos medios
transparentes.
La curvatura de la crnea es fija (7,80 mm).
La curvatura del cristalino (en mm):
No Acomod. Acomod.
Anterior
10.00
5.00
Posterior

-6.00

-5.00

37

La potencia refractiva del cristalino se debe, pues, a la curvatura de su cara


anterior.

NDICES REFRACTIVOS

- Recordemos que n=c/v, donde c es la velocidad de la luz en el vaco y v es su


velocidad en ese medio.
-

AIRE.
n=1.00
LQUIDOS (AGUA). n=1,336.
CRISTALINO.
n=1,413.
Vtreo, Acuoso, Cristal. n=1,336

Varias curvaturas en el ojo:


1 Cornea: La capacidad de esta de refractar la luz es fija.
2 Cristalino: Tiene dos superficies curvar, anterior y posterior. Es adems una lenta
flexible, puede cambiar su curvatura. Es el responsable fundamentalmente de que no
tengamos que usar gafas. Ese cambio de curvatura (acomodacin, reduccin del radio)
es un cambio de su capacidad de refractar la luz.
El radio de curvatura de la cara anterior es de 10.00 cuando est acomodado , y de 5.00
cuando no.
Cuando esta acomodado su capacidad de refractar es mayor.
-La luz converge sobre la retina debido a que es refractada por lo medios pticos del
ojo.
- La capacidad de una superficie para hacer converger un haz de rayos en un punto es su
potencia refractiva. Se mide en dioptras.
- La dioptra es la inversa de la longitud focal en metros.
-La longitud focal es la distancia entre el centro de la superficie y el punto donde hace
converger los haces luminosos.
Si la imagen se forma ntida debido a la capacidad de los nervios pticos, la capacidad
de cambiar la refraccin se llama potencia refractiva del medio que es media con la
dioptra: capacidad que tiene el medio para hacer converger la luz. La longitud focal del
medio ptico es la distancia focal, es la inversa de la longitud focal expresada en
metros. Una lente que tiene una longitud focal de 0,2, tendr una dioptra de 1/ 0,2.

38

- La dioptra es la inversa de la distancia focal en metros.


- Una lente cuya potencia sea 5 dioptras tiene una distancia focal de 0,2 metros.
- Potencia refractiva de los medios oculares:
No Acom.
Acom.

CRNEA:
CRISTALINO

43,08 D

43,08 D

ANTERIOR

7,70 D

POSTERIOR

12,83 D

15,40 D

59,60 D

68,22 D

OJO COMO UN TODO

15,40 D

La potencia refractiva de los medios oculares. La crnea tiene una curvatura fija y el
cristalino una curvatura variable. (Acomodacin).
La crnea tiene una potencia refractiva 43,08 dioptras. Mientras que no cambie el radio
de curvatura de la cornea, no cambia la potencia refractiva.
El cristalino tiene el doble de dioptras cuando est acomodado.

REFRACCIN Y MEDIOS PTICOS


- Factores de la refraccin
- Crnea
- Cristalino
- Distancia crnea-cristalino (longitud de la cmara anterior del
ojo).
- Longitud axial del ojo ( aproximacin 1mm=3D)
Cuando los 4 factores tienen valores normales este ojo ser emtrope (forma exacta en
la retina la imagen del objeto).
-Amtrope: Ojo anormal en cuanto a la refraccin.
- Esfricas: Un punto de luz forma un nico punto de la imagen en la retina.
- Hipermetropa: Menos potencia refractiva de la necesaria dada la longitud del ojo.
-Miopa: Ms potencia refractiva de la necesaria, dada la longitud del ojo.
- Presbicia: Dficit en la acomodacin.
-Cilndricas: Un punto de luz forma ms de un punto de la imagen en la retina.
-Astigmatismo: Error en la curvatura de la crnea.
NOTA:
Hipermetropa: Una imagen borrosa en el plano de la retina porque la imagen ntida se
forma despus de la retina. Eso puede deberse a la longitud axial del ojo, es demasiado
ptico para la capacidad refractiva. No tiene ninguna facilidad para enfocar objetos
cercanos.
Infinito visual: A partir de hay el objeto subtiende rayos paralelos al observador.

39

No puede enfocar lo cercano, los


rayos divergentes se formarn ms
atrs.
a

Presbicia o vista cansada: Aparece


con la edad, 40-45 aos y depende
d
de si el individuo a sufrido otra
tag a/2 = S/(2d)
anomala esfrica. Consiste en una
anomala de acomodacin. El
cristalino y los msculos filiares van
perdiendo la capacidad de acomodacin del ojo, no se cambia la curvatura y la
refraccin es rgida.
S

ANOMALAS CILNDRICAS
Astigmatismo: Es una anomala en la curvatura de la crnea.
Astigmatismo mixto: Un estmulo forma dos imgenes en el ojo. Una antes de la retina
y otra detrs de la retina. Las dos imgenes son borrosas.
AGUDEZA VISUAL
- Capacidad para ver detalles finos de los objetos ( Agudeza= Potencia
Refractiva)
- Los resultados de agudeza pueden expresarse en trminos de grados
de ngulo visual.
NGULO VISUAL: Es el ngulo que subtiende los lmites del objetivo con respecto al
observador. Depende de la distancia observador objeto y el tamao del objeto.

L Prueba de agudeza de reconocimiento. Pedir que diga el nombre del objeto. Test de
Snellen. La agudeza visual de un observador normal es de 1 minuto de arco en este test.

Indicar la posicin de la abertura del objeto. (Agudeza de resolucin. Test de

Landont). En qu posicin hay un cambio de la intensidad luminosa significativo?

Enrejados de onda cuadrada Ves barras alternantes o un gris homogneo?


30 seg de arco: la agudeza visual.

40

(Punto) Se le presenta al observador uno slo de esos elementos y se le pregunta si esta


hay. Agudeza de deteccin. Agudezas normales de segundo.
Agudeza de Vernier: Si esas 2 barras estn alineadas formadas en una lnea nica. 1-2
seg de arco.
Diferentes medidas de agudeza (Olzak y Thomas, 1986).
-

Agudeza de reconocimiento o identificacin. Test de Snellen ( 1de


arco)
- Agudeza de resolucin: requieren captar separaciones entre partes de
los estmulos. Test de Landolt. Patrones de enrejado (30 de arco).
- Agudeza de deteccin: Se ha presentado objetivo? (0,5 de arco).
- Agudeza de Vernier o de localizacin: alineamiento de rectas (1-2
de arco).
No se suele tener en cuenta el grado de contraste ni el tiempo, factores de los cuales
tambin depende la agudeza.
Notacin de Snellen: minutos de arco (ngulo mnimo de resolucin)- Decimal.
Observacin: Mtrico 6/6: Ve lo que nuestro observador y lo que ve un observador
normal en metros.
Imperial. Es lo mismo pero en pies.
Decimal: Uno partido el ngulo mnimo de resolucin. La que ms se emplea
habitualmente.

Cuando disminuimos el contraste


entre el fondo y la letra va
disminuyendo la agudeza.
-Nuestra sensibilidad al contraste
es menor a medida que nos vamos
a la derecha de ese enrejado.
Curva de sensibilidad al contraste:
Que grado necesita el observador
para percibir un objeto a una
frecuencia determinada.
Para cualquier individuo que
conozcamos esta curva estamos
conociendo
la
caracterstica
compleja de su sistema visual.

41

Y FINALMENTE..
Si tenemos un ojo emtrope y la potencia refractiva normal, podemos tener la impresin
de la imagen que se forma en la retina es normal. Cualquier imagen en la retina por muy
normal que sea es borrosa. Se debe a que cuando la luz atraviesa un medio ptico la luz
sufre una dispersin, que es igual a decir que las caractersticas del estmulo no se
preservan en la salida del medio ptico.

La luz emitida por el estimulo


atraviesa el medio ptico, y la luz que
sale del medio ptico no tiene las
caractersticas de la luz que llega.
Tiene una intensidad semejante a las del
estimulo en el centro, pero en cualquier
direccin que nos alejemos la intensidad
luminosa en la imagen es diferente.
Funcin de dispersin del punto (PSF).
Es una medida que sufre cualquier punto
luminoso cuando atraviesa un medio
ptico. O bien tenemos la atenuacin de
Contraste (la transformada).
El negro no es tan negro y el blanco no es tan blanco, se ha reducido el contraste o
modulacin del contraste. Que se produce siempre que la luz atraviesa el medio ptico.
La atenuacin del contraste es diferente: Se reduce ms en las frecuencias altas que en
las bajas.
Multiplicar el contraste por la modulacin, que depende de la frecuencia espacial.
Tambin depende del dimetro de la pupila o el radio.
Cuando mayor es el dimetro de la pupila mayor modulacin se produce.
Modulacin del contraste: Funcin de transferencia de modulacin. Convolucin de
funciones con la letra de Snellen sera una letra borrosa. Si el punto no se proyecta
ntido la imagen que proyecta cualquiera estmulo tampoco se proyecta ntida.
Son ms borrosas cuando ms pequeo es el detalle de la imagen.
MOVIMIENTOS OCULARES
- Objetivo: Mantener focalizados los objetos sobre la fvea. Necesarios
porque:
- Muchos objetos son dinmicos
- Nuestro propio movimiento.
- Dos clases fundamentales:
- Movimientos de versin (el ngulo entre los ejes longitudinales de los ojos =
constante).
- sacdicos: realizando tareas como leer, los ojos dan saltos (sacdicos) en
lugar de realizar un movimiento gradual. Son rpidos de ejecucin (50 milisegundos,
unos 600 /s) , pero lentos de preparar ( 250 milisegundos).

42

-movimientos de persecucin. Implicados en el seguimiento de objetos en


movimiento. Son lentos (hasta 100/s). Han desempeado, desde Berkeley, un papel
importante en la explicacin de la percepcin de profundidad.
Movimientos que tienen un objetivo, que es que la imagen del objeto se forme en la
zona de la retina donde tenemos ms agudeza visual, en la fovea o en la foveola. Esos
movimientos son imprescindibles porque:
- Porque muchos objetos son dinmicos, y ese hecho no excluye que
tengamos inters en ellos. Para mantenerlos enfocados en la fovea.
- Porque nosotros tambin nos movemos y tenemos inters en ver
objetos que no se estn moviendo como nosotros.
- Dos clases fundamentales:
-Movimientos de versin:
- Movimientos de convergencia:
La diferencia es que los movimientos de versin son siempre movimientos conjugados
(que ambos ojos realizan simultneamente y en la misma direccin del espacio). ( el
ngulo entre los ejes longitudinales de los ojos es constante).
Varios tipos de movimientos de versin, el ms importante es el movimiento sacdico o
scada. Es un movimiento conjugado extraordinariamente rpido en su realizacin,
brusco que se puede conceptuar como si los ojos saltan de una posicin a otra (leyendo
una lnea, arriba de la pgina, debajo de la pgina). Movimientos muy rpidos y sin
embargo son movimientos que requieren un tiempo largo para ser programados. El
promedio de planificar es 250 milisegundos. Es un movimiento preciso a la posicin del
espacio que queremos procesar a continuacin.
Movimientos de persecucin: Lento en su realizacin, suave y suele realizarse cuando
tenemos en el campo visual un objeto en movimiento. Son movimientos de naturaleza
gradual.
Por ejemplo: Movimiento vestbulo ocular (cuando el lugar de ser el objeto que se
desplaza es el observador el que se desplaza).
El sistema neuronal que los controla es literalmente diferente.
Movimientos de vergencia: Son movimientos no conjugados o disyuntivos. Lo que
cambia es el ngulo formado por los ejes longitudinales de los ojos que se muevan en
direcciones opuestas pero a la misma velocidad. Han desempeado un papel importante
en la explicacin de la percepcin de profundidad.

43

TEMA

2.

PERCEPCIN

DEL

COLOR
1.- Utilidad de la visin del color
2.- Descripcin psicofsica del color
- Dimensiones del color
- El crculo colorimtrico
3.- Procesamiento basado en la imagen
- Mezcla de colores
- Teoras basadas en la imagen.
- Modelos geomtricos
- Teora Trigonomtrica
4.- Procesamiento basado en las superficies
Constancia del color: Teora Retinex

Goldstein, Cap. 6.
Matlin y Foley, Cap. 7.
Gegenfurtner, K. (2001). Color in the cortex revisited. Nature Neuroscience, 4, 339-340.
Land, E. (1978). La teora retinex de la visin del color. Investigacin y Ciencia, 17,
Febrero.
Palmer, S.E. (1999). Vision Science (cap. 3). Cambridge: Bradford.
Zeki, S. (1995). Una visin del cerebro. Barcelona: Ariel.
Gegenfurtner, K. y Kiper, D.C. (2003). Color Vision. Annual Review of Neurosciences,
26, 181-206

1.- UTILIDAD DE LA VISIN DEL COLOR


- Deteccin
- Discriminacin
-Reconocimiento de objetos ( Gegenfunrther y Rieger, 2000).
2.- La intensidad luminosa es exactamente igual en todos los lados de la diapositiva.
Ahora emergen las flores ms claramente.
1.- Solo hay intensidades luminosas.
3.- Las dos cosas. Buena discriminacin
.Una utilidad fundamental es identificar
que los objetos estn presentes en la
escena.
Si hay ventaja de CC se debe a la ventaja
de compara test con la memoria del
primero.

44

Estmulos experimentales:
- En color
- En blanco y negro
El tiempo de exposicin del estmulo es variable.
Despus introducen una mscara patrn. Tienen longitud de onda igual a las del
estmulo previo.
Se presentan estmulos de la prueba. El sujeto debe indicar cual de los dos se haba
presentado inicialmente. Podan estar tambin en color en blanco y negro.
VI: El color del estmulo previo
El color de la prueba
Lo que medimos es la proporcin de elecciones correctas. Lo que observamos es que a
medida que incrementamos el tiempo de exposicin, aumentan las respuestas correctas
(Efectos principales del tiempo de exposicin del Estmulo)

45

Si el procedimiento del color no aadiese ninguna facilidad para identificar el


estmulo?
La condicin menor que B debe ser mejor, que en BB y eso es lo que ocurre. Con cortos
tiempos de exposicin indica una ventaja considerable en cuanto a la condicin no
color.
CC/ CB: El hecho de que haya color en la prueba tambin supone una ventaja, que
aparece ms tarde y se mantiene significativa hasta el tiempo mximo de exposicin.
Ventaja:
-

Estimulo coloreado
Prueba coloreada

Beneficia el reconocimiento de los objetos


Presentes en la escena.

Si hay diferencias en ejecucin entre las dos no se debe al prime, tiene que deberse a la
prueba. Es un beneficio de la memoria que se guarda del estmulo previo (ventaja
cognitiva).
CC/ BB: En ninguna de las dos pruebas est en color. La diferencia se debe en que el
estmulo previo tena color y en otra no. El proceso es mejor cuando haba color que
cuando no haba color (ventaja sensorial).
El color mejora la identificacin de objetos, en 2 niveles diferentes:
1.- Proceso sensorial
2.- Proceso cognitivo de la escena
Ventaja: Podamos ver el color.
Tambin mejora la velocidad con la que percibimos.
Cmo es que somos capaces de procesar color?
Depende de las caractersticas de nuestro sistema visual, y tiene que depender del hecho
de que tenemos ms de un fotorreceptor sensible cuando uno de ellos a diferente
longitud de onda.
Si tuvisemos slo 1 tipo de cono Podramos ver distintas longitudes de onda de la luz?
-

Incrementando la intensidad de longitud de onda puede percibir ms


ese color aunque no sea el que le corresponda.
2 Cono: (Cono L) naranja rojizo. Entre uno y otro la discriminacin
es perfectamente posible. El cono L diferencia entre las 2. Esto hace
que si modulamos la intensidad en este caso es imposible que
perciban la misma longitud de onda ya que no pueden ser
confundidos.

DESCRIPCIN PSICOFSICA DEL COLOR


Cuntos colores somos capaces de discriminar?

46

Si los colores se presentan simultneamente en zonas adyacentes,


parece que somos capaces de discriminar bastantes millones de
colores (McAdam, 1942; 2.8 millones, Pointer y Attridge, 1998).
Pero si los colores se presentan en sucesin, con intervalos de varios
segundos, el nmero se reduce hasta alrededor de 12 (Nilson y
Nelson, 1981)

Depende del modo en que hagamos la prueba de discriminacin de colores. Hay dos
tareas diferenciables, una que implica que los colores se estn presentando al
observador de modo simultneo y otro de modo sucesivo.
-

Presentacin sucesiva: Es ms difcil. Podemos basar una respuesta,


no se puede por comparacin, en este caso, el nmero de colores que
somos capaces de discriminar es infinitamente menor que de modo
simultneo.

DIMENSIONES DEL COLOR

El color percibido depende de tres caractersticas de la estimulacin luminosa:


matiz: es lo que normalmente llamamos color. Se asume que
depende de la longitud de onda de la luz. La traduccin, sin
embargo, no es directa, como prueba el efecto Bezold-Brke (el
matiz percibido de las longitudes de onda largas y de las cortas
depende de la intensidad luminosa). Incrementando la intensidad
las largas se perciben ms amarillas y la cortas ms azules.
Variando la longitud de onda cambia el matiz, pero tambin la
saturacin y el brillo.
saturacin: es la pureza del color. Las luces saturadas son
vvidas, las plidas tienen una baja saturacin. Depende de la
cantidad de gris aadida.
brillo: intensidad percibida de la estimulacin.

Al incrementar la intensidad los colores van cambiando. El rojo gira al percibirse ms


amarillo, y las longitud de onda corta viran al color. El matiz depende de la longitud de
onda. Variando la intensidad luminosa cambiamos tambin el matiz.
Saturacin: Cuando tenemos una sola longitud de onda en el estmulo decimos que la
luz es monocromtica y el color es completamente saturado. El color puro es de una
sola longitud de onda, y completamente desaturado (gris/blanco).

Longitud de onda, matiz, saturacin

Brillo: Cualidad psicolgica que est vinculada a la


del estmulo luminosa. Las dimensin oscila
dos extremos.
380-470:violeta
Baja: Negro
Alta: Blanco

intensidad
entre
los

470-490: azul
495-535 verde

Y efecto Bezold-Brucke

47

Parches: El color saturado pasa a mayor cantidad de luz blanca, se ha ido desaturando el
color. Saturacin por pureza del color.
El matiz depende de la longitud de onda. Efecto Bezold- Brucke. El matiz depende de la
intensidad luminosa.
Brillo (intensidad luminosa). Cuando es muy baja la apariencia de todos los colores est
cercana al negro, alta se percibe como blanco.

EL CIRCULO COLORIMTRICO (ANOMALOSCOPIO).


- La relacin entre los tres atributos del color: matiz, saturacin y brillo,
puede estudiarse mediante el crculo colorimetrico: dos semicrculos, en
que se presentan dos colores, uno fijo, y el otro variable. El sujeto puede
manipular la longitud de onda, la cantidad de gris que aade y la
intensidad-

campo de prueba
campo de mezcla

Es un instrumento simple: Estructura circular con una divisin central con 2


campos diferenciados. En uno de los campos se presenta 1 color determinado. Bajo
control del experimento, el otro campo es el campo de mezcla.
Qu combinacin necesita un observador para reproducir en el campo de prueba?

48

Foco: Luz roja


Media
Azul

Pedimos al observador introduzca tanta cantidad


como sea necesaria para obtener el color de prueba,
(reproducirlo).

Programa de mezcla de colores (Anomaloscopio).


Ver que cantidad de los tres colores necesito para igualar un color determinado. (A los
cuales somos altamente sensibles).
Otra opcin: Proyectar siempre en el campo de prueba un solo color simple e igualar esa
luz variando la cantidad e luz blanca, longitud de onda, saturacin y brillo.
PROCESAMIENTO BASADO EN LA IMAGEN (En la longitud de onda de la luz)
Si un rayo de luz blanca atraviesa 1 prisma se descompone en luces espectrales.
Cmo es posible esto? La luz blanca es una luz compuesta por luces monocromticas y
para que se separen es necesaria que sean refractadas de diferente manera. La luz ms
refractada es la luz azul, verde, amarilla y la menos refractada es la luz roja.

La luz del sol est compuesta de luces espectrales que no pueden


descomponerse ms:
- La refraccin es menor para las longitudes de onda largas que para las
cortas. Esto podra producir aberracin cromtica
- Mezcla de colores
Modelos
geomtricos de la percepcin del
color

La cantidad de refraccin de un rayo luminoso depende de la longitud de onda.


El cristalino refracta la luz y en la crnea (lo mismo que pasa en un prisma). La longitud
de onda es refractada igual en el prisma. Aberracin cromtica: la imagen que se forma
en la retina no es nica, sino tantas imgenes como componentes monocromticos tenga
la luz que llega hasta el ojo.
Azul
Verde
Rojo

Retina

Imagen

Azul
Verde
Rojo
49

Blanca

La imagen final es la suma de las 3.


Si hay aberracin cromtica, las 3
imgenes van a coincidir.
Si enfocamos en la regin del verde, la imagen del verde en el se forma en la retina.
Detrs de la retina: aberracin longitudinal.
Desalienada respecto del plano de la retina: aberracin transversal.
Importante: La refraccin supone un problema porque las imgenes se pueden formar en
diferentes posiciones en el plano vertical de la retina o
MEZCLA DE COLORES
La mezcla de luces monocromticas de diferente longitud de onda produce a menudo un
nuevo matiz, pero la mezcla no destruye los componentes

Hay dos tipos de mezcla: aditiva y sustractiva.


La mezcla aditiva se produce cuando se mezclan luces de distinta longitud de
onda.
Se llama aditiva porque la energa procedente de las distintas luces se
suma, incrementndose el brillo percibido.

Mezclando matices generamos matices nuevos que conservan los componentes que
tenemos mezclando para crear.
Mezcla:
-

Aditiva: Es la mezcla de luces. Se denomina aditiva porque la energa


luminosa total de la mezcla es la suma de los componentes. Cuanta
ms cantidad de luces monocromticas aadamos ms brillante va a
ser la mezcla. Contra ms sumamos la mezcla va a ser blanca.
Colores primarios: Rojo/ verde/ azul: Son suficientes para obtener
cualquier matiz. Es posible conseguir cualquiera de los matices del
espectro.

50

Sustractiva: Se produce cuando se mezclan pigmentos. Restamos


intensidades luminosas. Si por cada componente restamos
intensidades luminosas la apariencia es negra. Cuando empleamos
pigmentos, por cada pigmento que aadamos restamos intensidad
luminosa.

Colores metmeros: La mezcla de diferentes luces monocromticas puede producir el


mismo color resultante. Los colores complementarios forman metmeros.
Colores no espectrales: Algunos colores no se corresponden con ninguna longitud de
onda. El prpura es mezcla de azul y rojo, pero ninguna luz monocromtica produce
prpura.

.
- Colores complementarios: Son pares de luces monocromticas que producen grisblanco ( color acromtico) cuando se mezclan. Hay un gran nmero de
complementarios.
Cualquier par de color que cuando se mezclan producen gris o blanco son los colores
complementarios.
Cualquier color es un metmero (rojo, verde, azul, amarillo). Aparece a partir de los
experimentos con mezclas de colores. Muchos colores pueden obtenerse con muchas
mezclas de muchos colores (gris= diferentes sumas de colores). El metmero resultante
es el mismo, los colores componentes son diferentes.

51

Colores no espectrales: No encontramos ninguna longitud de onda que lo produzca. Son


colores que solo pueden obtenerse por la mezcla de otros colores: prpura. No hay
manera variando la longitud de onda del espectro de encontrarla. (Marrn tambin).

DIAGRAMAS DE CROMATICIDAD

Los diagramas tienen su origen en los primeros investigadores del color:


Newton, Helmholtz, Young, Maxwell, Grassman.
Fue Newton el primero que observ que la luz blanca estaba compuesta de
diferentes luces de color: si por algn medio las luces se separan unas de otras,
la de mayor anchura producir una sensacin de color Rojo, la menor o ms
corta, de un violeta profundo, y las intermedias, de colores intermedios
Newton, 1672)
-

Los diagramas tienen su origen en los primeros investigadores de


color: Newton y Helmorth.
Fue Newton el primero que observ que la luz blanca estaba
compuesta de diferentes luces de color: Si por algn medio las luces
se separan unas de otras, la de mayor anchura producir una
sensacin de color rojo, la menor o ms corta, de un violeta profundo.

EL CIRCULO DE COLOR DE NEWTON

Esta forma de representar el color dura 300


aos, hasta el ao 2000.
Lo que tiene de interesante es que representa
dos dimensiones. En el borde representa la
anchura, el matiz a lo largo de la
circunferencia en funcin de la anchura que
tiene la luz.
Conforme nos movemos del centro al
permetro del centro son colores desaturados
(en el centro), tiene apariencia blanca.
EL CRCULO DE
(Southall, 1937).

COLORES

REVISADO

52

Representa el matiz en el permetro y la saturacin por la cercana a la


circunferencia.
Los colores complementarios estn ubicados correctamente.
Permite predecir en gran medida la resultante que se obtendr de la mezcla de
colores.

Es una teora de percepcin del color. Una teora que tiene los miembros de la teora de
Newton.
Es igual que el de Newton en que es un crculo, la anchura en el permetro, y la
cercana al centro, perdida de saturacin del color.
- Le falta 1 parte donde no hay longitud de onda (pone prpura, la
regin de los no espectrales).
- La longitud de onda no se distribuye de forma uniforme, sino que es
aparentemente arbitrario.
- La distribucin de la longitud de onda parece arbitraria, pero estn
puestas as porque hay que explicar la mezcla de colores y en
concreto los colores complementarios y los metmeros.
- Estn puestas de manera que cualquier dimetro al centro une colores
complementarios. As puede predecir que no ocurre como la suma de
dos colores. Nos permiten que colores van a producir
complementariedad.
-

Representa el matiz en el permetro y la saturacin por la cercana a


la circunferencia.

Los colores complementarios estn ubicados correctamente

Permite predecir en gran medida la resultante que se obtendr de la


mezcla de colores.

- Determina cuales son los complementarios


-Como obtener metmeros
-No sabe lo que hacer con los prpuras

PROBLEMAS DEL CRCULO

El crculo es capaz de realizar buenas predicciones cualitativas sobre el color


resultante de la mezcla.
pero no es apropiado para hacer predicciones cuantitativas. Por ejemplo, no es
capaz de predecir adecuadamente la cantidad en que hay que mezclar dos
colores de 480 y 580 nm para producir su anulacin mutua.
Qu hacer con los colores no espectrales?

53

CIE

En 1931 la comisin internacional de la iluminacin, basndose en los trabajos


de Wright (1928) y de Guild (1931) estableci el estndar CIE.
La CIE utiliz unos estndares en los que la funcin de sensibilidad al brillo se
bas en la combinacin lineal de la intensidad de
tres estmulos
monocromticos

- Proporciones para mezclar tres colores ortogonales y obtener un metmero.


-El sujeto tena disponible tres focos: 650nm, 530 nm, 460 nm, la separacin de
longitud de onda es muy grande, cuando esto ocurre decimos que esos colores son
ortogonales porque ninguno de los tres se puede obtener mezclando los otros dos.
Podemos obtener la gama ms grande con tres ortogonales.

Se utiliz la variacin de intensidad de los tres colores para obtener el color de prueba.
Tenemos que cantidad. Si cantidades se necesitan de RLV/ AZUL para el color que
queremos obtener. Hay colores que necesitan una cantidad negativa de rojo, lo que
quiere decir que no se obtienen utilizando los tres colores primarios.

54

En el diagrama CIE se emplea tres colores bsicos, X (rojo), Y (azul) y Z (verde). Se


asume que X+Y+Z=1, luego se necesitan slo dos coordenadas, dado que Z= 1(X+Y)
Tiene elementos como en el permetro de la parbola
longitud de onda. La zona que no tiene ninguna
longitud de onda pertenece a los colores espectrales.
Si yo quiero tener una mezcla luminosa de 200=
80+80+40.

TEORA BASADAS EN LA IMAGEN

Las primeras posturas parten de los hallazgos realizados con la mezcla de


colores, fundamentalmente por Newton y Maxwell. La primera teora importante
fue expuesta formalmente por Young y Helmholtz: la teora tricromtica. Unos
cuantos aos ms tarde, hacia finales del XIX, Hering, expuso la teora
oponente.

TEORA TRICOMTICA

Puesto que es posible conseguir casi cualquier matiz mezclando tres colores
bsicos parece razonable adoptar como punto de partida la existencia de tres
tipos de fotorreceptores, diferencialmente sensibles a los tres colores bsicos.
David Brewster (1831), siguiendo a Newton, fue quiz el primero en medir la
sensibilidad diferencial al color.
Brewster crey que estaba describiendo las caractersticas fsicas de la luz, pero
en realidad describira la primera teora tricromtica.
La teora fue finalmente formulada por Helmoltz y Young quien escribi:

es completamente imposible concebir que cualquier punto de la retina contiene un


nmero infinito de partculas, cada una capaz de vibrar al unsono con cada posible
ondulacin, es necesario suponer que hay un nmero limitado, por ejemplo, a los tres
colores principales, rojo, amarillo y azul (Young, 1802, p. 21).
- Salvando de que no se conoca el conocimiento de la ondulacin de la luz est muy
bien, pero creen que Newton no poda equivocarse (amarillo).

Finalmente Helmholtz corrige el error de Young sobre los colores bsicos y


postula, basndose en Brewster, distintas curvas de sensibilidad: los receptores
son mximamente sensibles a una longitud de onda, pero responden tambin
ante otras.
Qu fenmenos es capaz de explicar una teora como la tricromtica que asume
que el color es codificado en los fotorreceptores de la retina?
Cmo se explica la discriminacin de matices, la percepcin del brillo, la
saturacin, etc.

55

Cmo se discriminan los matices?

Segn la respuesta diferencial de los tres tipos de conos. Por ejemplo, la


diferencia verde-amarillo: el verde activa su fotorreceptor, el amarillo
activa dos: el del verde y el del rojo.

La discriminacin entre matices en que los patrones de activacin para distintos colores
son distintos.
CMO SE CODIFICA EL BRILLO?
Cuanto ms brillante sea la luz, ms se va a activar (ms fotones) mayor absorcin del
fotorreceptor.
CMO SE CODIFICA LA SATURACIN? La luz desaturada desactiva los tres
fotorreceptores. La desaturacin iguala el patrn de accin de los 3 fotorreptores.
-

Los colores metmeros producen la igualacin del patrn de actividad


en los tres fotorreceptores.
Los complementarios:
- Se mezclan (gris/blanco): Se activan los tres fotorreceptores.

La evidencia fisiolgica a favor de la teora proviene de los estudios sobre las


curvas de absorcin de los conos. La absorcin es la cantidad de energa
asimilada por un cono.
Se encuentran tres tipos segn su sensibilidad mxima: a longitudes de onda
largas (L, en torno a los 570 nm, amarillo-rojizo), medias (M, en torno a 535,
verde) y cortas (S, 445, azul-violeta).
Este dato es precisamente uno de los problemas centrales de la teora: esos
colores no son ortogonales, por tanto, a partir de ellos no puede obtenerse
cualquier matiz.

56

CIRCULO DE SOUTHALL
Taxonoma:
Monocromatismo: un solo color: brillo
Dicromatismo: Protanopia (R), Deute, Tritano
Tricromatismo: Protanomala, Deutera,Tritanom
El resultante a lo largo de la secante. Los colores que puedo obtener en los picos de
onda son los que estn dentro del tringulo.
La teora falla garrafalmente. Con el anomaloscopio no se puede obtener los resultados
que indica el crculo.
Monocromatismo: Visin en blanco y negro, porque no funcionan los conos o no hay.
Se caracteriza porque cualquier color que se proyecta en el campo de prueba lo puede
obtener con tres colores sea cual sea su longitud de onda.
Dicromatismo: ( B) Protanopia ( rojo), deute ( verde), Triptano ( azul).
Protanopia (daltnicos): Hay un fallo en el cono del rojo.
El protanope ve en azul y amarillo.
Deuteranope: Tiene un problema con el pigmento del cono verde. Ven en azul y
amarillo. La diferencia es que el punto del gris son 498 nm (diferente al protanope).
Tricromatismo anomalodeo: Necesita ms cantidad de cierta longitud de onda
(desplazamiento de los picos L y M).

MOLLON (1990) seala:


Las curvas de absorcin de los conos L y M distan unos 30 nm,
sin embargo la curva de los conos S dista ms de 100 nm.

Los conos S (un 5% del total) son mucho menos frecuentes que los L y M. No
existen en el centro de la fvea, que slo contiene conos L y M: los
observadores normales son dicrmatas en la fvea central.

Las deficiencias heredadas de los conos S son muy raras, lo contrario que las de
L y M, ligadas al cromosoma X

Cuando la visin depende de los conos S la resolucin espacial es muy pobre.

- Los conos S no solo no existen en la fovea central sino que fuera de ella son muy poco
existentes.
- Rechazamos por ello la teora tricromtica (este conjunto de motivos).

57

TEORA DE LOS PROCESOS OPONENTES

Formulada por Hering (1878). Se apoya en una serie de datos psicofsicos:


Igualacin de colores.
Postimgenes de color
Deficiencias de codificacin
Mezclas imposibles.

Si en lugar de utilizar ese tipo de datos hubiramos utilizado otros probablemente no


sera una teora tricromtica. La teora de procesos oponentes utiliza datos de
experimentos con postimgenes del color entre otras, igualacin de colores, deficiencias
de codificacin y mezclas imposibles.
IGUALACIN DE COLORES
Si utilizan una categora; lo nico que puede utilizar para categorizar es el brillo?
Cuatro categoras: rojo, amarillo, verde y azul (contradice las predicciones de la
categora tricromtica).
POSEFECTOS DEL COLOR
Mirar al cuadradito negro durante un tiempo de 30 segundos (bastante).
Rojo: verde
Verde: Rojo
Amarillo: Azul
Azul: Amarillo

Postefectos: Siempre ocurre lo mismo. Demuestra que esas cuatro


categoras parecen estar organizadas por pares de colores.

DEFICIENCIAS EN LA VISIN DEL COLOR


Si alguien tiene problemas con el verde tambin tiene con el rojo, percibes mal un
tambin el verde.
Quienes confunden el azul con un color, confunden tambin el amarillo con ese color.
Tener problemas con el amarillo tambin tiene problemas con el azul.
MEZCLAS IMPOSIBLES
Basta con que uno intente imaginarse colores con cierto hombre (rojo verdoso). Hay
mezclas de colores que resultan imposibles. Concretamente azul-amarillo, rojo-verde.
No hay ningn problema en los dems casos. Esto apunta a una direccin diferente que
es la que propone Hering. Teora oponente del color. Es propuesta en tres sistemas de
receptores retinianos. Es falsa porque el dice que hay tres fotorreceptores que funcionan
por oposicin.
Se activa con el rojo y se inhibe con el verde.
No es as porque hay tres tipos de conos y todos ellos se activan con una determinada
longitud de onda, pero ninguno se inhibe y menos de esta manera. Por ello la teora es
falsa.

58

- Hering propuso tres sistemas de receptores retinianos. Cada sistema con dos
componentes: rojo-verde, azul-amarillo y brillo: blanco-negro.
- Esta teora no tiene apoyo emprico si se entiende formulada estrictamente en trminos
de fotorreceptores retinianos.

LA TEORA DUAL DE CODIFICACIN DEL COLOR

De Valois y Jabobs (1975) descubrieron un mecanismo oponente en el ncleo

geniculado lateral. Cada color de un par oponente puede excitar una clula e inhibirla
su emparejado.

La integracin de las dos teoras, tricomtica a nivel de fotorreceptores y oponente


ms arriba, parecera, en principio, la solucin ms aceptable.

Etapa Tricromtica
Retina: Fotorreceptores

Etapa Oponente
Retina (Ganglionares), NGL, Crtex

En el ncleo geniculado lateral si hay clulas que funcionan por oposicin al color.
Clulas que se activan en la luz y se inhiben con la oscuridad tambin (brillo).
Estas investigaciones han seguido en el sentido en que se pueden encontrar clulas
oponentes tambin ms abajo, clulas ganglionares y bipolares que tiene un
funcionamiento de este tipo.
En los fotorreceptores tenemos que ser necesariamente tricromticos, pero ms all de
los fotorreceptores el funcionamiento es oponente y entonces tenemos tres canales de
informacin:
Rojo-Verde
Azul-amarillo
Brillo

Oponentes

Clulas ganglionares. Aumenta o


disminuye la actividad por encima /
debajo de la tasa base.
(Azul+verde+rojo)

59

PROCESAMIENTO BASADO EN LAS SUPERFICIES


Imaginamos que trabajamos en ausencia del color: papel, asociado al brillo (blanco).
Nos salimos al sol y la intensidad luminosa que refleja el papel ser mayor, recibe ms
luz simplemente. Sin embargo, lo vamos a seguir percibiendo blanco y diramos que es
igual que blanco. Lo que demuestra es que hay una cierta constancia en la percepcin de
la claridad de los objetos, de la blancura se mantiene dentro de lo que cabe: constancia
de la claridad, es absolutamente imprescindible explicarla.
El color se adapta a la vez, cada vez va siendo ms sensible a la luz. La explicacin de
adaptacin sera que nos adaptamos a la luz y percibimos el blanco igual en todos los
lugares Cmo es que incrementamos el umbral? Cuanto tiempo tardamos en
adaptarnos a la oscuridad? Minutos. Es lenta y sin embargo nuestra percepcin de
claridad es oscuridad inmediata. No nos sirve esa explicacin.
TEORA DE LA INFERENCIA INCOSNCIENTE
La claridad se percibe constante por que lo que hace el individuo es basar su percepcin
en la reflectancia de la superficie del objeto que ser igual mientras las caractersticas
fsicas y qumicas del objeto no cambien. La reflectancia en la que se basa es constante
(90% de la luz que recibe).
Problema: Admito que podamos determinar la luminancia (reflejada) pero calcular la
reflectancia necesito tambin la iluminancia). No es posible.
Se puede admitir que los fotorreceptores funcionan como detectores de la iluminancia
pero no somos capaces de medirla.
Parche 1: Se percibe uno ms claro. Fsicamente son iguales. La cantidad de luz que
estn enviando a nuestra retina es la
misma. Cuando dos estn sobre el
mismo fondo gris se perciben iguales,
cuando el fondo cambia no.
Lo que muestra es que el contexto
est
desempeado
un
papel
fundamental en nuestra percepcin.
Este tipo de observacin lleva a
ML R+/V
Wallach a postular su teora de
Az
contraste.
+/A
mRazones
de
luminancia:
la
luminancia
L1
L2
S-M-L
M

S+M+L

B+/
N-

L-

L3
L4

Es explicativa del punto de vista


algortmico. Y nos indica que la
iluminancia puede ser irrelevante.

60

CONSTANCIA DEL COLOR


Dentro de ciertos rangos tambin existe. Puede desaparecer en sistema de visin
artificial.
Mquina con diferentes visiones de luz ambiental. Los colores parece que cambian
cuando cambia la iluminacin ambiental.

Cambio de color dependiendo del fondo. El contexto determina tambin como


percibimos el color. Teoras basadas en la superficie.

TEORAS DE PROCESAMIENTO DE LA SUPERFICIE


- Neuronas que responden al color (clulas oponentes dobles al color).
Tanto en la periferia como en el centro hay oposicin al color. Si en el centro la clula
se excita ante el verde se inhibe en el rojo en el centro.
En la periferia tenamos justo el mecanismo opuesto. Muestra dos oposiciones al color,
una en el centro y otra en la periferia.
Se puede construir por la agregacin de clulas que muestran la oposicin simple al
color.
El segundo tipo de clula muestra campo oponente al color. Son dos reas circulares
adyacentes (Verde +/ rojo -) derecha (rojo +/- verde).
Se encuentran a partir de la corteza estriada (son frecuentes) la baja frecuencia de esas
clulas en la corteza visual se ha hecho que se cuestione su funcin en la percepcin.

61

Teoras de procesamiento de la superficie

- El papel de las clulas doble-oponente:

Responden de la misma
manera a las diferencias
entre longitudes de onda
que inciden sobre centro y
periferia.

Sin embargo:
1. Hay muy pocas en V1
(Shapley y Hawken, 2002)

El papel de las clulas doble-oponente:


R+/V-/ R-V+
En parte de la periferia luz roja y es rojo -, tiende a cancelar. Se activa cuando en la
periferia se activa el verde. Esta clula en esta situacin se va a activar.
2 fila) Tenemos menos intensidad luminosa.
Ests clulas son sensibles a los cambios de longitud de onda que inciden sobre sus
campos receptivos. Lo que hace la clula es calcular diferencias en longitudes.
Necesitamos un mecanismo que sea sensible del cambio de longitud de onda. (Clulas
oponentes al color). Es el mecanismo que necesitamos para explicar la constancia del
color.
CONWAY
-

La codificacin del color es tricromtica en los fotorreceptores de la


retina.
- A partir de las clulas ganglionares es sistema de percepcin
oponente al color. Rojo/ Verde
Azul/ Amarillo
Brillo
V1. Nos encontramos con clulas doble oponentes al color. Ven contrastes cromticos
no diferencias en intensidad luminosa.
A partir de hay Conway propone que el matiz del color se percibe en V2. Los naranjas
estn representados alado de los rojos/amarillos/rojos/verdes.
El lugar de V2 que se activa va a determinar el matiz que se va a percibir.

62

AMBURGUESA: Slo hay rojo en la imagen. Curioso que se perciban diferentes


colores cuando slo hay lneas blancas y rojas.
Es un estudio muy antiguo de Land que cre una teora de codificacin del color (Teora
Reties).
La percepcin del color: Retina + Cortex (Retinex).
Es el creador de las Polaroid.
TEORA RETINEX (Land, 1964, 1974, 1985)
En sus experimentos Land utiliz figuras compuestas de parches de color, llamadas
Mondrian. Estas figuras pueden presentarse bajo condiciones de observacin natural y
en el vaco.
En cualquiera de los dos casos, los proyectores se ajustan,
por ejemplo, haciendo que la cantidad de luz roja reflejada
sea de 60, que la de luz verde sea 30 y la de luz azul, 10.
Land realiz una serie de experimentos utilizando estmulos
con parches de diferentes colores dada su semejanza con los
cuadros de Modrian se le llama estimulo de Modrian.
Estimulos: 2 condiciones:
-observador natural
-observador en vaco
No utiliz luz blanca para iluminar los estmulos. Utiliz 3 focos (rojo, verde y azul) en
cantidades diferentes: ms luz roja, menos verde y muy poca azul.
Cuando un observador en condiciones normales se le pregunta por un parche de un
color lo ve de ese color a pesar de la luz de los focos.
El color que tiene el parche si dependiese de la longitud de onda dira que siempre es
rojo.
En la diapositiva hay un parche del verde iluminado. Lo que ocurre no es que se perciba
errneamente el color, es que no se percibe color, es gris o blanco dependiendo de la
intensidad luminosa.
Para percibir el color necesitamos una superficie ms (dos superficies)

En condiciones de observacin natural (a la


izquierda) los sujetos perciben correctamente cada
color. Por ejemplo, los parches verdes se perciben
como tales, aunque realmente reflejen ms
cantidad de luz de onda larga que media.
Evidentemente, el color del parche no
corresponde con la longitud de onda

63

predominante reflejada por l. En condiciones de observacin en el vaco, el parche


verde se percibe como blanco o gris claro. Por tanto, el color percibido en una
superficie est determinado por la composicin de longitudes de onda reflejadas por
ella, pero tambin por la de las superficies circundantes.

Por qu una superficie se percibe verde aunque refleje mayor cantidad de luz
roja que verde?
Evidentemente slo hay una solucin a este problema. La superficie
verde tiene mayor reflectancia a la longitud de onda media, que a las
dems longitudes de onda. Por tanto el sistema visual debe basarse en la
reflectancia, ms que en la luminancia misma.
Cmo se logra calcular la reflectancia? La solucin pasa por comparar
la eficacia diferencial de la superficie para reflejar distintas longitudes de
onda (larga, media y corta). De todas formas la comparacin slo es til
si se dispone de ms de una superficie.

Por qu una superficie se percibe verde aunque refleje mayor cantidad de luz
roja que verde?
- Si cogemos el parche verde iluminemos como iluminemos si tiene
una reflectancia del 95% de luz verde la va a reflejar haya mucho o
poco verde iluminado. La reflectancia es fija.
- Lo razonable es pensar que el sistema visual calcula la reflectancia
para percibir el color. El problema es como podemos calcular la
reflectancia. Si la nica influencia disponible es la luminancia (luz
que llega a sus ojos).

Calculamos la reflectancia:
1) El sujeto realiza un registro de luminancia de la escena (como hacemos un
registro de la luminancia del rojo/verde/azul (como con un filtro).
2) Estos registros de luminancia nos sirve para realizar comparaciones dentro de
ese registro de la intensidad luminosa entre distintos parches. Nos sirve para
determinar los lugares que tienen ms intensidad luminosa de ese color en esa
banda.
3) Comparamos entre registros de luminancia que nos acerca muy claramente al
color autntico del parche.
Teora Retinex: Color: 2 comparaciones:
- Distintos lugares en el rojo o verde o azul
- Entre distintas bandas de onda para la misma posicin
El blanco tendra alta luminosidad pero en todos los casos.

64

Registro de luminosidad de una escena compleja,


cuando se observa slo bajo una luz de onda larga
(rojo), de onda media (verde) o de onda corta (azul).
El sistema visual obtiene informacin sobre la
reflectancia para cada longitud de onda de cada parche
comparando su eficacia para reflejar esa luz. Cada
parche tiene una luminosidad diferente en cada luz,
ese es el registro de luminosidad de la escena.

Dnde se produce la comparacin?


Probablemente en V4.
Experimento:
- Control:
- Cerebro
dividido
(cuerpo
calloso
seccionado): Identifica el parche como gris /
blanco.
Tenemos exactamente lo mismo que si lo estuvisemos
presentado una condicin en vaco. Para que se identifique el
color del parche correctamente el color se construye en algn
lugar de la corteza en el que se unan la informacin de los dos
hemisferios.
-

Zeki ( 1999) present datos de un paciente con lesin en V4. El


paciente PB no identifica correctamente los colores, slo percibe el
color cuando la longitud de onda predominante es de ese color. El
color se basa en longitud de onda predominante. No se construye
correctamente el matiz.

La teora Retinex sostiene que el sistema visual compara los registros de


luminosidad de una escena obtenidos para las tres bandas de onda. Por tanto, el
color es el producto de dos comparaciones, una entre las superficies para la luz
de la misma banda, y otra entre los tres registros de luminosidad obtenidos para
distintas bandas de ondas. El color es una comparacin entre comparaciones:
cuando cambia la luminosidad cambian simultneamente los tres registros,
permaneciendo invariable el color.

65

TEMA

3.

PERCEPCIN

DE

DISTANCIA Y PROFUNDIDAD
1. Percepcin de la profundidad
1.1. Dificultad
1.2. Factores que afectan la percepcin de la profundidad:
1.2.1. Claves Oculomotoras
1.2.2.Claves binoculares
1.2.2. Claves monoculares (pictricas)
1.2.3. Claves dinmicas
2. Relacin tamao-distancia
2.1. Constancia del tamao.
Bibliografa
Goldstein, E.B. (op. cit.) . Capt. 7.
Matlin y Foley (op. cit.). Capt. 6.
Marcos-Ruiz, R. (1992). Percepcin del espacio. En J.L. Fernndez-Trespalacios
y P. Tudela (Eds.): Atencin y Percepcin (capt. 9, p. 463-504). Madrid:
Alhambra.
Munar, E., Rossell, J. Y Snchez-Cabaco, A. (op. cit.), Capt. 11.
Ohzawa, I, DeAngelis, GC, Freeman, RD. (1997). The Neural Coding of
Stereoscopic Depth. Neuroreport, 8, 3-12
Por qu es difcil la percepcin de la profundidad?
La percepcin de la profundidad nos resulta tan natural que no caemos en la
cuenta de la dificultad que implica.
Tres conceptos relacionados
Distancia Egocntrica (O-S);
Relativa (Ob-Ob); la distancia que ha entre
objetos cualquiera
Profundidad (3-D).tridimensionales

La dificultad es enorme: el mundo es tridimensional. Nuestra retina


son bidimensionales. Evidentemente necesitamos reconstruir la
tercera dimensin, la profundidad.

66

Clsicamente el problema se ha abordado desde dos polos opuestos:


nativistas (Gestalt) frente a empiristas (James).
En uno u otro caso, se admite que el sistema debe emplear indicios
Cules son las claves que utiliza para reconstruir la profundidad?

Innato- Aprendido
Dos posturas diferentes que han aportado datas que apoyaran una postura innatista o
aprendizaje.
Gato: Distintas profundidades. Excepto la rata todos los dems siendo pequeos (6ms)
evitan moverse a zonas ms profundas a pesar de los incentivos. Los nios tan pequeos
tienen ya una percepcin de la profundidad bien desarrollada. Este experimento
apoyaran la posicin naturista (innato).
Otra investigacin: El sujeto se le pone un prisma binocular en ambos ojos y el prisma
invierte completamente la visin retiniana. Lo que esta arriba se proyecta arriba, y lo
que esta abajo se proyecta abajo. El insultado es que el individuo es incapaz de realizar
ningn comportamiento. A medida que transcurre el tiempo el individuo puede realizar
comportamiento complicado: Evidencia de que la experiencia perceptual es importante
es importante para actuar/ percibir.
Hay datos que apoyan a ambas. Las coinciden en que la unidad manera es que el
sistema visual est especializado en la deteccin de indicios o claves de profundidad o
de distancia.

CLAVES DE PROFUNDIDAD

OCULOMOTORAS

CONVERGENCIA

ACOMODACIN

VISUALES

BINOCULARES

PICTRICAS
(MONOCULARES)

ESTEREOPSIS

ESTTICAS

DINMICAS

INTERPOSICIN

TAMAO

PERSPECTIVA

Claves oculomotoras

67

Para mantener focalizados los objetos, los ejes longitudinales de los ojos
convergen de una forma que depende de la distancia objeto-observador. Para
que se produzca convergencia, los msculos extraoculares tienen que contraerse
de forma apropiada. Si el sistema visual recibe informacin sobre el grado de
contraccin muscular, puede emplearla para inferir la distancia objeto-sujeto.
Algo similar puede ocurrir en el caso de la acomodacin del cristalino: los
msculos ciliares tienen que contraerse en funcin de la cercana del objeto al
observador.

Los movimientos de convergencia son movimientos que requieren A medida que el


objeto se acerca la cantidad de rotacin que yo tengo que dar a mis ojos es mayor.
ngulo de convergencia, para enfocar el objeto es necesario que se produzcan
movimientos oculares. Especialmente el ncleo medial recto (relajarse/ contraerse) de
forma adecuada. Para que se produzca el movimiento de convergencia es necesario que
se produzca relajacin y contraccin de los msculos oculares.
Tambin es necesario que la forma del cristalino se adapta a la distancia objetoobservador ms cerca: acomodacin ms redonda para sanar la potencia refractiva. Es
necesario que entren en accin los msculos alrevs que estn enganchados de cristalino
con las fibras zonales, lo que hace el cristalino se ambombe o no.

A medida que decrece la distancia observador-objeto el ngulo de convergencia


decrece. Distancia egocntrica.
Por otro lado el abombamiento del cristalino.
1) Infinito visual:

68

A medida que el objeto esta ms cerca del observador el cristalino se va abombando


cada vez ms y los msculos filiares estn ms tensos. Distancias egocntricas.
Hasta que punto esa informacin es valiosas?
ngulo visual: Se calcula a partir del tamao del objeto y la distancia observadorobjeto.
1) Distancia observador-objeto
2) Distancia entre los ojos del observador
ngulo de convergencia: Funcin directa de la distancia entre los ojos.
.- Funcin indirecta entre la distancia observador-objeto.

Esta informacin va a ser razonablemente buena hasta los 2 metros. A partir de dos
metros el ngulo de convergencia sera intil. Algo parecido sucede con la acomodacin
del cristalino. Distancias todava menores de dos metros. (Distancias egocntricas
cortitas). Ms all la informacin de estas claves es irrelevante.
Trotter (1993, Lewis et al, 1998).
El mensaje oculomotor que llega a la corteza visual primaria est relacionado con la
convergencia ocular. El mensaje podra indicar la posicin de los globos en las rbitas o
bien ser una copia del enviado a estos msculos.
Puede realizarse una estimacin de distancia basndose solamente en claves de
acomodacin y convergencia?
+ S, pero no es muy fiable (Wallach y Floor, 1971).

69

- Acomodacin: Es til slo para objetos muy cercanos (ms all de unos
cuantos metros los msculos ciliares estn ya completamente relajados y su informacin
deja de ser til).
- Convergencia: Es, potencialmente, mejor, pero tambin muy limitada. El
ngulo de convergencia es inexistente prcticamente a una distancia de 2 metros.
Las claves oculomotoras son poco tiles para construir la profundidad a
distancias superiores a dos metros (Foley, 1991). Incluso es posible que sean
irrelevantes (Logvinenko, Epelboim y Steiman, 2001)

Claves visuales binoculares: estereopsis


Los campos visuales de cada ojo estn solapados en gran parte. Sin embargo, en
el caso humano, el punto de vista de cada ojo, debido a su situacin frontal y su
separacin (unos 5/6 cms.) es levemente diferente. Esta disparidad en las
imgenes retinianas proporciona una informacin valiosa para construir la
tercera dimensin, al menos cuando la distancia a la que se sitan los objetos del
observador no es excesivamente grande (hasta 30 m.).
La distancia a la que esta el objeto va a ser fundamental para explicar el papel de esta
clave. Las imgenes que se proyectan a un ojo u otro son relativamente diferentes y va a
depender la distancia del objeto y la separacin que tengamos entre un ojo y otro.
Tenemos una visin unitaria de la escena (sistema capaz de fundir los dos estmulos en
una imagen nica). Tiene que resolver el problema de la distancia entre una imagen y la
otra. (Estereopsis).

A. Seale (1999). Retocado por Kaufman y Kaufman (2000). Explaining


the moon illusion. PNAS, 97, 500-505
Imagen izquierda ( Ojo izquierdo) Imagen derecha ( Ojo derecho).
La escena se convierte en una imagen tridimensional ( 2 imagen=1)
CUANTIFICANDO LA DISPARIDAD
Para que lo anterior sea posible (Calcular la disparidad retiniana de las imgenes):
Depende:
-

Distancia iterpupilar
Distancia de fijacin

70

Como esta mirando el rbol la imagen se forma en la fovea de cada uno de las retinas.
El guardia esta bastante cerca de la fovea en un ojo y en otro bastante lejos de la fovea
(En lugares diferentes de ambas retinas).
3) Acercamos el guardia al observador pero el sujeto mira el rbol la imagen del
guardia no es fvea. La diferencia de la imagen retiniana es ms dispar ahora.
Pero la imagen coincide en el mismo lugar retiniano. (A el 2 ojo izquierdo y en
el derecho).Las imgenes se dice que no son dispares. Si es no ocurre se dice
que las imgenes son dispares.

Calculamos el grado de disparidad:

tan( ) =

: Disparidad retiniana
I : Distancia interpupilar
d: Distancia Fij-Objeto
D: Distancia de fijacin

Id
2
I + D 2 + Dd

La visin estereoscpica es posible porque somos capaces de computar la disparidad


retiniana, que incrementa en funcin de la distancia en profundidad de los objetos y
disminuye con el cuadrado de la distancia de fijacin

Un objeto puede
parecer el mismo a diferente distancia.

71

tan( ) =

Id

Horptero
Dicotomizado. Tengo objetos que no producen disparidad y objetos que si producen
disparidad.
No producen disparidad; El objeto que est en el punto de fijacin no produce
disparidad.
Nios en distintos lugares de la piscina. A y C estn dentro del semicrculo. Esos nios
tampoco producen disparidad. Si el punto en el que se proyecta en un ojo que en otro es
el mismo no produce disparidad aunque no estn en el punto de fijacin. En la lnea
imaginaria no se produce disparidad. Esa lnea imaginaria en la que se produce
disparida 0 es el horptero. Es una lnea que depende de la distancia observador-punto
de fijacin y la podamos definir como un crculo imaginario en cuyo permetro la
disparidad es O. Pasa por el punto de fijacin y por los puntos nodales (centros pticos)
de los ojos. ( Horptero de Vizth-Mller).
Los nios B, D, E, F proyectan a lugares diferentes de la retina, producen algn tipo de
disparidad Cmo podemos caracterizar esa disparidad?
DISPARIDAD CRUZADA
Como est ms cerca tiene que rotar sus ojos en direccin nasal para poder mirar el
muro del rojo: incrementando el ngulo de convergencia (cruzando ms los ojos) . Ms
ac de la lnea del horptero.
Mirar el objeto lejano: Reducir el ngulo de convergencia tiene que descruzar los ojos (
disparidad no cruzada) ,. Ms lejos que la lnea del horptero respecto del observador.
Los objetos anteriores o posteriores a la lnea de fijacin, el horptero, proyectan sus
imgenes en lugares dispares de la retina. Producen disparidad cruzada.
Los objetos anteriores o posteriores
a la lnea de fijacin, el horptero, proyectan sus
imgenes en lugares dispares de la retina. Producen
disparidad cruzada los que estn ms cerca que el
punto de fijacin (P) y no cruzada los que estn ms
lejos. Todos los objetos situados en el horptero, la
proyectan en puntos coincidentes, producen disparidad
cero.
Por tanto, la informacin sobre la disparidad, su grado
y tipo (cruzada o no) puede ser empleada por el
sistema visual para construir la 3-D.
La disparidad disminuye con el cuadrado de la
distancia de fijacin. Su utilidad es mayor a pequeas
distancias.

72

Imgenes de objetos cercanos al horptero pueden fusionarse y producir estereopsis


(rea de Panum), el resto produce diplopa. La atencin es un contribuyente importante
a la eliminacin de la visin doble.
Cul es la disparidad suficientemente pequea como para cuantificarla? Por el rea de
Panum.
Vierth- Millar. Horptero terico. Porque el ojo no es esfrico. Si la geometra fuese
esfrica (pero no lo es). El verdadero horptero es el emprico ya no tiene forma
circular, pasa por el punto de fijacin pero no al observacin. Parbola de las bastante
separadas cualquier punto que pase por el horptero emprico produce disparidad 0.
La disparidad es suficientemente pequea como para que el sistema pueda fusionar el
uno ojo (derecho ms izquierdo) ms lejos de rea de Panum la disparidad es demasiado
grande para el observador, no puede identificar las imgenes no puede fundir en una
sola. Fuera del rea de Panum todos tenemos diplopa.
Por qu no vemos los objetos dobles? Quien experimenta la diplopa ve doble

Cmo se produce la estereopsis? Parece obvio que emparejando las imgenes


de ambos ojos. Para emparejarlas hay que identificar elementos en la escena y
despus calcular la direccin de la disparidad. Esto es lo mismo que decir que se
identifican formas y luego se emparejan

73

ESTEREOPSIS

ANLISIS
DE LA
FORMA

OJO
IZQUIERDO

OJO
DERECHO

Sin embargo, hay estereopsis en ausencia de elementos identificables, como


ocurre en los esteregrafas de puntos aleatorios (Julesz, 1971)

OJO
IZQUIERDO

ANLISIS
DE LA
FORMA

ESTEREOPSIS

FORMA

OJO
DERECHO
74

Si no fusemos esterociegos veramos un tringulo flotando bajo el fondo. Las nicas


formas reconocibles son los puntos pero son todas iguales. Este tipo de estmulos nos
llevan a una experiencia totalmente diferente. Si no hay formas reconocibles es mejor
asumir que 1 se funden las imgenes y despus es cuando aparece la imagen del objeto.
El cambiar del estmulo a determinados el cambio de teora.
Cuando se logran fusionar se percibe una figura tridimensional.
El problema de la correspondencia (Cual es el punto de la imagen izquierda se
corresponde con el de la derecha).

Cmo se produce la fusin binocular?


Julesz sugiere que se produce por una
comparacin punto a punto. El problema de la
correspondencia es enorme: el nmero de
emparejamientos posible es una funcin
potencial del nmero de puntos.

EL PROBLEMA DE LA CORRESPONDECIA
Teoras Computacionales:
Algoritmo Cooperativo de Marr-Poggio
Compatibilidad: Puntos negros slo se emparejan con puntos
negros.
Unicidad: Un punto negro en OD puede emparejarse slo con
uno negro en OI.
Continuidad: La disparidad vara suavemente con la
profundidad.
Algoritmo basado en deteccin de bordes:
de
Emparejamiento
bordes
Escalas mltiples
Primero escalas amplias,
luego
estrechas.
El
movimiento ocular es
fundamental

75

-El observador forma todas las parejas posibles. Sabiendo que el objetivo es descartar
las parejas falsas. Tiene tres clases de supuestos:
1) Compatibilidad:
Solo se emparejan puntos negros con negros y blancos con blancos. Del conjunto de
parejas falsas podemos quitar blanco de uno y negro de otro.
2) Unicidad: Un punto negro del ojo izquierdo slo puede emparejar con un negro
del derecho.
3) Continuidad: La disparidad vara suavemente con la profundidad.

La funcin de estos es descartar el de parejas falsas. Los ganadores son los que
controlan lo que se ve. No nos sirve.
- Algoritmo basado en deteccin de bordes (Tampoco nos sirve).

Teoras de Filtros:
Si en un estereograma de puntos aleatorios se eliminan slo las altas o slo las bajas
frecuencias espaciales, se sigue percibiendo en profundidad, pero si en una mitad se
eliminan las altas y en la otra mitad las bajas, no se produce la fusin, sino rivalidad
binocular. Luego, la estereopsis parece depender de la correspondencia de frecuencias
espaciales.

Parece que la informacin de frecuencias espaciales que se proyecta a ambos ojos es


crucial y comn a ambos ojos. Cuando borramos las bajas frecuencias y mantenemos
las altas frecuencias de ambos ojos son comunes. Slo conseguimos borrar la
estereopsis cuando borramos en un ojo bajas y en otro las altas.

Desplazamiento
del enrejado

La idea es muy simple: la fase permite computar la disparidad


(Sanger, 1988; Ohzawa, DeAngelis y Freeman, 1990, 1997).

45 (90)

90 (180)

Simtrico
Campo
receptivo
Antisimtric
o
76

La nueva teora simplemente viene a decir:


Qu parmetro es equivalente del desplazamiento lateral que da lugar a la estereopsis?
Lo que caracteriza en trmino de frecuencia espacial de un ojo respecito de otro es el
desplazamiento espacial de un ojo respecto de otro es el desplazamiento de fase en las
mismas frecuencias espaciales.
Si nos separamos los ojos la diferencia de fase aumenta. Cuanto mayor distancia all
entre centro y centro del ojo mayor diferencia hay entre las fases.
El sistema computa la fase de cada uno de las frecuencias espaciales presentes en el
estmulo en cada uno de los ojos.
Distinta fase 0. No hay desplazamiento lateral.
Mayor que fase 0. Disparidad retiniana.
El problema se reduce a cmo el sistema visual podra calcular el desfase. Para ello el
sistema debe tener mecanismos que son sensibles a la fase. En la va visual hay
detectores de la fase visual.
Existen esos detectores, clulas simples V1 y clulas complejas que reciben de esta
informacin. Son las ilustradas en la diapositiva.
1) La clula tiene una zona excitadora (central) y dos inhibidoras (laterales).
Funciona la cancelacin de la zona excitadora con respecto a la inhibidora y viceversa.
Esa clula se denomina de campo receptivo simtrica o clula simtrica.
2) Cuatro zonas; 2 excitadoras y dos inhibidoras, de forma alternante.
Si el campo receptivo esta iluminado de forma completa la inhibidora anula a la
excitadora. No altera (clula asimtrica).
Cmo se computan esas 2 clulas la fase?
Enrejado: Proyecta de la manera ilustrada.
Cul va a ser la actividad de estas clulas?
1) El resultado es activacin de la clula de campo simtrico.
2) Zona excitadora en barra oscura (no hay excitacin).

77

3) Zona inhibidora en barra oscura (no hay inhibicin).


El resultado neto es la tasa base de disparado.
(90) 180: Desplazamiento real de nuestros ojos.
1) La prediccin es de esta clula simtrica si se activa ser ms bien poco.
2) Activacin de esa clula.
Un desplazamiento lateral equivalente que se produce por el desplazamiento de nuestros
ojos.
El una clula simtrica est ms activada y en otra clula antisimtrica est menos
activada por el desplazamiento lateral.
Si no hay desplazamiento lateral la activacin sera igual en la clula simtrica y
asimtrica.
Para calcular la disparidad realmente lo que necesitamos 2 clulas especializadas con
una frecuencia espacial determinada.
Ventaja
-Ya no tenemos problema de correspondencia.
Una teora como esta es mucho ms eficiente que las teoras de tipo computacional.
Ya tenemos como explicar la estereopsis? No porque nos consta que por encima de V1
todava hay aportaciones a la construccin de la tercera dimensin porque hay otro tipo
de estereopsis que es totalmente opuesto al que acabamos de ver si basa en lo que es
especfico de cada ojo, no de la diferencia entre los ojos. Estereopsis de DaVinci.

Hay datos que apoyen este


anlisis en el caso de escenas
naturales?
Hay clulas complejas en
la va visual que integran
informacin procedente
de clulas simples con
campos receptivos
desfasados (Ozhawa et al,
1997).
Problemas:
Hay estereopsis en
niveles superiores?
Stereopsis de Da Vinci

La idea tiene dos ventajas:


No hay que emparejar elementos o caractersticas, por tanto no hay problema de
correspondencia.
El cmputo tiene lugar en todas las regiones de la imagen, y no slo en los pasos de
cero (Marr y Poggio, 1979; Mayhew y Frisby, 1980).

78

Lo que es comn a ambos ojos es evidente pero lo que es no es comn tambin. Esta
superficie tapa para 1 de los ojos una parte del campo visual, slo proyecta al ojo
derecho. Hay una posicin que es exclusiva del ojo derecho y otra que es exclusiva para
el ojo izquierdo. Aqu la teora anterior no puede ser aplicada, porque dice que para que
se pueda computar la estereopsis tiene que coincidir la imagen en ambos ojos.
No todas las personas estamos capacitadas para ver la tercera dimensin mediante la
estereopsis.
Estereoceguera: No son capaces de fusionar las imgenes de ambos ojos, sus percepcin
de la distancia no puede estar basndose en claves que implican un solo ojo ms que
otras claves. La visin del espacio, tridimensional no se puede percibir de forma
binocular.

Estereoceguera: Algunas personas (entre un 5 y un 10% de la poblacin) son


incapaces de emparejar las imgenes estereoscpicas, son estereociegas,
probablemente debido al no desarrollo de neuronas binoculares. Uno de los
agentes causales ms importantes es el estrabismo, que imposibilita enfocar un
mismo objeto con ambos ojos a la vez. El dficit se produce si el problema no se
corrige antes de la edad escolar. (Estereoagudeza: 15-20= excelente)
Rivalidad binocular: Cul es el patrn que emerge si cada figura se presenta a
un ojo? Se ignora alternativamente informacin de un ojo o del otro.
Durante la supresin, los sujetos fracasan en la visin de objetos situados en el
rea suprimida

Una persona estereociega no pueda llenar una taza de caf, lo derrama (no sabe si estn
en el borde). La causa fundamental de la estereoceguera se corrige en la actualidad (es
estrabismo). Los ejes pticos de los ojos no estn alineados.
La consecuencia de estos es que la imagen que se proyecta a un ojo es diferente de que
que se proyecta a otro ojo. La imagen retiniana entre un ojo y otro es totalmente
diferente. Si las imgenes no se pueden fundir la consecuencia es visin doble (no es lo
que realmente tienen) o que uno de las imgenes sea suprimida igual visin monocular.
Lo que corresponde al ojo que est alineado peor (ojo estrbico) y puede que el ojo
vuelva vago tenga una agudeza visual reducida.

La correccin hace que el individuo no sea estereociego y pueda recuperar gran parte de
la visin estereoptica y es posible que el otro ojo se recupere tambin.
Diferente capacidad refractiva entre un ojo y otro.
Anisometropa:
Por dos causas:
Podemos tener 1 ojo emtrope (potencia refractiva buena) y otro emiope (potencia
refractiva en otro mayor)

79

Hipermtrope-emtrope.
Si uno es emtrope (ntida) y otro es hipermtrope (borrosa).
Borramos una frecuencia en un ojo y otras en otro ojo porque la proyeccin retiniana en
otro ojo (mayor cuanto ms anomala tenga en la potencia refractiva el ojo anormal).
La Anisometropa es por la incapacidad de fusin uno de las imgenes puede ser
suprimida (la que se proyecta borrosa). Una correccin ptica es suficiente.
Todo esto se puede estudiar experimentalmente.
Proyectamos en un ojo y otro, imgenes totalmente diferentes.
Se percibe una cosa o la otra.

Lo que observamos es que una vez veremos la cara y va a emerger la firgura de la cara
si vemos normal.
Piedras: Anaglifo: Forma alternativa de producir estereopsis.

80

Claves monoculares (pictricas) estticas

Prcticamente todas las superficies tienen textura (el granulado de una pared, los
dibujos de la madera, ...).
La densidad de la textura cambia con las distancia de las distintas partes del
objeto, dado que no suelen ser perpendiculares a nuestra lnea de visin. Este
cambio se denomina gradiente de textura
El gradiente de textura proporciona informacin sobre la distancia, el tamao y
los bordes de los objetos (Gibson, 1950; Todd y Akerstrom, 1987). Los dos
factores importantes:
semejanza de la forma
semejanza del tamao de los elementos de textura.

El tamao proyectado sobre la retina es una funcin inversa


de la distancia. Esta clave explica tambin otras como la
altura relativa, el tamao o la perspectiva lineal.

Altura. Los objetos situados lejos de la lnea del horizonte, tanto por encima como por
debajo de ella se perciben ms cercanos al observador que los cercanos a ella.

81

Tamao. El tamao por s solo puede influenciar la percepcin de profundidad: los


objetos ms pequeos se perciben como ms lejanos. Proporciona informacin de
distancia relativa.

Cuando el objeto es familiar, el tamao de su imagen retiniana sirve para calcular de


forma adecuada la distancia. Si el objeto, por el contrario no es familiar, entonces es
necesario compararlo con otros para poder enjuiciar adecuadamente.

82

El conocimiento previo sobre la distancia a la que est situado un objeto no es


suficiente para interpretar su tamao adecuadamente. Gruber y Dinnertein (1965).
Cuadrados situados a 16 y 8 metros a lo largo de un pasillo, el primero doble que el
segundo. Cuando se suprimen las claves del pasillo, se perciben los dos cuadrados como
si estuviesen a la misma distancia y fuesen de tamao idntico. Casos similares de
interrelacin tamao distancia son los que proporcionan la habitacin de Ames y la
ilusin de la luna.

Interposicin u oclusin. Cuando un objeto tapa, o ensombrece, parte de otro


objeto, el primero se percibe como ms cercano. Es quiz la clave ms primitiva de
profundidad, por ello es una de las ms simples y poderosas.No indica distancia entre
objetos. Requiere asignar los lmites a regiones del espacio. Puede llegar a anular la
disparidad cuando hay conflicto, pero es incrementada si la superficie oclusiva contiene
frecuencias espaciales altas (Brown y Weisstein, 1988).

83

Perspectiva lineal. Se refiere a los cambios en la imagen de los objetos


conforme retroceden respecto del observador. El efecto ms aparente es la convergencia
de paralelas, que produce una de las ms fuertes impresiones de profundidad. Tambin
puede contrarrestar la informacin proporcionada por la disparidad (Stevens y Brookes,
1988).

El punto del infinito donde parecen converger las lneas se denomina punto de
fuga.

Perspectiva area.
Los objetos ms distantes se perciben ms difuminados que los cercanos. Se debe a la
interaccin de la luz con las partculas suspendidas en la atmsfera. Su valor para la
pintura fue descubierto por Leonardo. OShea, Blackburn y Ono (1993): la reduccin
del contraste de los objetos hace que estos aparezcan ms distantes. Consecuencias
prcticas en actividades como pilotaje de aviones.

84

Sombras. Los objetos tridimensionales producen sombras, sobre todo dentro del propio
objeto, por tanto tienen gradientes de luminancia. El sistema visual parece emplearlas
teniendo en cuenta:
i) Slo hay una fuente de luz,
ii) La luz viene de arriba (definido retinalmente, no ambientalmente, Howard,
Bergstrm y Masao, 1990).
iii) El sesgo de convexidad es un 30% mayor que el de concavidad (Liu y Todd, 2004)

Es una clave que no se emplea para inferir distancia relativa ni relacin distancia objeto,
sino para la ntidamente. La clave es que los objetos tridimensionales proyectan
sombras sobre s mismos. La intensidad luminosa dentro de la superficie del objeto
cambia debido a la propia forma del objeto. Los objetos tridimensionales hace que
cambie el gradiente de intensidad luminosa: inferir tridimensionalidad.
El sistema visual parece emplearlas teniendo en cuenta.
1) Hoyo ( abajo ) montculo: Los dos son la misma, pero una est rotada en el
plano vertical . En las dos apreciamos un gradiente de intensidad luminosa
diferente. Percibimos esa superficie como un hundimiento del terreno. Por tanto
el campo de la intensidad luminosa es la clave. Cuando hay un gradiente de la
intensidad luminosa que nos da la clave.
2) Conjunto de objetos que parecen proyectar una sombra y parece que retroceden
y el segundo estn a la misma distancia aparente diferente del observador. La
proyeccin de la sombra hace que veamos todas
al mismo nivel y otra y a distinta distancia.
El sistema visual utiliza supuestos que son 3:
1) Tenemos una fuente luminosa y solo 1. Esa fuente
de luz est situada en principio arriba pero hay
que matizarlo (arriba respecto de las retinas del
observador). Si el observador invierte su posicin
85

en el espacio (haciendo el pino) arriba estara en el suelo.


Hay una preferencia por arriba a la izquierda, se consigue ms rpida si la luz est
arriba a la izquierda. Eso es lo que tenemos percibido cuando vemos las fotografas
del crter (la luz est situada arriba a la izquierda).
En primero haba discrepancias, pero nadie percibe plano el cambio de intensidad
luminosa es prcticamente inexplicable, la primera se fue peor porque la luz est
situada a la derecha. Es ms fcil si la fuente luminosa est a la izquierda.
2) Sesgo de convexidad: Preferencia del sistema de que las superficies salen hacia
fuera, es una preferencia de la convexidad, que de la concavidad cuando la
escena es ambigua.

Hoja: Slo tenemos cambios en la intensidad de la luz, tenemos tridimensionalidad.


Tenemos un gradiente de intensidad luminosa que es explicable por una fuente
luminosa arriba a la izquierda.
Homer: Tenemos color pero es irrelevante para percibir tridimensionalidad. El
dibujante tambin supone lo de la fuente luminosa arriba a la izquierda.

86

Claves dinmicas. Paralaje de movimiento.


Cuando el objeto (o el observador) se desplaza se produce un cambio en la
perspectiva de ese objeto (paralaje absoluto) y en relacin con los dems objetos
de la escena (paralaje relativo).

El observador se desplaza fsicamente en el espacio. Considerando un solo objeto si


el sujeto se mueve la perspectiva del sujeto cambia. En ese cambio de perspectiva se
le conoce como paralaje absoluto de movimiento.
La relacin entre los objetos (dos o ms) situados en el campo visual del observador
cambia. A ese cambio de perspectiva se le denomina paralaje relativo de
movimiento.
Paralaje absoluto: un objeto
Paralaje relativo: dos o ms objetos: Cambio de perspectiva; el sujeto lo utiliza
Para inferir distancia o profundidad absoluta
Pero la utiliza para calcular distancia relativa.

Flujo ptico:

Gradiente de movimiento: Cuando el observador se mueve


perpendicularmente a su punto de fijacin: todos los puntos por encima
del de fijacin (distantes) parecen desplazarse en la direccin del
movimiento, todos los situados por debajo (cercanos) en la contraria.
Cuanto
ms
cercanos
al
observador ms rpido el
desplazamiento.
Expansin ptica: rea

MST (Wurtz, 1998;Clifford et al, 2000)

Las estimaciones de profundidad


basadas en el paralaje de movimiento
son tan exactas como las basadas en la
disparidad binocular (Graham, 1965).

El elemento fundamental para hacer las dos inferencias es la velocidad


aparente de desplazamiento aparente de la retina. Es notorio que si el observador
esta mirando a una posicin del espacio todos los objetos situados parecen
desplazarse con el movimiento del observador. Pero el movimiento es una funcin
aparente de la distancia a la que est situada.

87

Ventana coche: Los quitamiedos parecen desplazarse de forma vertiginosa y las


montaas no.
Ms cerca del observador: Mayor velocidad aparente. Respecto del punto de fijacin
los objetos parecen desplazarse del modo contrario, en la direccin opuesta al
observador. Ms debajo, al contrario. Ms encima del punto de fijacin, en la misma
direccin que nosotros.
- Expansin ptica/ Contraccin:
Se refiere a la apariencia de movimiento que tienen los objetos (estticos)
en el campo visual / ganar velocidad cuando el objeto se acerca.
Carretera (adelante); Van aparentemente abriendo el campo visual y
la velocidad es una funcin inversa a la distancia.
- Cuando ms rpido vayamos nosotros ms rpido se abrirn los
objetos entre nosotros y cuanto ms lejos ms lento.
- Cuanto miramos por la ventana de atrs (contraria a la direccin del
movimimiento). El campo visual parece que va estrechndose.
Cuando ms rpido va el coche, los objetos situados lateralmente
aumenta. Es la contraccin de los objetos dentro del campo visual.
En todos los casos opera el desplazamiento aparente que es una funcin de la velocidad
a la que vamos y de la distancia a la que est situado el objeto.
-

Lo calculamos de distancia en paralaje son tan exactos como la visin binocular.


En resumen: Umbral diferencial de distancia respecto al eje del objeto. La clave ms
poderosa es la oclusin por orden de eficacia.
Claves:
1: Oclusin.
2: Tamao relativo
3: Grande densidad
4: Distancia observador-objeto
La disparidad binocular cerca tiene mucha eficacia. Altura sobre el horizonte: muy
eficaces entre distancias grandes (20-80 cms).
Perspectiva area: Cuando la distancia tiende a crecer: mayor eficiencia.
Ordenacin de eficacia de claves:
1. Oclusin
2. Binocularidad
3. Perspectiva de movimiento ( paralaje)
En conclusin, el sistema visual utiliza un conjunto de claves, algunas las utiliza como
preferencia para inferir objetos cercanos mientras que otras las utiliza para inferir
objetos a mayor distancia. La nica clave es la misma a la misma distancia es la
oclusin.

88

Integracin de la informacin de profundidad


Cmo se combinan las claves de profundidad? Tres posibilidades
Dominancia: Una clave predomina sobre el resto: Perspectiva lineal sobre
tamao en la habitacin de Ames.
Compromiso: Bruno y Cutting (1988). Las claves se procesan separadamente y
luego se combinan aditivamente. El sistema visual parece estar compuesto por
mdulos dedicados a una fuente de informacin.
Ocurre igual cuando las claves entran en conflicto? Rogers y Collet
(1989): La percepcin se vuelve inestable, como ocurre en el cubo de
Necker. Unas claves predominan sobre otras (la estereopsis puede ser
eliminada por la oclusin)

Interaccin: No hay procesamiento separado: Estereopsis y convergencia


interactan para inferir profundidad

Compromiso: Es lo que ms frecuentemente se dar. Lo que ocurre


en un contexto natural es que las claves estn de acuerdo entre si, y lo
que hace el sujeto es sumar la informacin de las diferentes claves.
No todas las claves pesan lo mismo en esa sumas las ms relevantes
pesan ms. Una clave que siempre pesa ms es la clave de oclusin.
Interaccin: Implica que la utilizacin de una clave depende el
procesamiento de otra clave que haya presente (estereopsis y
convergencia): Interactan a la estereopsis depende del grado de
convergencia ocular.
La clave de estereopsis es dependiente de la convergencia ocular
.

Dibujos copa:
a) La que predomina es la clave de oclusin: La segunda es la clave de altura
respecto de la superficie que se apoyan es la otra clave.
b) Conflicto entre claves:
1. Oclusin: El vaso est delante.
2. Altura: El vaso est detrs.
3. No sabemos como interpretar eso.

Cmo influye la interpretacin de la profundidad en la percepcin? Nakayama,


Shimojo y Silverman (1989) y Nakayama, He y Shimojo (1995): la percepcin
de la forma depende de claves de profundidad como la oclusin o la estereopsis.

89

Relacin tamao-distancia

Un objeto puede parecer el mismo a diferentes distancias, a pesar de que su


imagen retinal cambia. Este fenmeno se conoce como constancia del tamao.
La constancia del tamao depende no slo de la imagen retiniana, sino tambin
de la distancia percibida (Holway y Boring, 1947) o del tamao recordado
(Shiffman, 1967).
La relacin entre la distancia y el tamao percibidos se conoce como
escalamiento distancia-tamao. Formalizada en la ley de Emmert:
Tp=k*Tr*Dp. Esta ley explica tanto la constancia del tamao como las
ilusiones de tamao.

Un pasillo que retrocede en profundidad respecto de nosotros (los dos


sujetos son del mismo tamao). Si recortamos el personaje de atrs y lo traemos
adelante tenemos la impresin de que es ms pequeo).
Tamao-percibido 1 es diferente del tamao percibido 2

90

Tamao retiniano grande y una distancia pequea.


Tamao retiniano pequeo y una distancia grande.
La cosa se rompe cuando el tamao retiniano es pequeo y la distancia tambin es corta.
2 dibujo. Shepard: Monstruos tnel. Perspectiva lineal. Gradiente de textura. Altura
sobre el horizonte.
El tamao retiniano de ambos es el mismo pero la distancia retiniana no es la mima.

TEMA

4.

PERCEPCIN

DEL

MOVIMIENTO

Introduccin
Movimiento real
mecanismos:
de correlacin
basados en gradientes
movimientos del observador
Movimiento aparente
movimiento estroboscpico
movimiento inducido y postefectos de movimiento
movimiento autocintico

Movimiento biolgico
Goldstein, E.B. (op. cit.). Cap. 8
Matlin y Foley (op. cit.). Cap. 11
Munar, E., Rossell, J. y Snchez-Cabaco, A. (op. Cit.). Cap. 12
Derrington, A.M. et al (2004). Visual mechanisms of motion analysis and
motion perception. Annual Review of Psychology, 55, 181-205

91

El estudio experimental de la percepcin del movimiento comienza en el siglo


XIX con Exner (1875).
Desde el comienzo los investigadores han mantenido que se trata de una
sensacin primaria (Exner, 1875; Wertheimer, 1912), porque la
introspeccin sugiere que se trata de una experiencia perceptual nica,
muy diferente de otras experiencias.
Tambin se ha mantenido que incluye una etapa previa de
reconocimiento de patrones, puesto que el mismo patrn aparece
localizado en diferentes lugares (Barlow, 1979).
Integracin: distintos mecanismos de deteccin de movimiento:
De primer orden: basados en la luminancia
De segundo orden: basados en la textura
De tercer orden: basados en caractersticas
Los beneficios funcionales de procesar el movimiento tienen que ver con:
la codificacin de la profundidad
la segmentacin de la forma y el reconocimiento de objetos
la percepcin del movimiento real de los objetos, gua de la accin.

La percepcin del movimiento es una sensacin primaria; se puede percibir el


movimiento sin que se perciba en si el objeto, sin que se preste atencin. Es cogida por
los psiclogos de la Gestalt. Ha habido una segunda explicacin que viene a decir lo
contrario, no es una sensacin primaria para el individuo debe reconocer alguna de las
caractersticas que hay presentes en el objeto antes que el movimiento se pueda percibir
( Barlow, 1979).
Mecanismo de primer orden: Es capaz de percibir movimiento simplemente a partir de
cambios de intensidad luminosa sobre un fondo homogneo de intensidad ( Exner).
Mecanismo de segundo orden: Requiere que se produzca cambios en la textura de la
superficie para percibir movimiento.
Mecanimo de tercer orden: Requiere un previo reconocimiento de caractersticas en la
escena ( Barlow).

Profundidad:
Efecto de profundidad cintica

El movimiento nos puede permitir percibir objetos tridimensionales.


El sistema visual puede construir representaciones 3-D empleando slo informacin
sobre movimiento, es decir, sobre la velocidad y la direccin de los elementos. (Mather,
1989).
El efecto fue descrito en primer lugar por Wallach y O'Connell (1953)

92

Objetos
Estructura a partir del movimiento: Efecto estereocintico: la rotacin produce
distorsin aparente de la forma, lo que lleva a la percepcin de una estructura 3-D en
rotacin. Parece que el sistema visual asume la rigidez de la forma para interpretar los
cambios en el patrn.
Cambia la forma porque estoy rotando el objeto. Cambia el cambio aparente de la forma
para percibir estructuras tridimensionales.
Movimiento biolgico:
Puede determinarse la direccin (Cutting y Profitt, 1981) y el gnero del caminante
(Mather & Murdoch, 1994).
El movimiento permite extraer no solo formas rgidas, sino tambin formas articuladas.
El sistema debe ser capaz de integrar informacin sobre los puntos a travs de grandes
reas de la imagen para poder deducir la conexin entre ellos.
Segregacin Figura-Fondo: Camuflaje: Los contornos de los objetos son definidos por
el movimiento relativo.
Aparece el contorno del objeto cuando hay movimiento. Entra el mecanismo de
segundo orden, por lo que hay es un cambio en el cambio de textura.
Gua de la accin

Evitar colisiones: El tiempo para la colisin


es la relacin entre el tamao de la imagen
retiniana y la velocidad en cada momento
Expansin: A medida que el observador se
acerca a un objeto visual cercano a el perece
separarse. Adems el observador tiene una
informacin de tamao del objeto a medida
que el objeto se est cercano a l.
Es posible predecir una colisin y evitarla.

La estructuracin del campo depende de la combinacin de varios factores:


dinamismo del objeto, de los ojos y de la cabeza. En este contexto se distinguen:
MOVIMIENTO REAL: Gregory (1998): Los objetos que se mueven de
una parte a otra del campo visual estimulan sucesivamente distintos
receptores retinianos, siempre que los ojos (o la cabeza) no realicen
movimientos de persecucin del objeto (sistema imagen-retina). Cuando
se producen movimientos de versin (o de cabeza) el objeto estimula el
mismo (o casi) lugar retiniano (sistema ojo-cabeza).

93

Que el observador est esttico o que est en movimiento.


Es lo mismo que el observador mueva los ojos que mueva la cabeza.
La diferencia es fundamental:
El observador est esttico: Un objeto que se traslada fsicamente en el espacio va a
proyectarse en posiciones sucesivas en la retina del observador.
Que este en movimiento de persecucin (ojos-cabeza): Lo que intenta es mantener el
objeto en la fovea, en el mismo lugar retiniano. Di la velocidad del objeto es lenta se
consigue mantener la imagen en la misma posicin de la retina.
No podemos utilizar el mismo mecanismo para explicar los 2 tipos de percepcin:
Explicacin 1: Mecanismo sistema imagen-retina
Explicacin 2: Mecanismo de ojo-cabeza.
MOVIMIENTO APARENTE: La percepcin del movimiento se produce
aunque el objeto no se mueve realmente. Que no haya objeto en
movimiento a pesar de que nosotros percibimos movimiento (percepcin
de movimientos aparentes). Es una ilusin que tiene mucha importancia.
Hay muchos tipos. Algunas clases son:
MOVIMIENTO ESTROBOSCPICO. Ilusin de movimiento
producida por estimulacin de distintas zonas de la retina en
diferentes momentos del tiempo. Es un movimiento ilusorio que
se produce cuando se estimulan dos lugares diferentes retinianos
en sucesin temporal. A poco que la distancia temporal de
estimulacin y la espacial sea adecuada.

MOVIMIENTO AUTOCINTICO: se produce cuando el


observador mira fijamente a un punto luminoso que carece de
referentes. Cuando uno intenta enfocar un movimiento esttico.
Necesita mantener movimientos oculares para enfocarlo, y
parapente comenzar a moverse de forma errtica (el objeto).

MOVIMIENTO INDUCIDO: es un caso de movimiento relativo


en el que un objeto esttico se ve en movimiento porque hay
otros objetos del entorno que se estn moviendo. Vemos en
movimiento algo que no est en movimiento y no vemos
movimiento cuando est dinmico.

POSTEFECTOS DE MOVIMIENTO. Cuando se observa


fijamente un objeto en movimiento, y a continuacin el objeto se
detiene, tiende a vrselo movindose en direccin opuesta a la

94

original. Cuando mira de forma persistente un objeto en


movimiento y cuando retira la visin parece que se est
moviendo en la direccin distinta en la que se mova.

Movimiento real. Sistema imagen-retina

La imagen de un objeto en movimiento recorre posiciones sucesivas en la retina.


Una explicacin consistira en postular la existencia de mecanismos detectores
del movimiento.
Estos modelos de detectores (de correlacin) fueron propuestos formalmente por
Reichardt en 1969. Su estructura implica dos receptores, una unidad de demora
y un integrador (correlatos).

t
Cor

Computan bien el movimiento cuando los


estmulos se mueven en la direccin
adecuada y tienen la velocidad adecuada.
Cuando el estmulo se mueve en la
direccin (o con una velocidad) inadecuada
las seales alcanzan el integrador en
momentos temporales diferentes: no se
produce deteccin.
Resultados de la selectividad direccional:
Adaptacin
Postefectos

t
Cor 95

Detectores de movimiento que estn especializados en determinar que una


imagen se est desplazando por distintos lugares retinianos.
Movimiento Reichard: Idea de correlacin (multiplicacin). Se basan en el producto de
la informacin de distintos lugares retinianos.
Tres capas de clulas:
- Capa de clulas de input ( entrada)
- Capa de clulas de demora
- Capa de clulas de correlacin
Una de las clulas de entrada est conectada con la clula de correlacin. Conecta con la
de demora y luego con la de correlacin.
El principio fundamental es el procedimiento de correlacin. Si llega la informacin a la
clula de salida procede de las dos clulas de entrada entonces se activa. Si llega en
momentos diferentes en el tiempo entonces la clula no se activa.
La clula de demora lo que hace es retener la activacin de la clula de entrada el
tiempo suficiente para que llegue la informacin al mismo tiempo (simultneamente). Si
esto se produce se activar.

(A. Kitaoka). Ilusin de movimiento producido por el


movimiento ocular

Modelos de energa

Adelson y Bergen (1985), Van Santen y Sperling (1985) y Watson y Ahumada (1985)
han propuesto modelos de energa basados en el modelo de detectores de Reichardt (Lu
y Sperling, 1994).
Estos modelos computan el movimiento a partir de dos entradas
que muestrean el campo visual en localizaciones espaciales adyacentes mediante filtros
de frecuencia espacial. El modelo introduce dos unidades de demora, una para el
receptor izquierdo y otra para el derecho. Un integrador multiplica la informacin

96

procedente del receptor correspondiente y del filtro de demora temporal. La salida de


cada canal es el promedio de actividad producido en una ventana temporal. La
diferencia entre las salidas de cada canal determina el movimiento percibido. Resultados
mayores que 0 indican que el estmulo se mueve hacia la izquierda, los menores que 0
indican que se mueve en sentido opuesto.
FE2

FE1

Capa de filtros de entrada

TF

TF

Xi

Der

(Demora) Filtros
temporales

Xd
(Correlacin) Capa de
correlacin

TW
por

Hay dos Capa de integracin


canales o
lneas de
procesamiento
definidas
filtro de entrada:
- Canal izquierdo o lnea de procesamiento de la
izquierda.
Canal derecho o lnea de procesamiento de la derecha.

TW

el

_
-

El filtro de entrada hace dos cosas:


-

Detectar el estmulo, hace un anlisis de las caractersticas espaciales


del estmulo y se activa.

El detectar calcula la derivada de la funcin de intensidad luminosa en el espacio.


Calcula la diferencia entre las intensidades adyacentes del estmulo.
Caractersticas:
-

Es especfico a la direccin del movimiento de derecha- izquierda. El


sistema visual debera tener mecanismos para cada una de los
movimientos que somos capaces de percibir.
- Este mecanismo es especfico para una velocidad de desplazamiento.
Estos mecanismos son superespecializados.
La existencia de estos mecanismos fue avaluada por ivestigaciones como la ilusion de
la catarata. ( Postefecto de movimiento). El agua parece desplazarse hacia arriba. Eso lo
que confirma que hay mecanismos direccionales , introduce elementows de fatiga.
Postefecto: Se interpreta en beneficio de mecanismos detectores de movimiento, se
rompe el balance de los movimientos hacia arriba y hacia abajo y luego se activa el
mecanismo no utilizado.
El movimiento de B y A produce siempre una salida positiva.

97

Son detectores de Reichard. Son simplemente detectores complejos que ensamblan dos
detectores en un mismo detector. Reduce el nmero de clulas de entrada y nos permite
que el detector sea bidireccional ( izquieda-derecha/ derecha-izquierda).
100
80
60
40
20
0
-20
-40
-60
-80
-100

150

80

100

70
60

50

50
40

30
20
-50

10
0
-100

-10

-150

Movimiento real. Sistema ojo-cabeza

Un problema no contemplado hasta ahora es que, a menudo, movemos


nuestros ojos simultneamente al movimiento del objeto. Una
consecuencia posible es que las posiciones retinianas son las mismas, a
pesar de lo cual sigue producindose la percepcin de movimiento del
objeto.
Para que la percepcin del movimiento sea correcta el sistema visual
debe considerar no slo el movimiento del objeto, sino tambin el de los
ojos y la cabeza.
Por qu los objetos estticos permanecen estticos cuando movemos los
ojos o la cabeza?
Lo que nosotros hacemos es mover los ojos para percibir el objeto. Informacin sobre el
movimiento propio puede entenderse de dos maneras:
1) Ya realizado
2) Movimiento programado (que voy a realizar).
La diferencia da igual a la teora aferente o eferente o teora de la descarga corolaria.
Las dos teoras son parecidas porque asumen que la percepcin del movimiento
aparente de una estructura que se llama comparador cerebral (compara informacin que
llega ).
-

Retina
Movimiento del observador El resultado de la comparacin es le
resultado perceptual.

La teora eferente dice lo que llega a la retina respecto al movimiento ocular del
observador que indica que el msculo ha realizado un movimiento.
Teora corolaria: Lo que llega es el programa motor que se va a realizar, que es lo que
se enva al computador y a los msculos implicados en la comparacin.

98

Programacin
motora

Teora de la descarga corolaria (Teuber)

Cuando se mueve el ojo pasivamente el mundo visual parece moverse, pero el


movimiento debera compensarse igual que si fuese voluntario, segn la teora
de la retroalimentacin. La imagen se desplaza por la retina, pero el sistema ojocabeza no contrarresta esa informacin.
Exponiendo los ojos a un flash luminoso se produce una postimagen, que no
puede moverse en la retina. Cuando los ojos se mueven pasivamente la
postimagen no se mueve, pero si se mueven voluntariamente, la postimagen se
mueve con los ojos, lo que indica que lo importante es la orden de moverlos.
En el mismo sentido, cuando se paraliza el ojo (Brindley y Merton, 1960), el
mundo parece moverse cuando se intenta mover los ojos.

El efecto autocintico proporciona ms apoyo para la teora de la descarga


corolaria (eferente): Cuando se observa fijamente un nico punto luminoso en la
oscuridad, aparenta moverse de forma errtica. La direccin del movimiento
depende de que se hayan forzado durante un tiempo corto (unos 30 s) los
msculos extraoculares en determinada direccin, puesto que se requieren
comandos anormales para mantener los ojos enfocando el punto luminoso
(Gregory, 1998).

99

Calcular la derivada:
El cuadradito es una funcin derivada en el espacio de intensidades luminosas en cada
lado.
( 5-5) ( 5-5) 1-1-1-1-1-1-1
0-0-0-0-0-0-00-0-0-0-0
La derivada 2 tiene dos valores distintos de 0. El borde est en medio de ellos. Justo en
el paso de 0 est el borde.
La nica caracterstica relevante en el estmulo en el cambio de intensidad.
El filtro temporal lo nico que hace es demorar a entrada de la informacin.
La clula de integracin hace lo que me llega de la izquierda menos lo que me llega de
la derecha. Tiene un detector positivo si el movimiento es de derecha a izquierda. Si es
al contrario el movimiento se dara un resultado es negativo.
Un modelo completo asume que en la va visual V1 tenemos detectores bidireccionales,
si lo giramos para que sea un detector vertical ser una direccin en positivo y otra en
negativo.
(Mecanismos de Reichard complejos en la va visual).

El enfoque de la percepcin directa:

Cualquier objeto aparece


conjuntamente un mosaico.

inmerso

en

un

contexto,

formando

100

Cuando se mueven los ojos (y la cabeza) cambia el mosaico retiniano


completo.
Si el gradiente de cambio es continuo a lo largo del mosaico, la
interpretacin ms razonable, sin necesidad de considerar
informacin muscular alguna, es que no hay movimiento del
objeto, pero s del observador. Por ejemplo, si el movimiento de
toda la matriz es grande, se interpretara que se ha producido un
movimiento sacdico y se producira la supresin del
procesamiento.
Si el gradiente del cambio muestra discontinuidades bruscas a lo
largo del mosaico, la interpretacin razonable es que hay
movimiento de algn objeto de la escena.

Movimiento aparente

La importancia del movimiento aparente queda perfectamente ilustrada cuando


caemos en la cuenta de que es la base de la industria del cine y de la televisin,
de los dibujos animados y de la simulacin de movimiento que se realiza en los
ordenadores. La percepcin del movimiento se basa en dos principios: la
persistencia visual y el fenmeno phi.
Persistencia de la visin:la retina es sensible a las fluctuaciones de la
intensidad luminosa, siempre y cuando se siten por debajo de una tasa
crtica: la frecuencia de fluctuacin crtica (FFC), que es mayor a mayor
intensidad luminosa y es mayor en la periferia que en el centro de la
retina. Normalmente por encima de 60 Hz una luz que flucta se percibe
como siempre encendida.
En el cine se proyectan 24 fotog/seg, pero cada uno de ellos es
interrumpido 3 veces por un obturador de 3 aspas, de forma que
la fluctuacin es de 72 encendidos por segundo (Hz). En la
televisin se presentan unos 25 fotog/seg, cada uno dos veces, lo
que da una tasa de 50 Hz, esto hace que a veces se perciba
parpadeante.
El parpadeo de baja frecuencia, como el de los videojuegos o el
de los estroboscopios de las discotecas, puede ser peligroso para
personas que sufran de epilepsia fotosensible, pero tambin puede
alterar el comportamiento de personas no epilpticas,
dificultndoles la percepcin y produciendo nusea, vmitos,
pnico, confusin e incluso prdida de conciencia (flicker
vertigo, Rash, 2004). FFC y encefalopata heptica mnima:
umbral FFC menor en MHE (39 Hz).

Movimiento aparente: Para producirlo tenemos que estimular la retina en dos lugares y
en dos momentos diferentes. Una primera variable ser la distancia entre los lugares de
la retina estimulados, el intervalo de tiempo que hay entre estmulos.
Otra variable es la duracin, el tiempo que presentamos un estmulo y otro estmulo.

101

Lo que ms tiene que ver es el intervalo entre estmulos. En funcin de si el intervalo es


de 30 mseg o menos entonces lo que conseguimos es que el observador perciba que los
2 estmulos hayan sido percibidos a la vez a partir de 30 mseg 60 mseg sin incluir el
observador detectar el movimiento parcial: parece que los dos estmulos se mueven en
direcciones distintas hacia el centro. Es una percepcin de salto hacia no de un
movimiento real.
Justo en 60 mseg tenemos el intervalo ptimo: Que la apariencia del movimiento
estroboscpico es idntica al movimiento real: la sensacin es que el estmulo se
desplaza de una posicin a otra. A partir de hay aproximadamente unos 20 mseg el
sujeto tiene la impresin de desplazamiento pero va siendo sustituida por la de sucesin
( no movimiento) . Primero aparece uno en una posicin y luego otro en otra posicin.

Movimiento estroboscpico. El fenmeno fue descubierto por Exner


(1875) y estudiado extensivamente por Wertheimer (1912) y Korte
(1915). Y ms recientemente por Kolers (1972).
La percepcin de movimiento se consigue no moviendo objetos reales sino
presentando distintos objetos durante un corto tiempo en lugares y
momentos temporales diferentes. Por tanto, el objeto aparece y
desaparece en un punto A y tras un tiempo (ISI) aparece y desaparece en
un punto B, situado a cierta distancia (ISD) de A.
Menos de 30 msegs: No movimiento. 30-60: movimiento
parcial;
60: ptimo; 60-120: movimiento phi, ms de 200: sucesin, no
movimiento.
Movimiento estroboscpico: Es un detector en movimiento. Los detectores de
movimiento tienen clulas de entrada que estn separadas y lo que ocurra entre los 2
receptores es irrelevante llegan a las clulas de integracin simultneamente.

Movimiento inducido: un objeto estacionario se percibe movindose en


la direccin opuesta a otro objeto adyacente que se est moviendo
realmente. Tpicamente, la luna se percibe movindose, cuando hay
nubes, aunque de hecho, su movimiento est por debajo del umbral.
Reinhardt-Rutland (1988, Ehrenstein, 2003): El efecto parece
deberse a la accin de dos principios relacionados con el
movimiento relativo (es ms fcil detectar objetos en movimiento
cuando hay objetos estticos alrededor) y con el marco de
referencia (el objeto mayor sirve de referente).
Un caso especial de movimiento inducido es la automocin inducida: el
observador se percibe a s mismo en movimiento, aunque de hecho no se
est moviendo. Tpicamente ocurre en las estaciones de autobuses, de
trenes, etc., situaciones en las que hay un cambio relativo en la escena,
pero no contamos con informacin suficiente para interpretarlo. Si el

102

objeto mvil ocupa la mayor parte de la escena, nuestra experiencia


visual es la misma que cuando nos estamos moviendo.
Es un movimiento ilusorio porque el objeto estacionario se percibe en movimiento y
frecuentemente el objeto que est en movimiento se percibe esttico. Cmo podemos
explicar esto?
Luna en un claro de nubes: Tiene la impresin de que la luna est moviendo.
Intervienen dos factores:
-

Un factor relativo al umbral de movimiento: Se mide en relacin a la


velocidad mnima que se tiene que percibir para captar el
movimiento. La velocidad puede ser menor si el objeto que se mueve
est acompaado por objetos estticos. Nuestra capacidad para
detectar el movimiento crece cuando los objetos en movimiento estn
acompaados por objetos estticos.
Segundo factor: dos personajes en un coche, el coche est parado y
esta moviendo el marco de referencia (los edificios). Los marcos de
referencia del mundo son estticos y si es el que se mueve el sujeto lo
atribuye a los objetos que ve.

La combinacin de estos factores es lo que hace que aparezca el movimiento inducido.


Relacionado con este efecto est la automocin inducida, el es el propio observador el
que se percibe en movimiento. Si el observador tiene los pies en el suelo no se da este
efecto. Si esta en un coche y si el de al lado empieza a moverse el percibe que es el l el
que se est moviendo. Para que esto suceda debe ocupar todo el campo visual del
observador el objeto que se est moviendo.
Movimiento biolgico.
Introducido por Johansson (1972, 1975). Un conjunto de puntos luminosos sobre las
principales articulaciones de una persona, por lo dems en
completa oscuridad, es interpretado como un conjunto aleatorio
de puntos cuando la persona est esttica, pero rpidamente se
percibe su caminar cuando se pone en marcha.
Cutting et als. (1988). Es muy fcil identificar hacia qu
direccin camina la persona.
Cutting y Proffitt (1981) y Mather y Murdoch (1994). Tambin
es fcil identificar el sexo del caminante, quiz debido a que el
centro de gravedad es ms bajo en los hombres que en las
mujeres.

La percepcin del movimiento de seres vivos. Se produce no slo cuando los seres
vivos se estn desplazando en la escena sino cuando estn en otras situaciones.
Puntos luminosos de un actor sobre fondo negro.
La capacidad de distinguir el movimiento biolgico es muy fcil con muy poca
informacin.
Introducir dos vas de procesamiento:

103

1 va de procesamiento de la forma de los objetos (V1): Crtex visual primario.


STS. Surco temporal superior.
La va de procesamiento postula que hay mecanismos de deteccin
V1: Orientacin
V2, V4: Caractersticas ms complejas.
IT, STS, FA: Detectan patrones enteros.
Va siendo cada vez mayor conforme avanzamos en la va hasta el detector de objetos
(que cabe la persona entera).
1 va del procesamiento del movimiento:
V1/2, MT: movimiento local.
MT, MST, KO: detectores con mayor campo
receptivo y que engloban varios puntos
simultneamente (viendo).
STS, FA; Detectores de movimiento global
Es absolutamente imprescindible asumir 2
vas de procesamiento y conforme se va
avanzando en la va se va abarcando ms.

Descarga corolaria y esquizofrenia


Ford et al (2001, Ford y Mathalon, 2005). Potencial N1 en Cz

La descarga corolaria (que se produce cuando se habla voluntariamente)


contribuye a reducir la activacin del crtex auditivo en los controles,
pero no en esquizofrnicos. Este fallo en la descarga corolaria podra ser
el origen de las alucinaciones auditivas, del fracaso en distinguir si lo que
se oye es autogenerado o simplemente escuchado.

104

TEMA

5.

PERCEPCIN

DE

FORMAS Y PATRONES

1. La obtencin de los elementos primitivos de la imagen.


Detectores de rasgos.
Canales de frecuencia espacial
Teoras computacionales:
Esbozo primario en bruto: Algoritmo de Marr y Hildreth.
Sntesis
2. La organizacin perceptual.
La aportacin de la Gestalt
La asignacin de lmites: mximos y mnimos de curvatura.
Goldstein, E.B. (op. cit). Cap. 5
Marr, D. (1985). La visin. Madrid:Alianza.
Matlin y Foley. Cap. 5.
Rock, I. y Palmer, S. (1991). El legado de la Psicologa de la Forma.
Investigacin y Ciencia, 173, 50-57.

105

Palmer, S. (1999). Les thories contemporaines de la perception de Gestalt.


Intellectica, 28, 53-91.
Kimchi, R., Behrmann, M. y Olson, C.R. (2003). Perceptual organization in
vision. LEA

Objetivo: Qu anlisis de la imagen retiniana permite identificar la forma de


los objetos?
Situacin inicial: los cambios de intensidad luminosa y composicin espectral
de la luz nos dan informacin sobre la estructura espacial de los objetos, por
tanto, nos informan de sus bordes.
Mecanismo inicial: Estructura de los campos receptivos.
Sin embargo:
los cambios de intensidad no siempre estn asociados a bordes, dependen
tambin de:
orientacin de la superficie y reflectancia
Curvatura de la superficie
otras: i.e.: una sombra sobre un objeto, texturas distintas
Cmo interpretar la funcin de los campos receptivos?
Cambios en la intensidad luminosa y en la proyeccin espectral. El observador tiene que
fijarse en las dos cosas. Nos quedamos sin los colores y lo simplificamos quitando el
color.
La informacin que tiene el observador es principalmente los cambios de intensidad
luminosa De qu nos informan? De los bordes de los objetos y sin ellos es imposible
percibir la forma. Los bordes son imprescindibles.
Los cambios de intensidad no slo son los bordes, sino tambin hay una sombra que
produce en el objeto en funcin de la orientacin del objeto respecto de la fuente
luminosa.
Los cambios de la intensidad luminosa nos indica la presencia de bordes pero no solo de
ella. El sistema visual tiene que descartar los cambios de intensidad luminosa no
importantes, los que nos se deben a un borde.

De que mecanismo tenemos para describir los cambios de intensidad luminosa? Por
cualquier clula que tenga 2 zonas: simple, ganglionar.
Que se cancelan entre si: son ideales para detectar los cambios de intensidad luminosa.

Cmo analiza el observador lo que la imagen contiene para percibir la forma de los
objetos?
- En la imagen, lo que hay es una proyeccin bidimensional de los objetos 3D. El
observador tiene que crear, a partir de esta informacin una imagen tridimensional.
La situacin de partida, lo que contiene la imagen (informacin sobre intensidad
luminosa y cambios en la misma, cambios en la composicin espectral de la luz). El
observador se vale de estas dos cosas: prescindimos de la informacin relativa al color
puesto que podemos percibir formas en ausencia de color.
La informacin es relativa, fundamentalmente, con los cambios en intensidad luminosa,
a partir de los cuales, llega a la forma del objeto. Estos cambios nos informan de los
bordes de los objetos, sin esto, es imposible construir la forma del objeto; pero estos
cambios no se producen slo en los bordes del objeto, sin esta, es imposible construir la

106

forma del objeto; ( Ej: pueden producirse por una sombra que se proyecta sobre el
objeto, que introduce en cambio en la intensidad luminosa, en funcin de la orientacin
de la superficie del objeto respecto de la fuente luminosa). Por lo que, no cualquier
cambio de intensidad luminosa indica un borde, por el sistema visual tiene que desechar
los cambios no significativos que no indican la presencia de un borde debido a otros
factores.
Qu mecanismos tenemos para descubrir los cambios en intensidad luminosa?
Cualquier clula con campo receptivo con dos formas, una de la cual se opone a la otra.
- Campo clula de campo receptivo de dos zonas que se ayudan entre
s, importante para detectar los cambios en intensidad luminosa.
-

Cambios en intensidad luminosa


-

Significativo ; producido por el borde del objeto

Irrelevante: No contribuye a construir la forma del objeto

El sistema visual se queda con los cambios significativos en intensidad.

La deteccin de rasgos
El sistema visual dispone de clulas con campo perceptivo:
- Una primera posibilidad es identificar que las clulas funcionan con detectores de
cambios de intensidad luminosa significativos , determinados rasgos; detectores de
caractersticas presentes en el objetos ( conjunto de clulas que analizan los objetos en
busca de la presencia de rasgos en el mismo que pertenezcan a bordes , para luego,
ensamblar esta informacin).

Clulas ganglionares
Clulas en el Ncleo geniculado lateral, que identifican cambios
Clulas simples (detectores sobre segmentos simples de trozos de
bordes).
Clulas complejas
Clulas complejas de tipo II (hipercomplejas): detectan ngulos
luminosos, cambios de intensidad luminosa en ngulos.

(Este conjunto de clula, que suficiente para, el anlisis del objeto)


- Todo esto es falso si tenemos en cuenta que las tareas determinan la interpretacin de
los resultados experimentales.
Esta teora se realiza con patrones con estmulos artificiales, por ejemplo (diapositiva):
patrn con enrejado de onda cuadrada:

107

- Los cambios en intensidad luminosa, son todos relevantes En esto lo que sucede con
escenas naturales?
- En las escenas naturales, la estructura de los cambios en intensidad luminosa es
irrelevante. Los detectores no discriminarn entre seal y ruido, si tenemos en cuenta
todos los cambios como relevantes.
Hay algo intrnseco si a lo largo del proceso que nos obligue a admitir que si la clula
se activa, es un detecto de ese tipo de barra?
-No, lo que se puede interpretar, es que hay algo en el estmulo que activa al detector,
pero no que este sea el que se activa concretamente por esta intensidad.
-

Propuestas alternativas:
A) Propuestas de los canales psicofsicos:
B) Computacionales ( Marr)
C) Principios de los 90 , surge alternativas a ambas:

1. anlisis de texturas
2. Estructuras a partir de la forma

Desde la fisiologa (Hubel y Wiesel) se ha propugnado la existencia de clulas a


distintos niveles de la va visual que funcionaran como detectores de
caractersticas:
puntos y barras luminosas: ganglionares y LGN on-off y off-on. Se
asocian a inhibicin lateral (o antagonismo lateral, Levine y Shefner,
1991).
crtex:
simples: barras de orientacin especfica
complejas: detectores de lneas en movimiento con orientacin,
direccin de movimiento y longitud mnima especficos.
hipercomplejas: son sensibles a ngulos luminosos de caractersticas
especficas y a segmentos que terminan dentro del campo
receptivo (end-stopped cells)

Hay acuerdo sobre la estructura de los campos receptivos, pero no sobre su


significado.
El inconveniente ms importante que tiene
asumir que las clulas son detectores de
caractersticas:
se trabaja con estmulos artificiales
en los que los bordes de los objetos
estn especificados de forma clara.

Sin embargo, la

108

Situacin es bastante
diferente en imgenes
Naturales:

Hay acuerdo sobre la estructura de los campos receptivos, pero no


sobre su significado.

Enrejado: Se caracteriza en los cambios de intensidad luminosa son relevantes


(significativo) Eso es lo que sucede en escenas naturales? Fotos de Einstein. Muchos
de ellos son irrelevantes. En casos naturales hay muchos cambios que son irrelevantes.
Los detectores se activaran en cambios relevantes como irrelevantes.
No discrimina entre seal y ruido.
Que tu le presentes una barra y la clula se active no siempre es que sea un detector de
la barra. Muy pocos aos despus se propusieron otras alternativas.

La relacin entre las estructuras de las escenas y las de las imgenes es mucho
ms compleja de lo que la teora de rasgos afirma.
Interpretaciones alternativas sobre las funciones de los campos receptivos:
Canales psicofsicos
Enfoque computacional de Marr: deteccin de lmites.
Alternativas computacionales:
Anlisis de texturas
Estructura a partir de la forma

Canales psicofsicos
La forma de un objeto es el ensamblaje de una multiplicidad de primitivas
espaciales.
Las primitivas (los ladrillos) de la teora de la frecuencia espacial no son
segmentos, ni bordes, son patrones bidimensionales cuya luminancia vara segn
una funcin seno definida en el dominio espacial: enrejados sinusoidales.
Cada primitiva es caracterizada completamente por cuatro parmetros:
Frecuencia espacial
Amplitud o contraste
Fase
Orientacin

109

Se entiende por percepcin de la forma al ensamblaje de un conjunto de primitivas


abstractas (se describen matemticamente): funciones cosenoidales o sinusoidales .
Tienen una traduccin real y esos patrones que describen las funciones cosenoidales son
enrejados sinusoidales. Para esta teora es el ensamblaje de patrones sinusoidales que
nos permiten describir el objeto.
1) Frecuencia espacial: Nmero de ciclos (alternancias claro / oscuro) por cm2. Es
frecuente que se emplee una medida con respecto objeto-sujeto (ciclos /gav).
2) Amplitud: Distancia entre primer mximo y primer mnimo ( En este contexto se
suele usar ms bien el contraste):
C: Lmax-Lmin
Lmax+Lmin
El contraste puede tomar valores entre 0 y 1.
Contraste:
0: Intensidad homognea.
1: Mximo cambio posible entre barra clara y oscura.
Se expresa en porcentaje: 80% de contraste.
El contraste determina la sensibilidad del sujeto al estmulo.
3) Fase: Distancia entre origen del estmulo y el lugar donde se alcanza el primer
mximo de intensidad. Se puede expresar en grados o en radianes.
4) Orientacin: La lnea de la formulacin sinusoidal y el eje horizontal.
Apuntes clase:
-

Se apoya en entidades abstractas para explicar la percepcin de la


forma.
Definicin de forma: Es el ensamblaje de un conjunto de primitivas
ladrillos, estas son abstractas en el sentido en que se describe
matemticamente con las funciones cosenoidales o sinusoidales (estas
funciones tienen una traduccin real, describen realmente patrones de
enrejaos /enrejados sinusoidales). Agregacin de un conjunto de
patrones sinusoidales que nos permiten describir la forma del objeto.
Estos se describen a partir de cuatro parmetros:

1) Frecuencia espacial del enrejado: (Nmero de ciclos / alternancias claro


oscuro por mitad de amplitud).
- Se emplean ciclos por grado de ngulo visual.

110

2) Amplitud (se expresa en %).Distancia entre un mximo y un mnimo, en este


contexto, se suele hablar ms bien de contraste, utilizando la expresin
matemtica de este:
-

Contaste 0: No cambio de intensidad.


Contraste 1: Mximo cambio posible entre la barra clara y la
oscura.
El contraste es importante, puesto que, determina la sensibilidad del
observador a ese estmulo.

3) Fase: Distancia entre el origen del estimulo (izquierda) y el lugar que se


alcanaza el primer mximo. Se puede expresar en grados o radianes.
4) Orientacin: ngulo que se forma entre la lnea de la modulacin sinusoidal.
(la que describe la funcin sinusoidal perfecta).
Se puede analizar cualquier imagen as?
-

Si, se puede analizar. El anlisis se denomina Fourier. Se puede


utilizar para describir cualquier patrn, por complejo o simple que sea
, cmo?

Canales psicofsicos: Anlisis Fourier de la imagen

Pueden estas primitivas agregarse


para realizar la descripcin de un
patrn complejo?
de
onda
Enrejados
cuadrada...
Y patrones ms complejos

Se puede analizar cualquier estmulo en enrejados sinusoidales? Si, con el


anlisis de Fourier. Se puede utilizar para describir cualquier por complejo o simple que
sea.
Cmo se hace el anlisis del primer enrejado? Sumar un nmero infinito de enrejado
sinusoidales elementales.

111

1) Funcin seno que hay que sumar:


Onda fundamental que tiene la misma frecuencia que el
patrn de enrejado y la misma amplitud o contraste.
2. Patrn original.
3. Se suma este, el patrn fundamental (funcin seno).
2) Componente. Armnico. 1 Armnico. Tiene una
frecuencia que es mltiplo impar de la frecuencia
fundamental y la amplitud es el recproco de ese nmero.
F= 3f
A= A
3
2 armnico: La frecuencia es 5f y la amplitud es la amplitud partido 5:
f: 5f

A: A/5

Se suma el fundamental y los armnicos se suman las energas de los armnicos en


todos y cada uno de los puntos. Con el anlisis Fourier es muy simple determinar los
componentes de un enrejado. Siempre lo analizamos con funciones seno.

Apuntes de Gema:
-

Para obtener el enrejado, hay que sumar un nmero infinito de


frecuencias seno, (enrejados sinusoidales elementales).
(En la teora). En la prctica con un nmero finito.

Cules son las funciones seno a sumar para obtener el patrn?


Sumar la onda fundamental que tiene igual frecuencia que el patrn
de enrejado de igual amplitud o contraste.

Se puede reconstruir la imagen original?


-

Componente armnico: Es el primer armnico, caracterizado por


una frecuencia multiploimpar (1, 3, 5) de la frecuencia
fundamental, y una amplitud recproca de ese nmero. Ej: La
frecuencia es f, el primer armnico es 3f, si es A: amplitud: A/3; el
segundo armnico f: 5f: A/ 5.

Cmo se mezcla el fundamental y los armnicos:

112

La energa se suma punto a punto (siempre que hablamos de luz, la


energa se suma).
(Suma de los armnicos y el fundamental).

Es posible, por tanto, determinar canales que son los compuestos de un patrn de
enrejado, Pero Qu ocurre con patrones reales /naturales?
-

Si, se puede saber cuales son las funciones sinusoidales necesarias,


para construir cualquier imagen. Caracterizacin de este anlisis.

a) Quitando frecuencias espaciales altas: imagen borrosa, para ello se aplica filtro
de frecuencias espaciales denominadas de paso bajo ( pasan las frecuencias
espaciales e impiden presentar las altas= a multiplicar altas aumentan las
frecuencias por cero).
b) Quitamos frecuencias espaciales bajas: Filtro de paso alto: No hay borrosidad,
sino mantenimiento de los detalles, y prdida de contraste.
c) Filtros de paso de banda: Eliminamos las altas y bajas frecuencias y se quedas
las bandas intermedias.
Lo que propone la teora, es que el sistema visual se comporta como un analizador
Fourier: la funcin de las clulas a lo largo de la va visual, es analizar la frecuencia
espacial de estmulo.
Adems, asume que la determinacin de dichas frecuencias requiere que el sistema
visual contenga dos espectros:
- De amplitud( Indica la amplitud de cada una de las frecuencias
espaciales presentes)
- De fase: (fase que tiene cada una de las frecuencias espaciales).

Fase: Distancia origen y primer mximo: A partir de aqu, especificarlo. Cuando


tenemos ambos aspectos, decimos que tenemos el espectro de Fourier de la imagen.
(Aqu termina el anlisis).
Sntesis: Invertir el anlisis, es decir, juntar /sumar las frecuencias espaciales con su
amplitud, fase y orientacin concreta para volver a obtener la imagen. Hecho esto, se
comprueba que no se pierde nada de informacin. Los clculos a lo largo de la va
visual (actan como analizadores de Fourier), por lo menos hasta V1, se comportan
como detectores de frecuencias espaciales, cada una sensible a una frecuencia
espacial, orientacin y ancho de banda determinada ( se activan tambin por debajo o
por encima de esta frecuencia: esto es el ancho de banda de la clula: se activa en un
rango de frecuencia no es hiperespecfica).
- Hay un buen nmero de analizadores de este tipo que estn
solapados, por que dos analizadores se pueden activar: a la vez con
la misma frecuencia.
- Por encima de V1>Pueden haber analizadores.
- Estos pueden conectar con un canal de procesamiento comn.

113

Canales Psicofsicos: Anlisis Fourier

Imagen natural: Taza: El nmero de frecuencias es mayor que el enrejado. Se calcula la


correlacin en el enrejado.
Sea complicada o no la escena podemos analizarla con el mtodo de Fourier sin ningn
problema. Se puede saber cuales son las funciones sinusoidales que forman la imagen.
Foto de la Alambra: Otras a las que le ha quitado frecuencias espaciales de la imagen. (
Cada vez ms borrosa) . Para quitarle las frecuencias se le aplica un filtro de paso bajo.
Filtro de paso-alto: Deja pasar las frecuencias espaciales altas y filtra las bajas ( perdida
de los grandes contrastes).
Filtro de paso de banda: Elimina las altas y las bajas y se deja las intermedias.
Con eso se demuestra que quitando frecuencias espaciales a la imagen cambia
drsticamente la imagen.

El anlisis consiste en computar dos espectros: el de amplitud y el de fase.


El espectro de amplitud contiene la amplitud de cada componente con una
frecuencia espacial y orientacin determinadas
El espectro de fase contiene la fase de cada componente con frecuencia espacial
y orientacin determinadas.

Cualquier imagen puede recomponerse


a partir de estos dos espectros. La
invertibilidad del anlisis garantiza
que los espectros contienen toda la
informacin sobre la imagen. No es
seguro que ocurra lo mismo con los
anlisis basados en caractersticas.

El sistema visual se comporta como un analizador


Fourier. Es detector de las frecuencias espaciales que
estn presentes en la imagen y asume que la
determinacin de las frecuencias espaciales requiere que
el sistema visual compute dos espectros:

114

Espectro de amplitud: Nos indica la amplitud que tiene cada uno de


las frecuencias espaciales presentes en la imagen
- Espectro de fase: La fase que tiene cada frecuencia espacial presente
en la imagen ( medir la distancia entre el origen y el primer mximo)
Cuando tenemos los 2 espectros decimos que tenemos el espectro Fourier de la imagen
lo siguiente es el anlisis:
-

Sntesis: Invertir el anlisis: (juntar las frecuencias espaciales con su amplitud, fase y
orientacin concreta para volver a obtener la imagen original): As se demuestra que no
se ha perdido nada en la imagen reconstruida.
La teora simplemente dice que hay un buen nmero de analizadores que estn
solapados. Hasta V1 tendramos esos analizadores por encima de V1 puede ocurrir.
Que haya ms analizadores.
que haya menos analizadores que se conectan para forma una va comn
Hasta V1 es sistema visual se dedica a obtener la amplitud, la fase y la orientacin que
tiene la imagen.

Canales de frecuencia espacial

El anlisis de la imagen es realizado por una multiplicidad de canales


psicofsicos solapados sintonizados a diferentes frecuencias espaciales y
orientaciones.
Un canal psicofsico es un conjunto de neuronas (no especificadas) sensible a un
rango limitado de frecuencias espaciales y orientaciones. (Mechler, Reich y
Victor (2002). Detection and Discrimination of Relative Spatial Phase by V1
Neurons. The Journal of Neuroscience, 22:6129-6157

A lo largo de la va visual hay canales psicofsicos que se dedican a ampliar la presencia


en la imagen de determinadas frecuencias espaciales (amplitud, fase y orientacin, y las
mismas en la imagen) los canales psicofsicos estn sintonizados para la deteccin de
determinados frecuencias espaciales. Los canales se activan tambin si en la imagen hay
frecuencias espaciales sitiales a aquellas que se estn sintonizando).
La propuesta implica que los canales estn solapados. Los canales pueden activarse a la
ves ante la misma frecuencia.

115

Qu es un canal? Conjunto de neuronas ubicado a lo largo de la va visual (entre


clulas ganglionares retinianas, y el Crtex visual estriado y V1 por encima de V1 el
anlisis se realiza en otros trminos.

Evidencia sobre los canales psicofsicos

Adaptacin selectiva de los canales (Blakemore y Campbell):


1) Determinar la funcin de sensibilidad al contraste para cada sujeto
2) Presentar una frecuencia espacial durante un tiempo suficientemente
largo para intentar que el canal correspondiente se adapte.
3) Volver a medir la funcin de sensibilidad al contraste.

Experimento: Un canal sensorial pierde eficacia cuando es estimulado de forma


contina a lo largo del tiempo: adaptacin este es selectiva al tipo de estmulo que se le
ha presentado.
Partiendo de esto utiliza la funcin de sensibilidad al contraste, para determinar la
existencia de canales psicofsicos a la va visual: 3 etapas:
1) Determinar la funcin de sensibilidad al contraste para cada sujeto.
2) Aplicar los sujetos la adaptacin selectiva: presentacin de un determinada
frecuencia espacial/ enrejado sinusoidal con frecuencia espacial y nivel de
contraste concretos. Si hay a canal psicofsico encargado de detectar esa
frecuencia espacial, hay sensibilidad a la misma y a frecuencias espaciales
semejantes, se reduce, (el umbral de contraste se incrementa). Si no existe canal:
no hay cambio.
1) Evidencia preadaptacin.
2) Adaptacin alto
contraste.
3) Evaluacin postadaptacin

2) Adaptacin a alto contraste


1) Evaluacin pre-adaptacin
3) Evaluacin post-adaptacin

Reduccin en t sensibilidad al contraste en las frecuencias espaciales entrenadas.

116

Adaptacin al canal a cual frecuencias concretas. Observan cambios en sensibilidad a


frecuencias cercanas a esta.
Tienen en cuenta la orientacin del estmulo.
( 1971). Mide el umbral de contraste para estmulo de enrejados de onda cuadrada (
compete por un fundamental y armnico).
-

Medimos el umbral de contraste pero estimulo al enrejado sinusoidal


(mnimo componente) el fundamental del primer enrejado) : amplitud
y frecuencia.

Si hay un detector a una frecuencia espacial del fundamental el


umbral diferencial es igual para ambos: el umbral est determinado
por el fundamental mientras que el resto de componentes son
irrelevantes.

En V1 se ha descrito neuronas y puede comportarse como canales psicofsicos


detectores de frecuencias espaciales y tienen ancho de banda.

Evidencia sobre los canales psicofsicos

Se produce tambin adaptacin a la orientacin (Bradley, Seitkes y De Valois,


1988)
El umbral de deteccin de un enrejado cuadrado no difiere del umbral de un
enrejado sinusoidal con la misma frecuencia y amplitud que el fundamental del
primer patrn (Graham y Nachmias, 1971)

ODonnel et al (2002).
Los esquizofrnicos muestran un dficit de procesamiento sensorial,
especialmente en frecuencias espaciales bajas, probablemente por anomalas en zonas
del hemisferio derecho ligadas a la percepcin espacial y a la atencin.

117

Teoras computacionales: La aproximacin de Marr

Apuntes Gema:
Marr divide el proceso visual en cuatro etapas (cada una realiza una serie de
operaciones con cada entra que recibe y ofrece a la siguiente, una salida: etapas
jerarquizadas:
1: Obtencin del esbozo primario bruto, cuyo objetivo es detectar las primitivas
de la imagen a partir de las cuales se obtiene las representaciones de la imagen de los
objetos segmentos de borde, manchas y terminaciones de barras.
2: Esbozo primario completo: Los elementos primarios se agrupan entre s
constituyendo unidades de mayor tamao y detectando la textura de la superficie.
3: Representacin 2 D: Representacin tridimensional del objeto centrada en
el observador (coordenadas de las distintas partes del objeto estn referidas al
observador: representacin subjetiva).
4: Representacin tridimensional: Los distintos elementos que componen el
objeto, estn referidos al propio objeto.
Marr supone que la representacin 3D, es la nica en explicar cmo somos
capaces de reconocer objetos.

Esbozo primario en bruto: deteccin de las primitivas: segmentos de borde,


terminaciones, manchas y barras (velocidad y direccin de movimiento,
contraste del color).
Esbozo primario completo: agregacin de elementos primitivos (caracterizacin
de la textura).
Representacin 2 -D: representacin con coordenadas centradas en el
observador.
Representacin 3-D: representacin con coordenadas centradas en el objeto.

118

Marr divide el proceso visual en 4 etapas (cada una realiza una seria de
operaciones y ofrece a la siguiente una salida: etapas jerarquizadas:
1) Obtencin del esbozo primario en bruto cuyo objetivo es detectar otras
primitivas de la imagen, a partir de las cuales se obtiene la representacin de la imagen
de los objetos, segmentos de borde, manchas, terminaciones o barras.
2) Esbozo primario completo: Los elementos primarios se agregan entre s
constituyendo unidades de mayor tamao y detectando textura de la superficie.
3) Representacin 2 D: Representacin tridimensional del objeto. Entrada en
el observador (coordenadas de las distintas partes del objeto est referidas al
observador: representacin subjetiva.
4) Representacin tridimensional: Los distintos elementos que componen el
objetivo estn referidos al propio objeto.
Marr supone que se representa en 3D es el nico en explicar como somos
capaces de reconocer objetos.

El esbozo primario en bruto

El esbozo primario tiene que especificar en qu lugares de la imagen se


producen cambios significativos en su intensidad.
Este objetivo se alcanza aplicando algn conjunto de algoritmos de deteccin a
la imagen.
La imagen debe entenderse como una matriz de niveles de gris, que se obtiene
midiendo la intensidad luminosa en cada punto de la imagen (en cada pxel).

254696452
964202469
254696452

119

Tiene que indicar donde hay cambios significativos en intensidad luminosa en la


imagen.
Imagen: Es una matriz bidimensional que contiene informacin a cerca de la
intensidad luminosa de cada uno de los puntos de la imagen (nivel de gris que contiene
la imagen).
(Conjunto organizado de puntos. En filas y columnas). Cada fotorreceptor
representa un punto de la imagen).
-

Cualquier imagen no es ntida: (no est representada en ntido).


Cualquier sistema neural tambin tiene ruido intrnseco.

(Imagen contiene cambios en intensidades detectados a otros factores irrelevantes-.


El sistema visual las suprime suavizando la imagen. Sustituyendo los valores originales
de intensidades por nuevos valores teniendo en cuenta los antiguos.
Para suavizar hay que tener en cuenta:
-

Distancia anchura del punto a considera.


Todos los pixels dentro de esta anchura. Valor=?
Si valen igual el suavizado es la media del entorno.
Si no valen igual Cul es la contribucin de cada uno de los pixeles
del entorno?

Decimos en entorno y la funcin de pesos para relizar el suavizado:


(Centrado en el punto que nos interesa y va reduciendo valor con forme ms lejos se
encuentra de ella el resto de puntos)
Funcin de pesos: Centrada en el punto que nos interesa y va reduciendo valores
conforme ms lejanos se encuentran el resto de puntos. Asumimos la gausiana/ normal.
La imagen es bidimensional, por lo que la funcin gausiana tambin tiene que serlo.
Filtrado de la imagen: Multiplicacin de pesos por los valores de intensidad de los
puntos (por suavizar la imagen).

Esta idea de la imagen como una matriz de niveles de gris, descarta la


informacin referente al color.
Cualquier imagen necesita ser suavizada debido a las fluctuaciones de
intensidad, que no constituyen bordes o lmites reales del objeto (ruido).
La suavizacin se realiza sustituyendo cada pixel por el promedio ponderado de
su entorno. Uno de los operadores de suavizado ms interesantes es el gaussiano
bidimensional (Fisher, Perkins, Walker y Wolfart, 1996). Por ejemplo, un filtro
correspondiente a una gaussiana de 1.4 sera:

2 4
4 9
5 12
4 9
2 4

5
12
15
12
5

4
9
12
9
4

2
4
5
4
2
120

Suavizado

Imagen

Filtro

Imagen
Filtrada

Imagen: El centro del filtro es 15, lo ponemos encima del 4 (verde). Lo que hacemos es
poner los pesos en el punto de la matriz donde esos pesos van a operar.
2x6= producto. Sumamos esos productos y dividimos por la suma de los valores del
filtro. El resultado es que tenemos incrementado su intensidad luminosa.
Consiste en poner el filtro sobre todos y cada uno de los puntos de la imagen y hacer la
multiplicacin. Reducimos el tamao en 1x1.
El suavizado: convolucin entre la imagen y el filtro del matemtico.
La anchura de la gausiana pude ser una decisin fundamental para el suavizado de la
imagen.
Apuntes Gema:

Cmo se hace el suavizado?


Imagen: Matriz de intensidades luminosas (valores de gris)

121

Filtro: (funcin de filtros)


-

Cogemos el filtro y lo ponemos encima de la matriz haciendo que el


centro del filtro coincida con lo que queremos suavizar.
Filtro 15. Imagen 4. Ponemos los pesos en el punto de la matriz
donde van a operar.

Multiplicamos la matriz por cada uno de los pesos correspondientes, sumamos los
productos y dividimos por la suma de los valores del filtro.
- Resultado del suavizado: Incremento de intensidad luminosa.
El suavizado, matemticamente, es la convolucin entre la imagen y el filtro de la
funcin de pesos.
La anchura de la gausina puede ser importante a la hora de suavizar.
Efecto de aplicar diferentes suavizados a una misma imagen (Ej.: diapositiva de
Einstein).
-

Imagen suavizada con cuatro funciones de pesos que difieren en la


anchura).
Negro: peso= 0; incremento de intensidad luminosa (el entorno es
limitado) ms peso.
En el centro de la funcin de pesos, el peso es mayor y decrece
conforme nos alejamos.
Cuanto mayor es el rea blanca/ gris, ms anchura tiene la funcin
de pesos.

Qu ocurre cuando se aplica la funcin de pesos ancha a la imagen original?


-

Parte de la imagen no se modifica (cuanto ms se acerca a 0 ms


informacin se pierde).
El resto, suavizado (reduccin de diferencias en intensidad
luminosa): efecto de aplicar un filtro de este tamao en el suavizado
consiste en eliminar los detalles de la imagen (reducir el contraste:
cambia en intensidad se magnifican los grandes rasgos de la cara.

Filtro del original: aparecen detalles finos.

Filtro estrecho: Se magnifican los detalles de la imagen (no eliminan


los detalles, sino que los realzan: deshace los grandes cambios en
intensidad luminosa).

Los filtros anchos resaltan los grandes contrastes.

Si los suavizados producen efectos tan diferentes en la imagen Cul puede ser el nivel
de suavizado usado por el sistema visual?
Ningn nivel de suavizado por s slo es adecuado, puesto que en cada uno perdemos
informacin de algn tipo. (Filtrar imagen supone perder informacin).
Si hacemos la imagen promedio, esta es notablemente igual a la imagen original, en
cuanto a la informacin que contenida en la imagen, el sistema visual ha de utilizar

122

varios niveles porque el sistema le interesa usar los detalles pequeos (filtros
estrechos) y grandes contrastes (filtros anchos) y un filtro intermedio.
- La funcin de pesos, ser la mezcla de la gausiana con otra funcin denominada filtro
de Gabor, es una mezcla de una gaussiana bidimensional con una funcin cosenoidal.

Efecto de diferentes suavizados

Qu tamao tiene que tener el entorno de suavizado? Imagen filtrada por cuatro filtros
gaussianos de diferente anchura, cada uno difiere del siguiente en un factor de 2 (los
filtros aparecen asociados a la imagen). El filtro ancho destaca los grandes contrastes de
intensidad de la imagen, mientras encubre los detalles, lo contrario sucede con un filtro
estrecho. Arriba a la derecha, la imagen promedio de las 4 filtradas es notablemente
similar a la original: el anlisis preserva la informacin
En el centro de la funcin de pesos tenemos el peso mayor. Cuadrito (funcin de pesos).
Funcin de pesos ancha: Parte de la imagen no se
modifica y depende de lo ancho que sea el filtro.

Apreciamos el suavizado de la
imagen (reducir las diferencias en
las intensidades luminosas). El
efecto fundamental consiste en
eliminar los detalles de la imagen;
reduce la resolucin de la imagen.
Los grandes cambios de intensidad
se magnifican y se pierden los
detalles pequeos.

Cuarta
parte
Aparecen los
(penltimo).

del
original:
detalles finos

Filtro muy estrecho: Los detalles finos se magnifican. La imagen


tiene un gris bastante homogneo. Deshace los cambios grandes de
intensidad luminosa.

Los filtros anchos resaltan los grandes contrastes y los finos resaltan los detalles y
homogenizan la imagen.
Cul es el grado de suavizacin apropiado?

En las imgenes naturales, donde puede haber escalas muy diferentes de


cambios de intensidad luminosa: Un sistema adaptativo trabaja con

123

grados de suavizado o filtrado muy diferentes. Tambin es importante


que el sistema sea capaz de integrar la informacin procedente de estos
diferentes filtros.
Marr y Hildreth: La suavizacin de la imagen a diferentes escalas se
produce empleando una gausiana (o un filtro de Gabor) de diferente
anchura (desviacin tpica).

Filtrar la imagen significa perder informacin de la imagen. La medida de los cuatro


imgenes anteriores es notablemente igual que la original.
- Deberas responder que para tener una mejor imagen debe utilizar
varios niveles de suavizados.
- Para los detalles (estrechos).
- Para los grandes cambios (anchos).
- Por los menos tres tipos de filtros diferentes. Tambin un filtro
intermedio.
De esa manera el sistema tendr toda la informacin necesaria.
La funcin de pesos podra ser una solamente una gausiana sino de esta con otra.
Filtro de Gabor: Es una mezcal de una gausiana y una funcin cosenoidal. En el centro
del filtro hay un peso grande. La funcin de Gabor parece que es la funcin que las
cluas simples de V1 implementan. La gausiana y la funcin de Gabor nos llevaran a
una imagen muy semejante.

Cmo se detectan los bordes de la imagen?

Apuntes Gema:
Primitivas preceptale (segmentos de borde, barras, terminaciones o manchas). Antes
de obtenerlas hay que determinar en qu zonas de la imagen retiniana hay bordes (
cambios de intensidad luminosa significativos).

124

- Funcin de intensidad en el espacio: Indica como cambia la intensidad luminosa


cuando me desplazo a lo largo del eje x e y (relaciona la intensidad con la
posicin de un punto de la imagen en el espacio).
En la imagen: Matriz que contiene las intensidades.
Derivada: (aplicada a funciones continuas) pero la funcin de intensidad en el espacio
es discreta.
- Hay que aplicar el anlogo de la derivada en funciones concretas :
es la resta ( clculo de la diferencia en las funciones espaciales.
- La funcin alcanza un mximo justo donde cambia la intensidad
luminosa: indica el borde.

Primera derivada.
Valor= 4

Valor: 0

Valor: 0

Problema: Hay que buscar a lo largo de toda la imagen, cuales son los
mximos. El sistema sera muy lento. (Problema d tiempo de cmputo).
Qu es un mximo?
Mximos locales:
Mximos globales: Se desconoce cual utilizar.
Segunda derivada: Diferencia de la diferencia de la derivada primera.
-

Si hay un borde, la derivada segunda toma un valor 0 entre el pico


+ y el -.
Clculo de la derivada segunda, y buscamos en qu lugares hay un
peso por 0.

Utilizando los paso por 0, identificamos los bordes del objeto.

125

La deteccin de los cambios de intensidad en cada nivel de suavizado se


realiza mediante diferenciacin: el algoritmo de Marr y Hildreth usa la
derivada segunda de la funcin que relaciona espacio e intensidad. Esta
operacin se realiza de forma simultnea con la suavizacin, mediante el
operador Laplaciano de la Gausiana: 2G = (2I/x2 + 2I/y2)G,
La derivada primera proporciona la tasa de cambio del gradiente de
intensidad; la segunda adopta un valor cero en el punto de mxima
pendiente del gradiente, es decir justo en un borde de la imagen.

Funcin de intensidad en el espacio: Una funcin que me dice el cambio que sufre la
intensidad en el eje horizontal y vertical (posicin de la imagen en el espacio).
Normalmente lo llamamos imgenes: es la funcin de intensidad en el espacio.
Si la funcin de intensidad en el espacio es la imagen Es continua o discreta? Es
discreta, as que la derivada no se aplica en ella, sino el anlogo de la discreta, la recta
(diferencia entre dos posiciones espaciales).
Imagen: Suavizada: Calcule la diferencia entre las intensidades (dos puntos adyacentes
en toda la imagen). Coger un punto y restarle el anterior.
La funcin siempre alcanza un mximo justo donde cambia la intensidad luminosa
(borde).

126

Primera
diferencia

1
1
1
1
1
1

SEGUNDA
DERIVADA

diferencia de
una diferencia
En un solo paso:

1 -2 1

1
1
1
1
1
1

... 0
0
0
0
0
0

0
0
0
0
0
0

5
5
5
5
5
5

5
5
5
5
5
5

5
5
5
5
5
5

-1 +1

PRIMERA
DERIVADA

Segunda
diferencia:

1
1
1
1
1
1

4
4
4
4
4
4

0
0
0
0
0
0

0
0
0
0
0
0

-4
-4
-4
-4
-4
-4

0
0
0
0
0
0

-1 +1
0
0
0
0
0
0

4
4
4
4
4
4

La derivada primera, hay que buscar a lo largo de toda la imagen cuales son los
mximos y hay que realizar mucho computo y el proceso sera muy lento y nuestra
percepcin no sera inminente y tiene otro problema Qu es un mximo? En imgenes
normales pueden ser mximos globales y locales.
Segunda derivada: Es la diferencia segunda, la diferencia de la diferencia. Nos dice que
justamente encontramos un pico positivo antes del borde y un punto negativo despus
del borde. Si hay un borde entonces la derivada toma un valor 0 antes del borde y
despus del borde. Se buscan en que lugares pasa el fundn por 0 donde est el pico
positivo y el punto negativo.

Cmo se combina la informacin procedente de diferentes filtros?

Apuntes Gema:
El sistema ha de integrar las tres representaciones correspondientes a cada uno de los
niveles de analizado:
Cualquiera que sea el filtro, el paso por 0 representa un borde.

127

Tenemos que decidir si este es un borde real (pertenece a un objeto) o es un borde de


otros factores (Ej.: sombras, que se proyectan al objeto).
Supuesto de coincidencia espacial: Si un borde es rea, tiene que esta presente por lo
menos en dos niveles de suavizado presentes ( uno de ancho y otro ms estrecho) si
tenemos un paso por 0 en un borde ancho pero no en uno estrecho, este borde se
debe, a una difraccin ( no real bordes ruido-).
-

Debemos considerar que en la derivada primera, el mximo alazara


un mnimo determinado.

1) Los pasos de cero representan cambios de intensidad: bordes


potenciales.
2) Supuesto de coincidencia espacial: Los cambios de intensidad
significativos darn lugar a pasos de cero en al menos dos filtros de
distinta anchura.
2.1.) Un paso de cero en un filtro estrecho que no se produzca
tambin con un filtro ancho es posible que represente ruido.
2.2.) Un paso de cero en un filtro ancho que no se produzca en
uno estrecho ser significativo, pero se deber a la difraccin, y
no tendr importancia en una escena natural
2.3) Slo los pasos de cero cuyo pico de la primera derivada est
por encima de un umbral son significativos.

Cual es el resultado de la combinacin de salidas de distintos filtros? El esbozo


primario:

Segmentos de borde all donde se emparejen los segmentos de paso de


cero de los filtros de similar anchura.
Manchas (blobs): bucles cerrados de
los segmentos de borde.
Barras son segmentos de borde de un
filtro ancho que encierran otros de un
filtro ms estrecho.
Terminaciones: extremos de las
barras.

Apuntes Gema:

128

Segmentos de Borde: Son trozos de borde: coincidencia espacial: En ambas imgenes:


En esa regin de la imagen, hay un segmento de borde: segmentos de paso cero
presentes en ambos filtros (estrecho y ancho): tiene que coincidir la orientacin.
Machas (blobs): Bucles cerrados de segmento de borde. Recorremos los filtros en
busca de segmentos de paso cero, se cierran completamente, a los cales se le
denominan, manchas.
Barras: Segmentos de borde de un filtro ancho que encierran segmentos de borde en un
filtro estrecho.
- Construimos tres mapas:
c) Segmentos de borde
d) Manchas
e) barras
Mapa 4; es un mapa de terminaciones
-

Es esbozo primario, es la construccin de 4 mapas donde quedan


localizadas las primitivas y orientacin de las mismas en al imagen.
Estas hay que agruparlas hasta construir la forma del objeto.

Teoras computacionales( continuacin)

Anlisis de texturas:
Textura: Propiedad de la imagen definible estadsticamente. Una regin
texturada uniformemente puede definirse como predominantemente
vertical, predominantemente pequea en escala, ondulada,
granulada, etc. (Landy y Graham, 2004).
El sistema visual utiliza las propiedades estadsticas de la estructura
espacial para segregar regiones en la imagen, para lo cual computa tanto
la orientacin como el tamao y la escala espacial. (Battelli et al (1997).
AB no tiene problemas con objetos definidos por el contorno, pero s
cuando la forma viene definida por la textura.)
Estructura a partir del sombreado. La forma puede recuperarse a partir del
sombreado. Pentland (1989) ha demostrado que un conjunto de filtros de Gabor
puede ser suficiente para construir una representacin tridimensional a partir de
la imagen.

129

Apuntes Gema: Dos teoras


a) El sistema visual tiene analizadores de textura de las superficies
b) El sistema visual tiene analizadores de sombreado.
A) Anlisis de textura.
La textura hace referencia a la frecuencia con la cual, ciertas caractersticas de la
imagen, como el sombreado.
El sistema visual utiliza informacin sobre la orientacin de los segmentos de borde
para construir la forma del objeto.
Paciente AB: problemas a la hora de percibir la forma, que en este caso, depende
de la superficie (pero no de los contornos).
Textura: importante en la percepcin de la forma: este papel se debe a la presencia
de analizadores de textura.

B) Anlisis de sombreado:
El sistema visual utiliza informacin sobre el gradiente de intensidad luminosa de la
imagen para la construccin 3D: Tiene analizadores sobre el gradiente de intensidad
luminosa.
Utiliza las mismas neuronas que tienen un circuito similar al del sistema de filtros de
Gabor para la construccin de la forma del objeto.
1)
2)
3)
4)
5)
6)
7)

Hasta V1, como


Anlisis centro-periferia.
analizadores Fourier
Anlisis en trmino de frecuencia espacial
De bordes.
Analizadores de textura y sombreado
Analizadores de curvatura
Analizadores de movimiento ( detectores de Reichard)
Estereopsis.

Cmo se agregan las primitivas para construir la forma?


Problema de la organizacin perceptual: Determinar los mecanismos que usa el
sistema visual para agrupar las primitivas en unidades ms complejas.
Psiclogos de la Gestalt: Aportacin importante desde el punto de vista descriptivo.

130

. Para construir la forma del objeto, hay que segregar este del resto de la imagen
(segregacin figura-fondo); para que esto sea posible, los lmites / borde han de ser
asignados a una regin u otra de la escena (se trata de un problema de asignacin de
bordes).
FIGURAS AMBIGUAS:
(Para que algo pueda construirse como figura, los bordes han de asignarse a cada
regin u otra).
Por qu se interpretan como tres crculos? Asignacin de segmento de borde a ambas
imgenes? Asignamos el lmite a una regin u otra, para que la escena se pueda
percibir de una manera u otra.

Dos principios / ideas fundamentales:


Pregnacia: Si tenemos elementos semejantes en la escena (en forma,
tamao,). Estos elementos semejantes se agrupan entre ellos, puesto que es lo ms
sencillo de realizar (Vs. No agrupacin). Considerar cada elemento como un elemento
como un elemento aislado).
: Basada en la semejanza de cualquier naturaleza.
Minimizacin: De algo que pueda reducir la energa que tiene que invertir para
resolver el problema. El sistema agrupa los elementos presentes, minimizando la
energa necesaria para agruparlos.

131

Teoras computacionales: sntesis


Analizadores
de bordes

Analizadores
de curvatura

Analizadores
de textura

Analizadores
de
movimiento

Estere
opsis

Analizadores locales de
frecuencia espacial
Analizadores centro-periferia

ORGANIZACIN PERCEPTUAL
Cmo se produce la agregacin de las primitivas preceptales en trozos de
mayor tamao? Qu elementos de la escena van juntos, constituyendo un
objeto?
Sin duda las aportaciones ms importantes y pioneras en este campo fueron
realizadas por los Psiclogos de la Gestalt.
Consideremos primero su aportacin y despus los ltimos avances.
FIGURAS AMBIGUAS
Cules son los lmites de los objetos?

132

ESCHER (1989).
Circle Limit IV

JASTROW (1900)
Pato o conejo?

PRINCIPIOS DE ORGANIZACIN
La idea bsica: Pregnancia. Los elementos similares (en forma, color, tamao,
etc.) se agrupan juntos porque sta es la organizacin ms simple de todas las
posibles alternativas, en especial, respecto de percibirlos como elementos
independientes no organizados. Principios:
Proximidad
Semejanza
Destino Comn
Buena Continuacin
Clausura
Tamao relativo, orientacin y simetra.
Principio de minimizacin.
Usado para resolver problemas visuales indeterminados (ms
organizaciones posibles que datos)
Cuando varias organizaciones son posibles con los datos actuales, el
sistema visual selecciona la que minimiza alguna funcin concreta (por
ejemplo, costes o energa
PROXIMIDAD

Los elementos cercanos se agrupan.

133

SEMEJANZA

Los elementos similares se agrupan

DESTINO COMN
Las cosas que parecen moverse juntas, en la misma direccin y con la misma velocidad,
parecen agruparse juntas.

BUENA CONTINUACIN
Los elementos se agrupan para formar rectas o curvas suaves

CLAUSURA

134

Ambos patrones tienden a verse como un hexgono, a pesar de que slo uno tiene sus
propiedades: de todas las organizaciones geomtricas posibles se selecciona siempre la
que proporciona una figura cerrada: un hexgono, en lugar de lneas que se entrecruzan

TAMAO RELATIVO, ENVOLVIMIENTO, ORIENTACIN

Tamao regin negra < regin blanca: (el principio del tamao relativo). Se constituyen
como figuras, las relaciones de menor tamao, y como fondo, las de mayor tamao. Es
la interpretacin ms frecuente.

Figura segura: regin negra: Las regiones envueltas


tienden a considerarse como figuras y las que
envuelven, como fondo.

SIMETRIA: Las regiones simtricas tienden a preferirse como figuras con preferencias
de las regiones asimtricas.

Las reas simtricas tienden a ser percibidas como


figuras contra el fondo asimtrico.

135

PREGNANCIA
De todas las organizaciones geomtricas posibles, la que ocurre es siempre la que posee
la forma mejor, la ms estable y la ms simple.
Los gestaltistas no niegan la familiaridad (el principio fundamental de organizacin de
Helmholtz), pero rechazan una explicacin en slo esos trminos.
Aplicamos el principio de pregnacia: Ocurre porque es lo ms simple.
Otros: El problema es la familiaridad de los cuadrados / tringulos.
El principio de pregnacia se pude relacionar con el de familaridad,
elementos semejantes han sido percibidos antes , con mayor
frecuencia.

PRINCIPIOS APORTADOS RECIENTEMENTE

Regin comn o inclusin: se agrupan los elementos de lo que se percibe como


una misma regin. Parecido al principio de envolvimiento.

Cohesin: toda regin uniforme y conectada se percibe como una sola unidad.

Por qu funcionan las leyes?

Los principios de agrupamiento captan el hecho de que las regiones de la imagen


que covaran de cierta manera tienden a emerger de superficies comunes,
objetos, regiones y colecciones de objetos en el mundo.
Marr (1982). Las leyes funcionan porque constituyen un conjunto de supuestos
razonables sobre los objetos fsicos y biolgicos:
Las diferentes regiones de un objeto reflejarn la luz de manera similar.
La materia es cohesiva, luego regiones adyacentes es probable que
formen parte del mismo objeto y se muevan simultneamente en la
misma direccin.
Muchos objetos naturales son simtricos.
Los objetos son pequeos en relacin con el fondo

136

La asignacin de los lmites: mnimos y mximos

Singh y Hoffman (1998). Principio de generalidad: el sistema visual rechaza


interpretaciones inestables del estmulo. Una
interpretacin inestable es aquella en la que
un cambio mnimo, p.e. de posicin, lleva a
cambios cualitativos.

Hoffman y Richards (1984). La regla del mnimo:


Los mnimos de curvatura (concavidades) son lmites en el contorno de las siluetas.
Cuando dos cuerpos convexos intersecan, ocurren concavidades en los puntos de
interseccin. La localizacin de concavidades puede ser una seal de los lmites entre
componentes

Sigh y Hoffman: Principio de Generalidad. Es un principio sencillo.


Figuras geomtricas: Nos encontraramos que le observador dira que inicialmente la
figura de la derecha es bidimensional y la de la izquierda es tridimensional. Si le
dejamos ms tiempo cambia de opinin. A penas que el observador cambia de posicin
o el objeto cambia se aproxima al de la izquierda. Si interpretamos la figura
tridimensionalmente un leve cambio del punto de fijacin cambiara su opinin
radicalmente, en la izquierda no.

El principio de Generalidad. El sistema visual prefiere interpretaciones estables que si


pretende interpretaciones inestables.
La figura derecha es inestables si se interpreta tridimensional (cubo) si cambia
levemente el punto de vista cambia la interpretacin radicalmente. Se va a interpretar
preferentemente como una figura bidimensional porque es estable, y la de la izquierda
tridimensional porque es estable tridimensionalmente.
Asignacin de lmites: regla del mnimo:

137

Si las figuras intersecan en el punto donde intersecan se produce una concavidad y da


igual que las figuras sean planas como tridimensionales (concavidad: mnimo de
curvatura).
La regla de mnimo: Si eso ocurre cuando dos cuerpos intersecan eso significa que el
sistema visual decide segregar en dos regiones porque hay un mnimo de curvatura.
Se basa en una regla: Siempre que intersecan 2 partes de un objeto: mnimo de
curvatura que el cerebro utiliza para segmentar el espacio.

Barenholtz et al (2003)

Las concavidades tienen ventaja perceptiva sobre las convexidades:


-Se detectan mejor
- Determinan ms el nmero de regiones percibidas
El sistema trabaja mejor con concavidades que con convexidades.
Partiendo de una concavidad la eliminan y partiendo de una convexidad la elimina.
Lo que miden los aciertos que cometen los sujetos al decir si se ha eliminado /
introducido una concavidad o convexidad.
Barra gris clara: concavidades
Barra gris oscura: convexidades
La capacidad que tienen los sujetos de discriminar la manipulacin de la concavidad el
ndice des hasta 6 veces mayos cuando se hace referencia a la convexidad hay una
diferencia enorme.

138

Dividir el polgono en regiones: los resultados indican que el nmero de pares que el
sujeto divide esa figura es una funcin del nmero de concavidades (mnimos de
curvatura).

Driver y Baylis (1995): Los lmites se asignan obligatoriamente a una parte del campo.
La asignacin de lmites a una regin u otra depende de la curvatura. Cuando la figura
es biestable (copa de Rubin, Cubo de Necker,), la asignacin se produce de arriba a
abajo. En los dems casos es automtica (de abajo a arriba).
Meng, M y Tong, F. (2004). J. of Vision.
(1) Mire al cubo pasivamente
(2) Intente percibir el cubo como visto desde arriba tanto tiempo como pueda.
(3) Intente percibir el cubo como visto desde abajo tanto tiempo como puesta.

Cuando la figura es ambigua


inestable entonces la atencin
es un determinante fundamental de la percepcin de la forma que va a tener el
observador.
Cubo de Necker. Puede ser percibido de varias formas.
Meng M y Tong. Experimento de sobre la atencin en la interpretacin de las figuras.
(Centrar la atencin en la cara posterior o anterior):
1.- Pasiva
2:- Intente percibir el cubo visto desde arriba tanto como pueda
3.- Intente percibir el cubo visto desde abajo tanto tiempo como pueda.

139

Tambin utiliza una cruz como punto de fijacin. Luego miden el tiempo que dicen que
lo estn viendo desde una perspectiva o desde otra.
Cuando abajo tiende a ver el cubo pretende desde abajo y viceversa.
Apuntes Gema :
Principio de mnimo:
Ej: En el punto donde intersecan las dos figuras, se produce una concavidad ( mnimo
de curvatura) independiente de que sea planas o en 3D.
El sistema visual utiliza los mnimos de curvatura para segmentar/ dividir el espacio
en secciones.
Experimento ( Barenholtz et. Al 2003).
- Utiliza la teora de deteccin de seales para demostrar que el
sistema visual trabaja mejor con concavidades que con
convexidades.
Forma bsica: Polgono irregular con mnimos y mximos de curvatura
.
- Introducimos una concavidad
- Introducimos una convexidad
Introducir y eliminar - Modificamos un lado
minimos y maximos

Partiendo de una concavidad, la eliminamos (= una


convexidad).

Mide los aciertos del sujeto en cuanto a que sea introducido o


eliminado.
Ruido (no se ha hecho).
Falsa alarma (el sujeto dice que se ha hecho, pero no se ha hecho).

INDICE D prima.

- La capacidad de discriminar cuando ha habido manipulacin de la concavidad.


ndice d es 6 veces mayor que el caso de convexidad, por lo que los cambios en
concavidad se detectan mejor.
- Pide al sujeto, que trace lneas dividendo la figura en partes
/regiones posibles.

140

El nmero de regiones en que el sujeto divide esta figura, es ms funcin del nmero de
concavidades de la misma, no de convexidades.
Todo esto ocurre con independencia de la atencin que presta el observador al objeto,
si la figura no es ambigua, pero en el caso de que esta s lo sea (figura inestable) , la
atencin es un determinante fundamental en la percepcin de la forma ( participa en la
segregacin del espacio si el input estmulo- es interpretable de varias formas
diferentes.
Ej: Cubo de Necker. (Puede ser percibido de varias formas).
Introducimos una concavidad

TEMA 6. RECONOCIMIENTO DE
OBJETOS Y CARAS

Qu es el reconocimiento?
Mecanismos de reconocimiento
Comparacin de plantillas

141

Anlisis de caractersticas: Pandemonium


Teora de Marr y Nishihara
Biederman: Reconocimiento por componentes
Hummel: Modelo dual
Reconocimiento de caras

Bibliografa

Goldstein (op. cit.; cap. 5)


Matlin y Foley. (op.cit. cap 5)
Fuentes, L.J. (1992). Reconocimiento de patrones. En Fernndez-Trespalacios y
Tudela (Eds.). Atencin y Percepcin. Madrid: Alhambra.
Hummel (2000). Where view-based theories break down: The role of structure
in shape perception and object recognition. En E. Dietrich and A. Markman
(Eds.). Cognitive Dynamics: Conceptual Change in Humans and Machines (pp.
157 - 185). Hillsdale, NJ: Erlbaum.
Tarr, M. J., y Vuong, Q. C. (2002). Visual Object Recognition. In H. Pashler
(Series Ed.) and S. Yantis (Ed.), Stevens' Handbook of Experimental
Psychology: Vol. 1. Sensation and Perception (3rd ed., Vol. 1, pp.287-314).
New York, NY: John Wiley & Sons, Inc

Qu es el reconocimiento?

El R es una actividad perceptual fundamental para la adaptacin. Los objetos,


las palabras, las caras,..., son identificados fcilmente por adultos, pero tambin
por nios. Los animales tambin muestran gran capacidad de R.
No se ha conseguido un sistema artificial que sea capaz de reconocer con esa
facilidad. Por qu?
El enorme avance en el conocimiento de las etapas tempranas del procesamiento
visual no ha sido suficiente. Quiz el problema sea ya de tipo conceptual.

El reconocimiento es una actividad perceptual aparentemente sencilla. Los seres


biolgicos muestran alta capacidad de reconocer objetos, es capacidad adaptativa por lo
tanto, lo que se tiene. No hay mquinas que sean capaces de reconocer.
Apuntes Gema:
El reconocimiento es la etapa final del procesamiento perceptual:
Es difcil de explicar, puesto que la mayora de los intentos de construir mquinas que
sean capaces de reconocer, implica la representacin de la forma a partir de la cual ,
se llega a la representacin del objeto.
Gran variedad de claves ms (no slo la forma, por ejemplo, textura, de superficie,
localizacin relativa de otros objetos, movimiento relativo)I

142

Qu es reconocer /identificar el objeto?


- Esto es, clasificarlo / categorizarlo de alguna forma que est definida
por los objetos que uno tiene o el contexto en que est (no es
exclusivamente denominar el objeto).
- Con la clasificacin, el objeto se le atribuyen cualidades que no son
caractersticas de la forma.
Por qu es complicado explicar que es reconocer?
- Reconocimiento: Igualacin entre la forma del objeto y lo que hay
en nuestra memoria.
- Problema: explosin combinatoria: solucin: en memoria slo hay
almacenada una forma por objeto.
El reconocimiento se produce cuando hay semejanza entre la forma visual y las
almacenadas en memoria.
-

Problema de explosin combinatoria: La mayora de los modelos han


hablado de que tenemos una memoria sobre cada objeto y por lo
tanto, slo una memoria almacenada.

Varias razones (Ullman, 1996):

Hay varias vas visuales que llevan al R


Forma visual: una cara familiar
Color y/o textura: un rbol por el patrn de ramas y color.
una jirafa, una cebra,..
Localizacin relativa a otros objetos: un picaporte de puerta.
Movimiento relativo: una mancha volando - una mosca.
Pero tambin no visuales:
Conocimiento previo, expectativas: un objeto blanco sobre un
escritorio - un telfono.

Estudiaremos slo reconocimiento por la forma.

Forma visual: primero constituye una representacin de la forma a


partir de ella intenta reconocer el objeto uno de las claves para
reconocer y lo segundo del objeto es su forma. Peor no la nica,
aunque si la ms importe.
Textura de la superficie: ( orientacin de la rayas en el dibujo)
Color del objeto.
Posicin del objeto en el ambiente determinado
Movimiento

Hay una variedad de claves visuales muy graves que las personas utilizamos para
reconocer los objetos.

143

Reconocimiento previo o expectativas de lo que nos vamos a encontrar en ciertos


lugares. Pero tambin no visuales.

Reconocer es clasificar un objeto en el nivel apropiado. Lo que es apropiado


depende de las circunstancias y del contexto.
La etapa final del R no es la nominacin del objeto, sino recuperar informacin
sobre l que no est presente en la imagen misma.
Por qu el reconocimiento es difcil?
RECONOCER => determinar si una imagen corresponde con algn
objeto que hayamos visto en el pasado
* todo reside en almacenar en memoria suficiente nmero de diferentes puntos
de vista del objeto?
* Qu tamao tendra que tener ese almacn?
* Cul ser el grado de similitud suficiente para reconocer el objeto?

Lo que es apropiado depende de las circunstancias y del contexto.


Est definida por los objetivos: Lo que se nos pide es si lo conocemos o no. Depende lo
que tengamos como objetivo asi podemos reconocer un objeto en una determinada
clasificacin: mueble/mesa.
Por qu el reconocimiento es difcil?
La teora intuitiva es cierta. El reconocimiento se produce porque hay una igualacin del
objeto visual y lo que tenemos almacenado en la memoria.
Cunto soy capaz de reconocer? Desde cuantos puntos de vista? Mueble, mesa
Numero de objetos por nmero de formas: explosin combinatoria. (Capacidad del
almacn que se requiere para eso es enorme.
Otro problema. Veo que compara el objeto con el almacn Cunto tiempo tardo en
recorrer el almacn? En cuanto tiempo decido que ese el objeto?
En memoria slo hay almacenado una forma por objeto. Esa es la esencia de todos los
modelos de reconocimiento hasta hace 10 aos.

Forma

Memoria

?
?
?

144

Gran parte de la investigacin se ha realizado en el contexto de reconocimiento


de caracteres, lo que ha producido ciertos modelos de reconocimiento que son
tiles sobre todo como introduccin al problema.

Comparacin de plantillas

Apuntes Gema:
Data de los aos 50: el reconocimiento de objetos se reproduce porque la forma visual
del objeto, activa la representacin de ese objeto almacenada en memoria: el
reconocimiento se produce porque hay detectores de objetos (tantos, como objetos
somos capaces de reconocer conjunto de neuronas que se activan cuando la forma
del objeto las activa, puesto que su representacin est presente).
Tiene como primera aplicacin, la deteccin de cdigos en cheques bancarios.
Es un modelo deficitario: Por qu?
Ej: A: Tendramos un detector para cada una de las modalidades de esta letra, en
cada uno de los tamaos, orientaciones Problema de la explosin combinatoria.
Este modelo, es descartable a la hora de categorizar objetos, letras.
No tanto si lo retomamos de la siguiente manera podemos seguir manteniendo esta
idea, si antes de que acte el detector, introducimos algunas operaciones sobre la
figura del objeto: Puede ser cualquier conjunto de operaciones que tengan el sentido
final de ajustar la forma de entrada a las caractersticas de la plantilla.
Ej: Respecto al tamao: operacin de cambio de tamao para que se corresponda con
el de la plantilla.
El sistema es capaz de corregir la posicin espacial de la entrada con el de la plantilla:
ajustar la orientacin, con las letras de la plantilla.
El sistema, realiza procesos de normalizacin / estandarizacin de la forma de entrada:
cambiar la orientacin y el tamao, para ajustar al modelo de la plantilla, si se activa
el detector, corresponde con la plantilla.
Ej: Siendo el patrn de entrada ambiguo, la teora de plantillas, dira que tendra que
activarse el mismo detector.

El reconocimiento se produce porque la imagen del objeto acaba activando la


representacin central de ste: Hay detectores de objetos.

145

Sin embargo, cualquier cambio en la imagen debido a su orientacin, tamao,


contexto, etc. dificultara o impedira su R Tendramos que tener una
representacin para cada una de las variaciones posibles?

AAA:

Un modelo de este tipo postulara que tenemos detectores diferentes


detectores para distintas A (tamao, orientacin): No eliminamos el problema de la
explosin combinatoria. : Modelo descartable.
-

Es posible que tengamos una plantilla para cada variacin, pero


podran ser demasiadas las necesarias.
Ms fcil, suponer que en una fase previa se realizan procesos de
estandarizacin de la imagen, por ejemplo, en cuanto a orientacin y
tamao ( Budensen et als, 1981).

Si el tamao es demasiado grande respecto de la platilla se reduce y si es muy grande se


incremente.
Si la letra se me presenta girada asumir que cambia de orientacin para ajustarla a la de
las plantillas.
Procesos de normalizacin o estandarizacin de la forma de entrada.
- Orientacin
- Tamao
Una vez que se han hecho esas operaciones si se activa la plantilla de la ( A) se
identifica como una A.
Este modelo es ms rico en cuanto a capacidad de explicativa.

eje

Es posible que tengamos una plantilla para cada variacin, pero podran ser
demasiadas las necesarias.
Ms fcil: suponer que en una fase previa se realizan procesos de
estandarizacin de la imagen, por ejemplo, en cuanto a orientacin y tamao
(Bundesen et als., 1981).

orientacin

tamao

plantilla

146

El mecanismo de igualacin de plantillas funcionara siempre que tras la


normalizacin el patrn no sea ambiguo. Pero esto no siempre es posible:

UESO
Siendo el patrn de entrada ambiguo (aislado) la teora de platilla dira que se tendra
que activar el mismo detector. Lo que no consigue aplicar es el contexto es un
componente importante para detectar el estmulo. Nos permite solucionar la
ambigedad.

Anlisis de Caractersticas

Apuntes Gema

147

Se puede considerar como un desarrollo del modelo procedente, es


especfico para el reconocimiento de caracteres, (letras y nmeros).
Qu es lo que diferencia a unas letras de otras?

El modelo que tiene que construir, sita en la va visual, detectores de rasgo de los
objetos.

Qu diferencia a R de P? Y a O de Q? Presencia de un rasgo oblicuo en la R


que no esta presente en la P. (unas tienen caractersticas que otras no tienen).
Solamente un rasgo, una caracterstica. La forma precisa de los elementos no es crucial:

El R requiere slo un conjunto de detectores encargados de captar la presencia


de caractersticas distintivas en las imgenes. En general son necesarios
detectores de lneas, de ngulos, de curvas, ..

Este modelo se considera un desarrollo del modelo precedente y adems es especfico


como el anterior para el reconocimiento de caracteres.
El primer modelo de rasgos es el Modelo de Pandemonium de Selfridge . Los
demonios es la metfora de concepto de detector. La esencia es que es un modelo de
detectores jerrquico y secuencial.
- Demonios de lneas: sintonizados a la presencia de lneas
componentes de la imagen (verticales/ horizontales/ oblicuas/ curvas).
- Demonios de ngulos: Sintonizados a la presencia de determinados
ngulos en el estimulo.
- Es un modelo serial: Los detectores es etapa es enviada a la siguiente
etapa ( depende de la activacin de la cantidad de input de la etapa
precedente).
- Demonios de patrones: ( letras)
- Demonio de decisiones: lo que hace es comparar la activacin de los
detectores de objetos y selecciona como respuesta aquel demonio que
est activado.
La E y la R tambin estarn activas pero no tanto como la B por sus caractersticas
comunes.
Metemos una superesturcturura que decide y recopila toda la informacin.

El modelo ms influyente fue el Pandemonium de Selfridge (1959). Neisser


(1967) y Lindsay y Norman (1972, 1977) lo popularizaron.

148

Los detectores en
las diferentes
etapas se activan y segn la cantidad de activacin , se activaran las etapas precedentes:
es un modelo serial:
Ej.: detector ms activo: B: E: R: (mejor respuesta en B)
Postulamos la presencia en la va visual, de detectores de objetos, solo cambiamos el
modo en que estos se activan. (Solucionamos el problema del tamao y el de la variedad
en los tipos)
Problema:
Va visual: Detectores de rasgos: de frecuencia espacial la interpretacin no es nica.
Si la clula simple, dispara a su tasa mxima , es porque se han presentado en el campo
visual las caractersticas a las que es sensible, sin embargo , si esta no dispara a su tasa
mxima , desconocemos la causa, puesto que cuando esto no ocurre, es debido a que la
caracterstica presentada , no es la adecuada.
- Si la tasa de disparo, est por debajo la salida de la clula simple, la
desconocemos.
Para se pueda identificar el estmulo, debemos tener en cuenta tambin, las relaciones
estructurales entre las caractersticas que lo componen (estas relaciones , no se
incorporan en el modulo).

149

.- Las propiedades de las clulas del cortex visual Son un apoyo a la existencia de
estos mecanismos?
Sin embargo:
Es posible interpretar de otro modo la actividad de la clulas de la va
visual (v.gr. Marr, 1982, Malik y Perona, 1990, etc.)
Si lo fueran su respuesta sera ambigua: una clula simple vara su
respuesta a un borde segn su contraste y su posicin. Una tasa baja:
borde de bajo contraste en posicin adecuada
borde de contraste alto en orientacin inadecuada.
Cules son las relaciones estructurales entre las caractersticas?

Modelo de Marr y Nishihara

Apuntes Gema:
Muy influyente en psicologa contempornea e ingeniera.
Modelo de Marr: Representacin 2 : (problema est en coordenadas subjetivas: el
observador tiene representada la orientacin y distancia de cada uno de los puntos del
objeto respecto de l).
Consecuencia: Si el observador o el objeto se mueve, cambia el totalmente la
represtacin.
Importante, porque si se asume que no se puede explicar el reconocimiento desde una
representacin 2 D, hay que pasar una representacin 3D, para lo cual, hay que
localizar los ejes del objeto
Cmo encuentro los ejes en los cuales centrarme para determinar las coordenadas de
la superficie del objeto?
Se asume que lo que el sujeto tiene almacenado en su memoria, es un catlogo de
objetos, constituidos de forma jerrquica, que contiene a su vez, submodelos:
Objeto visual: catlogo de objetos .
Cmo construimos un modelo de la figura humana?
Utilizamos un elemento constructor el cilindro:
Definimos un eje:
Definimos una seccin tridimiensional del cilindro:
Desplazamos el crculo a lo largo del eje vertical. El elemento constructor, es un cono
generalizado / cilindro.
Ventaja: Para construirlo, slo es necesario conocer el eje a lo largo del cual movemos
la seccin transversal.

150

Especificamos parte de la figura humana, utilizando el mismo constructor.


Cono generalizado que representa el tronco a partir del cual se representa el resto de
conos generalizados.
- Suficiente para distinguir la figura humana, de cualquier otro tipo de
figura : reconocimiento.
- En ocasiones , esto no es suficiente , necesidad de construccin de
submodelos. Ej: Construccin submodelo de brazo.

Cmo se llega de la imagen al modelo del objeto?

Modelo con coordenadas objetivas vs. Imagen: coordenadas


subjetivas.
Figuras chinescas: No
- Textura
- Color
- Elementos de contorno dentro del
Objeto: inf sobre la silueta

El sistema visual , utiliza los contornos del objeto para construir las representacin 3D
del mismo . Para ello, adopta 3 supuestos fundamentales:
a) Cualquier punto de la silueta del objeto, es generado por algn punto de la
superficie del objeto. Conjunto de puntos que dan lugar a la silueta: generador
de contorno del objeto.
b) Si dos puntos estn cercanos en la silueta, tambin lo estn en el generador de
contornos del objeto.
c) Todos los puntos de los generados de contornos, se encuentran en el mismo
plano, excepto cuando existe curvatura en el mismo.
El sistema visual localiza los puntos donde hay mnimos de curvatura: utilizando
para dividir el objeto en partes.
- Se identifica el eje correspondiente al cono generalizado.
- Movemos el crculo a lo largo del eje para crear el cilindro.
- A esto, se le aade informacin sobre textura, movimiento,
estereopsis, para la representacin completa del objeto.

Cmo encontrar las coordenadas del objeto, en situaciones naturales, para


cualquier objeto?
Una solucin posible fue la aportada por Marr y Nishihara (1978; Marr, 1982).
La representacin 21/2-D es un conjunto de valores correspondientes a cada
parte de la superficie del objeto que representan su orientacin y profundidad
respecto del observador. Si el observador (o el objeto) se mueve, la

151

representacin cambia. Por tanto, esta representacin no es la adecuada para el


R.
Utilizar una representacin 3-D implica localizar los ejes del objeto.

Los distintos parches que el observador tiene representado es la orientacin de los


distintos puntos del espectro de l y a qu distancia estn los distintos puntos del
espectro de l. Esa es la esencia de la representacin 2 D.
Marr no puede explicar el reconocimiento si la representacin del objeto cambia de un
momento a otro. Si no se asume lo que asume Marr. El modelo de reconocimiento es
totalmente distinto. Solucin. Desde la representacin 2 D hay que pasar a una
representacin 3- D (lo que implica buscar un sistema de coordenadas centrado en el
objeto).
Cmo encuentro los ejes del objeto en los cuales centrar para determinar las cualidades
del objeto?
El problema es que hay que localizar los ejes del objeto. El problema es como
localizarlos. Se asume que lo que el sujeto tiene almacenado en su memoria es un
catlogo de l modelo de forma jerrquica.
Tanto el objeto visual como el catlogo tienen el mismo modelo de representacin.
Cmo localizar los ejes del objeto?

Marr y Nishihara proponen que se considere una organizacin jerrquica de


modelos que representaran partes diferentes y significativas del objeto. Cada
modelo tendra su propio sistema de coordenadas. Consideremos la figura
humana:
A nivel global se podra considerar un eje centrado en el tronco. Este eje
permite especificar la posicin, la orientacin, etc., del resto de modelos:
brazos, etc.
Los modelos subordinados se especificaran ahora de forma semejante.
De esta forma se podra construir un catlogo de modelos con distintos niveles
de especificacin.

Un esquema posible empleando conos generalizados simples, conseguidos desplazando


una seccin transversal a lo largo de un eje longitudinal.
El cilindro tiene un eje bien definido, puede construirse de una forma muy simple,
desplazamos un crculo a lo largo de un eje.
Eso es un cono generalizado (elemento constructor) la ventaja de su uso, para
construirlo es necesario conocer el eje a lo largo del cual movemos la seccin
transversal.
Hay un cono generalizado que representa el tronco y a partir de ese podemos ubicar los
dems conos generalizados.
Es suficiente para distinguirlo de un chimpanc, es suficiente para que se produzca el
reconocimiento.
Podemos dividirlo en ms partes, (brazo-antebrazo-mano). El modelo almacenado en el
catlogo es un modelo jerrquico. Si empezamos por un modelo muy grueso y podemos
ir degradndolo.

152

Un esquema posible empleando conos generalizados simples,


conseguidos desplazando una seccin transversal a lo largo de un
eje longitudinal.

Organizacin jerrquica de modelos asociados a la figura


humana.

Cmo puede obtenerse la descripcin del modelo a partir de la imagen, antes


de acceder al catlogo?

Marr sugiere una solucin a partir de los contornos oclusivos del objeto (la
silueta), basndose en tres supuestos:
Cada punto de la silueta tiene un punto correspondiente en la superficie
del objeto (estos puntos constituyen el generador de contorno de la
silueta).
Los puntos cercanos en la imagen estn tambin cercanos en el
generador de contorno.
Todos los puntos de un generador de contorno se encuentran en el mismo
plano.

Objeto y generador

Silueta

Contorno

Marr a partir de figuras chinescas (sombras) (carece de color y textura) le


basta con el contorno exterior del objeto. El sistema visual utiliza bsicamente los

153

contornos del objeto para construir la representacin tridimensional para eso el sistema
visual adopta tres supuestos fundamentales:
-

Cualquier punto de la silueta del objeto es generado por algn punto


de la superficie del objeto ( lo que hay en la silueta procede de un
punto de la silueta) . El conjunto de puntos que eran iguales a la
silueta es lo que se conoce como generador de contorno de la silueta.
Si dos puntos estn cercanos en la silueta entonces tambin est n en
el generador de contorno.
Todos los puntos del generador de contorno se encuentran en el
mismo plano (Si la pongo de forma convexa la ano no estn en el
mismo plano). Se viola siempre que sea cncavo o convexo el objeto.

El ltimo supuesto puede plantear problemas de interpretacin.

Pero si la forma es un cono generalizado puede obtenerse a partir de contornos


oclusivos. Luego tambin los ejes, que estn centrados en el observador.
Si presenta una concavidad o convexidad el error de interpretacin puede aparecer
(muchos objetos tienen superficies que no son planas). Si salvamos eso a partir del
contorno es posible reconocer el contorno del objeto.
Borrico (usamos esa representacin para reconocer los objetos)
1) Localizar los puntos dnde hay mnimos de curvatura.
2) Segrega el contorno a partir de los mnimos de curvatura que ha localizado. SE
utiliza para dividir el objeto en partes.
3) Se generan los ejes correspondientes a las partes.
4) Mover el circulo a lo largo del eje para crear un cilindro.
A esto ahora se haba que aadir informacin: textura, movimiento, esteropsis, (integrar
el resto de informacin que el sujeto posee
sobre el objeto y tendramos una
representacin completa). Es la esencia del
modelo todo esto.
Marr asume que el reconocimiento tiene que
realizarse por una representacin objetiva del
objeto.

154

La transformacin de las coordenadas de los ejes a coordenadas espaciales se


realizar teniendo en cuenta la estereopsis, la textura, el sombreado, etc., pero
tambin puede ser necesario comparar el modelo derivado con los almacenados.
Esta comparacin podra facilitar los procesos de anlisis de la imagen.
A partir de estas ideas varios autores han desarrollado posteriormente teoras de
reconocimiento que tratan de refinar la idea de los conos generalizados y las
formas componentes. Quiz la ms influyente haya sido presentada por
Biederman a partir de (1987, 1991, 1992, 1993).

Biederman: Reconocimiento por componentes

El modelo recoge la idea del reconocimiento por componentes ms elementales.


Los elementos estn constituidos por un conjunto de formas bsicas: cilindros,
pirmides truncadas, cubos, etc. que Biederman llama geones.
Los geones estn definidos segn caractersticas no accidentales: colinealidadcurvatura, simetra, paralelismo y coterminacin.

Es el modelo ms importante de los estructurales.


Asume que las representaciones del objeto se producen a partir de conos generalizados.
No asume que la representacin sean objetiva del objeto, sino subjetiva, (lo que no
implica que la representacin no sea dependiente del punto de vista si cambia el
reconocimiento se siegue produciendo igual de bien-).
Geones: Son los elementos que utiliza para la representacin del modelo como para el
catlogo.
No cualquier figura geomtrica es un gen, slo las que estn construidas con
caractersticas no accidentales (infrecuentes).
Es extremadamente raro que las propiedades no accidentales sean consecuencia
de un punto de vista concreto. Si el punto de vista cambia, la propiedad, en
general, no cambia. Excepciones una curva como recta.

linealidad-curvatura

coterminacin-no coterminacin

paralelismo-no paralelismo

simetra - asimetra

Linealidad- curvatura: Es una caracterstica no accidental para


prcticamente es imposible confundirla, slo hay un punto de vista
que permite la confusin.

155

Coterminacin. No coterminacin.

Paralelismo- no paralelismo

Simetra- No simetra.

Podemos construir modelos de objetos utilizando esas caractersticas.


Cilindro y prisma son geones son literalmente confundibles entre si dado que son
construidos a partir de caractersticas no accidentales.
La descripcin del objeto consta de la composicin de los geones y de la localizacin
relativa de los geones que la componen.

Propiedades no accidentales que diferencian un ladrillo de un cilindro.

Extraccin de bordes
Deteccin de
propiedades no
accidentales

Describir las regiones


de concavidad

Activacin de geones
y relaciones
Activacin de modelos
de objetos
Identificacin
de objetos

156

La representacin de un objeto es un modelo estructural de sus


componentes, sus tamaos relativos, orientacin, lugar de ensamblaje, etc.
La ventaja de los geones es que estn definidos por propiedades invariantes
respecto del punto de vista del observador, lo que permitira el R de objetos a
partir de su representacin 2D.
Biederman y Cooper (1991) han obtenido datos en favor de esta hiptesis: el
priming de repeticin es mayor cuando entre prime y probe (repitiendo objetos)
se repiten geones, pero no cuando son complementarios de uno a otra.
Biederman y Cooper (1992): el priming no cambia si se manipula el tamao,
localizacin, punto de vista.
Original

Cambio
gen

Cambios mtricos del original

Objetos ( construidos) a base de geones como objetivo


presentan otro estimulo parecido pero con un cambio de
gen. Lo que miden la velocidad con la que identifican
el objetivo y el nmero de aciertos . Los sujetos tardan
ms en reconocer el objeto cuando hay un cambio de
tamao y eso que son menos parecidas. El parecido fsico
no es lo relevante , lo relevante son los geones
componentes.

Estos efectos se obtienen tambin con fotografas de objetos originales (Fiser y


Biederman, 2002).

157

Apuntes Gema:

Biderman, reconocimiento por componentes


-

Asume que la representacin del objeto, se realiza a base de conos


generalizados.
- Diferencias con el modelo de Marr: No asume que la
representacin sea objetiva, si no subjetiva, : esto implica que el
reconocimiento sea dependiente del punto de vista, si cambia este, el
reconocimiento se sigue produciendo igual de bien, el punto de vista
es irrelevante , puesto que la representacin del objeto se produce
mediante formas geomtricas , conos generalizados , particulares
denominados: geones ( los utiliza el sistema para construir tanto el
catlogo del objetos en memoria , como la representacin visual).

No cualquier figura geomtrica es un gen, slo aquellas construidas por


caractersticas no accidentales (son cuatro):
A) linealidad- curvatura: (imposible confundir una lnea recta con una curva).
C) Coterminacin no coterminacin: dos lneas intersecan, dos lneas no
intersecan.
D) Paralelismo no paralelismo
E) Simetra asimetra.
La descripcin del objeto, consta de los geones que la componen la localizacin
relativa de los geones respecto de los dems.
Modelo:
Tarea del sistema: Localizacin de los bordes del objeto (podemos usar la derivada
segunda)
Dos procesos que actan en paralelo:
Caractersticas no accidentales: Localizan los mnimos de curvatura. Segregacin de
regiones, puesto que cada una est vinculada a un gen particular.
Activacin de geones y de las relaciones espaciales que hay entre ellos. Donde est
cada gen respecto de los dems.
Activacin de los modelos de objetos que contienen los geones y las relaciones
espaciales.
Se identifica el objeto ms activo.

Este modelo, es capaz de explicar resultados obtenidos por Biederman y Cooper.


La tarea de Primming. Resultado: El objeto tarda ms en reconocer el objeto cuando
hay un cambio de gen que cuando hay un cambio en el parecido fsico (Ej.: tamao).
Cuando presentamos el estimulo previo, se han activado los geones y relaciones
espaciales del mismo. El sujeto, est facilitado en su respuesta cuando hay, por

158

ejemplo, dos de los tres geones que son comunes (retraso por el cambio, en el ejemplo
de la botella).
Variar mtricamente un gen, no repercute negativamente en la velocidad de
reconocimiento del objeto, pero s, variar el gen.

Reconocimiento basado en el punto de vista

Almacenamos una multiplicidad de puntos de vista sobre los objetos


Las coordenadas estn centradas en el observador.
Puntos de vista diferentes producen patrones diferentes de activacin neuronal.
El reconocimiento se produce cuando el patrn de activacin de un objeto iguala
algn patrn de activacin almacenado

Los observadores reconocen mejor los objetos cuando se le presentan desde cierta
perspectiva que de otra segn estos autores.
En esta aproximacin se olvida del problema de la explosin combinatoria.
1) La presentacin de un objeto en el campo visual del observador produce un
patrn de activacin que es diferente al de otro objeto.
2) Cmo se produce el reconocimiento del objeto? Cuando se encuentra
almacenado en la memoria del sujeto un patrn de activacin semejante al que
tiene el sujeto en la memoria.
La esencia pasamos de la explosin combinatoria y asumimos que lo que caracteriza a
un objeto es el patrn de activacin que produce.
3) Se almacenan las representaciones de los puntos de vista ms naturales /
comunes.
Hay un punto de vista que es ms fcil de reconocer que los dems ( el punto de vista
cannico) : que ofrece mayor cantidad de superficie del objeto al observador ( 3/5 partes
de la superficie del coche es visible para el observador).
Bulhoff: Las formas complejas ( poco familiares) : trozos de alambre soldados : son mal
reconocidas al principio y sin embargo a lo largo del entrenamiento van incrementando
su capacidad del reconocimiento pero hay puntos de vista ms fciles de reconocer de
esos objetos .
Watson: Manipulacin de semejanza del punto de vista entre el estimulo previo y el
estmulo objetivo. Lo que encuentran que la respuesta al objetivo es proporcional a la
semejanza de los puntos de vista.

159

Apuntes Gema:
El reconocimiento no se realiza con independencia del punto de vista. A partir de esto,
asumen que el reconocimiento no se realiza igual de fcil en cuanto a tiempo y
precisin, cuando los objetos son presentados desde perspectivas ptimas.
No se almacena representacin para cada objeto, por lo que, para cada objeto
conocido almacenamos tantos puntos de vista diferentes como puntos de vista
experimentados sobre ese objeto. Por lo que, en principio, las representaciones del
objeto estn en coordenadas subjetivas; estn referidas al observador (se olvida el
problema de la explosin combinatoria).
- La presentacin de un objeto en el campo visual del observador, produce un patrn de
activacin diferente a cualquier otro objeto.
SI dos objetos producen igual patrn de activacin, se trata del mismo objeto, o el
observador lo percibe como tal.
Lo que tenemos almacenado en memoria, son activadores producidos en el pasado con
objetos que conocemos: hacemos una comparacin con lo que tenemos en memoria y lo
presente.
- Activacin actual: Activacin en memoria :
- Menos diferencia: creamos un nuevo patrn de activacin para una
nueva representacin.
Palmer ( 1981)
Experimentos: Presentan a sujetos , objetos rotndolos.
Tiempo que los observadores tardan en reconocer y la precisin de los mismos.
Punto de vista cannico: Ofrece al observador mayor cantidad de superficie del objeto.
Para la mayora de los sujetos, es una perspectiva que ofrece informacin sobre la
parte alta lateral y frontal , del objeto.
Importante, porque para los modelos de independencia del punto de vista, esto no sera
( la existencia de este punto de vista armnico, rechaza las ideas de los modelos
anteriores).
Edelman y Blthoff
Presentan formas complejas y poco familiares: Son cual reconocidas al principio; a lo
largo del entrenamiento se incrementa la capacidad de reconocimiento. Hay puntos de
vista sobre estas , ms fciles de reconocer que otros.

Lawson, Humphreys y Watson . Priming: Semejanza de puntos de vista entre el estmulo


previo y el objeto. La respuesta a este ltimo, es dependiente de la semejanza de los
puntos de vista.

Se almacenan las
naturales/comunes.

representaciones

de

los

puntos

de

vista

ms

160

Palmer, Rosch y Chase (1981): no todos los puntos de vista son igualmente
fciles de reconocer. El punto de vista cannico es siempre ms fcil.
Edelman y Blthoff (1992): las formas complejas poco familiares producen
graves problemas de R.
Lawson, Humphreys y Watson (1994), Lawson y Humphreys (1996): los efectos
de priming dependen de la semejanza de puntos de vista de las presentaciones
sucesivas.

El modelo dual (Hummel, 2000, 2002)

Prueba
Distincin entre objetos atendidos e ignorados.
Atendidos: Reconocidos mediante descripciones estructurales como en el
modelo de Biederman.
Ignorados: Reconocidos holsticamente y dependiendo del punto de vista. Un
cambio en el punto de vista elimina el priming de repeticin.

Implica que va a asumir que hay dos formas de que el reconocimiento se produzca:
1) Independiente del punto de vista ( se realizar segmentando el objeto en geones :
atendido).
2) Dependiente del punto de vista (Ignorados).
El factor crtico que hace que se active una u otra va es la atencin.
Holstica: Se considera el objeto entero.

Sin embargo, la tarea a realizar sobre el objeto atendido determina el nivel de


procesamiento alcanzado por el objeto ignorado, no que sea ignorado.

Castillo (2004)

161

Prueba: categorizar el estmulo en rojo.


Resultados: Cuando repetimos el estmulo ignorado en la prueba, tenemos un priming
negativo, si la tarea es semntica (categorizacin). Si se trata de buscar caractersticas
fsicas tenemos un priming positivo.
Esto demuestra que puede que no sea tanto el que el estimulo sea atendido o ignorado,
sino lo que hay que hacer con el estmulo aprendido, lo que determina el procesamiento
con el estmulo ignorado.
El nivel que se alcanza, no depende tanto de la atencin, sino de la tarea

Experimento de priming:
-

Estimulo previo: Cama / cabra: ( 2 objetos solapados)


Target: cabra/ lneas aleatorias ( 1 slo objeto.
Se le pide al observador que categorize al objeto sobre el animal o no
animal (target).

Sobre el estimulo previo se le dice que diga lo que es lo de lneas rojas (el estmulo en
verde es ignorado)
Es un priming negativo (El estimulo ignorado en uno es atendido en 2)
Condicin 2:
1) Localiza una caracterstica fsica ( borde discontinuo)
2) Categorize el estimulo en rojo.
Si la tare es semntica hay priming negativo. Se obtiene si en el prime es categrica, y
no e obtiene si en la prime es la bsqueda de una caracterstica fsica.
Lo que determina el procesamiento del estmulo es lo que hay que hacer con el estmulo
atendido para procesar el estmulo ignorado que la atencin segn el experimento. Por
tanto el modelo de Hummer se puede mantener pero hay que tener en cuenta que hay
que matizarlo en ese sentido.
Modelo que resume lo que hemos visto hasta aqu.

162

Riesenhuber y Poggio ( 2000)


En el Crtex inferotemporal postula la existencia de 2 capas de redes neuronales :
V1, V2----Vn : Neuronas ( unidades sintonizadas al punto de vista ) Que esas neuronas
cuando al campo receptivo se proyecta un objeto con un punto de vista concreto.
-

Todas esas neuronas que representan la mesa baja todos esos puntos
de vista conectan dentro de la Crtex inferotemporal. Como
conectando al objeto. (independientemente del punto de vista).

IT/ PFC::: En la corteza inferotemporal y prefrontal hay neuronas que contienen la


identidad del objeto que nos permiten categorizar el objeto. Estn conectadas con las
anteriores.
Conclusin:
El reconocimiento es dependiente e independiente del punto de vista

Postula la existencia en el crtex inferotemporal de un conjunto de neuronas


denominadas, unidades sintonizadas al punto de vista: estas se activan cuando en su
campo receptivo se proyecta un objeto con un punto de vista determinado.
Hay tantas neuronas en la corteza, como puntos de vista sobre los diferentes objetos,
las cuales, conectan con una neurona sintonizada al objeto: se activa cuando
cualquiera de las neuronas conectadas con ellas, se activan.

163

En la corteza inferotemporal y prefrontal, nos encontramos neuronas que contienen la


identidad del objeto, que permiten reconocerlo y clasificarlo (conectadas a la capa
anterior).

Reconocimiento de caras

Apuntes Gema:
En este tipo de tareas , se requiere de gran atencin.
Investigacin neuroimagen.
Principio de los 80, literatura psicolgica: datos que apuntan que reconocer caras, es
una tarea que el sistema visual realiza de una forma especial Tiene este tipo de tarea
algo especial que la diferencie del resto?
Bruce et al . ( 1992)
1) Experimento en el que utilizan caras de personajes conocidos por los
observadors que se presentan como dibujos lineales extrados por un
algoritmo de extraccin de bordes similar al de Marr. ( Algoritmo de
Pearson y Robinson). Miden el reconocimiento hayado , el cual , resulta
ser muy pobre).
Operacin de mibralizacin: rellenar de negro las zonas oscuras en la cara original:
mejora el reconocimiento de caras, esto indica que:
La importancia de los bordes, es cuestionada porque el reconocimiento es pobre.
No considera que el color es una mala idea, puesto que introduciendo color, mejora el
reconocimiento.
II, Experimento (1994): Reconocer objetos cuando invertimos el color de la imagen, es
muy difcil. El reconocimiento en el negativo de las fotos (por ejemplo) se deteriora
mucho, sobre todo en el caso del reconocimiento de caras. Experimento 1994: Priming
de repeticin: presentacin del mismo estmulo en la prime que en la prueba.
- Presentan en la prime, a cada dibujo lineal de la cara.
- Prueba: dibujo de la cara, pero en foto.
Presentado esquema y foto, el reconocimiento se deteriora. Si hacemos modificaciones
en el esquema, introduciendo elementos de textura y color, el prime mejora.
Son elementos esenciales en el reconocimiento. Esto no ocurre en el reconocimiento de
objetos.
Experimento de Hellawary (1987)
- Presentan a los sujetos como estmulos, caras: estos han de
determinar si los elementos de las diferentes caras se perciben igual.
- El procesamiento de cualquiera de los elementos, depende del resto
de elementos presentes en la cara.
- Conclusin: el procesamiento de los elementos, depende del contexto
de cara, en el que estos se presentan.

164

Tamak y Farah ( 1993)


Investigan el reconocimiento de elementos de la cara ( ej: nariz, ojos..) encontrando
que el reconocimiento de estas es superior cuando los elementos se han presentado en
el contexto de una cara estndar donde los elementos estn situados en su lugar, que si
se presentan elementos aislados o de manera desorganizada.
Pone de manifiesto que este procesamiento es especial para los humanos.
Hay circunstancias en las que esto no ocurre. Ej: . Foto Margaret Tacher. Pocas
diferencias, aunque en realidad , si hay alguna diferencia importante, son caras
invertidas, ( al situarlas en su posicin , se pueden ver las diferencias).
-

Caras invertidas:
- Procesamiento diferente
- Puede considerarse un procesamiento analtico (por partes,
por ello, descubrir los elementos cambiarlos, es ms difcil).
Caras no invertidas: procesamiento holstico.
Conclusin: procesamiento espacial en un sentido concreto. Posicin
estndar. Procesamiento holstico.

Experimento: Son especiales las caras?


Tarea de reconocimiento de los elementos de la cara.
Diseo: 3 condiciones experimentales:
1) Cara completa o parte de la misma (todas las frecuencias espaciales estn
presentes: cara de espectro completo.
2) Igual caras/ partes; manipuladas en cuanto a frecuencia espacial, eliminan las
altas frecuencias espaciales, que transmiten informacin de detalle y
permanecen las bajas frecuencias espaciales, que contienen informacin de los
rasgos de la imagen.
3) Cara/Partes: Se aplica un filtro pero eliminan bajas frecuencias espaciales y
nos quedamos con las altas frecuencias: resalta de los detalles y eliminamos los
grades contrastes.
Resultados.
1) Reconocimiento del elemento, es superior si el elemento se presenta en el
contexto de la cara, que si se presenta aislado.
2) El reconocimiento es mejor cuando los elementos se presentan aislados.
3) El efecto de superioridad de la cara es mayor con frecuencias espaciales bajas.
Efecto de superioridad de la cara, es literalmente la mitad que en frecuencias
espaciales bajas.
El efecto se puede manipular / incrementar si eliminado informacin sobre los detalles
de la cara (eliminando altas frecuencias espaciales) tenemos informacin sobre las
caractersticas globales de la cara.
Esto indica que el reconocimiento se hace a travs de dos vas:

165

Va rpida: Vinculada a un anlisis realizado en la periferia de la va visual: V1 ( slo


) . Recupera las frecuencias bajas presentes en la imagen y que se enva hacia la
corteza inferotemporal y la corteza prefrontal, producindose en ambas, el
reconocimiento, basndose en la forma global.Es ms rpida, 80 mseg, identificacin a
mayor velocidad de la cara.
2) Va vinculada a las frecuencias altas: crtex estriado.

La identidad del individuo se expresa en gran medida a travs de la cara. Cmo


estn representadas?
Bruce et als. (1992): las caras famosas eran bastante difciles de reconocer si se
presentaban esquematizadas mediante un algoritmo como el de Pearson y
Robinson (1985). El relleno en negro de zonas que eran oscuras en el original
hace que el reconocimiento sea igual al que se produce con las fotografas
originales.
Los negativos fotogrficos sirven poco para reconocer rostros. El factor crtico
parece ser el brillo relativo de las reas pigmentadas como el pelo y la piel
(Bruce y Langton, 1994).

Es el reconocimiento especialmente diferente del reconocimiento de cualquier otro tipo


de objeto
Pearson: Rellenar de negro las zonas oscuras de la cara mejora el reconocimiento.
Utilizando los bordes el reconocimiento es posible.
Cuando invertimos el brillo de la imagen es bastante difcil. El reconocimiento del
objetivo en general en el negativo se deteriora mucho y en el caso de la cara mucho
ms.
Demuestran que le factor crtico es el brillo, invertir el color es lo que dificulta el
reconocimiento de la cara.

Bruce et als. (1994): el priming de repeticin es menor cuando se utiliza


esquema y fotografa que si emplea slo fotografa. Lo que cambia entre

166

condiciones es el nivel de detalle de la textura de gris. Segn Biederman y


Cooper (1991) esto no es importante en objetos.
Parece que las propiedades superficiales de piel y las reas texturadas como el
pelo desempean un papel muy importante.
Las caras se procesan holsticamente. Young, Hellawell y Hay (1987): es
imposible codificar una parte de la cara sin que las ms distantes influyan esa
codificacin.

El primming de repeticin es menor. Es un dibujo lineal de la cara y l la prueba


presentan la cara pero en fotografa. Presentando esto se deteriora tanto en velocidad,
precisin y aciertos con respecto en el caso que presentamos fotografa a fotografa.
El reconocimiento de caras es difcil en objetos porque en las caras los elementos de
textura y color (pelo, cara) resultan ser esenciales en el reconocimiento.

Tanaka y Farah (1993): las partes no estn explicitadas en la descripcin que


media el R de las caras. El R de una parte como la nariz es superior si se ha
presentado previamente en el contexto organizado de la cara que en aislamiento
o en un contexto de cara desorganizada.
En las caras invertidas, estos efectos no se producen, lo que sugiere un anlisis
por partes

Hay circunstancias en las cuales los elementos de la cara se reconocen igual si estn
desorganizadas. ( Margaret Tacher) Cuando las caras se procesan invertidas parece que
se procesan invertidas es diferente de cuando son cannicas. Parece un procesamiento
por partes (en invertidas) y si es cannico el procesamiento es holstico.
Son especiales las caras? Si, cuando las caras se presentan de forma estndar el
procesamiento es holstico.
Condiciones experimentales:
1) Todas las frecuencias espaciales que componen la cara estn presentes (
espectro completo).
2) Frecuencias espaciales manipuladas (eliminadas las altas frecuencias detalles
de la imagen- y slo quedan las bajas grandes rasgos de la imagen.
3) Filtro para eliminar las bajas frecuencias espaciales (resalta de los detalles):
Reducimos mucho su contraste global.
Lo que tienen que hacer los sujetos es reconocer los ojos (elementos de los ojos).
167

Estndar:
1) Efecto de superioridad de la cara, lo importante es el tamao de la cara, la
diferencia es que el efecto de superioridad de la cara es mayor cuando el de la
foto esta con todas las frecuencias espaciales.
2) Hay un efecto de superioridad de la cara.
El efecto se puede manipular si eliminamos informacin que llevan altas frecuencias
espaciales que tenemos es una cara en lo que los detalles han desaparecido.
Lo que esto indica es que el reconocimiento de caras se procesa por dos vas:
Va rpida: Anlisis realizado en la periferia de la va visual.
Recupera la frecuencia espaciales bajas presentes en la imagen: y se
enva hacia la corteza prefrontal y inferotemporal y hay se produce el
reconocimiento basndose en la forma global de la cara.
- Va del que: Crtex ventral: vinculadas a las frecuencias espaciales
altas.
La va de las vas de las frecuencias espaciales bajas es muy rpida.
-

Son realmente especiales las caras?


Tarr y Cheng (2003)

Apuntes Gema:
Tienen un sitio especfico en el CIT: en el rea fusiforme (de las caras. Esto ha sido una
corriente de gran fuerza, pero puede ser cuestionable por una razn<. Las caras son
especiales porque nuestra experiencia perceptual comienza en el momento que
nacemos.
Uno de los tipos de objetos de contraste ms importantes utilizado detecta el lugar de
activacin cerebral: reconocimiento de coches.
reas que se activan ms al discriminar caras que coches: (estos sujetos son expertos
en el reconocimiento de caras, pero no de coches).
Si ideamos un conjunto de objetos que nadie ha visto jams y dedicamos un tiempo al
entrenamiento con los sujetos, convertimos a los mismos en expertos para la
discriminacin de estos objetos. Comparamos ahora la activacin general para el
reconocimiento de caras y des estos objetos: resultados:
Caras: Activacin de rea fusiforme.
Objetos: activacin del rea fusiforme.
Solucin: rea que se activa en el reconocimiento de objetos de los cuales somos
expertos.
Las caras son especiales porque somos expertos en el reconocimiento de las mismas
(por ello se han utilizado resonancia magntica).

168

Se activa la corteza inferotemporal Por qu? Para todos somos autnticos


expertos en el reconocimiento de caras. Las caras son especiales porque cuando
estudiamos el reconocimiento de recaras son individuos de estudio que son sper
especialistas. Pueden ser especiales porque podemos estar haciendo estudios sobre las
diferencias entre reconocimientos en los que no tenemos ninguna especializacin, pero
en las caras s.
Lo que podemos hacer es coger y estudiar expertos en coches. Ahora s podemos
comparar los sujetos reconociendo caras (expertos) y reconociendo otras cosa que sean
expertos (coches, greebles,) se activa la misma rea: Especializada en la deteccin de
cosas en los cuales somos expertos. Son especiales porque somos expertos en el
reconocimiento de caras.

Son
realmente
especiales las caras?

Hay un componente en el EEG que aparece unos milisegundos despus de la


presentacin del estmulo y que es de voltaje negativo (N170). El N170 es un indicador
del procesamiento del sujeto de la cara.
Lo que se observa que el voltaje es mayor cuando se presentan caras que cuando se
presentan coches.

169

Las caras son todas con la misma orientacin y tamao y los coches no. La
variabilidad de tamao y orientacin de una cara es tan baja que cuando sumamos 100
caras seguimos viendo una cara.
El tamao N170 es una funcin de la coherencia del estmulo.
Los coches no son coherentes: N170 pequeo
Las caras son coherentes: N170 grande
Cuando las caras son coherentes y los coches no el N170 es mayor con coches son
coherentes, pero cuando es al revs N170 es mayor para los coches. Cuando ambas son
coherentes N170 es mayor en caras.
Cuando se controla la coherencia parece que la especialidad de las caras desaparece.
Experimento de Thiery et al.
Utiliza medidas de actividad cerebral medidas con EEG. Hay un componente /potencial
evocado que aparece en el EEG unos 170 mseg despus de la presentacin del estmulo
y que es de voltaje negativo, se le denomina N 170. Este potencial es un indicador del
procesamiento de la cara, que ha realizado el sujeto.
- El procedimiento es el mismo que el experimento anterior. La
amplitud en voltaje de N170, es mayor cuando se presentan caras
que coches.
- En estos experimentos, son siempre fotografas de caras hechas de
diferente y que tiene aproximadamente el mismo tamao de cara.
Qu ocurre cuando se presenta la figura de un coche como control?
Estos varan de tamao y orientacin.
Si suponemos las fotos sumando, por ejemplo caras, el resultado sigue siendo la
apariencia de cara. Pero, en los coches no ocurre esto (potenciales diferentes de un
ensayo a otro, y en tamao de N170 sera menor: menor coherencia entre los
estmulos).
Introducimos caras que diferencian en tamao y en orientacin, introducimos coches
con el mismo tamao y orientacin.
1) Baja coherencia coches
2) Alta coherencia coches de N170.
3) Baja coherenia de caras.
4) Alta coherencia de caras.

( Resultados sobre diferentas de amplitud).


Conclusin es N170 un indicador de la orientacin o un indicador del reconocimiento
de caras.

170