Vous êtes sur la page 1sur 163

L

a inteligencia, ha de ser una fuente inagotable de investigacin en


el mbito de la psicologa, cada ao, se publican

miles de

artculos de investigacin sobre su naturaleza y medicin, Sin


embargo encontrar una definicin unnime se hace muy difcil,
pero

resulte

paradjico

los

psicometras explican mejor la

medicin de la inteligencia que su definicin.


En el presente documento,

detallamos los diversos puntos de vista

respecto a las pruebas de inteligencia las cuales nos permiten asimilar


ciertas definiciones, teoras y practicas convencionales de evaluacin en el
entendido que para comprender las teoras de la inteligencia es importante
establecer la validez del constructo de las medidas de C.I..
En los captulos siguientes, evaluamos las capacidades de los lactantes
y preescolares, en ella revisamos la naturaleza y aplicacin de los
principales instrumentos de evaluacin, luego, nos referimos a las pruebas
de inteligencia individual y finalmente a las pruebas grupales, en todas ellas
nos planteamos una cuestin fundamental: La utilidad practica

de estos

instrumentos.

ENRIQUE GUSTAVO BALBN VILLAVERDE


PSICOLOGO

INDICE

INTRODUCCIN
OBJETIVOS
I UNIDAD
TEORAS Y MEDICIN DE LA INTELIGENCIA
1.1 DEFINICIONES DE INTELIGENCIA.

09

PRIMERA ACTIVIDAD

13
II UNIDAD

EVALUACIN DE LAS CAPACIDADES DE LACTANTES Y


PREESCOLARES.
2.1 EVALUACIN DE LA CAPACIDAD DEL LACTANTE

14

2.2 EVALUACIN DE LA INTELIGENCIA DEL PREESCOLAR

23

2.3 UTILIDAD PRCTICA DE LA EVALUACIN DE

LACTANTES Y

PREESCOLARES

52

SEGUNDA ACTIVIDAD

60
III UNIDAD

PRUEBAS INDIVIDUALES DE INTELIGENCIA


3.1 ORIENTACIN HACIA LAS PRUEBAS INDIVIDUALES DE
INTELIGENCIA

62

3.2 ESCALAS WECHSLER DE INTELIGENCIA.

65

3.3 SUBPRUEBAS WECHSLER: DESCRIPCIN Y ANLISIS.

70

3.4 ESCALA WECHSLER DE INTELIGENCIA PARA ADULTOS III

87

3.5 ESCALA WECHSLER DE INTELIGENCIA PARA EL NIVEL


ESCOLAR III

96
5

3.6 ESCALA DE INTELIGENCIA STANFORD BINET: CUARTA


EDICIN.

101

3.7 PRUEBAS DETROIT DE APTITUD PARA EL APRENDIZAJE 4

114

3.8 TEST BREVE DE INTELIGENCIA DE KAUFMAN (K BIT)

118

TERCERA ACTIVIDAD

121
IV UNIDAD

PRUEBAS GRUPALES DE INTELIGENCIA


4.1 ORGENES Y CARACTERSTICAS DE LAS PRUEBAS
GRUPALES.

123

4.2 BATERA MULTIDIMENSIONAL DE APTITUD (MAB)

127

4.3 ESCALA DEL SHIPLEY INSTITUTE OF LIVING (SILWS).

134

4.4 BATERA MULTINIVEL: PRUEBAS DE CAPACIDAD COGNITIVA


(CogAt).

139

4.5 PRUEBA DE INTELIGENCIA CULTURALMENTE JUSTA (CFIT).

144

4.6 MATRICES PROGRESIVAS DE RAVEN (RPM)

149

4.7 PERSPECTIVA SOBRE LAS PRUEBAS CULTURALMENTE


JUSTAS.
REFERENCIAS BIBLIOGRAFICAS.

156
165

OBJETIVOS
GENERAL:
Entender las bases tericos- conceptuales de la medicin de la
inteligencia dentro de principios ticos

y legales

a fin de que la

interpretacin de los resultados refleje en buena medida la realidad


mesurada.
ESPECFICOS:

Conocer le evolucin histrica de las pruebas de inteligencia a fin de


que el estudiante entienda las limitaciones iniciales de las mismas y
los modos como estas han sido superadas y las perspectivas de la
misma.

Conocer los principios de las pruebas

de inteligencia,

sus

aplicaciones a campos especficos y las consecuencias sociales y


legales de la mensuracin.
-

Conocer

el

proceso

de

estandarizacin,

toma

de

muestra,,

descripcin categrica y puntuacional de las pruebas de inteligencia


a fin de brindar una interpretacin coherente y tener capacidad de
plasmar la misma en un informe final.
-

Conocer la utilidad practica y limitaciones de los diversos reactivos


psicolgicos de medicin de la inteligencia.

PRUEBAS PSICOLGICAS DE EFICIENCIA


INTRODUCCIN
Entre otros, uno de los objetivos del presente fascculo es investigar
los diferentes significados que se le han dado al trmino inteligencia y
analizar la manera en que las definiciones y teoras han influido en la
estructura

contenido

de

las

pruebas

de

inteligencia.

Una

justificacin importante para este tema es que la comprensin de que


estas teoras

de la inteligencia

se tornan importantes

para

establecer la validez de constructo de las medidas de C.I. en las


paginas siguientes
principales
posteriormente

se revisa la naturaleza

instrumentos
se investiga

de

evaluacin

y aplicacin de los
de

los

lactantes,

una cuestin fundamental: la utilidad

practica de estos instrumentos.


La inteligencia es pues, uno de los temas que mas se han investigado
en psicologa sin embargo pese a la cantidad de tratados al respecto,
no existe una definicin universalmente aceptada, sin embargo resulta
conveniente, detallar algunas definiciones que a nuestro entender
tiene mejor elaboracin.
8

DEFINICIONES DE INTELIGENCIA
Sperman

(1904-1923):

Una

capacidad

general

que

implica

principalmente la deduccin de correlaciones y correlatos.


Bient

Simon

(1905):

La

capacidad

para

juzgar

bien,

para

comprender su impotencia.
Terman (1916): La capacidad para formar conceptos

y para

comprender su importancia.
Pintner: (1921): La capacidad del individuo para adaptarse de manera
adecuada a las situaciones relativamente nuevas de la vida.
Throndike (1921): el poder de dar buenas respuestas, desde el punto
de vista de la verdad o el hecho.
Thurstone

(1921)

la

capacidad

para

inhibir

las

adaptaciones

instintivas, para imaginar de manera flexible, diferentes respuestas y


para realizar adaptaciones

instintivas modificadas en conducta

manifiesta.
Wecheler (1939) El conjunto o capacidad global del individuo
actuar

de

manera

propositiva,

pensar

de

manera

para

racional

enfrentarse de manera efectiva con el ambiente.


Humphreys

(1971)

El

repertorio

completo

conocimiento, inclinacin para el aprendizaje

de

habilidades,

y tendencias a la

generalizacin adquiridos, considerados de naturaleza intelectual y


que estn disponibles en un momento determinado.
Piaget (1972): un termino genrico que indican las formas superiores
de organizacin o equilibrio

de la estructura cognitiva que se utiliza

para la adaptacin al ambiente fsico y social.


Sternberg

(1985):

la

capacidad

mental

para

automatizar

el

procesamiento de informacin y para emitir en un contexto

la

conducta

la

adecuada

en

respuesta

situaciones

novedosas;

inteligencia tambin incluye metacomponentes de ejecucin y de


adquisicin del conocimiento (los cuales analizan despus)
9

Eysenck (1986): transmisin correcta de la informacin a trabes de la


corteza.
Garder (1986): La capacidad o habilidad para resolver problemas o
para crear productos que se consideran valiosos dentro de uno o ms
entornos culturales.
Cesi (1994): Capacidades innatas mltiples

que dan un rango de

posibilidades; estas se desarrollan (o dejan de desarrollarse o se


desarrollan despus se atrofian) dependiendo de la motivacin y
exposicin a experiencias educativas relevantes.
Como podemos apreciar son distintos los puntos de vista al respecto
sin embargo existen criterios generalizados en funcin a: 1.- la
capacidad para aprender
adaptarse

de la experiencia y 2.- la capacidad para

al propio ambiente. El hecho de que tanto el aprendizaje

como la adaptacin sean importantes para la inteligencia se destaca


en gran medida

en ciertos casos de discapacidad mental, donde las

personas no poseen una u otra capacidad en grado suficiente.


Los conceptos

de los expertos

acerca de la inteligencia son muy

semejantes, en orden de importancia, consideran a la capacidad de


solucin de problemas prcticos , la capacidad verbal y la competencia
social como los ingredientes fundamentales; ellos sealan que la
inteligencia verbal, la capacidad de solucionar problemas

y la

inteligencia practica son importantes.


Las primeras teoras acerca de la inteligencia, propuestas a finales del
siglo XX enfatizan la agudeza sensorial. Tanto Sir Francis Galton como
J. McKeen Cattell consideraban que la inteligencia se sustenta en las
capacidades sensoriales agudas: ambos desarrollaban varias medidas
sensoriales en sus fallidos intentos por medir la inteligencia.
A inicios del siglo XX Charles Spearman propuso que la inteligencia
constaba de dos tipos de factores; un solo factor general, g y
numerosos factores especficos, s1, s2, s3

10

y as sucesivamente.

Spearman ayudo a inventar el anlisis factorial como auxiliar para sus


investigaciones acerca de la naturaleza de la inteligencia.
L.L. Thurstone, favoreci la perspectiva de que la inteligencia consta
aproximadamente de siete factores grupales en vez de un solo factor
general. Estos eran comprensin verbal, fluidez de palabra, numero,
espacio, memoria asociativa, velocidad perceptual y razonamiento
inductivo. En ltima instancia, Thurswtone reconoci la existencia de
g como factor de primer orden.
Raymond Catell propuso que la inteligencia esta formada por factores
principales: la inteligencia fluida (g) e inteligencia crisatalizada. La
primera no es verbal en su mayor parte y es una forma de eficiencia
mental relativamente independiente de la cultura, la inteligencia
cristalizada tiene una fuerte dependencia de la cultura y se emplea
para tareas que requieran de una respuesta aprendida o habitual.
Jean Piaget, propuso una tesis del desarrollo en su teora acerca de
la inteligencia. Sugiri que los esquemas -patrones organizados de
conducta o estructuras

mentales que conducen

al conocimiento de

cmo hacer las cosas- evolucionan hacia la maduracin cada vez


mayor a trabes de un proceso denominado equilibracin.
En la teora de Piaget, la asimilacin es la aplicacin de un esquema a
un objeto, persona o acontecimiento. Si un esquema funciona, surge
un estado de equilibrio, de lo contrario el resultado es el equilibrio
un estado de tensin dinmica. Es este ltimo caso, la persona debe
adaptar el esquema para que funcione- un proceso denominado
acomodacin.
J.P: Guilford propuso un modelo de estructura intelectual (EI) para
resumir sus puntos de vista acerca de la naturaleza multifactica de
la

inteligencia.

dimensiones

Clasifico

las

capacidades

intelectuales

en

tres

llamadas operaciones (cinco tipos) y productos (seis

tipos) de esta manera, Guilford propuso en total 150 tipos diferentes


de inteligencia.
11

Segn la teora del procesamiento simultneo y sucesivo, el cerebro


humano

tiene

dos

formas

especficas

de

procesamiento

de

informacin: simultanea, en la que se procesan a un mismo tiempo


grupos de informacin principalmente espacial, y sucesiva, en la que
la informacin se organiza de manera temporal en una serie lineal.
Algunos investigadores han estudiado los fundamentos biolgicos de
la inteligencia. Por ejemplo, varios estudios indican que la inteligencia
psicometrica

se correlacionan con los patrones

evocada (el potencial evocado

promedio

de la onda cerebral

o PEP) se correlaciona a

niveles de .70 a .80 con el CI medio.


H. Garden propuso una teora de la inteligencias mltiples basada de
manera aproximada en el estudio de las relaciones cerebro conducta.
Afirma

la

existencia

de

varias

inteligencias

relativamente

independientes que incluyen la inteligencia lingstica, musical, lgico


matemtico, espacial, corporal cenestsica y personal.
R. Sterberg propone una teora triarquica de la inteligencia con los
siguientes

aspectos:

inteligencia

componencial

(los

mecanismos

internos responsables de la conducta inteligente); inteligencia basada


en la experiencia (la capacidad de manejar
tareas

novedosas)

inteligencia

de manera eficaz

contextual

moldeamiento y seleccin del ambiente de la vida real).

12

las

(adaptacin,

Responda segn corresponda:


1.-

Pese a la diversidad de puntos de vista respecto a la definicion


de la inteligencia, existen dos conceptos generales comunes
entre la mayoria de autores, estas son:
a.b.-

2.-

El autor que define la inteligencia como : un termino generico


que indica las formas superiores de organizacin o equilibrio de
la estructura cognitiva que se utilizan para la adaptacion al
ambiente fisico y social, es..:

3.-

Describa las etapas del desarrollo cognitivo segn Piaget:


a.b.c.d.-

4.-

Segn la teoria del procesamiento simultaneo y sucesivo, el


cerebro humano, tiene dos formas especificas de procesamiento
de informacion: Simultanea y sucesiva.
V( )

F( )

5.- R. Sternberg propone la teoria de las inteligencias multiples


V( )

F( )

Nota: Las respuestas se encuentran al final del libro.

13

EVALUACIN DE LA CAPACIDADES DE
LACTANCIA Y PREESCOLARES
Evaluacin de la capacidad del lactante
El

periodo

de

la

lactancia

edad

preescolar

se

extiende

aproximadamente desde el nacimiento hasta los seis aos de edad.


Los cambios que ocurren durante este periodo son, obviamente,
profundos. El lactante desarrolla los reflejos bsicos, domina los hitos
del desarrollo (asir, gatear, sentarse, ponerse de pie y dems),
aprende un lenguaje y establece la capacidad para el pensamiento
simblico. Para la mayora de los nios, el patrn y progreso del
desarrollo se encuentra de manera visible dentro de lmites normales.
No obstante, en ocasiones los padres y profesionales entrenados en la
evaluacin de lactantes y preescolares se encuentran con nios cuyo
desarrollo parece lento, demorado o, incluso, que muestran un retraso
14

evidente. Estos nios provocan una conmocin de preguntas ansiosas:


Qu

tan

retrasado

funcionamiento

est?

normal

en

Cules
la

son

escuela?

los

Este

prospectos
nio

lograr

de
la

independencia personal cuando llegue a la edad adulta?


En el extremo opuesto se encentran aquellos nios precoces que
alcanzan los hitos del desarrollo meses o aos antes de lo programado
en trminos normativos. En estos casos, los orgullosos padres tienen
un conjunto diferentes de preocupaciones: Qu tan avanzado est mi
hijo?

Cules

son

las

reas

ms

fuertes

ms

dbiles

de

funcionamiento intelectual? Este nio ser un adulto dotado?


Los instrumentos para la evaluacin de lactantes y preescolares
pueden ayudar a responder las preguntas acerca de nios en ambas
situaciones.

Por

supuesto,

estas

pruebas

tambin

proporcionan

informacin til acerca de la mayora de los nios que caen en medio


de la distribucin. En este tema se revisa la naturaleza y aplicacin de
las

principales

medidas

para

lactantes

preescolares.

Estas

herramientas incluyen pruebas individuales, inventados del desarrollo


y escalas de clasificacin. Se comienza con una descripcin de varios
instrumentos

destacados

despus

se

investiga

la

pregunta

fundamental del propsito o utilidad. Cul es el empleo de estas


medidas? Cul es el significado de una puntuacin en un inventario
del desarrollo o en una prueba de inteligencia para preescolares?
Hasta qu grado estos procedimientos permiten el pronstico de las
capacidades adultas o, en ese caso, ayudan a vaticinar el desempeo
inicial en la escuela? Estas preguntas tendrn ms significado si se
revisan primero los instrumentos relacionados.
La revisin se divide en dos partes: medidas para lactantes (dirigidas
a nios desde el nacimiento hasta los dos aos y medio de edad) y
pruebas para preescolares (dirigidas a nios desde los 2 aos y medio
basta los 6 aos de edad). La divisin es un tanto arbitrada, pero no
por

completo.

Las

pruebas

para

lactantes

tienden

ser
15

multidimensionales y a tener cargas significativas en desarrollo


sensorial y motor. A partir de los dos aos y medio de edad, es tpico
que se utilicen las medidas estandarizadas como la Escala de
Inteligencia Stanford-Binet: Cuarta Edicin, la Batera de Evaluacin
Kaufman para Nios, las Differential Ability Scales (Escalas de
Capacidad

Diferencial)

las

Escalas

McCarthy

de

Aptitudes

Psicomotrocidad para nios para la evaluacin de nios preescolares.


Estas pruebas tienen fuertes cargas en habilidades cognitivas, como
comprensin verbal y pensamiento espacial. As, las escalas para
lactantes y las pruebas para preescolares miden componentes un
tanto diferentes de la capacidad intelectual.
INVENTARIOS GESELL DEL DESARROLLO
Diseados para medir el progreso en el desarrollo de lactantes y nios
desde las cuatro semanas hasta los 60 meses de edad, los Inventarios
Gesell del Desarrollo se publicaron por primera vez en 1925, y
despus se han revisado de manera peridica (Gesell, IIg y Ames,
1974; Knobloch, Stevens y Malone, 1987). Casi todas las pruebas
para lactantes han tomado prestados o han adaptado los reactivos de
los inventarios originales diseados por Arnold Gesell (1880-1961), de
modo que es justo y apropiado que se comience la presente revisin
con este instrumento.
Los Inventarios Gesell del Desarrollo proporcionan un procedimiento
estandariza la observacin y valoracin de los logros en el desarrollo
que tienen los nios en cinco reas: motora gruesa, motora fina,
desarrollo del lenguaje, conducta adaptativa y conductas personalessociales. La mayor parte de los 144 reactivos en el inventario son
puramente observacionales y se basan en la inspeccin directa de las
respuestas de los nios a juguetes y a situaciones estndar. Por
ejemplo, a continuacin se presentan algunos reactivos ilustrativos
que por lo comn superara un lactante de 40 semanas de edad.
16

Adaptativa
Seala a una bolita en un vaso.
Tira de un cordel para obtener un anillo
Motora gruesa
Transita por una barra utilizando dos manos.
Se deja caer al piso con control
Motora fina
Toma una bolita de manera decidida.
Utiliza asimiento de tijeras en un cordel lenguaje
Lenguaje
Usa da da con dignificado.
Responde a la palabra no no.
Personal-social
Extiende un juguete, pero no lo suelta.
Para los brazos por el vestido, si se le ayuda a iniciar el movimiento.
El rango de edades del Inventario Gesell del desarrollo es del
nacimiento a los 60 meses. El genio de Gesell se encuentra en haber
identificado situaciones que ocurren de manera natural en el hogar o
la clnica y en utilizar objetos o tareas con enorme atractivo para
lactantes

preescolares.

En

algunos

casos,

es

necesaria

la

informacin de uno de los padres o de la persona encargada del


cuidado del nio para calificar los reactivos individuales. A pesar del
ambiente

naturalista

entrenamiento

de

la

adecuado,

prueba,
pueden

los

observadores,
lograr

con

el

confiabilidades

interobservadores a la mitad del rango de .90 (Knobloch, Stevens y


Malone, 1987).
Los pedatras y otros especialistas en nios son quienes empleen
principalmente los Inventarios Gesell del Desarrollo para identificar a
17

lactantes y nios en riesgo de presentar alteracin neurolgica y


retraso mental. Gesell nunca tuvo la intencin de que su inventario
fuera una prueba de inteligencia. Tena una fuerte orientacin
biolgica en su investigacin y supona que el desarrollo normal era
una evolucin madurativa que ocurra en una secuencia fcil de
predecir. Gesell determin que el desarrollo normal es un fenmeno
con lmites temporales: la variabilidad de edades para el logro de los
hitos del desarrollo en la lactancia es generalmente pequea, en el
rango de unas cuantas semanas para muchas tareas. Por tanto, la
demora grave para alcanzar a los hitos del desarrollo, establecidos por
Gesell

de

manera

concienzudamente

cronolgica,

puede

indicar

alteracin neurolgica o retraso mental (Honzik, 1983; Lewis y


Sullivan, 1985). Varios estudios indican que los Inventarios Gesell del
Desarrollo funcionan bien en la deteccin de lactantes en riesgo
(Knobloch, Stevens y Malone, 1987).
Aunque

los

Inventarios

Gesell

del

Desarrollo

se

emplean

principalmente para la deteccin y diagnstico clnico, Knobloch,


Stevens y Malone (1987) proporcionan una bese ms o menos
definida para la obtencin de Cocientes del Desarrollo para las cinco
reas y el desarrollo general. La frmula es la siguiente:
CD = Edad de maduracin

x 100

Edad cronolgica
La edad de maduracin se basa en la imagen clnica total de los
hitos del desarrollo superados y no superados en cada rea. Aunque
no se proporcionan criterios precisos, la edad de maduracin para un
lactante parece ser la edad del desarrollo en la que se pasan la
mayor; parte de los reactivos. Dado que sus propiedades tcnicas no
se han estudiado de manera a cuada, el Cociente del Desarrollo debe
utilizarse principalmente como herramienta de investigacin.

18

Las pruebas Gesell son muy respetadas debido a que proporcionan


descripciones detalladas de los hitos del desarrollo en la lactancia que
no tienen paralelo en la bibliografa sobre evaluacin infantil (Nuttall,
Romero y Kalesnik, 1992). Sin embargo, el empleo de los inventarios
Gesell como instrumento psicomtrico recibido agudas crticas en aos
recientes. problema bsico parece residir en una falta de atencin a
los criterios formales de confiabilidad y validez. Por ejemplo, en los
primeros manuales de Gesell los informes sobre la confiabilidad testretest son mnimos o nulos. Cuado los investigadores contemporneos
examinaron esta propiedad de las pruebas Gesell, los resultados
fueron sorprendentes. Lichtenstein (1990 inform de una correlacin
test-retest de slo .73 con una muestra de 46 nios, lo cual cae muy
por debajo del nivel recomendado de .90 para la toma de decisiones
sobre individuos (Nunnally, 1978; Salvia & Ysseldyke, 1991). Banerji
(1992) concluy que las pruebas Gesell funcionaban de manera
deficiente como instrumentos de deteccin de la preparacin para la
escuela. En general, los especialistas en educacin se muestran
cautelosos en cuanto a la utilizacin de estas pruebas para la toma de
decisiones sobre asignacin o retencin escolar.
ESCALAS ORDINALES DE DESARROLLO PSICOLGICO
Las Ordinal Scales of Psychological Development (Escalas Ordinales de
Desarrollo

Psicolgico),

llamadas

de

aqu

en

adelante

Escalas

Ordinales, se disearon como una herramienta basada en la teora de


Piaget para la medicin del desarrollo intelectual entre nios de 2
semanas

aos

de

edad

(Uzgiris

Hunt,

1989).

Dichas

herramientas incluyen seis escalas, cada una diseada para medir una
capacidad especfica que surge durante el primer estadio piagetiano
de la inteligencia sensoriomotora. Cada escala consta de 5 a 15 pasos
ordinales independientes; es decir, los reactivos se ordenaron en una
secuencia del desarrollo que normalmente no vara.
19

Las escalas son las siguientes:


.

Exploracin visual y permanencia de objeto.

Desarrollo de medios-fines.

Imitacin vocal y de ademanes.

Desarrollo de la causalidad operacional.

Construccin de relaciones de objeto en el espacio.

Desarrollo de esquemas para relacionarse con los objetos.

Ante las muchas adversidades que surgen cuando se examina a los


lactantes es posible que lloren, regurgiten, se alejen gateando,
ignoren la tarea, se duerman o se queden fijados en la barba del
examinador

las

escalas

de

este

instrumento

poseen

fuertes

propiedades psicomtricas. En un estudio con 84 lactantes, las Escalas


Ordinales mostraron excelente confiabilidad interobservadores (media
de 96%), buena consistencia test-retest, ordinalidad respetable y
correlaciones muy fuertes con la edad (Uzgiris, 1976). En pocas
palabras, este instrumento parece ser un ndice psicomtricamente
slido de la inteligencia sensoriomotora.
Uzgiris (1983) considera que el funcionamiento intelectual en la
lactancia es cualitativamente diferente y necesita comprenderse por
sus caractersticas propias. Las Escalas Ordinales se desarrollaron
como un medio para investigar la inteligencia del lactante dentro del
esquema terico de Piaget; por esta razn Uzgiris no pretende que su
instrumento

sirva

como

medio

de

prediccin.

En

general,

las

correlaciones entre las puntuaciones de la escala y el CI posterior son


muy bajas hasta que los lactantes tienen cuando menos 18 meses de
edad. Muy pocos clnicos utilizan el instrumento para la deteccin del
desarrollo; sin embargo, Dunst (1980) ha abogado por el empleo de
estas escalas como base para el diseo de currculo slido en trminos
20

del desarrollo para nios con discapacidad. Recientemente, Auer y


Reisberg (1996) han hecho surgir la fascinante posibilidad de que las
Escalas Ordinales puedan emplearse para la evaluacin cognitiva de la
demencia grave en ancianos.
ESCALAS BAYLEY DE DESARROLLO INFANTIL - II
Despus de decenios de preponderancia en el campo de la evaluacin
de lactantes, las Escalas Bayley de Desarrollo Infantil han tenido una
revisin reciente (Bayley, 1969, 1993). El formato de la escala es el
mismo

la

Escala

Mental

la

Escala

Motora

proporcionan

puntuaciones cuantitativas estndar normalizadas, con media de 100


y desviacin estndar de 16- pero las Bayley Scales of DevelopmentII cubren un rango ms amplio de edades, que va desde 1 hasta 42
meses. El tercer componente, la Escala de Calificacin Conductual
consta de 30 reactivos diseados para evaluar atencin, orientacin,
regulacin emocional y calidad motora. La Bayley-II tiene nuevas
normas obtenidas con una muestra aleatoria estratificada de 1700
nios que se asemeja mucho a los datos estadsticos del censo de EUA
para 1988 en cuanto a edad, sexo, origen tnico, regin y educacin
de los padres.
La Escala Mental mide las siguientes capacidades:
.

Agudeza sensorial/perceptual.

Adquisicin de constancia objetal.

Memoria, aprendizaje y solucin de problemas.

Vocalizacin, comunicacin verbal.

Evidencia inicial de pensamiento abstracto.

Habituacin.

Mapeo mental.

Lenguaje complejo.
21

Formacin de conceptos matemticos.

La Escala Motora evala las siguientes habilidades.


.

Grado de control del cuerpo.

Coordinacin de msculos grandes.

Control motor fino de manos y dedos.

Moviminto dinamico.

Praxis dinmica

Imitacin postural.

Estereognosis.

La calidad tcnica t la excelente estandarizacin de las escalas Bayley


sealan a esta prueba como el pinculo psicomtrico en su campo
(Sattler, 1988). Aunque la escala Bayley-II tiene slo una modesta
cantidad de investigacin sobre validez, se asemeja en gran medida a
su antecesora, para la cual se puede citar una enorme cantidad de
evidencias de validacin. As, la validez de la Bayley-II descansa, en
parte, en su semejanza con la escala Bayley original. En cuanto a
validez, el manual de la escala Bayley informan de una correlacin de
.57 entre la Escala Mental y el CI de la Stanford-Binet para 120 nios
con edades de 24 a 30 meses. Self y Horowitz (1979) revisaron la
voluminosa literatura acerca de los correlatos de las puntuaciones de
la escala Bayley. Esta escala muestra fuerte relacin con la StanfodBinet, con las Escalas Wechsler, el desempeo en tareas piagitianas
clase social y factores ambientales. Tambin, las puntuaciones muy
bajas en la escala Bayley predicen un resultado deficiente del
desarrollo en la infancia tarda (Vander Veer y Schweid, 1974).
Rhodes, Bailey y Yow (1983) citan evidencia adicional sobre validez.
Un estudio reciente sobre la validez de las Bayley cales of Infant
Development-II (BSID-II) con lactantes prematuros encontr una
22

fuerte concordancia entre esta prueba y la primera, lo cual sustenta la


validez clnica de la revisin (Goldstein, Fogle, Wieber y OShea,
1995). Un estudio con la lactancia australianos sanos inform que las
puntuaciones de la BSID-II eran apropiadamente ms bajas que las
de la BSID, lo cual indica que las normas para la primera edicin en
verdad eran obsoletas (Tasbihsazan, Nettelbeck y Kirby, 1997). A
pesar de estos estudios en apoyo a su validez, Nellis y Gridley (1994)
sugieren precaucin con la BSID-ll basta obtener mayor informacin.
Las escalas Bayley requieren mayor habilidad y tiempo (45 a 75
minutos) para aplicar e interpretar la prueba que instrumentos
comparables como la Denver-2. En consecuencia, se reservan para
evaluaciones especiales y para aplicaciones de investigacin; por lo
comn no se les utiliza como instrumentos rutinarios de deteccin.
EVALUACIN DE LA INTELIGENCIA DEL PREESCOLAR
Los nios preescolares exhiben gran variabilidad en cuanto a madurez
emocional y receptividad hacia los adultos. Un nio puede animar-se
ante el examinador y luchar por dar su mejor desempeo desempeo
en todas las preguntas. Otro puede mirar fijamente al piso y quedarse
mudo mientras intenta realizar una sencilla tarea de diseo con cubos.
Cuadro Medidas adicionales de la capacidad en la lactancia
Inventario del Desarrollo (Battelle Developmental lnventory,
BDI; Newborg, Stock, Wnek, Guidubaldi y Svinicki, 1984). Del
nacimiento a los ocho aos de edad; los 341 reactivos evalan los
dominios Personal-Social, Adaptativo; Motor; Comunicacin; Cognitivo
y Total. La batera completa requiere de 1 a 2 horas para su
aplicacin; una versin del BDl para deteccin (96 reactivos) ha
recibido graves criticas.
23

Developmental Assessment of Young Children (Evaluacin del


Desarrollo de Nios Pequeos DAYS, Voress y Maddox, 1998).
Del nacimiento a los seis aos de edad; la evaluacin en cinco
dominios

(cognicin

comunicacin,

socioemocional,

fsico

adaptativo) se realiza a travs de observacin, entrevistas con los


encargados del cuidado del nio y evaluacin directa. La DAYS
proporciona una evaluacin breve (20 minutos con base en datos
normativos sobresalientes (1300 nios divididos en 23 grupos por
edad que se aproximan a los datos del censo de 1996). Los cinco
ndices resultantes y el ndice global son sumamente confiables (con
coeficientes que van de .90 a .99).
Developmental lndicators for the Assessment of Learning-3
(Indicadores

del

Desarrollo

para

la

Evaluacin

del

Aprendizaje3 DIAL-3; Mardell-Czudnowsid y Goldenberg, 1998).


De los 3 a los 6 aos de edad; los dominios que se evalan incluyen
Motor (p. ej., atrapar, cortar, escribir), Conceptos (p. ej., nombrar,
contar, clasificar) y Lenguaje (p. ej.. sustantivos/verbos, solucin de
problemas, extensin de la oracin). La confiabilidad test-retest la
parte alta del rango de .80 es extraordinaria para un instrumento de
este tipo. En el mismo que se tienen disponibles versiones en ingls y
espaol.
Early Screening lnventory (Inventario de Deteccin Temprana,
ESI; Melseis, Wiske y Tivnan, 1984). Edades de 3 a 6 aos; es un
instrumento breve de deteccin que proporciona puntuaciones en
cuatro reas dibujo de la Figura Humana, Visomotora/Adaptativa;
Lenguaje y Cognicin y Motora Gruesa/Consciencia Corporal. La
puntuacin total se utiliza para clasificar a los nios en uno de tres
grupos de canalizacin: Bien (de superior al promedio a menos 1
DE); reevaluar (entre menos 1 y menos 2 DE) y canalizar (inferior
a menos 2 DE).

24

Early Screening Profiles (Perfiles de Deteccin Temprana, ESP;


Harrison, Kaufman, Kaufman y col., 1190). Edades de 2 a 6 aos; los
dominios que

se evalan incluyen Cognitivo/Lenguaje, Motor y

autoayuda/Social; cuatro Exmenes (Articulacin, Conducta, Historial


de salud y Hogar) complementan la evaluacin. Este instrumento
tiene

fuertes

cualidades

psicomtricas;

el

manual

proporciona

informacin detallada en siete estudios de validacin llevados a cabo


de manera independiente con respecto al estudio de estandarizacin.
Barnett (1996) ofrece una revisin escptica; Telzrow (1995) se
muestra ms positivo.
Gesell child Development Age Scale (Escala Gesell de Edad del
Desarrollo Infantil, GCDAS; Cassell; 1990). De los 18 meses a loa
10

aos

de

edad;

esta

prueba

intenta

poner

en

trminos

operacionales la teora de etapas del desarrollo infantil de Gesell al


pedirle a la madre, maestro o clnico que respondan a 100 reactivos
de falso-verdadero, apropiados para cada edad, dentro de un conjunto
ms

amplio

de

240

reactivos.

Se

pueden

utilizar

hasta

tres

calificadores para valorar a un nio; los resultados Incluyen una


grfica de la edad cronolgica contra la edad del desarrollo en 10
reas del desarrollo. La GCDAS es una prueba prueba prometedora
que

requiere

de

mayor

investigacin

en

cuanto

cualidades

psicomtricas (Lang. 1996).


En el primer caso se puede asegurar que los resultados de la prueba
son un ndice apropiado del funcionamiento cognitivo; pero en el
segundo, prevalece la incertidumbre falta de receptividad seala una
carencia de habilidad o de cooperacin? Con nios preescolares, el
examinador

requiere

de

una

gran

humildad.

Scarr

(1981)

ha

expresado este sentimiento de la siguiente manera:

25

Cuando se mide el funcionamiento cognitivo de un nio, tambin se


mide la cooperacin, atencin, persistencia, capacidad para estarse
quieto y receptividad social ante una situacin de evaluacin.
El peligro especial en la evaluacin preescolar es que el examinador
puede inferir que una puntuacin baja indica un bajo nivel de
funcionamiento cognitivo cuando, en realidad, el nio tan slo es
incapaz de quedarse quieto, atender, cooperar y as sucesivamente.
La evaluacin preescolar requiere abordarse con un cuidado poco
usual, a fin de evitar las consecuencias negativas de la etiquetacin y
el diagnstico excesivo de padecimientos discapacitantes.
Existen

varias

pruebas

de

inteligencia

de

aplicacin

individual

adecuadas para nios preescolares. Schakel (1986) ha llamado a las


siguientes pruebas como las cuatro grandes:

Escala Wechsler de Inteligencia para los Niveles Preescolar y


Primaria (WPPSI-R)

Escala de Inteligencia Stanford-Binet: Cuarta Edicin (SB :CE)

Batera de Evaluacin Kaufman para Nios (K-ABC)

Escala McCarthy de Aptitudes y Psicomotricidad para Nios (MSCA)

stas son las pruebas de

inteligencia ms comunes en nios

preescolares. La ltima se acerca pidamente a la obsolescencia (se


public en 1972); a menos que se le revise, los psiclogos escolares
pronto comenzarn a hablar de las tres grandes. Por supuesto,
algunos de estos van ms all de la edad preescolar los y llegan hasta
los inicios de la niez. La SB:CE se utiliza tambin con adultos. Se
revisan stas y otra prometedora adicional:

26

Las Diferrential Ability Scales.


ESCALA WECHSLER DE INTELIGENCIA PARA LOS NIVELES
ESCOLARES Y PRIMARIA-REVISADA (WPPSI-R)
El

WPPSI-R

es muy

similar

a su

antecesor,

pero

ofrece

una

actualizacin de normas y aplicacin para un rango ms amplio de


edades de los 3 a los 7 aos, 3 meses (Wechsler, 1989) Adems, se
revisaron varios reactivos obsoletos y parciales y se aadi una
versin de Composicin de objetos a las 11 subpruebas originales. La
confiabilidad y validez del WPPSI-R son muy similares a las de la
versin anterior de esta prueba. Salvia e Ysseldyke (1991) resumen
las confiabilidades de divisin en mitades como sigue: CI Verbal (.86
a .96), CI de Ejecucin (.85 a .93) y Cl Total (.90 a .97). Las
confiabilidades de las subpruebas del WPPSI-R son sustancialmente
ms

dbiles;

sus

interpretaciones

deben

restringirse

las

puntuaciones mixtas de CI. Las normas para el WPPSI-R se basan en


una muestra cuidadosamente estratificada de 1 700 nios y en edad,
sexo, regin geogrfica, origen tnico y educacin y ocupacin de los
padres; su validez se basa, en parte, en su parecido con el WPPSI,
que obtuvo grandes alabanzas de los revisores. Sattler (1988) revis
varias docenas de estudios en apoyo de la validez concurrente y
predictiva del WPPSI, y concluy que la prueba sirve como un
excelente medio de prediccin a largo plazo de la inteligencia y del
desempeo escolar en la adolescencia.
La investigacin inicial con el WPPSI-R confirma la validez predictiva
de este instrumento para el desempeo escolar posterior. Por
ejemplo. Kaplan (1996) determin que los resultados preescolares del
WPPSI-R predicen en gran medida las puntuaciones de rendimiento
escolar de los nios desde el jardn de infantes hasta el tercer grado.
Los resultados con nios en tercer grado se resumen en el cuadro 5
5 y revelan que los CI Verbal y Total constituyeron medios de
27

prediccin mucho ms poderosos del rendimiento posterior que el CI


de Ejecucin.
Las subpruebas del WPPSI-R incluyen las siguientes:
Verbal

Ejecucin

Informacin

Composicin de objetos

Comprensin

Diseos geomtricos

Aritmtica

Diseo con cubos

Vocabulario

Laberintos

Semejanzas

Figuras incompletas

Frases

Casa de los animales

Cuadro 01 Correlaciones entre los Cl preescolares del WPPSI-R


y resultados posteriores en una prueba de rendimiento para 72
nios de tercer grado
Puntuaciones del WPPSI-R
Puntuaciones
del programa
completo de
pruebaIIl

CIV

CIE

CIT

Capacidad verbal

.62*

.24

.52*

Comprensin auditiva

.45*

.02

.30

Comprensin de lectura .48*

.03

.28

Mecnica de la escritura .54*

.16

.42

Proceso de escritura

.45*

.08

.32

Capacidad cuantitativa

.44*

.17

.36

Matemticas

.62*

.34*

.58*

Fuente: Reimpreso con autorizacin de Kaplan, C. (1996). Predictive


vaIidity of te WPPSI-R: a four year follow-up study. Psychology in the
Schools, 33,211-219.

28

Tres de estas 12 subpruebas (Frases, Diseos geomtricos y Casa de


los animales) se encuentran slo en el WPPSI-R y se resumen a
continuacin (las otras nueve subpruebas, comunes en todas las
escalas Wecbsler, se analizan en el Tema 6A: Pruebas individuales de
inteligencia). Frases es una subprueba complementaria en el WPPSIR. sta requiere que el nio repita al pie de la letra una oracin que le
ha ledo en voz alta el examinador. El reactivo ms fcil se encuentra
al nivel de Juan tiene un coche verde, mientras el ms difcil es
mucho ms largo y consta de dos oraciones conectadas como stas:
Este viernes visitaremos la huerta del granjero. Lleva una
moneda para que puedas comprar una calabaza
La subprueba de Diseos geomtricos est formada por 10 diseos incluyendo un crculo, un cuadrado y un rombo- que el nio debe
copiar.

Esta

subprueba

es

una

medida

de

las

capacidades

perceptuales y de organizacin visomotora. Por ltimo, la subprueba


de Casa de los animales requiere que el nio coloque un cilindro de un
color especfico (negro blanco,

azul, amarillo) en un orificio debajo

del animal apropiado (perro, pollo, pez y gato, respectivamente). Hay


25 animales distribuidos en secuencia aleatoria en una matriz de 5 x
5. La puntuacin inicial en esta subprueba es la cantidad de tiempo
requerido para colocar un cilindro bajo cada animal. Los errores se
restan de la puntuacin total. El xito en esta subprueba requiere
capacidad de aprendizaje, destreza manual y atencin sostenida
durante los minutos que se necesitaran para colocar un cilindro
apropiado bajo cada uno de los 25 animales.
La ampliacin de la cobertura de edad hacia un lmite inferior de tres
aos constituye una adicin bien recibida para el WPPSI-R, dado que
la identificacin temprana de las dificultades del desarrollo es esencial
29

para su tratamiento. Tambin, las normas de CI del WPPSI-R se


extendieron hacia abajo hasta llegar a una puntuacin de 41, que se
encuentra aproximadamente a 3.9 desviaciones estndar por debajo
de la media de la poblacin. En especial cuando se le utiliza junto con
una evaluacin de conducta de adaptacin, el WPPSI-R es una
herramienta esencial para el diagnstico del retaso mental de leve a
grave en nios preescolares y en edad escolar temprana. Las normas
de CI para esta prueba tambin se extienden muy por arriba del
rango necesario para la identificacin de inteligencia dotada en la
parte de los entornos escolares. Estos as han hecho que el WPPSI-R
sea muy popular entre los psiclogos escolares y especialistas en
desarrollo temprano.
ESCALA DE INTELIGENCIA STANFORD-BINET CUARTA EDICIN
Con un rango de edades desde los d os aos hasta la edad adulta, la
Escala de Inteligencia Stanford-Binet: Cuarta Edicin (SB:CE) es una
de esas pruebas poco comunes diseadas para utilizarse por igual con
preescolares, adultos (Thomdike, Hagen y Sattler, 1986) el siguiente
captulo sobre pruebas individuales y grupales de inteligencia se
presenta un anlisis
La SB:CE consta de 15 subpruebas, pero no todas se aplican a cada
uno de los gripos por edad. En el cuadro 5-6 se muestran las
subpruebas en general y aquellas que por lo comn se aplican a nios
preescolares (hasta los cinco aos de edad). El lector observar que la
SB:CE produce varias puntuaciones de subprueba, cuatro de rea y
una mixta total, que ya no se denomina CI. Posdesgracia, en el caso
de preescolares no se toma una muestra de la misma profundidad de
las cuatro reas de contenido. El rea de Razonamiento verbal est
buen representada con tres subpruebas, pero la puntuacin de
Santificacin se basa en una sola subprueba. Las otras dos reas
30

(Razonamiento abstracto/visual y Memoria a corto plazo) se basan


slo en los resultados de dos subpruebas. Como se analiza en el
siguiente captulo, Sattler (1998) defiende una solucin de dos
factores para informar las puntuaciones de la SB:CE (Comprensin
Verbal

Razonamiento

no

Verbal/Visualizacin)

que

con

toda

seguridad es el enfoque preferible en el caso de preescolares.


Un aspecto esencial de la SB:CE es que la puntuacin mixta total es
sumamente comparable con otros pilares de la evaluacin preescolar,
como el WPPSI-R y el CISC-III. Por ejemplo, el manual de WPPSI-R
informa de puntuaciones globales similares para 115 nios, de 4 a 7
aos de edad, examinados con ambos instrumentos: CI promedio en
el WPPSI-R de 105.3 contra puntuacin mixta de 107.2 en la SB:CE
(Wechsler, 1989). En un estudio con 30 nios presescolares, el CI
promedio en el WPPSI-R fue de 94.1, mientras la puntuacin mixta de
la SB:CE fue de 95.8 (McCrowell y Tagle, 1994). No obstante, los
componentes verbales
significativa:
Razonamiento

95.5

de

para

verbal

en

las

el
la

dos pruebas

CIV

en

SB:CE.

el

difieren de

WPPSI-R

Rust

manera

101.6

Lindstrom

para

(1996)

encontraron puntuaciones comparables entre la SB:CE y el CISC-III


con 57 voluntarios (de 6 a 17 aos de edad), con puntuaciones totales
que diferan, en promedio, en menos de dos puntos.

31

Cuadro 02. Subpruebas y reas de la Escala de Inteligencia


Stanford-Binet, cuarta edicin
Razonamiento Verbal
Vocabulario*
Comprensin*
Absurdos*
Relaciones Verbales
Razonamiento Abstracto/Visual
Anlisis de Patrones*
Copiado*
Matrices*
Doblado y cortado de papel
Razonamiento Cuantitativo
Cuantiflcacin*
Series de nmeros
Construccin de ecuaciones
Memoria a Corto Plazo
Memoria de cuentas*
Memoria de oraciones*
Memoria de dgitos
Memoria de objetos
* Denota una subprueba que comnmente se emplea con nios
preescolares.
Lavin (1996) tambin inform puntuaciones totales casi idnticas en
estos dos instrumentos para 40 nios con edades de 6 a 16 aos. Sin
embargo, en el examen de nios con problemas identificados del
desarrollo, Lukens y Hurrell (1996) encontraron que las puntuaciones
en el WISC-III eran menores en 29 de 31 casos, lo cual indica que la
SB:CE puede subdiagnosticar el retraso mental. Se puede encontrar
32

un anlisis amplio de la SB:CE en el contexto de la evaluacin


preescolar en Nuttall, Romero y Kalesnik (1992). Laurent, Swerdlik y
Ryburn (1992) proporcionan una resea de la investigacin sobre
validez con la SB:CE.
BATERA DE EVALUACIN KAUFMAN PARA NIOS (K-ABC)
La K-ABC es una medida combinada de inteligencia y rendimiento que
se construy de manera aproximada dentro del esquema terico de la
neuropsicologa moderna (Luria, 1966; Das, Kirby y Jarman, 1979).
Muchas de las subpruebas de esta batera se parecen a pruebas
neuropsicolgicas, las cuales se analizarn con mayor detalle en un
tema posterior; la K-ABC se orienta principalmente hacia la evaluacin
psicoeducativa y la planificacin educativa (Kaufman y Kaufman,
1983); sus defensores afirman que posee mayor relevancia para la
planificacin

psicoeducativa

que

pruebas

tradicionales

como

las

escalas Wechsler y la Stanford-Binet.


La K-ABC est diseada para nios de 2 aos y medio de edad y
consta de 16 subpruebas, de las cuales no se aplican ms de 13 a
cada nio evaluado (figura 55). Diez de las subpruebas producen la
Puntuacin Mixta de Procesamiento Mental, que est normada para
generar el promedio familiar de 100 y desviacin estndar de 15. Las
otras seis componen la Escala de Rendimiento. Las 10 subpruebas de
procesamiento mental se descomponen en dos escalas globales:
Escala de procesamiento simultneo (siete subpruebas) y Escala de
procesamiento secuencial (tres subpruebas).
Un objetivo de la K-ABC consiste en producir puntuaciones que se
traduzcan en intervenciones educativas. Las escalas Secuencial y
Simultnea

se

basan

aproximadamente

en

conceptos

neuropsicolgicos y se supone que reflejan el estilo de solucin de


problemas

de

procesamiento

de

informacin

del

nio.

Las

subpruebas de Procesamiento secuencial requieren de la disposicin


33

en serie o temporal del contenido verbal, numrico o visoperceptual.


Se supone que los nios con puntuaciones altas en esta escala
aprendices secuenciales aprenden mejor al enfrentar pequeas
cantidades de informacin en orden consecutivo, paso por paso, como
en una serie de instrucciones verbales claras. En contraste, las
subpruebas de Procesamiento simultneo requieren que el nio
sintetice y organice el contenido visoperceptual o espacial de manera
inmediata o global. Se supone que los nios con puntuaciones altas en
esta escala aprendices simultneos aprenden mejor a travs de la
integracin y sntesis de muchos trozos relacionados de informacin al
mismo tiempo, como se encuentra n medios visuales (ilustraciones,
mapas o grficas).

Escala de
Procesamiento
Secuencial

Puntuacin
Mixta de
Procesamiento
Mental

Escala de
Procesamiento
Simultneos

Escala de
Rendimiento

Movimientos manuales*
Recuerdo de nmero
Orden de palabras
Movimientos manuales*
Recuerdo de nmero
Orden de palabras
Ventana mgica
Reconocimiento de rostros*
Cierre gestltico
Tringulos*
Analogas con matrices*
Memoria espacial*
Series de fotografas*
Vocabulario expresivo
Rostros y lugares
Aritmtica
Acertijos
Lectura/decodificacin
Lectura/comprensin

Figura 2.1, subpuebas y escalas de la Batra de Evaluacin Kaufman


para nios.
34

Kaufman,

Kaufman

Goldsmith

(1984)

proporcionan

pautas

ejemplos para la enseanza de la lectura, ortografa y aritmtica a


nios con base en las fortalezas secuenciales o simultneas en la KABC. Aunque la teora convincente, la sustentacin para la supuesta
interaccin entre aptitud y tratamiento de la K-ABC es dispar en el
mejor de los casos. por ejemplo, Fisher, Jenkins, Bancroft y Kraft
(1988)

equipararon

estrategias

de

enseanza

con

los

estilos

cognitivos secuencial/simultneo (como se determinan a partir de la


K-ABC) para 57 estudiantes de educacin primaria inscritos en una
clnica de discapacidad para el aprendizaje. Aunque, en general, los
resultados prestaron apoyo a la interaccin predicha entre aptitud y
tratamiento,

los

efectos

fueron

pocos

no

tuvieron

ninguna

importancia prctica.
Ambas escalas de la Puntuacin Mixta de Procesamiento Mental (PPM)
se disearon reducir los efectos de la parcialidad de sexo y raza, y
segn la mayor parte de los informe, los autores de la prueba
tuvieron xito en estos objetivos (Notan, Watlington y Willson, 1989).
Con base en los datos de estandarizacin, Kaufman, Kamphaus y
Kaufman (1985) informaron de diferencias pequeas (del orden de
cinco puntos) entre la PPM de personas de raza blanca y de miembros
de grupos minoritarios en la K-ABC. sta es una diferencia mucho ms
pequea que la que se encuentra por lo comn con pruebas como el
WISC-II y la Stanford-Binet, donde son comunes las diferencias del
orden de 15 puntos de CI a favor de las personas de raza blanca.
Valencia y Rankin (1988) sometieron a 76 nios de raza blanca y 90
mxico-estadounidenses de quinto y sexto grados e informaron que
casi no haba diferencia en la Puntuacin Mixta de Procesamiento
Mental (100 contra 98, respectivamente), aunque se encontr una
gran diferencia en la Escala de rendimiento (103 contra 91). Knight,
Baker y Minder (1990) informan de una diferencia comparable entre la
35

K-ABC y la SB:CE con 30 nios afroestadounidenses, estudiantes de


primaria, que presentaban discapacidad para el aprendizaje (PPM de
83 contra Puntuacin Mixta de 84 en la SB:CE).
En el cuadro 2.1 se describen las escalas y subpruebas de la K-ABC.
Adems de las Escalas, Simultnea, Secuencial y de Rendimiento, se
puede calcular una Escala No Verbal complementaria con seis
subpruebas (de los grupos simultneos y secuencial) que no requieren
de palabras. Las subpruebas de la Escala No Verbal incluyen las
siguientes:
Movimientos manuales.
Reconocimiento de rostros.
Tringulos.
Analogas con matrices.
Memoria espacial.
Series de fotografas.
En el caso de las subpruebas No Verbales, el examinador demuestra
cada tarea mediante ejemplos o mmica. La Escala No Verbal es
apropiada para examinar a nios bilinges o de inmigracin reciente,
cuyas habilidades en el idioma espaol podran mi ser dbiles.
Adems, los nios con deterioro auditivo, trastornos del habla o del
lenguaje pueden evaluarse de manera imparcial con esta escala.
La K-ABC se estandariz con una muestra nacional estratificada de
8000 nios seleccionados de modo cuidadoso para representar os
datos del censo de EUA para 1980 en cuanto a sexo, regin
geogrfica, educacin de los padres, tamao de la comunidad y
categora tnica (raza blanca, afroestadounidenses, hispanos, otros).
Un rasgo poco comn y bienvenido de la muestra de estandarizacin
36

es el nfasis en nios asignados a educacin especial y a programas


para inteligencia dotada y para nios talentosos (aproximadamente
7%

de

la

muestra

normativa).

Por

otra

parte,

las

normas

socioculturales complementarias para raza y educacin de los padres


se

obtuvieron

de

los

resultados

de

prueba

de

469

nios

afroestadounidenses y 119 de raza blanca.


La confiabilidad de la K-ABC es bastante buena en trminos generales,
aunque algunas subpruebas poseen coeficientes de consistencia
interna apenas aceptables, en especial con los individuos ms
jvenes. En el caso de nios preescolares, los valores medios van
desde .72 para Ventana mgica hasta .88 para Recuerdo de nmeros.
En cuanto a los nios en edad escolar, los valores medios van de .71
para Cierre Gestltico a .85 para Analogas con Matrices. Por otro
lado, la confiabilidad de las puntuaciones de Escala y de la puntuacin
mixta es muy fuerte. Por ejemplo, la confiabilidad test-retest de la
Escala de Rendimiento es de .93 para nios preescolares y de .97
para aquellos en edad escolar. La Puntuacin Mixta de Procesamiento
Mental tiene una confiabilidad de .90 con nios preescolares y de .96
con aqullos en edad escolar.
Los estudios sobre la validez de la K-ABC presentan una imagen
heterognea,

con

buen

apoyo

para

la

validez

convergente

de

discriminacin, fuerte confirmacin de la validez relacionada con el


criterio y buena sustentacin para los cambios apropiados a la edad
en las puntuaciones de prueba (pertinente para la validez de
constructo). No obstante, los estudios analtico-factoriales sobre
validez de constructo muestran resultados mixtos y conflictivos.
Kamnphaus,

37

Cuadro 03. Descripcin de las subpruebas de la K-ABC


Escala de Procesamiento Secuencial
Movimientos manuales: el nio debe copiar la secuencia precisa de
golpes en la mesa con el puo palma o lado de la mano ejecutados
por el examinador.
Recuerdo de nmeros: muy similar a la prueba tradicional de
retencin de dgitos, excepto que al examinador se le instruye a no
dejar caer su voz despus de decir el ltimo dgito.
Orden de palabras: mide la capacidad del nio para sealar a
siluetas de objetos comunes en igual orden que los mismos objetos
nombrados por el examinador
Escala de Procesamiento Simultneo
Ventana mgica: requiere que el nio identifique y nombre un
objeto cuya ilustracin se gira detrs de una abertura estrecha, de
modo que slo se expone una fraccin de la ilustracin en algn
momento especifico.
Reconocimiento de rostros: el nio debe prestar una estrecha
atencin a uno o dos rostros en una fotografa mostrada de manera
breve y despus seleccionar el rostro o rostros correctos en una
fotografa de grupo.
Cierre gestltico: el nio debe nombrar o describir de manera
precisa una mancha parcialmente terminada, similar a una mancha de
tinta. Esta subprueba mide la capacidad para llenar mentalmente los
espacios vacos para formar una gestalt.

38

Tringulos: el nio debe ensamblar varios tringulos idnticos de


goma (amarillos en un lado, azules en el otro) para equipararlos con
una ilustracin de un diseo abstracto.
Analogas con matrices:

con

fichas

de

vinilo,

el

nio

debe

seleccionar la ilustracin o diseo que mejor complete una matriz de 5


por 5 cm que expresa una analoga visual.
Memoria

espacial:

el

nio

debe

recordar

la

localizacin

de

ilustraciones ordenadas de manera aleatoria en una pgina.


Series de fotografas: el nio debe ordenar en una secuencia
temporal adecuada una disposicin de fotografas dispuestas de
manera aleatoria. Esta subprueba es similar a Ordenacin de dibujos
en las escalas Wechsler, excepto que la tarea debe resolverse sin
manipulacin fsica, lo cual elimina la tensin innecesaria sobre la
realimentacin visomotora.
Escala de Rendimiento
Vocabulario expresivo: el nio debe nombrar el objeto representado
en una fotografa.
Rostros y lugares: el nio debe nombrar a una persona muy
conocida, personaje ficticio o lugar representado en una fotografa.
Aritmtica: una prueba de habilidades bsicas de clculo y de
capacidades aritmticas relacionadas con la escuela.
Acertijos: el nio debe inferir el nombre de un concepto concreto o
abstracto con base en una lista de sus caractersticas.
39

Lectura/Decodificacin: una prueba de identificacin de letras y de


reconocimiento/pronunciacin de palabras.
Lectura/Comprensin: el nio debe demostrar comprensin de
lectura al seguir instrucciones dadas en oraciones.
Beres, Kaufman y Kaufman (1996) proporciona amplia revisin de,
literalmente, docenas de estudios de validez con la K-ABC.
Las escalas Simultnea y Secuencial muestran el patrn esperado de
correlaciones con los factores simultneo y sucesivo en otras bateras
de prueba (p. ej., Das y Mensink, 1989), lo cual indica buena validez
convergente y de discriminacin para estas escalas globales de la KABC,

Cooley

Ayres

(1985)

encontraron

correlaciones

apropiadamente fuertes entre las puntuaciones de la K-ABC y medidas


de rendimiento (validez convergente) y relaciones apropiadamente
insignificantes entre las puntuaciones de la K-ABC y medidas de
ansiedad en la infancia (validez de discriminacin). Tambin se
encontr un descubrimiento un tanto singular: la Puntuacin Mixta de
Procesamiento Mental de la K-ABC se correlacion en -.51 con la
escala de Hiperactividad de la Achenbach Chil Behavior Checklist
(Lista de Verificacin de Conducta Infantil) (la correlacin es negativa
porque

una

alta

puntuacin

en

Hiperactividad

indica

conducta

disfuncional). Esta lista de verificacin bien validada consiste en


reactivos

que

califican

los

padres

(p.

ej.,

el

nio

no

puede

concentrarse, no puede prestar atencin durante largo tiempo, no es


agradable para otros nios). En apariencia, la K-ABC detecta en cierto
grado

las

capacidades

de

atencin.

Quiz

la

superposicin

es

indirecta, donde la deficiencia en capacidades de atencin conduce a


la reduccin en el logro de las habilidades intelectuales que se miden
con la K-ABC.

40

La validez de esta prueba se sustenta tambin en los 43 estudios


citados

resumidos

en

el

Manual

Interpretativo,

incluyendo

numerosos estudios de correlacin con otras pruebas (Kaufman y


Kaufman, 1983). Estas correlaciones varan de manera amplia, pero
en general dan apoyo a la validez de la K-ABC, al menos en cuanto a
la puntuacin mixta de procesamiento mental. En este sentido, las
conclusiones de Obrzut, Obrzut y Shaw (1984) y de Naglieri (1985)
son

tpicas.

Con

muestras

independientes

de

estudiantes

con

discapacidad para el aprendizaje y con retraso mental educable, estos


dos estudios informaron correlaciones casi idnticas de .80 y .83,
respectivamente, entre el CI del WISC-R y las puntuaciones mixtas de
la K-ABC.
Como recordar el lector del captulo sobre validez, una manera de
demostrar la validez de constructo de una prueba consiste en mostrar
que los cambios relacionados con la edad en las puntuaciones
naturales son regulares, sensatos y consistentes con la teoraReynolds, Willson y Chatman (1984) correlacionaron la edad y las
puntuaciones naturales de la muestra de estandarizacin (N = 2 000)
y de una muestra adicional de personas afroestadounidenses y de
raza blanca (N = 615). Todas las correlaciones entre la edad y las
puntuaciones

naturales

fueron sumamente

significativas. Y

ms

importante an, no ocurrieron diferencias significativas en la magnitud


de estas relaciones en funcin de los grupos por raza o edad, lo cual
sustenta la validez de constructo de la K-ABC como medida de aptitud
y rendimiento asociada con el desarrollo.
Los estudios analtico-factoriales de las dimensiones secuencial y
simultnea en las que se basa la K-ABC han producido resultados
conflictivos (Kamphaus, 1990). En el lado positivo, los autores de la
prueba citan conclusiones tomadas de la muestra de estandarizacin
que parecen confirmar la distincin entre secuencial y simultneo
41

(Kaufman
Naglieri,

Kaufman,

1982).

1983;

Algunos

Kaufman,

estudios

Kaufman,

independientes

Kamphaus
tambin

han

informado de resultados similares (p. ej., McCallum, Karnes y OehlerStinnett, 1985).


Los crticos reconocen que la K-ABC es una buena medida de la
inteligencia general, pero se muestran dudosos acerca de la distincin
entre

procesamiento

simultneo

secuencial

como

base

para

comprender el desempeo en la prueba. Por ejemplo, Strommen


(1988) emprendi un anlisis factorial confirmatorio de la K-ABC con
el propsito especfico de examinar la hiptesis de que los factores
que

componen

la

prueba

slo

se

correlacionan

de

manera

moderada, lo cual constituye una de las afirmaciones clave de los


autores de la prueba (Kaufman y Kaufman, 1983). Este investigador
concluy

que

los

factores

que

subyacen

la

K-ABC

estn

intercorrelacionados de manera sustancial en todos los niveles por


edad, lo cual arroja dudas sobre la existencia independiente de los
procesos secuencial y simultneo en la prueba. Estos constructos
modernos bien pueden resultar vino viejo en pellejos nuevos, nada
ms que una redenominacin de la dicotoma familiar entre formas
sumamente intercorrelacionadas de razonamiento verbal y no verbal.
Para una interpretacin ms positiva de los estudios analticofactoriales de la K-ABC, vase el arttulo de resea de Kamphaus y
colaboradores (1996).
Una segunda crtica tiene que ver con la designacin de las seis
subpruebas como pruebas de rendimiento. Anastasi (1985) seala que
una prueba puede considerarse apropiadamente como prueba de
rendimiento slo cuando se le vincula de manera estrecha con un
contenido educativo especfico. No obstante, los autores de la K-ABC
hicieron esfuerzos especiales para separar las pruebas de rendimiento
42

de cualquier contenido curricular especfico. Estas subpruebas se


parecen ms a las medidas tradicionales de inteligencia que a las de
rendimiento acadmico. De hecho, con base en las cargas factoriales
en el primer factor sin rotacin, muchos investigadores han concluido
que las subpruebas de Rendimiento proporcionan una mejor medida
de la inteligencia general que aqullas de procesamiento mental!
(Mine, Guilmette, Snyder y Castellanos, 1992). Esta controversia se
basa, en parte, en posturas filosficas divergentes en cuanto a la
naturaleza de la inteligencia y no es probable que se resuelva a travs
de la investigacin (Reynolds, l994b).
Otra preocupacin es que la K-ABC no detecta de manera suficiente
las

habilidades

verbales

(Sattler,

1988).

pesar

de

estas

controversias, la K-ABC ofrece un enfoque nico e interesante de la


evaluacin de la inteligencia infantil y posee normas muy elevadas de
calidad tcnica. En tanto los examinadores incluyan las subpruebas de
Rendimiento

que

detectan

la

inteligencia

general

en

grado

sustancial la K-ABC puede proporcionar un enfoque nuevo y valioso


de la evaluacin psicoeducativa.
ESCALAS MCCARTHY DE APTITUDES Y PSICOMOTRICIDAD
PARA NIOS
Las Escalas McCarthy de Aptitudes y Psicomotricidad para Nios
constituyen una prueba de inteligencia de aplicacin individual,
diseada para nios entre los 2 aos y medio y los 8 aos y medio de
edad (McCarthy, 1972). La prueba consiste en 18 subpruebas
independientes, como se listan en el cuadro 5-8. Estas contribuyen a
las puntuaciones en cinco escalas, cada una se obtiene de 3 a 7
subpruebas: Verbal, Perceptual-Ejecucin, Cuantitativa, Memoria y
Motora. Adems, se puede calcular un ndice Cognitivo General con
media de 100 y DE de 16 a partir de 15 subpruebas. La prueba se
43

dise para proporcionar un mejor entendimiento tanto de los nios


normales

como

aprendizaje.

de

aquellos

McCarthy

que

(1972)

tienen
enfatiz

discapacidad
las

para

el

consideraciones

funcionales, como el deseo de identificar las debilidades cognitivas


clnica y educativamente relacionadas, como el principal criterio para
la seleccin de reactivos y para los agrupamientos de las subpruebas
en las Escalas McCrthy.
La

muestra

de

estandarizacin

de

1032

nios

consisti

de

aproximadamente 100 individuos en cada grupo de edad, con


incrementos de medio ao desde los 2 aos y medio hasta los 5 aos
y medio de edad e incrementos de un ao desde los 5 aos y medio
hasta los 8 aos y medio. En cada nivel de edad, la muestra se
estratific de manera aproximada en las siguientes variables, de
acuerdo con el censo de Poblacin de EUA para 1970: sexo, raza
(blanca-no blanca), regin geogrfica, nivel ocupacional del padre y
residencia urbana-rural. Se excluy a los nios con problemas
mentales o emocionales graves y se incluy a individuos bilinges slo
si podan comprender el Ingls. Por supuesto, un problema potencial
con las escalas McCarthy es que los datos normativos, obtenidos a
inicios del decenio de 1970, son bastante obsoletos.
Los datos de confiabilidad para las escalas McCarthy presentan una
imagen heterognea. El ndice Cognitivo General tiene un desempeo
adecuado, con confiabilidades de divisin en mitades que promedian
cerca de .93 y coeficientes test-retest a un mes que tienen un
promedio aproximado de .90. Las confiabilidades de divisin en
mitades para las cinco escalas van de .79 a .88, mientras los
coeficientes test-retest van de .69 a .89. Las confiabilidades para las
18 subpruebas individuales son sustancialmente menores, de modo
que se advierte a los examinadores que no coloquen demasiado
nfasis en los patrones y diferencias de subprueba.

44

Cuadro 04. Subpruebas y escalas de las Escalas McCarthy de


Aptitudes y Psicomotricidad para Nios
Escalas
Subpruebas

Ver

Ejecu

Cuant

Mem

bal

cin

itativ

oria

perce

Motora

cognitiv
o

ptual
Memoria

ndice

general
Mem

ICG

pictrica
Conocimiento

ICG

de palabras
Memoria

Mem

ICG

verbal
Fluidez verbal

ICG

Analogas

ICG

opuestas
P
Construccin

ICG

con cubos
Solucin

de

Mem

ICG

rompecabeza
s
Secuencia

ICG

ICG

ICG

rtmica
Orientacin
derecha Izquierda
Dibujo de un
diseo
Dibujo de un

Mot

ICG

Mot

ICG

nio
Agrupamiento
conceptual
45

Preguntas

ICG

con nmeros
Memoria

Mem

ICG

numrica
Conteo

ICG

clasificacin
Coordinacin

Mot

de piernas
Coordinacin

Mot

de brazos
Accin

Mot

imitativa

Por desgracia, no se ha confirmado la derivacin con base clnica de


las cinco escalas McCarthy a travs de estudios analticos-factoriales,
lo cual deja en duda la validez de este instrumento. Aunque los cinco
factores (que corresponden a las cinco escalas) se encontraron en
todos lo grupos por edad dentro de la muestra de estandarizacin
(Kaufman, 1975), estudios posteriores no han reproducido estas
conclusiones originales. Por ejemplo, Foros-Santacana y GmezBenito (1990) encontraron cinco factores en una muestra de 141
nios de 4 y 5 aos de edad, pero stos no corresponden a la
clasificacin propuesta por McCarthy. Otros investigadores informan
de casos similares en los que no se pudo corroborar la distribucin
original de las subpruebas. Por ejemplo, Keith y Bolen (1980)
encontraron slo tres factores

en una muestra de 300 nios con

edades de 6 a 8 aos y medio de edad: cognitivo general, verbal y


motor.

46

La confusin acerca de la estructura factorial de las escalas McCarthy


indica que los examinadores deben ser precavidos en el anlisis de un
perfil que se base en las cinco escalas antes mencionadas (Verbal,
Perceptual-Ejecucin, Cuantitativa, Memoria y Motora). En muchas
muestras y para algunos grupos por edad, las escalas pueden ser
mejores como medidas de la capacidad cognitiva general que de las
capacidades especficas designadas por los nombres de las escalas
(Sattler, 1988).
En el lado positivo, las escalas McCarthy funcionan muy bien como
medios de prediccin de la preparacin para la escuela y del
rendimiento escolar posterior en el caso de nios en el jardn de
infantes. Massoth y Levenson (1982) sometieron a prueba a 33 nios
con la escala McCarthy en el periodo de otoo del jardn de infantes y
correlacionaron estas puntuaciones con los resultados de la prueba de
preparacin para la lectura aplicada un alo despus y tambin con los
niveles de rendimiento a la terminacin del primer grado de primaria.
Curiosamente, las correlaciones ms fuertes se obtuvieron con la
Escala Cuantitativa, mientras la Escala Verbal tuvo un resultado
deficiente como medio de prediccin de la preparacin para la escuela
o

del

rendimiento

en

lectura

(cuadro

04).

Las

capacidades

perceptuales y analticas que miden las escalas McCarthy parecen ser


mejores medios de prediccin de la preparacin y del rendimiento en
lectura que las tareas verbales. Un seguimiento a los seis aos con los
mismos individuos revel correlaciones sorprendentemente altas entre
las

escalas

McCarthy

aplicadas

en

el

jardn

de

infantes

el

rendimiento escolar en el sexto grado (Massoth, 1985). La Escala


Cuantitativa mostr la correlacin ms fuerte con las calificaciones del
curso (r = .60), mientras que la Escala Verbal constituy un medio de
prediccin dbil (r = .40). La Escala Cuantitativa parecera ser una
excelente prueba de deteccin para nios preescolares.
47

En resumen, las escalas McCarthy proporcionan un ndice valioso y


adecuado

para

la prediccin

del

funcionamiento

intelectual,

en

especial con nios en el rango de 5 a 6 aos de edad. El instrumento


tambin es una excelente herramienta para la evaluacin de la
inteligencia general, aunque puede subestimar el funcionamiento de
preescolares, nios con discapacidad para el aprendizaje y con retraso
mental. En la actualidad, las normas para la prueba son sumamente
obsoletas. A pesar de esto, las puntuaciones generales en la escala
McCarthy corresponden de manera estrecha a los CI Totales del
WPPSI-R (Karr, Carvajal, Elser y Bays, 1993). Aun as, las escalas
McCarthy necesitan revisin y reestandarizacin.
Cuadro 05. Correlaciones entre las puntuaciones de la Escala
McCarth y la preparacin, y el rendimiento en lectura de 33
nios en el jardn de infantes
Escala

Preparacin

Prueba

McCarthy

para la Lectura

Metropolitan de

de Macmillan

Rendimiento

.33

.16

.39*

.37*

Cuantitativa

.64*

.50**

General Cognitiva

.53*

.39*

Memoria

.39*

.28

.31

.35*

Verbal
EjecucinPerceptual

Motora

Fuente: Adaptado con autorizacin de Massoth, N.A y Levenson, R. L.


(1982). The McCarthy ScaIes of Childrens Abilities as a predictor of
reading

readiness and

Schools, 19,239-296.

48

reading achievement.

Psychology

in

the

ESCALAS DE CAPACIDAD DIFERENCIAL


Las Differential Abiltty Scales (DAS) son una adicin reciente a la
evaluacin individual de la inteligencia que es digna de un breve
comentario (Elliott, 1990, 1997). La DAS cubre un rango de edades de
los 2 aos y medio a lo 18 aos en tres bateras superpuestas:
preescolar inferior (edades de 2:6 a 3:5), preescolar superior (edades
de de 3:6 a 5:11) y edad escolar (edades de 6:0 a 17:11). Aqu se
presenta la batera pre-escolar superior.
Las subpruebas de la batera preescolar incluyen

subpruebas

esenciales y diagnsticas. Las primeras estn altamente saturadas


del factor g y se utilizan para obtener dos puntuaciones de rea
(Verbal y No Verbal) y una puntuacin mixta global conocida como
Capacidad Conceptual General (CCCI). Las puntuaciones de rea y la
CCG se basan en una media de 100 y desviacin estndar de 15. Las
subpruebas diagnsticas miden memoria a corto plazo y velocidad de
procesamiento de informacin. Se les utiliza slo para el anlisis
clnico. Las subpruebas diagnsticas dependen menos del factor g y,
por tanto, no figuran en la puntuacin mixta global. Las subpruebas
de la DAS se describen en el cuadro 5.
La confiabilidad de las puntuaciones de la DAS es encomiable para un
instrumento que se utiliza en el nivel preescolar. En el caso de
preescolares, se informa que la confiabilidad de la CCG es de .90 a
.94. Para preescolares mayores (3 aos y medio a 6 aos de edad) las
puntuaciones

agrupadas

Verbales

No

Verbales

muestran

confiabilidades de-SS y .89, respectivamente.

49

Cuadro 06. Subpruebas de la Batera Preescoiar DAS


Subpruebas

Capacidades Medidas

Contribucin a la
puntuacin mixta

Subpruebas

Lenguaje

receptivo,

esenciales

comprensin

Verbal CCG

de

instrucciones verbales
Vocabulario de

Lenguaje

expresivo,

nombres

conocimiento de nombres

semejanzas

Razonamiento

con dibujos

equiparacin

no

verbal,

Verbal CCG
No verbal, CCG

de

ilustraciones

con

temas

no

verbal,

comunes
Construccin

Visualizacin

de patrones

espacial,

con

cubos

No verbal, CCG

cuadrados de colores
Copiado

Copiado

de

coordinacin

diseos,

motora

No verbal, CCG

fina;

equiparacin visoespacial
Primeros

Conocimiento de conceptos

conceptos de

de nmero y cuantitativos

CCG

nmero
subpruebas
diagnsticas
Construccin

Orientacin

de cubos

equiparacin

espacial,

n/a

visoper-

ceptual con cubos


Equiparacin

Relaciones

espaciales,

de formas

discriminacin

visual

parecidas a

formas similares

n/a

de

letras
Recuerdo de

Memoria auditiva a corto

dgitos

plazo

50

de

secuencias

n/a

numricas
Recuerdo de

Aprendizaje a corto plazo y

objetos

recuerdo

verbal

n/a

de

ilustraciones
Reconocimiento

Memoria

de dibujos

plazo,

visual

corto

reconocimiento

n/a

de

objetos familiares

Cuadro 07. Correlaciones entre las puntuaciones mixtas de la


DAS y el WISC-III de 53 nios con discapacidad para el
aprendizaje
Puntuacin mixta de

Puntuacin mixta

la DAS

del WISC III


CIV

CIE

CIT

DAS
Med

DE

ia
Verbal

.77

.52

.72

90.2

12.0

Razonamiento verbal

.55

.65

.67

83.5

12.5

Espacial

.50

.67

.64

93.6

17.0

CCG

.68

.71

.78

87.2

14.8

Media del WISC-III

89.

93.

89.7

13.

14.

DE del WISC-III

13.2

Fuente: Reimpreso con autorizacin de Dumont, R., Cruce, C., Price,


L. Whelley, P. (1996). The relationaship between the Differential
Ability Scales (DAS) and the wechster Intelligence Scale for ChildrenThird

Edition

(WISC-III)

for

students

with

learnin

disabilities.

Psychology in the Schools, 33, 203-209.

51

Los estudios sobre validez concurrente prestan un fuerte apoyo a la


DAS, con correlaciones en los rangos de .70 y .80 con otras
correlaciones en los rangos de

.70

y .80

con otras medidas

preescolares de la inteligencia y rendimiento (Elliott, 1990ab). Un


estudio de Dumont, Cruse, Price y Whelley (1996) provee una muy
fuerte sustentacin para la validez de la DAS al proporcionar un
patrn confirmatorio de las correlaciones entre este instrumento y el
WISC-III con 53 nios en los que se haba identificado discapacidad
para el aprendizaje. Los resultados se resumen el cuadro 5-11 y
muestran que los componentes similares se correlacionan en mayor
medida que aquellos diferentes en las dos pruebas. Tambin, dicho
cuadro revela

que las puntuaciones totales con muy similares, en

promedio, entre la DAS (CCG media de 87.2) y el WISC-III (CI medio


89.7). Elliott (1997) describe estudios adicionales de validez para este
magnfico instrumento.
UTILIDAD PRCTICA DE LA EVALUACIN DE LACTANTES Y
PREESCOLARES
En general, la historia de la evaluacin infantil ha mostrado una y
otras vez que las puntuaciones de prueba que se obtienen en los
primeros uno o dos aos de vida muestran una validez predictiva
mnima. Por ejemplo, en su resea acerca de las pruebas de
inteligencia con lactantes. Goodman (1990) concluy.
Si el propsito exitoso de la inteligencia de adolescentes y adultos a
partir de las puntuaciones en la infancia temprana es uno de los
principales logros de la psicologa aplicada, entonces la incapacidad
para predecir la inteligencia de a primera infancia a partir de la
lactancia puede considerarse como uno de sus mayores fracasos.
Dado el psimo historial de fracasos repetidos en cuanto a validez
predictiva, debera hacerse una difcil pregunta: Cul es el propsito
y utilidad prctica de la evaluacin de lactantes? De hecho, las
52

pruebas con stos tienen una funcin importante, pero limitada, que
representar. Se regresar a esta cuestin despus de revisar los
estudios predictivos.
VALIDEZ PREDICTIVA DE LAS PRUEBAS CON LACTANTES Y
PREESCOLARES
Cuando se trata de muestras heterogneas de nios normales, el
resultado general es que las puntuaciones de pruebas con lactantes se
correlacionan en sentido positivo, pero de modo poco impresionante,
con las puntuaciones de prueba en la infancia (Goodmena, 1990;
McCall, 1979). Unos cuantos estudios muestran un tono ms optimista
(p. ej., Wilson, 1983), pero la mayora de los investigadores,
concuerda con la conclusin de McCall (1976):
En trminos generales, esencialmente no existe correlacin entre el
desempeo durante los primeros seis meses de vida y la puntuacin
de CI despus de los cinco aos de edad; las correlacione se colocan
de manera predominante en el nivel de 0.20 para las evaluaciones
realizadas entre los 7 y 18 meses de vida cuando se trata de predecir
el CI en el periodo de 5 a 18 aos de edad, y no es sino hasta los 19 a
30 meses que la prueba con lactantes pronostica el CI posterior en el
rango de 0.40 a 0.55.
McCall (1979) volvi a confirmar su conclusin original en una resea
posterior que se ha resumido aqu. El lector observar que se ha
resumido aqu. El lector observar en el cuatro 7 que las correlaciones
entre las puntuaciones de pruebas con lactantes y con nios en edad
escolar no superar al .40 hasta que los individuos tienen, cuando
menos, 19 meses de edad en la prueba inicial.

53

Cuadro 08. Resumen de correlaciones entre puntuaciones de


pruebas de inteligencia para lactantes y nios en individuos
normales
Edad de la prueba

Edad de prueba en la

inicial

(ao)

en

la

lactancia (meses)

infancia

3-4

5-7

8-18

1-6

.21

.09

.06

7-12

.32

.32

.26

13-18

.50

.50

.32

19-30

.59

.59

.49

Fuente: Adaptado con autorizacin de McCall, R. B. (1979). The


development of intellectual functioning in infancy and the prediction of
later IQ. En J.D. Osofsky (Ed.), Handbook of infant development.
Nueva York: John Wiley.
Las conclusiones con pruebas para preescolares tienen un carcter un
tanto ms positivo. La correlacin entre los resultados de pruebas
preescolares y el CI posterior es, por lo comn, fuerte, significativa y
representativa. La manera ms sencilla de investigar esta cuestin
consiste en medir la estabilidad de los resultados de CI en estudios
longitudinales. En el cuadro 8 se resume la estabilidad de las
puntuaciones de CI de nios en la Stanford-Binet de una edad a otra.
Estos datos provienen del Estudio Longitudinal Fels, una de las
primeras investigaciones de seguimiento del desarrollo intelectual y
emocional de nios (Sontag, Baker y Nelson, 1958) que se considera
clsica. La correlacin ms bajo en este cuadro es .43 y se encuentra
entre el CI evaluado a los cuatro aos y de nuevo a los 12 aos de
edad. Lo que se destaca del cuadro es la fortaleza del vnculo entre el
CI en la edad preescolar y en la infancia posterior. Entre mayor sea el
nio cuando se le somete a prueba por primera vez, ms fuerte ser
la relacin con el CI posterior De hecho, los resultados sugieren que,
54

en promedio, el CI se vuelve razonablemente estable hacia los ocho


aos de edad.
Cuadro 09. Estabilidad del CI de los 3 a los 12 aos de edad
Edad
de la

Edad de la repeticin de la prueba


4

10

11

12

.83

.72

.73

.64

.60

.63

.54

.51

.46

.80

.85

.70

.63

.66

.55

.50

.43

.87

.83

.79

.80

.70

.63

.62

.83

.79

.81

.72

.67

.67

.91

.83

.82

.72

.73

.92

.90

.82

.83

.90

.90

.81

.90

.88

prueba
inicial
3
4
5
6
7
8
9
10
11

.90

Fuente: Adaptado con autorizacin de Sontag, L.W., Baker, C. y


Nelson V. (1958). Mental growth and personality development: A
longitudinal study. Monographs of the Society for Research in Chile
Development, 23, (No 68. completo). Copyright de The Society for
Research in Child Development, Inc.
De manera colectiva, estas conclusiones confirman que, en general,
las pruebas con lactantes tienen un valor pronstico deficiente,
mientras

que

aquellas

con

preescolares

tienen

un

desempeo

moderado en la prediccin de la inteligencia posterior Esto conduce a


la pregunta planteada al inicio de esta seccin: Cul es el propsito y
utilidad prctica de la evaluacin de lactantes?

55

UTILIDAD PRACTICA DE LAS ESCALAS BAYLEY-lI Y DE OTRAS


ESCALAS PARA LACTANTES
El empleo ms importante y justificable de las pruebas con lactantes
es la deteccin de discapacidades del desarrollo. Aunque las pruebas
existentes para la etapa de la lactancia son deficientes como medios
de prediccin de la inteligencia en la infancia, una excepcin a esta
regla se encuentra en el caso de lactantes que obtienen una
puntuacin

muy

baja

en

pruebas

como

la

Bayley-ll

otros

instrumentos de deteccin. Por ejemplo, los lactantes que tienen


puntuaciones a dos desviaciones estndar por debajo de la media en
la escala Bayley, en particular en la Escala Mental, tienen una elevada
probabilidad de obtener despus en su vida resultados de prueba en
os rangos de retraso mental (Self y Horowitz, 1979; Goodman,
Malizia, Durieux -Smith, MacMurray y Bernard, 1990).
Con nios en situacin de riesgo, la correlacin entre-las puntuaciones
de prueba en la lactancia y el CI posterior en la niez es mucho ms
fuerte que para las muestras de nios normales. McCall (1983)
determin que la correlacin mediana entre las puntuaciones de
prueba en la lactancia y el CI en la infancia en un seguimiento a siete
aos era un robusto .48. La conclusin ms consistente es que una
puntuacin muy baja en una prueba para lactantes dos desviaciones
estndar por debajo de la media o ms baja predice de manera
precisa un CI bajo en la infancia (Frankenburg, 1 985). Por ejemplo,
los estudios con la Denver Developmental Screening Test-Revised
(Prueba

Denver

de

Deteccin

del

DesarrolloRevisada;

desde

entonces publicada como DenverII) revel una tasa falsa positiva de


slo 5 a 11%, lo cual significa que los lactantes y preescolares
identificados

como

nios

en

riesgo

pocas

veces

lograban

un

funcionamiento en el rango normal. Los estudios con las escalas


Bayley tambin se conforman a este patrn (p. ej., VandrVeer y
Schweid, 1974).
56

NUEVOS ENFOQUES DE LA EVALUACIN CON LACTANTES


Lewis ha afirmado que las pruebas tradicionales para lactantes pasan
por alto las conductas iniciales de procesamiento de informacin,
como la memoria de reconocimiento y la atencin hacia el ambiente,
que podran predecir mejor la funcin cognitiva en la infancia (Lewis y
Sullivan, 1985). En un estudio, la simple habituacin visual a un
estmulo novedoso (medida por la duracin de la fijacin), evaluada a
los tres meses de edad, se correlacion en .61 con la puntuacin
obtenida en la Escala Mental de las escalas Bayley a los 24 meses de
edad (Lewis y Brooks-Gunn, 1981). Con un paradigma similar, Fagan
ha informado de resultados comparables (Fagan, 1984; Fagan y
Shepherd, 1986). Por ejemplo, en un estudio, este investigador
someti a prueba con el mtodo todo de habituacin la memoria de
reconocimiento de lactantes a las edades de 4 a 7 meses (Fagan y
McGrath, 1981). En este estudio, los lactantes observaron primero
una fotografa del rostro de un beb durante un periodo corto y
despus se les mostr la misma fotografa junto con una desconocida
(p. ej., la imagen de un hombre calvo). Los investigadores llevaron un
registro cuidadoso de cul era la fotografa que los lactantes miraban
ms;

la

lgica

detrs

del

procedimiento

es

sencilla:

Mirar

principalmente la nueva fotografa significa que el lactante reconoce la


anterior; es decir, un lactante con buena memoria de reconocimiento
prefiere mirar algo nuevo. Por tanto, la preferencia por la novedad como se mide a travs del tiempo de fijacin visual en la nueva
imagen- se vuelve un ndice de la memoria inicial de reconocimiento.
Aos

despus,

los

investigadores

aplicaron

la

Peabody

Picture

Vocabulary Test (Prueba Peabody de Vocabulario con Figura; PTB)


para estimar la inteligencia en la infancia temprana. Las puntuaciones
de memoria de reconocimiento en la lactancia y las puntuaciones en la
PPVT en la infancia temprana se correlacionaron en .37 a los cuatro
aos de edad y en .57 a los siete. Es probable que estas correlaciones
57

subestimen la validez predictiva de las pruebas de memoria para


lactantes, en el sentido de que el ndice de memoria en la lactancia
fue un procedimiento poco confiable basado en un pequeo nmero
de reactivos de prueba. Lo que es ms, los investigadores evaluaron a
lactantes normales, lo cual diminuy las correlaciones entre el medio
de prediccin y el criterio.
Las medidas cognitivas para lactantes representan una gran promesa
como medios de prediccin de la inteligencia en la infancia (Bornstein,
1994; Fagan y Haiken-Vasen, 1997). En los siguientes aos se podra
ser testigo de surgimiento de tipos completamente nuevos de
instrumentos de evaluacin para lactantes que se basen en la
medicin de la memoria temprana, habituacin y capacidades de
atencin, en lugar de las capacidades sensoriomotoras. Un primer
paso en esta direccin es la Fagans Test of lnfant Intelligence (Prueba
Fagan de Inteligencia para Lactantes; Fagan y Shepherd, 1986), que
es un instrumento sencillo basado en los mtodos antes descritos para
la medicin de la preferencia por la novedad y la memoria de
reconocimiento de los lactantes. Esta prueba produce una puntuacin
mixta que se basa en la preferencia por la novedad -como se mide a
travs

del

promediada
concordancia

tiempo
en

de

varios

fijacin

visual

ensayos.

intercalificadores

El

muy

en

una

nueva

procedimiento
alta

(QNeill,

imagen

muestra

una

Jacobson

Jacobson, 1994).
Los estudios iniciales sobre la validez de la Fagans Ten of Infant
Intelligence (FTII) como medio de prediccin de la inteligencia en la
infancia han obtenido resultados mixtos. En una muestra de 200
lactantes, las puntuaciones de la FTII obtenidas entre los 7 y 9 meses
de edad se correlacionaron slo en .32 con el CI de la Stanford-Binet
a la edad de tres aos (DiLalla, Thompson, Plomin y colaboradores,
58

1990). En otro estudio reciente, las correlaciones globales entre las


puntuaciones de la F1II, obtenidas de los 7 a los 9 meses de edad, y
el CI del WPPSI-R a los cinco aos de edad, se colocaron alrededor del
.2 en dos muestras no-megas de nios sanos (Andersson, 1996).
Estas correlaciones no prestan apoyo al empleo de la prueba como
herramienta de deteccin en poblaciones que no se consideren en
riesgo. Sin embargo, la prueba puede funcionar mejor si se le utiliza
con lactantes en riesgo. De todas maneras, se requiere mayor
investigacin antes de abandonar las medidas tradicionales para
lactantes en favor de la prueba Fagan y otros mtodos similares.

59

RESPONDA SEGN CORRESPONDA:


1.-

Los inventarios Gesell del desarrollo proporcionan un


procedimiento estandarizado para la obsrvacion y valoracin de
los logros en el desarrollo del nio en cinco areasw especificas:
a.b.c.d.e.-

2.-

El rango de edades del Inventario Gesell del desarrollo es del


nacimiento hasta los 60 meses
V( )

3.-

F( )

El problema basico del inventario Gesell reside en la falta de


atencin a los criterios formales de confiabilidad y validez
V( )

F( )

4.- Las escalas ordinales del desarrollo psicolgica constan de cinco


escalas las cuales son:
a.b.c.d.e.5.- Siendo la evaluacin de los lactantes un aspecto muy impotante
no es difcil pese a que esta poblacin no sigue las instrucciones
y no puede verbalizar lo que sabe.
V( )
60

F( )

PRUEBAS INDIVIDUALES
DE INTELIGENCIA
Introduccin:
El examen de la inteligencia es uno de los principales logros de la
psicologa de este siglo. En respuesta al xito de las escalas BidetSimon a principios del siglo XX, los psiclogos desarrollaron y
depuraron docenas de pruebas individuales de inteligencia diseadas
con base en este instrumento innovador. Tambin se observ un gran
crecimiento en las pruebas grupales de indigencia, fomentadas por la
entusiasta aceptacin de las pruebas Army Alfa y Beta durante y
despus de la primera Guerra Mundial. Slo con algunas excepciones,
las pruebas actuales de inteligencia, tanto individuales sobresalientes
y se termina el captulo con una resea de las pruebas grupales de
inteligencia en el Tema 6B

61

Aunque esta obra dedica tres captulos completos al fascinante y


emocional tema del examen de la inteligencia, no se afirma que la
cobertura sea exhaustiva. Un anlisis completo de las pruebas de
inteligencia se encuentra simplemente ms all del campo de accin
de sta o cualquier otra referencia bsica. Casi cada mes aparecen
pruebas nuevas y revisadas, y cada ao se publican miles de
novedosos descubrimientos de investigacin. Aqu se resean las
pruebas ms utilizadas o que ilustran avances interesantes en la
teora o el mtodo. Los lectores pueden encontrar informacin acerca
de pruebas adicionales en la serie del Mental Measurements Yearbook,
que ahora publica cada 3 o 4 aos el Buros Institute (p.ej., Mitchell,
1985; Conoley e Impara, 1995; Conoley y Kramer, 1989, 1992). La
Encyclopedia of Human Intelligence (Stemberg, 1994) tambin es una
buena fuente de informacin acerca de las pruebas individuales y
grupales de inteligencia.

ORIENTACIN

HACIA

LAS

PRUEBAS

INDIVIDUALES

DE

INTELIGENCIA
Las pruebas individuales de inteligencia revisadas en este tema
incluyen las siguientes:

Escala Wechsler de inteligencia para adultos-II! (WAIS-R)

Escala Wechsler de inteligencia para el nivel escolar-II! (WISC-III)

Prueba de inteligencia Stanford-Binet: Cuarta Edicin (SB:CE)

Detroit Ten of Learning Aptitude-4 (DTLA-4; Prueba Detroit de


Aptitud para el Aprendizaje)

Test Breve de Inteligencia de Kaufman (K-B rl)

Otro instrumento prometedor que no se revisa es Kaufman Adolescent


and Adult Intelligence Test (KAIT; Prueba Kaufman de Inteligencia
para Adolescentes y Adultos). Publicada en 1992, la KAIT ha llegado
62

recientemente al es-cenado de las pruebas (Dumont y Hagberg, 1994;


Shaugnessy y More, 1994). Kaufman y Kaufman (1997) enumeran
varias

ventajas

de

la

KAIT,

incluyendo

su

fundamentacin

psicomtrica en la distincin G-G, propuesta por John Hom y sus


seguidores. La KAIT tambin es atractiva por su brevedad: la prueba
proporciona ndices sumamente confiables de inteligencia en dos
terceras panes del tiempo que se requiere para la mayor parte de las
bateras. Junto con las pruebas preescolares presentadas en tema
anterior, es probable que los instrumentos antes listados expliquen 98
% de las evaluaciones intelectuales realizadas en EUA.
Las escalas Wechsler han dominado las pruebas de inteligencia en
aos recientes, pero de ninguna manera son las nicas opciones
viabIes de evaluacin individual. Muchos otros instrumentos miden
igualmente bien la inteligencia general incluso algunos diran que
mejor. Considrense las implicaciones de la siguiente observacin,
ahora familiar, de que en muestras grandes y heterogneas, las
puntuaciones en cualesquiera dos instrumentos establecidos (p. ej.,
escalas

Wechsler,

Stanford-Binet,

McCarthy,

Kaufman,

etc.)

se

correlacionan por lo comn de 0.80 a 0.90. Con frecuencia, la


correlacin entre dos instrumentos establecidos es casi tan alta como
la correlacin test-retest para cualquier instrumento por s solo.
Cuando el propsito es obtener una puntuacin global, parecera que
cualquier prueba de inteligencia establecida y con normas mas
adecuadas sera suficiente.
Pero obtener una puntuacin total no es la nica meta de la
evaluacin. Adems, por lo general, el examinador desea comprender
el funcionamiento intelectual del individuo. Para este propsito, el CI
total es importante, pero existen casos donde la puntuacin global
puede ser irrelevante o incluso engaosa. Para comprender el
63

funcionamiento intelectual de alguien, el examinador tambin debera


revisar las puntuaciones de subprueba en bsqueda de hiptesis que
podran explicar el funcionamiento nico de ese individuo. Por
supuesto, los examinadores necesitan emprender de manera cauta el
anlisis de subpruebas, con hallazgos basados en la investigacin
acerca de la naturaleza y
subpruebas en

significado de la dispersin de las

el caso de la prueba utilizada (Gregory, 1994b;

McLean, Kaufman y Reynolds, 1989; ott, Fantuzo y Glutting, 1990).


Si

el

objetivo

del

examinador

consiste

en

comprender

el

funcionamiento intelectual y no slo determinar una puntuacin total,


las diferencias entre pruebas se vuelven bastante reales. Todo
instrumento

aborda

la

perspectiva

diferente

medicin
y

de

produce

la
un

inteligencia
conjunto

desde

distintivo

una
de

puntuaciones de subprueba. Adems, una prueba adecuada para un


especfico, podra tener un desempeo totalmente inadecuado en otro
contexto. Por ejemplo, el WAIS-R tiene un desempeo admirable en el
examen del retraso mental leve, pero contiene muy pocos reactivos
simples para la evaluacin de personas con discapacidades del
desarrollo de moderadas a graves.
Un axioma central de la evaluacin es que la eleccin de un
instrumento de prueba debe basarse en el conocimiento de sus
fortalezas

debilidades,

segn

conciernen

la

pregunta

de

referencia. Dicho de manera sencilla, el examinador hbil no depende


a ciegas de una sola prueba para todos los casos que se le refieren!
En vez de ello, elige de manera flexible uno o ms instrumentos,
segn las necesidades de evaluacin que percibe en el individuo a
examinar. Cada una de las pruebas que se analizan en este tema
tienen sus mritos especiales y tambin particulares. El usuario debe
conocer estas facetas a fin de elegir el instrumento ms adecuado
para cada referencia nica.
64

ESCALAS WECHSLER DE INTELIGENCIA


En el decenio de 1930, David Wechsler, un psiclogo de Bellevue
Hospital

de

la

ciudad

de

Nueva

York,

concibi

una

serie

de

instrumentos de gran sencillez que finalmente definieron las pruebas


de inteligencia desde mediados hasta finales del siglo XX. Su
influencia sobre el examen de la inteligencia se ve superada slo por
las contribuciones innovadoras de Binet y Simon. Es adecuado
comenzar el estudio de las pruebas individuales con un resumen de la
tradicin de Wechsler, seguido de un anlisis de los instrumentos en
si.
ORGENES DE LAS PRUEBAS WECHSLER
Wechsler comenz a trabajar en su primera prueba en 1932,
buscando disear un instrumento adecuado para examinar a los
diversos pacientes que se referan a la seccin psiquitrica del
Bellevue Hospital en Nueva York (Wechsler, 1932). Posteriormente, al
describir el desarrollo de su primera prueba, escribi que nuestra
meta no era producir un conjunto de pruebas totalmente novedosas,
sino seleccionar, de cualquier fuente disponible, una combinacin de
ellas que satisfaciera los requisitos de una escala eficaz para adultos
(Wechsler, 1939). De hecho, el contenido de sus escalas se inspir en
gran medida en las pruebas Army Alfa y Beta (Frank, 1983). Quienes
han ledo de manera detenida el libro Psychological Examining in the
Unuited States, editado por Yerkes (1921) justo despus de la
primera Quena Mundial, podran sorprenderse de descubrir que
Wechsler se apropi de docenas de reactivos de prueba de esta
fuente, muchos de los cuales han sobrevivido hasta la actualidad en
las revisiones contemporneas de las pruebas Wechsler. Este autor no
era tanto un genio creativo como un individuo prctico, que dise un
instrumento nuevo y til a partir de elementos sobrantes de los
intentos anteriores y descontinuados para examinar la inteligencia.
65

La primera de las pruebas Wechsler, llamada Escalas de inteligencia


Wechsler-BeIlevue, se public en 1939. Al analizar la fundamentacin
para su nueva prueba, Wechsler (1941) explic que los instrumentos
existentes,

como

la

Stanford-Binet,

eran

deplorablemente

inadecuados para la evaluacin de la inteligencia adulta. La WechslerBellevue se dise para rectificar varios defectos que se haban
observado en pruebas anteriores:

Los reactivos de prueba no tenan atractivo para las personas


adultas.

Demasiadas preguntas enfatizaban la mera manipulacin de las


palabras.

Las instrucciones enfatizaban la velocidad a expensas de la


precisin.

Depender de la edad mental era irrelevante en el caso de pruebas


con adultos.

Para

corregir

estas

deficiencias,

Wechsler

dise

su

prueba

especficamente para adultos, aadi reactivos de ejecucin para


equilibrar las preguntas verbales, redujo el nfasis en las preguntas
con lmite de tiempo e invent un nuevo mtodo para obtener el CI.
En trminos especficos, sustituy la frmula comn:
CI =

edad mental

edad cronolgica
por una frmula nueva relacionada con la edad
CI =

puntuacin obtenida o real

puntuacin media esperada para esa edad


Esta nueva frmula se bas en la interesante presuposicin expresada en forma de axioma- de que el CI permanece constante a
66

medida que se envejece de manera normal, aunque la capacidad


intelectual natural pueda cambiar o incluso disminuir. La suposicin de
la constancia de CI es bsica para las escalas Wechsler. Como lo
expres el mismo autor (1941):
La constancia de CI es la suposicin bsica de todas las escalas donde
grados relativos de inteligencia se definen en trminos de dicho CI. No
slo es bsico, sino absolutamente necesario, que los Cl sean
independientes de la edad en la cual se calculan, debido a que, a
menos de que dicha suposicin se mantenga, no es posible un
esquema permanente de clasificacin de la inteligencia.
Aunque los autores contemporneos de pruebas aceptan, en general,
la perspectiva de Wechsler, es importante destacas que la suposicin
de la invarianza del CI con respecto a la edad es, en realidad, una
afirmacin de valores, una eleccin filosfica, y no necesariamente
una caracterstica inherente de la naturaleza humana.
Wechsler tambin tena la esperanza de utilizar su prueba como un
auxiliar para el diagnstico psiquitrico. Para lograr este objetivo
dividi su escala en secciones independientes, verbal y de ejecucin,
lo que permita que el examinador comparara la facilidad del individuo
en el uso de palabras y smbolos (subpruebas verbales) contra su
capacidad

para

(subpruebas

de

manipular

objetos

ejecucin).

Se

percibir

consideraba

patrones

visuales

que

grandes

las

diferencias entre capacidad verbal (V) y capacidad de ejecucin (E)


tenan importancia diagnstica. De manera especfica, Wechsler
consideraba que la enfermedad orgnica del cerebro, la psicosis y los
trastornos emocionales, daban lugar a un notable patrn V>E,
mientras que la psicopata en adolescentes y el retraso mental leve
producan un fuerte patrn La investigacin subsecuente demostr
67

muchas

excepciones

estas

reglas

diagnsticas

simples.

Sin

embargo, la distincin entre habilidades verbales y de ejecucin ha


resultado vlida y til para otros propsitos, como el anlisis de las
relaciones

cerebro-conducta

el

estudio

de

los

efectos

del

envejecimiento sobre la inteligencia. La divisin terica de Wechsler


para las subpruebas en secciones verbal y de ejecucin se clasifica
quiz como su contribucin ms duradera al examen contemporneo
de la inteligencia.
CARACTERSTICAS GENERALES DE LAS PRUEBAS WECHSLER
Si se incluyen las revisiones, David Wechsler y sus seguidores
produjeron

10

pruebas

de

inteligencia

en

un

lapso

de

aproximadamente 60 aos. Una de las principales razones para el


xito de estos instrumentos fue que cada nueva prueba o revisin
permaneci fiel al contenido y formato familiares que se introdujeron
en la

Wechsler-Bellevue. Al apegarse a una sola frmula exitosa,

Wechsler asegur que los examinadores pudieran cambiar de una


prueba Wechsler a otra con un reentrenamiento mnimo; esto no slo
fue bueno en trminos psicomtrico, sino que tambin represent una
hbil estrategia de mercadeo, en el sentido de que garantiz varias
generaciones de usuarios de las pruebas.
Las diversas versiones y ediciones de las pruebas Wechsler poseen las
siguientes caractersticas en comn:

De 10 a 14 subpruebas. El enfoque de subpruebas mltiples


permite que el examinador analice las fortalezas y debilidades
intraindividuales, en lugar de calcular una sola puntuacin global.
Como el lector ver ms adelante, el patrn de puntuaciones de
subprueba puede transmitir informacin til que no es evidente en
l nivel global de desempeo.

68

Una Escala Verbal compuesta de 5 o 6 subpruebas y una Escala de


Ejecucin que tambin incluye 5 o 6 subpruebas. Con esta
divisin,

el

examinador

puede

evaluar

las

habilidades

de

comprensin verbal y organizacin perceptual por separado. El


patrn de capacidades en estos dos factores de inteligencia puede
tener relacin con la integridad funcional de los hemisferios
izquierdo y derecho del cerebro, y puede servir como indicacin de
las fortalezas y debilidades vocacionales, como se analiza ms
adelante.

Una mtrica comn para el CI y la puntuacin ndice. La media del


CI y de la puntuacin ndice es de 100 y la desviacin estndar es
de 15 para todas las pruebas y todos los grupos por edad.
Adems, las puntuaciones escalares en cada subprueba tienen una
media de 10 y una desviacin estndar de aproximadamente 3, lo
cual permite que el examinador analice las puntuaciones de
subprueba de la persona evaluada en cuanto a fortalezas y
debilidades relativas.

Subpruebas comunes para diferentes edades. Por ejemplo, las


pruebas preescolar, infantil y adulta de Wechsler (WPPSI-R,
WISC-III y WAIS-III) contienen, todas, un ncleo comn con las
mismas ocho subpruebas (cuadro 61). Un examinador que
domine la aplicacin de una subprueba esencial en cualesquiera
de las pruebas Wechsler (como la subprueba de Informacin en el
WAIS-III) puede transferir con facilidad esta habilidad a otros
miembros de la familia Wechsler de medidas intelectuales.

69

Cuadro 10. Composicin de subpruebas de las escalas Wechsler


WPPSI-

WISC-

WAIS-

III

III

Escalas Verbales
Informacin
Retencin de Dgitos
Vocabulario

Aritmtica

Comprensin

Semejanzas

Frases

Sucesin

de

Letras

Nmeros
Escalas de ejecucin
Figuras Incompletas

Ordenacin de Dibujos
Diseo con cubos

Matrices
Composicin de objetos

X
X

Claves/Smbolos y Dgitos
Laberintos

Diseos Geomtricos

Bsqueda de Smbolos
Casa de los animales

X
X

Nota: Las subpruebas principales, comunes a todas las escalas


Wechsler, se encuentran en tipografa negrita.
SUBPRUEBAS WECHSLER: DESCRIPCIN Y ANLISIS
Wechsler (1939) defini la inteligencia como la capacidad total o
global del individuo para actuar de manera propositiva, pensar de
70

manera racional y manejar de manera eficaz su ambiente. Tambin


crea que slo se puede conocer la inteligencia a travs de aquello que
le permite hacer a una persona. Por tanto, en el diseo de sus
pruebas,

seleccion

componentes

que

representaran

un

amplio

conjunto de capacidades subyacentes, de modo que se pudiera


estimar la capacidad intelectual total. Lo que es ms, le pidi a sus
pacientes que realizaran cosas, no slo que respondieran a preguntas.
Las subpruebas Wechsler son muy diversas y con frecuencia dependen
de lo que Wechsler llamaba producciones mentales.
Se presenta aqu una descripcin de las subpruebas del WISC-III y del
WAIS-III. Tambin se analizan las capacidades detectadas por cada
subprueba y se ofrecen comentarios basados en la investigacin. Se
refiere al lector al Tema 5B para una descripcin de las tres
subpruebas nicas del WPPSI-R (Frases, Diseos Geomtricos y Casa
de los Animales). Las subpruebas verbales se enumeran en primer
trmino.
INFORMACIN
En esta subprueba se examina el conocimiento real acerca de
personas, lugares y fenmenos comunes. Las preguntas para nios
son como las siguientes:
Cuntos ojos tienes?
Quin invent el telfono?
Qu produce un eclipse solar?
Cul es el planeta ms grande?
Las preguntas para adultos son similares, pero progresan a mayores
niveles de dificultad. Las preguntas difciles en la subprueba de
informacin para adultos se asemejan a:
Cul es el elemento ms comn aire?
Cul es la poblacin mundial?
71

Cmo se convierte el jugo de fruta en vino?


Quin escribi Madame Bovary?
Los reactivos de prueba de Informacin examinan los conocimientos
generales disponibles para la mayora de las personas criadas en
instituciones

culturales

sistemas

educativos

de

las

naciones

occidentales industrializadas. De manera indirecta, esta subprueba


mide el aprendizaje y las habilidades de memoria en el sentido deque
los

sujetos

deben

retener

el

conocimiento

obtenido

de

las

oportunidades educativas, formales e informales, a fin de responder a


los reactivos de Informacin.
Por lo comn, Informacin se considera como una de las mejores
medidas

de

capacidad

general

entre

las

subpruebas

Wechsler

(Kaufman, McLean y Reynolds, 1988). Por ejemplo, el manual del


WAIS-III seala que, por lo general, Informacin tiene la segunda o
tercera correlacin ms alta con el CI Total entre todos los 13 grupos
por edad (Tulsky, Zbu y Ledbetter, 1997). De manera consistente,
Informacin muestra fuertes cargas en el primer factor identificado en
los anlisis factoriales de las correlaciones de subprueba del WAIS-III
(vase despus). Con frecuencia, el primer factor se denomina
Comprensin Verbal. Sin embargo Informacin tiende a reflejar la
educacin formal y la motivacin para el logro acadmico y, por tanto,
puede producir estimados falsos de capacidad elevada en el caso de
estudiantes perpetuos y lectores vidos.
RETENCIN DE DGITOS
Retencin de Dgitos consta de dos pruebas independientes, Dgitos
en Orden Progresivo y Dgitos en Orden Inverso. En la primera, el
examinador lee una serie de nmeros a una velocidad de uno por
segundo y despus le pide al sujeto que los repita. Si el paciente
72

responde correctamente en dos ensayos consecutivos de la misma


extensin, el examinador prosigue a la siguiente serie que tiene un
dgito adicional, hasta una extensin mxima de nueve dgitos. Para
Dgitos en Orden Inverso se utiliza un procedimiento similar, slo que
la persona examinada debe repetir los dgitos en orden inverso, hasta
una extensin mxima de ocho dgitos. Por ejemplo, el examinador
lee:
6-1-3-4-2-8-5
y la persona trata de repetir los nmeros en orden inverso:
5-8-2-4-3-1-6
Retencin de Dgitos es una medida del recuerdo auditivo inmediato
de nmeros. Se requieren facilidad numrica, buena atencin y
libertad de la distractibilidad. La ansiedad o la fatiga pueden afectar el
desempeo en esta subprueba u muchos clnicos han observado que,
con frecuencia, los pacientes hospitalizados por razones mdicas o
psiquitricas tienen un o deficiente en Retencin de Dgitos.
Ambas

pruebas

pueden

evaluar

capacidades

fundamentalmente

diferentes. Dgitos en Orden Progresivo parece requerir que el


individuo evaluado acceda en forma secuencial a un cdigo auditivo.
En contraste, para el desempeo en Dgitos en Orden Inverso, la
persona debe formar una huella visual de memoria a nivel interno a
partir de las secuencias numricas presentadas de modo oral y
despus recorrer visualmente los nmeros del final al principio. stas
es, con toda claridad, la prueba ms compleja, y no es de sorprender
que tenga una carga ms fuerte en inteligencia general que Dgitos en
Orden Progresivo (Jensen y Osborne, 1979). Gardner (1981) discute
que los examinadores deberan complementar los procedimientos
estndar de informe y enumerar subpuntuaciones independientes para
73

Retencin de Dgitos. Este autor presenta medias, desviaciones


estndar y rangos percentiles independientes para Dgitos en Orden
Progresivo y Dgitos en Orden Inverso para nios entre 5 y 15 aos de
edad.
VOCABULARIO
Se pide al individuo que defina hasta varias docenas de palabras que
tienen un nivel cada vez mayor de dificultad, mientras el examinador
escribe la respuesta al pie de la letra. Por ejemplo, en un reactivo fcil
el examinador podra preguntar qu es una taza?, y la persona
evaluada obtendra crdito parcial por responder: una cosa para
beber, y crdito completo por responder tiene un asa, condene
lquido en su interior y bebes de ella. Para los adultos y nios
inteligentes, los reactivos avanzados en la subprueba de Vocabulario
de Wechsler pueden ser muy desafiantes, al nivel de tintura,
vocinglero y atroz.
El vocabulario se aprende en gran medida en el contexto de la lectura
de libros y al escuchar a otras personas. Son pocos los individuos que
obtienen su vocabulario de la lectura del diccionario o de memorizar
las listas de palabras de la seccin de Aumente sus conocimientos de
palabras de las revistas populares. En trminos generales, el
vocabulario de una persona es una medida de la sensibilidad a
informacin nueva y de la capacidad para descifrar significados a
partir del contexto en el que se encuentran las palabras. Precisamente
debido a que la adquisicin del significado de una palabra depende de
la inferencia contextual, la subprueba de Vocabulario resulta ser la
mejor medida de la inteligencia general entre las escalas Wechsler
(Gregory, 1999). Esto sorprende a muchos legos, quienes consideran
que el vocabulario es slo un sinnimo de la exposicin a la educacin
y, por tanto, un ndice mediocre de la inteligencia general. Sin
74

embargo, simplemente no es posible negar la evidencia emprica:


Vocabulario tiene la correlacin ms alta con el CI Total entre todas
las subpruebas, tanto en el WISCIII (combinacin de los grupos por
edad) como en el WAIS-III (para grupos de 12 a 13 aos de edad).
ARITMTICA
Excepto por los reactivos ms fciles para nios pequeos o personas
con retraso, la subprueba de Aritmtica est formada por problemas
matemticos presentados de manera oral. El individuo examinado
debe resolver los problemas sin papel o lpiz dentro de un lmite de
tiempo (por lo general 30060 segundos). Los reactivos sencillos
destacan operaciones fundamentales de suma o resta, por ejemplo:
Si tienes 15 manzanas y regalas 7, cuntas te quedan?
Los reactivos ms difciles requieren una adecuada conceptuacin del
problema y la aplicacin de dos operaciones aritmticas, por ejemplo:
John compr un equipo estereofnico que tena una rebaja de 15 %
con respecto al precio original de venta de $600. Cunto pag John
por el equipo estereofnico?
Aunque los requisitos matemticos de los reactivos de Aritmtica no
son

excesivamente

demandantes,

la

necesidad

de

resolverlos

problemas a nivel mental dentro de un lmite de tiempo hace que esta


subprueba sea muy desafiante para la mayora de las personas
examinadas. Adems de las habilidades aritmticas rudimentarias, el
desempeo

exitoso

en

Aritmtica

requiere

altos

niveles

de

concentracin y la capacidad para conservar los clculos intermedios


dentro de la memoria a corto plazo. En los anlisis factoriales del
WISC-III y del WAIS-III, con frecuencia, Aritmtica tiene cargas en un
tercer factor interpretado ya sea como Libertad de la Dstractibilidad o
como Memoria.
75

COMPRENSIN
La subprueba de Comprensin es un conjunto eclctico de reactivos
que requieren explicacin ms que conocimiento sobre hechos reales.
Las preguntas fciles destacan sentido comn, mientras las ms
difciles requieren una comprensin de los convencionalismos sociales
y culturales.
En el WAIS-III, dos de las preguntas ms difciles necesitan que la
persona examinada interprete proverbios:
Un reactivo fcil de Comprensin se presenta en la siguiente forma:
Por qu las personas utilizan ropa?. Los reactivos difciles se
asemejan a los siguientes:
Qu quiere decir este dicho?: Ms vale pjaro en mano que ciento
volando?.
Por qu los jueces del Tribunal Superior de Justicia conservan su
puesto de por vida?
Comprensin parecera ser, en parte, una medida de la inteligencia
social, en cuanto a que muchos reactivos se dirigen a la comprensin
de la persona examinada acerca de los convencionalismos sociales y
culturales.

Sipps,

Berry

Lynch

(1987)

encontraron

que

las

puntuaciones de Comprensin se relacionaban un poco con medidas


de la inteligencia social en el inventario de personalidad de California.
Por supuesto, una alta puntuacin significa slo que la persona conoce
acerca de los convencionalismos sociales y culturales: la eleccin de la
accin correcta puede provenir o no de este conocimiento. Sin
embargo, estudios recientes de Cambell y McCord (1996) y Lipsitz,
Dworkin y Erlenmeyer-Kiniling (1993) no encontraron sustentacin
para la creencia popular de que las puntuaciones de Comprensin son
sensibles al fu miento social.
76

SEMEJANZAS
En esta subprueba, al individuo examinado se le hacen preguntas del
siguiente tipo: En qu se parecen las camisas y los calcetines? La
subprueba de Semejanzas evala la capacidad de la persona para
distinguir las se importantes de las semejanzas no importantes entre
objetos, hechos e ideas. De manera indirecta, estas preguntas
evalan la asimilacin del concepto de similitud. La persona evaluada
debe poseer tambin la capacidad para juzgar cundo una semejanza
es importante ms que trivial. Por ejemplo, las camisas y los
calcetines se parecen en que ambas palabras comienzan con la letra
c, pero sta no es la semejanza esencial entre ambos artculos. La
similitud importante es que las camisas y los calcetines son, ambos,
casos de un mismo concepto, es decir, ropa. Como ilustra este
ejemplo, Semejanzas puede considerarse una prueba de formacin de
conceptos verbales.
Ahora se centra la atencin hacia una descripcin y anlisis de las
subpruebas de Ejecucin las escalas Wechsler. Con excepcin de
Matrices en el WAIS-III, todas las subpruebas tienen lmite de tiempo,
y en la mayor parte de ellas se conceden puntos de bonificacin a la
persona evaluada, con base en un desempeo rpido.
SUCESIN DE LETRAS Y NMEROS
sta es una nueva subprueba que se encuentra slo en el WAIS-III. El
examinador presenta verbalmente una serie de letras y nmeros que
se encuentran en orden aleatorio. El examinando debe volver a
ordenar y repetir la lista diciendo los nmeros en orden ascendente y
despus las letras en orden alfabtico. Por ejemplo, si el examinador
dice R-3-B-5-Z-1-C, el examinado debe responder 1-3-5-B-C-R-Z.
Esta

subprueba

mide

atencin,

concentracin

libertad

de

la

distractibilidad. Junto con Aritmtica y Retencin de Dgitos, esta


77

subprueba

contribuye

la

puntuacin

del

ndice

de

Memoria

Simultnea en el WAIS-III (vase despus).


FIGURAS INCOMPLETAS
Para esta subprueba, el examinador pide al individuo identifique la
parte importante que falta una ilustracin. Por ejemplo, un reactivo
simple podra ser de este tipo: un dibujo de una mesa a la que le falta
una pata. Los reactivos van aumentando en grado de dificultad; la
subprueba contina hasta que la persona evaluada falla en cinco
reactivos consecutivos. La figura 6-1 representa un reactivo similar a
aqullos encontrados en el WAIS-IIl.

Figura 3.1. Reactivo de Figuras Incompletas similar a los encontrados


en el WAIS-III.
Aunque figuras Incompletas est incluida en la mitad de ejecucin de
cada prueba Wechsler, las capacidades que se requieren para esta
subprueba se superponen slo a un nivel modesto con las medidas
tpicas de la inteligencia ejecutiva (p. ej., Diseo con cubos). En
primer lugar, el desempeo exitoso en Figuras Incompletas implica en
gran medida acceder a la memoria a largo plazo, ms que utilizar la
habilidad
78

perceptual-manipulativa.

Es

cierto

que

la

persona

examinada debe tener buena atencin a los detalles visuales, pero las
altas puntuaciones reflejan principalmente la capacidad para comparar
cada dibujo con objetos o situaciones similares almacenados en la
memoria alargo plazo. En resumen, Figuras Incompletas no requiere
en realidad de un componente de ejecucin. El individuo necesita
verbalizar el elemento faltante o slo sealar a la seccin del dibujo
que presenta una anomala. La subprueba de Figuras Incompletas
presupone que la persona evaluada se ha visto expuesta al objeto o
situacin representados, por tal razn, puede ser inapropiada para
personas que no han tenido acceso a las ventajas culturales.
ORDENACIN DE DIBUJOS
En

esta

subprueba,

el

examinador

coloca

en

desorden

varios

recuadros de una tira de caricaturas no verbales. La tarea de la


persona evaluada consiste en colocar los recuadros juntos en el orden
conecto, a fin de describir una historia que tenga sentido. La figura 62 presenta una tarea de ordenacin de dibujos como la que podra
encontrarse en el WAIS-III.

Figura 3-2: Reactivo de Ordenacin de Dibujos similar a los


encontrados en el WAIS-III

79

Aunque Ordenacin de Dibujos se agrupa junto con las tareas de


ejecucin, tiene cargas aproximadamente iguales en os componentes
verbal y de ejecucin revelados en los estudios analtico-factoriales de
intercorrelacin

de

subpruebas

(p.ej.,

Silverstein,

1982a).

Las

capacidades detectadas son complejas y multifacticas. Antes de


ordenar los dibujos, la persona examinada debe tener la capacidad de
descifrar la gestalt de la historia conecta, a partir de sus elementos
desordenados. Esta subprueba tambin mide pensamiento secuencial
y la capacidad para ver relaciones entre acontecimientos sociales, En
el WAIS-III, varias de las historias de Ordenacin de Dibujos tienen
temas humorsticos. Como resultado, se requiere de refinamiento
social y sentido del humor para tener un desempeo exitoso.
DISEO CON CUBOS
En la subprueba de Diseo con Cubos, la persona debe reproducir
diseos geomtricos bidimensionales a travs de la rotacin y
colocacin correctas de cubos tridimensionales de colores. Esta
subprueba se presenta en el Tema 2B, Proceso de prueba. En todas
las escalas Wechsler, los primeros reactivos de Diseo con Cubos
pueden resolverse mediante tanteo. Sin embargo, los reactivos ms
difciles necesitan del anlisis de relaciones espaciales, coordinacin
visomotora y aplicacin rgida de la lgica. Diseo con Cubos demanda
mucha mayor capacidad de solucin de problemas y de razonamiento
que la mayor parte de las subpruebas de ejecucin, donde la memoria
y la experiencia previa tienen mayor ponderacin. En los anlisis
factoriales de las escalas Wechsler, Diseo con Cubos tiene por lo
comn la carga ms elevada de todas las subpruebas de ejecucin en
el segundo factor ste se identifica de diversas maneras como factor
no

verbal,

visoespacial

inteligencia

perceptual-organizacional

(Fowler, Zillmer y Macciocchio, 1990; Silverstein, 1982a). En el WISCIII y en el WAIS-Ill, con Cubos tiene la correlacin ms alta con el CI
80

de ejecucin para casi todos los grupos de estandarizacin entre las


edades de 6 y 8 aos. Por esta razn, en general se reconoce a
Diseo con Cubos como el ndice quintaesencial la Inteligencia no
verbal en las pruebas Wechsler (Gregory, 1999).
Esta es una prueba en la que tiene gran importancia los lmites de
tiempo. Considrese la versin del WAIS-R, que consta de 14 diseos
de dificultad progresiva. Para obtener una alta puntuacin, los adultos
no slo deben reproducir correctamente cada uno de los 14 diseos,
sino que tambin deben obtener una bonificacin en los ltimos cinco
diseos al terminarlos con rapidez. Una persona que resuelve todos
los diseos dentro del lmite de tiempo, pero que no puede obtener los
puntos de bonificacin, tendr una puntuacin exacta-dentro del
promedio en esta subprueba. Las puntuaciones de Diseo con Cubos
pueden ser engaosas en el caso de individuos examinados que no
valoran la ejecucin veloz.
MATRICES
Matrices una nueva subprueba que se encuentra slo en el WAIS-III.
Se aadi para mejorar la evaluacin del razonamiento no verbal en
la prueba para adultos. La subprueba consiste en 26 problemas de
razonamiento figurativo dispuesto en orden de dificultad creciente
(figura 6-3).

Para encontrar

la respuesta correcta, la

persona

evaluada tiene que identificar un patrn o relacin recurrente entre


los estmulos figurativos dibujados a lo largo de una lnea recta
(reactivos sencillos) o en una rejilla de 3 x 3 (reactivos difciles) en los
que falta el ltimo elemento. Con base en el razonamiento no verbal
acerca de patrones y relaciones, la persona debe inferir el estmulo
faltante y seleccionarlo de entre cinco opciones que se proporcionan
en la parte inferior de la tarjeta.
81

Figura 3-3: Reactivo de Matrices similar a los encontrados en el


WAIS-III
Matrices se dise para constituir una medida de la inteligencia fluida,
que es la capacidad para realizar operaciones mentales como la
manipulacin

de

smbolos

abstractos.

Los

reactivos

detectan

integracin de patrones, razonamiento por analoga y razonamiento


en serie. En general, la subprueba es una excelente medida del
razonamiento inductivo con base en estmulos figurativos. Matrices es
la nica subprueba de ejecucin sin lmite de tiempo dentro del WAISIII.
COMPOSICIN DE OBJETOS
Para cada reactivo, la persona evaluada debe armar las piezas de un
rompecabezas para formar un objeto comn (figura 6-4). Por ejemplo,
Composicin

de

objetos

en

el

WAIS-IlI

consiste

en

cinco

rompecabezas: un maniqu (seis piezas), un perfil (siete piezas), un


elefante (seis piezas), una casa (nueve piezas) y una mariposa (siete
82

piezas). El examinador no identifica los reactivos, de modo que la


persona evaluada debe discernir primero el objeto para identificar
cada reactivo a partir de sus panes desordenadas. El xito en esta
subprueba requiere altos niveles de organizacin perceptual; es decir,
la persona debe captar el patrn general o gestalt, con base en la
percepcin de las relaciones entre las partes individuales.

Figura 3-4: Reactivo de Composicin de Objetos similar a los


encontrados en el WAIS-III
Composicin de Objetos es la menos confiable de las subpruebas
Wechsler. Por ejemplo, en el WAIS-III esta subprueba tiene una
correlacin corregida de divisin en mitades de .70 (Tulsky, Zhu y
Ledbetter, 1997). Entre las subpruebas WAIS-III, slo Ordenacin de
Dibujos con un valor de .74 se acerca a la falta de confiabilidad de
Composicin de Objetos. Estas dos subpruebas se destacan de las
otras subpruebas Wechsler, que son ms confiables. La mediocre
confiabilidad de Composicin de Objetos puede reflejar, en parte, el
pequeo nmero de reactivos al igual que la funcin de los factores
aleatorios en la solucin de rompecabezas.
CLAVES O SMBOLOS Y DGITOS
Aunque las tareas son casi idnticas, esta subprueba se denomina
Claves en el WISC-III y Smbolos y Dgitos en el WAIS-III. La versin
83

del WISC-III consta de dos partes separadas y distintas, una para


nios menores a ocho aos (Claves A) y otra para nios de ocho aos
en adelante (Claves 8). En Claves A, el nio debe dibujar el smbolo
conecto dentro de una serie de formas en secuencia aleatoria. La
tarea utiliza cinco formas (estrella, crculo, tringulo, cruz y cuadrado)
y a cada forma se le asigna un smbolo nico (lnea vertical, dos lneas
horizontales, una sola lnea horizontal, crculo y dos lneas verticales,
respectivamente). Despus de una breve sesin de prctica, se le pide
al nio que dibuje el smbolo correcto dentro de 43 de las formas en
secuencia aleatoria. Sin embargo, dado que existe de tiempo un lmite
de de dos minutos, las puntuaciones altas requieren un desempeo
rpido.
Claves B en el WISC-III y Smbolos y Dgitos del WAIS-III son
idnticas en

formato

(figura 6-5).

Para

ambas

subpruebas, el

individuo examinado debe relacionar un smbolo con cada uno de los


dgitos del 0 al 9 y con rapidez el smbolo apropiado debajo de una
larga serie de dgitos aleatorios. El lmite de tiempo para ambas
versiones es de dos minutos. Muy pocos examinados se las -para
codificar todos los estmulos dentro de este tiempo.

Figura

3-5:

Reactivos

de

Smbolos

Dgitos

similares

los

encontrados en el WAIS-III.
Estes (1974) analiz la subprueba de Smbolos y Dgitos desde la
postura de de la teora del aprendizaje y concluy que el desempeo
incapaz requiere la capacidad para producir con rapidez claves
84

verbales para representar cada uno de los smbolos dentro de la


memoria. Por ejemplo, en la figura 6-5 la persona examinada codificar
el smbolo bajo el nmero dos cmo T invertida. La codificacin
verbal

media

el

desempeo

rpido

al

simplificar

la

tarea.

El

desempeo eficiente tambin demanda aprendizaje inmediato de los


pares de smbolos-dgitos, de modo que la persona no tenga que
buscar cada dgito en el cuadro de referencia para determinar la
respuesta correctamente sentido, Smbolos y Dgitos es singular: es la
nica subprueba Wechsler que necesita de aprendizaje en el momento
de una tarea no familiar.
Las puntuaciones de Smbolos y Dgitos muestran una disminucin
pronunciada a medida se avanza en edad. En estudios transversales,
las puntuaciones naturales en Smbolos y Dgitos declinan hasta 50%
de los 20 a los 70 aos de edad (Wechsler, 1981). La disminucin es
aproximadamente lineal y no se explica con facilidad a travs de
referencias superficiales a las diferencias motivacionales o a la
lentificacin motriz. Por supuesto, los resultados transversales no son
sinnimos

por

necesidad

de

las

tendencias

longitudinales.

Sin

embargo, la disminucin con la edad en Smbolos y Dgitos es tan


pronunciada que debe indicar, en parte, un verdadero cambio
relacionado con la edad en la velocidad de las habilidades bsicas de
procesamiento de informacin. sta es una de las subpruebas ms
sensibles a los efectos del deterioro orgnico (Lezak, 1995).
LABERINTOS
Esta subprueba slo aparece en el WPPSI-R Y WISC-III, y consiste en
laberintos de lpiz y papel que el nio debe resolver dentro de un
lmite de tiempo. Al individuo evaluado se le pide que no levante el
lpiz y se le aconseja que intente no entrar en callejones sin salida.
Se da crdito completo para cada laberinto si el nio lo resuelve
dentro del lmite de tiempo (30 a 150 segundos, dependiendo de la
85

dificultad) sin entrar en algn callejn sin salida. Se resta un punto de


puntuacin natural por cada vez que haya entrado en un callejn sin
salida.
La subprueba de Laberintos detecta habilidades perceptomotoras,
velocidad motora, planificacin visual y la capacidad para inhibir las
respuestas impulsivas. Esta subprueba es una medida deficiente de la
inteligencia general, pero mide razonablemente bien la organizacin
perceptual.

En

el

WISC-III,

Laberintos

es

una

subprueba

complementada que no se utiliza para el clculo del CI.


BSQUEDA DE SMBOLOS
a Bsqueda de Smbolos es una medida complementaria de ejecucin
que se encuentra en el WISC-III y el WAIS-III. Es una subprueba con
fuerte influencia de los lmites de tiempo, en la que el nio observa un
grupo blanco de smbolos, despus examina con rapidez un grupo de
bsqueda con smbolos y finalmente marca la casilla de SI o NO
para indicar si uno o ms de los smbolos dentro del grupo blanco
ocurrieron dentro del grupo de bsqueda. Un reactivo de Bsqueda de
Smbolos se representa en la figura 6-6. Esta subprueba parecera ser
una medida de la velocidad de procesamiento.

Nota: La tarea de la persona examinada consiste en determina, si


cualesquiera de las formas que se encuentran a la izquierda ocurre
entre las cinco formas de la derecha.
Figura 3.6. Reactivo de Bsqueda de Smbolos similar a aquellos
encontrados en el WISC-III.
86

ESCALA WECHSLER DE INTELIGENCIA PARA ADULTOS-III


El WAIS-III constituye una revisin significativa del WAIS-R, aunque
se conserv la mayor parte de los reactivos anteriores. Los cambios
ms importantes incluyen la adicin de tres subpruebas y de un
modelo alternativo para calificar la prueba (cuatro puntuaciones ndice
para complementar el abordaje tradicional de CI Verbal, de Ejecucin
y Total). Otras mejoras importantes con respecto a su antecesor
incluyen la actualizacin y expansin de las muestras normativas,
extensin de la cobertura hasta los 89 aos de edad, adicin de
reactivos fciles para mejorar la evaluacin del retraso mental y
establecimiento de normas compartidas con la Escala Wechsler de
Memoria-III (Gregory, 1999). Debido a los cambios en los protocolos
del

WAIS-III

(p.

ej.

Presentacin

destacada

de

reglas

de

descontinuacin), esta prueba es un poco ms fcil de aplicar que el


WAIS-R. Sattler y Ryan (1999) proporcionan una resea sobresaliente
acerca del WAIS-III en la prctica clnica.
El WAIS-III se compone de 14 subpruebas, pero una (Composicin de
Objetos) es ahora opcional y se le utiliza slo como sustituto para
pruebas inutilizadas bajos circunstancias poco comunes (Wechsler,
1997). Del conjunto principal de 13 subpruebas, 11 son necesarias
para el clculo de los CI tradicionales (Verbal, Ejecucin y Total). Las
normas para las puntuaciones de CI se establecieron con el promedio
convencional de 100 y desviacin estndar de 15 en la poblacin
general.

La

separacin

de

las

subpruebas

para

obtener

las

puntuaciones de CI es como sigue:


CI Verbal
Vocabulario
Semejanzas
Aritmtica
87

Retencin de Dgitos
Informacin
Comprensin
CI de Ejecucin
Figuras Incompletas
Claves, smbolos y Dgitos
Diseo con Cubos
Matrices
Ordenacin de Dibujos.
Las 11 subpruebas se utilizan para el clculo del CI Total. La divisin
Verbal-Ejecucin de las subpruebas del WAIS-III es casi idntica a la
encontrada en el WAIS-R. la nica diferencia es la adicin de Matrices
en lugar de Composicin de Objetos.
Adems de las puntuaciones tradicionales de CI, en el WAIS-III se
pueden obtener puntuaciones en cuatro ndices, cada uno de los
cuales se basa en 2 o 3 de las 13 subpruebas. Estos ndices se
derivaron del anlisis factorial de las subpruebas, el cual revel cuatro
dominios: Comprensin Verbal, Organizacin Perceptual, Memoria
Simultnea y Velocidad

de Procesamiento. Las puntuaciones ndice

Tambin se basan en la media familiar de 1000 y subpruebas para las


cuatro puntuaciones ndice es la siguiente:
ndice de Comprensin Verbal
Vocabulario
Semejanzas
Informacin
ndice de Organizacin Perceptual
Figuras Incompletas
Diseo con Cubos
88

Matrices
ndice de Memoria Simultnea
Aritmtica
Retencin de Dgitos
Sucesin de Letras y Nmeros
ndice de Velocidad de Procesamiento
Claves, Smbolos u Dgitos
Bsqueda de
El lector notar que el ndice de Comprensin Verbal (ICV) es similar
al CI Verbal, pero no incluye subpruebas sensibles a la atencin (es
decir. Retencin de Dgitos y Aritmtica). Por tal razn, el ICV es una
medida ms directa de la comprensin verbal que el CI Verbal. El
ndice de Organizacin Perceptual (IOP) es similar al CI de Ejecucin,
pero depende menos de la velocidad (porque Matrices no tiene lmite
de tiempo). Por tal razn, el IOP es una medida ms refinada del
razonamiento fluido y de la solucin de problemas visoespaciales que
el CI de Ejecucin. En este sentido, el ICV y el IOP son medidas ms
puras que los CI Verbales y de Ejecucin, respectivamente.
El ndice de Memoria Simultnea (IMS) se compone de subpruebas
sensibles a atencin y memoria inmediata (Aritmtica, Retencin de
Dgitos

Sucesin

de

Letras

Nmeros).

Una

puntuacin

relativamente baja en este ndice puede significar que la persona


evaluada tiene un problema de atencin o memoria, en especial con
los materiales que se presentan de manera verbal. El ndice de
Velocidad de Procesamiento (IVP) se compone de

subpruebas que

requieren del procesamiento sumamente veloz de informacin visual


(Claves, Smbolos y Dgitos, Bsqueda de Smbolos). El IVP es
sensible a una amplia variedad de padecimientos neurolgicos y
neuropsicolgicos (Tulsky, Zhu y Ledbetter, 1997).
89

ESTANDARIZACIN DEL WAIS-III


La estandarizacin del WAIS-III se emprendi con gran cuidado y se
bas en los datos obtenidos por el Bureau of the Census de EUA en
1995. La muestra total de 2450 adultos (de 16 y 89 aos de edad) se
estratific de manera esmerada en estas variables: sexo, raza,
etnicidad, nivel de estudios y regin geogrfica. Se utilizaron las cifras
del censo de 1995 como los valores blanco para las variables de
estratificacin.
Por ejemplo, entre las personas dentro del rango de 55 a 64 aos de
edad,

el

Departamento

del

Censo

encontr

que

3.47%

son

afroestadounidenses con educacin media superior. De aqu que el


3.5% de los individuos de estandarizacin dentro de este rango de
edades fueron afroestadounidenses con educacin media superior.
La muestra de estandarizacin se dividi en 13 bandas por edad: 1617, 18-19, 20-24, 25-29, 30-34, 35-44, 45-54, 55-64, 65-69, 70-74,
75-79, 80-84, 85-89 aos. Excepto para los dos grupos de mayor
edad, cada muestra incluy a 200 participantes cuidadosamente
estratificados en las variables demogrficas que se sealan en las
variables demogrficas que se sealan antes; el grupo de 80 a 84
aos de edad incluy a 150 participantes y el grupo de 85 a 89 aos
incluy

100

participantes.

La

muestra

resultante

tiene

una

correspondencia muy estrecha con las proporciones del censo de EUA.


Sin embargo, se excluy a personas de las que exista la sospecha de
un deterioro cognitivo, incluso leve, de modo que es probable que la
muestra sea ms sana que sus equivalentes del censo. En trminos
especficos, se utilizaron varios criterios de exclusin dentro de la
muestra de estandarizacin, incluyendo daltonismo, deterioro auditivo
o visual sin correccin, evidencia de problemas con drogas/alcohol,
menoscabo de extremidades superiores, utilizacin de medicamentos
ansiolticos
90

antidepresivos

una

variedad

de

padecimientos

potenciales discapacitantes a nivel neurolgico (lesiones craneales,


embolias, epilepsia, enfermedad de Alzheimer, esquizofrenia).
Aunque

el

WAIS-III

es

muy

similar

al

WAIS-R

tiene

una

superposicin sustancial en cuanto a los reactivos, ambas pruebas no


producen CI similares. En estudios contrabalanceados que comparan
las puntuaciones de 192 adultos en las dos pruebas, las puntuaciones
del WAIS-III son menores en un punto en el caso del CI Verbal, en 5
puntos para el CI de ejecucin y en 3 puntos para el CI Total (Tulsky,
Zhu y Ledbeter, 1997). En pocas palabras, el WAIS-III es una prueba
ms difcil que el WAIS-R. Aqu se encuentra un enigma perturbador:
por

qu

la

muestra

normativa del

WAIS-III

parece

ser

ms

inteligente que la muestra normativa del WAIS-R? Esta cuestin se


ver con mayor detalle en el Tema 7B, Predisposicin de prueba y
otras controversias.
CONFIABILIDAD
La confiabilidad del WAIS-III es excepcionalmente buena. El promedio
de las confiabilidades mixtas de divisin en mitades entre todos los
grupos por edad son: CI Verbal, 0.97; CI de Ejecucin, 0.94; y CI
Total, 0.98. Los coeficientes de estabilidad en test-retest para 394
examinandos confirman en mucho la misma imagen: CI Verbal, 0.96;
CI de Ejecucin, 0.91; y CI Total, 0.96. Las confiabilidades y
coeficientes de estabilidad para las cuatro puntuaciones ndice tienden
a ser un tanto inferiores, pero an se encuentran en o cerca de .90 en
todos los casos.
Para el CI Total, el error estndar de medida se encuentra en el rango
de 2 a 2.5 puntos, segn el grupo de edad. Considrese lo que esto
significa: 95% de las veces, el CI Total verdadero de una persona
evaluada se encontrar dentro de 5 puntos (dos errores estndar de
medida)

del

valor

obtenido.

En

trminos

de

uso

comn,

los
91

psicmetras diran que el CI del WAIS-III tiene una banda de error


alrededor de 10 puntos; es decir, las puntuaciones de CI son precisas
dentro de un rango de aproximadamente 5 puntos.
En contraste con las fuertes confiabilidades encontradas para las
puntuaciones de CI e ndice, las confiabilidades de las 14 subpruebas
individuales

son,

en

general,

mucho

ms

dbiles.

Las

nicas

subpruebas con coeficientes de estabilidad superiores a .90 son


Informacin (.94) y Vocabulario (.91). Para las subpruebas restantes,
los valores de confiabilidad van desde la parte baja del rango de .70
hasta mediados del rango de .80. La implicacin ms importante de
estas conclusiones sobre confiabilidad dbil es que los examinadores
deben abordar-el anlisis de perfil de subpruebas con extremo
cuidado. Las puntuaciones de subprueba que parecen tener una
elevacin (o disminucin) discrepante en el caso de un individuo
evaluado podran ser consecuencia de la confiabilidad generalmente
dbil de ciertas subpruebas, ms que una indicacin de fortalezas o
debilidades

cognitivas

verdaderas.

Algunos

estudiosos

del

tema

concluyen que el anlisis del perfil (la identificacin de fortalezas y


debilidades cognitivas especficas con base en el anlisis de los picos y
valles en

las

puntuaciones

de

subprueba)

no

se

justifica

con

fundamento en la evidencia (Gregory, 1994b).


VALIDEZ
Con base en un nmero de diferentes lneas de evidencia revisadas
aqu, la validez del WAIS-III parece ser bastante satisfactoria. En
numerosos estudios que correlacionan el WAIS-III con pruebas
establecidas de inteligencia y tambin con medidas del rendimiento
acadmico, se ha demostrado su buena validez relacionada con el
criterio. Por ejemplo, el CI Total del WAIS-III tiene una fuerte
correlacin con las puntuaciones globales en otras medidas: .93 el
92

WAIS-R, .88 con el WISC-III (en el caso de los jvenes de 16 aos en


los grupos donde se superponen las edades), .64 con Matrices
Progresivas Estndar y .88 con la Prueba de Inteligencia StanfordBinet: Cuarta Edicin. El CI del WAIS-III tambin tiene una fuerte
correlacin con las ocho subpruebas de la Prueba Wechsler de
Rendimiento Individual, al revelar una correlacin mediana de .70
(Tulsky, Zhu y Ledbetter, 1997). No existe duda de que el WAIS-R
capta los mismos aspectos de la inteligencia global que miden otros
instrumentos de amplia utilizacin.
La

validez

del

WAIS-III

tambin

se

apuntala

en

su

fuerte

superposicin con el y con el WAIS-R original, para los cual se ha


establecido una impresionante cantidad de datos de validez. Para una
revisin completa de estos datos, el lector debe consultar a Matarazzo
(1972)

Kaufman

(1990).

Aqu

se

presentar

un

estudio

representativo y provocativo en el que se realiz un anlisis de


correlaciones del lugar acadmico alcanzado por el alumno y las
puntuaciones de prueba de

inteligencia. Conry y Plant (1965)

correlacionaron las puntuaciones del WAIS con la clasificacin de 98


estudiantes de educacin media superior en el momento de su
graduacin. Tambin correlacionaron las puntuaciones del WAIS con
el promedio de calificaciones al final del primer ao de universidad de
335 estudiantes de una segunda muestra. Los resultados se presentan
en el cuadro 6-2. Obsrvese que el CI Verbal pronostica el xito
acadmico al mismo nivel que el CI Total, mientras el CI de Ejecucin
conserva una relacin ms dbil con los niveles de rendimiento.
Obsrvese tambin que Vocabulario produce la correlacin general
ms elevada de todo el cuatro (065) con la posicin acadmica. Estos
datos

refuerzan

en

gran

medida

la

inclusin

de

medidas

de

vocabulario en las pruebas de inteligencia.


93

Cuadro 11. Correlaciones entre el lugar acadmico en la


secundaria, las calificaciones universitarias y las puntuaciones
del WAIS
Subpruebas del

Educacin

Universidad

WAIS y CI

media

(N=335)

superior
(N=98)
Informacin

0.54

0.48

Comprensin

0.55

0.33

Aritmtica

0.45

0.19

Semejanzas

0.50

0.69

Retencin de Dgitos

0.37

0.04

Vocabulario

0.65

0.46

Smbolos y dgitos

0.34

0.15

Figuras incompletas

0.33

0.20

Diseo con Cubos

0.29

0.19

de

0.22

0.07

de

0.17

0.12

CI Verbal

0.63

0.47

CI de Ejecucin

0.43

0.24

CI Total

0.62

0.44

Ordenacin
Dibujos
Composicin
Objetos

Fuente: Adaptado con autorizacin de Conry, R. y Plant, W. T. (1965).


WAIS and group test predictions o fan academia success criterion:
High Schoool and colege. Educational and Psychological Measurement,
25, 493-500.
Varios estudios refuerzan la validez de constructo del WAIS-III al
mostrar que las puntuaciones de prueba en el caso de diversos grupos
son consistentes con la teora. Por ejemplo, Sattler (1982, 1988) ha
94

sealado que las tendencias relativas a la edad en la subpruebas del


WAIS-R (las cuales son muy semejantes a las del WAIS-III) se
conforman de

manera estrecha a la teora Cattell-Horn de

la

inteligencia fluida y cristalizada. El lector recordar del tema anterior


que la inteligencia fluida se utiliza para resolver problemas novedosos,
mientras la inteligencia cristalizada requiere la recuperacin de
respuestas aprendidas o habituales. Segn la teora, la inteligencia
fluida declina de manera aguda en la vejez, mientras la inteligencia
cristalizada permanece constante o aumenta ligeramente (Horn,
1985).
Un anlisis del WAIS-R y del WAIS-III indica que las subpruebas
verbales

dependen

mucho

ms

de

la

inteligencia

cristalizada

(recuperacin de respuestas aprendidas), mientras las subpruebas de


ejecucin requieren altos niveles de inteligencia fluida (solucin de
problemas novedosos). De conformidad con las expectativas tericas,
una inspeccin de los datos normativos revela que las puntuaciones
naturales en las subpruebas verbales muestran una disminucin
mnima a medida que se avanza en edad, mientras las puntuaciones
naturales en las subpruebas de ejecucin caen de manera vertiginosa
en el caso de personas mayores (Wechsler, 1981, 1997). Por
supuesto, estos datos son transversales y, por tanto, no constituyen
una prueba definitiva de la declinacin longitudinal. Sin embargo, los
decrementos con la edad en las subpruebas de ejecucin son tan
notables que ponen a prueba la creencia de atribuirlas a diferencias
de cohorte u otros factores artificiales. Es ms probable que una
proporcin

significativa

de

esta

disminucin

sea

un

descenso

verdadero relacionado con la edad que corrobora la teora Cattell-Horn


de la inteligencia.
Otra expectativa consistente con la teora, que se confirma con los
datos empricos, es una fuerte relacin entre los logros educativos y
las puntuaciones de CI (Kaufman. 1990). Estas dos variables deberan
95

tener una fuerte correlacin con base en dos suposiciones: que la


educacin eleva la inteligencia y que las personas ms inteligentes
buscarn en general un nivel ms alto de educacin.
En apariencia, los anlisis de la relacin entre las puntuaciones de CI
del WAIS-III y los logros educativos todava no se han terminado.
Sin embargo, la investigacin con la edicin anterior es relevante para
esta

cuestin

debido

la

fuerte

semejanza

entre

los

dos

instrumentos. Matarazzo y Herman (1984) analizaron el total de aos


de escolaridad contra el CI Verbal, el CI de Ejecucin y el CI Total de
los 1 880 individuos utilizados en la muestra de estandarizacin del
WAIS-R. Al excluir a las personas jvenes, con edades de 16 a 24
aos, muchos de los cuales todava no terminaban su educacin, la
correlacin entre los aos de escolaridad terminada y el CI Total fue
de 0.63 para los 500 sujetos entre 25 y 44 aos de edad y de 0.62
para los 730 individuos entre 45 y 74 aos.
Estas conclusiones revelan una correlacin muy fuerte entre el logro
educativo y las puntuaciones de CI. Por ltimo, el CI de Wechsler y los
logros laborales tambin tienen una fuerte vinculacin (Reynolds,
Chastain, Kaufman y McLean, 1987), lo cual tambin brinda un apoyo
adicional a la validez del WAIS-III como medida de la inteligencia
general.
ESCALA

WECHSLER

DE

INTELIGENCIA

PARA

EL

NIVEL

ESCOLAR-III
El WISC se public en 1949 como una extensin descendente de la
Wechsler-Bellevue original. Aunque se le utiliz ampliamente en los
siguientes dos decenios, los psicmetras percibieron varios defectos
en ella: ausencia de individuos de raza no blanca en la muestra de
estandarizacin,

ambigedades

en

la

calificacin,

reactivos

inapropiados para nios (p. ej., referencia a cigarros puros) y


ausencia de mujeres y afroestadounidenses en el contenido pictrico
96

de los reactivos. El WISC-R (Wechsler, 1974) y el WISC-III (Wechsler,


1991) corrigieron estos errores.
El

WISC-III

consta

de

10

subpruebas

principales

tres

complementarias. Las subpruebas verbales y de ejecucin se aplican


en orden alternado:
Subpruebas Verbales Subprueba de Ejecucin
Informacin

Figuras Incompletas

Semejanzas

Claves

Aritmtica

Ordenacin de Dibujos

Vocabulario

Diseo con Cubos

Comprensin

Composicin de Objetos

Retencin de Dgitos Bsqueda de Smbolos


Laberintos
Retencin de Dgitos, Bsqueda de Smbolos y Laberintos son
subpruebas complementarias que, por lo comn, no se incluyen en el
clculo del CI. Sin embargo, en general, estas subpruebas se aplican
debido a la informacin diagnstica que proporcionan. En caso de que
se interrumpa la aplicacin de una subprueba y sta se arruine o deba
omitirse debido a discapacidades especiales, se le puede sustituir con
Retencin de Dgitos (en el caso de subpruebas verbales) o Laberintos
(en las subpruebas de Ejecucin). Bsqueda de Smbolos slo puede
utilizarse como sustituto de la subprueba de Claves.
La estandarizacin del WISC-Ill es excepcionalmente buena, ya que se
bas en 100 nios y 100 nias en cada nivel de edad de los 6 aos y
medio a los 16 aos y medio (N total = 2200). Estos casos se
seleccionaron con cuidado y se estratificaron con base en el censo de
EUA

para

1988

con

afroestadounidenses,

respecto
nativos

raza/origen

tnico

estadounidenses,

(blancos,

esquimales,

aleutianos, asiticos, nativos de las Islas del Pacfico y otros), regin


97

geogrfica y educacin de los padres. Aunque no fue una variable


formal de estratificacin, el tamao de la comunidad para la muestra
de estandarizacin del WISC-III se asemeja mucho a los datos del
censo. La muestra de estandarizacin se obtuvo tanto de escuelas
pblicas como privadas e incluye a nios en programas de educacin
especial. Un rasgo deseable de la muestra es que 7% de los nios
estaba dentro de las categoras de discapacidad para el aprendizaje,
trastornos emocionales y discapacidades del habla/lenguaje, etc., y
5% de la muestra incluy a nios dentro de programas para
individuos talentosos. La confiabilidad del WISC-III es comparable a la
del WAIS-R: las tres puntuaciones de CI (Verbal, de Ejecucin y Total)
muestran confiabilidades de divisin en mitades y test-retest dentro
del tango de .90; mientras las subpruebas individuales poseen
coeficientes de divisin en mitades un poco ms bajos, que van de .69
(Composicin de Objetos) a .87 (Vocabulario y Diseo con Cubos). La
confiabilidades test-retest tienden a ser ligeramente ms bajas.
La validez del WISC-III depende, en parte, de su superposicin con el
WISC-R, para

el cual se pueden citar docenas de estudios de

sustentacin. No se desea abrumar con detalles excesivos, de modo


que se refiere al lector interesado a Sattler (1988) para una buena
revisin de los estudios anteriores. El Manual del WISC-III cita un
impresionante conjunto de estudios de validez, que se resumirn aqu.
Los

estudios

preliminares

indican

fuertes

correlaciones

con

las

puntuaciones del WISC-R (r = .90 para el CIV; .81 para el CE y .89


para el CIT), fuertes correlaciones con las puntuaciones del WAIS-R
en el caso de personas de 16 aos de edad (r = .90 para el CIV; .80
para el CE y .86 para el CIT) y correlaciones un poco menores, pero
confirmatorias, con las puntuaciones del WPPSI-R en una muestra de
nios de 6 aos de edad. Estas correlaciones son casi tan altas como
lo permitiran las confiabilidades de las escalas -respectivas. Un
descubrimiento interesante, que se analiza en el siguiente captulo, es
98

que los CI del WISC-llI son, en promedio, aproximadamente cinco


puntos menores que los CI del WISC-R (Vance, Maddux, Fuller y
Awadh, 1996).
El WISC-lll tambin muestra correlaciones confirmatorias de la teora
con numerosas pruebas cognitivas, de capacidad y de rendimiento
(Wechsler, 1991). Por ejemplo, en un estudio con 27 nios entre los 7
a 14 aos de edad a los que se les aplicaron tanto el WISC-III como
las Differential Ability Scales (Escalas de Capacidad Diferencial, DAS;
Elliott,

1990),

las

puntuaciones

del

CIV

del

WISC-III

se

correlacionaron en .87 con las puntuaciones de Capacidad Verbal del


DAS, pero slo en .58 con las puntuaciones de Razonamiento no
Verbal de esa misma prueba. Por el contrario, las puntuaciones del
CE del WISC-llI se correlacionaron en .78 con las puntuaciones de
Razonamiento no Verbal, pero slo en .31 con las de Capacidad
Verbal. El Manual cita correlaciones consistentes con la teora apropiadamente

altas

para

constructos

similares,

bajas

para

constructos diferentes- con la Otis-Lennon School Ability Test (Prueba


de Capacidad Escolar Otis-Lennon), el Test de Retencin Visual de
Benton-Revisado,

subpruebas

de

la

Batera

de

Pruebas

Neuropsicolgicas Halstead-Reitan y el Wide Range Achievement Test


Revised (Prueba de Aprovechamiento de Amplio Rango-Revisada. Los
estudios con grupos especiales de nios -talentosos, con retraso
mental, discapacidad para el aprendizaje, hiperactividad, trastornos
de conducta, retraso en habla/ lenguaje- tambin proporcionan un
fuerte apoyo para la validez del WISC-III.
Los estudios analtico-factoriales de la muestra de estandarizacin
proporcionaron evidencia adicional de la utilidad del WISC-Ill en la
evaluacin diagnstica de nios. Los resultados de numerosos anlisis
factoriales, incluyendo los anlisis separados para cuatro subgrupos
segn la edad (de 6 a 7, 8 a 9,11 a 13 y 14 a 16 aos de edad)
constituyen una fuerte indicacin de una solucin de cuatro factores.
99

Los primeros dos factores son familiares en estudios previos de las


Escalas
Wechsler:
Comprensin Verbal

Organizacin Perceptual

Informacin

Figuras Incompletas

Semejanzas

Ordenacin de Dibujos

Vocabulario

Diseo con Cubos

Comprensin

Composicin de Objetos

El tercer factor en el WISC-III es un tanto diferente del de su


antecesor, y el cuarto factor es nuevo:
Libertad de la

Velocidad de Procesamiento

Distractibilldad
Aritmtica

Claves

Retencin de Dgitos Bsqueda de Smbolos


Una subprueba, Laberintos, revel una asignacin inconsistente a los
factores, con cargas dbiles en Libertad de la Distractibilidad para
nios de 6 a 7 aos y dbiles en Organizacin Perceptual para nios
de ocho aos y mayores.
La solucin de cuatro factores se presenta tambin en las otras
muestras, incluyendo pacientes psiquitricos infantiles (lupa, Wright y
Fristad, 1997), nios canadienses seleccionados de manera aleatoria
(Roid y Worrall, 1997) y nios que reciben educacin especial
(Konold, Kush y Canivez, 1997). En una nota discrepante, Riccio,
Cohen, Hall y Ross (1997) encontraron que los factores 3 y 4 no eran
importantes desde el punto de vista clnico, es decir, mostraban

100

relacin mnima con medidas independientes de atencin en una


muestra de nios con supuestos problemas de atencin.
La solucin de cuatro factores para el WISC-III da la posibilidad del
informe

opcional

de

Puntuaciones

de

ndice

-similares

las

puntuaciones de CI- para cada uno de los cuatro factores. Estas


puntuaciones se basan en la media familiar de 100 y desviacin
estndar de 15. Las Puntuaciones de ndice (ndice de Comprensin
verbal, ICV, ndice de Libertad de la Distractibilidad, ILD, etc.) se
derivan de la asignacin de las subpruebas que se lista antes y sirven
para complementar los CI Verbal y de Ejecucin. Este anlisis factorial
del WISC-III es particularmente til en la evaluacin discapacidades
para el aprendizaje y trastornos relacionados. En particular, los nios
con discapacidad para el aprendizaje tienen la probabilidad de obtener
puntuaciones bajas en el tercer factor, lo cual sugiere que la
distraccin puede subyacer a algunas formas de este trastorno
(Farnham-Diggory, 1978; Kaufman, 1979 Smith, 1983). Parker y
Atkinson

(1994

proporcionan

una

fundamentacin

mtodos

especficos para el clculo preciso (por el contrario de la mera


estimacin) de las puntuaciones factoriales del WISC-III.
ESCALA DE INTELIGENCIA STANFORD- BINET: CUARTA EDICIN
Con una herencia que data de la escala Bidet-Simon de 1905, la
Stanford-Binet: Cuarta Edicin (SB:CE) tiene el linaje ms antiguo, y
quiz ms prestigioso, de cualquier prueba de inteligencia individual.
En el cuadro 6-3 se resumen algunos de los hitos importantes en el
desarrollo

de

la

Stanford-Binet

sus

predecesoras.

La

SB:CE

incorpora las principales revisiones en cuanto a fundamentacin


terica y contenido de las pruebas de inteligencia. Aunque se han
conservado muchos de los tipos de reactivos de las anteriores escalas
Binet-Simon, la SB:CE es, en realidad, una nueva prueba que
comparte slo una modesta superposicin con sus antecesoras.
101

Cuadro 12. Hitos en el desarrollo de la Stanford-Binet y sus


pruebas antecesoras.
Ao

Pruebas/

Comentario

Autores
1905

Bidet y Simon

Prueba simple de 30 reactivos

1908

Bidet y Simon

Introduccin del concepto de edad


mental

1911

Bidet y Simon

Extensin para incluir a los adultos

1916

Stanford

Introduccin del concepto de CI

Binter
Terman

Merrill
1937

Stanford-

Primera

Binet-2

paralelas (I y M)

Terman

utilizacin

de

formas

Merrill
1960

Stanford-

Utilizacin de mtodos modernos de

Binet-3

anlisis de reactivos.

Terman

Merrill
1972

Stanford-

Reestandarizacin de la SB-3 con

Binet-3

2100 personas

Thomdike
1986

Stanford-

Reestructuracin

Binet-4

subpruebas

Thomdike,
Hagen
y Sattler

102

completa

en

15

MODELO DE INTELIGENCIA DE LA SB:CE


La ms importante de las alteraciones de la SB:CE es un modelo
jerrquico de la inteligencia con mltiples subpruebas. En ediciones
anteriores, el examinador slo obtena una puntuacin mixta de CI.
Aunque

poda

respuestas

analizarse

correctas

proporcionaban

una

de

manera

incorrectas,

base

para

el

cualitativa

las

pruebas

anlisis

el

patrn

de

anteriores

no

cuantitativo

de

los

subcomponentes de toda la escala. Esta deficiencia se corrige en la


SB:CE, que est formada por 15 subpruebas diseadas para evaluar la
capacidad en cuatro reas: verbal, abstracta/visual, cuantitativa y de
memoria a largo plazo. Debido a que las diferentes subpruebas son
adecuadas pana distintas edades, a un individuo slo se le aplican de
8

10

subpruebas.

Por

tanto,

la

SB:CE

produce

hasta

10

puntuaciones de subprueba, cuatro puntuaciones de rea y una


puntuacin mixta (que ya no se denomina CI) basada en toda la
prueba.
Los autores de la SB:CE adoptaron un modelo jerrquico de tres
niveles de la estructura de las capacidades cognitivas como una gua
para la construccin de esta prueba (cuadro 12). El primer nivel es el
de capacidad general g, que los autores definen como la unidad
cognitiva y los procesos de control que un individuo utiliza en la
organizacin de estrategias adaptativas para la solucin de problemas
nuevos (Thorndike, Hagen y Sattler, 1986). Tomando una extensa
muestra de un amplio rango de tareas cognitivas, los factores
especficos

de

cualquier

subprueba

particular

disminuyen

en

importancia y la posicin de la persona examinada en el desempeo


combinado se vuelve un reflejo indirecto del factor de inteligencia g.

103

g
Primer nivel

Segundo
nivel

Capacidades
cristalizadas

Tercer nivel Razonamient


o verbal

subpruebas

Vocabulario
Comprensin
Absurdos
Relaciones
verbales

Capacidades
fluidasanalticas

Razonamient
o cuantitativo

Razonamient
o
abstracto/vis

Cuantificacin
Series de
nmeros
Construccin
de ecuaciones

Anlisis de
patrones
Copiado
Matrices
Doblado y corto de
papel

Memoria a
corto plazo

Memoria de
cuentas
Memoria de frases
Memoria de
dgitos
Memoria de
objetos

El segundo nivel parece reconocer una aceptacin de la perspectiva


modificada de Cattell-Horn acerca de la inteligencia (p. ej., Hom y
Cattell, 1966) por parte de los autores de la SB:CE. Sin embargo,
adems de la distincin entre inteligencia cristalizada/fluida propuesta
por Cattell y Hora, los autores han aadido un factor independiente de
memoria a cono plazo que se basa en cuatro subpruebas. La SB:CE
enfatiza las habilidades de memoria a un grado mucho mayor que
cualquier otra prueba de inteligencia general. Cuando el examinador
desea una evaluacin amplia de la memoria a corto plazo, la SB:CE
puede muy bien ser el instrumento de eleccin. El factor de
capacidades cristalizadas representa las habilidades relacionadas con
la escuela, como el vocabulario y las habilidades cuantitativas. El
factor de las capacidades fluidas-analticas es, en gran medida, un
104

sinnimo del constructo de CattellHora acerca de la inteligencia fluida


y tipifica las habilidades cognitivas necesarias para resolver problemas
nuevos que contienen estmulos no verbales y figurativos.
El tercer nivel atae en realidad slo al factor de las capacidades
cristalizadas, que los autores de la SB:CE dividen en dos reas:
razonamiento verbal y razonamiento cuantitativo. A este nivel, las
capacidades

fluidas-analticas

reciben

la

etiqueta

alternativa

de

razonamiento abstracto/visual. Los autores sealan que estos factores


son ms especficos y ms dependientes del contenido que los
factores en el primero y segundo niveles. stos se incluyen en el
modelo debido a que tienen un significado especial para clnicos y
educadores (Thorndike, Hagen y Sattler, 1986). En resumen, el
examinador obtiene hasta 10 puntuaciones de subprueba, cuatro
puntuaciones

de

rea

<Razonamiento

verbal,

Razonamiento

cuantitativo, Razonamiento abstracto/visual y Memoria a cono plazo)


y una puntuacin mixta total.
SUBPRUEBAS DE LA SS:CE
La ltima edicin de la Stanford-Binet incluye 15 subpruebas, pero no
todas se aplican a todos los grupos por edad. Por ejemplo, Relaciones
Verbales y Construccin de Ecuaciones son demasiado difciles para
nios pequeos y, por lo comn, se aplican a personas de ocho aos
en adelante. En contraste, Absurdos y Copiado son demasiado fciles
para personas mayores y, por lo comn, se aplican slo a individuos
menores de 10 aos de edad. Seis subpruebas abarcan todos los
grupos por edad: Vocabulario, Comprensin, Cuantificacin, Anlisis
de Patrones, Memoria de Cuentas y Memoria de Oraciones.
Nueve de las subpruebas de la SB:CE se basan en los tipos de
reactivos que aparecen en ediciones anteriores. Sin embargo, por
105

primera vez los reactivos similares se agrupan en subpruebas. En


ediciones previas de la Stanford-Binet, los reactivos se agrupaban por
nivel de edad y no por contenido. Seis de las subpruebas de la SB:CE
son nuevas y ayudan a corregir el fuerte nfasis verbal de las
versiones

anteriores.

Las

nuevas

subpruebas

proporcionan

una

cobertura ms representativa de las tareas cuantitativas, espaciales y


de memoria a cono plazo. Las subpruebas de la SB:CE se describen en
el cuadro 6-4.

Cuadro 13. Descripcin de las subpruebas de la Stanford-Binet.


Cuarta Edicin
Razonamiento verbal
Vocabulario: Comienza con 14 reactivos pictricos de vocabulario en
los que la tarea del nio pequeo consiste en identificar el objeto
representado en el dibujo; contina con 32 palabras que er sujeto
debe definir. Las palabras difciles de vocabulario son similares a:
renuente

teratognico

pusilnime

Comprensin: Reactivos sencillos incluyen la identificacin de partes


del cuerpo humano, mientras que los difciles requieren juicio social,
razonamiento y evaluacin. Un ejemplo de un reactivo difcil es:
Cules son algunas de las razonas por las que debe requerirse que
un trabajador nuevo se una al sindicato de trabajadores que
representa a sus compaeros?
Absurdos: Esta subprueba se extiende slo hasta los 9 aos de edad
y requiere que la persona examinada identifique la incongruencia en
las ilustraciones Esta tarea demanda percepcin de los detalles,
concentracin y comprensin social. Un reactivo caracterstico podra
representar a una persona que claramente camina hacia adelante en
la arena, con huellas al frente de olla, pero sin ninguna huella detrs.
106

Relaciones verbales: A la persona examinada se le lee (y tambin


puede ver) una lista de cuatro palabras, con instrucciones de expresar
la semejanza entre las primeras tres cosas, pero la diferencia con
respecto

una

cuarta,

Esta

subprueba

requiere

formacin

de

conceptos y razonamiento verbal. Ejemplo: En qu se diferencian


una marsopa un delfn y una ballena de un tiburn?
Razonamiento abstracto/visual
Anlisis de patrones: Los reactivos fciles implican colocar formas
recortadas en los huecos de un tablero de formas, mientras que los
reactivos difciles demandan que la persona reproduzca diseos
complejos por medio de cubos. Los reactivos difciles requieren
organizacin perceptual y visualizacin, espacial, mientras que los
reactivos de tablero de formas requieren capacidades visomotoras y
de manipulacin.
Copiado: En el caso de nios menores de 10 aos, el sujeto debe
reproducir un modelo simple de cubos slidos (para individuos muy
pequeos) o copiar un diseo con papel y lpiz. Esta subprueba
requiere que la Porsons integre los procesos perceptual y motor.
Matrices: La tarea de la persona consiste en seleccionar el objeto,
diseo o letra que complete mejor la matriz. Esta subprueba requiere
razonamiento perceptual y tiene fuertes cargas en inteligencia fluida.
Doblado y cortado de papel: Es una prueba de opcin mltiple en la
que la persona examinada debe identificar cmo se vera un trozo de
papel que se ha doblado y cortado si se le desdoblara Esta subprueba
demanda visualizacin pensamiento espaciar y atencin a seales
visuales. Doblado y cortado de papel contribuye de manera sustancial
al factor de Razonamiento no verbal/visualizacin.
Razonamiento cuantitativo
Cuantificacin: Las tareas en esta subprueba van desde el conteo
simple hasta los conceptos y operaciones aritmticas ms completos,
107

Esta subprueba es similar a Aritmtica en las escalas Wechsler pero


depende menos de la educacin formal. Un ejemplo de un reactivo
difcil es: Cuntas losetas de 10cm por 10cm se necesitan para
cubrir una seccin de piso de 1 m por 1 m?
Series

de

nmeros:

La

persona

examinada

debe

llenar

una

secuencia numrica con el siguiente nmero lgico. Esta subprueba


mide razonamiento lgico y requiere persistencia flexibilidad y un
enfoque de ensayo-error para los problemas difciles. Un ejemplo de
un reactivo difcil es: Cuales son los nmeros siguientes? 5,10, 9,
18, 17, 34, 33, _____, ____.
Construccin

de

Ecuaciones:

El

sujeto

debe

reordenar

correctamente una ecuacin aritmtica desordenada Como en el caso


de nmeros, esta subprueba demanda lgica. Flexible y persistencia.
Un ejemplo de un reactivo difcil es:1/4 4 6 10 - / =
Memoria a corto plazo
Memoria de cuentas: Utilizando cuatro formas de cuentas de tres
diferentes colores (un total de 12 tipos da cuentas), la persona
examinada debe reproducir un diseo en fotografa colocando cuentas
reales en una estaca. Sin embargo, el diseo est a la vista slo
durante cinco segundos de modo qu la tarea debe llevarse a cabo de
memoria. No tiene lmite de tiempo.
Memoria de frases: La persona debe repetir al pie de la letra frases
presentadas de manera oral. Esta subprueba tiene fuertes cargas en
Comprensin verbal a edades de 2 a 7 aos, pero es una buena
medidas factor de Memoria para sujetos mayores. Ejemplo de una
frase difcil es: A medida que los profesores se hacen ms viejos, en
general les parece cada vez menos importante publicar muchos
artculos breves cada ao.
Memoria de dgitos: Esta subprueba es esencialmente idntica a
Retencin de Dgitos de las pruebas Wechsler. Mide memoria auditiva
108

a corto plazo y libertad de la distractibilidad. Incluye dgitos en orden


progresivo y dgitos en orden inverso.
Memoria de objetes: En esta subprueba, a la persona se le nuestra
una serte de ilustraciones de objetos individuales a una frecuencia de
una por segundo. Despus de que se han presentado todas las
tarjetas para un reactivo, al Individuo debe elegir los objetos
mostrados entre aqullos presentados en una tarjeta que contiene de
5 a 13 elementos. Para obtener un crdito completo, el sujeto debe
sealar a los objetas cortados en el mismo orden en queso le
mostraron. Esta subprueba contribuye de manera sustancial al factor
di Memoria en todos los niveles de edad.
Nota:

Estos reactivos se parecen a los de la Stanford-Binet, pero

en realidad no se encuentran dentro de la prueba.


ESTANDARIZACIN

DE

LA

SB:CE

PROPIEDADES

PSICOMTRICAS
La muestra de estandarizacin se aplic a 5013 individuos con edades
de 2 a 24 aos. Se utilizaron los datos del censo de EUA para 1980
con el fin de derivar la representacin proporcional en cinco variables:
regin geogrfica, tamao de la comunidad, grupo tnico, edad y
sexo. Tambin se obtuvieron datos sobre clase social. Debido a que
haba un exceso de nios cuyos padres provenan de categoras socioeconmicas altas (43% de la muestra contra 19% de la poblacin), se
utilizaron procedimientos de ponderacin para equilibrar los datos de
estandarizacin. Los nios con antecedentes socioeconmicos ms
altos se contaron como slo una fraccin de un caso (tan poco como
0.28 para algunos grupos por edad) a fin de ajustar el exceso de
individuos de las categoras socioeconmicas altas dentro de la
muestra. Este es un procedimiento estadstico razonable y reconocido
que mejora los datos de estandarizacin. En general, parece ser que
109

los datos normativos para la SB:CE son bastante representativos de la


poblacin blanco.
Con excepcin de Memoria de Objetos, la confiabilidad de las
subpruebas de la SB:CE es buena, a juzgar por los coeficientes Kuder
Richardsin de consistencia interna dentro de los rangos de .80 y .90
obtenidos con casi todos los grupos por edad. La confiabilidad de
Memoria de objetos fue slo regular, con coeficientes de consistencia
interna que por lo general se encuentran en la parte baja del tango de
.10. La confiabilidad de las puntuaciones de rea es sobresaliente, en
especial cuando se utiliza un complemento Integro de subpruebas
para obtener una puntuacin de rea (los coeficientes de consistencia
interna se encuentran en la paste superior del rango de .90). La
puntuacin mixta es excepcionalmente confiable, con coeficientes KR20 que van de .95, a la edad de dos aos, a .99 a edades de 18 a 23
aos. La confiabilidad test-retest se evalu en muestras de nios de 5
y 8 aos de edad. Con un intervalo promedio de 16 semanas entre
sesiones las confiabilidades en el retest se colocaron dentro del rango
de .90 para la puntuacin mixta, mientras las puntuaciones de rea y
de subprueba demostraron un patrn ms variable por ejemplo,
muchas de las confiabilidades en el retest se colocaron en los rangos
de .60 y .70. que es demasiado bajo para la torna de decisiones
acerca de los individuos. En pocos casos, las confiabilidades de
subprueba fueron extremadamente bajas: .28 para Cuantificacin, .46
para copiado y .51 para Razonamiento Cuantitativo, en la muestra de
nios de ocho dos de edad, y .56 para Memoria de Cuentas en el caso
de la muestra de nios de cinco aos. Los examinadores haran bien
en interpretar con precaucin las puntuaciones en estas subpruebas.
APLICACIN Y CALIFICACIN DE LA SB:CE
La SB:CE utiliza la primera subprueba, Vocabulario, como una prueba
directiva para el resto del examen. El propsito de una prueba
110

directiva consiste en reducir al mnimo el nmero total de reactivos


aplicados al saltarse los reactivos fciles de subprueba que, casi con
absoluta seguridad, la persona examinada aprobarla de todas formas.
Con base en la edad cronolgica y la puntuacin de Vocabulario, el
examinador consulta un cuadro para determinar el nivel de entrada
para todas las subpruebas restantes. Adems, el examinador debe
establecer un nivel basal y uno superior para cada subprueba. En el
caso de pruebas como la SB:CE en las que los reactivos de subprueba
Se califican de los ms fciles a los ms difciles, el nivel basal es el
punto bajo en el cual casi con toda seguridad la persona respondera
de manera conecte a todas las preguntas. El nivel basal se encuentra
cuando se aprueban los cuatro reactivos en dos niveles consecutivos.
A veces, el examinador debe dirigirse hacia abajo del nivel de entrada
para encontrar el nivel basal. El nivel superior es aqul por encima del
cual casi con toda seguridad el individuo fallara en todos los reactivos
restantes. La prueba descontina en el nivel superior, que Se
encuentra cuando la persona reprueba ya sea en 3 de los 4 o en los 4
reactivos completos en dos niveles consecutivos.
Cada reactivo se aprueba o reprueba de acuerdo con normas muy
especificas. Se proporcionan guas extensas de calificacin para cinco
subpruebas:

Vocabulario,

Comprensin,

Absurdos

Copiado

Relaciones Verbales. Estas subpruebas requieren respuestas libres


(lo contrario de respuestas de opcin mltiple) y puede necesitarse
cierta cantidad de juicio para la calificacin de cierta cantidad de juicio
para la las respuestas poco convencionales. Los autores de la SB:CE
no informan los estimados de confiabilidad intercalificadores; sin
embargo, con base en la experiencia con otras pruebas, es poco
frecuente que las diferencias entre examinadores en la interpretacin
de las pautas de calificacin constituyan una fuente comn de error de
medicin (Gregory, 1999).
111

VALIDEZ DE LA SB:CE
La validez relacionada con el criterio de la SB:CE ha sido el terna de
numerosas

investigaciones

que

correlacionan

las

puntuaciones

obtenidas en este instrumento con las puntuaciones de otras pruebas


de inteligencia y aprovechamiento. El Manual Tcnico es inusualmente
frtil en este sentido, presenta una multitud de estudios que
comparan o correlacionan las puntuaciones de la SB:CE con otras
medidas. En general, este instrumento se correlaciona bastante bien
con otras pruebas individuales de inteligencia. Lo que es ms, el
patrn de correlaciones ente las puntuaciones de rea de la SB:CE y
las subpuntuaciones de otras pruebas es, en general, confirmatorio -la
subescalas similares muestran correlaciones ms altas que aquellas
que son diferentes. Por ejemplo, el Cl Verbal de las escalas Wechsler
se correlaciona mejor con la puntuacin de Comprensin Verbal de la
SB:CE (una medida similar) que con la puntuacin de Razonamiento
Abstracto/Visual ce la SB:CE (una medida diferente).
Varios estudios han investigado la validez de constructo de la SB:CE
con anlisis factoriales confirmatorios diseados para establecer si la
prueba corresponde a la teora que gui su construccin (Kline. 1989;
Laurent, Swerdlik y Rybum, 1992; Kaplan y Alfonso, 1997; Thomdike.
Hagen y Sattler, 1986). En general, los estudios prestan poco apoyo a
la existencia de los cuatro factores planteados en la construccin de la
prueba

(razonamiento

razonamiento

verbal,

razonamiento

cuantitativo,

abstracto/ visual y memoria a corto plazo). Por

ejemplo, Kline (1989) concluy que la solucin dedos factores de


Sattler (1988) funciona mejor para edades de 2 a 6 aos, mientras la
solucin de tres factura se adapta mejor a los grupos de mayor edad.
Con base en una amplia resea de estudios de validez, Laurent,
Swerdlik y Ryburn (1992) tambin concluyeron que la SB:CE es una
112

prueba bifactorial para edades de 2 a 6 aos (verbal, no verbal) y una


prueba trifactorial para edades de siete aos y mayores (verbal, no
verbal memoria). Sin embargo. Thorndike (1990) defiende el modelo
original de cuatro factores. En parte, el debate se reduce a la eleccin
del anlisis factorialcorrecto (McCallum, 1990).
La SB:CE es, sin lugar a dudas, mejor que las ediciones anteriores de
esta prueba. Uno de

los principales cambios -el desglose

del

desempeo general en puntuaciones de rea y subprueba- es una


adicin bienvenida y til al examen de la inteligencia; adems,
incorpora una buena cantidad de reactivos muy fciles en la mayor
parte de las subescalas. En consecuencia, el examinador obtiene una
imagen mucho ms precisa del funcionamiento de bajo nivel en nios
y adultos jvenes. Para la evaluacin del retaso mental o el dao
cerebral

significativo,

la

SB:CE

es

superior

casi

todos

sus

competidores, en especial aqullos corno el WAIS-R cuyo CI Total


toca fondo a mitad en las puntuaciones 50. Otra ventaja de la SB:CE
es que cuatro subpruebas evalan memoria a corto plazo. Cuando el
problema de referencia implica memoria a corto plazo. Cuando el
probable que la SB:CE sea el instrumento a elegir.
Sin embargo, la SB:CE tiene varias deficiencias. El problema ms
grave es la falta de uniformidad de las puntuaciones mixtas. Las
puntuaciones ms altas y ms bajas posibles fluctan de manera
bastante notable a travs de los diversos grupos por edad. Por
ejemplo, la puntuacin mixta ms alta posible para las ala-desde 2 a
12 dos es de 164, pero, despus de esa edad, el nivel superior cae
hasta 149. Otro problema significativo es la falta de una batera
comparable para todos los niveles de edad que cubre esta prueba. A
los nios no se les aplican las mismas subpruebas que a los individuos
de mayor edad. Otro problema con la SB:CE es la confusin acerca de
113

su estructura factorial. Cuntos factores existen, 2.304? Parece


haber surgido un consenso de que los cuatro factores propuestos por
Thorndike a al. (1986) no se sustentan en la evidencia y que la
solucin dedos factores describe el desempeo en prueba de nios en
edad preescolar, mientras la solucin de tres factores funciona mejor
en el caso de nios de siete dos en adelante (Laurent et al., 1992).
Otra preocupacin es la posibilidad de comparacin de los resultados
de la SB:CE con otras pruebas de inteligencia. Prewett y Matavich
(1994) encontraron que las puntuaciones mixtas de prueba de la
SB:CE eran, en promedio, siete puntos ms altas a las del CI del
WISC-III

en

una muestra

de

nios

canalizados.

Peor

an,

la

puntuacin de Razonamiento Verbal de la SB:CE era 12 puntos mayor,


en promedio, que el CI Verbal del WISC-III. La enorme diferencia en
puntuaciones verbales es perturbadora porque indica que las dos
pruebas daran impresiones diagnsticas sumamente diferentes en
casos individuales. Sin embargo, es poco claro si las puntuaciones de
la SB:CE son demasiado altas o si las puntuaciones del WISC-III son
demasiado bajas (o quizs estn en juego ambos efectos).
PRUEBAS DETROIT DE APTITUD PARA EL APRENDIZAJE-4
Las Detroit Tests of Learning Aptitud-4 (DTLA-4; Pruebas Detroit de
Aptitud para el Aprendizaje; Hammill, 1999) es una revisin reciente
de un instrumento que se public por primera vez en 1935. La prueba
se aplica de manera individual y est diseada para nios escolares
entre 6 y 17 aos de edad. La DTLA-4 consiste en 10 subpruebas que
forman la base para el clculo de 16 puntuaciones mixtas (incluyendo
inteligencia general, nivel ptimo)

y 14 reas de capacidad. Las

subpruebas se encuentran, en gran medida, dentro de la tradicin


Binet-Wechsler, aunque existen algunas sorpresas, pues incluye una
medida de la capacidad narrativa de Construccin de historias (cuadro
6-5).
114

Cuadro 14. Descripcin breve de las subpruebas de la DTLA-4


Sub prueba

Tarea

Palabras opuestas

Proporcionar

antnimos

(palabras opuestas)
Secuencias de diseos

Discriminar

recordar

material grfico sin sentido.


Imitacin de oraciones

Repetir

oraciones

presentadas de manera oral.


Letras invertidas

Memoria visual a corto plazo


y atencin.

Construccin de historias

Crear una historia lgica a


partir de varias ilustraciones.

Reproduccin de diseos

Copiar diseos de memoria

Informacin bsica

Conocimiento de informacin
y hechos cotidianos.

Relaciones simblicas

Seleccionar entre una serie


de diseos la parte faltante
de un diseo anterior.

Secuencias de palabras

Repetir una serie de palabras


sin relacin entre s.

Secuencias de historias.

Organizar
pictrico

materiales
en

secuencias

significativas.
La puntuacin mixta de Capacidad Mental General se forma con la
combinacin de las puntuaciones estndar de las 10 subpruebas en la
batera. La puntuacin mixta de Nivel ptimo se basa en las cuatro
puntuaciones estndar ms altas obtenidas por el individuo y se
considera

que

representa

el

desempeo

de

la

persona

bajo

circunstancias ptimas. Cada una de las 14 puntuaciones restantes de


las combinaciones se deriva de una mezcla de varias subpruebas que
115

se

considera que miden un atributo

comn. Por

ejemplo, las

subpruebas que implican el conocimiento de palabras y su utilizacin


se combino para obtener la puntuacin mixta Verbal, mientras las
subpruebas que no implican lectura, escritura o habla comprenden la
puntuacin mixta No Verbal. Varias de las puntuaciones mixtas estn
diseadas para representar los principales constructos dentro de las
teoras actuales de la inteligencia. Adems de las puntuaciones mixtas
del Nivel Mental General y del Nivel ptimo, las 14 puntuaciones
mixtas restantes de la DTLA-3 son las siguientes:
Verbal

No verbal

(Lingstica)

Atencin

Atencin

(de Atencin)

Incrementada
Motriz

Reducida
Motriz

Incrementada

(Motora)
Reducida

Huida

Cristalizada (Hom y Cattel])

Simultnea

Sucesiva

(Das)

Asociativa

Cognitiva

(Jensen)

Verbal

Ejecucin

(Wechsler)

Las 16 puntuaciones mixtas se basan en la media de 100 y en la


desviacin estndar de 15 ya familiares. Las 10 subpruebas se
normaron para una media de 10 y desviacin estndar de 3.
Las puntuaciones mixtas se disearon para ofrecer evaluaciones
contrastantes, de modo que una diferencia entre puntuaciones pueda
ser de importancia diagnstica. Por ejemplo, un individuo que obtiene
una puntuacin alta en aptitud de Atencin-Reducida pero baja en
aptitud de Atencin-Incrementada (en el dominio de atencin),
supuestamente sufre de dificultades para la rememoracin inmediata,
memoria a corto plazo o concentracin enfocada.

116

La DTLA-4 se estandariz con 1350 estudiantes cuyos antecedentes


eran muy semejantes a los datos del censo en cuanto a sexo, raza,
residencia urbana/rural, ingreso familiar, Jopos educativos de los
padres y rea geogrfica. La confiabilidad de este instrumento es
similar a la de otras pruebas individuales de inteligencia, con
coeficientes de consistencia interna que por lo general superan a .80
en el caso de las subpruebas, y a .90 en el caso de las puntuaciones
mixtas. Asimismo, los coeficientes test-retest para las subpruebas y
puntuaciones mixtas se encuentran en los rangos de .80 y .90. La
validez relacionada con el criterio se estableci adecuadamente a
travs de estudios correlativos con otros instrumentos establecidos,
como el WISC-III, K-ABC y la Batera Woodcock-Johnson.
Una preocupacin con la DTLA-4 es que la divisin conceptual en
puntuaciones mixtas no se sustenta lo suficiente en la evidencia
emprica. Por ejemplo, aunque puede ser cierto que la puntuacin
mixta

Simultnea

mida

los

procesos

cognitivos

simultneos

propuestos por Das, Kirby y Jarman (1979), existe poco apoyo


emprico para apuntalar esta afirmacin. Otro problema con el
instrumento

es

que

existen

ms

puntuaciones

mixtas

que

subpruebas! Es inevitable que tales puntuaciones tengan fuertes


intercorrelaciones, dado que cada subprueba ocurre dentro de varias
puntuaciones mixtas. En resumen, la DTLA-4 puede utilizarse como
una buena medida de la inteligencia general, pero el empleo de las
puntuaciones mixtas con propsitos de planificacin psicoeducativa requiere estudios empricos adicionales. Schmidt (1994) proporciona
una amplia revisin de la
DTLA-3.

117

TEST BREVE DE INTELIGENCIA DE KAUFMAN (K-BIT)


Las pruebas de inteligencia analizadas antes y en el tema anterior son
medidas excelentes de la capacidad intelectual, pero no dejan detener
defectos. Un problema es el tiempo que se requiere para aplicarlas.
Las sesiones de prueba con las Escalas Wecbsler, la Batera Kaufman
de Evaluacin para Nios y la Stanford-Binet pueden durar una hora y
no es poco comn que se utilicen dos horas si el nio es inteligente y
propenso a hablar demasiado. Una segunda desventaja de estas
pruebas tan conocidas es la cantidad de entrenamiento que se
requiere para aplicarlas. La aplicacin adecuada de la mayora de las
pruebas individuales de inteligencia se basa en la suposicin de que el
examinador tiene un ttulo a nivel avanzado en psicologa o en un
campo

relacionado

que

ha

tenido

amplia

experiencia

bajo

supervisin con los instrumentos en cuestin.


Alan Kaufman respondi a la necesidad de una medida breve de
inteligencia, con fines de deteccin y de aplicacin fcil, al desarrollar
el Test Breve de Inteligencia de Kaufman (K-BIT, Kaufman y
Kaufman, 1990; Kaufman y Wang, 1992). El K-BIT consiste en una
seccin de Vocabulario y una de Matrices. La primen contiene dos
partes:

Vocabulario

expresivo

(nombrar

dibujos)

Definiciones

(proporcionar una palabra con base en una frase breve y en ortografa


parcial). La prueba de Matrices requiere resolver analogas de
matrices de 2 x 2 y 3 x 3 utilizando estmulos abstractos.
Las normas de la K-BIT se establecieron para personas entre 4 y 90
aos de edad y se puede aplicar en 15 a 30 minutos. En esta prueba
se obtienen puntuaciones estndar con media de 100 y DE de 15 para
Vocabulario, Matrices y la combinacin de ambas, llamada Puntuacin
Mixta de CI. A pesar de la comparabilidad de estas dimensiones de
calificacin con pruebas de inteligencia muy conocidas, los autores de
118

la K-BIT aclaran que su instrumente no tiene el propsito de sustituir


a los enfoques tradicionales (p.ej., WPPSI-R, K-ABC, WISC-III o
SB:CE). La K-BIT es principalmente una prueba de deteccin til para
sealar la necesidad de una evaluacin ms amplia. La brevedad de
este instrumento tambin lo hace la opcin natural para investigacin
sobre inteligencia.
Los datos de confiabilidad para la K-BlT son excepcionalmente fuertes.
La confiabilidad de divisin en mitades y los coeficientes test-retest
para una variedad de muestras se colocaron en el rango de .90 para
Vocabulario, .80 y .90 para Matrices y .90 para la Puntuacin Mixta de
CI. La muestra normativa de 2 022 personas estuvo dentro de 1 a 3
puntos porcentuales con respecto alas cifras del censo de EUA para
1990 en cuanto a gnero, regin geogrfica, raza u origen tnico y
logros educativos de los padres (edades de 4 a 19 aos) o de los
individuos examinados (edades de 20 aos en adelante).
El Manual de la K-BIT presenta datos de validez sumamente faenes,
con base en 20 estudios de correlacin. Estos resultados son similares
a un estudio reciente de la validez concurrente en el que se
compararon los resultados de la K-BIT con las puntuaciones del WAISR

de

200

individuos

canalizados

un

centro

de

evaluacin

neuropsicolgica (Naugle, Chelune y Tucker, 1993). La muestra de


pacientes incluy a personas con trastornos convulsivos, lesiones
enceflicas, abuso de sustancias, trastorno psiquitrico, embolia,
demencia y otros padecimientos neurolgicos. La heterogeneidad de
la muestra de pacientes garantiz tan amplio tango de capacidad
funcional, un rasgo deseable en un estudio de validacin. Aunque las
puntuaciones de la K-BIT tendieron a ser aproximadamente cinco
veces ms elevadas que los datos obtenidos del WAIS-R, las correladones

entre

estos

dos

instrumentos

fueron

muy

altas

y
119

constituyeron una confirmacin de la teora. El CI de Vocabulario (KBIT) y el Cl Verbal (WAIS-R) se correlacionaron en .83, el Cl de
Matrices (K-BIT) y el CI de Ejecucin (WAIS-R) se correlacionaron en
.77 y los CI totales de ambos instrumentos tuvieron una sorprendente
correlacin de .88. En un estudio en ti que se compararon las
puntuaciones

de

la

K-BIT

del

WISC-III

de

50

estudiantes

canalizados. Prewett (1995) tambin inform fuertes correlaciones (r


= .78 para las puntuaciones totales) y descubri que las puntuaciones
de la K-BIT tendan a ser cinco veces mayores que sus equivalentes
en el WISC-III. Canivez (1995) encontr puntuaciones comparables
entre la K-BIT y el WISC-III para 137 nios de educacin primaria y
media y tambin inform correlaciones muy fuertes entre las dos
pruebas, en especial para las puntuaciones totales (r .87). Eisenstein
y

Engelhart

(1997)

encontraron

que

la

K-BIT

tena

un

buen

desempeo en cuanto a estimar los CI de adultos canalizados por


trastornos

neuropsicolgicos,

pero

Donders

(1995)

recomienda

precaucin cuando se utilice la prueba con nios que sufren lesin


cerebral. La razn es que las puntuaciones de la K-BIT muestran una
relacin insignificante con la duracin del coma, es decir, la prueba no
es un buen ndice del estado neuropsicolgico de los nios. Aun as, la
K-BIT es una medida sobresaliente de deteccin de a inteligencia
general para utilizase en investigacin o cuando las restricciones de
tiempo impiden el uso de una medida ms larga.

120

RESPONDA SEGN CORRESPONDA:


1.- La primera escala de inteligencia Wechsler Bellevue (1939) se
diseo para rectificar

varios defectos

que se habian observado

en las pruebas anteriores entre ellas:


a.b.c.d.2.- Seale Ud. Dos caractersticas comunes de la prueba Wechsler:
a.b.3.- Wechsler en 1939,

defini la inteligencia como: la capacidad

total o global del individuo para actuar de manera propositiva,


pensar de manera racional y manejar de manera eficaz su
ambiente:
V( )

F( )

4.- Refierase brevaemnte a la estandarizacion del Wais III:


-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------5.-La prueba Standford Binet: cuarta edicin, no adopta un modelo
jerarquico de inteligencia:
V( )

F( )
121

PRUEBAS GRUPALES DE
INTELIGENCIA
Una prueba grupal de inteligencia permite evaluar de manera rpida y
eficiente a docenas o cientos de personas al mismo tiempo. En este
tema se presenta al lector una muestra de pruebas grupales destacas.
Para bien o para mal, el nmero de pruebas grupales que se
comercializan en la actualidad es simplemente sorprendente se
encuentran disponibles veintenas de ellas. En los nmeros recientes
del

Mental

Measurements Yearbook

(Mitchell,

1985;

Conoley

Kramer, 1989, 1992) y de la serie de Test Critiques (Keyser y


Sweetland, 1984-1988) se presentan varias docenas de registros,
adems de que cada ao se publican instrumentos nuevos. La
cobertura amplia de este campo en crecimiento es simplemente
imposible. En consecuencia, aqu la informacin se centra en las

122

interrogantes surgidas de las pruebas grupales y despus se revisar


un muestrario eclctico de estos diversos instrumentos.
ORGENES Y CARACTERSTICAS DE LAS PRUEBAS GRUPALES
Las primeras pruebas grupales de inteligencia que tuvieron alguna
utilidad se desarrollaron a principios del siglo XX en EUA; sin
embargo, sus orgenes pueden ubicarse en los esfuerzos de los
psiclogos europeos del siglo XIX La prueba grupal de inteligencia
actual tiene una deuda, en especial con las tcnicas de llenado de
espacios en blanco que desarroll Ebbinghaus (18%), en el decenio de
1890. Su prueba consista en varios pasajes de un texto donde se
omitan palabras o partes de ellas, como en el siguiente ejemplo
breve:
Caperucita Roja
_____ una vez una pequea y dulce _____, amada por todos ____
que ____ sus ojos en ella. Su abue___ le regal una caperuza de seda
____, que llevaba ____ el tiempo. Le llamaban ______ Roja. Un
____, su madre le dijo: Tu ____ est enferma y dbil. _____le este
pastel y vino. No te salgas del
y no _____ con desconocidos.
La tarea del estudiante consista en llenar el mayor nmero de
espacios en blanco que fuera posible (en varias selecciones), con un
limite de tiempo de cinco minutos; por lo comn, una sola persona
aplicaba la tarea de llenado a un grupo completo. Slo en cuatro
ocasiones, en varios miles de casos, un estudiante lleg a llenar todos
los espacios en blanco. Ebbingbaus empleaba el nmero total de
respuestas correctas como una base para comparar a los individuos
en cuanto a su capacidad intelectual (DuBois, 1970).
Aos despus, el xito prctico de las escalas Binet inspir a los
psiclogos para desarrollar pruebas de inteligencia que pudieran
123

aplicarse de manera simultnea a grandes nmeros de personas. En el


capitulo anterior se ha sealado que la necesidad de someter a prueba
a miles de reclutas del ejrcito para la primera Guerra Mundial inspir
a los psiclogos en EUA (bajo la conduccin de Roben M. Yerkes) a
lograr rpidos avances en la psicometra y el desarrollo de pruebas.
Ocurrieron adelantos paralelos en los sistemas escolares, donde los
administradores deseaban tener medios eficaces para examinar y
asignar a los alumnos. Sin embargo, la tcnica de llenado de espacios
en blanco y las preguntas abiertas limitaban gravemente la eficacia de
la evaluacin. Las pruebas grupales evolucionaron rpidamente a su
diseo moderno: el formato de opcin mltiples.
DIFERENCIAS

ENTRE

LAS

PRUEBAS

GRUPALES

INDIVIDUALES
Las pruebas grupales difieren de las individuales en cinco aspectos:

Formato de opcin mltiple contra formato de preguntas abiertas.

Calificacin mecnica objetiva contra calificacin por parte del


examinador.

Aplicacin grupal contra individualizada.

Empleo con fines de deteccin contra empleo dirigido a la


planificacin de regularizacin.

Muestras

enormes

de

estandarizacin

contra

muestras

simplemente grandes.
Se analizar cada uno de estos conceptos por separado.
La diferencia ms obvia esquelas prueba grupales suelen emplear un
formato de opcin mltiple. Aunque las primeras pruebas de este tipo
utilizaban preguntas abiertas, esta caracterstica se dej de lado
rpidamente debido a las cantidades excesivas de tiempo que se
requeran para la calificacin. Como un resultado del formato de
opcin mltiple, las pruebas grupales pueden calificarse de manera
124

rpida y objetiva a travs de un instrumento de rastreo ptico


conectado a una computadora. La calificacin por computadora
elimina los errores del examinador y los efectos de halo que pueden
ocurrir en la calificacin de pruebas individuales- Adems, los
psicmetras obtienen un acceso casi instantneo al anlisis de
reactivos y a los bancos de datos de prueba, de modo que la
calificacin por computadora promueve el rpido desarrollo y revisin
de as pruebas grupales.
stas tambin difieren de las pruebas individuales en el modo de
aplicacin. En una prueba grupal, el examinador se limita, en gran
medida, a la lectura de instrucciones y a la imposicin de limites de
tiempo; existen nfimas oportunidades de interaccin personal entre
quien aplica la prueba y quien la toma. Para la mayora de los
individuos examinados esto no tendr importancia, pero para algunos
los

tmidos,

aquellos

que

se

confunden,

quienes carecen

de

motivacin la ausencia de rapport con el examinador tendr


resultados desastrosos.
Las pruebas tradicionales de inteligencia sobresalen como auxiliares
en el diagnstico y tratamiento de las dificultades de aprendizaje de
los individuos, mientras que las pruebas grupales se utilizan con ms
frecuencia como mtodos masivos de deteccin en apoyo a la toma de
decisiones institucionales. As, las pruebas grupales pueden utilizarse
en los sistemas acolares para sealar a los nios que tienen
necesidad de regularizacin o enriquecimiento escolar; en entornos
industriales, para identificar a los buenos candidatos para un trabajo
especfico; o en los ambientes militares, para Ayudar a seleccionar a
los reclutas que tienen discapacidades mentales.
En general, las pruebas grupales se estandarizan en muestras de
enorme tamao -cientos de miles de personas en vez de slo unos
125

cuantos cientos de casos seleccionados de manera cuidadosa cuando


se trata de pruebas individuales. Por supuesto, nunca debe darse por
mentada

la

idoneidad

de

una

muestra

de

estandarizacin.

Independientemente de que se utilicen muestras de estandarizacin


de gran tamao para las pruebas grupales o ms pequeas para las
pruebas individuales, es importante determinar el grado en que la
muestra es representativa de la poblacin en su conjunto.
VENTAJAS Y DESVENTAJAS DE LAS PRUEBAS GRUPALES
Aunque los pioneros en psicologa abrazaron con entusiasmo las
pruebas grupales, tambin reconocieron la naturaleza de esta especie
de trato con el Diablo: los psiclogos han vendido el alma del
individuo examinado a cambio de los beneficios de las pruebas
masivas. Whipple (1910) resumi las ventajas de las pruebas
grupales, pero tambin seal los peligros potenciales:
La mayor parte de las pruebas mentales puede aplicarse ya sea a
individuos o a grupos. Ambos mtodos tienen ventajas y desventajas.
El mtodo de grupo tiene, por supuesto, el mtodo particular de la
economa de tiempo; una clase de 50 100 nios puede realizar una
prueba en menos de una quincuagsima o centsima parte del tiempo
que requerirla la aplicacin de la misma prueba de modo individual.
En ciertos estudios comparativos; por ejemplo, sobre los efectos de
unas vacaciones de una semana sobre la eficiencia mental de los
escolares, se vuelve Imperativo que todos los individuos realicen la
prueba al mismo tiempo. Por oto lado, casi con toda seguridad o todo
grupo habr quienes, por una razn u otra, no pueden seguir las
instrucciones o ejecutar la prueba al mximo de su capacidad. El
mtodo individual permite que el examinador detecte estos casos y.
en general, mediante el ejercicio de la supervisin personal, puede

126

obtenerse, como se seal antes, Informacin valiosa acerca de la


actitud de las personas hacia la prueba.
En suma, las pruebas grupales plantean dos riesgos interrelacionados:
1) algunos individuos examinados tendrn puntuaciones muy por
debajo de su capacidad verdadera debido a problemas motivacionales
o dificultades para seguir instrucciones y 2) las puntuaciones invlidas
no se reconocern como tales, teniendo consecuencias indeseables
para estos individuos atpicos. En realidad, no existe una manera
simple en que puedan evitarse por completo estos riesgos, que son
parte del intercambio en favor de a eficacia cuando se opta por las
pruebas grupales. Sin embargo, es posible reducir al mnimo las
consecuencias potencialmente negativas si los examinadores analizan
con

escepticismo

las

puntuaciones

muy

bajas

recomiendan

evaluacin individual para estos casos.


Volvemos ahora nuestra atencin hacia un anlisis de varias de las
pruebas grupales de inteligencia ms destacadas. Se recuerda al
lector que, debido al gran nmero de estos instrumentos, por
necesidad, la revisin ser seleccionada. Se presenta una revisin
equilibrada

de

instrumentos

viejos,

establecidos,

nuevos

prometedores para el campo, comenzando con una prueba que intenta


cerrarla

brecha

entre

las

pruebas

individuales

grupales

de

inteligencia.
BATERA MULTIDIMENSIONAL DE APTITUD (MAB)
La Multidimensional Aptitude Battery, MAB (Batera Multidimensional
de Aptitud; Jackson, 1984a) es una prueba grupal reciente para
evaluar inteligencia que se dise para ser un equivalente de lpiz y
papel del WAIS-R (Krieshok y Harrington, 1985). Como el lector
recordar, el WAIS-R es un instrumento muy respetado (ahora
127

reemplazado por el WAIS-III) que se utiliza ampliamente como


prueba individual de la inteligencia adulta. Kaufman (1983) seala
que el WAIS-R es el criterio de a inteligencia adulta y ningn otro
instrumento

se

le

acerca.

Sin

embargo,

un

profesional

bien

entrenado requiere cerca de una hora y media simplemente para


aplicar la prueba de Wechsler para adultos a una sola persona. Debido
a que el tiempo profesional es may solicitado, una evaluacin
completa

con

la

prueba

de

inteligencia

Wechsler

-que

incluye

aplicacin, calificacin y redaccin del informe- puede costar cientos


de

dlares.

Desde

hace

tiempo,

muchos

examinadores

han

sospechado que una prueba grupal apropiada -con las ventajas


adicionales de la calificacin objetiva y del informe narrativo por
computadora- puede proporcionar una alternativa igualmente vlida y
mucho menos costosa a las pruebas individuales, para la mayora,
pero no para todas las personas.
ANTECEDENTES DESCRIPCIN
La MAB se dise para producir subpruebas y factores paralelos a los
del WAIS-R, pero con el empleo de un formato de opcin mltiple que
puede calificarse por computadora. El objetivo aparente en el diseo
de esta prueba consisti en producir un instrumento que pudiera
aplicarse a docenas o cientos de personas con la presencia de un solo
examinador (y quiz unos cuetos supervisores de examen) con el
mnimo entrenamiento. Adems, la MAB se dise para obtener
puntuaciones de CI que tienen propiedades psicomtricas similares a
las encontradas en el WAIS-R. La MAB es apropiada para individuos
de 16 a 74 aos de edad y proporciona 10 puntuaciones de
subprueba, as como CI Verbal, de Ejecucin y Total.

128

Aunque utiliza reactivos originales de pruebe la MAB es principalmente


un clon elaborado del WAIS-R, idntico en todas las subpruebas. Las
10 subpruebas de la MAB se muestran a continuacin:
Verbal

Ejecucin

Informacin

Smbolos y Dgitos

Comprensin

Figuras Incompletas

Aritmtica

Espacial

Semejanzas

Ordenacin de Dibujos

Vocabulario

Composicin de Objetos

El lector observar que en la MAR no se incluye Retencin de Dgitos


del WAIS-R; la razn es, en gran medida, de naturaleza prctica:
simplemente no habra manera de presenta una subprueba parecida
en un formato de lpiz y papel; en cualquier caso, la omisin no es
grave. Retencin de Dgitos tiene la correlacin ms baja con el CI
Total del WAIS-R, y es muy conocido que esta subprueba contribuye
poco a la medicin de la inteligencia general.
La nica diferencia significativa con respecto al WAIS-R es la
sustitucin de Diseo con Cubos por la subprueba Espacial en la MAB.
En sta, las personas deben ejecutar a nivel mental rotaciones
espaciales de figuras y seleccionar como respuesta una de cinco
rotaciones posibles presentadas. Slo se utilizan rotaciones mentales
(aunque se incluyen versiones invertidas del estmulo original, como
reactivos

distractores),

los

avanzados

son

muy

complejos

demandantes.

129

Figura 4.1: Reactivos de dmostracin de tres pruebas de ejecucin


de la MAB.
Fuente: Reproducido con autorizacin de Jackson D.N. (1984).
Manual for the Multimensional Aptitude Battery Port Huron MI: Sigma
Assessment Systems, Inc. (800) 256-1285.
Los reactivos en cada una de

las 10

subpruebas MAB

estn

distribuidos en orden de dificultad creciente; se comienza con


preguntas y problemas que la mayora de los adolescentes y adultos
consideran sencillas y contina con reactivos que sari tan difciles que
slo algunas personas los responden de manera correcta. No se
castigan las conjeturas y se alienta a los individuos examinados a
responder a todos los reactivos dentro del lmite de tiempo. A
diferencia del WAIS-R (donde las subpruebas verbales son medidas de
130

poder sin lmite de tiempo), todas las subpruebas de la MAB


incorporan elementos tanto de poder como de velocidad: a los
individuos slo se les permiten siete minutos para trabajar en cada
subprueba. Incluyendo las instrucciones, las partes Verbal y de
Ejecucin de la MAB requieren, cada una, aproximadamente 50
minutos para su aplicacin.
CARACTERSTICAS TCNICAS
La primera publicacin de la MAB (Jackson, 1984a) no se estandariz
de la manera tradicional, donde las puntuaciones se vinculan con el
desempeo de muestras grandes y representativas, estratificadas
segn variables como sexo, raza, residencia urbana-rural, ocupacin
de los padres, regin geogrfica y similares. En lugar de ello, los
autores siguieron una estrategia de calibracin de las puntuaciones de
la MAB con el WAIS-R como prueba de referencia. Para derivar la
frmula lineal de calibracin, se aplicaron tanto el WAIS-R como la
MAB, en forma contrabalanceada, a una nuestra de estudiantes
universitarios (n = 18), estudiantes del ltimo ao de educacin
media superior (n = 74), pacientes psiquitricos hospitalizados (n =
58) e individuos bajo libertad condicional (n = 10). Los examinados,
117 varones y 43 mujeres, tenan edades de los 16 a los 35 aos. Los
coeficientes de correlacin entre los CI de la MAB y del WAIS-R fueron
de .82, .65 y .91 para los CI Verbal, de Ejecucin y Total,
respectivamente. De hecho, las tablas normativas presentadas en el
Manual reflejan una transformacin lineal simple de las puntuaciones
naturales de la MAb a los CI del WAIS-R para esta muestra inicial de
160 personas
El Manual presenta varios estudios de confiabilidad de consistencia
interna

test-retest;

en

general,

los

resultados

son

bastante

notables. Por ejemplo, en un estudio con ms de 500 adolescentes


entre 16 y 20 aos de edad, la confiabilidad de consistencia interna de
131

los CI Verbal, de Ejecucin y Total se coloc en la parte superior del


rango de SO. En un estudio test- retest con 52 pacientes psiquitricos
jvenes, las subpruebas individuales mostraron confiabilidades que
iban de .83 a .97 (mediana .90) para la escala Verbal, y de .87 a .97
(mediana .91) para la escala de Ejecucin. Estos resultados se
comparan

de

manera

bastante

favorable

con

los

estndares

presentados para el WAIS-R (Wechsler. 1981).


Los anlisis factoriales de la MAB ofrecen un fuerte apoyo a la validez
de constructo de este instrumento (Lee, Wallbrown y BIaha, 1990;
Wallbrown, Carmin y Barnett, 1988). En un anlisis factorial con las
puntuaciones de 3121 varones y mujeres, estudiantes de bachillerato,
el Manual presenta un factor general con cargas de moderadas a altas
para todas las sub-pruebas (de .53 a .82). En un anlisis factorial
independiente con los datos de los individuos de estandarizacin, Lee,
Wallbrown y BIaha (1990) encontraron dos factores ortogonales
despus del primer factor general. Estos dos factores rotados pueden
identificarse con toda claridad como factores Verbal y de Ejecucin.
Adems,

otros

investigadores

han

sealado

la

congruencia

extremadamente fuerte entre los anlisis factoriales del WAIS-R (sin


Retencin de Dgitos) y de la MAB. En una muestra de gran tamao de
internos,

Ahrens,

Evans

Barnett

(1990)

observaron

cambios

confirmatorios de validez en las puntuaciones de la MAB en relacin


con el nivel educativo. As, existen buenas justificaciones para utilizar
las escalas independientes Verbal y de Ejecucin en la MAB.
En general, la validez de la MAB depende de su muy fuerte semejanza
fsica y emprica con su prueba madre, el WAIS-R. Los datos,
correlativos entre las puntuaciones de ambas son importantes en este
sentido. Para 145 personas heterogneas a las que se les aplicaron la
MAB y el WAIS-R en forma contrabalanceada, las correlaciones entre
ellas fueron de a.44 (Espacial/Diseo con Cubos) a .89 (Aritmtica y
Vocabulario), con una mediana de .78. Las correlaciones entre los CI
132

del WAIS-R y MAB fueron muy saludables; es decir, .92 para CI


Verbal, .79 para el CI de Ejecucin y .91 para el CI Total (Jackson,
1984a). Slo con algunas excepciones, las correlaciones entre las
puntuaciones de la MAB y del WAIS-R aqullas entre el WAIS y el
WAIS-R.
COMENTARIO SOBRE LA MAB
Jackson (1984a) tuvo gran cuidado en el desarrollo de la MAB,
mejorando de manera continua el instrumento durante un periodo de
aproximadamente 10 aos antes de publicarlo. Durante este tiempo,
los reactivos se seleccionaron, revisaron y eliminaron conforme a
criterios psicomtricos rigurosos concernientes al nivel de dificultad,
poder discriminativo y eficacia de las alternativas distractoras. No es
de sorprender que el instrumento resultante sea una hazaa de
excelencia psicomtrica. Los ndices de confiabilidad son fuertes, los
anlisis factoriales confirmo la dicotoma verbal/de ejecucin y las
puntuaciones

de

subpruebas

CI

generales

se

correlacionan

excepcionalmente bien con las medidas correspondientes del WAIS-R.


A pesar de ello, varios revisores han presentado advertencias y
preocupaciones acerca de la MAB que merecen comentario. Krieshok y
Harrington (1985) sealan que el Manual no Proporciona estimados de
legibilidad para las instrucciones o para los reactivos en s, sino que
expresa vagamente que la MAB presupone habilidades de lenguaje
necesarias para leer y comprender instrucciones por escrito y para
comprender instrucciones verbales. Sin embargo, no recomienda un
nivel mnimo de lectura para la aplicacin vlida; esto puede conducir
al examinador a suponer que cualquier persona que

llega al nivel

mnimo de edad de 16 aos puede tomar la MAB, una presuposicin


que evidentemente es poco firme. De hecho, Krieshok y Harrington
(1985) sometieron a la MAB a un anlisis de

legibilidad por

computadora, y concluyeron que algunos reactivos verbales requieren


133

nivel de lectura del primer ao de educacin media superior. Debido al


nivel relativamente alto de lectura que se necesita en partes de esta
prueba, parece probable que un estudiante que en otros sentidos es
muy inteligente, pero que tiene discapacidad para la lectura, podra
tener una puntuacin artificialmente la MAB.
La MAB ha demostrado ser una verdadera promesa en investigacin,
orientacional y seleccin de personal; adems, puede funcionar como
instrumento de deteccin en entornos clnicos, siempre y cuando el
examinador considere las puntuaciones bajas como base para una
prueba de seguimiento con el WAIS-R. Los examinadores deben tener
en mente que la MAB es una prueba grupal y que, por tanto, lleva
consigo el potencial de mal uso en casos individuales. La MAB no debe
utilizarse de manera aislada para la toma de decisiones diagnsticas o
para

asignacin

programas

como

clases

para

individuos

intelectualmente dotados.
ESCALA DEL SHIPLEY INSTITUTE OF LIVING SCALE (SILS)
La Shipley Institute of Living Scale (SILS) tambin se conoce como
Shipley-Hartford, debido a que se le instituy hace dcadas en
Hartford, Connecticut (Shipley, 1940, 1983). La SILS se propuso
originalmente como ndice de deterioro intelectual, en Un intento por
estimar

los

efectos

de

la

demencia,

dao

cerebral

otros

padecimientos orgnicos. Sin embargo, la prueba se ha empleado


principalmente como una prueba corta de deteccin de la inteligencia,
en especial dentro del sistema de salud mental de la Administracin
de Veteranos.
ANTECEDENTES Y DESCRIPCIN
La SILS se conforma de dos subpruebas, vocabulario y abstracciones.
La intencin original de la prueba era detectar el deterioro orgnico
intelectual al contrastas el desempeo en las secciones de vocabulario
134

y abstracciones. Se consideraba que el deterioro orgnico tena


relativamente poco efecto sobre el vocabulario, y que la capacidad de
abstraccin mostrarla una disminucin significativa. Por tanto, una
gran

discrepancia

en

favor

de

vocabulario

sobre

abstracciones

parecera significar la presencia de alteracin orgnica. Sin embargo,


numerosos estudios y revisiones concluyeron que la SILS tiene un
desempeo deficiente como ndice del dao orgnico (p. ej., Yates.
l954; Johnson, 1987) por lo que se utiliza pocas veces con este
propsito.
La SILS consiste en 40 reactivos de opcin mltiple para vocabulario y
20 para pensamiento abstracto; cada reactivo se califica como
correcto o incorrecto. Los reactivos abstractos cuentan doble, de
modo que la mxima puntuacin en cada mitad de la prueba es de 40
puntos. Tambin se presenta una puntuacin mixta. La prueba se
autoaplica con un lmite de tiempo de 10 minutos para cada una de
las dos secciones. Algunos usuarios favorecen el uso de la prueba sin
lmite de tiempo y se han elaborado normas independientes para este
enfoque (Heinemann, Harper, Friedman y Whitney. 1985). Pocas
personas necesitan ms de 10 minutos por seccin; la mayora de los
examinadores consideran que la SILS puede ser completamente una
medida de poder. Tambin existe una versin de la prueba para
microcomputadora; la computadora aplica y califica la prueba y
produce un informe narrativo y una representacin grfica de las
puntuaciones.
En la seccin de vocabulario, la tarea de la persona examinada
consiste en seleccionar el sinnimo de una palabra entre cuatro
alternativas. Los 40 reactivos se parecen a los siguientes:

NAVE

casa

PUERIL

gordo

rbol

tenedor
oportuno

necio

barco
seco

La puntuacin de vocabulario es el nmero correcto ms un punto por


cada cuatro reactivos omitidos. Sumar los puntos pan los reactivos
135

omitidos proporciona una correccin para la negativa a adivinar. Como


resultado de este factor de correccin, la puntuacin mnima es
aproximadamente de 10 entre 40 puntos.
La intencin era que los reactivos de abstraccin deberan requerir
que la persona examinada obtuviera por induccin algn principio
comn para una serie dada de componentes y despus demostrara su
comprensin de este principio terminado la serie. Cada reactivo es
una serie de letras o nmeros seguidos de espacios en blanco para
indicar el nmero de caracteres en la respuesta. Los 20 reactivos se
parecen a los siguientes:

A B D G K

nao pan arar sara

135

341

52

2 6 8 ___ ___ ___

12___

La persona debe terminar cada serie y colocar la respuesta apropiada


en los espacios en blanco. (Las respuestas a los reactivos anteriores
son P, 962 y 3). Por supuesto, para obtener la respuesta correcta, el
individuo debe inferir la regla que determina la progresin de los
estmulos en cada reactivo y despus utilizar la regla para determinar
la continuacin. (En el reactivo 1, la distancia entre letras aumenta
aritmticamente; en el reactivo 2, los pares son imgenes de espejo
una de la otra, excepto por la ltima y la primera letra que aumentan
por uno -de o-p. r-s; en el reactivo 3, cada grupo de nmeros suma
uno menos que el grupo anterior - 9, 8, 7, ).
CARACTERSTICAS TCNICAS
Zachary (1986) ha publicado normas recientes para la SILS con base
en 290 pacientes psiquitricos diversos que tambin realizaron el
WAIS. La muestra contiene nmeros aproximadamente iguales de
varones y mujeres; esta muestra normativa es de jvenes: la mayora
se encuentran entre 16 y 54 aos, con una mediana de edad de 30
aos. Con base en esta muestra, el manual contiene tablas de
136

puntuaciones T corregidas segn edad (media de 50, DE de 10) para


vocabulario

abstracciones.

Contra

el

consejo

de

numerosos

investigadores anteriores, el autor del Manual de la SILS tambin


introdujo el Cociente de Abstraccin (CA), un nuevo ndice de
deterioro

basado

en

la

diferencia

entre

las

puntuaciones

de

Vocabulario y Abstracciones. El CA se obtiene al comparar la


puntuacin

pronosticada

contra

la

puntuacin

obtenida

en

abstracciones. La puntuacin pronosticada se obtiene de una ecuacin


de regresin que utiliza la puntuacin de vocabulario, la edad Y el
nivel educativo. El CA es una mejora sobre los ndices anteriores de
deterioro en cuanto que, para su clculo, se toman en cuenta 1$
disminuciones que ocurren de manera natural con la edad. Las
personas con esquizofrenia y otros individuos con disminucin en su
eficiencia intelectual tienden a obtener bajos CA. Sin embargo, existen
causas no patolgicas para un CA bajo (p. ey, desagrado por los
conceptos abstractos) y, por tanto, la utilidad de este ndice est
sujeta a dudas.
Mason, Lemmon, Wayney Schmidt (1991) han intentado revivir el
enfoque del CA para la SILS mediante ecuaciones de regresin que se
emplean en el clculo de Cocientes de Abstraccin que utilizan la
edad, sexo y clase social como variables moderadoras. Sin embargo,
no proporcionan ninguna evidencia de la validez del CA como ndice
de deterioro cerebral.
La confiabilidad de la SILS es marginal. Las medidas tpicas de
consistencia

interna

(correlacin

pares-nones)

son

de

.87

(vocabulario) y .89 (abstracciones) y .92 (puntuacin total). Sin


embargo, como se seala en los Standards for Educational and
Psychological Testitrg (AERA, APA y NCME, 1985), los coeficientes de
divisin en mitades de la variedad pares-nones producen estimados
137

de confiabilidad inflados, cuando se trata de pruebas de velocidad. En


el sentido de que las puntuaciones de la SILS se basan en la velocidad
en vez del poder, estas confiabilidades sern artificialmente altas. Es
ms probable que las confiabilidades test-retest sean ms apropiadas
para la SILS. Estas confiabilidades varan de manera considerable en
la literatura, pero se acercan al .80 Para la puntuacin total en
muestras ms grandes y heterogneas (Johnson, 1987).
Puesto que la SILS se emplea principalmente como prueba de
deteccin de la inteligencia, la validez de este instrumento se vincula,
en gran medida, con su capacidad para pronosticar CI Totales en
pruebas individuales como el WAIS o el WAIS-R. Como escribi
Johnson (1987), literalmente docenas de estudios de correlacin han
investigado la precisin de la SILS Como medio de prediccin del CI
Wechsler

(p.

ej.,

Zachary,

Crumpton

Spiegel,

1985).

Las

correlaciones entre la SILS y la Wechsler-Bellevue o el WAIS van de


.65 a .90, con una mediana de .76 (Johnson, 1987). Con base en
estos estudios, Johnson (1987) informa que el intervalo de confianza
de 95% para el CI estimado de la SILS es de aproximadamente 11
puntos de CI. Por ejemplo, una puntuacin total de 60 en la escala
Shipley para un varn de 40 aos de edad, se convierte en un CI del
WAIS-R de 102; en 95% de tales casos, el CI real de la persona en el
WAIS-R caer dentro del rango de 91 a 113 (Zachary, 1986).
COMENTARIO SOBRE LA SILS
La SILS es una medida razonablemente buena de la inteligencia
general que ha encontrado amplio uso en la investigacin. Adems, el
instrumento an es bastante popular como prueba de deteccin de la
inteligencia general y de la posible ineficiencia intelectual (Bowers y
Pantle, 1998). Aunque la SILS es til para la deteccin intelectual en
un
138

rango

muy

amplio,

no

se

le

debe

utilizar

para

realizar

discriminaciones ms detalladas. Los clnicos responsables utilizarn


una prueba de inteligencia individual (p. ej., K-BIT, WAIS-III) cuando
se requiera una evaluacin individual ms precisa.
A pesar de que es una prueba de deteccin aceptable, la SUS posee
varias limitaciones significativas:
1. La SILS es inapropiada para individuos con bajo CI o para los que
tienen discapacidades significativas del lenguaje.
2. La prueba tiene un nivel superior bajo, en especial en la seccin de
abstracciones, y no se distribuye a los individuos examinados que
tienen un alto CI.
3. La SILS tiene una banda de error que se aproxima a 11 puntos de
CI, lo cual puede ser excesivo para muchas aplicaciones.
BATERA MULTINIVEL PRUEBA DE CAPACIDADES COGNITIVAS
(CogAT)
Una funcin importante de las pruebas psicolgicas consiste en
evaluar las capacidades de los estudiantes que constituyen un
prerrequisito para el aprendizaje tradicional dentro del saln de clase.
En el diseo de pruebas para dicho propsito, los psicmetras deben
enfrentarse al problema obvio e irritante de que los jvenes en edad
escolar difieren en gran ardida en sus capacidades intelectuales. Por
ejemplo, una prueba adecuada para un nio de sexto grado ser
demasiado fcil para un alumno de secundaria, pero ser muy difcil
para un estudiante de temer grado.
La respuesta a este dilema es una batera multinivel, una serie de
pruebas superpuestas. En una batera multinivel, cada prueba grupal
se disea para un nivel especifico de edad o grado escolar, pero las
pruebas adyacentes poseen cierto contenido comn. Debido a la
139

superposicin en contenido entre los niveles adyacentes de edad o


grado, cada prueba posee niveles inferior y superior apropiadamente
bajos y altos para la evaluacin adecuada de los estudiantes en
ambos extremos de capacidad. Adems, por lo general, las bateras
multinivel emplean muestras normativas sumamente comparables en
cada nivel sucesivo. Por todas estas razones, se consideran ideales
para estimar la preparacin del alumno para el aprendizaje escolar.
Casi todos los sistemas escolares en EUA emplea cuando menos una
batera multinivel con normas nacionales.
La Cognitive Abilities Test, CogAT (Prueba de Capacidades Cognitivas)
es una de las mejores bateras de pruebas escolares en uso en la
actualidad (Thorndike y Hagen, 1993ab). La revisin ms reciente de
la prueba es la Edicin Multinivel CogAT, Forma 5, publicada en 1993.
Este instrumento se analizar con cierto detalle y despus se
proporcionar un resumen de pruebas contrarias.
ANTECEDENTES Y DESCRIPCIN
La CogAT se deriv de las Pruebas de inteligencia Lorge-Thorndike,
una de las primeras pruebas grupales de inteligencia que tena el
propsito de utilizarse ampliamente dentro de los sistemas escolares.
La CogAT es, en primer trmino, una medida de la capacidad escolar,
pero tambin incorpora una batera de razonamiento no verbal con
reactivos que no tienen relacin dinas con la educacin formal en la
escuela. Las dos bateras principales, adecuadas para alumnos desde
jardn de nios hasta tercer grado, se analizan de manen breve al
final de esta seccin. Aqu se revisa la edicin multinivel dirigida a
estudiantes de 3 al 10 grados.
Las nueve subpruebas de la CogAT Multinivel se agrupan en tres
bateras como sigue:

140

Batera

Batera

verbal

cuantitativa no verbal

Razonamiento

Batera
Relaciones Gasificacin

Verbal

Cuantitativas de Figuras

Frases

Series de

Incompletas Nmeros

Analogas de
Figuras

Analogas

Construccin Anlisis de

Verbales

de Ecuaciones Figuras

Para cada subprueba de la CogAT, los reactivos se ordenan segn el


nivel de dificultad en un solo protocolo de prueba. Sin embargo, los
niveles de inicio y finalizacin difieren en cada 1 de los 8 niveles
superpuestos (A hasta H). As, A todos los individuos examinados se
les proporcionan los reactivos apropiados segn el vado. Todas las
subpruebas, excepto una, emplean un formato de opcin mltiple. La
excepcin es Anlisis de Figuras, en la que la persona responde con SI
o No a una sede de alternativas.
Las subpruebas tienen estrictos lmites de tiempo que van de los 8 a
los 12 minutos. Cada una de las tres bateras puede aplicase en
menos de una hora. Sin embargo, el manual recomienda tres sesiones
de prueba en das sucesivos para los nios pequeos. En el caso de
los nios mayores, el primer da deben aplicarse dos bateras y l da
siguiente se utiliza un solo periodo de prueba.
Muchas subpruebas de la CogAT tienen una notable semejanza con
partes de la Stanford-Binet: Cuarta Edicin. Por ejemplo, ambas
pruebas incluyen reactivos de doblado de papel- La explicacin reside
en

la

paternidad

comn:

Robert

Thorndike

Elizabeth

Hagen

desarrollaron ambas pruebas y las dos se publicaron en la Riverside


Publishing Company. De nuevo se ve el carcter hbrido de las
pruebas actuales de inteligencia, en cuanto a que las nuevas pruebas
incorporan los mejores aspectos de sus predecesoras.
141

Las puntuaciones naturales de cada batera pueden transformarse en


puntuacin estndar normalizada con base en la edad, con media de
100 y desviacin estndar de 16. Adems, tambin estn disponibles
rangos percentiles y estaninas para los grupos por edad y nivel de
grado. Se utiliz una interpolacin para determinar las normas de
nivel de grado para los periodos de otoo, invierno y primavera.
CARACTERSTICAS TCNICAS
La CogAT se norm conjuntamente (estandarizacin concurrente) con
tres pruebas de aprovechamiento, las Iowa Tests of Basic Skills
(Pruebas Iowa de Habilidades Bsicas), las Test of Achievement and
Profidency (Pruebas de Ejecucin y Rendimiento) y las Iowa Tests of
Educational Development (Pruebas Iowa de Desarrollo Educativo). La
estandarizacin concurrente con medidas de rendimiento es una
prctica comn y deseable en el establecimiento de normas para
pruebas de inteligencia con niveles mltiples. La virtud particular de la
normatizacin conjunta es que se determina con gran precisin la
correspondencia esperada entre las puntuaciones de inteligencia y de
rendimiento. Como consecuencia, los examinadores pueden identificar
con exactitud a los estudiantes de bajo rendimiento que necesitan
regularizacin o de mayor evaluacin para descartar una posible
discapacidad para el aprendizaje.
La confiabilidad de la CogAT es excepcionalmente buena. En ediciones
anteriores, los estimados de confiabilidad Kuder-Richardson 20 para
las bateras multinivel promediaron .94 (Verbal), .92 (Cuantitativa) y
.93 (No verbal) en todos los niveles por grado. Las confiabilidades
test-retest a seis meses para las formas al-ternas fueron de .85 a .93
(Verbal), .78 a .88 (Cuantitativa) y .81 a .89 (No verbal).
El Manual proporciona un cmulo de informacin acerca de validez de
contenido, reIacionada con el criterio y de constructo para la CogAt;
142

aqu se resumen slo los puntos ms relevantes. Las correlaciones


entre la CogAT y las bateras de rendimiento son sustanciales. Por
ejemplo, la batera verbal de la CogAT se correlaciona en los rangos
de .70 y .80 con las subpruebas de rendimiento de las pruebas Iowa
de habilidades bsicas y las de ejecucin y rendimiento.
La CogAT pronostica las calificaciones escolares razonablemente bien.
Las correlaciones van del rango de .30 al de .60, dependiendo del
nivel de grado, sexo y grupo tnico. No parece haber una tendencia
clara en cuanto a qu batera es mejor en el pronstico del promedio
de calificaciones. Las correlaciones entre la CogAT y las pruebas
individuales de inteligencia tambin son sustanciales, y por lo comn
van de .65 a .75. Estos datos hablan bien de la validez de constructo
de la CogAT, en la medida en que la Stanford-Binet se reconoce de
manera

amplia

como

una

excelente

medida

de

la

inteligencia

individual.
COMENTARIO SOBRE LA CogAt
La edicin multinivel de la CogAT es una prueba grupal de la
inteligencia

con

fuerte

confiabilidad

estudiantes

del

tercer

grados.

doceavo

normas
La

cuidadosas

para

estandarizacin

concurrente con dos pruebas de aprovechamiento es un aspecto


bienvenido y prctico. En apoyo a la validez de la CogAT, las
correlaciones con calificaciones, rendimiento y otras medidas de
inteligencia son bastante robustas. Recientemente se ha producido
una versin alemana de la CogAT (Perleth, Hofmann, Schuer y
Wernberger, 1994).
Ansorge (1985) ha cuestionado si las tres bateras son realmente
necesarias. Este autor seala que las correlaciones entre las bateras
143

Verbal, Cuantitativa y No verbal son sustanciales. Los valores


medianos en todos los grados son los siguientes:
Verbal y Cuantitativa:

.78

No verbal y Cuantitativa

.78

Verbal y no verbal

.72

Dado que la batera Cuantitativa ofrece pocos aspectos nicos, desde


un punto de vista puramente psicomtrico no existe justificacin para
incluirla. Sin embargo, los autores de la prueba recomiendan utilizar
todas las bateras con la esperanza de que las diferencias en
desempeo

ayudarn

los

profesores

en

la

planificacin

de

estrategias de regularizacin. Sin embargo, los autores no defienden


mucho esta afirmacin.
Un reciente estudio

de

Stone

(1994) proporciona una notable

justificacin para la utilizacin de la CogAT como base para la


evaluacin

de

puntuaciones

estudiantes.
de

la

Este

CogAT

de

investigador
403

alumnos

encontr
del

que

tercer

las

grado

proporcionaban una prediccin imparcial del aprovechamiento del


alumno que era ms precisa que las calificaciones del maestro.
Particularmente estas ltimas mostraban parcialidad en contra de
estudiantes

caucsicos

asiaticoestadounidenses

al

pronosticar

menores puntuaciones de aprovechamiento.


PRUEBA DE INTELIGENCIA CULTURALMENTE JUSTA (CFIT)
La

Culture

Fair

Intelligence

Test

(CFIT

Prueba

de

Inteligencia

Culturalmente Justa; Cattell, 1940; IPAT, 1973) es una medida no


verbal de la inteligencia fluida que Raymond B. Cattell, el importante
psiclogo de la medicin, concibi originalmente en el decenio de
1920. El objetivo de la CHI consiste en medir la inteligencia fluida capacidad analtica y de razonamiento en situaciones abstractas y
novedosas- de una manera que est tan libre del prejuicio cultural
144

como sea posible. Esta prueba se llam en un principio la Prueba de


Inteligencia Culturalmente Libre. El nombre se cambi cuando se hizo
evidente la imposibilidad de eliminar por completo las influencias
culturales de las pruebas de inteligencia.
ANTECEDENTES Y DESCRIPCIN
La CFIT ha atravesado por varias revisiones, surgiendo en su
apariencia actual en 1961. La prueba consiste en tres versiones: la
Escala 1 se utiliza con adultos con retraso mental y nios entre 4 y 8
aos de edad; la Escala 2 se emplea con adultos dentro del rango
promedio de inteligencia y con nios entre 8 y 13 aos de edad; y la
Escala 3 es para adultos con alto nivel de capacidad y para
estudiantes de bachillerato y universidad. La Escala 1 implica una
considerable interaccin entre el examinador y la persona evaluada
cuatro de las subpruebas se deben aplicar de manera individual. As,
en algunos aspectos la Escala 1 es ms una prueba individual de
inteligencia que una prueba grupal. Aqu se analizan slo as Escalas 2
y 3, dado que atas son en realidad pruebas grupales de inteligencia.
Estas dos pruebas difieren principalmente en el nivel de dificultad.
Para cada escala se encuentran disponibles dos formatos equivalentes
llamados Forma A y Forma B. Los autores de la prueba recomiendan
aplicar ambas formas a cada individuo para retener lo que se
denomina prueba completa. Cada forma en si misma se conoce como
forma corta. A pesar de la recomendacin de utilizar ambas formas
como una prueba combinada, es muy comn que los usuarios de la
CFIT dependan de una sola forma breve con propsitos de deteccin.
Cada forma incluye cuatro subpruebas, Series, Clasificacin, Matrices
y Condiciones. En la figura 6-9 se presentan reactivos de muestra. Por
supuesto, cada subprueba est precedida por varios reactivos de
prctica. La prueba completa est hbilmente organizada en un
protocolo de ocho pginas.
145

Figura

4.2.

Reactivos

de

muestra

de

Prueba

de

inteligencia

culturalmente justa.

Fuente: Copyright del Institute for Personality and Ability Testing.


Inc. Reimpreso con autorizacin.
La CFIT es una prueba sumamente rpida. Cada forma de las Escalas
2 y 3 requiere cera de 30 minutos para su aplicacin, pero slo se
dedican 12.5 minutos para la presentacin de la prueba en s. Por
146

tanto, los resultados pueda ser engaosos en el caso de personas que


no le dan importancia a la velocidad de ejecucin en la resolucin de
problemas. Por fortuna, la Escala 2 puede utilizarse como una prueba
de poder sin lmite de tiempo. Sin embargo, las normas para este
modo de aplicacin son limitadas (IPAT, 1973).
CARACTERSTICAS TCNICAS
Las muestras de estandarizacin para las Escalas 2 y 3 fueron
respetablemente grandes, pero no se describen con suficiente detalle
como para determinar el grado en que reflejan a la poblacin general.
Las muestras de estandarizacin se caracterizan como sigue:
El grupo de estandarizacin para la Escala 2 est por 4 328 varones y
mujeres tomados como muestra en diversas regiones de EUA y Gran
Bretaa. Las normas de la Escala 3 se basan en

3140 casos, que

Incluyen a alumnos estadounidenses de bachillerato, divididos por


igual entre los ltimos cuatro aos de educacin meda superior, y
jvenes adultos en una muestra laboral estratificada (IPAT, 1973).
Las puntuaciones naturales se convienen a una puntuacin estndar
normalizada de CI con media de 100 y desviacin estndar de 16.
Las confiabilidades test-retest de formas alternas y de consistencia
interna se encuentran en general en el rango de .70 para las formas
individuales de las Escalas 2 y 3. Las confiabilidades de la prueba
completa son ms altas, en general a la mitad del rango de .80. Estos
resultados se basan en docenas de estudios con miles de personas e
indican un grado respetable de confiabilidad para un instrumento tan
corto (IPAT, 1973).
La validez de la CFIT como medida de la inteligencia general se ha
establecido ms all de cualquier duda razonable. Las puntuaciones
de la CNT se correlacionan a la mitad del rango de .80 con el factor
general

de

inteligencia

muestran

relaciones

consistentemente
147

fuertes -en gran medida en los rangos de .70 y .80- con otras
medidas

convencionales

de

inteligencia

(WAIS,

WISC,

Matrices

Progresivas de Raven, Stanford-Binet, Otis y la Batera de Prueba de


Aptitud General; vase IPAT, 1973, p.11). No hay duda de que la CFTI
es una prueba bien diseada, til y vlida de la inteligencia.
Pero, la CFIT es una prueba culturalmente justa, como afirma su
nombre? Un objetivo de este instrumento era el de reducir al mnimo
las influencias irrelevantes del aprendizaje cultural y del clima social
y, por tanto, producir una separacin ms evidente entre la
capacidad natural y el aprendizaje especifico (IPAT, 1973). Por
desgracia, la evidencia disponible indica que la CFIT no es ms exitosa
que las medidas tradicionales en la bsqueda de un mtodo justo
culturalmente para la medicin de la inteligencia (Koch, 1984). Por
ejemplo, Willard (1968) encontr que 83 nios afroestadounidenses
con desventajas culturales obtuvieron puntuaciones aproximadamente
iguales en la Stanford-Binet (X = 68.1) y en Ia CFIT (X = 70.0). Lo
que es ms, 14 de los nios llegaron al nivel inferior de la CFIT y
recibieron la puntuacin ms baja de la prueba con un CI de 57,
mientras las puntuaciones de la Stanford-Binet se distribuyeron en un
patrn ms similar a una curva con forma de campana.
COMENTARIO ACERCA DE LA CFIT
La CIFT es una excelente medida breve, no verbal, de la inteligencia
general. Incluso cuando se emplean la Forma A y la Forma B para
obtenerlo que se conoce como prueba completa, la CIFT puede
aplicarse a grupos grandes en menos de una hora. Una advertencia
importante para los usuarios de la prueba es que la CFIT no ha
logrado el encomiable objetivo de producir una prueba culturalmente
justa. Lo que es ms, el objetivo en s puede ser quimrico:

148

Las culturas difieren con respecto a la Importancia que le dan a la


competencia con los compaeros en la ejecucin de tareas o en la
solucin, de problemas, a la velocidad o calidad de la ejecucin y a
una variedad de otras conductas relacionadas con pruebas. Algunas
culturas enfatizan la solucin concrete de los problemas ms que la
abstracta, llegando con frecuencia al grado deque un problema carece
de significado excepto en un entorno concreto. El mero concepto de
contestar una prueba inventada de manera artificial carece de sentido
en dichas situaciones (Koch, 1984).
Existen dudas de que incluso sea posible la existencia de una prueba
culturalmente justa. En ediciones futuras, los creadores de la CFIT
haran bien en cambiarle el nombre a su prueba, de modo que los
usuarios

poco

experimentados

no

le

confieran

propiedades

imaginarias a este instrumento.


Aunque la CFIT es una prueba valiosa, es necesaria una revisin y el
establecimiento de nuevas normas. Tiene una apariencia ms bien
anticuada. Algunos de los dibujos para los reactivos de la prueba son
tan pequeos que slo las personas con visin perfecta pueden inferir
las relaciones figurativas representadas en los componentes de los
reactivos.

Las

anteriores

muestras

de

estandarizacin

se

han

especificado de manera deficiente y pareceran ser muestras de


conveniencia ms que representaciones estratificadas cuidadosamente
seleccionadas de la poblacin en conjunto.
MATRICES PROGRESIVAS DE RAVEN (RPM)
Presentadas originalmente en 1938, las Matrices Progresivas de Rayen
(RPM) son una prueba no verbal del razonamiento inductivo que se
basa en estmulos de figuras (Rayen, Court y Rayen. 1986, 1992).
Esta prueba ha sido muy popular en investigacin bsica y tambin se
149

le utiliza en ambientes institucionales con propsitos de deteccin


intelectual.
ANTECEDENTES Y DESCRIPCIN
En un principio, la prueba RPM se dise como una medida del factor
g de Spearman (Raven, 1938). Por esta razn, Rayen eligi un
formato especial de prueba que supuestamente requera el ejercicio
de g. Se recuerda al lector que Spearman defini a g como la
deduccin de correlatos. El trmino deduccin se refiere al proceso
de inferencia de relaciones con base en semejanzas fundamentales
percibidas entre estmulos. En particular, para responder de manera
correcta a las RPM, los individuos examinados deben identificar un
patrn

recurrente

de

relacin

entre

los

estmulos

figurativos

organizados en una matriz de 3 x 3. Los reactivos le clasifican en


orden de dificultad creciente, de aqu la referencia a las matrices
progresivas.
La prueba de Raven es en realidad una serie de tres instrumentos
diferentes. Gran parte de la confusin acerca de la validez, la
estructura factorial y similares se deriva de la suposicin injustificada
de que las tres formas deberan producir datos equivalentes. Se
alienta al lector a abandonar estas hiptesis sin fundamento. Aunque
tres formas de la RPM se parecen unas a otras, pueden existir
diferencias sutiles en las estrategias de solucin de problema que
requieren cada una de ellas.
Matrices Progresivas en Color es una prueba con 36 reactivos
diseada para nios de 5 a 11 aos de edad. Raven incorpor colores
en su versin de la prueba para ayudar a mantener la atencin de los
sujetos jvenes. Las normas de Matrices Progresivas Estndar se
establecieron para nios de seis aos en adelante, aunque la mayor
150

parte de los reactivos son tan difciles que la

prueba es ms

adecuada para adultos. Esta prueba consta de 60 reactivos agrupados


en

cinco

conjuntos

de

12

progresiones.

Matrices

Progresivas

Avanzadas es similar a la versin estndar, pero tiene un nivel


superior

ms alto. La versin avanzada est formada por 12

problemas en el Conjunto I y 36 problemas en el Conjunto II. Esta


forma es especialmente adecuada pan individuos con un intelecto
superior.
CARACTERSTICAS TCNICAS
En Raven y Summers (1986) se presentan las normas para Matrices
Progresivas en Color y Estndar, obtenidas con grandes muestras en
EUA.

Se

incluyen

normas

independientes

para

mexicano-

estadounidenses y afroestadounidenses. Aunque no se hizo el intento


de utilizar un procedimiento de muestreo aleatorio estratificado, la
seleccin de distritos escolares fue tan ampliamente variada que las
normas estadounidenses para nios parecen slidas en un nivel
razonable. Sattler (1988) resume las normas pertinentes para todas
las versiones de la RPM. Recientemente. Rayen, Court y Rayen (1992)
produjeron nuevas normas para la prueba de Matrices Progresivas
Estndar, pero Gudjonsson (1995) ha hecho surgir la duda deque
estos datos se hayan visto comprometidos debido a que no hubo
vigilancia durante la prueba.
En cuanto a Matrices Progresivas en Color, se informan confiabilidades
de divisin en mitades dentro del rango de .65 a .94, donde los
individuos ms jvenes producen valores ms bajos (Rayen. Court y
Raven, 1986). Para Matrices Progresivas Estndar, un valor tpico de
divisin en mitades es .86, aunque en personas ms jvenes se
encuentran valores ms bajos (Raven. Court y Rayen, 1983). Las
confiabilidades test-retest para las tres formas varan de manera
151

considerable de una muestra a otra (Burke, 1958; Raven, 1965 Raven


et al, 1986). En el caso de adultos normales en los ltimos aos de la
adolescencia y mayores, son tpicos los coeficientes de confiabilidad
entre .80 y .93. Sin embargo, para nios preadolescentes, se
informan coeficientes de confiabilidad tan bajos como .71. As, cuando
se trata de individuos ms jvenes, es posible que la RPM no posea la
suficiente confiabilidad como para justificar su utilizacin en la toma
de decisiones sobre individuos.
Los estudios analtico-factoriales de la RPM proporcionan poco o
ningn apoyo a la intencin original de la neta de medir un
constructo unitario (factor g de Spearman). Varios estudios sobre
Matrices Progresivas en Color revelan tres factores ortogonales
(Carlson y Jensen, 1980; Wiedl y Carlson, 1976). El Factor I incluye
en gran medida, los reactivos muy difciles y se le puede denominar
cierre y razonamiento abstracto por analogas. El Factor II se cataloga
como integracin de patrones a travs de identidad y cierre. El Factor
III consta de los reactivos ms fciles y se define como una simple
integracin de patrones (Carlson y Jensen, 1980). En resumen, los
reactivos muy fciles y muy difciles en Matrices Progresivas en Color
parecen vincularse con procesos intelectuales diferentes.
Matrices progresivas avanzadas se descompone en dos factores que
pueden tener validez predictiva por separado (Dillon, Pohlmann y
Lohmann, 1981). El primer factor comprende reactivos

los que la

solucin se obtiene a travs de la suma o ruta de patrones (figura 610a). Los individuos que tienen un buen desempeo en estos
reactivos pueden sobresalir en cuanto a la toma de decisiones rpidas
y en situaciones donde deben percibirse las relaciones parte-todo. El
segundo factor se compone de reactivos en los que la solucin se basa
en la capacidad para percibirla progresin de un patrn (figura 6152

10b). Las personas que tienen un desempeo apropiado en estos


reactivos

pueden

tener

buena

capacidad

mecnica,

as

como

habilidades adecuadas para estimar el movimiento proyectado y


realizar

rotaciones

mentales.

Sin

embargo,

las

habilidades

representadas por cada factor son, por el momento, meras conjeturas


y requieren confirmacin independiente.
Un enorme conjunto de investigaciones publicadas tiene que ver con
la validez de la RPM. Burke (1958) proporciona un buen resumen de
los

primeros

datos,

las

conclusiones

ms

recientes

pueden

encontrarse recopiladas en Court (1982) y en los manuales actuales


de Ia RPM (Raven y Summers, 1986; Raven, Court y Raven. 1983,
1986, 1992). En general, los coeficientes de validez en relacin con
pruebas de aprovechamiento van del rango de .30 al de .60. Como
podra esperarse, estos valores son un poco ms bajos que los
encontrados eh pruebas ms tradicionales (con cargas verbales) de la
inteligencia.

Los

coeficientes

de

validez

con

otras

pruebas

de

inteligencia van del rango de .50 al de .80. Tambin, como podra


esperarse, las correlaciones tienden a ser ms con las pruebas de
ejecucin que con las pruebas verbales. En un enorme estudio en el
que participaron miles de escolares, Saccuzzo

y Johnson (1995)

concluyeron que Matrices Progresivas Estndar y el WISC-R mostraron


una validez predictiva aproximadamente igual y que no existe
evidencia

de

validez

diferencial

entre

los

ocho

grupos

tnicos

diferentes.

153

(a)

(b)

Figura 4.3. Matrices Progresivas de Raven: reactivos tpicos.


Johnson, Saccuzzo y Guertin (1994) lograron lo que (casi) es
imposible

al

desarrollar

una

forma

alterna

verdaderamente

comparable de Matrices Progresivas Estndar. Para cada uno de los 60


reactivos

originales,

desarrollaron

un

reactivo

similar

que

era

comparable en trminos de nivel de dificultad y estrategia cognitiva


subyacente requerida para la solucin. Un anlisis de confiabilidad de
formas alternas con un grupo diverso de 449 nios que tomaron
ambas pruebas en orden contrabalanceado revel un coeficiente de
confiabilidad de .90, que est al nivel de los datos de test-retest
154

inmediato. En esta misma muestra, la distribucin de puntuaciones no


mostr diferencias en cuanto a desviacin estndar, asimetra y rango
de dificultad dejos reactivos. La media de respuestas correctas fue de
36.1 en MPE y de 35.5 en la nueva prueba. En resumen, las dos
versiones

de

la

prueba

son

casi

idnticas

en

caractersticas

psicomtricas generales y tambin en nivel de dificultad. La nueva


prueba promete satisfacer un importante papel en los estudios de
investigacin que requieren de la repeticin de prueba.
COMENTARIO ACERCA DE LA RPM
Aunque la RPM no ha cumplido las expectativas originales de medir el
factor g de Spearman, la prueba es, sin embargo, un ndice til del
razonamiento no verbal, figurativo. La actualizacin reciente de las
normas fue un avance bien acogido para esta prueba tan conocida, en
el sentido de que muchos usuarios estadounidenses estaban recelosos
de las normas britnicas por considerarlas anticuadas y limitadas. Sin
embargo, las normas adultas de Matrices Progresivas Estndar y
Avanzadas continan siendo bastante restringidas.
La RPM es particularmente valiosa como prueba complementaria para
nios y adultos con discapacidades auditivas, del lenguaje y fsicas.
Con frecuencia, estos individuos presentan dificultades cuando se les
evala con medidas tradicionales que requieren atencin auditiva,
expresin verbal o manipulacin fsica. En contraste, la RPM puede
explicarse a travs de pantomima, si ello es necesario. Lo que es ms,
la nica va expresiva que se requiere del examinando es una marca
con un lpiz o un ademn que denote la alternativa elegida. Por tales
razones, la RPM es ideal para examinar a personas que tienen un
dominio limitado del idioma ingls. De hecho, la RPM est tan
restringida en trminos culturales como es posible: el protocolo de
prueba no contiene una sola palabra en algn idioma.
155

Mills y rissot (1995) encontraron que Matrices Progresivas Avanzada


identificaba

como

dotados

una

mayor

proporcin

de

nios

minoritarios que una medida ms tradicional de la aptitud acadmica


(la Prueba de Capacidad Escolar y Universitaria).
Finalmente, debe expresarse una advertencia: algunos individuos
sumamente

inteligentes

de

alto

funcionamiento

tienen

un

desempeo muy inferior en la RPM. Gregory y Gernert (1990)


sometieron a prueba (con una variante de la RPM) a casi 100
miembros

de

cuerpos

docentes

universitarios.

Un

investigador

sobresaliente y que habla llegado a nivel vicepresidencial, no tuvo la


menor idea de cmo resolver los problemas de la RPM y obtuvo
puntuaciones a un nivel aleatorio. Algunas personas de inteligencia
superior al promedio simplemente no tienen un buen desempeo en
tareas de razonamiento figurativo. Los examinadores haran bien en
cuestionar la validez de una baja puntuacin en el caso de un
individuo que en otros sentidos es muy exitoso.
PERSPECTIVA SOBRE LAS PRUEBAS CULTURALMENTE JUSTAS
La Culture Fair Intelligence Test (CFIT; Prueba de Inteligencia
Culturalmente Justa de Cattell) y las Matrices Progresivas de Raven
(RPM)

se

citan

con

frecuencia

como

ejemplos

de

pruebas

culturalmente justas, lo cual es un concepto con una historia larga y


confusa. Aqu se intentar aclarar algunos trminos y problemas.
El primer asunto a analizar es que las pruebas de inteligencia son tan
slo muestras de aquello que las personas saben y pueden hacer. No
se deben materializar y sobrevalorar las pruebas de inteligencia. Las
pruebas nunca son muestras de inteligencia innata o de conocimiento
independiente de la cultura. Todo conocimiento se basa en la cultura y
se adquiere a travs del tiempo. Como seala Scarr (1994), no existe
nada que se asemeje a una prueba culturalmente libre.
156

Pero, qu sucede con una prueba culturalmente justa que plantea


problemas que son igualmente familiares (o no familiares) para todas
las culturas? sta parecerla ser una posibilidad ms realista que una
prueba cultural-mente independiente, pero incluso en este caso los
escpticos pueden tener dudas. Considrese la pregunta de qu es lo
que significa una prueba, lo cual difiere de una cultura a otra. En
teora, una prueba de matrices parecera igualmente justa para la
mayora de las culturas. Pero en la prctica surgen problemas sobre
equidad.

Las

personas

criadas

en

culturas

occidentales

estn

entrenadas en un pensamiento lineal, convergente. Se sabe que el


propsito de una prueba es encontrar una sola reapuefl adecuada y
hacerlo con rapidez. Si se examina la matriz de 3 x 3 de izquierda a
derecha y de arriba hacia abajo, buscando los principios lgicos
invocados en la sucesin de formas, puede suponerse quela personas
criadas en Nepal o en Nueva Guinea o incluso en la partes ms
remotas de Idaho harn lo mismo? La prueba puede significar algo
diferente para ellos. Quizs la aborden como una medida de la
progresin esttica, ms que como una sucesin lgica. Quiz la
consideren como una bobera de tal tipo que no es digna de un
esfuerzo

intelectual

intenso.

Suponer

que

una

prueba

igualmentejusta para todos los grupos culturales tan slo porque los
estmulos son igualmente familiares (o no familiares), es algo
inapropiado. Se puede hablar acerca de grados de justicia (o
injusticia) cultural, pero el concepto de que cualquier prueba sea
culturalmente justa en trminos absolutos es, con toda seguridad, un
equivoco.

157

1.- Las pruebas grupales de inteligencia difieren de las individuales en


cinco aspectos:
a.b.c.d.e.2.- Seale una ventaja y una desventaja de las pruebas grupales:
Ventaja:

Desventaja:

3.- La MAB es una prueba grupal de inteligencia, con preguntas de


opcion mltiple, diseada como un equivalente de lapiz y papel para
el Wais R
V( )

F( )

4.- La confiabilidad Test Retest de la MAB es muy relativa y los


anlisis factoriales no sustentan su validez de construto:
V()

158

F( )

5.- Describa brevemente la escala Shipley Institute of Living ( SILS)


------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------6.- El Test de Matrices Progresivas de Raven (RPM) se diseo
originalmente como una medida del factor g de separman

y es una

prueba no verbal de razonamiento inductivo que se basa en estimulos


figurativos.................
V( )

F( )

159

RESPUESTAS DE LAS ACTIVIDADES


PRIMERA ACTIVIDAD:
1.A.- La capacidad para aprender de la experiencia.
b.- La capacidad para adaptarse al propio ambiente.
2.Jean Piaget
3.a.- Sensorio Motora. (nacimiento a los dos aos)
b.- Pre operacional. (2 a 6 aos).
c.- Operaciones Concretas (7 a 12 aos)
d.- Operaciones Formales. (12 aos en adelante)
4.V (X )

F( )

5.V()

160

F(X)

SEGUNDA ACTIVIDAD
1.a.- Motora Gruesa.
b.- Motora Fina
c.- Desarrollo del Lenguaje.
d.- Conducta Adaptativa y Personal Social.
2.V(X)

F()

V(X)

F( )

3.4.a.- Exploracion Visual y Permanencia del Objeto


b.- Desarrollo de Medios Finesc.- Imitacin Vocal y de Ademanes
d.- Desarrollo de la Causalidad Operacional.
e.- Construccin de Relaciones de Objeto

en el

Espacio.
f.-

Desarrollo

de

Esquemas

Para

Relacionarse

con

Objetos.
5.V( )

F (X )

161

TERCERA ACTIVIDAD
1.a.- Los reactivos de prueba que no tenian atractivo para
las personas adultas.
b.-

Demasiadas

preguntas

enfatizaban

la

mera

manipulacin de las palabras.


c.-

Las

instrucciones

enfatizaban

la

velocidad

expensas de la precision.
d.- Depender de la edad mental era irrelevante en el
caso de las pruebas con adultos.
2.a.- De 10 a 14 sub pruebas, el enfoque de sub pruebas
multiples

permite

que

el

examinador

analice

las

fortalezas

intraindividuales, en lugar de calcular una sola puntuacin global.


b.- Una prueba verbal compuesta

de cinco a seis sub

pruebas y una escala de ejecucin que tambien incluye cinco o seis


sub pruebas. Con esta divisin el examinador puede evaluar las
habilidades de comprensin verbal y organizacin perceptual por
separado..........entre otras.
3.V(X)

F( )

4.-

5.V( )

162

F(X)

CUARTA ACTIVIDAD
1.a.- Formato de opcion multiple, contra formato de
preguntas abiertas.
b.- Calificacin mecanioca objetiva contra calificacio del
examinador.
c.- Aplicacin grupal contra individual.
d.- Empleo con fines de deteccin contra empleo

para

planificacin y regularizacion.
e.-

Muestreos

enormes

de

estandarizacion

contra

muestras simplemente grandes.


2.Ventaja:
Puede examinarse con rapidez y eficacia a grandes grupos de
personas.
Desventajas:
El individuo evaluado puede tener puntuaciones
su

verdadera

capacidad

debido

problemas

muy por debajo de


motivacionales

dificultad para seguir instrucciones.


3.V(X)

F( )

4.V( )

F(X)

5.La escala SILS, se propuso originalmente como un indice


de deterioro intelectual, la SILS consta de una seccion de vocabulario
163

con cuarenta reactivos

de opcion mltiple y una seccion de

abstracciones con veinte reactivos de llenados de espacio en blanco.


La prueba no ha funcionado bien como indice de organicidad pero si
satisface la necesidad de un instrumento breve de deteccin para la
inteligencia general.
6.V(x )

164

F( )

Robert J. Gregory, EVALUACIN PSICOLGICA Editorial:


Manual Moderno, 4 Edicin Mxico, 2006.

Bem, D. Funder D. Test Psicologicos de Inteligencia


Editorial American Psychological 1999
.

Campbell, D. P. Manual de medicion de la inteligencia


Editorial Mineapolis E.U.A. 1997.

Golberg, p. Evaluacion psicologica


Baterias Psicologicas
Editorial : Allyn y Bacon E.U.A. 1998.

165

Vous aimerez peut-être aussi