Vous êtes sur la page 1sur 62
© (e oe Vee TESTS PSICOLOGICOS ANNE ANASTASI SUSANA URBINA rincipales contextos del uso actual de las pruebas as pruebas psicolégicas se utilizan con diversos propésitos y sus reas de aplica- cién crecen continuamente. Luego de haber revisado con cierto detalle ejem- plos representativos de distintas pruebas, pasemos a la consideracién de los temas que atafien a su aplicacién. En este capftulo consideramos tres éreas prin- cipales en las que las pruebas cumplen una multiplicidad de funciones, que a grandes rasgos podemos llamar los contextos educativo, ocupacional y clinico o de consejerfa En el siguiente capitulo, el ultimo, veremos los temas éticos y sociales que se relacio- nan con las practicas de evaluacién en todas las Areas. EVALUACION EDUCATIVA En las escuelas se emplea casi cualquier prueba disponible; en el repertorio del conse- jero y de los psicélogos escolares pueden encontrarse tests de inteligencia, de aptitu- des especiales, de aptitudes multiples y de personalidad. Es comin que maestros y directores tengan que actuar en funcién de los resultados obtenidos con diferentes clases de pruebas; sin embargo, se han desarrollado especificamente algunos instru- mentos para emplearse en los contextos educativos,! pruebas que constituyen el cen- tro de interés de esta seccién, Incluyen instrumentos disefiados para la predicci6n y clasificacién en ambientes educativos y muchas clases de pruebas de aprovechamien- to escolar. "Tanto la versin de 1985 de los Estindares de Examinacidn (AERA, APA, NCME) como su revisin propuesta {véaseelcapttulo 1) incluyen un capttulo dedicado al uso de las pruebas en la edueacisa, 414 Principales contextos del uso actual de las pruebas 475 Naturaleza y usos de las pruebas de aprovechamiento. Las pruebas de apro- vechamiento, cuyo nimero supera con mucho a cualquier otro tipo de pruebas estanda- rizadas, estén disefiadas para medir los efectos de los programas de instruccién o entrenamiento. Se acostumbra distinguirlas de los tests de aptitud, que incluyen va- rios tests generales de inteligencia, baterias de aptitudgs muiltiples y tests de aptitudes especiales. Desde un punto de vista, la diferencia entte la evaluacién del aprovecha miento y la de la aptitud estriba en el grado de uniformidad de las experiencias rele- vantes. De este modo, una prueba de aprovechamiento mide los efectos de conjuntos relativamente estandarizados de experiencias, como un curso elemental de francés, de trigonometria o de programacidn en computadoras. En contraste, la ejecucién en un test de aptitud refleja la influencia acumulativa de una multiplicidad de experiencias en la vida diaria. Podemos decir que los tests de aptitud miden el efecto del aprendiza- je en condiciones relativamente no controladas y desconocidas, mientras que las pruebas de aprovechamiento miden los efectos del aprendizaje ocurrido en condicio- nes que en parte se conocen y controlan, La segunda distincién entre los tests de aptitud y las pruebas de aprovechamiento tiene que ver con sus usos; los primeros permiten predecir la ejecucién subsecuente, se emplean para estimar el grado en que los individuos se beneficiarn de un curso es- pectfico de entrenamiento o para anticipar la calidad de su aprovechamiento en una nueva situaci6n. Por otro lado, las pruebas de aprovechamiento generalmente repre- sentan una evaluaci6n terminal de su posicién individual al finalizar la formacién. En éstas, el énfasis se centra en lo que el individuo puede hacer en ese momento. Sin embargo, debe reconocerse que no es posible aplicar rigidamente distincion al- guna entre los tests de aptitud y las pruebas de aprovechamiento. Algunos tests de apti- tud pueden depender de un aprendizaje muy espectfico y uniforme, mientras que algunas pruebas de aprovechamiento cubren experiencias educativas més bien amplias y no estandarizadas. De modo similar, una prueba de aprovechamiento puede emplear- se para predecir el aprendizaje futuro y, como tal, cumple la misma funcién que un test de aptitud; por ejemplo, las pruebas de aprovechamiento en los cursos propedéuticos de la escuela de medicina pueden servir para predecir el rendimiento en esos estudios. En un esfuerzo por evitar el significado excesivo que se ha asociado a los términos “aptitud” y “aprovechamiento”, cada vez es més frecuente el uso del término “habili- dad” para designar las mediciones de la conducta cognoscitiva.? Cualquier prueba cognoscitiva, independientemente de cémo se llamara antes, ofrece una muestra de lo que el individuo sabe en el momento en que se le probs y mide el nivel de desarrollo obtenido en una o més habilidades. Ningén instrumento revela cémo o por qué alcan- 26 ese nivel, y para responder a esas preguntas es necesario ahondar en otras variables concomitantes y en especial en los antecedentes y las experiencias del individuo. En 2 Los nuevos nombres de los exmenes de la Junta Universitaria, efectivos desde 1994, representan un ejemplo de dos cambios que tienen lugar en telacién con las etiquetas. La conocida abreviatura del SAT ahora correspond a Test de Evaluacién Escolar (Scholastic Assessment Test) en lugar de Test de Aptitud Académica (Scholastic Apeitu- de Test). El nuevo SAT se ha reagrupado en dos componentes, el SAT-L, una prueba de razonamiento que reem- plaza al anterior Test de Aptitud Académica, yel SAT-I, son pruebas teméticas que reemplazan a las anteriores pprucbas de aprovechamiento. Estos cambios fueron acompafiados por otras innovaciones sustanciales en las pruebas que veremos en otra seccién del capitulo. 476 Aplicaciones de las pruebas Especificidad $< ———______________________._ Generalidad | os ce oe é “dp 4 # Figura 17.1. Pruebas de habilidades desarrolladas: continuo de especificidad de la experiencia. este sentido, cada puntuacién tiene un pasado que debe ser explorado para la adecua- da comprensisn del sujeto que la obtuvo; pero también tiene un futuro en la medida fen que permite cierta prediccidn de lo que hard en otras situaciones, ajenas a la prue- ba, asf como en algtin tiempo futuro. Los tests de habilidades desarrollados, se han disefiado como tests de inteligencia general, baterias de aptitudes multiples, rests de aptitudes especiales o pruebas de aprovechamiento, pueden ordenarse en rérminos de la especificidad de la experiencia que suponen, como se ilustra en la figura 17.1. En un extremo se encuentran las prue- bas de aprovechamiento orientadas al curso que cubren habilidades técnicas o infor- macion real muy definidas. Aqui podria encontrarse, por ejemplo, un examen de vocabulario de ruso o de mantenimiento de televisores. Vienen luego las pruebas de aprovechamiento de orientacién mas amplia, que suelen usarse para evaluat Ia obten- cid de las principales metas educativas a largo plazo, y en las que encontramos instru- mentos que se concentran en la comprensidn y aplicacién de principios cientificos, la interpretaci6n de la literatura o la apreciacion de las artes, De orientacién atin més amplia son los instrumentos de medicién de las habilidades cognoscitivas biisicas, co- mo las pruebas de comprensién de lectura, de célculos aritméticos y de razonamiento Iogico, que afectan el rendimiento del individuo en una gran variedad de actividades. Es claro que aqui se funden imperceptiblemente las pruebas de aprovechamiento con los instrumentos de medicién tradicionales de inteligencia y de aptitud.> Las baterfas cognoscitivas predominantemente verbales, conocidas como tests de inteligencia, es- van proximas a las pruebas mas amplias de aprovechamiento; vienen luego las de eje- cucién y sin lenguaje, que por lo general no requieren de lectura o escritura; mientras que en el extremo se encuentran los instrumentos transculturales disefiados para em- plearse con personas de muy diversos antecedents. Denominar a algunos instrumentos como “tests de aptitud” y a otros “pruebas de aprovechamiento” puede dar lugar a algunos usos inadecuados de los resultados. Un > Fea superposicién puede demostrarse empiticamente mediante el examen del cercano parecdo del contenido yel grado de correlacién entee las prucbas con esas etiquetas (véase, por ejemplo, W. Coleman y Cureton, 1954; Cooley y Lohnes, 1976). Principales contextos del uso actual de las pruebas 477 ejemplo comtin es la prictica de identificar como nifios con bajo aprovechamiento a aquellos cuyas puntuaciones en las pruebas de aprovechamiento son inferiores a los ob- tenidos en los tests de aptitud o en los de inteligencia. En realidad, estas diferencias de Jos individuos en las puntuaciones de las pruebas reflejan el hecho de que no hay dos instrumentos (u otros indicadores de la ejecucién, com¢ las calificaciones obtenidas en Jos cursos) que mantengan una correlacién perfecta. La cuestién del bajo o elevado aprovechamiento puede formularse con mayor precisién como una sobre 0 subpredic- cién de la primera prueba a la segunda. Entre las razones que explican los errores de prediccién en los casos individuales se encuentran la poca confiabilidad de los instru- mentos, las diferencias en el contenido cubierto, los diversos efectos de los factores ac- titudinales y motivacionales sobre ambas medidas y el impacto de experiencias como la instruccién de remedio o una larga enfermedad (R. L. Thorndike, 1963). Desde Mice mucho tiempo se reconocen las diversas funciones que pueden cumplir las pruebas de aprovechamiento en el proceso educativo. Como auxiliar en la asigna- cién de calificaciones (o en cualquier otra evaluacisn de la competencia alcanzada), las prucbas estandarizadas de aprovechamiento tienen las ventajas de la objetividad, la uni- formidad y la eficacia. Si se construyen de manera apropiada, tienen otros méritos, como la adecuada cobertura del contenido y la reduccién de la operacién de factores aleato- rios e irrelevantes en los procedimientos de calificacién. Las pruebas de aprovechamien- to también constituyen una caracteristica importante de los programas de ensefianza de remedio. A este respecto, pueden ser de utilidad tanto en la identificacién de los estu- diantes con problemas educativos especiales como en la medicién del progreso en el cuiso del trabajo de remedio. Para todos los estudiantes, la aplicacién periddica de prue- bas de aprovechamiento bien elaboradas y apropiadamente elegidas pueden ayudar a fa- cilitar el aprendizaje. Estas pueden revelar las debilidades del aprendizaje anterior, dar direcci6n al aprendizaje subsecuente y motivar al estudiante. El valor de incentivo del “conocimiento de los resultados” ha sido demostrado repetidamente en algunos experi- mentos psicolégicos realizados en muchas situaciones de aprendizaje, con sujetos que varian mucho tanto en edad como educacién. La eficacia de dicha autosupervisiOn sue- Te aumentar por su inmediatez. Desde otro punto de vista, las pruebas de aprovechamiento proporcionan un medio para adaptar la instruccién a las necesidades individuales. La ensefianza puede ser mas fructffera cuando es adecuada para la etapa del alumno, El primer paso necesario para la ensefianza eficaz consiste en asegurarse de qué es lo que el estudiante puede hacer y qué es lo que ya sabe. Al aplicar examenes al inicio del afio escolar, los educadores pueden emprender los pasos necesarios para cubrir las deficiencias reveladas por los resultados. Otros ejemplos de la funcién de las pruebas de aprovechamiento en el pro- ceso de ensefianza se aprecian en la evaluacién referida a dominio y los sistemas ins- truccionales individualizados que analizamos en el capftulo 3. Finalmente, las pruebas de aprovechamiento pueden emplearse como apoyos en la evaluacién y el mejoramiento de la ensefianza, asf como en la formulacién de las me- tas educativas. Las pruebas de aprovechamiento pueden proporcionar informacién sobre lo adecuado de la ensefianza de las habilidades y contenido esencial. Al concen- trar la atencidn en estos temas y ofrecer hechos concretos, las pruebas estimulan el anilisis de los objetivos educativos y fomentan el examen critico del contenido y de 478 Aplicaciones de las pruebas los métodos de instruccién.* Dado el incremento en la exigencia publica de explica- ciones, en las dltimas décadas se ha observado una cantidad sin precedente de evalua- ciones a instituciones educativas de todos los niveles. En los Estados Unidos, gran parte de esta evaluacién es obligatoria, por mandato de los distritos locales y estatales, asf como por el gobierno federal (B. Gifford, 1989b; Hartle y Battaglia, 1993; National Council on Education Standards and Testing, 1992). La Evaluacién Nacional del Pro- greso Educativo, conocida informalmente como “la tarjeta de calificaciones naciona- les”, es uno de los ejemplos mejor conocidos del programa de evaluacién de ley establecido por el gobierno estadounidense (véase, por ejemplo, Alexander y James, 1987; Gentile, Martin-Rehrmann y Kennedy, 1995; E. G. Johnson, 1992; Messick, Beaton y Lord, 1983; NAEP, 1985; E. B. Womer, 1970). Debido a la difusién de las pruebas estandarizadas y a las consecuencias econémicas de amplio rango que pueden estar unidas a sus resultados, los propios instrumentos han sido sometidos a criticas y a un escrutinio intenso. Los métodos utilizados para evaluar e} progreso educativo, algu- na ver tertitorio exclusivo de los especialistas en las pruebas, se ha convertido en el centro de interés de un debate muy politizado que no sélo recibe la atencién de legis- ladores y Iideres de la industria, sino también del pablico en general (R. E Bennett y Ward, 1993; Courts y McInerney, 1993; Gifford y O'Connor, 1992; S, P. Robinson, 1993; G. P. Wiggins, 1993). El lector interesado puede encontrar en Linn y Gronlund (1995, capitulo 18) una revisiGn de los temas y las tendencias relacionados con los exdmenes escolares y la evaluacién de los programas. Construccién en comparacién con eleccién. Histéricamente, los examenes escolares tradicionales consistfan en un conjunto de preguntas que debian responder- se de palabra 0 por escrito. En cualquier caso, el examinado componfa y formulaba la respuesta; el término “pregunta de ensayo” Ilegé a utilizarse ampliamente para cubrit las preguntas de respuesta libre, que no sélo inclufan las que exigfan un largo ensayo, sino también las que pedfan al examinado dar una respuesta corta o trabajar en la so- lucién de un problema matemético. En contraste, las “preguntas objetivas” eran aquellas que pedian la eleccién de una respuesta correcta de las alternativas propor- cionadas para cada pregunta. Aunque hay varias clases de reactivos que piden a los examinados seleccionar una respuesta, como los de falso 0 verdadero y los de empa- tejamiento, con mucho las més utilizadas, estudiadas y también més criticadas han sido las preguntas de opcién multiple. Los erfticos de éstas argumentan que promueven la memorizacién mecénica y el aprendizaje de hechos aislados en lugar del desarrollo de las habilidades para la reso- luci6n de problemas y la comprensién de conceptos. Ademés, mucha gente mal in- formada en los planteles y la politica educativa considera idénticos los reactivos de opcién miltiple con la evaluacién estandarizada y menoscaba a la vez estos dos ele- mentos de la metodologfa de la evaluacién.* En un giro irénico de los acontecimien- “Publicaciones recientes en Ia educacidn en las reas de matematica yciencia (véase, por ejemplo, Penner, Bats- che, Knoff y Nelson, 1993) y el mejoramiento de las habilidades de pensamiento (véase, por ejemplo, Mulcahy, Short y Andrews, 1991) ejemplifican el trabajo orientado a la solucién que puede resultar de este examen critico. 5 Debe mencionarse que los instrumentos uilizados en muchos programas de evaluacién educativa a gran escala (como las pruebas del SAT, el NAEP y otros instrumentos estandarizados de aprovechamiento) utilizaron por al- ‘in tiempo preguntas de ensayo y reactivos de formato abierto. Principales contextos del uso actual de las pruebas 479 tos, a menudo se considera que los mismos programas estandarizados de evaluacién usados para planear el progreso educativo contribuyen a las deficiencias educativas que han descubierto (Courts y McInerney, 1993; H. Gardner, 1992; Resnick y Res- nick, 1992). Por desgracia, las criticas acerca del uso excesivo e inadecuado de las pruebas estandarizadas en algunos casos han sido cufdadosamente justificadas. En cualquier caso, las quejas de que la evaluacién dirige el curriculum y que ambos ne- cesitan con urgencia una reforma provienen de educadores de todos los niveles. Los defensores de la reforma educativa creen que se necesita una revisién general tanto de las metas curriculares, de los métodos instruccionales asf como de los instrumen- tos de evaluacién debido a que perciben que todas esas 4reas se encuentran rela- cionadas ‘Como los aspectos filoséficos, politicos y practicos de la reforma educativa estan més alld del alcance de este libro, nos limitaremos a analizar algunas de las opciones propuestas en la metodologia de la evaluacién, las cuales se describen por diversos ru- bros como evaluacién “basada en el desempefio”, evaluacién “auténtica” y evaluacién “directa” (véase, por ejemplo, E. L. Baker, O'Neil y Linn, 1993; Linn y Gronlund, 1995, capfulo diez). Aunque cada una de ellas representa énfasis distintos, una de las, caracteristicas centrales que todos comparten es la marcada preferencia por tareas que, como las anteriores “preguntas de ensayo”, requieren que el examinado dé una respuesta. Estos reactivos se describen ahora como de construccién de respuesta o tareas abiertas, y se distinguen de las tareas de selecciGn de respuesta, que es el término aplica- do a los reactivos que s6lo exigen que el examinado elija una respuesta de entre las opciones presentadas, como los reactivos de opcién multiple y los otros tipos de pre- guntas que solian Ilamarse “objetivas”. Los reactivos de construccién de respuesta pueden incluir el simple completamiento (como los de “Ilenar los espacios”), solucién de problemas y ensayos, asf como una variedad de presentaciones 0 desempefios como tocar un instrumento, dar una charla o reparar una méquina.° El método conocido como evaluacién de portafolio ofrece otro conjunto de alternati- vas. Esta herramienta pretende principalmente hacer tan significativo y realista como sea posible el proceso de evaluacién educativa. Aunque el término se aplica a una am- plia gama de procedimientos, por lo comtin el portafolio consta de un registro acumu- lativo (obtenido a lo largo de un periodo prolongado) de muestras del trabajo del estudiante en dreas concretas, como la redaccién o cualquier otro empefio que incluya un proceso en el que sea posible documentar el progreso (Camp, 1993; Gitomer, 1993; D. P. Wolf, 1993). El método de portafolio ofrece gran flexibilidad y puede po- nerse en préctica de manera més o menos formal y con diversos grados de colaboraci6n. entre el estudiante y el maestro (véase en Karlsen, 1992, un ejemplo de un instrumen- to publicado). El lector habra inferido, incluso de esta breve recapitulacién, que se est prestando gran atencién a los medios por los que se conducen las evaluaciones del aprendizaje y el trabajo del estudiante. Esta preocupacién se extiende no sélo a lo que miden los di- © Obviamente, los reactives de la prueba pueden clasficarse segtin otras dimensiones, ademas de si incluyen o no la construcciéin ola seleccién de respuestas. En R. E. Bennett (1993) y en R. E. Snow (1995) pueden encontrar- se ejemplos de dos diferentes taxonomias de los tipos de reactivos.

Vous aimerez peut-être aussi