Vous êtes sur la page 1sur 42

Pg.

0 de 42

MDULO VII: DISEO DE PRUEBAS DE EVALUACIN DEL


APRENDIZAJE
1. Clasificacin de instrumentos de evaluacin
1.1. Introduccin
Las tcnicas e instrumentos de evaluacin estn dirigidos a evaluar todos
aquellos aspectos que forman parte del proceso de formacin. Si nos referimos
a las personas participantes, stos valoran sus conocimientos, habilidades y
actitudes, en cuanto a los contenidos que se van impartiendo en la accin
formativa.
Antes de describir las tcnicas e instrumentos ms utilizados para llevar a cabo
esta evaluacin, aclararemos la diferencia existente entre estos dos conceptos:
Tcnicas: son pautas de actuacin concretas y
particulares, que se utilizan para desarrollar una
actividad.
Instrumentos: son las herramientas que se
emplean para alcanzar el objetivo de la actividad.

La eleccin de una determinada tcnica y/o instrumento determinar tanto el


proceso de evaluacin y metodologa (cualitativa, cuantitativa, mixta) como su
validez y fiabilidad.
La persona formadora debe seleccionar las tcnicas e instrumentos ms
apropiados en cada situacin, dependiendo en gran medida de esta eleccin el
grado de xito de la evaluacin.

1.2. Tipos de instrumentos


Entre el abanico de eleccin encontramos:
Conceptos
Evaluacin de contenidos conceptuales. Pruebas objetivas

Pruebas de evocacin
Ensayo
Respuesta breve
Texto incompleto
Pruebas de seleccin
Dos alternativas
Correspondencia
Seleccin mltiple
Ejercicio interpretativo

Pg. 1 de 42

Procedimientos
Evaluacin contenidos procedimentales
Listas de cotejo
Escalas de calificacin
Hoja de evaluacin de las prcticas
Actitudes
Evaluacin contenidos actitudinales

Escalas de actitudes
Sociogramas
Anecdotarios
Grupos de discusin
Metodologa Q

Otros
Instrumentos complementarios

Tcnicas de observacin. Anecdotarios


Listas de control
Escalas de estimacin
Tcnicas de informacin directa
Cuestionarios
Inventarios
Entrevistas
Test

2. Evaluacin de contenidos conceptuales


2.1. Planteamiento general de una prueba de evaluacin
Una prueba de evaluacin no se puede improvisar, sino, que debe ser fruto de un
trabajo organizado para que pueda tener una mnima garanta de validez. Por
tanto, en el planeamiento de una prueba de evaluacin hay que tener en cuenta
los siguientes criterios que condicionan su eficacia:
a) Comprobar que los aprendizajes que
queremos evaluar se ajustan al tipo de prueba.
As, hay aprendizajes que es ms adecuado
medir con una prueba prctica que con una
escrita.
b) Seleccionar las preguntas (tems) que
mejor se adapten al aspecto del aprendizaje
que queremos medir.
c) Establecer una relacin entre los objetivos y contenidos que se
pretenden evaluar con los tems que se van a utilizar para su medicin
(tabla de especificaciones).
d) Elaborar un nmero de tems y prcticas superior al que se vaya a utilizar
para poder seleccionar los ms adecuados. As podremos ir elaborando un
banco de tems.

Pg. 2 de 42

e) Cuidar la presentacin fsica de la prueba de manera que no se


dificulten las respuestas de los alumnos por aspectos puramente formales
(calidad de la impresin, orden de las alternativas etc.).
f) A la vez que se construye la prueba, debe elaborarse la clave de
respuesta. De esta manera nos cercioraremos de su objetividad.

2.2. Construccin de la tabla de especificaciones


Su construccin es el primer paso que hay que dar al planear una prueba de
evaluacin. Establece la relacin entre los objetivos y contenidos del curso con
los tems que se van a utilizar para la medicin de los mismos.
A lo largo de las prximas pantallas, veremos el procedimiento que hay que
seguir para su elaboracin:
1. Seleccionar los objetivos a evaluar y los contenidos correspondientes a cada
uno. Para ello habr que simplificar la totalidad de objetivos suprimiendo
aquellos que se repiten o estn implicados en otros.
En un ejemplo referido a la informtica, los objetivos y contenidos podran ser:
Objetivos
a.- Conocer:
1.1. Terminologa
1.2. Procedimiento
1.3. Criterios de Aplicacin
1.4. Clasificaciones
1.5. Elementos
b.- Definir vocabulario tcnico
c.Determinar
soluciones
ms
adecuadas
d.- Realizar los clculos necesarios
e.- Comprender los procedimientos
f.- Analizar problemas
g.- Aplicar procedimientos a situaciones
planteadas

Contenidos
1. Hardware:
1.1. Procesador
1.2. Placa base
1.3. Memoria
1.4. Unidades de almacenamiento
de datos
1.5. Tarjetas de vdeo
1.6. Tarjetas de sonido
1.7. Monitores
1.8. Impresoras y Plotters
1.9. Scanners/Cmaras digitales
1.10. Tarjetas de Red
1.11. Modems
1.12. Tarjetas RDSI
2. Sistemas Operativos:
2.1. Windows
2.2. Linux
2.3. Linex

2. Dar importancia relativa a cada uno de los


objetivos. De aqu saldr determinado el nmero
de tems que hace referencia a cada objetivo:
Adjudicar un porcentaje de importancia a cada
objetivo.
Determinar el nmero de tems que harn
referencia a cada uno de esos contenidos.
Para ello, solo tenemos que precisar el nmero total de tems que queremos
que tenga la prueba y repartir proporcionalmente segn el porcentaje de
importancia adjudicado a cada una de las partes.

Pg. 3 de 42

3. Jerarquizar los objetivos, es decir, determinar a que nivel se pide cada uno.
Para esto utilizaremos las llamadas taxonomas.

3. Pruebas objetivas
3.1. Tipos de tems
Se utilizan para evaluar objetivos del dominio cognoscitivo, ya sea de
conocimientos o de habilidades intelectuales. Consisten en un tipo de examen
escrito cuyas caractersticas principales son:
Presencia de un alto nmero de preguntas breves en su enunciado y
breves en su respuesta (tems).
Las respuestas correctas estn previamente determinadas.
El procedimiento para la valoracin de los resultados de la prueba est
previamente determinado.
En este tipo de pruebas, podemos encontrarnos con diferentes tipos de tems,
como los siguientes:
tems de evocacin
Suponen evocar o redactar la respuesta concreta e ntegra. Entre estos tems,
encontramos:
Pruebas de ensayo: son pruebas en las que el alumno tiene que
desarrollar la pregunta que se propone, pudiendo presentar sus propias
ideas.
Respuesta breve: contestar con una palabra, frase o smbolo.
Texto incompleto: la respuesta se ha de insertar en un texto
presentado.
tems de seleccin
Consiste en elegir una respuesta entre varias propuestas.
De dos alternativas: consiste en elegir una respuesta entre dos
propuestas.
Correspondencia: asociar por parejas los elementos de dos conjuntos.
Seleccin mltiple: elegir una respuesta, generalmente entre tres o
cinco propuestas.
Algunas normas que debemos seguir siempre que redactemos
preguntas para nuestras pruebas objetivas, han de ser:
Vocabulario del tem comprensible para todos los
alumnos.
Redactar el tem de manera que exija una respuesta
exacta. Si una pregunta est formulada de manera
ambigua o general podr tener varias respuestas
correctas.
Evitar la interdependencia entre dos o ms preguntas.
No debe existir interrelacin entre varias preguntas de
modo que para contesta a una de ellas se tenga que
haber contestado a las anteriores.

Pg. 4 de 42

Evitar el uso de trucos o trampas.


No recurrir a trivialidades.
Agrupar los tems de un tipo y dar instrucciones para su contestacin.
Evitar que la respuesta sea obvia.
Evitar claves reveladoras.

En general hay tres clases de claves:


Claves verbales: resultan de una asociacin verbal
entre la pregunta y su respuesta. Ejemplo:
Cual de las unidades siguientes es mltiplo del metro?
Kilogramo.
Hectmetro.
Decalitro.
(Clave verbal: metro - hectmetro).
Claves gramaticales: construcciones gramaticales que descubren la
respuesta al concordar la respuesta con lo preguntado en gnero
(masculino-femenino) o en nmero (singular-plural).
Claves por heterogeneidad: resultan por la discordancia entre los
elementos de un conjunto. Ejemplo:
Unir cada elemento con su definicin:
Elemento que produce la chispa.
Elemento que recarga la batera.
Tipo de combustible.
Elemento que evita cortocircuito.

Buja.
Condensador.
Dnamo.
Fusible.
Gasoil.
Delco.

3.2. tems de evocacin:


Pruebas de ensayo
Son pruebas en las que el alumno tiene que desarrollar la pregunta que se le
propone, pudiendo seleccionar, relacionar y presentar ideas con sus propias
palabras.
Al tener el alumno la oportunidad de desarrollar la respuesta pueden medirse
objetivos algo ms complejos que con las pruebas objetivas y tienen mayor
subjetividad que estos tems, aunque dicha subjetividad se reduce utilizando
procedimientos adecuados de correccin.
La posibilidad de expresin del alumno en su respuesta estar ms o menos
restringida segn la prueba sea de:
Ensayo breve: estas pruebas limitan tanto el contenido como la forma
de la respuesta del alumno. Esta limitacin viene dada por la propia
expresin de la pregunta, as en las instrucciones y naturaleza de cada
pregunta se establecen unas bases precisas que orientan la respuesta
hacia el tipo especifico de aprendizaje que se pretende medir. Ejemplo:

Pg. 5 de 42

En la hora de examen que tienes explica:


1. Por que es deficitaria nuestra balanza comercial (10 minutos).
2.
Por que es difcil construir carreteras y ferrocarriles en Espaa (5
minutos).
3. Por que Espaa ocupa un lugar estratgico en Europa (10 minutos).
Ensayo o de respuesta extensa: estas pruebas dan al alumno mayor
posibilidad de expresin, ya que le ofrecen la posibilidad de seleccionar
cualquier informacin que posea y que considere adecuada para
organizar las respuestas segn su criterio, integrando y evaluando ideas
corno considere ms apropiado. Se trata de medir la capacidad del
alumno para dar un enfoque global a una determinada cuestin.
Tiene la ventaja de que permite expresarse al alumno con toda libertad,
pero por el contrario son difciles de evaluar, por no permitir la objetividad
necesaria y por el excesivo tiempo que su calificacin conlleva. Ejemplo:
Analice lar razones fundamentales de la creciente incorporacin de la
informtica a los diferentes sectores productivos.
Para elaborar este tipo de prueba, debemos seguir unas normas, como:
Restringir el uso de estas pruebas para la medicin
de los aprendizajes complejos que no pueden
medirse a travs de pruebas objetivas.
Organizar la prueba de manera que las respuestas a
cada una de las cuestiones se de en hojas
separadas. De esta forma es ms fcil analizar y
corregir la misma pregunta contestada por todos los
alumnos.
Indicar el tiempo aproximado que debe emplearse
en cada respuesta. Esto orientar al alumno sobre la
extensin y profundidad que requiere la respuesta y
le ayudar a organizar mejor su trabajo.
Especificar en la pregunta los aspectos que se tomarn en cuenta para
la evaluacin de la misma.
Plantear la pregunta de manera que quede claramente expresada la tarea
del alumno y evitando cualquier posibilidad de interpretacin incorrecta.
No plantear, la prueba con preguntas opcionales.
Es preferible aumentar el nmero de cuestiones y disminuir la longitud
de las preguntas y respuestas requeridas, que hacer preguntas muy
densas que exigen respuestas demasiado largas.
El procedimiento que seguiremos para corregirlas, ser:
El evaluador no debe conocer el nombre del alumno hasta que haya
terminado de calificar.
Calificar la misma pregunta a la vez a todos los alumnos antes de pasar
a la correccin de la siguiente pregunta. As se
conseguir que la atencin del evaluador no se
distraiga demasiado con el constante cambio de tema
y una lnea de juicio ms homognea para asignar
puntuacin a cada respuesta.
Elaborar los posibles modelos de respuesta para
cada pregunta, asignndoles previamente una
puntuacin. Ejemplo:

Pg. 6 de 42

Enumerar los elementos que componen el aire, indicando en que proporcin


se encuentran.
Respuesta modelo.
Puntuacin.
Oxigeno 20%
Nitrgeno 79%
Anhdrido carbnico, nen, argn, kriptn, y helio
en pequeas cantidades.
1
Respuesta breve y texto incompleto
Sirven para medir conocimientos de datos simples que pueden expresarse con
la brevedad que requieren este tipo de tems. Son adecuados para la evaluacin
formativa ya que indican de forma breve y precisa si los alumnos han captado las
ideas fundamentales y los aspectos de la materia en los que el profesor deber
insistir.
Entre sus ventajas encontramos que resultan fciles de construir y que adems
eliminan la posibilidad de respuesta por adivinacin.
Para redactar estos tems, seguiremos las siguientes normas de elaboracin:
Redactar la pregunta de manera que nicamente sea posible una
respuesta breve. Ejemplo:
La vaca es un animal........................
(Podra contestarse mamfero, herbvoro, manso etc.)
La vaca, por alimentarse con vegetales, se clasifica como animal. (Herbvoro)
Evitar el uso de expresiones idnticas a las que figuran en los manuales,
ya que en estos casos solo se estimula la simple memorizacin y no la
comprensin.
Es preferible la pregunta directa a la oracin incompleta.
Cuando la respuesta trata de nmero, indicar el tipo de unidades exigidas.
Considerar correcta cualquier pregunta que exprese el concepto
correcto.
Los espacios en blanco para las respuestas deben ser de la misma
longitud y ordenarse a la derecha de la hoja.

3.3.tems de seleccin:
De dos alternativas
Se usan para medir la capacidad del alumno de distinguir entre hechos y
opiniones, identificar relaciones causa-efecto y distinguir conclusiones vlidas de
las que no lo son.
En este tipo de tems nos encontramos con unas ventajas y limitaciones que
tendremos que tener en cuenta a la hora de su eleccin. Entre las ventajas, decir
que son fciles de elaborar, poco propicios a la existencia de claves reveladoras y
adems son fciles de contestar.
Por el contrario, entre sus limitaciones, su valor diagnstico es prcticamente
nulo, ya que, el reconocer una proposicin como falsa no quiere decir
necesariamente que se conozca con exactitud la respuesta correcta. As mismo,
debemos tener en cuenta que su incidencia del azar en estos tems es del 50% y

Pg. 7 de 42

que resulta difcil reducir el contenido de una unidad didctica a respuestas


alternativas tan reducidas.
Para paliar la alta incidencia del azar la frmula de correccin en estas pruebas
es:
PUNTUACIN FINAL = n aciertos - n errores
Este tipo de tems, tiene diferentes tipos:
Verdadero / Falso, o Si / No.
Justificacin de la respuesta falsa.
Consiste en escribir la respuesta verdadera en el caso de que la
afirmacin sea falsa.
Hecho / Opinin.
Consiste en distinguir si la observacin presentada es un hecho o una
opinin.
Como todos los tems anteriores, estos tems de dos alternativas deben seguir
unas normas de elaboracin:
Cada enunciado solo debe incluir una idea o
concepto. Ejemplo:
Cuando se enciende la luz roja del semforo se debe
cambiar a una velocidad ms corta para detener el
vehculo:
V
F
Primer concepto: cambiar a una velocidad corta.
Segundo concepto: detener el vehculo.
La verdad o falsedad de los tems debe ser lo ms categrica posible, de
modo que solo admita una alternativa como respuesta correcta, la cual,
no sea tan evidente que pueda contestarse sin necesidad de estudiar o
tan absurda que no tenga posibilidad de respuesta. Ejemplo:
El agua hierve a 100 grados.
V-F
(mal)
El agua destilada hierve a 100 grados al nivel del mar.
V-F
(bien)
Las proposiciones de tipo muy general deben evitarse pues suelen tener
excepciones. Ejemplo:
Los metales se caracterizan por ser duros. V-F
(El plomo y el mercurio son excepciones).
Evtense claves ajenas a respuesta. Trminos como siempre, nunca;
nadie, ninguno, suelen asociarse a conceptos falsos ya que son escasas
las situaciones verdaderas que no tienen excepciones.
Redactar los tems positivos y negativos con la misma extensin.
Evitar las formulaciones negativas y la doble negacin. Solo deben
usarse cuando sean imprescindibles y siempre recalcando la negacin.

Pg. 8 de 42

De correspondencia
Se utilizan para medir la capacidad de identificar relaciones entre dos cosas, se
basan pues en el conocimiento de asociaciones concretas, que generalmente son
asociaciones sencillas.
Su principal ventaja es su densidad, pues dada la variedad de conceptos que
incluye cada tem, es posible comprobar gran cantidad de conocimientos en poco
tiempo.
En cambio, tiene dificultad de encontrar material homogneo para la construccin
de listas amplias de elementos para asociar y un riesgo de que existan claves
reveladoras.
Las normas de elaboracin que seguiremos para este tipo de tems son:
Elaborar un nmero desigual de premisas y de respuestas, explicando
en las instrucciones que las respuestas pueden usarse una vez, varias
veces o ninguna. As se evita que el alumno acierte el ltimo par por
simple eliminacin.
El material que compone el tem debe ser homogneo. Esto es necesario
para que todas las respuestas parezcan razonables y evitar la existencia
de claves.
La lista de premisas debe ser breve, aproximadamente entre 4 y 7.
El espacio ocupado por un tem debe caber en un solo lado de la hoja.
Evitar claves reveladoras: verbales, gramaticales y por heterogeneidad.
Pueden ser de dos tipos: asociar pares simples y asociar pares compuestos, segn
el nmero de columnas que intervengan y los requerimientos exigidos.
Asociacin de respuestas por pares simples. Ejemplo:
Relaciona cada ro con su vertiente.
1.
2.
3.
4.
5.
6.
7.
8.
9.

Ebro
Guadiana.
Mio.
Guadalquivir.
Segara.
Tajo
Narcea.
Duero.
Naln.

a. Vertiente Cantbrica.
b. Vertiente Atlntica.
c. Vertiente Mediterrnea.

Asociacin de respuestas por pares complejos. Ejemplo:


Relaciona el monumento de la primera columna con el estilo artstico a que
pertenece (segunda columna) y la nacin en que se encuentra (tercera
columna).

Pg. 9 de 42

1. Catedral de Chartres.
2. Catedral de Colonia.
3. Puerta del Hospicio.

A.
B.
C.

Renacentista.
Romnico.
Barroco.

4. Baslica de San Pedro.

D. Gtico.

a. Espaa.
b. Francia.
c. Italia.
d. Alemania.

De seleccin mltiple
Estos tems permiten la medicin de objetivos y aprendizajes ms complejos y
se adaptan muy bien al tratamiento estadstico.
En estos tems la parte correspondiente al planteamiento del problema recibe el
nombre de base. Las posibilidades que se ofrecen para la respuesta se llaman
alternativas y las alternativas incorrectas se llaman distractores. Ejemplo:
Base: Si decimos que una sustancia tiene un ph 7 cmo ser?
a) Acida
b) Bsica.
c) Neutra. (Respuesta correcta).
Distractores: a) y b).
Alternativas: a), b) y c).
Existen dos tipos bsicos de tems de seleccin mltiple:
Seleccin de la respuesta correcta: tiene una sola respuesta
correcta o verdadera entre 3 o ms alternativas que pueden plantearse.
Ejemplo:
Amrica fue descubierta durante el reinado de:
1. Felipe II
2. Los Reyes Catlicos.
3. Carlos I.
4. Felipe III.
5. Carlos VI
Seleccin de la mejor respuesta: todas las alternativas planteadas son
ms o menos vlidas o correctas, pero solo una es la mejor, la ms
correcta. Ejemplo:
Cervantes es conocido sobre todo por:
1. Sus poesas.
2. Sus novelas ejemplares.
3. Sus novelas de caballeras.
4. Sus retablos teatrales.
Para contrarrestar la incidencia del azar en eleccin de la respuesta la formula de
correccin es la siguiente:
Pt=A-E/(N-x)
Donde:
Pt = Puntuacin tota, resultado.
A = Aciertos.
E = Errores.

Pg. 10 de 42

N = Nmero total de alternativas.


x = Nmero de alternativas verdaderas.
Las normas que deberemos seguir para elaborar estos tems son:
La base del tem o pregunta debe tener por si misma significado y
presentar un problema sin necesidad de aadir las alternativas. Ejemplo:
(MAL) Los gases:
a) Son dctiles.
b) Tienen expansionalidad.
c) Tienen elasticidad.
(BIEN) Cual de las siguientes propiedades corresponde a los gases?
a) Ductilidad.
b) Expansionalidad.
c) Elasticidad.
Utilizar las formulaciones negativas nicamente cuando sea
imprescindible. En estos casos se recalcar especialmente la negacin.
La respuesta ptima debe ser solamente una.
Evitar sobrecargar de texto la base del tem. Ejemplo:
(MAL) Como es sabido el motor de explosin funcionar gracias a la
combustin de un gas formado por la mezcla de aire u combustible, en esta
operacin, que nombre recibe el elemento que produce la chispa para la
combustin de los gases?
a) Carburador.
b) Delco.
c) Buja.
(BIEN) En el motor de explosin, que elemento produce la chispa para la
combustin de los gases?
a) Carburador.
b) Delco.
c) Buja.
Todos los distractores deben parecer razonables, de lo contrario podran
eliminarse fcilmente por ser absurdos o incoherentes con el resto del tem,
facilitando as una respuesta por eliminacin. En las prximas pantallas vamos a
conocer las caractersticas de estos distractores.
Variar al azar la posicin de la respuesta correcta.
Evitar el uso de las alternativas "Todas las anteriores" y "Ninguna de las
anteriores".
Al utilizar "Todas las anteriores" el alumno puede notar que es correcta
con solo darse cuenta que dos opciones son correctas, tambin puede
reconocerse como incorrecta en cuanto se de cuenta de que al menos una
de las otras alternativas es incorrecta.
Cuando se utiliza "Ninguna de las anteriores" no estaremos midiendo ms
que la capacidad de reconocer respuestas incorrectas y eso no garantiza
que el alumno sepa cual es la correcta.
Variar la longitud de la respuesta correcta para evitar claves.
Evitar la utilizacin de trminos absolutos en los distractores. Trminos
como "siempre, todo, ninguno, nunca, solamente" suelen ir asociados a
alternativas falsas.

Pg. 11 de 42

Asegurarse de que no existan tems que suministren informacin o claves


para responder a otros tems de la prueba, pues a veces la informacin de
un tem puede servir para responder a otro.
No debe existir coincidencia ni inclusin mutua entre las alternativas.
Ejemplo:
Cual es la proporcin de brucelosis en el ganado vacuno de la provincia X?
a) Ms del 70%.
b) Ms del 60%.
c) Menos del 50%.
d) Menos del 30%.
Aqu si "a" es correcta tambin lo es "b", e igualmente si "d" es correcta
tambin lo es "c".
Las palabras que se vayan a repetir en todas las alternativas forman parte
de la base del tem y no de las opciones. Ejemplo:
(MAL) El consumo medio de combustible en un automvil est calculado:
a) A una velocidad de 90 Km/h.
b) A una velocidad de 110 Km/h.
c) A una velocidad de 80 Km/h.
(BIEN) El consumo medio de combustible de un automvil se calcula a una
velocidad de:
a) 90 Km/h.
b) 110 Km/h.
c) 80 Km/h.
Cuando se pretende medir la comprensin de trminos, conceptos...etc.,
estos deben figurar en la base mientras que las definiciones,
descripciones, etc. figuraran en las alternativas. Ejemplo:
(MAL) Como se llama el aparato que permite aumentar o disminuir el voltaje
de la corriente alterna?
a) Transformador.
b) Rectificador
c) Estabilizador.
d) Condensador.
(BIEN) Que funcin especifica cumple un transformador en un circuito
elctrico?
a) Modificar la fuerza electromotriz de la corriente.
b) Cambiar la corriente continua en alterna.
c) Convertir energa mecnica en elctrica.
d) Impedir las oscilaciones del flujo elctrico.
A mayor nmero de distractores menor probabilidad de acertar la
respuesta por azar. En general se recomienda el empleo de tres
distractores ms la respuesta correcta, en total cuatro alternativas.
Estos tems permiten una amplia aplicabilidad a los distintos objetivos del
aprendizaje, reduce la posibilidad de acierto por azar y adems son tiles para la
evaluacin formativa y para los alumnos de bajo nivel verbal.
Por el contrario, tienen una incapacidad para medir objetivos que supongan
creatividad, dificultad de encontrar distractores que puedan parecer aceptables y
tampoco se puede precisar de que manera actuar el alumno en una situacin
real.

Pg. 12 de 42

3.4. El ejercicio interpretativo


Es un tipo de prueba utilizada para la medicin de aprendizajes complejos.
Consiste en una base comn de informacin o datos sobre la que se formulan un
conjunto de preguntas o tems de cualquiera de los tipos anteriormente
analizados.
Los datos o base de informacin pueden darse en forma de tablas, grficos,
mapas, dibujos o simplemente por escrito.
En este tipo de prueba es ms improbable que el alumno pueda responder
utilizando simplemente conocimientos memorsticos, posibilitando por tanto la
utilizacin de funciones mentales superiores (comprensin, anlisis) que
suponen aprendizajes ms complejos.
En las prximas pantallas vamos a ver dos ejemplos: uno de informacin y otro de
una base de datos.
Informacin:
Dibujo de un mapa fsico de la Pennsula Ibrica realizado incorrectamente,
de acuerdo con lo que figura en los tems.
tems:
1. En este mapa estn incorrectamente sealados los ros de la vertiente:
a) Atlntica.
b) Cantbrica.
c) Mediterrnea.
d) Las tres anteriores.
2. Este mapa trae mal situados los afluentes del ro:
a) Ebro.
b) Tajo.
c) Mediterrneo.
d) Guadalquivir.
(De esta forma se pueden seguir indicando cuantos tems se juzguen
necesarios).
Base de datos:
Lleg al taller un "jeep" de cuatro cilindros echando humo negro. El dueo se
quejaba de la poca potencia que tenia el vehculo, y que gastaba mucho
aceite (4 5 litros cada 2.000 Km., el "jeep" tenia 3 aos de uso, y marcaba
7.000 Km. de recorrido). El cuentakilmetros funcionaba normalmente.
Andando en "ralent", el motor golpeaba con sonido a hueco en cada
revolucin. El mecnico oprimi el acelerador momentneamente. Durante la
aceleracin, el motor golpete; en el instante inmediato de alcanzar su
mxima aceleracin, emita un suave sonido, como de ametralladora.
Despus de apagar el motor, verific que el nivel de aceite marcaba un litro
de existencia en el crter.
La compresin del motor media as: 1,55 lbs; 2,20 lbs; 3,60 lbs; 4,50 lbs.
Todas las bujas estaban secas y presentaban una gruesa capa de
carboncillo.
Preguntas o tems.
Instrucciones: Rodear con un circulo la letra que preceda a la respuesta
correcta.
1- Que significaba el golpe a hueco y constante?
a) Soltura en un casquete de la bancada.
b) Golpeteo de un pistn.
c) Combustin incompleta.
d) Soltura en un casquete de biela.

Pg. 13 de 42

2- Que significaba la baja compresin de la cmara 2?


a) Una vlvula en malas condiciones.
b) Un aro roto.
c) Una rotura en la junta de culata.
d) Un escape alrededor de la buja.
3- Que significaba el sonido ametrallador?
a) Soltura de un casquete de la bancada.
b) Combustin incompleta.
c) Soltura de uno o varios casquetes de la biela.
d) Golpeteo del pistn. ....etc.
Su aplicacin es en la evaluacin de los aprendizajes significativos que supongan
procesos mentales complejos, como pueden ser:

Capacidad para interpretar datos y relaciones.


Capacidad para elaborar hiptesis.
Diagnosticar fallos.
Realizar reparaciones.
Plantear experimentos nuevos.
Solucionar planteamientos difciles.
Capacidad para reconocer limitaciones de los datos.
Formular conclusiones validas.
Distinguir entre generalidades y particularidades.
Capacidad para aplicar principios.
Realizar inferencias lgicas.
Definir problemas.

Entre las ventajas que podemos encontrar estn la aplicabilidad a situaciones


reales y cotidianas de la vida profesional, el hacer posible la medicin de aspectos
ms complejos del aprendizaje, el tener una evaluacin de los objetivos ms
global y completa que la de otro tipo de pruebas objetivas y reducir la diferencia
entre los que poseen mucha informacin (conocimientos memorsticos) y los que
tienen informacin ms elemental, ya que la informacin indispensable para
responder a los tems figura en la base de datos comn.
En cambio, son difciles de construir y se requiere de una buena capacidad lectora
del alumno para la correcta comprensin de la informacin dada en la base de
datos.
Para elaborar estos tems, debemos tener presente las siguientes normas de
elaboracin:
Utilizar el ejercicio interpretativo para la evaluacin
de aprendizajes de alto nivel de complejidad
que no puedan ser evaluados por otro tipo de
tems.
Seleccionar el material de la base de datos en
funcin de los objetivos perseguidos.
Construir los tems de la prueba de forma que sea
preciso el anlisis y la interpretacin de la base de
datos para responder.
La base de datos y los tems deben ser
proporcionales en extensin.

Pg. 14 de 42

4. Evaluacin de contenidos procedimentales


4.1. Qu evaluamos?
Se trata de evaluar algunos de estos aspectos:
La ejecucin de alguna actividad que implique destreza. Ejemplos:
habilidad para manejar herramientas, maquinaria, vehculo, para el
trabajo de taller, laboratorio, etc.
Interesa comprobar el procedimiento seguido y los hbitos de trabajo (uso
del equipo, de los recursos, tiempo empleado, etc.)
El producto resultante de una ejecucin. Ejemplos: una carta escrita a
mquina, un plano, un plato de cocina, un peinado, etc.
En este caso interesa calificar la calidad del producto recurriendo a aspectos
como precisin, exactitud, acabado, presentacin, etc.
Principalmente se distinguen dos modalidades de pruebas:
Ejecutar
una
tarea
en
condiciones
simuladas en pequea escala. Aqu el
alumno
debe
ejecutar
movimientos,
actividades y operaciones como si fueran
reales.
Realizar una tarea o conjunto de tareas
que
constituyan
una
muestra
representativa de la que se tendrn que
realizar en un determinado trabajo. Si el
alumno realiza adecuadamente las operaciones de esta muestra de
trabajo se podr inferir que es capaz de resolver con eficacia todo lo de su
gnero.

4.2. Instrumentos para la evaluacin de los contenidos procedimentales


Para evaluar estos contenidos es necesario recurrir a tcnicas de observacin;
entre ellas hay que destacar tres que iremos viendo en las prximas pantallas:
1. Escalas de calificacin: consisten en una serie de enunciados o preguntas
sobre el aspecto que se va a evaluar, seguido por una escala de opciones
graduadas en intensidad que permite indicar el grado hasta el cual se halla
presente cada atributo.
Estas escalas pueden ser de tres tipos:
Numricas: cuando la intensidad del rasgo observado se expresa en
nmeros. Ejemplo:
Rapidez en el diagnstico de averas
12345
Grficas: cuando la intensidad del rasgo observado se expresa en
categoras.
Organizas las herramientas antes de iniciar el trabajo?
Siempre

Generalmente

A veces

Raras veces

Pg. 15 de 42

Nunca

Descriptiva: cuando las categoras de la escala describen de forma


breve, pero lo ms exacta posible, las caractersticas o el rasgo a
observar. Ejemplo:
Colabora con el alumno en la realizacin de ejercicios:
Nunca
Rara vez
Se limita a Casos aislados
explicar

Con frecuencia
Resuelve dudas

Siempre
Atiende,
colabora

Para elaborar y utilizar estas escalas, existen una serie de criterios:


Los rasgos y caractersticas deben ser directamente observables. Evitar
por tanto las cuestiones abstractas y subjetivas.
Los tems o preguntas deben ser unvocos, es decir, no deben tener
varias interpretaciones.
Siempre que sea posible deben aplicar la escala varios evaluadores
expertos en la materia, para reducir la subjetividad.
El nmero de categoras de la escala debe oscilar entre 3 y 7.
2. Listas de control o de cotejo: son similares a las escalas de calificacin
pero con la limitacin de que slo permiten juicios del tipo todo-nada, si-no,
ausencia-presencia de la caracterstica a evaluar.
La lista de cotejo es til para evaluar aquellas destrezas que puedan
dividirse en una serie de actos especficos claramente definidos. Ejemplo:
Para verificar el proceso para encuadernar un libro.
OPERACIONES
1. Corta con precaucin el hilo que une los cuadernillos.
2. Desprende los cuadernillos sin daarlos.
3. Limpia bien el lomo para quitar restos de cola.
4. Etc.

SI

NO

Al igual que las escalas de calificacin, estas tambin establecen unos


criterios para el uso y elaboracin, como los siguientes:
Hacer una casilla para cada detalle de la ejecucin o el producto que se
va a evaluar.
Tomar en cuenta para la puntuacin el valor positivo o negativo de cada
casilla.
Colocar las casillas en orden consecutivo de acuerdo con la actuacin
que se va a evaluar.
Aadir a la lista aquellos actos que representan errores comunes, siempre
que estn limitados en nmero y puedan identificarse claramente.
Elaborar las listas de cotejo nicamente para evaluar aquellas actuaciones
o productos que admitan distinciones dicotmicas.
3. Hoja de evaluacin de prcticas: este instrumento es una integracin de
los dos anteriores; consiste en un cuadro de doble entrada en que se
relacionan las actividades que tienen que realizar los alumnos con un
Pg. 16 de 42

conjunto de factores (exactitud, tiempo, etc.) que se califican de forma


dicotmica o gradualmente. Ejemplo:
Prctica de autopsia.

Los criterios establecidos para elaborar y utilizar este instrumento son:


Describir los objetivos o conductas que se
pretenden evaluar con la prueba prctica.
Establecer el nmero y tipo de prctica que se
van a realizar y ponderarlas en funcin de su
importancia.
Elaborar una lista de operaciones significativas
y observables, que constituirn el apartado de
actividades.
Ponderar cada una de las actividades en funcin de su importancia en el
conjunto de la prctica y establecer, de acuerdo a esta ponderacin, la
puntuacin mxima obtenida.
Establecer una serie de factores relacionados con la ejecucin de las
actividades.
Describir el significado de cada uno de los factores en el contexto de la
prueba.
Dar instrucciones claras sobre el procedimiento de calificacin de la
prueba.
Es conveniente adjuntar la lista de material necesario para la realizacin
de la prctica.

5. Evaluacin de contenidos actitudinales


5.1. Escalas de actitudes
Al lado de estas pruebas, se han desarrollado otro tipo que
cuenta con una gran produccin, sobre todo en la medicin de
las actitudes y los valores: las escalas.
Centrndonos en la medicin de actitudes encontramos dos
tipos fundamentales de escalas, ligados respectivamente a
Likert y Thurstone: las escalas de intervalos de apariencia
igual y las escalas de puntuacin sumada.

Pg. 17 de 42

Las actitudes son disposiciones organizadas a travs de la experiencia que


influyen en las respuestas de los sujetos hacia personas, objetos o situaciones. La
presencia de actitudes se detecta cuando se da esa tendencia organizada,
favorable o desfavorable, que ejerce influencia en las respuestas; por contra la
carencia de actitud se da hacia: objetos, personas o situaciones de los que
carecemos de experiencias.
El modelo presentado por Thurstone
fundamentalmente las siguientes fases:

es

bastante

complejo;

implicando

Recogida de informacin en torno a las opiniones y actitudes hacia el


objeto a medir. Es necesario tomar estas opiniones de una muestra
amplia y variada, representativa, para que puedan quedar incluidas
opiniones y actitudes de todo tipo, favorables, desfavorables y neutrales.
Clasificacin, por un conjunto amplio de jueces, de la informacin
recogida, en un determinado grupo de categoras que incluyan diversos
grados de aceptacin y rechazo del objeto medido. Los jueces deben
clasificar las frases recogidas no con arreglo de su propia actitud, sino por
el orden de aprecio o rechazo que cada una represente.
Atribucin de valores escalares a cada enunciado en funcin del
nmero de jueces que incluyen una determinada frase en cada una de las
categoras. El valor escalar es el correspondiente a la mediana de estas
calificaciones.
Seleccin de aquellos enunciados o frases que cumplen ciertos
requisitos:
o
o
o

igualdad de intervalos entre cada dos enunciados consecutivos,


homogeneidad en la interpretacin de los enunciados por los jueces,
expresados mediante Q (amplitud semi-intercuartil), y
la pertinencia al contenido medido.

La puntuacin de los sujetos es la mediana de los valores escalares del


conjunto de los enunciados de la escala a los que se adhiere.
Las escalas segn el modelo debido a Lickert suponen la
presentacin de una serie de enunciados que reflejan
actitudes a las que los sujetos deben conceder diversos
grados de acuerdo, dos por lo general, o de desacuerdo,
pasando por una situacin intermedia de indecisin o falta
de opinin. Por lo general, si el enunciado representa
aspectos positivos, se conceden 5 puntos al acuerdo total y
1 al mximo desacuerdo, dejando los valores 4, 3 y 2 para
acuerdo, indecisin o falta de opinin, y desacuerdo. En
caso de enunciados negativos se invierte la puntuacin,
dando un 5 al mximo desacuerdo y un 1 al acuerdo total.
La puntuacin del sujeto es la suma de las puntuaciones
recibidas por sus adhesiones a los diferentes enunciados.
Se recomienda utilizar las escalas segn la tcnica de Lickert dado que se llega a
resultados francamente similares a los alcanzados utilizando el modelo de
Thurstone, pero son ms fciles de construir y requieren mucho menos tiempo
para su elaboracin.

Pg. 18 de 42

Debemos advertir que estos tipos de escalas se utilizan igualmente en la


medicin de los valores, como la escala de Allport-Vernon-Lindzey que toma
como base la tipologa de Spranger, la cual considera diversos modos de vida del
hombre segn predominen los valores tericos, econmicos, estticos, sociales,
polticos o religiosos.
5.2. Tcnicas sociomtricas
Un grupo especial de tcnicas, muy usadas en los centros formativos es el que
tiene como misin fundamental poner de relieve la estructura de los grupos y las
interacciones que se dan entre sus miembros.
La figura de J. L. Moreno, es clave en este tipo de tcnicas, de las que es creador.
Moreno define la sociometra como el estudio de la organizacin y evolucin de
los grupos y de la posicin que en ellos ocupan los individuos, prescindiendo del
problema de la estructura interna de cada individuo. Los grupos a los que es
aplicable la sociometra son aqullos en que por sus caractersticas son posibles, y
se dan, las relaciones interpersonales. As, una clase, un grupo de trabajo, un
club, un campamento..., podrn ser estudiados sociomtricamente, pero no una
provincia, una ciudad o los asistentes a un acontecimiento deportivo.
Gracias a la sociometra nos es dado a conocer, si los
sujetos son sinceros en sus respuestas, la autntica
estructura de los grupos, estructura que no siempre
coincide ni en sus fines ni en su forma. Este conocimiento
es de gran utilidad cuando se trata de lograr eficacia en la
consecucin
de
las
metas
del
aprendizaje,
especialmente cuando se utilizan los denominados equipos
de trabajo, y en la solucin de los problemas de
adaptacin de los escolares, pero tambin puede ser de
gran valor para poner a prueba hiptesis cientficas en la investigacin educativa.
La tcnica sociomtrica ms conocida es el test sociomtrico, prueba muy simple
y sencilla de confeccionar, aplicar y valorar. En esencia, consiste en una serie de
preguntas a los sujetos del grupo para que relacionen los dos o tres miembros
de su grupo que elegiran o/y rechazaran para un conjunto de tareas, como
jugar, estudiar, hacer un trabajo, ir de excursin.... Naturalmente se incluirn
aquellas actividades relevantes y relacionadas con los objetivos a investigar, o con
las decisiones educativas a tomar.
La aplicacin de la prueba requiere el establecimiento de un rapport suficiente
para conseguir una disposicin favorable a la cumplimentacin de la misma por los
sujetos, a lo que debe unirse la firme promesa de secreto sobre las elecciones y
los rechazos emitidos por los miembros del grupo.

6. Requisitos que debe reunir todo instrumento de evaluacin


6.1. Fiabilidad
Cualquier instrumento de medida debe contener ciertas caractersticas que
garanticen su nivel de calidad, como fiabilidad, validez, objetividad, dificultad,
discriminacin, representatividad, adecuacin a lo enseado, adecuacin al tiempo
previsto, practicidad.

Pg. 19 de 42

La fiabilidad es una estimacin del grado de constancia entre repetidas


mediciones efectuadas a los sujetos con el mismo instrumento. O lo que es igual,
una prueba es fiable cuando aplicada en distintas ocasiones a los mismos sujetos
se obtienen resultados similares.
El grado de fiabilidad de una prueba depende de los siguientes criterios:
El nmero de cuestiones o tems que la integran. A mayor nmero de
tems, mayor fiabilidad, de forma que con un nmero infinito de
cuestiones se alcanzara una fiabilidad absoluta.
La homogeneidad del contenido de las cuestiones. Si todos los tems
estn referidos a conocimientos del mismo tema, el grado de fiabilidad
ser mayor.
La homogeneidad de los alumnos. Si aplicamos una prueba a un grupo
homogneo de alumnos, las puntuaciones obtenidas tendrn menos
variacin que si se aplica a un grupo demasiado heterogneo (diferencias
de edad, de capacidad, de nivel de conocimientos...)
La objetividad de las puntuaciones. Cuanto ms influidas estn por el
juicio personal o criterio del examinador, menos fiable ser el resultado.
Grado de discriminacin de los tems. A mayor capacidad de un tem
para discriminar los distintos niveles de aprendizaje (los que saben ms
de los que menos), mayor ser tambin la fiabilidad de la prueba.
Grado de dificultad de la prueba. Hay .mayores posibilidades de que los
tems de dificultad media otorguen mayor fiabilidad a una prueba.
Tiempo empleado en la prueba. Cuanto mayor es el tiempo empleado en
la prueba mayor fiabilidad.
Probabilidad de responder correctamente por azar. A mayor
probabilidad ms baja fiabilidad.
Existen distintos mtodos para hallar la fiabilidad, aunque el procedimiento ms
sencillo cuando los datos no estn agrupados, es el propuesto por Kuder
Richardson, en cuyo proceso slo es necesario conocer los conceptos y clculos
estadsticos de la media aritmtica y la desviacin tpica o estndar.
Media aritmtica

x
N , en donde
x
x=

= suma de las puntuaciones (tems aceitados) de todos los alumnos


N= nmero total de alumnos.
Puntuacin tpica o estndar

en donde:
x = desviacin de cada puntuacin (X) respecto a la media (X); o sea x= X-

N= nmero total de alumnos.


Ejemplo:
Vamos a calcular el coeficiente de fabilidad (F) de una prueba. Supongamos
que:
El nmero de items de la prueba (K)= 50
La media de las puntuaciones (X)= 39
La desviacin tpica o estndar ( )= 6
Pg. 20 de 42

Sabidos estos datos, aplicamos la frmula de Kuder Richardson:

K
X (K - X )
(1 )
K -1
K 2
que en nuestro caso sera:
39(50 - 39)
50
F=
) = 0,78
(1 50 62
50 - 1

F=

Este coeficiente de fiabilidad (0,78) es bastante aceptable, lo que indica que


la prueba tiene suficiente consistencia.
En las pruebas de rendimiento estandarizadas suelen obtenerse coeficientes
de fiabilidad superiores a 0,90. Para las pruebas construidas por el docente,
el grado de fiabilidad es bueno a partir de 0,60, siendo mejor cuanto
ms se aproxime a 1.
Otro mtodo para hallar la fiabilidad de una prueba es la tcnica de la repeticin
de la prueba: test-retest, la cual consiste en aplicar la misma prueba dos veces
sucesivas al mismo grupo de alumnos y correlacionar despus las puntuaciones
obtenidas en ambas aplicaciones.
Generalmente las puntuaciones de la segunda aplicacin son ms altas que las de
la primera ya que se suelen recordar algunas respuestas, pero si el nmero de
preguntas es elevado, es difcil que se recuerden demasiadas.
El coeficiente de correlacin que ms se utiliza es el de Pearson.
6.2. Validez
La validez hace referencia al grado de precisin con que una prueba mide lo que
se propone medir.
Por ejemplo, una prueba que pretenda medir los conocimientos estadsticos, y que
slo contenga grficas, no tendr validez para evaluar el dominio que tiene un
sujeto sobre la estadstica general, pero si ser vlido para medir sus
conocimientos sobre las representaciones grficas.
Aunque existen procedimientos estadsticos para averiguar el ndice de validez,
parece que no es estrictamente necesario recurrir a ellos en el uso habitual de las
pruebas de evaluacin. La garanta de validez viene dada por una correcta
elaboracin de la prueba, por su adecuacin a cada caso y por su aplicacin,
calificacin e interpretacin adecuadas.
Existen distintos tipos de validez que iremos viendo en las prximas pantallas.
Exactamente nos referiremos a tres de ellos que pueden resultar tiles: validez
concurrente, validez predictiva y validez de contenido.
1. Validez concurrente: consiste en verificar la
validez de una prueba mediante su correlacin
con otra que se supone que mide los mismos
conocimientos y que ya tiene una validez
reconocida. Para ello suele utilizarse el
coeficiente de correlacin de Pearson o el de
Sperman.

Pg. 21 de 42

2. Validez predictiva: es la medida en que una prueba puede pronosticar


algo para el futuro.
Por ejemplo quienes podrn realizar eficazmente un trabajo administrativo.
Si en la prueba los que ms alto puntan demuestran ser los administrativos
ms eficaces, diremos que tal prueba tiene validez predictiva.
Un procedimiento vlido para averiguar la validez predictiva, continuando
con el mismo ejemplo sera el siguiente:
Aplicamos la prueba que pretendemos validar primero a un grupo de
administrativos cuyos niveles de eficacia conocemos de antemano, de esta
manera veremos si la prueba discrimina a los administrativos en cuanto a
eficacia, es decir, si existe correlacin entre los ms eficaces y los que ms
puntos han sacado en la prueba.
Despus se aplica la prueba a un grupo de administrativos nuevos y despus
de un tiempo, cuando hemos comprobado sus niveles de eficacia,
correlacionamos tales niveles con las puntuaciones obtenidas en la prueba.
3. Validez de contenido: hace referencia al grado en que una prueba
representa adecuadamente el rea de conocimientos o de capacidades
que se pretende evaluar.
Si no estn debidamente representados en la prueba todos y cada uno de los
objetivos que se pretende evaluar, puede ocurrir que
un alumno obtenga una calificacin alta por el simple
hecho de haber tenido suerte al estar representado
en la prueba lo nico que l conoca. En cambio, otro
alumno mucho ms aplicado, puede que alcance una
calificacin baja por el simple hecho de que en la
prueba nicamente estaban representados los pocos
contenidos que l no dominaba.

6.3. Ejemplo: fiabilidad y validez


Podemos aclarar con un ejemplo la relacin entre los conceptos de fiabilidad y
validez:
Supongamos un buen tirador que con una escopeta tira al blanco. Si la escopeta
no es buena, los tiros se dispersaran por todo el crculo, muy separados y sin dar
en el blanco tal como representa la figura 1. Este resultado no tiene fabilidad ni
validez. En cambio si el arma tiene fiabilidad pero no validez, presentara el
aspecto de la figura 2, es decir todos los tiros estarn bastantes juntos pero en un
lugar que no ser el blanco.
Por ltimo si logramos que un resultado tenga fiabilidad y validez, estaramos en el
caso de la figura 3, donde casi todos los tiros estn bastante juntos y adems en
el centro del blanco o muy cerca.

Pg. 22 de 42

Con esto queda demostrado que para ser vlido un instrumento necesita ser
fiable, pero puede ser fiable sin ser necesariamente vlido. En general la validez
de una prueba es directamente proporcional a su fiabilidad.
6.4. Caractersticas de las pruebas
Objetividad: cuando a una prueba se le asigna una puntuacin que es
independiente del juicio de quien la corrige, podemos decir que se ha
calificado objetivamente. Si una prueba no es objetiva es muy difcil que
pueda ser fiable.
Dificultad: una prueba buena ha de tener una dificultad media, lo que
significa que ha de ser superada por algo ms de la mitad de los alumnos.
La mayor o menor dificultad o facilidad de la prueba vendr dada por las
oscilaciones de la media de los alumnos que la superen. La dificultad no
siempre es una caracterstica de la eficacia de una prueba, a veces hay
que considerar el tipo de alumnos y el tipo de materia.
Discriminacin: una prueba posee discriminacin cuando diferencia
correctamente los distintos niveles de rendimiento de los alumnos.
Representatividad: una prueba es representativa cuando es fiel reflejo
del grado de consecucin de los objetivos propuestos. Ocurre con
frecuencia que al disear una prueba de evaluacin, olvidamos el grado de
importancia de cada uno de los objetivos programados, entonces la
prueba es ms representativa de unos objetivos que de otros.
Adecuacin de lo enseado: cuando las respuesta que da un alumno a
una prueba son producto exclusivo de lo enseado por el profesor en la
etapa de aprendizaje que se trata de evaluar, diremos que tal prueba se
adecua a lo estrictamente enseado. Contener tems que solo comprueben
lo enseado es la caracterstica que revela la eficacia de un instrumento
de medicin del rendimiento.
Adecuacin al tiempo previsto: se considera bien planeada con
respecto al tiempo una prueba que sea resuelta en el plazo establecido
por ms del 90% de los alumnos. No deben imponerse limitaciones
innecesarias en el tiempo de una prueba, solo las derivadas de razones
administrativas o del cansancio de los alumnos.
Practicidad: una prueba adems de ser eficaz, debe reunir una serie de
caractersticas que hagan que su utilizacin sea prctica y funcional. Una
prueba deja de ser prctica cuando consume excesivo tiempo al docente
en prepararla, cuando su coste sea elevado, cuando requiera mltiples y

Pg. 23 de 42

largas explicaciones para que los alumnos la entiendan o cuando exija un


abrumante trabajo de puntuacin.

7. Anlisis de tems
7.1. Objetivos del anlisis
El anlisis de los tems que integran una prueba de evaluacin es una tarea
imprescindible para poder conocer la efectividad real de la enseanza y de los
instrumentos utilizados en la prueba.
Los objetivos del anlisis de las respuestas de los alumnos a cada uno de los
tems, son los siguientes:
Informacin sobre el logro de los diferentes
objetivos del programa.
Ejemplo: Se registraran ms aciertos en
los tems relacionados con el conocimiento
de hechos especficos o en los relacionados
con el anlisis?
Estimacin de la dificultad de cada una de las preguntas o tems.
Ejemplo: Algunos tems fueron tan fciles que los contesto el 90% y otros
tan difciles que solo obtuvieron el 10% de respuestas correctas.
Estimacin de la discriminacin de cada tem sobre los alumnos buenos
y deficientes.
Ejemplo: Discriminar mejor el tem que tiene mayor porcentaje de
aciertos entre los alumnos buenos que entre los deficientes, que otro que
fue acertado por un porcentaje equivalente de ambos grupos.
Determinar criterios ms racionales para el otorgamiento de
calificaciones.
Ejemplo: Podrn incidir en la calificacin tems respondidos por el 100%
de los alumnos?

7.2. Tcnicas de anlisis


Son los procedimientos estadsticos que cumplen los
mencionados: ndice de discriminacin o ndice de dificultad.

objetivos

antes

ndice de discriminacin: el ndice de discriminacin (dc) indica en que


medida un tem es vlido para discriminar entre los alumnos de alto y
bajo nivel. Para obtener dicho ndice, se separa por una parte al 27% de
alumnos que han obtenido las calificaciones ms altas en la totalidad de la
prueba, y por otra al 27% de los que han obtenido las calificaciones ms
bajas tambin en toda la prueba (el 46% de los alumnos restantes no se
utiliza).
La frmula de obtencin es la siguiente:

dc =

S -I
N

Pg. 24 de 42

Siendo:
S= N de aciertos al tem del 27% de alumnos con notas superiores a la
totalidad de las pruebas.
I= N de aciertos al tem del 27% de alumnos con notas inferiores en toda la
prueba.
N= N de alumnos que corresponden al 27% del total del grupo examinado.
ndice de dificultad: el ndice de dificultad (df)
expresa la proporcin entre los alumnos que
contestan correctamente a un tem y el nmero
total de alumnos que realizan la prueba.
Existen diversas frmulas para la obtencin del
ndice de dificultad, la ms sencilla es la siguiente:

df =

B
N

Siendo:
B= n de alumnos que contestan bien al tem.
N= n total de alumnos que realizan bien la prueba.
Ejemplo de ndice de discriminacin:
Supongamos que tenemos un grupo de 40 alumnos; el 27% son 10,8, es decir 11
alumnos. Hay que comprobar cuantos alumnos de entre los 11 que ms alta nota
sacaron en la prueba han contestado correctamente al tem que estudiamos.
Supongamos que son 8. En el 27% del grupo inferior, que lgicamente estar
constituido por otros 11 alumnos, han sido 4 los que han contestado
correctamente al tem. Aplicando la frmula obtenemos el siguiente resultado:

dc =

8-4
= 0,36
11

En la siguiente tabla vemos el significado de los valores del ndice de


discriminacin:
NDICE
0,40 y ms.
0,30 a 0,39
0,20 a 0,29
menos de 0,19

INTERPRETACIN.
Muy buenos
Buenos, pero mejorables.
Regulares, deben mejorarse.
Deficiente, deben descartarse o revisarse.

Ejemplo de ndice de dificultad:


Si en un grupo de 30 alumnos la preguntan la contestan bien 12, su ndice de
dificultad ser:

df =

12
= 0,4
30

Pg. 25 de 42

La siguiente tabla ofrece una interpretacin de los ndices de dificultad:


NDICE

INTERPRETACIN

Hasta 0,25
De 0,25 a 0,44
De 0,45 a 0,54
De 0,55 a 0,74
Ms de 0,75

Muy difcil
Difcil
Normal
Fcil
Muy fcil

Por todo ello, la medicin de los conocimientos que realiza una prueba de
evaluacin, es ms precisa cuando sus tems se distribuyan:
Muy difcil 10%, Difcil 20%, Normal 40%, Fcil 20% y Muy fcil 10%.
7.3. Anlisis de tems
Todos los tems de una prueba deben ser analizados para garantizar su
eficacia. Aquellos tems que aparecen como defectuosos (muy fciles, poca
discriminacin...etc.) en las tablas anteriores debern ser revisados para averiguar
las causas de su deficiencia.
Vamos a ver a continuacin algunos ejemplos que nos ilustrarn sobre el valor de
estos anlisis. En todos los casos vamos a dividir el supuesto grupo total de
alumnos en tres partes:
A. Un grupo superior que abarca al 27% del total y
est formado por los alumnos que sacan mayor
nota en la prueba.
B. Un grupo medio que comprende el 46% de los
alumnos que estn entre el superior e inferior.
C. Un grupo inferior que comprende el 27% de los
alumnos que sacan las puntuaciones ms bajas en la prueba.
Con esta divisin en grupos se facilita la rpida obtencin del ndice de
discriminacin de cada tem.
Caso A (la opcin correcta es la C)
TEM N12
IND. DIF. 0,85
IND.DISC.0,10

OPCIONES
A

GRUPO SUPERIOR

25

GRUPO MEDIO

GRUPO INFERIOR

TOTAL

OMISIONES

TOTAL

29

46

51

22

29

93

109

Pg. 26 de 42

Este tem resulta tener un ndice de discriminacin muy bajo y deficiente.


Observando las otras respuestas que funcionan como distractores (A, B, D), no
han sido demasiado eficaces, dado su escaso nmero de elecciones.
Una clase o sesin dedicada al anlisis nos informar si la opcin C era tan
evidente que las restantes no cumplieron su cometido, o si realmente las
enseanzas fueron tan eficaces que todo el grupo dominaba las respuestas. Este
tipo de sesiones de anlisis entraran dentro de la denominada evaluacin
formativa.
Caso B (la opcin correcta es la B)
TEM N 20
IND. DEF. 0,34
IND. DISCRI. 0,48

OPCIONES

OMISIONES

TOTAL

GRUPO SUPERIOR

15

10

29

GRUPO MEDIO

22

14

51

GRUPO INFERIOR

20

29

TOTAL

17

38

44

109

Este tem tiene un buen ndice de discriminacin y dificultad. Las respuestas


asignadas a B por los distintos grupos indican que se trata de un elemento difcil.
De 109 alumnos examinados apenas 38 conocen la respuesta correcta. Adems la
opcin D ha sido elegida por 44 alumnos. Habr que cuestionarse si la opcin D
resulta ambigua y aparentemente fcil de aceptar como verdadera, si es necesario
reajustar los dems elementos distractorios para hacerlos ms atractivos o si en
general no han comprendido bien la cuestin evaluada y convendran aclaraciones
sobre la misma.

8. Instrumentos complementarios
8.1. Tcnicas de observacin
Junto a las tcnicas de evaluacin descritas anteriormente, existen otras que
complementan datos sobre el rendimiento del alumno, pero tambin se hace
necesario evaluar los aspectos afectivos que escapan a la aplicacin de las
tcnicas citadas, vlidas nicamente para los aspectos cognoscitivos. No podemos
olvidarnos de las actitudes, sentimientos, intereses y valores de los alumnos y su
evaluacin solo es posible con las tcnicas complementarias.
La observacin es una tcnica de exploracin que permite obtener datos del
comportamiento exterior del alumno o grupo. Observar es conocer y debe ser
entendida como una tcnica que pretende recoger informacin complementaria a
la obtenida mediante la utilizacin de otros procedimientos.
La observacin solo es efectiva en la medida en que sea sistemtica. No es
correcto enjuiciar a un alumno por una manifestacin aislada de su conducta. Por
eso es preciso tener en cuenta lo siguiente:

Pg. 27 de 42

Procurar que sea lo ms objetiva posible. Los


aspectos observados deben enjuiciarse framente,
con independencia del alumno que los produce.
Por ello es aconsejable no emitir enseguida un
juicio sobre lo que se observa.
Es
beneficioso
corroborar
las
distintas
observaciones con otras anteriores o sucesivas y,
si es posible, con las que puedan aportar otros
profesores respecto al mismo alumno.
Cada observacin debe registrarse cuidadosamente.
La observacin en situaciones naturales suele entraar muchos problemas desde
el punto de vista tcnico. Como ejemplo, podemos pensar en las dificultades de
observar la interaccin que se produce entre dos reclusos en un patio de la crcel.
La observacin supone en todo caso pasar una temporada sobre el campo de
estudio. Esta estancia puede tener una duracin muy variable: desde unas
cuantas horas para observar una fiesta, una comida, un bar o una clase, hasta
varios aos, con una presencia continua o estancias reiteradas.
Es mirar de cerca, lo que significa tambin estar expuesto a las miradas, a la
atencin, a comentarios o preguntas. Es la tcnica que implica una cercana fsica
ms permanente, as como un abanico ms amplio de interacciones y por lo tanto,
de mtodos. Tanto si el campo de estudio es nuevo como si ya se ha trabajado
sobre l, los primeros pasos de bsqueda sern exploratorios. Una doble
atencin que implica por una parte estar atento a lo nuevo, lo desconocido, y por
otra estar atento a uno mismo, que es ajeno a la novedad.
Este comportamiento deber basarse en un Plan de
Observacin y en una serie de plantillas ms especficas.
Supone registrar con la mayor precisin e inmediatez posible
todo lo que se est observando y analizarlo con frecuencia y
periodicidad. El anlisis servir a su vez para reorientar todo el
plan y preparar nuevas plantillas.
El Plan de Observacin tiene como objetivo preparar y
coordinar el conjunto de las observaciones que se van a
efectuar en lugares y momentos diferentes. Es una previsin a
largo plazo, abierta y, necesariamente, en evolucin. Cuando
se trata de introducirse en un terreno, utilizar informadores puede resultar muy
til porque adems de ser unos mediadores privilegiados, pertenecen o han
pertenecido al grupo estudiado y facilitan los primeros contactos y datos. Pueden
ser informadores institucionales o portavoces autorizados de un grupo o una
institucin.
Control
Segn el control de la situacin
Observacin natural o espontnea. Se produce en la vida cotidiana o
en situaciones no provocadas.
Observacin de laboratorio o experimental. Existe un gran control de
la situacin para eliminar interferencias externas. Es de difcil manejo
pues se utilizan muchas variables. El investigador manipula el medio

Pg. 28 de 42

registrando las modificaciones que se producen. Hay un grupo afectado


por la modificacin al que se llama experimental y otro de control.
Fuente de datos
Segn la fuente de datos
Observacin directa. El propio observador observa y registra el
comportamiento manifestado.
Observacin indirecta. El observador obtiene la informacin a travs de
lo que el sujeto dice por s mismo o lo que informan otros sobre l.
Observador
Segn el papel que adopta el observador
Observacin participante o interna. El observador participa de forma
activa o pasiva en la situacin. La observacin participante implica que el
evaluador se introduzca en el contexto natural utilizando tcnicas de
registro cualitativas, es decir que vaya tomando "notas de campo" en
funcin de las interpretaciones que haga de sus percepciones. No solo
supone que contemple la actividad de los miembros del grupo sino que
interacte con ellos, ya que debe descifrar el cdigo cultural mediante la
experiencia directa y el anlisis de la infraestructura simblica del mismo.
Observacin externa o no participante. El observador se mantiene
fuera del campo de observacin.
Autoobservacin. El observador realiza la observacin sobre s mismo.
Entendemos por notas de campo es un instrumento de registro de datos del
investigador de campo donde se anotan las observaciones de forma completa,
precisa y detallada.
En la observacin pueden producirse errores debido a diferentes factores. Los
ms usuales pueden provenir del sujeto observado, del propio observador y del
sistema de evaluacin empleado.
Procedentes del sujeto observado: se
debe al fenmeno de la reactividad, ya que los
sujetos modifican su conducta al ser
observados. Para paliarlo podemos utilizar
distintas
estrategias:
observadores
participantes, dispositivos ocultos, perodo de
habituacin o diferentes observadores.
Procedentes
del
observador:
Pueden
producirse diferentes efectos.

Efecto halo o tendencia a evaluar aspectos parciales guindose por la


impresin general.
Severidad o indulgencia con tendencia a dar puntuaciones bajas o
altas respectivamente.
Tendencia central o la tendencia a evitar los puntos extremos y buscar
el punto intermedio en la clasificacin.

Pg. 29 de 42

Error lgico o tendencia a calificar de forma similar conductas que


segn el observador estn lgicamente relacionadas.
Error de consenso o la tendencia a clasificar segn impresin de
terceras personas.
Error de proximidad o tendencia a dar una clasificacin similar a
aspectos que estn prximos en la pauta de evaluacin.

Procedentes del sistema de evaluacin: puede deberse al cdigo o


registro elegido, a la forma de categorizar las conductas, al muestreo, o a
los instrumentos.
La observacin: tipos y caractersticas

Para hacer ms efectiva la observacin existen varias tcnicas de probada


eficacia, que podemos utilizar. Son muy variadas y pueden estar estandarizadas o
no. Las ms utilizadas son:
a) Diarios: es una tcnica de observacin narrativa y retrospectiva que
consiste en escribir con lenguaje habitual las propias actividades o las ajenas.
El diario no es una tcnica donde el objeto de la observacin est
predeterminado. Lo que importa ante todo es describir longitudinalmente ya
que el orden cronolgico es muy importante para conseguir informacin.
b) Agendas: es ms completa que los diarios. No solo consiste en anotar las
actividades sino las intenciones, justificacin, lo previsto, lo que en realidad
se hizo, que se vio o se oy, los efectos, decisiones

Pg. 30 de 42

c) Registros anecdticos o anecdotarios: se trata de tomar nota lo ms


pronto posible de incidentes crticos, palabras o acciones significativas que
tienen lugar en el curso normal de los acontecimientos de la forma ms
exacta posible. Puede completarse con otros
datos como nombre del protagonista, fecha,
observador, lugar...
d) Escalas de estimacin: se denominan
tambin de apreciacin o de valoracin.
Designan una tcnica que comprende un
conjunto preestablecido de categoras o de
signos para cada uno de los cuales se precisa
un juicio ponderado. Este juicio se traduce por
enunciados descriptivos, por nmeros, por una forma grfica o por una
combinacin de todas esas modalidades. Su utilizacin comporta una serie de
ventajas como un esfuerzo mental menor para el observador, rapidez a la
hora de tomar notas, posibilidad de incluir un nmero importante de
categoras o sofisticadas correlaciones estadsticas.
e) Listas de control: consisten en identificar si ciertas habilidades,
caractersticas o rasgos de comportamiento estn presentes o no en el sujeto
o grupo. Se diferencia de las escalas de estimacin porque en las listas se
trata de constatar si se da o no un rasgo determinado y en las escalas se
intenta medir la intensidad o frecuencia de esa conducta.
8.2. Listas de control o cotejo y Escalas de estimacin
Listas de control: consisten en listas de frases o de palabras que indican
determinadas conductas cuya presencia o ausencia ha de indicar el
observador en funcin de lo observado. Ejemplo:
Alumno:
Caractersticas
1. Participa
2. Es ordenado en sus trabajos
3. Es constante en el trabajo
4. Etctera

SI

NO

A la hora de construir una lista de control hay que especificar las


caractersticas a observar de modo concreto y observable, redactndose
en forma positiva.
Escalas de estimacin: en ellas el observador emite un juicio de valor
sobre el rasgo observado mediante una graduacin que va de lo mximo a
lo mnimo. Ejemplo:
Alumno:
Caractersticas
1. Participa
2. Es ordenado en sus
trabajos
3. Es constante en el trabajo
4. Etctera

Grado
5
4
5
4

3
3

2
2

1
1

5
5

3
3

2
2

1
1

Pg. 31 de 42

4
4

Las normas para su elaboracin son las siguientes:


o
o
o

Las caractersticas a observar se redactarn de forma que sean


interpretadas de modo unvoco por todos los profesores.
Las caractersticas expuestas deben poder ser observadas con
claridad en el aula.
La escala debe ser elaborada por un equipo, mejor que por un
docente solo.

8.3. Tcnicas de informacin directa


Son aquellas mediante las cuales el alumno proporciona informacin sobre si
mismo de modo directo. Son las tcnicas de recogida de informacin ms
utilizadas por la sociologa. Aplicada tanto al conocimiento de la realidad como a la
evaluacin de programas sociales, permite recabar la opinin sobre aspectos
relacionados con el programa de una muestra representativa de individuos.
Aunque pueden ser de tipo descriptivo o analtico, en evaluacin de programas se
usan las de tipo analtico que pretenden obtener informacin de grandes grupos
que muestran la distribucin e intensidad de los efectos provocados por la
implantacin de las acciones contempladas en el programa.
Las tcnicas de encuesta resultan no slo tiles,
sino a veces imprescindibles si queremos recabar
informacin sobre la poblacin objetivo y tambin
sobre la poblacin en general, a la que sera poco
probable acceder de otra manera. Dentro de las
tcnicas de encuesta vamos a detenernos en la
entrevista, el cuestionario y las medidas de
autoinforme
La entrevista
Resulta ser un instrumento con finalidad cientfica mediante cual el entrevistado
debe proporcionar al tcnico investigador una informacin verbal por medio de
una serie de preguntas intencionales. Es una de las ms utilizadas porque supone
un contacto directo, una conversacin entre dos o ms personas en la que se tiene
el objetivo previo de recoger datos o informacin, establecindose una relacin
directa y personal que puede utilizarse en diferentes momentos de la
planificacin o la evaluacin.
La entrevista tambin puede ser ms o menos estructurada. La estructuracin no
afecta solo al tipo de preguntas a realizar sino al tipo de respuestas, a la secuencia
fija de las preguntas, al registro y a la interpretacin de la informacin. El objetivo
es obtener informacin relevante a travs de una serie de preguntas que el
entrevistador hace al encuestado segn sus objetivos en la investigacin.
Todas las entrevistas podemos clasificarlas atendiendo a ciertos aspectos. As
podemos encontrarnos con:
Por su finalidad: orientacin, informacin,
seguimiento, de tratamiento, teraputica, de
informacin.
Por su modalidad: Informal o libre, no
estructurada, planificada, estandarizada.
Por el nmero de personas: individual,
colectiva.

Pg. 32 de 42

Por el grado de libertad: puede permitir un mayor grado de


profundizacin, preguntas abiertas, cerradas.
Segn forma de encauzarla: dirigida, directa, intensiva, directiva,
clnica.
Adems, todas las entrevistas siguen el mismo patrn de preguntas, existiendo
dos tipos diferentes:
Exhaustivas: si las categoras o respuestas abarcan a todos los datos que
puedan darse, para que no se quede sin respuesta.
Excluyentes: cuando no se permite elegir vlidamente dos respuestas a
la misma pregunta.
Del mismo modo, las preguntas que realicemos pueden tener diferente
natulareza, por lo que en funcin de esta, podremos encontrarnos con:

De identificacin: categoras bsicas: edad, sexo.


De hecho: o acontecimientos.
De accin: sobre actividades.
Informacin: comprueba conocimientos.
De intencin: o propsitos.
De opinin: criterio o juicio.
Sobre expectativas: del sujeto.
Sobre motivos.
Preguntas filtro: para eliminar interferencias.
De control: para asegurar el inters y la buena fe
del entrevistado.

Los pasos que hay que seguir en la construccin de una entrevista, son:
Especificar las variables objeto de estudio, o que se pretende medir o
evaluar.
Decidir el tipo de preguntas y modo de respuesta. Ser ms o menos
estructurada o sistematizada.
Construir guin o protocolo de entrevista con unas directrices marcadas
para su desarrollo, que puede ser ms rgida o flexible.
Antes de conocer en profanidad el cuestionario, debe quedar claro que ciertos
aspectos para realizar una buena entrevista:
Una primera toma de contacto para crear un buen clima.
No dar nunca opinin ni claves reveladoras sobre respuestas.
Saber preguntar lo necesario, no alentar respuesta en particular, evitar
crtica, sorpresa, aprobacin.
Seguir el ritmo del entrevistado con empatia, evitando prejuicios.
Puede hacerse el registro a mano mientras se est hablando, por audio o
video, o bien simultanearlo.
Saber estructurar el tiempo, la accin, saber escuchar. Tcnica activa,
animar con gestos, no interrumpir si no es necesario.
Ambiente agradable, acogedor, facilitador de la comunicacin, con
intimidad, sin interrupciones.
Acabar cordialmente. Resumir y acabar con un comentario informal y
preparar el siguiente encuentro si es necesario.

Pg. 33 de 42

El cuestionario
Consiste en un listado de cuestiones o preguntas intencionadamente
organizadas, redactadas por el investigador con el objeto de recoger de forma
sistemtica y ordenada un conjunto de informaciones precisas acerca de las
variables objeto de inters o de investigacin.
Las aplicaciones del cuestionario pueden establecerse en funcin del momento de
aplicacin, de la amplitud de la muestra o la cantidad de informacin. Sirve para la
evaluacin diagnstica, para determinar el posicionamiento de un sujeto mediante
sus respuestas a un conjunto determinado de temas, o para el anlisis de
relaciones entre diversas cuestiones. Tambin permite la comparacin entre
grupos o la clasificacin de sujetos, facetas aprovechables en la evaluacin del
producto o rendimiento de los programas educativos o sociales.
La construccin de un cuestionario exige un trabajo previo de definicin del
aspecto o aspectos que va a recoger, operativizando los mismos en
dimensiones o indicadores que sern la base de lo que se denomina gua del
cuestionario. A partir de esa gua se elabora el listado de preguntas a incluir en l.
Tambin es preciso mencionar alguno de sus inconvenientes, por ejemplo que
resulta difcil reunir una lista de buenas preguntas, que el anlisis puede requerir
mucho tiempo o preparacin, que las tasas de respuesta a menudo son bajas por
miedo o deseo de anonimato o incluso, tener en cuenta que algunas personas
pueden no responder honestamente.
Entre las ventajas est el que puede enviarse por correo
facilitando la tarea al encuestado con una aclaracin de la forma
de cumplimentarlo o los datos postales completos para la
devolucin, o que puede ser administrado adems de
individualmente, en grupo, reuniendo a un conjunto de personas,
pudiendo estar el investigador presente o no.
En cuanto a los tipos de pregunta, pueden ser:
De respuesta fija (cerradas). Del tipo En general te
gustan las clases de ciencia? Has aprendido mucho, poco, nada?
Preguntas abiertas (libres). Del tipo Qu asuntos debemos incluir el
ao que viene? Qu factores consideras ms relevantes?
Todo cuestionario, requiere de una serie de etapas para su construccin, tales
como:
Determinar cul es el problema y que informacin se necesita para
proporcionar respuestas.
Decidir qu tipo de preguntas utilizar: fijas, abiertas.
Comprobar que el lenguaje y formato grfico de la redaccin facilite la
comprensin unvoca de la pregunta.
Decidir qu lugar debe ocupar cada pregunta en el cuestionario para
lograr orden lgico y psicolgico.
Redactar un primer borrador con una muestra de personas.
Revisarlo basndose en las crticas.
Administrar el cuestionario.
Analizar e interpretar los datos.
Redactar el informe final.

Pg. 34 de 42

As mismo, hay que tener presente unas consideraciones como:

No demasiado largos.
Claridad en las preguntas, lenguaje sencillo.
Preguntas importantes.
Evitar preguntas con elementos que sugieran contestacin.
Que las diferentes opciones en la respuesta fija estn equilibradas.
Que los elementos sigan una lgica y orden natural.

Recuerda que la entrevista suele hacerse verbal por lo que permite mayor
flexibilidad, mientras que el cuestionario resulta ms fiable por su mayor
tipificacin y codificacin, por lo que pueden generalizarse ms fcilmente los
resultados.
Medidas de autoinforme
En esencia, tanto la entrevista como la encuesta
pueden ser medidas de autoinforme siempre que
se refieran a cuestiones relativas a uno mismo.
Supone la emisin de una verbalizacin, donde
un individuo refleja algo que est haciendo (nivel
conductual); que est experimentando (nivel
fisiolgico), o que est pensando (nivel cognitivo)
sobre el impacto que est causando en l la
emisin de una accin o programa. El autoinforme
presenta la ventaja de la accesibilidad a un mayor nmero de elementos con un
menor esfuerzo debido a que no es precisa la interaccin individuo a individuo,
propia de la entrevista.
El autoinforme ayuda a recabar informacin ms profunda sobre determinados
aspectos del programa a costa quiz de no abarcar a tantas personas. Aunque
parece una tcnica cualitativa no es as, por que no se busca la informacin
subjetiva "libre" del individuo. Por el contrario, se busca conocer indicadores
subjetivos sobre una serie de tpicos marcados de antemano por el evaluador. Es
ms, una garanta sobre la calidad de la construccin tiene que ver con la
posibilidad de contrastacin de la informacin por otros medios. Adems de
esto, el rigor con el que se construya, el formato de respuesta y el sistema de
codificacin y anlisis de respuesta as como la garanta de confidencialidad y
anonimato, son necesarios.
8.4. Los test
Son otra tcnica de informacin directa. Los test nos vienen ya hechos, con la
debida validez, fiabilidad, tipificacin y dems elementos necesarios para que la
informacin que proporcionar sea correcta.
Dado que la seleccin e interpretacin de los diversos test corresponde a personal
especializado, solo indicaremos cules son los aspectos sobre los que un
docente puede tener informacin derivada de la aplicacin de los tests
correspondientes. Estos aspectos son los siguientes:
Aptitudes:
o

Mentales: comprensin verbal, fluidez


verbal, aptitud numrica y espacial,

Pg. 35 de 42

o
o

memoria, atencin o capacidad abstracta.


Especiales: aptitudes burocrticas, para el clculo, musicales o
artsticas.
Especficamente profesionales.

Intereses: tanto personales como profesionales.


Personalidad: rasgos caracterolgicos (emotividad, actividad) y rasgos
de
personalidad
(introversin-extroversin,
dominancia-sumisin,
sociabilidad-neuroticismo).
8.5. Tcnicas de anlisis de tareas y documentos
Una rica fuente de datos para el profesional en ejercicio se puede encontrar en
documentos como peridicos, actas, artculos, revistas, diarios, memorandos,
documentos gubernamentales que establecen la poltica. Cualquier escrito se
puede considerar un documento. Los documentos proporcionan hechos relativos a
la materia de inters en cuestin y sirven para iluminar los propsitos, la
fundamentacin racional y los antecedentes histricos del asunto, acontecimiento
o materia de investigacin. El propsito es poner al descubierto los hechos de
la investigacin y puede utilizarse tanto en la etapa exploratoria de un proyecto,
como en su desarrollo o evaluacin. Los documentos pueden ser de carcter
oficial o privado:
Oficial: pueden ser muy variados. Por ejemplo los
estatutos,
memorias,
organigramas,
diagramas,
manuales, correspondencia, idearios, oficios, circulares,
archivos, informes, estadsticas o actas de reuniones.
Pueden tener un carcter interno o externo e informan
sobre diversas cuestiones de inters evaluativo tales
como la organizacin, roles internos, reglamento o
liderazgos.
Privado: los documentos de carcter privado pueden ser
cartas, diarios o historias de vida. Por documentos
personales se entienden todas aquellas producciones de
los sujetos que describen sus propias acciones, experiencias y
creencias.
Tanto unos como otros, son producto de la actividad social y educativa y dan
cuenta de los acontecimientos sociales y de las ideas humanas, por lo que se
convierten en fuentes importantes de informacin, aunque es importante
considerar que nos son reactivos, es decir el investigador no influye en la
situacin cmo hara en una entrevista o en otra forma de investigacin.
Los mtodos que se aplican normalmente en la recogida de documentos proceden
de otras disciplinas como la historia (recogida de documentos de archivos) o la
etnografa (recogida de producciones materiales de tipo tcnico o cultural). Pero
en muchas investigaciones puede ser esencial esta recogida incluso antes de
proceder a intervenir sobre el terreno. Las principales fuentes de
documentacin que pueden resultar tiles en el mbito social normalmente estn
vinculadas a:
Administracin Pblica de mbito nacional, por ejemplo el
I.N.E.
Municipal, como el Registro Civil, el censo electoral,
catastro, polica local, parroquias, servicios de asistencia
pblica, educacin.
Provincial o regional.

Pg. 36 de 42

Privadas con archivos o bien ligadas a biografas personales, que pueden


incluir correspondencia, cuadernos, fotografas, muebles, colecciones.
Asociaciones ms o menos formalizadas que habr que descubrir.
Documentos
creados
abiertamente
con
fines
publicitarios,
propagandsticos o de comunicacin, tales como peridicos, anuncios,
carteles, octavillas o panfletos.
Documentos elaborados para uso interno de los organismos o instituciones
como las actas, comisiones o comunicaciones, las rdenes de servicio,
discursos o boletines internos.
Indicadores sociales
Se pueden entender como la forma ms objetiva de obtener datos sobre los
implicados en un programa. Sin embargo, algunas fuentes ponen en tela de
juicio esta supuesta objetividad, porque al seleccionar los indicadores podemos
basarnos en un juicio "subjetivo" y ponderar en exceso un indicador, lo que lleva
aparejado el defecto en la ponderacin de otro. Por ejemplo, en un programa de
salud podemos estar dando ms importancia a los aspectos de salud y tal vez los
aspectos educativos estn jugando un papel al menos tan relevante como los
otros.
Un indicador es una medida estadstica que permite dar cuenta de una realidad
social desde un punto de vista diacrnico para reflejar su evolucin y desarrollo.
Cuanto ms extensa sea esa realidad, ms amplio ser el indicador, lo que nos
permitira utilizar la comparacin como elemento de evaluacin del programa.
En investigacin social se han distinguido dos tipos de indicadores:
Descriptivos: son una mera recoleccin de datos sin buscar relaciones
entre los elementos de la realidad que pretenden medir.
Evaluativos o normativos, analticos o diagnsticos: si reflejan las
relaciones que en el pasado se han establecido entre los elementos que
los componen e intentan predecir si se producirn en el futuro.
Los grandes indicadores se usan como una herramienta bsica en el anlisis de
necesidades de la poblacin objetivo, de los potenciales usuarios del programa,
como medio para contrastar el logro del cumplimiento de los objetivos del
programa y como instrumento de estimacin de los efectos no deseados que ha
generado su implantacin.
La construccin de indicadores debe ser hecha por el equipo evaluador aunque
luego podemos tener personal contratado que se ocupe de su recopilacin o
anlisis. Adems debe calibrarse el peso de los indicadores; si es un programa de
salud, normalmente pesarn ms los indicadores de salud.
En evaluacin
evaluativos.

de

programas

normalmente

se

usan

Datos de archivo
Muy directamente relacionada con los indicadores se encuentra la
consulta de datos de archivo. El inconveniente es que no
siempre estn a disposicin de todo el mundo o son
accesibles, aunque todo dato que nos pueda aportar la
organizacin en relacin con la situacin inicial de los usuarios o

Pg. 37 de 42

los

indicadores

los criterios de seleccin utilizados, es potencialmente til de cara a determinar su


eficacia y efectividad.
Es ms relevante el tipo de datos a recolectar. Todo programa de accin social que
se precie debe pormenorizar al menos, antecedentes del problema, objetivos,
acciones, personal, estructura o plazos. Esta informacin es vital tanto para la
planificacin como para la estimacin de la evaluabilidad del programa y tambin
para el establecimiento de la eficacia o grado de cumplimiento de sus objetivos.
Asociados a estos objetivos, habr que determinar indicadores a ser posible
cuantitativos, que nos informen de los logros obtenidos tras su implantacin.
Todas estas tcnicas juegan un papel compensatorio, es decir, sirven para
triangular los datos obtenidos de otras fuentes de informacin. Y todas pueden
conllevar la aplicacin de la tcnica de anlisis de contenido que se explica a
continuacin.
Anlisis de contenido
El anlisis de contenido se ocupa de investigar sobre el significado profundo y la
estructura de un mensaje o comunicacin. El mensaje puede estar contenido en
un documento escrito, una emisin de medios de comunicacin, pelcula, video, o
en la conducta humana real observada. La meta es desvelar asuntos,
conceptos e indicadores ocultos del contenido del mensaje.
Se trata de una orientacin cientfica que debe considerarse no solo como un
mecanismo para medir, sino tambin como un mecanismo para observar una
comunicacin. El anlisis de contenido es esencialmente poco visible y no
reactivo, es decir, el investigador no influye en la situacin cmo hara en una
entrevista u otra forma de investigacin.
El anlisis de contenido trata de estudiar con detalle el mensaje de la
comunicacin escrita, oral o visual. Se utiliza inicialmente cmo una tcnica de
anlisis y cuantificacin de los materiales de comunicacin. Puede definirse como
una tcnica de investigacin para la descripcin objetiva, sistemtica y cuantitativa
del contenido manifiesto de las comunicaciones con el fin de interpretarlas. El
anlisis de contenido debe cumplir ciertas condiciones en cuanto al tratamiento
de los datos:
Se deben crear datos reproducibles u
objetivos.
Que sean susceptibles de medicin y
tratamiento cuantitativo.
Que tengan significacin para alguna teora
sistemtica.
Que puedan generalizarse ms all del
conjunto especfico de material analizado.
El procedimiento en su forma ms simple implica establecer algunas categoras
de trabajo y observar, contar y anotar la aparicin de unidades de categoras. El
problema clave es establecer buenas categoras para filtrar el mensaje. Una vez
que se dispone de los datos de un mensaje, un codificador puede abrirse paso a
travs de l, asignando un cdigo numrico a las categoras particulares a medida
que ocurren. Los pasos del procedimiento pueden ser los siguientes:
Definir el universo de contenido: texto,
mensaje, comunicacin, etc. Una forma es que
otro investigador utilice esos cdigos. Lo

Pg. 38 de 42

conveniente es que la tasa de acuerdo est en torno al 70%. Si no es as,


es necesario volver a redefinirlos.
Escribir definiciones cuidadosas de las categoras clave que se
estn codificando: definir sobre el nivel de anlisis: palabras, temas,
personajes, elementos, mediciones espaciotemporales.
Analizar los datos y codificar las categoras: es preciso asignar
cdigos numricos a las categoras en el universo de anlisis de contenido.
Un modo es utilizar categoras nominales: nio/nia; permisivo/permisiva,
y la cuantificacin sera simplemente cuestin de contar la frecuencia con
la que stas categoras se producen.
Cuantificar y hacer recuentos: llevando a cabo recuentos de palabras y
calculando las frecuencias de datos.
8.6. Tcnicas de anlisis de datos
Algunas de las tcnicas ms utilizadas para el anlisis de datos son las destinadas
a analizar o valorar diferentes aspectos individuales o sociales. Las ms
utilizadas son las que tratan de medir alguno de los siguientes aspectos:
Inteligencia: pruebas estandarizadas (Thorndike) o no estandarizadas
(tipo piagetiano).
Conocimiento: tambin puede hacerse de forma estandarizada como
pruebas o test de rendimiento, ortogrficas, test de lectura o escritura.
Existen tambin las no estandarizadas que se elaboran para controlar la
comprensin o destrezas alcanzadas. Entran aqu por ejemplo los test
criteriales elaborados a partir de una taxonoma. Se centran en los
objetivos de un programa, curso o propuesta de formacin.
Personalidad: suelen ser cuestionarios acompaados de unas escalas de
tipo Lickert o de verdadero o falso. Por ejemplo, el de personalidad de
Cattell o la escala de ansiedad de Taylor.
Dimensiones sociales del grupo: incluyen test sociomtricos, de
relaciones sociales. Son muy variadas. Tienen en comn que se basan en
respuestas que nos dan los sujetos sobre sus preferencias y rechazos a
los miembros del grupo a que pertenecen. Pueden ser cualitativas como el
sociograma o cuantitativas, como los test sociomtricos.
Evaluacin del medio socio econmico y cultural: se concreta en
cuestiones que giran en torno al status profesional o nivel de estudios de
progenitores, o en una medicin global en base a la observacin de
mltiples indicadores (propiedades o disponibilidad de electrodomsticos)
Actitudes, intereses, valores: opiniones, actitudes o juicios sobre
aspectos diversos para lo que existen diferentes tipos de escalas.
Contextos, situaciones y procesos de intervencin: suele hacerse a
travs de cuestionarios, la observacin y la entrevista.
Sistemas organizativos: roles internos, valores y liderazgo para el
anlisis de los sistemas organizativos.
Realidades vividas por sujetos, culturas de grupo o para conocer
situaciones actuales de grupos e instituciones como las historias de vida.
8.7. Introduccin a mtodos de muestreo
Es importante a la hora de ofrecer datos referentes a cualquier fase del proceso de
planificacin o evaluacin especificar de qu fuentes o en que lugares obtenemos
la informacin. Cuando no es posible realizar el estudio con todo el colectivo
implicado, puede ser necesario determinar la muestra o proporcin de la
poblacin a la que representa. Hay distintas maneras de seleccin y es importante

Pg. 39 de 42

la forma de determinar su tamao. En los casos de programas acotados a


contextos y sujetos concretos, no es necesario establecer un muestreo
sistemtico, pero tal vez sea conveniente seleccionar personas o sujetos que son
tpicos o representativos de la poblacin o bien disponen de la informacin
que necesitamos. Nosotros vamos a referirnos de forma general a dos tipos de
muestreo:
Muestreos de probabilidad:
Muestreos al azar simple
Cada miembro de la poblacin en estudio tiene la misma oportunidad de ser
seleccionado. El mtodo comprende la seleccin al azar de una lista de la
poblacin (marco de muestreo), del nmero necesario de sujetos para la muestra.
Por la probabilidad y la posibilidad, la muestra debiera contener sujetos con
caractersticas similares a las de la poblacin como un todo, esto es algn viejo,
algn joven, alto, bajo, adaptado, rico, pobre. Esto implica la dificultad de que se
necesita una lista completa de la poblacin y a veces no es posible.
Muestreo sistemtico
Es una forma modificada del azar simple. Comprende la seleccin de sujetos de la
lista de poblacin de manera sistemtica en lugar de al azar. Por ejemplo en una
poblacin de 2000 necesitamos una muestra de 100; entonces seleccionamos 1 de
cada 20 personas. El punto de partida para la seleccin es al azar.
Muestreo estratificado
Comprende la divisin de la poblacin en grupos homogneos, conteniendo cada
grupo sujetos de similares caractersticas. Por ejemplo el grupo A puede
contener machos y el B hembras. Con el fin de obtener una muestra
representativa de toda la poblacin en funcin del sexo, debe hacerse una
seleccin al azar del grupo A y del B. Si se necesita se puede reflejar en la
muestra la proporcin exacta de machos y hembras.
Muestreo de conjuntos
Se usa cuando la poblacin es grande y est diseminada. Por ejemplo si queremos
encuestar el nivel de aptitud de los nios en una comunidad, con problemas de
desplazamiento y dems, podemos seleccionar al azar un nmero especfico de
escuelas y examinar a todos los nios de las escuelas seleccionadas.
Muestreo en fases
Es una forma modificada del de conjuntos. Continuando con el ejemplo anterior,
seleccionaramos al azar un nmero de escuelas y dentro de cada una de esas
escuelas una clase al azar y dentro de las clases un nmero de alumnos.

Muestreo sin probabilidad:


Muestreo de conveniencia o accidental
Consiste en elegir a los individuos ms prximos como informantes y continuar
ese proceso hasta que se haya obtenido el tamao requerido de la muestra.
Muestreo por cuota
Ha sido descrito como el equivalente sin probabilidad del muestreo estratificado.
Intenta obtener representantes de los diversos elementos de la poblacin total en
las proporciones en que se presentan all. Por ejemplo si queremos analizar las
relaciones raciales en una comunidad se puede establecer una cuota para cada

Pg. 40 de 42

grupo tnico que sea proporcional a su representacin en la poblacin total en el


rea de la encuesta.
Muestreo intencional
El investigador selecciona a mano los casos que sern incluidos en su muestra
sobre la base de su propio juicio en cuanto a tipicidad. De esta manera
construye una muestra satisfactoria para sus necesidades especficas.
Muestreo dimensional
Es un refinamiento del de cuota. Consiste en la identificacin de diversos factores
de inters en una poblacin y la obtencin al menos de un informante de cada
combinacin de esos factores. As en un estudio de relaciones raciales dentro de
cada grupo tnico, el investigador puede distinguir entre las actitudes de los
emigrantes recientes, los que llevan ms tiempo y los que han nacido en Gran
Bretaa. Su plan de muestreo pudiera tomar la forma de una tabla
multidimensional con grupos tnicos en la parte superior y duracin de la estancia
de arriba abajo.
Muestreo de bola de nieve
Se identifica un pequeo nmero de individuos que tienen las caractersticas que
se requieren. Se les usa como informantes para identificar a otros que califican por
inclusin y estos a su vez identifican an a otros.

Pg. 41 de 42

Vous aimerez peut-être aussi