Vous êtes sur la page 1sur 44

MÉTODOS ESTADÍSTICOS PARA LA INVESTIGACIÓN

CONFIABILIDAD Y VALIDEZ DE UN
INSTRUMENTO
1. Introducción
• ¿QUÉ REQUISITOS DEBE SATISFACER UN INTRUMENTO DE
MEDICION?

• El rigor y la calidad para evaluar el instrumento dependen,


fundamentalmente, de cómo se aborde la confiabilidad y la
validez, cualidades esenciales que deben estar presentes en el
desarrollo del proceso de recoger y analizar la información
conducente a garantizar una mayor confianza sobre las
conclusiones emitidas.

• Tanto la la confiabilidad como la validez se conjugan para


ayudar al evaluador a ser objetivo en el proceso de describir la
realidad derivada de un instrumento específico.
2. La confiabilidad

La confiabilidad se refiere al grado de estabilidad que al


medir presenta un determinado instrumento. Esto en el
sentido de que si aplicamos repetidamente un instrumento
al mismo sujeto u objeto en iguales condiciones y en
tiempos próximos debe producir iguales resultados. Una
balanza o un termómetro serán confiables si al pesar o al
medir en dos ocasiones seguidas, se obtienen los mismos
resultados.
2.2. Tipos de confiabilidad
Los procedimientos más utilizados son:
1. Test-retest. Un mismo instrumento es aplicado dos o más
veces a un mismo grupo de personas en condiciones
similares. Si la correlación entre los resultados de las
diferentes aplicaciones es altamente positiva, el
instrumento se considera confiable.
2. Medidas paralelas o formas equivalentes.
3. División por mitades o mitades partidas.
4. Alfa de Cronbach.
3. La validez

• La validez se refiere al grado en que un instrumento mide


la variable que pretende medir. Dice relación con la
utilidad o funcionalidad que cumple un instrumento. ¿En
qué grado sirve para esta o esta otra aplicación?
Longitud Peso Tiempo Psicoeducativas

Es necesario probar
empíricamente que el
instrumento es VÁLIDO
en todos los casos
¿Qué características deseamos
que prediga? CRITERIO

La exactitud con que pueden


Ausencia se sesgos. Representa Grado en que un instrumento
hacerse mediciones significativas y
la relación entre lo que se mide realmente mide la variable
adecuadas con un instrumento, en
y aquello que realmente se que pretende medir
el sentido que mide realmente el
quiere medir (Palella y Martins; (Hernández, Fernandez y
rasgo que pretende medir (Ruiz;
2006) Baptista; 1998)
2003)
3.2. Un instrumento puede tener tres tipos de validez
1. La validez de contenido: mide el grado en que un
instrumento sirve o no sirve para medir el aprendizaje de un
contenido o competencia. Un instrumento tiene esta validez si
refleja o representa adecuadamente el dominio específico del
contenido o competencia que desea medir. Por ejemplo, una
prueba de operaciones aritméticas no tendrá validez de
contenido si explora suma y división y excluye problemas de
resta y multiplicación. Un instrumento de medición debe
contener representados a todos los ítems del dominio de
contenido que desea medir.
2. La validez de criterio o predictiva, y
3. La validez de constructo.

(OJO!: La validez TOTAL implica la validez de


contenido + validez de criterio + validez de constructo)
IMPORTANTE

Cabe agregar que un instrumento de medición puede ser:

- Confiable pero no válido, y no puede ser válido si no es confiable.


- Puede medir consistentemente o establemente o confiablemente un
aspecto más no medir lo que se busca que mida, su validez o
utilidad: medir.
- Por ello es requisito que un instrumento de medición demuestre ser,
primero: confiable y, luego, válido.
- Si un instrumento no opera bien (confiabilidad) no puede servir
(validez) para nada.
FACTORES QUE AFECTAN LA VALIDEZ
a) Instrucciones imprecisas o vagas
b) Estructura de la oración demasiado difícil
c) Preguntas que sugieren las respuestas
1. Construcción del d)Ambigüedad en la formación de los reactivos
Instrumento e) Pruebas demasiado cortas
f) Ítems incongruentes con el contenido
g) Ordenamiento inadecuado

a) Tiempo insuficiente para responder


2. Administración y
b) Ayuda adicional a algunos sujetos
Calificación
c) Subjetividad en la puntuación

3. Respuestas de los a) Bloqueo de los sujetos al responder


sujetos b) Situaciones externas

Principio: La validez es específica con


4. Naturaleza del Grupo o
respecto a un grupo en particular
Criterio
Ej: comprensión de lectura el alumnos
6to grado y 9no. Grado
TIPOS DE VALIDEZ
¿Cuan representativo es el
comportamiento elegido como
muestra del universo que se Validez de Contenido
intenta representar?

¿Qué significado tiene el


comportamiento con respecto a
los atributos del individuo que Validez de Constructo
son de interés para la medición?

¿Hasta donde se puede


predecir la actuación de un Validez Predictiva
sujeto a partir de su ejecución en
la prueba?
EVIDENCIA RELACIONADA CON EL CONTENIDO
Se determina hasta donde los itemes de un
No puede ser
expresada instrumento son representativos de las
cuantitativamente variables que se desea medir (grado de
(Ruiz; 2003)
representatividad). Palella y Martins; 2006

Método: Validez de Contenido


Técnica: Juicio de Expertos

Ítems Congruencia Claridad Tendenciosidad Observaciones


Si No Si No Si No
1 ❑. ❑. ❑. ❑. ❑. ❑. __________________________
2 ❑. ❑. ❑. ❑. ❑. ❑. __________________________
__________________________
4 ❑. ❑. ❑. ❑. ❑. ❑.
__________________________
5 ❑. ❑. ❑. ❑. ❑. ❑. __________________________
6 ❑. ❑. ❑. ❑. ❑. ❑. __________________________
7 ❑. ❑. ❑. ❑. ❑. ❑. __________________________
8 ❑. ❑. ❑. ❑. ❑. ❑. __________________________
9 ❑. ❑. ❑. ❑. ❑. ❑. __________________________
__________________________
10 ❑. ❑. ❑. ❑. ❑. ❑.
__________________________
11 ❑. ❑. ❑. ❑. ❑. ❑.
EVIDENCIA RELACIONADA CON EL
CONSTRUCTO
Verifica que el instrumento
¿Hasta donde un instrumento
contenga todas las dimensiones,
mide realmente un determinado
indicadores y variables que se
rasgo latente o una característica
reflejan en la operacionalización
de las personas ? ¿Con cuanta
de variables. (Palella y Matins;
eficacia lo hace? (Ruiz; 2003)
2006)
Método: Validez de Constructo
Técnica: Análisis Factorial

1. Ruiz (1988)
desarrolló la escala Con la Técnica Análisis Factorial
AC 2000 que mide comprobó que las dimensiones
autoconcepto de (Autoconcepto: social, personal y
alumnos de 6to. escolar) tenían soporte empírico en
grado los datos
EVIDENCIA RELACIONADA CON EL
CONSTRUCTO
Item Factor 1 Item Factor 2 Item Factor 3
A. Social A. Escolar A. Personal
3 0.51 4 0,52 1 0,53
6 0,63 8 0,43 2 0,48
16 0,49 12 0,45 5 0,58
22 0,48 25 0,54 7 0,43
26 0,64 28 0,57 9 0,57
27 0,54 29 0,55 10 0,56
30 0,40 13 0,41

2. Información Escala Auto -.Estima de


Instrumento AC - 2000
Correlacional. Coopersmith (1959)
Ruiz (1988)
Coeficiente de Correlación 0,79
EVIDENCIA RELACIONADA CON LA PREDICCIÓN
Establece la validez de un instrumento de medición
comparándola con algún criterio externo. Entre más se
relacionen los resultados del instrumento con el criterio,
mayor será su validez (Silva; 2009)
Alumno PAA (X) L (Y)

Egledis 650 75

Ronny 710 87 Método: Validez Predictiva


Técnica: Análisis Correlacional
Frank 682 85

Victor 700 83 La PAA es un


691 80 instrumento
Vanesa
Válido
Liévana 705 82

Ruben 600 81
Coeficiente de Correlación
Maybeth 690 90 entre X e Y:
Julio 709 90 Spearman: 0,83
Pearson: 0,87
Marbelis 715 78
¿Cómo sabemos que
estamos haciendo la
inferencia correcta?

Un instrumento que no Consciencia de usar


tiene una validez IMPORTANCIA instrumentos
demostrada no vale la técnicamente bien
pena aplicarlo DE LA VALIDEZ calibrados

Construir un instrumento
técnicamente bien
hecho, implica en si
mismo una investigación
CONFIABILIDAD
Se refiere al grado en que su aplicación de un
instrumento repetida al mismo sujeto produce
iguales resultados” Hernández, Fernández y
Bastita (1998) “(p.21)

Se refiere a la consistencia de los resultados.


En el análisis de la confiabilidad se busca que
los resultados de un cuestionario concuerden
con los resultados del cuestionario en otra
ocasión. Menéndez (2009)

Se refiere al grado en que su aplicación repetida


al mismo sujeto u objeto produce iguales
resultados. Silva (2009)

Estabilidad y Consistencia
Reproducibilidad Seguridad Precisión Interna u
Predictibilidad Homogeneidad
CONFIABILIDAD

Supuestos Básicos: La persona no cambia

-Diferentes tiempos (Test – Retest)


-Diferentes observadores (Confiablidad interobservador)
- Diferentes versiones (Confiabilidad en paralelo)

Muñoz, (2009)

Grupo homogéneo: Confiabilidad baja


Grupo heterogéneo: Confiablidad alta
TIPOS DE CONFIABILIDAD
MÉTODO TÉCNICA PROPÓSITO

Test/retest Coeficiente r correlación Consistencia en el


de Pearson tiempo de los puntajes
Formas Equivalentes Coeficiente r correlación Estabilidad Temporal,
de Pearson consistencia de las
respuestas.
División por dos mitades Pearson/Spearman- Homogeneidad de los
Brown. itemes al medir el
Rulón constructo
Guttman
Análisis de KR 20 Coeficientes de fiabilidad
homogeneidad de los como consistencia
Itemes interna para itemes
dicotómicos (KR20).
Alfa de Cronbach Homogeneidad de los
itemes con escala tipo
Lickert.
DESCRIPCIÓN DE LOS MÉTODOS

Método: TEST – RETEST


Características:
❑ El investigador debe aplicar el mismo instrumento dos veces al
mismo grupo después de cierto período.
❑ Debe calcular la confiabilidad del instrumento ANTES de la
aplicación definitiva del mismo.
❑ Coeficiente de Correlación de Pearson altamente positivo =
Instrumento confiable.
Debilidades:
❑ El periodo de tiempo (corto – largo) entre las mediciones puede
confundir el coeficiente de confiabilidad.
DESCRIPCIÓN DE LOS MÉTODOS

Método: FORMAS EQUIVALENTES


Características:
❑Se administran dos o más versiones equivalentes de un mismo
instrumento.
❑Deben ser similares en contenido, instrucciones, tipos de preguntas y
dificultad.
❑Son administradas al mismo grupo en un período relativamente corto.
❑Los patrones de respuestas deben variar POCO entre las
aplicaciones.
❑Coeficiente de Confiabilidad = Fórmula de Correlación de Pearson.
Debilidades:
❑ Dificultad para obtener dos pruebas realmente paralelas
❑ Implica doble trabajo
❑ Confiable solo si la correlación entre los resultados de ambas
aplicaciones es positiva
DESCRIPCIÓN DE LOS MÉTODOS

Técnica: Alfa de Cronbach


Características:
❑Requiere sólo una aplicación del instrumento de medición.
❑Produce valores que oscilan entre cero (0) y uno (1).
❑No es necesario dividir en mitades los ítems del instrumento.
❑Se aplica la medición y se calcula el coeficiente.

Técnica: Kuder – Richardson KR - 20

❑Permite calcular la confiabilidad con una sola aplicación del


instrumento.
❑No requiere el diseño de pruebas paralelas.
❑Es aplicable sólo en instrumentos con ítems dicotómicos, que
puedan ser codificados con 1 – 0 (correcto – incorrecto, presente –
ausente, a favor – en contra, etc.) .
CONFIABILIDAD DIVISIÓN DE DOS MITADES
Spearman- Brown

Pasos:
1. Dividir los itemes de la prueba en dos partes
iguales.
2. Correlacionar las puntuaciones totales de las dos
mitades.
3. Multiplicar el coeficiente obtenido por 2 y dividir
el término 1 más la correlación de las dos mitades,
como se expresa en la fórmula que aparece en la
siguiente lamina:
CONFIABILIDAD DIVISIÓN DE DOS MITADES
Spearman- Brown

FORMULA:

rtt= coeficiente de confiabilidad de las mitades.


rhh= correlación de Spearman entre las dos mitades
o los puntajes pares e impares.
CONFIABILIDAD DIVISIÓN DE DOS MITADES
Rulón (1939)

FORMULA:

rtt= coeficiente de confiabilidad de las mitades


Sd2= varianza de la diferencia de los puntajes pares e
impares.
St2= Varianza total de la prueba o escala.
CONFIABILIDAD DIVISIÓN DE DOS MITADES
Rulón (1939)

Pasos:
1. Calcula la diferencia de la varianza de las dos
mitades para cada sujeto.
2. Dividir la varianza de los puntajes totales.
3. Restar esta proporción de la unidad (1,00).
CONFIABILIDAD DIVISIÓN DE DOS MITADES
Guttman y Flanagan (1939)

FÓRMULA:

rtt= coeficiente de confiabilidad


Sd2= varianza de la diferencia de los puntajes pares e
impares.
St2= Varianza total de la prueba o escala.

https://www.youtube.com/watch?v=MDa-3t6HvD8
CONFIABILIDAD GUTTMAN

Alumnos I1 I2 I3 I4 I5 I6 I7 I8 I9 I10 IMPAR PAR TOTAL


1 2 1,75 1 0 1 0,75 1,75 1 0 0 5,75 3,5 9,25
2 0 2 1 1 1 1 0,75 0 1 0
3 1 0,75 1 0,75 1 1 2 1 0 2
4 1 1 1 1 1 0,75 1 1 1 1
5 1 1 1 0 0,75 0 0 1 1 0
6 1 1 0 1 0,75 0 1 0 0 0
7 0 0 0 0 0,75 0 1,75 0 1 1
8 1 1 1 1 1 1 1 1,75 1 1
9 0 1 0 1 0 1 1 0 1 0
10 1 1 1 1 1 0 1 0 1 0
IMPARES: 1+3+5+7+9 Media
PARES:2+4+6+8+10 Varianza
CONFIABILIDAD KUDER-RICHARDSON (KR-20)

PROCEDIMIENTO:
Correlación a través de proporciones de
aciertos y desaciertos y varianza del total de
aciertos.

APLICABLE EN:
Lista de Cotejo y cuestionarios de
preguntas cerradas con opciones de
respuestas dicotómicas (SI- NO)
CONFIABILIDAD KUDER-RICHARDSON (KR 20)

K= Número de Ítems.
∑p.q= sumatoria de proporciones de aciertos
por desaciertos.
S2 T= Varianza del total de aciertos.
CONFIABILIDAD KUDER-RICHARDSON (KR 20)
Sujetos 1 2 3 4 5 6 Total

1 1 0 1 1 1 1 5
2 0 0 1 1 0 0 2
3 1 1 1 0 1 1 5
4 1 1 0 1 1 0 4
5 1 1 0 0 0 1 3
p

p.q

https://www.youtube.com/watch?v=qcm2lktF4FI
CONFIABILIDAD ALFA DE CRONBACH
PROCEDIMIENTO:
Correlación a través de la varianza de cada ítem
asociado por variables y la varianza de las
puntuaciones totales.

APLICABLE EN :
Escalas de Estimación, Escala de Lickert,
cuestionario de preguntas cerradas con opciones
policotómicas , test de aptitud verbal, test de aptitud
no verbal , test psicológico.
CONFIABILIDAD ALFA DE CRONBACH

K= Número de Ítems.
S2= Varianza de los puntajes de cada ítems.
S2T= Varianza de los puntajes totales.
CONFIABILIDAD ALFA DE CRONBACH

Sujetos 1 2 3 4 Total de Puntajes


1 4 5 5 1 15
2 1 1 1 3 6
3 2 5 3 4 14
4 3 3 2 4 12
5 3 2 3 4 12
6 5 1 4 5 15
∑ 10 17 10 21 74
S2/Itemes 2 ∑S2/Itemes
St 2=11,47 9,27
CONFIABILIDAD ALPHA DE CRONBACH

Se organizan los datos y se calcula la varianza del


Ítem 1 y posteriormente el de los demás Ítems
incluyendo los puntajes totales de la última columna:
CONFIABILIDAD

RANGOS MAGNITUD

0,81 A 1,00 Muy Alta

0,61 A 0,80 Alta

0,41 A 0,60 Moderada

0,21 A 0,40 Baja

0,01 A 0,20 Muy Baja

Importante: se sugiere repetir la validación del instrumento


puesto que es recomendable que el resultado sea mayor o igual
a 0,81
FUENTE: RUIZ (2002).

https://www.youtube.com/watch?v=scCL458Eqyw
COMO RESUMEN
Una alta confiabilidad, por si sola, no
garantiza “buenos” resultados
científicos. Pero no puede haber
“buenos” resultados científicos sin
instrumentos confiables.
Carlos Ruiz Bolívar (2003)
GRACIAS

Vous aimerez peut-être aussi