Semana 3 MET Estad Invest

MÉTODOS ESTADÍSTICOS PARA LA INVESTIGACIÓN
CONFIABILIDAD Y VALIDEZ DE UN
INSTRUMENTO
1. Introducción
• ¿QUÉ REQUISITOS DEBE SATISFACER UN INTRUMENTO DE
MEDICION?
• El rigor y la calidad para evaluar el instrumento dependen,

fundamentalmente, de cómo se aborde la confiabilidad y la
validez, cualidades esenciales que deben estar presentes en el
desarrollo del proceso de recoger y analizar la información
conducente a garantizar una mayor confianza sobre las
conclusiones emitidas.
• Tanto la la confiabilidad como la validez se conjugan para

ayudar al evaluador a ser objetivo en el proceso de describir la
realidad derivada de un instrumento específico.
2. La confiabilidad
La confiabilidad se refiere al grado de estabilidad que al

medir presenta un determinado instrumento. Esto en el
sentido de que si aplicamos repetidamente un instrumento
al mismo sujeto u objeto en iguales condiciones y en
tiempos próximos debe producir iguales resultados. Una
balanza o un termómetro serán confiables si al pesar o al
medir en dos ocasiones seguidas, se obtienen los mismos
resultados.
2.2. Tipos de confiabilidad
Los procedimientos más utilizados son:
1. Test-retest. Un mismo instrumento es aplicado dos o más
veces a un mismo grupo de personas en condiciones
similares. Si la correlación entre los resultados de las
diferentes aplicaciones es altamente positiva, el
instrumento se considera confiable.
2. Medidas paralelas o formas equivalentes.
3. División por mitades o mitades partidas.
4. Alfa de Cronbach.
3. La validez
• La validez se refiere al grado en que un instrumento mide

la variable que pretende medir. Dice relación con la
utilidad o funcionalidad que cumple un instrumento. ¿En
qué grado sirve para esta o esta otra aplicación?
Longitud Peso Tiempo Psicoeducativas
Es necesario probar
empíricamente que el
instrumento es VÁLIDO
en todos los casos
¿Qué características deseamos
que prediga? CRITERIO
La exactitud con que pueden

Ausencia se sesgos. Representa Grado en que un instrumento
hacerse mediciones significativas y
la relación entre lo que se mide realmente mide la variable
adecuadas con un instrumento, en
y aquello que realmente se que pretende medir
el sentido que mide realmente el
quiere medir (Palella y Martins; (Hernández, Fernandez y
rasgo que pretende medir (Ruiz;
2006) Baptista; 1998)
2003)
3.2. Un instrumento puede tener tres tipos de validez
1. La validez de contenido: mide el grado en que un
instrumento sirve o no sirve para medir el aprendizaje de un
contenido o competencia. Un instrumento tiene esta validez si
refleja o representa adecuadamente el dominio específico del
contenido o competencia que desea medir. Por ejemplo, una
prueba de operaciones aritméticas no tendrá validez de
contenido si explora suma y división y excluye problemas de
resta y multiplicación. Un instrumento de medición debe
contener representados a todos los ítems del dominio de
contenido que desea medir.
2. La validez de criterio o predictiva, y
3. La validez de constructo.
(OJO!: La validez TOTAL implica la validez de

contenido + validez de criterio + validez de constructo)
IMPORTANTE
Cabe agregar que un instrumento de medición puede ser:
- Confiable pero no válido, y no puede ser válido si no es confiable.

- Puede medir consistentemente o establemente o confiablemente un
aspecto más no medir lo que se busca que mida, su validez o
utilidad: medir.
- Por ello es requisito que un instrumento de medición demuestre ser,
primero: confiable y, luego, válido.
- Si un instrumento no opera bien (confiabilidad) no puede servir
(validez) para nada.
FACTORES QUE AFECTAN LA VALIDEZ
a) Instrucciones imprecisas o vagas
b) Estructura de la oración demasiado difícil
c) Preguntas que sugieren las respuestas
1. Construcción del d)Ambigüedad en la formación de los reactivos
Instrumento e) Pruebas demasiado cortas
f) Ítems incongruentes con el contenido
g) Ordenamiento inadecuado
a) Tiempo insuficiente para responder

2. Administración y
b) Ayuda adicional a algunos sujetos
Calificación
c) Subjetividad en la puntuación
3. Respuestas de los a) Bloqueo de los sujetos al responder

sujetos b) Situaciones externas
Principio: La validez es específica con

4. Naturaleza del Grupo o
respecto a un grupo en particular
Criterio
Ej: comprensión de lectura el alumnos
6to grado y 9no. Grado
TIPOS DE VALIDEZ
¿Cuan representativo es el
comportamiento elegido como
muestra del universo que se Validez de Contenido
intenta representar?
¿Qué significado tiene el

comportamiento con respecto a
los atributos del individuo que Validez de Constructo
son de interés para la medición?
¿Hasta donde se puede

predecir la actuación de un Validez Predictiva
sujeto a partir de su ejecución en
la prueba?
EVIDENCIA RELACIONADA CON EL CONTENIDO
Se determina hasta donde los itemes de un
No puede ser
expresada instrumento son representativos de las
cuantitativamente variables que se desea medir (grado de
(Ruiz; 2003)
representatividad). Palella y Martins; 2006
Método: Validez de Contenido

Técnica: Juicio de Expertos
Ítems Congruencia Claridad Tendenciosidad Observaciones

Si No Si No Si No
1 ❑. ❑. ❑. ❑. ❑. ❑. __________________________
2 ❑. ❑. ❑. ❑. ❑. ❑. __________________________
__________________________
4 ❑. ❑. ❑. ❑. ❑. ❑.
__________________________
5 ❑. ❑. ❑. ❑. ❑. ❑. __________________________
6 ❑. ❑. ❑. ❑. ❑. ❑. __________________________
7 ❑. ❑. ❑. ❑. ❑. ❑. __________________________
8 ❑. ❑. ❑. ❑. ❑. ❑. __________________________
9 ❑. ❑. ❑. ❑. ❑. ❑. __________________________
__________________________
10 ❑. ❑. ❑. ❑. ❑. ❑.
__________________________
11 ❑. ❑. ❑. ❑. ❑. ❑.
EVIDENCIA RELACIONADA CON EL
CONSTRUCTO
Verifica que el instrumento
¿Hasta donde un instrumento
contenga todas las dimensiones,
mide realmente un determinado
indicadores y variables que se
rasgo latente o una característica
reflejan en la operacionalización
de las personas ? ¿Con cuanta
de variables. (Palella y Matins;
eficacia lo hace? (Ruiz; 2003)
2006)
Método: Validez de Constructo
Técnica: Análisis Factorial
1. Ruiz (1988)
desarrolló la escala Con la Técnica Análisis Factorial
AC 2000 que mide comprobó que las dimensiones
autoconcepto de (Autoconcepto: social, personal y
alumnos de 6to. escolar) tenían soporte empírico en
grado los datos
EVIDENCIA RELACIONADA CON EL
CONSTRUCTO
Item Factor 1 Item Factor 2 Item Factor 3
A. Social A. Escolar A. Personal
3 0.51 4 0,52 1 0,53
6 0,63 8 0,43 2 0,48
16 0,49 12 0,45 5 0,58
22 0,48 25 0,54 7 0,43
26 0,64 28 0,57 9 0,57
27 0,54 29 0,55 10 0,56
30 0,40 13 0,41
2. Información Escala Auto -.Estima de

Instrumento AC - 2000
Correlacional. Coopersmith (1959)
Ruiz (1988)
Coeficiente de Correlación 0,79
EVIDENCIA RELACIONADA CON LA PREDICCIÓN
Establece la validez de un instrumento de medición
comparándola con algún criterio externo. Entre más se
relacionen los resultados del instrumento con el criterio,
mayor será su validez (Silva; 2009)
Alumno PAA (X) L (Y)
Egledis 650 75
Ronny 710 87 Método: Validez Predictiva

Técnica: Análisis Correlacional
Frank 682 85
Victor 700 83 La PAA es un

691 80 instrumento
Vanesa
Válido
Liévana 705 82
Ruben 600 81
Coeficiente de Correlación
Maybeth 690 90 entre X e Y:
Julio 709 90 Spearman: 0,83
Pearson: 0,87
Marbelis 715 78
¿Cómo sabemos que
estamos haciendo la
inferencia correcta?
Un instrumento que no Consciencia de usar

tiene una validez IMPORTANCIA instrumentos
demostrada no vale la técnicamente bien
pena aplicarlo DE LA VALIDEZ calibrados
Construir un instrumento
técnicamente bien
hecho, implica en si
mismo una investigación
CONFIABILIDAD
Se refiere al grado en que su aplicación de un
instrumento repetida al mismo sujeto produce
iguales resultados” Hernández, Fernández y
Bastita (1998) “(p.21)
Se refiere a la consistencia de los resultados.

En el análisis de la confiabilidad se busca que
los resultados de un cuestionario concuerden
con los resultados del cuestionario en otra
ocasión. Menéndez (2009)
Se refiere al grado en que su aplicación repetida

al mismo sujeto u objeto produce iguales
resultados. Silva (2009)
Estabilidad y Consistencia
Reproducibilidad Seguridad Precisión Interna u
Predictibilidad Homogeneidad
CONFIABILIDAD
Supuestos Básicos: La persona no cambia
-Diferentes tiempos (Test – Retest)

-Diferentes observadores (Confiablidad interobservador)
- Diferentes versiones (Confiabilidad en paralelo)
Muñoz, (2009)
Grupo homogéneo: Confiabilidad baja

Grupo heterogéneo: Confiablidad alta
TIPOS DE CONFIABILIDAD
MÉTODO TÉCNICA PROPÓSITO
Test/retest Coeficiente r correlación Consistencia en el

de Pearson tiempo de los puntajes
Formas Equivalentes Coeficiente r correlación Estabilidad Temporal,
de Pearson consistencia de las
respuestas.
División por dos mitades Pearson/Spearman- Homogeneidad de los
Brown. itemes al medir el
Rulón constructo
Guttman
Análisis de KR 20 Coeficientes de fiabilidad
homogeneidad de los como consistencia
Itemes interna para itemes
dicotómicos (KR20).
Alfa de Cronbach Homogeneidad de los
itemes con escala tipo
Lickert.
DESCRIPCIÓN DE LOS MÉTODOS
Método: TEST – RETEST

Características:
❑ El investigador debe aplicar el mismo instrumento dos veces al
mismo grupo después de cierto período.
❑ Debe calcular la confiabilidad del instrumento ANTES de la
aplicación definitiva del mismo.
❑ Coeficiente de Correlación de Pearson altamente positivo =
Instrumento confiable.
Debilidades:
❑ El periodo de tiempo (corto – largo) entre las mediciones puede
confundir el coeficiente de confiabilidad.
Método: FORMAS EQUIVALENTES

Características:
❑Se administran dos o más versiones equivalentes de un mismo
instrumento.
❑Deben ser similares en contenido, instrucciones, tipos de preguntas y
dificultad.
❑Son administradas al mismo grupo en un período relativamente corto.
❑Los patrones de respuestas deben variar POCO entre las
aplicaciones.
❑Coeficiente de Confiabilidad = Fórmula de Correlación de Pearson.
Debilidades:
❑ Dificultad para obtener dos pruebas realmente paralelas
❑ Implica doble trabajo
❑ Confiable solo si la correlación entre los resultados de ambas
aplicaciones es positiva
Técnica: Alfa de Cronbach

Características:
❑Requiere sólo una aplicación del instrumento de medición.
❑Produce valores que oscilan entre cero (0) y uno (1).
❑No es necesario dividir en mitades los ítems del instrumento.
❑Se aplica la medición y se calcula el coeficiente.
Técnica: Kuder – Richardson KR - 20
❑Permite calcular la confiabilidad con una sola aplicación del

instrumento.
❑No requiere el diseño de pruebas paralelas.
❑Es aplicable sólo en instrumentos con ítems dicotómicos, que
puedan ser codificados con 1 – 0 (correcto – incorrecto, presente –
ausente, a favor – en contra, etc.) .
CONFIABILIDAD DIVISIÓN DE DOS MITADES
Spearman- Brown
Pasos:
1. Dividir los itemes de la prueba en dos partes
iguales.
2. Correlacionar las puntuaciones totales de las dos
mitades.
3. Multiplicar el coeficiente obtenido por 2 y dividir
el término 1 más la correlación de las dos mitades,
como se expresa en la fórmula que aparece en la
siguiente lamina:
Spearman- Brown
FORMULA:
rtt= coeficiente de confiabilidad de las mitades.

rhh= correlación de Spearman entre las dos mitades
o los puntajes pares e impares.
Rulón (1939)
FORMULA:
rtt= coeficiente de confiabilidad de las mitades

Sd2= varianza de la diferencia de los puntajes pares e
impares.
St2= Varianza total de la prueba o escala.
Rulón (1939)
Pasos:
1. Calcula la diferencia de la varianza de las dos
mitades para cada sujeto.
2. Dividir la varianza de los puntajes totales.
3. Restar esta proporción de la unidad (1,00).
Guttman y Flanagan (1939)
FÓRMULA:
rtt= coeficiente de confiabilidad

Sd2= varianza de la diferencia de los puntajes pares e
impares.
St2= Varianza total de la prueba o escala.
https://www.youtube.com/watch?v=MDa-3t6HvD8
CONFIABILIDAD GUTTMAN
Alumnos I1 I2 I3 I4 I5 I6 I7 I8 I9 I10 IMPAR PAR TOTAL

1 2 1,75 1 0 1 0,75 1,75 1 0 0 5,75 3,5 9,25
2 0 2 1 1 1 1 0,75 0 1 0
3 1 0,75 1 0,75 1 1 2 1 0 2
4 1 1 1 1 1 0,75 1 1 1 1
5 1 1 1 0 0,75 0 0 1 1 0
6 1 1 0 1 0,75 0 1 0 0 0
7 0 0 0 0 0,75 0 1,75 0 1 1
8 1 1 1 1 1 1 1 1,75 1 1
9 0 1 0 1 0 1 1 0 1 0
10 1 1 1 1 1 0 1 0 1 0
IMPARES: 1+3+5+7+9 Media
PARES:2+4+6+8+10 Varianza
CONFIABILIDAD KUDER-RICHARDSON (KR-20)
PROCEDIMIENTO:
Correlación a través de proporciones de
aciertos y desaciertos y varianza del total de
aciertos.
APLICABLE EN:
Lista de Cotejo y cuestionarios de
preguntas cerradas con opciones de
respuestas dicotómicas (SI- NO)
CONFIABILIDAD KUDER-RICHARDSON (KR 20)
K= Número de Ítems.
∑p.q= sumatoria de proporciones de aciertos
por desaciertos.
S2 T= Varianza del total de aciertos.
CONFIABILIDAD KUDER-RICHARDSON (KR 20)
Sujetos 1 2 3 4 5 6 Total
1 1 0 1 1 1 1 5
2 0 0 1 1 0 0 2
3 1 1 1 0 1 1 5
4 1 1 0 1 1 0 4
5 1 1 0 0 0 1 3
p
p.q
https://www.youtube.com/watch?v=qcm2lktF4FI
CONFIABILIDAD ALFA DE CRONBACH
PROCEDIMIENTO:
Correlación a través de la varianza de cada ítem
asociado por variables y la varianza de las
puntuaciones totales.
APLICABLE EN :
Escalas de Estimación, Escala de Lickert,
cuestionario de preguntas cerradas con opciones
policotómicas , test de aptitud verbal, test de aptitud
no verbal , test psicológico.
K= Número de Ítems.
S2= Varianza de los puntajes de cada ítems.
S2T= Varianza de los puntajes totales.
Sujetos 1 2 3 4 Total de Puntajes

1 4 5 5 1 15
2 1 1 1 3 6
3 2 5 3 4 14
4 3 3 2 4 12
5 3 2 3 4 12
6 5 1 4 5 15
∑ 10 17 10 21 74
S2/Itemes 2 ∑S2/Itemes
St 2=11,47 9,27
CONFIABILIDAD ALPHA DE CRONBACH
Se organizan los datos y se calcula la varianza del

Ítem 1 y posteriormente el de los demás Ítems
incluyendo los puntajes totales de la última columna:
CONFIABILIDAD
RANGOS MAGNITUD
0,81 A 1,00 Muy Alta
0,61 A 0,80 Alta
0,41 A 0,60 Moderada
0,21 A 0,40 Baja
0,01 A 0,20 Muy Baja
Importante: se sugiere repetir la validación del instrumento

puesto que es recomendable que el resultado sea mayor o igual
a 0,81
FUENTE: RUIZ (2002).
https://www.youtube.com/watch?v=scCL458Eqyw
COMO RESUMEN
Una alta confiabilidad, por si sola, no
garantiza “buenos” resultados
científicos. Pero no puede haber
“buenos” resultados científicos sin
instrumentos confiables.
Carlos Ruiz Bolívar (2003)
GRACIAS

Semana 3 MET Estad Invest

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Semana 3 MET Estad Invest

Transféré par

Droits d'auteur :

Formats disponibles

MÉTODOS ESTADÍSTICOS PARA LA INVESTIGACIÓN

• El rigor y la calidad para evaluar el instrumento dependen,

• Tanto la la confiabilidad como la validez se conjugan para

La confiabilidad se refiere al grado de estabilidad que al

• La validez se refiere al grado en que un instrumento mide

La exactitud con que pueden

(OJO!: La validez TOTAL implica la validez de

Cabe agregar que un instrumento de medición puede ser:

- Confiable pero no válido, y no puede ser válido si no es confiable.

a) Tiempo insuficiente para responder

3. Respuestas de los a) Bloqueo de los sujetos al responder

Principio: La validez es específica con

¿Qué significado tiene el

¿Hasta donde se puede

Método: Validez de Contenido

Ítems Congruencia Claridad Tendenciosidad Observaciones

2. Información Escala Auto -.Estima de

Ronny 710 87 Método: Validez Predictiva

Victor 700 83 La PAA es un

Un instrumento que no Consciencia de usar

Se refiere a la consistencia de los resultados.

Se refiere al grado en que su aplicación repetida

Supuestos Básicos: La persona no cambia

-Diferentes tiempos (Test – Retest)

Grupo homogéneo: Confiabilidad baja

Test/retest Coeficiente r correlación Consistencia en el

Método: TEST – RETEST

Método: FORMAS EQUIVALENTES

Técnica: Alfa de Cronbach

Técnica: Kuder – Richardson KR - 20

❑Permite calcular la confiabilidad con una sola aplicación del

rtt= coeficiente de confiabilidad de las mitades.

rtt= coeficiente de confiabilidad de las mitades

rtt= coeficiente de confiabilidad

Alumnos I1 I2 I3 I4 I5 I6 I7 I8 I9 I10 IMPAR PAR TOTAL

Sujetos 1 2 3 4 Total de Puntajes

Se organizan los datos y se calcula la varianza del

0,81 A 1,00 Muy Alta

0,61 A 0,80 Alta

0,41 A 0,60 Moderada

0,21 A 0,40 Baja

0,01 A 0,20 Muy Baja

Importante: se sugiere repetir la validación del instrumento

Vous aimerez peut-être aussi