Vous êtes sur la page 1sur 18

Centro de Investigación

2019 - I

MEDICIÓN EN INVESTIGACIÓN
I. CONCEPTO DE MEDICIÓN

Una de las definiciones más difundidas y de mayor aceptación sobre el concepto de medición corresponde a
STEVENS: “Medición es asignar numerales a objetos o eventos de acuerdo a reglas” (Stevens, 1970).
Observamos que dice numerales y no números existiendo por lo tanto una diferencia entre ambos términos:
la palabra “numeral” se refiere a símbolos, como: 1, 2, 3, 4… I, II, III, IV o A, B, C, …; no tienen significado
cuantitativo. En cambio, el término “número” refiere el significado cuantitativo del numeral, los números sirven
para indicar por ejemplo el peso, la talla de una persona, el registro de matrícula. Los símbolos: A, B, C,…
de una escala de calificación académica indican cualidades de rendimiento, pero fácilmente podemos
asignarle significado cuantitativo convirtiéndolos en números. Estos significados implican diferentes
relaciones entre numerales y números, asunto en el que está interesada la medición.

II. TIPOS DE MEDICIÓN

Tenemos claro que cada ciencia tiene una propia clase de objetos, la diferencia entre los objetos determinará
diferencias en las clases de medición de los mismos.

1. Medición Directa

Si queremos tomar el peso de un cuerpo se elige una unidad de medida, por ejemplo el gramo: el número
de unidades que son necesarias para equilibrar el objeto que se pesa (según una escala), es el número
que se asigna al objeto como la medida de su peso. La medición de ciertos atributos, como el peso y la
longitud se practican en forma directa; la unidad de medida se pone en relación inmediata al objeto,
determinándose las veces que esta contenida en el objeto medido.

2. Medición Indirecta

En el caso de la medición psicológica, educativa, sociológica, etc; es accesible sólo a la medición


“indirecta”. En esta se hacen inferencias acerca de un objeto o de sus propiedades a través de sus
efectos. La inteligencia, por ejemplo, se mide por el rendimiento del individuo en determinados estímulos,
se infiere su nivel de funcionamiento a través de sus efectos; la rapidez para ejecutar una actividad se
mide por el cronometro y la velocidad se expresa en unidades de tiempo. En estas mediciones siempre
son “efectos”, o factores del mundo objetivo los que se observan y a través de ellos se infiere el
funcionamiento de la conducta. Para ello es necesario aplicar un instrumento.

III. CONCEPTO DE INSTRUMENTO, PRUEBA O TEST

Una prueba o test, nos dice Anastasi, constituye esencialmente una medida objetiva y tipificada de una
muestra de conducta. Toda prueba responde al esquema: E – O – R.

E: Estímulo : Constituido por los ítems, reactivos, preguntas, que deben ser válidos y confiables para
obtener muestras del comportamiento de fenómenos que sean comparables.
O: Organismo : Los sujetos, quienes deben estar preparados para responder. Se debe tener en cuenta sus
capacidades y limitaciones.
R: Respuesta : Resultados en términos cualitativos y cuantitativos.

Curso: Investigación Educativa III


1
Centro de Investigación
2019 - I

IV. EVALUACIÓN DE LA CALIDAD DE UN INSTRUMENTO

Cualquiera sea el instrumento elegido, es necesario tener en cuenta ciertos criterios de validez y
confiabilidad que permitan juzgar en que medida, determinado instrumento resulta el más adecuado para la
tarea evaluativa, en especial si estos instrumentos son construidos por el docente investigador.

1. VALIDEZ

Se refiere a la eficacia con que un instrumento mide lo que debe medir. Este concepto se relaciona con
la pregunta ¿qué mide la prueba? Los instrumentos que aplicamos en el campo educativo (labor docente
o investigativa) se proponen evaluar construcciones tales como aprovechamiento, aprendizaje,
creatividad, inteligencia, motivación, actitudes, etc. para lo cual no existen medios directos como en las
ciencias físicas, para ello es necesario idear medios indirectos para medir atributos complejos: tales como
pruebas y escalas.
Acerca de la validez, la clasificación más conocida (Asociación Estadounidense de Psicología, Asociación
Estadounidense de Investigación Educacional), distingue:

a. Validez de Construcción

Se refiere a la medida en que un test nos proporciona información acerca de una característica
significativa del individuo. La validez de construcción de una prueba puede ser proporcionada por:

 Sus relaciones con otro test.


 Sus relaciones con otras características.
 Sus relaciones con factores del ambiente.

Asimismo, se define como el grado en que un test mide la construcción teórica elaborada respecto a
la conducta que se mide. Todo test se basa en una idea que el autor desarrolla para explicar la
organización y funcionamiento de un atributo conductual. Se afirma que un test posee validez de
constructo teórico, si el resultado obtenido es el esperado de acuerdo a la teoría formulada.
Algunas construcciones comunes: ansiedad, inteligencia, motivación, habilidad de raciocinio,
pensamiento crítico, etc.

Con la palabra construcción (constructo) se indica algo que no es medible directamente; por ejemplo
“madurez social”, según la escala de Vinelland se le pregunta al padre:

 ¿Su hijo usa patines, trineo, cochecito? (ocupación)


 ¿Se acuesta sólo? (meterse solo a la cama) (esfuerzo propio)
 ¿Escribe palabras sencillas? (comunicación)
 ¿Participa en juegos simples? (locomoción)
 ¿Se le puede confiar dinero? (autodirección)

Si hace todo esto, entonces diremos que tiene “madurez social”.


En relación a las escalas de actitudes (sobre el sexo, drogas, etc.) la validez de construcción implica
utilizar algunos estadísticos que permitan seleccionar los ítems que discriminan actitudes positivas de
negativas.

Curso: Investigación Educativa III


2
Centro de Investigación
2019 - I
b. Validez Predictiva

Permite predecir la situación futura de los individuos. Para determinar la validez predictiva de un
instrumento es necesario establecer un criterio con el cual puedan compararse las predicciones
formuladas.
Se asume que si la predicción enunciada por el test corresponde a lo esperado, el test es válido. El
conocimiento de la validez por este procedimiento requiere de un estudio de seguimiento o puesto
que el valor del test se comprueba en el futuro.

c. Validez de Contenido

Una prueba posee “Validez de contenido” cuando los ítems que la integran constituyen una muestra
representativa de los indicadores de la propiedad que se mide, dicho en otros términos, que el test
sea un adecuado muestreo del contenido que se examina.
Por ejemplo, la validez de contenido de un test de rendimiento escolar podía determinarse analizando
la correspondencia que sus ítems guardan con los temas que cubre la asignatura, la prueba deberá
reflejar el énfasis que el programa escolar otorga a ciertos temas, así como a los objetivos
instrumentales que el currículo persigue. Obviamente, la prueba carecerá de validez de contenido si
excluye algunos puntos programáticos o sus ítems reflejan un muestreo inadecuado de los
conocimientos y destrezas que se han propuesto como objetivos.
A menudo la validez de contenido se puede determinar sobre la base de juicio de expertos (para
escalas de actitud, guías de observación, cuestionario) y el análisis lógico, para las pruebas de
conocimiento (a partir de las tablas de especificación).

c.1. Validez de Contenido: Análisis Lógico

Es el investigador quien aporta los datos y realiza el análisis lógico que permite demostrar que
los ítems son representativos del dominio de contenidos que se estudia. Cada instrumento de
medición debe contribuir lo más posible a diferenciar entre los individuos respecto a la variable
que se está midiendo. No es posible incluir en el test todos los indicadores de la variable que
se quiere medir, puesto que siempre hay más indicadores de una variable de lo que se puede
incluir en el test. Se debe hacer pues, un muestreo de indicadores. (nos referimos a las pruebas
de conocimiento)

Para garantizar esta forma de validez es necesario elaborar una Tabla de Especificación,
teniendo en cuenta los siguientes elementos:

1º Determinar las conductas que se van a medir en la prueba (objetivos en la tarea didáctica
y categorías e indicadores en el trabajo de investigación).

2º Determinar los contenidos que se van a utilizar para medir conductas.

3º Establecer los pesos académicos, de objetivos y contenidos a medir. Los cuales se


determinan en función del tiempo que durará la unidad didáctica, y/o experiencia de
investigación.

4º Elegir un intervalo, (elección arbitraria) en el que se encontrará el número de ítems que


contendrá la prueba. Al elegir el intervalo se deberá tener en consideración: el grado de
estudios, la edad, el tiempo aproximado que durará la prueba.

Curso: Investigación Educativa III


3
Centro de Investigación
2019 - I

Ejemplo:
1º Objetivos : 3 ( I, II, III )
2º Contenidos : 5 ( A, B, C, D, E )
Incluir el
3º Nº de Sesiones : 15 esquema en la
tesis.
4º Intervalo : 20 – 25
(Li Ls)

Paso 1:
Determinar el número de sesiones para cada objetivo y hallar su proporción

Contenido A ------ 2/15 = 0,133 ------ 0,13


Contenido B ------ 4/15 = 0,266 ------ 0,27
Contenido C ------ 2/15 = 0,133 ------ 0,13
Contenido D ------ 3/15 = 0,200 ------ 0,20
Contenido E ------ 4/15 = 0,266 ------ 0,27
15/15 1,00

Paso 2:
Determinar el número de sesiones para cada contenido (hallar su proporción)

Obj. I ------ 5/15 = 0,3333….. 0,33


Obj. II ------ 3/15 = 0,20 0,20
Obj. III ------ 7/15 = 0,4666…. 0,47
15/15 1,00

Paso 3:
Elaboramos la tabla calculando el número de ítems por contenido y objetivo y el
límite inferior del intervalo.
( 20 – 25 )
Li Ls

Curso: Investigación Educativa III


4
Centro de Investigación
2019 - I

Cálculo del número de ítems:


A X I X 20 = 0,13 X 0,33 X 20 = 0,851 = 1
A X II X 20 = 0,13 X 0,20 X 20 = 0,521 = 1
A X III X 20 = 0,13 X 0,47 X 20 = 1,221 = 1
B X I X 20 = 0,27 X 0,33 X 20 = 1,78 = 2
B X II X 20 = 0,27 X 0,20 X 20 = 1,08 = 1
B X III X 20 = 0,27 X 0,47 X 20 = 2,53 = 3
C X I X 20 = 0,13 X 0,33 X 20 = 0,851 = 1
C X II X 20 = 0,13 X 0,20 X 20 = 0,52 = 1
C X III X 20 = 0,13 X 0,47 X 20 = 1,22 = 1
D X I X 20 = 0,20 X 0,33 X 20 = 1,32 = 1
D X II X 20 = 0,20 X 0,20 X 20 = 0,8 = 1
D X III X 20 = 0,20 X 0,47 X 20 = 1,88 = 2
E X I X 20 = 0,27 X 0,33 X 20 = 1,78 = 2
E X II X 20 = 0,27 X 0,20 X 20 = 1,08 = 1
E X III X 20 = 0,27 X 0,47 X 20 = 2,53 = 3
22
Items

TABLA DE ESPECIFICACIÓN

OBJETIVOS I II III
TOTAL
CONTENIDOS 0,33 0,20 0,47
A = 0,13 1 1 1 3
B = 0,27 2 1 3 6
C = 0,13 1 1 1 3
D = 0,20 1 1 2 4
E = 0,27 2 1 3 6
TOTAL 7 5 10 22

* Incluir el esquema en la tesis.

Curso: Investigación Educativa III


5
Centro de Investigación
2019 - I
c.2. Validez de Contenido: Juicio de Experto

La primera versión de un cuestionario, escala, etc. es sometida a la “opinión de expertos”


entendidos como tal aquellos que tienen alguna especialización afín al tema que se investiga, o
han efectuado estudios sobre temas similares o en su defecto han trabajado con grupos de
características similares a las muestras que se utilizarán en la investigación.

El propósito de la consulta es recoger sugerencias para mejorar el instrumento a partir de la


búsqueda del consenso, se dice pues que la validez de contenido consiste en esencia, en un
conjunto de juicios basados en el consenso de los expertos del tema.

MECÁNICA:

 Se considera un número de 7 expertos.


 Cada uno de ellos examina cuidadosamente un modelo de la prueba. (tiene conocimiento
del contenido y objetivos para lo cual el test fue elaborado)

Formas:
 Presentación de la prueba con Ítem a ciegas: a los jueces se le entrega las definiciones y
las clasificaciones separadas de los ítems.
El juez deberá analizar los ítems y clasificarlos. Posteriormente el investigador debe
contrastar su clasificación con el realizado por el juez.

 Presentación de la prueba con Ítem clasificado: se entregan los Ítems clasificados según
las áreas de la prueba que se está analizando.
Deberá indicar si está de acuerdo o no con el ítem para posteriormente comparar ambas
clasificaciones.

 Sobre la base del propio test prepara un informe en el cual indica el contenido representado
en aquel y los tipos de conocimientos y habilidades que el alumno debe poseer para
responder correctamente los ítems.
 Luego, se comparan los informes y se observa si existen discrepancias entre ellos.

El juicio definitivo sobre la validez de contenido depende del grado de adecuación existente entre
la prueba y los contenidos. No olvidar que la validez de contenido está referida al grado en que
los reactivos que constituyen la prueba son realmente la muestra respectiva del dominio de
contenido que nos interesa medir.

 Es necesario que los jueces pongan en juego sus capacidades de análisis lógico y su
experiencia.

Empleando el coeficiente de validación V de Aiken, (1985) se analizan cada uno de los ítems
para determinar la validez del instrumento.

Curso: Investigación Educativa III


6
Centro de Investigación
2019 - I

ANÁLISIS DE LOS INFORMES ENTREGADOS POR LOS JUECES Y LA CLASIFICACIÓN DEL


INVESTIGADOR

Si el Índice de Acuerdo es igual o mayor a 0,70 se acepta el ítem, de no llegar al mínimo se reformula
reclasifica, o elimina.

*Del ejemplo mostrado, se observa que los ítems han resultado válidos, por lo cual se concluye el proceso de
validación del instrumento.

Al término del proceso de validación se procede a la aplicación de la prueba al grupo piloto, que debe constar
como mínimo de 25 a 30 sujetos, para determinar su confiabilidad.

Curso: Investigación Educativa III


7
Centro de Investigación
2019 - I

2. CONFIABILIDAD

El concepto de confiabilidad de un test hace referencia a la consistencia de los puntajes obtenidos por un
mismo grupo de sujetos en una serie de mediciones tomadas con el mismo test. Según esto, la
confiabilidad denota estabilidad y consistencia de los puntajes, esperándose que no presenten
variaciones significativas en el curso de una serie de aplicaciones del test.

Una medida es confiable (dice THORNDIKE, Robert: Test y Técnicas de Medición en Psicología y
Educación) en el grado en que un individuo es más o menos el mismo en mediciones repetidas.

Formas:
 Medición de la confiabilidad a partir de la correlación producto – momento de Pearson (r).
 Medición de la confiabilidad a partir de los coeficientes Kuder Richardson 20, 21
 Medición de la confiabilidad a partir del Alfa de Cronbach

Antes de describir cada uno de los índices de confiabilidad es necesario precisar que para la aplicación
de la prueba se debe tener un grupo piloto, es decir un grupo de estudiantes que tengan las mismas o
similares características que el grupo ha investigar, a fin de aplicarle la prueba.

2.1 MEDICIÓN DE LA CONFIABILIDAD A PARTIR DE LA CORRELACIÓN DE PEARSON (r)

2.1.1 Repetición del mismo test (Test – Retest):

Consiste en tomar una misma prueba una segunda vez; para probar la consistencia de los
resultados, y a través de ello, determinar si el test es confiable o no.
La reaplicación de un test puede disponer de tal manera que refleje la existencia o no de
variaciones en las respuestas y por lo tanto de las puntuaciones, las que han de mantener
correlación. Asumiendo que pueden existir variaciones parciales por los efectos de la memoria y
la práctica.

2.2.2 Formas paralelas de test:

Las formas equivalentes de un test han de entenderse como formas construidas conforme a las
mismas especificaciones, pero compuestas de muestras separadas de conducta en el área
definida.
Si se dispone de dos formas de un test, debemos administrar a cada alumno, primero una forma y
luego la otra. La correlación entre las dos formas proporcionará un adecuado coeficiente de
confiabilidad.

2.2.3 Test subdividido:


Un procedimiento más simple, en el que a menudo se confía para obtener dos partes equivalentes,
consiste en poner preguntas alternas en los dos medios test, es decir, poner todas las preguntas
impares en una unidad del test, y todos los pares, en otra.
La correlación entre estas se correlacionan los test con el índice de correlación producto –
momento de Pearson cuya fórmula es la siguiente:

Curso: Investigación Educativa III


8
Centro de Investigación
2019 - I

Ejemplo de aplicación de (r)

PUNTAJE TOTAL DE ITEMS PUNTAJE TOTAL DE ITEMS


SUJETO PARES IMPARES (x) (y) (x2) (y2)
(x) (y)
1 58 46 2668 3364 2116
2 45 54 2430 2025 2916

n
N=50

2.2 MEDICIÓN DE LA CONFIABILIDAD A PARTIR DEL COEFICIENTE DE KUDER – RICHARDSON

2.2.1 Coeficiente Kuder – Richardson – 20 ( KR20 )


Permite estimar la consistencia interna de los ítems. Su cálculo requiere de una sola
administración del test; se basa en el examen de las respuestas correctas – fracasos para cada
item (los ítems que se califican son dicotómicos).

 
Fórmula:
K 1 -  pi.qi
KR20 =
K–1 S2
Donde: K = Número de ítems.
Pi = Proporción de aciertos.
qi = Proporción de errados.
 = Sumatoria.
S2 = Varianza de los puntajes.
Ejemplo:

1º Se aplica una prueba con 10 ítems en donde cada uno de ellos tiene dos alternativas (acierto –
desacierto, si – no, verdadero – falso, etc.) se otorga puntaje y así tenemos:

Acierto = 1 punto ---------- identificado por “p”


Desacierto = 0 punto ---------- identificado por “q”

2º La prueba se aplica a 5 sujetos y se realiza el siguiente análisis:


 Cada sujeto con sus dos alternativas: aciertos (p) y errados (q).
 Los ítems (en este caso del 1 al 10).

Curso: Investigación Educativa III


9
Centro de Investigación
2019 - I
SUJETOS 1 2 3 4 5
ITEMS p q p q p q p q p q
1 V - V V - V V - V -
2 V - - V V - - V - V
3 V - V - - V V - V -
4 V - - V - V V - - V
5 V - V - V - - V V -
6 V - - V - V V - V -
7 V - V - - V - V - V
8 V - - V V - V - - V
9 V - V - V - V - - V
10 V - - V - V - V - V
X (puntaje) 10 0 5 5 4 6 6 4 4 6
Proporción 1 0 0,5 0,5 0,4 0,6 0,6 0,4 0,4 0,6

3º Se hace un análisis de los puntajes/proporción para encontrar la sumatoria de los aciertos y errores
( ∑ piqi ).

PROPORCIÓN
pi qi piqi
SUJETOS
1 1 0 0
2 0,5 0,5 0,25
3 0,6 0,6 0,24
4 0,4 0,4 0,24
5 0,6 0,6 0,24
0,97
∑ piqi

4º Luego se analizan los puntajes totales o de toda la prueba.

PUNTAJES (1) (2) (3)

SUJETOS Xi ( Xi – x ) ( Xi – x )2

1 10 (10 – 5,8) = 4,2 (4,2)2 = 17,64


2 5 (5 – 5,8) = 0,8 (-0,8)2 = 0,64
3 4 (4 – 5,8) = 1,8 (-1,8)2 = 3,24
4 6 (6 – 5,8) = 0,2 (0,2)2 = 0,04
5 4 (4 – 5,8) = 1,8 (-1,8)2 = 3,24
∑ Xi 29 24,8

a) Obtenga el valor de la x para pasar a la columna (2)

X = ∑ Xi = 29 = 5,8
n 5

Curso: Investigación Educativa III


10
Centro de Investigación
2019 - I

b) Obtenga el valor de la varianza (3)

S2 =
(Xi - x)2 S2 = 24,8 = 4,96
n 5
5º Como último paso aplicamos la fórmula donde:

K
∑ piqi
S2 = 4,96
= 10
= 0,97
KR20 = K
K-1 1- ∑ piqi
S2 
-------------------------

KR20 = 10
10 - 1  1 – 0,97
4,97   = 10
9
1 - 0,195

KR20 = (1,11) (0,805) = 0,89

Si KR20 (COEFICIENTE) obtenido es inferior a 0,80, la prueba no es confiable. Para el ejemplo presentado,
supera el mínimo deseado (0,89), por lo tanto podemos decir que la prueba es confiable.

2.2.2 COEFICIENTE KUDER RICHARDSON 21 (KR21)

Se dice que las puntuaciones de una prueba son confiables cuando aplicadas en diversas
oportunidades producen los resultados aproximadamente similares. La confiabilidad será
entonces “una estimación del grado de consistencia o constancia” entre repetidas mediciones
efectuadas a los sujetos con el mismo instrumento.

El coeficiente KR21 se aplica especialmente a pruebas en donde los ítems tienen un nivel de
dificultad equivalente, son las pruebas de poder o ítems politómicos. (Se recomienda aplicar
este coeficientes para pruebas de conocimiento)

Fórmula:
𝑘 𝑋̅(𝑘 − 𝑋̅)
𝐾𝑅21 = ( ) (1 − )
𝑘−1 𝐾𝑆 2
Donde:
K = número de ítems.
𝑋̅ = media aritmética.
S2 = varianza

Ejemplo:

- Se aplico una prueba a un grupo de alumnos y se obtuvieron los siguientes datos:

K = 20 item
X = 17
S2 = 9

Curso: Investigación Educativa III


11
Centro de Investigación
2019 - I

Aplicamos la fórmula:

20 17(20−17) 20 17(3)
KR21 = (20−1) (1 − 20(9)
) = 19 (1 − 180
)
51
KR21 = 1,05 (1 − 180) = 1,05 (1 − 0,28)

KR21 = 1,05 (0,72) = 0,756

Si el coeficiente obtenido supera el valor de 0,60 (para pruebas construidas por el docente investigador)
concluimos que la prueba es confiable. Para pruebas estandarizadas el mínimo exigido es de 0,90.

Habiendo aplicado uno de los índices de confiabilidad a una prueba, y al no obtener el calificativo de confiable,
se procede a encontrar el ÍNDICE DE DIFICULTAD.
Según la interpretación clásica, es el valor que nos indica que tan fácil o difícil es un ítem.
Fórmula:
𝑁° 𝑑𝑒 𝑟𝑒𝑠𝑝𝑢𝑒𝑠𝑡𝑎𝑠 𝑐𝑜𝑟𝑟𝑒𝑐𝑡𝑎𝑠
I. D. = 𝑁° 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠 𝑞𝑢𝑒 𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑖𝑒𝑟𝑜𝑛 𝑙𝑎 𝑝𝑟𝑢𝑒𝑏𝑎 𝑁° 𝑅/𝐶
𝐼. 𝐷 =
𝑁° 𝑇/𝑃

Ejemplo:
Se aplicó una prueba de 5 ítems, contestadas por 20 personas.

1 2 3 4 5
Nº T / P 20 20 20 20 20
Nº R / C 20 0 10 15 5
Índice de Dificultad 20 / 20 0 / 20 10 / 20 15 / 20 5 / 20
1 0 0,5 0,75 0,25

Tenemos entonces:
I. D. = 1 pregunta muy fácil.
I. D. = 0 pregunta muy difícil.
I. D. = 0,5 grado de dificultad mediano, etc.

La tarea siguiente deberá ser reconstruir el ítem con alto índice de dificultad y complejizar los ítems que
resultan muy fáciles, pero antes de ello se debe elaborar una escala para buscar el balance de la prueba por
su índice de dificultad. A continuación se presentan a manera de ejemplos dos modelos.

MODELO 1:

I. D. CONDICIÓN PORCENTAJE
0 – 0,25 = Muy difícil = 10 %
0,26 – 0,50 = Difícil = 40 %
0,51 – 0,75 = Fácil = 40 %
0,76 – 1,00 = Muy fácil = 10 %

Curso: Investigación Educativa III


12
Centro de Investigación
2019 - I

MODELO 2:
I. D. CONDICIÓN PORCENTAJE
0 – 0,20 = Muy difícil = 10 %
0,21 – 0,40 = Difícil = 20 %
0,41 – 0,60 = Medianamente = 40 %
0,61 – 0,80 = Fácil = 20 %
0,81 – 1,00 = Muy fácil = 10 %

Estas son escalas convencionales, en todo caso se recomienda elaborar sus propias escalas, buscando el
balance de la prueba. Reconstruida la prueba se procederá a una nueva aplicación piloto, bajo las mismas
condiciones que la primera.

2.3. MEDICIÓN DE LA CONFIABILIDAD A PARTIR DEL COEFICIENTE DE ALFA DE CRONBACH

El coeficiente Alfa de Cronbach ha resultado uno de los coeficientes más empleados en la literatura relacionada
a estudios instrumentales; sin embargo, en estudios de simulación se ha demostrado que arroja resultados
espurios en instrumentos con escalas de respuesta Likert con menos de cinco categorías (Domínguez, 2012;
Elosua &
Zumbo, 2008; Lozano, García-Cueto & Muñiz, 2008).

Por otro lado, también se ha indicado que el coeficiente Alfa está afectado por el número de ítems (Ventura-
León & Caycho-Rodríguez, 2017). Finalmente, el coeficiente Alfa es aplicable a variables continuas, lo cual
ocurre poco en ciencias sociales (Elosua & Zumbo, 2008). De lo señalado anteriormente, se recomienda tener
el debido cuidado para elegir el coeficiente Alfa de Cronbach para estimar la evidencia de confiabilidad basada
en el análisis de la consistencia interna.

Al respecto, el coeficiente Alfa se presenta como una alternativa para el análisis de instrumentos con escalas
Likert con menos de cinco categorías, siendo su fórmula (Elosua & Zumbo, 2008):

𝑘 ∑ 𝑆𝑖 2
𝛼= [1 − ]
𝑘−1 𝑆𝑡 2
Donde:

K : N.° de ítems
Si2 : Sumatoria de varianza de los ítems
St2 : Varianza de la suma de los ítems
𝜶 : Coeficiente del Alfa de Cronbach

Curso: Investigación Educativa III


13
Centro de Investigación
2019 - I

Software recomendado

A continuación, en la Tabla 5, se presenta un listado del software que se puede emplear para obtener los datos
correspondientes a los estadísticos empleados para determinar evidencia de confiabilidad basada en la
consistencia interna.

Ejemplo:

PASO 1:

Luego, de aplicar la prueba al grupo piloto se sistematiza los resultados empleando el software Excel o spss.
Tener en cuenta al momento de elaborar la tabla:
 Construir una columna para ubicar a los sujetos de estudio.
 Construir una fila para ubicar los ítems del instrumento.

Curso: Investigación Educativa III


14
Centro de Investigación
2019 - I

PASO 2:
Exportar los resultados de la tabla del programa del Excel al Software SPSS

PASO 3:

Curso: Investigación Educativa III


15
Centro de Investigación
2019 - I

PASO 4:
Dirigirse a la pestaña “Vista de variables”, seleccionar la celda “Cadena” y cambiar por “Numérico”

PASO 5:
Luego, seleccionar la celda “Nominal” y cambiar por “Escala”

Curso: Investigación Educativa III


16
Centro de Investigación
2019 - I

PASO 6:
Dirigirse a la herramienta “Analizar”, seleccionar “Escala” y “Análisis de fiabilidad”

PASO 7:
Trasladar cada uno de los ítems al cuadro de elementos, y aceptar.

Curso: Investigación Educativa III


17
Centro de Investigación
2019 - I

PASO 8:
Finalmente, obtenemos la confiabilidad del Alfa de Cronbach.

*En la tesis debe aparecer el cuadro de la estadística de fiabilidad.

REFERENCI AS

ALARCÓN, Reynaldo. (1992) Métodos y Diseño de Investigación del Comportamiento. Lima, Fondo
Editorial.

ANDER EGG, Ezequiel. (1984) Introducción a las Técnicas de Investigación. Buenos Aires, editorial
Humanitas.

ARY, Jacobs y otros. (1985) Introducción a las Investigación Pedagógica. México, Nueva Editorial
Interamericana S.A.

CANALES, Isaac y otros. (1984) Evaluación. Tomo I, II. Lima, INIDE.

KERLINGER, Fred. (1987) Investigación del Comportamiento. México, Nueva Editorial Interamericana S.A.

ROSALES, Carlos (1990) Evaluación Formativa. Madrid, Narcea.

VEGA, A. Ricardo. (1979) Evaluación. Piura, Copias mimeografiadas para el Censo.

Curso: Investigación Educativa III


18

Vous aimerez peut-être aussi