Medición en Investigación - Documento Final 2019

Centro de Investigación
2019 - I
MEDICIÓN EN INVESTIGACIÓN
I. CONCEPTO DE MEDICIÓN
Una de las definiciones más difundidas y de mayor aceptación sobre el concepto de medición corresponde a
STEVENS: “Medición es asignar numerales a objetos o eventos de acuerdo a reglas” (Stevens, 1970).
Observamos que dice numerales y no números existiendo por lo tanto una diferencia entre ambos términos:
la palabra “numeral” se refiere a símbolos, como: 1, 2, 3, 4… I, II, III, IV o A, B, C, …; no tienen significado
cuantitativo. En cambio, el término “número” refiere el significado cuantitativo del numeral, los números sirven
para indicar por ejemplo el peso, la talla de una persona, el registro de matrícula. Los símbolos: A, B, C,…
de una escala de calificación académica indican cualidades de rendimiento, pero fácilmente podemos
asignarle significado cuantitativo convirtiéndolos en números. Estos significados implican diferentes
relaciones entre numerales y números, asunto en el que está interesada la medición.
II. TIPOS DE MEDICIÓN
Tenemos claro que cada ciencia tiene una propia clase de objetos, la diferencia entre los objetos determinará
diferencias en las clases de medición de los mismos.
1. Medición Directa
Si queremos tomar el peso de un cuerpo se elige una unidad de medida, por ejemplo el gramo: el número
de unidades que son necesarias para equilibrar el objeto que se pesa (según una escala), es el número
que se asigna al objeto como la medida de su peso. La medición de ciertos atributos, como el peso y la
longitud se practican en forma directa; la unidad de medida se pone en relación inmediata al objeto,
determinándose las veces que esta contenida en el objeto medido.
2. Medición Indirecta
En el caso de la medición psicológica, educativa, sociológica, etc; es accesible sólo a la medición

“indirecta”. En esta se hacen inferencias acerca de un objeto o de sus propiedades a través de sus
efectos. La inteligencia, por ejemplo, se mide por el rendimiento del individuo en determinados estímulos,
se infiere su nivel de funcionamiento a través de sus efectos; la rapidez para ejecutar una actividad se
mide por el cronometro y la velocidad se expresa en unidades de tiempo. En estas mediciones siempre
son “efectos”, o factores del mundo objetivo los que se observan y a través de ellos se infiere el
funcionamiento de la conducta. Para ello es necesario aplicar un instrumento.
III. CONCEPTO DE INSTRUMENTO, PRUEBA O TEST
Una prueba o test, nos dice Anastasi, constituye esencialmente una medida objetiva y tipificada de una
muestra de conducta. Toda prueba responde al esquema: E – O – R.
E: Estímulo : Constituido por los ítems, reactivos, preguntas, que deben ser válidos y confiables para
obtener muestras del comportamiento de fenómenos que sean comparables.
O: Organismo : Los sujetos, quienes deben estar preparados para responder. Se debe tener en cuenta sus
capacidades y limitaciones.
R: Respuesta : Resultados en términos cualitativos y cuantitativos.
Curso: Investigación Educativa III

1
2019 - I
IV. EVALUACIÓN DE LA CALIDAD DE UN INSTRUMENTO
Cualquiera sea el instrumento elegido, es necesario tener en cuenta ciertos criterios de validez y
confiabilidad que permitan juzgar en que medida, determinado instrumento resulta el más adecuado para la
tarea evaluativa, en especial si estos instrumentos son construidos por el docente investigador.
1. VALIDEZ
Se refiere a la eficacia con que un instrumento mide lo que debe medir. Este concepto se relaciona con
la pregunta ¿qué mide la prueba? Los instrumentos que aplicamos en el campo educativo (labor docente
o investigativa) se proponen evaluar construcciones tales como aprovechamiento, aprendizaje,
creatividad, inteligencia, motivación, actitudes, etc. para lo cual no existen medios directos como en las
ciencias físicas, para ello es necesario idear medios indirectos para medir atributos complejos: tales como
pruebas y escalas.
Acerca de la validez, la clasificación más conocida (Asociación Estadounidense de Psicología, Asociación
Estadounidense de Investigación Educacional), distingue:
a. Validez de Construcción
Se refiere a la medida en que un test nos proporciona información acerca de una característica
significativa del individuo. La validez de construcción de una prueba puede ser proporcionada por:
 Sus relaciones con otro test.

 Sus relaciones con otras características.
 Sus relaciones con factores del ambiente.
Asimismo, se define como el grado en que un test mide la construcción teórica elaborada respecto a
la conducta que se mide. Todo test se basa en una idea que el autor desarrolla para explicar la
organización y funcionamiento de un atributo conductual. Se afirma que un test posee validez de
constructo teórico, si el resultado obtenido es el esperado de acuerdo a la teoría formulada.
Algunas construcciones comunes: ansiedad, inteligencia, motivación, habilidad de raciocinio,
pensamiento crítico, etc.
Con la palabra construcción (constructo) se indica algo que no es medible directamente; por ejemplo
“madurez social”, según la escala de Vinelland se le pregunta al padre:
 ¿Su hijo usa patines, trineo, cochecito? (ocupación)

 ¿Se acuesta sólo? (meterse solo a la cama) (esfuerzo propio)
 ¿Escribe palabras sencillas? (comunicación)
 ¿Participa en juegos simples? (locomoción)
 ¿Se le puede confiar dinero? (autodirección)
Si hace todo esto, entonces diremos que tiene “madurez social”.

En relación a las escalas de actitudes (sobre el sexo, drogas, etc.) la validez de construcción implica
utilizar algunos estadísticos que permitan seleccionar los ítems que discriminan actitudes positivas de
negativas.

2
2019 - I
b. Validez Predictiva
Permite predecir la situación futura de los individuos. Para determinar la validez predictiva de un
instrumento es necesario establecer un criterio con el cual puedan compararse las predicciones
formuladas.
Se asume que si la predicción enunciada por el test corresponde a lo esperado, el test es válido. El
conocimiento de la validez por este procedimiento requiere de un estudio de seguimiento o puesto
que el valor del test se comprueba en el futuro.
c. Validez de Contenido
Una prueba posee “Validez de contenido” cuando los ítems que la integran constituyen una muestra
representativa de los indicadores de la propiedad que se mide, dicho en otros términos, que el test
sea un adecuado muestreo del contenido que se examina.
Por ejemplo, la validez de contenido de un test de rendimiento escolar podía determinarse analizando
la correspondencia que sus ítems guardan con los temas que cubre la asignatura, la prueba deberá
reflejar el énfasis que el programa escolar otorga a ciertos temas, así como a los objetivos
instrumentales que el currículo persigue. Obviamente, la prueba carecerá de validez de contenido si
excluye algunos puntos programáticos o sus ítems reflejan un muestreo inadecuado de los
conocimientos y destrezas que se han propuesto como objetivos.
A menudo la validez de contenido se puede determinar sobre la base de juicio de expertos (para
escalas de actitud, guías de observación, cuestionario) y el análisis lógico, para las pruebas de
conocimiento (a partir de las tablas de especificación).
c.1. Validez de Contenido: Análisis Lógico
Es el investigador quien aporta los datos y realiza el análisis lógico que permite demostrar que
los ítems son representativos del dominio de contenidos que se estudia. Cada instrumento de
medición debe contribuir lo más posible a diferenciar entre los individuos respecto a la variable
que se está midiendo. No es posible incluir en el test todos los indicadores de la variable que
se quiere medir, puesto que siempre hay más indicadores de una variable de lo que se puede
incluir en el test. Se debe hacer pues, un muestreo de indicadores. (nos referimos a las pruebas
de conocimiento)
Para garantizar esta forma de validez es necesario elaborar una Tabla de Especificación,
teniendo en cuenta los siguientes elementos:
1º Determinar las conductas que se van a medir en la prueba (objetivos en la tarea didáctica
y categorías e indicadores en el trabajo de investigación).
2º Determinar los contenidos que se van a utilizar para medir conductas.
3º Establecer los pesos académicos, de objetivos y contenidos a medir. Los cuales se

determinan en función del tiempo que durará la unidad didáctica, y/o experiencia de
investigación.
4º Elegir un intervalo, (elección arbitraria) en el que se encontrará el número de ítems que

contendrá la prueba. Al elegir el intervalo se deberá tener en consideración: el grado de
estudios, la edad, el tiempo aproximado que durará la prueba.

3
2019 - I
Ejemplo:
1º Objetivos : 3 ( I, II, III )
2º Contenidos : 5 ( A, B, C, D, E )
Incluir el
3º Nº de Sesiones : 15 esquema en la
tesis.
4º Intervalo : 20 – 25
(Li Ls)
Paso 1:
Determinar el número de sesiones para cada objetivo y hallar su proporción
Contenido A ------ 2/15 = 0,133 ------ 0,13

Contenido B ------ 4/15 = 0,266 ------ 0,27
Contenido C ------ 2/15 = 0,133 ------ 0,13
Contenido D ------ 3/15 = 0,200 ------ 0,20
Contenido E ------ 4/15 = 0,266 ------ 0,27
15/15 1,00
Paso 2:
Determinar el número de sesiones para cada contenido (hallar su proporción)
Obj. I ------ 5/15 = 0,3333….. 0,33

Obj. II ------ 3/15 = 0,20 0,20
Obj. III ------ 7/15 = 0,4666…. 0,47
15/15 1,00
Paso 3:
Elaboramos la tabla calculando el número de ítems por contenido y objetivo y el
límite inferior del intervalo.
( 20 – 25 )
Li Ls

4
2019 - I
Cálculo del número de ítems:

A X I X 20 = 0,13 X 0,33 X 20 = 0,851 = 1
A X II X 20 = 0,13 X 0,20 X 20 = 0,521 = 1
A X III X 20 = 0,13 X 0,47 X 20 = 1,221 = 1
B X I X 20 = 0,27 X 0,33 X 20 = 1,78 = 2
B X II X 20 = 0,27 X 0,20 X 20 = 1,08 = 1
B X III X 20 = 0,27 X 0,47 X 20 = 2,53 = 3
C X I X 20 = 0,13 X 0,33 X 20 = 0,851 = 1
C X II X 20 = 0,13 X 0,20 X 20 = 0,52 = 1
C X III X 20 = 0,13 X 0,47 X 20 = 1,22 = 1
D X I X 20 = 0,20 X 0,33 X 20 = 1,32 = 1
D X II X 20 = 0,20 X 0,20 X 20 = 0,8 = 1
D X III X 20 = 0,20 X 0,47 X 20 = 1,88 = 2
E X I X 20 = 0,27 X 0,33 X 20 = 1,78 = 2
E X II X 20 = 0,27 X 0,20 X 20 = 1,08 = 1
E X III X 20 = 0,27 X 0,47 X 20 = 2,53 = 3
22
Items
TABLA DE ESPECIFICACIÓN
OBJETIVOS I II III
TOTAL
CONTENIDOS 0,33 0,20 0,47
A = 0,13 1 1 1 3
B = 0,27 2 1 3 6
C = 0,13 1 1 1 3
D = 0,20 1 1 2 4
E = 0,27 2 1 3 6
TOTAL 7 5 10 22
* Incluir el esquema en la tesis.

5
2019 - I
c.2. Validez de Contenido: Juicio de Experto
La primera versión de un cuestionario, escala, etc. es sometida a la “opinión de expertos”

entendidos como tal aquellos que tienen alguna especialización afín al tema que se investiga, o
han efectuado estudios sobre temas similares o en su defecto han trabajado con grupos de
características similares a las muestras que se utilizarán en la investigación.
El propósito de la consulta es recoger sugerencias para mejorar el instrumento a partir de la

búsqueda del consenso, se dice pues que la validez de contenido consiste en esencia, en un
conjunto de juicios basados en el consenso de los expertos del tema.
MECÁNICA:
 Se considera un número de 7 expertos.

 Cada uno de ellos examina cuidadosamente un modelo de la prueba. (tiene conocimiento
del contenido y objetivos para lo cual el test fue elaborado)
Formas:
 Presentación de la prueba con Ítem a ciegas: a los jueces se le entrega las definiciones y
las clasificaciones separadas de los ítems.
El juez deberá analizar los ítems y clasificarlos. Posteriormente el investigador debe
contrastar su clasificación con el realizado por el juez.
 Presentación de la prueba con Ítem clasificado: se entregan los Ítems clasificados según
las áreas de la prueba que se está analizando.
Deberá indicar si está de acuerdo o no con el ítem para posteriormente comparar ambas
clasificaciones.
 Sobre la base del propio test prepara un informe en el cual indica el contenido representado
en aquel y los tipos de conocimientos y habilidades que el alumno debe poseer para
responder correctamente los ítems.
 Luego, se comparan los informes y se observa si existen discrepancias entre ellos.
El juicio definitivo sobre la validez de contenido depende del grado de adecuación existente entre
la prueba y los contenidos. No olvidar que la validez de contenido está referida al grado en que
los reactivos que constituyen la prueba son realmente la muestra respectiva del dominio de
contenido que nos interesa medir.
 Es necesario que los jueces pongan en juego sus capacidades de análisis lógico y su
experiencia.
Empleando el coeficiente de validación V de Aiken, (1985) se analizan cada uno de los ítems
para determinar la validez del instrumento.

6
2019 - I
ANÁLISIS DE LOS INFORMES ENTREGADOS POR LOS JUECES Y LA CLASIFICACIÓN DEL

INVESTIGADOR
Si el Índice de Acuerdo es igual o mayor a 0,70 se acepta el ítem, de no llegar al mínimo se reformula
reclasifica, o elimina.
*Del ejemplo mostrado, se observa que los ítems han resultado válidos, por lo cual se concluye el proceso de
validación del instrumento.
Al término del proceso de validación se procede a la aplicación de la prueba al grupo piloto, que debe constar
como mínimo de 25 a 30 sujetos, para determinar su confiabilidad.

7
2019 - I
2. CONFIABILIDAD
El concepto de confiabilidad de un test hace referencia a la consistencia de los puntajes obtenidos por un
mismo grupo de sujetos en una serie de mediciones tomadas con el mismo test. Según esto, la
confiabilidad denota estabilidad y consistencia de los puntajes, esperándose que no presenten
variaciones significativas en el curso de una serie de aplicaciones del test.
Una medida es confiable (dice THORNDIKE, Robert: Test y Técnicas de Medición en Psicología y
Educación) en el grado en que un individuo es más o menos el mismo en mediciones repetidas.
Formas:
 Medición de la confiabilidad a partir de la correlación producto – momento de Pearson (r).
 Medición de la confiabilidad a partir de los coeficientes Kuder Richardson 20, 21
 Medición de la confiabilidad a partir del Alfa de Cronbach
Antes de describir cada uno de los índices de confiabilidad es necesario precisar que para la aplicación
de la prueba se debe tener un grupo piloto, es decir un grupo de estudiantes que tengan las mismas o
similares características que el grupo ha investigar, a fin de aplicarle la prueba.
2.1 MEDICIÓN DE LA CONFIABILIDAD A PARTIR DE LA CORRELACIÓN DE PEARSON (r)
2.1.1 Repetición del mismo test (Test – Retest):
Consiste en tomar una misma prueba una segunda vez; para probar la consistencia de los
resultados, y a través de ello, determinar si el test es confiable o no.
La reaplicación de un test puede disponer de tal manera que refleje la existencia o no de
variaciones en las respuestas y por lo tanto de las puntuaciones, las que han de mantener
correlación. Asumiendo que pueden existir variaciones parciales por los efectos de la memoria y
la práctica.
2.2.2 Formas paralelas de test:
Las formas equivalentes de un test han de entenderse como formas construidas conforme a las
mismas especificaciones, pero compuestas de muestras separadas de conducta en el área
definida.
Si se dispone de dos formas de un test, debemos administrar a cada alumno, primero una forma y
luego la otra. La correlación entre las dos formas proporcionará un adecuado coeficiente de
confiabilidad.
2.2.3 Test subdividido:

Un procedimiento más simple, en el que a menudo se confía para obtener dos partes equivalentes,
consiste en poner preguntas alternas en los dos medios test, es decir, poner todas las preguntas
impares en una unidad del test, y todos los pares, en otra.
La correlación entre estas se correlacionan los test con el índice de correlación producto –
momento de Pearson cuya fórmula es la siguiente:

8
2019 - I
Ejemplo de aplicación de (r)
PUNTAJE TOTAL DE ITEMS PUNTAJE TOTAL DE ITEMS

SUJETO PARES IMPARES (x) (y) (x2) (y2)
(x) (y)
1 58 46 2668 3364 2116
2 45 54 2430 2025 2916
n
N=50
2.2 MEDICIÓN DE LA CONFIABILIDAD A PARTIR DEL COEFICIENTE DE KUDER – RICHARDSON
2.2.1 Coeficiente Kuder – Richardson – 20 ( KR20 )

Permite estimar la consistencia interna de los ítems. Su cálculo requiere de una sola
administración del test; se basa en el examen de las respuestas correctas – fracasos para cada
item (los ítems que se califican son dicotómicos).
 
Fórmula:
K 1 -  pi.qi
KR20 =
K–1 S2
Donde: K = Número de ítems.
Pi = Proporción de aciertos.
qi = Proporción de errados.
 = Sumatoria.
S2 = Varianza de los puntajes.
Ejemplo:
1º Se aplica una prueba con 10 ítems en donde cada uno de ellos tiene dos alternativas (acierto –
desacierto, si – no, verdadero – falso, etc.) se otorga puntaje y así tenemos:
Acierto = 1 punto ---------- identificado por “p”

Desacierto = 0 punto ---------- identificado por “q”
2º La prueba se aplica a 5 sujetos y se realiza el siguiente análisis:

 Cada sujeto con sus dos alternativas: aciertos (p) y errados (q).
 Los ítems (en este caso del 1 al 10).

9
2019 - I
SUJETOS 1 2 3 4 5
ITEMS p q p q p q p q p q
1 V - V V - V V - V -
2 V - - V V - - V - V
3 V - V - - V V - V -
4 V - - V - V V - - V
5 V - V - V - - V V -
6 V - - V - V V - V -
7 V - V - - V - V - V
8 V - - V V - V - - V
9 V - V - V - V - - V
10 V - - V - V - V - V
X (puntaje) 10 0 5 5 4 6 6 4 4 6
Proporción 1 0 0,5 0,5 0,4 0,6 0,6 0,4 0,4 0,6
3º Se hace un análisis de los puntajes/proporción para encontrar la sumatoria de los aciertos y errores
( ∑ piqi ).
PROPORCIÓN
pi qi piqi
SUJETOS
1 1 0 0
2 0,5 0,5 0,25
3 0,6 0,6 0,24
4 0,4 0,4 0,24
5 0,6 0,6 0,24
0,97
∑ piqi
4º Luego se analizan los puntajes totales o de toda la prueba.
PUNTAJES (1) (2) (3)
SUJETOS Xi ( Xi – x ) ( Xi – x )2
1 10 (10 – 5,8) = 4,2 (4,2)2 = 17,64

2 5 (5 – 5,8) = 0,8 (-0,8)2 = 0,64
3 4 (4 – 5,8) = 1,8 (-1,8)2 = 3,24
4 6 (6 – 5,8) = 0,2 (0,2)2 = 0,04
5 4 (4 – 5,8) = 1,8 (-1,8)2 = 3,24
∑ Xi 29 24,8
a) Obtenga el valor de la x para pasar a la columna (2)
X = ∑ Xi = 29 = 5,8
n 5

10
2019 - I
b) Obtenga el valor de la varianza (3)
S2 =
(Xi - x)2 S2 = 24,8 = 4,96
n 5
5º Como último paso aplicamos la fórmula donde:
K
∑ piqi
S2 = 4,96
= 10
= 0,97
KR20 = K
K-1 1- ∑ piqi
S2 
-------------------------
KR20 = 10
10 - 1  1 – 0,97
4,97   = 10
9
1 - 0,195

KR20 = (1,11) (0,805) = 0,89
Si KR20 (COEFICIENTE) obtenido es inferior a 0,80, la prueba no es confiable. Para el ejemplo presentado,
supera el mínimo deseado (0,89), por lo tanto podemos decir que la prueba es confiable.
2.2.2 COEFICIENTE KUDER RICHARDSON 21 (KR21)
Se dice que las puntuaciones de una prueba son confiables cuando aplicadas en diversas
oportunidades producen los resultados aproximadamente similares. La confiabilidad será
entonces “una estimación del grado de consistencia o constancia” entre repetidas mediciones
efectuadas a los sujetos con el mismo instrumento.
El coeficiente KR21 se aplica especialmente a pruebas en donde los ítems tienen un nivel de
dificultad equivalente, son las pruebas de poder o ítems politómicos. (Se recomienda aplicar
este coeficientes para pruebas de conocimiento)
Fórmula:
𝑘 𝑋̅(𝑘 − 𝑋̅)
𝐾𝑅21 = ( ) (1 − )
𝑘−1 𝐾𝑆 2
Donde:
K = número de ítems.
𝑋̅ = media aritmética.
S2 = varianza
Ejemplo:
- Se aplico una prueba a un grupo de alumnos y se obtuvieron los siguientes datos:
K = 20 item
X = 17
S2 = 9

11
2019 - I
Aplicamos la fórmula:
20 17(20−17) 20 17(3)
KR21 = (20−1) (1 − 20(9)
) = 19 (1 − 180
)
51
KR21 = 1,05 (1 − 180) = 1,05 (1 − 0,28)
KR21 = 1,05 (0,72) = 0,756
Si el coeficiente obtenido supera el valor de 0,60 (para pruebas construidas por el docente investigador)
concluimos que la prueba es confiable. Para pruebas estandarizadas el mínimo exigido es de 0,90.
Habiendo aplicado uno de los índices de confiabilidad a una prueba, y al no obtener el calificativo de confiable,
se procede a encontrar el ÍNDICE DE DIFICULTAD.
Según la interpretación clásica, es el valor que nos indica que tan fácil o difícil es un ítem.
Fórmula:
𝑁° 𝑑𝑒 𝑟𝑒𝑠𝑝𝑢𝑒𝑠𝑡𝑎𝑠 𝑐𝑜𝑟𝑟𝑒𝑐𝑡𝑎𝑠
I. D. = 𝑁° 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠 𝑞𝑢𝑒 𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑖𝑒𝑟𝑜𝑛 𝑙𝑎 𝑝𝑟𝑢𝑒𝑏𝑎 𝑁° 𝑅/𝐶
𝐼. 𝐷 =
𝑁° 𝑇/𝑃
Ejemplo:
Se aplicó una prueba de 5 ítems, contestadas por 20 personas.
1 2 3 4 5
Nº T / P 20 20 20 20 20
Nº R / C 20 0 10 15 5
Índice de Dificultad 20 / 20 0 / 20 10 / 20 15 / 20 5 / 20
1 0 0,5 0,75 0,25
Tenemos entonces:
I. D. = 1 pregunta muy fácil.
I. D. = 0 pregunta muy difícil.
I. D. = 0,5 grado de dificultad mediano, etc.
La tarea siguiente deberá ser reconstruir el ítem con alto índice de dificultad y complejizar los ítems que
resultan muy fáciles, pero antes de ello se debe elaborar una escala para buscar el balance de la prueba por
su índice de dificultad. A continuación se presentan a manera de ejemplos dos modelos.
MODELO 1:
I. D. CONDICIÓN PORCENTAJE
0 – 0,25 = Muy difícil = 10 %
0,26 – 0,50 = Difícil = 40 %
0,51 – 0,75 = Fácil = 40 %
0,76 – 1,00 = Muy fácil = 10 %

12
2019 - I
MODELO 2:
I. D. CONDICIÓN PORCENTAJE
0 – 0,20 = Muy difícil = 10 %
0,21 – 0,40 = Difícil = 20 %
0,41 – 0,60 = Medianamente = 40 %
0,61 – 0,80 = Fácil = 20 %
0,81 – 1,00 = Muy fácil = 10 %
Estas son escalas convencionales, en todo caso se recomienda elaborar sus propias escalas, buscando el
balance de la prueba. Reconstruida la prueba se procederá a una nueva aplicación piloto, bajo las mismas
condiciones que la primera.
2.3. MEDICIÓN DE LA CONFIABILIDAD A PARTIR DEL COEFICIENTE DE ALFA DE CRONBACH
El coeficiente Alfa de Cronbach ha resultado uno de los coeficientes más empleados en la literatura relacionada
a estudios instrumentales; sin embargo, en estudios de simulación se ha demostrado que arroja resultados
espurios en instrumentos con escalas de respuesta Likert con menos de cinco categorías (Domínguez, 2012;
Elosua &
Zumbo, 2008; Lozano, García-Cueto & Muñiz, 2008).
Por otro lado, también se ha indicado que el coeficiente Alfa está afectado por el número de ítems (Ventura-
León & Caycho-Rodríguez, 2017). Finalmente, el coeficiente Alfa es aplicable a variables continuas, lo cual
ocurre poco en ciencias sociales (Elosua & Zumbo, 2008). De lo señalado anteriormente, se recomienda tener
el debido cuidado para elegir el coeficiente Alfa de Cronbach para estimar la evidencia de confiabilidad basada
en el análisis de la consistencia interna.
Al respecto, el coeficiente Alfa se presenta como una alternativa para el análisis de instrumentos con escalas
Likert con menos de cinco categorías, siendo su fórmula (Elosua & Zumbo, 2008):
𝑘 ∑ 𝑆𝑖 2
𝛼= [1 − ]
𝑘−1 𝑆𝑡 2
Donde:
K : N.° de ítems
Si2 : Sumatoria de varianza de los ítems
St2 : Varianza de la suma de los ítems
𝜶 : Coeficiente del Alfa de Cronbach

13
2019 - I
Software recomendado
A continuación, en la Tabla 5, se presenta un listado del software que se puede emplear para obtener los datos
correspondientes a los estadísticos empleados para determinar evidencia de confiabilidad basada en la
consistencia interna.
Ejemplo:
PASO 1:
Luego, de aplicar la prueba al grupo piloto se sistematiza los resultados empleando el software Excel o spss.
Tener en cuenta al momento de elaborar la tabla:
 Construir una columna para ubicar a los sujetos de estudio.
 Construir una fila para ubicar los ítems del instrumento.

14
2019 - I
PASO 2:
Exportar los resultados de la tabla del programa del Excel al Software SPSS
PASO 3:

15
2019 - I
PASO 4:
Dirigirse a la pestaña “Vista de variables”, seleccionar la celda “Cadena” y cambiar por “Numérico”
PASO 5:
Luego, seleccionar la celda “Nominal” y cambiar por “Escala”

16
2019 - I
PASO 6:
Dirigirse a la herramienta “Analizar”, seleccionar “Escala” y “Análisis de fiabilidad”
PASO 7:
Trasladar cada uno de los ítems al cuadro de elementos, y aceptar.

17
2019 - I
PASO 8:
Finalmente, obtenemos la confiabilidad del Alfa de Cronbach.
*En la tesis debe aparecer el cuadro de la estadística de fiabilidad.
REFERENCI AS
ALARCÓN, Reynaldo. (1992) Métodos y Diseño de Investigación del Comportamiento. Lima, Fondo
Editorial.
ANDER EGG, Ezequiel. (1984) Introducción a las Técnicas de Investigación. Buenos Aires, editorial
Humanitas.
ARY, Jacobs y otros. (1985) Introducción a las Investigación Pedagógica. México, Nueva Editorial
Interamericana S.A.
CANALES, Isaac y otros. (1984) Evaluación. Tomo I, II. Lima, INIDE.
KERLINGER, Fred. (1987) Investigación del Comportamiento. México, Nueva Editorial Interamericana S.A.
ROSALES, Carlos (1990) Evaluación Formativa. Madrid, Narcea.
VEGA, A. Ricardo. (1979) Evaluación. Piura, Copias mimeografiadas para el Censo.

18

Medición en Investigación - Documento Final 2019

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Medición en Investigación - Documento Final 2019

Transféré par

Droits d'auteur :

Formats disponibles

Centro de Investigación

II. TIPOS DE MEDICIÓN

En el caso de la medición psicológica, educativa, sociológica, etc; es accesible sólo a la medición

III. CONCEPTO DE INSTRUMENTO, PRUEBA O TEST

Curso: Investigación Educativa III

IV. EVALUACIÓN DE LA CALIDAD DE UN INSTRUMENTO

 Sus relaciones con otro test.

 ¿Su hijo usa patines, trineo, cochecito? (ocupación)

Si hace todo esto, entonces diremos que tiene “madurez social”.

Curso: Investigación Educativa III

c.1. Validez de Contenido: Análisis Lógico

2º Determinar los contenidos que se van a utilizar para medir conductas.

3º Establecer los pesos académicos, de objetivos y contenidos a medir. Los cuales se

4º Elegir un intervalo, (elección arbitraria) en el que se encontrará el número de ítems que

Curso: Investigación Educativa III

Contenido A ------ 2/15 = 0,133 ------ 0,13

Obj. I ------ 5/15 = 0,3333….. 0,33

Curso: Investigación Educativa III

Cálculo del número de ítems:

* Incluir el esquema en la tesis.

Curso: Investigación Educativa III

La primera versión de un cuestionario, escala, etc. es sometida a la “opinión de expertos”

El propósito de la consulta es recoger sugerencias para mejorar el instrumento a partir de la

 Se considera un número de 7 expertos.

Curso: Investigación Educativa III

ANÁLISIS DE LOS INFORMES ENTREGADOS POR LOS JUECES Y LA CLASIFICACIÓN DEL

Curso: Investigación Educativa III

2.1 MEDICIÓN DE LA CONFIABILIDAD A PARTIR DE LA CORRELACIÓN DE PEARSON (r)

2.1.1 Repetición del mismo test (Test – Retest):

2.2.2 Formas paralelas de test:

2.2.3 Test subdividido:

Curso: Investigación Educativa III

Ejemplo de aplicación de (r)

PUNTAJE TOTAL DE ITEMS PUNTAJE TOTAL DE ITEMS

2.2 MEDICIÓN DE LA CONFIABILIDAD A PARTIR DEL COEFICIENTE DE KUDER – RICHARDSON

2.2.1 Coeficiente Kuder – Richardson – 20 ( KR20 )

Acierto = 1 punto ---------- identificado por “p”

2º La prueba se aplica a 5 sujetos y se realiza el siguiente análisis:

Curso: Investigación Educativa III

4º Luego se analizan los puntajes totales o de toda la prueba.

PUNTAJES (1) (2) (3)

1 10 (10 – 5,8) = 4,2 (4,2)2 = 17,64

a) Obtenga el valor de la x para pasar a la columna (2)

Curso: Investigación Educativa III

b) Obtenga el valor de la varianza (3)

2.2.2 COEFICIENTE KUDER RICHARDSON 21 (KR21)

- Se aplico una prueba a un grupo de alumnos y se obtuvieron los siguientes datos:

Curso: Investigación Educativa III

KR21 = 1,05 (0,72) = 0,756

Curso: Investigación Educativa III

2.3. MEDICIÓN DE LA CONFIABILIDAD A PARTIR DEL COEFICIENTE DE ALFA DE CRONBACH

Curso: Investigación Educativa III

Curso: Investigación Educativa III

Curso: Investigación Educativa III

Curso: Investigación Educativa III

Curso: Investigación Educativa III

*En la tesis debe aparecer el cuadro de la estadística de fiabilidad.

CANALES, Isaac y otros. (1984) Evaluación. Tomo I, II. Lima, INIDE.

ROSALES, Carlos (1990) Evaluación Formativa. Madrid, Narcea.

VEGA, A. Ricardo. (1979) Evaluación. Piura, Copias mimeografiadas para el Censo.

Curso: Investigación Educativa III

Vous aimerez peut-être aussi