Vous êtes sur la page 1sur 7

Estadstica Aplicada a Trabajos de Investigacin

VALIDEZ Y CONFIABILIDAD DE UN INSTRUMENTO i

La validacin de los instrumentos de evaluacin se inicia desde la etapa de


operacionalizacin de las variables o caractersticas de un objeto, individuo o fenmeno.

Este proceso consiste en traducir una variable expresada en lenguaje terico en otras
variables empricas que son los indicadores especficos y concretos de las cuales se
desprenden los reactivos o tems del instrumento.

Se realiza para controlar variables confusas que no estn en correspondencia directa con el
individuo, objeto o fenmeno a investigar y evaluar.

Exige nutrir de manera permanente el sustento terico para posibilitar un mejor proceso de
operacionalizacin o conjunto de significados que se da a una variable y, por lo tanto, lograr
interpretar de mejor modo los procedimientos realizados.

La validacin implica:
A) Establecer la relacin de correspondencia lgica del instrumento con los
criterios, indicadores e tems o preguntas.

B) Elaborar la tabla de especificaciones de los instrumentos de evaluacin.

C) Elaborar la prueba que se ajusta a la tabla de especificaciones.

D) El instrumento debe recoger a travs de sus reactivos o preguntas


(variables empricas) de manera equilibrada y representativa de los
indicadores, criterios y todos los conceptos, que sustentan la variable
terica.

Pontificia Universidad Catlica del Per 1


tala Navarro

Por lo tanto, luego de haber concluido con la elaboracin de un instrumento, de acuerdo a la


tabla de especificaciones, es necesario evaluarlo antes de aplicarlo y hacer correcciones
oportunas.

A continuacin las siguientes interrogantes de Hernndez-Sampieri, (2010) posibilitan la


validacin.

El concepto terico est reflejado realmente en el instrumento?

Qu significan las puntuaciones del instrumento?

El instrumento mide el constructo y sus dimensiones? Por qu s? Por qu no?


Cmo opera el instrumento?

Algunos autores definen:

La validez de un instrumento
de medicin es el grado en Grado en que un
que el instrumento mide instrumento realmente
realmente lo que el mide lo que el investigador
investigador pretende medir. pretende. (Thorndike)
(Hernndez Sampieri)

Ambas definiciones coinciden que el requisito de un instrumento para lograr la


confiabilidad es la validez. Pero lo recproco no es cierto, puesto que un instrumento
puede ser confiable sin ser vlido.
Para determinar la validez de un instrumento es necesario el anlisis psicomtrico que
exige respuesta a las siguientes preguntas:

Qu es lo que mide la prueba? Responder esta interrogante implica


informar sobre la validez del instrumento.

Hasta qu punto son consistentes las puntuaciones? Responder esta


interrogante implica informar sobre la confiabilidad del instrumento.

En tal sentido, para determinar la eficacia del instrumento de medicin se debe precisar
su validez y confiabilidad.

2 Centro de Educacin Continua


Estadstica Aplicada a Trabajos de Investigacin

Eficacia del instrumento de medicin

La eficacia del instrumento de recoleccin de datos est referida a su validez y


confiabilidad.
A travs de la validez de contenido, se trata de determinar hasta dnde los tems de una
prueba son representativos de los indicadores del criterio a evaluar y que se desea medir,
establece la relacin del instrumento con los criterios o dimensiones de la variable que se
pretende medir. Ello da garantas de que se ha operacionalizado claramente desde la
concepcin terica, hasta las dimensiones o criterios, indicadores y reactivos. El instrumento
(prueba) a travs de los tems debe contener los variables empricas claramente definidas.
Si no se cuenta con la seguridad de que los reactivos representan a los contenidos de los
criterios de la variable terica se debe proceder a la consulta de expertos, quienes evalan
la representatividad de los indicadores relevantes de los criterios o dimensiones de variable
terica. Siendo indispensable elaborar la tabla de especificaciones, elaborar la prueba que
se ajusta a la tabla de especificaciones y determinar si los tems de una prueba son
representativos de los indicadores del criterio a evaluar.

Describe la representatividad del muestreo de reactivos para el constructo que se mide y


aplica a mediciones tanto de atributos, emociones o afectos cognitivos. Se requiere una
muestra adecuada y representativa del contenido.

En el mtodo de juicio de expertos para evaluar la validez de contenido de la variable a


medir se necesitan a los expertos profesionales competentes con experiencia en la
construccin de instrumento. Se requiere de varios jueces.

Las siguientes interrogantes posibilitan el anlisis y evaluacin del instrumento a validar:

Existe congruencia entre las dimensiones?

Los indicadores representan al criterio a medir?

Los reactivos realmente miden a los indicadores?

Los reactivos cubren los conocimientos y corresponden a las demandas cognitivas


expresadas en los indicadores?

Los reactivos estn redactados con claridad? Son apropiados tericamente? Son
comprensibles?

Pontificia Universidad Catlica del Per 3


tala Navarro

Cul es el grado de validez que posee el instrumento que estamos sometiendo a


validacin?
El instrumento mide adecuadamente los principales criterios de la variable en
estudio?
Las preguntas que tan bien representan a las preguntas que pudieran hacerse?

Para facilitarles el trabajo a los jueces, se deben proporcionar los siguientes documentos:

Matriz

Tabla de especificaciones

Instrumento

Descripcin de la estrategia de aplicacin

Ficha para la evaluacin del instrumento

Para comprobar la validez de contenido a travs del juicio de expertos, sobre la respuesta
de los expertos podemos aplicar el coeficiente V de Aiken. 1

Es el procedimiento para obtener el coeficiente v de Aiken y para evaluar la validez de


contenido a travs del juicio de expertos. Se obtiene la validez del contenido de cada tem
a travs del coeficiente V de Aiken, para lo cual se usa la siguiente frmula:
V = S/ (n(c-1))
Dnde:
S: sumatoria de las respuestas o acuerdos de los expertos por cada tem
n: nmero de expertos
N: Nmero de tem
c: nmero de valores en la escala de valoracin ( 2 si se trata de acuerdo y desacuerdo) (
4 si se trata de escala: 0,1,2,3)
Para que el tem sea aceptado o vlido debe alcanzar un coeficiente V igual o
superior a 0.81.
Cuando alcanza un valor menor debera analizarse su redaccin, las recomendaciones y
observaciones de los jueces y tener en cuenta que la idea principal del tem debe estar en
el enunciado. Se debe evitar los conocimientos excesivamente triviales o excesivamente
rebuscados, evitar cuestiones sobre opiniones, no encadenar unos tems con otros,
minimizar el tiempo de lectura, evitar el uso de negaciones.

1
Adaptado de Separata: Programa de maestra en educacin. PAME- Callao .(2009)

4 Centro de Educacin Continua


Estadstica Aplicada a Trabajos de Investigacin

La validez de constructo se define como el grado en que una prueba Mide la construccin
terica elaborada respecto a los conocimientos o conducta que se mide.
Los procedimientos estadsticos apuntan a establecer de manera probabilstica grupos de
tems que debern ser definidos como dimensiones. Estas dimensiones son
conceptualizadas de manera consensuada para otorgarle el carcter de tiles y
cientficamente vlidos, por cuanto no existe una prueba patrn.
Si los dominios han sido construidos de manera terica, la estadstica corrobora la idoneidad
de estas agrupaciones y nos daremos respuestas a estas interrogantes:

Por ejemplo: el coeficiente de validez tem.total o correlacin del tem con los dems
evidencia el ndice de homogeneidad o discriminacin, es decir el tem nos informa el grado
con que contribuye a la consistencia y si realmente contribuye a lo que se mide
globalmente en la prueba.

Por lo tanto, el ndice de discriminacin correlaciona las puntaciones de un tem con el total
de puntuaciones de un instrumento. Es decir, nos dan respuesta a la pregunta Los tems
del instrumento son representativos de los indicadores del criterio a evaluar?

Los tems que tienen mayor correlacin son los que mejor representan al constructo medido.
El ndice informa el grado en que el tem contribuye a la consistencia, es decir si mide lo
que se est midiendo en la prueba.

El ndice de validez correlaciona las puntaciones en un tem con las puntuaciones de un


criterio.

Una correlacin mayor a 0,30 es vlida.

Correlacin tem-total
Correlacin de cada tem con el total menos el tem.

Mayor de 0,30, el tem tiene una validez buena y si el valor es menor a 0,20 debemos
analizar.

Pontificia Universidad Catlica del Per 5


tala Navarro

Confiabilidad de un instrumento
Segn Morales (2007), el anlisis de tems se hace para seleccionar los tems que nos van
a dar una fiabilidad ptima.

En qu grado este tem mide o manifiesta lo mismo que miden todos los dems tems y
que es precisamente lo que queremos medir?

Cabe considerar que con los anlisis estadsticos analizamos nmeros, no conceptos;
verificamos relaciones numricas para confirmar relaciones conceptuales. Por lo tanto, la
validez es fundamental antes que la confiabilidad del instrumento.

La confiablidad implica consistencia interna de los tems respecto al universo de contenidos


En qu medida la eleccin de la muestra de tems est libre de errores?

Loevinger (1957) pone de manifiesto que aumentar la consistencia interna ms all de cierto
punto va a tener un efecto sobre la disminucin de la validez de constructo. Dado que el
valor de consistencia interna depende de la intercorrelacin entre los tems, una forma de
aumentar esta es haciendo que los tems estn intercorrelacionados.

Sin embargo, los tems altamente correlacionados son tems que estn referidos a un mismo
aspecto, por lo tanto redundantes y sin la capacidad para representar los elementos
variados de un constructo.

El anlisis de confiabilidad nos permite determinar la probabilidad de que el instrumento o


conjunto de tems de una prueba generen los mismos resultados cada vez que este sea
aplicado al mismo individuo y en idnticas circunstancias.

Esto es lograr una prueba que conduzca a resultados similares cuando diferentes personas
la administran y cuando se usan formas alternas de la prueba. En pocas palabras esto es
una prueba confiable.

La confiabilidad est relacionada entonces con el instrumento, pero tambin con el tiempo
de aplicacin y la aplicacin por las personas capacitadas para tal fin.

6 Centro de Educacin Continua


Estadstica Aplicada a Trabajos de Investigacin

Los instrumentos de evaluacin deben ser vlidos y confiables. Son vlidos cuando el
instrumento se refiere realmente a la variable que pretende medir. Son confiables en la
medida que la aplicacin repetida del instrumento al mismo sujeto, bajo situaciones
similares, produce iguales resultados (HERNNDEZ, 1997).

Adems cabe resaltar que la confiabilidad es un clculo y la validez es un proceso lgico.

Factores que afectan a la validez y confiabilidad


Los factores que afectan son:

Improvisacin al
profundizar y actualizar la Instrumentos no validados
variable y teora que la
sustenta

Aspectos mecnicos del


instrumento cuando faltan
La administracin de
hojas, el instrumento est
instrumentos en
descompaginado, no hay
condicionas desfavorables
espacio para contestar,
de espacio, y tiempo
omisiones de grficos,
alternativas, etc.

i
Sosa Miriam y Navarro Itala (2013) Elaboracin y validacin de instrumentos de
evaluacin.Lima Per: UCA-UNALM

Pontificia Universidad Catlica del Per 7

Vous aimerez peut-être aussi