Vous êtes sur la page 1sur 34

Discutir y analizar los conceptos de validez y

confiabilidad.
Presentar y analizar situaciones que afectan la
validez y confiabilidad de los instrumentos.
Hallar la validez de contenido y confiabilidad
de un instrumento.
Validez
Es la cualidad del instrumento para medir los
rasgos o caractersticas que se pretenden medir.
Por medio de la validacin se trata de determinar si
realmente el cuestionario mide aquello para lo que
fue creado.
Confiabilidad
Se refiere a la consistencia de los resultados.
En el anlisis de la confiabilidad se busca que los
resultados de un cuestionario concuerden con los
resultados del mismo cuestionario en otra ocasin.
Son caractersticas que el cientfico social que
aspira hallar en todo mtodo, instrumento o
tcnica.
implica veracidad, confianza y exactitud
S los datos e instrumentos son vlidos y
confiables, entonces sus conclusiones tienden a ser
exactas.
La mayora de la literatura sobre el tema hace
referencia a la validez y confiabilidad haciendo
referencia al instrumento de medicin, y no al
proceso de investigacin.


Validez
Contenido
Criterio
Concurrente
Predictiva
Constructo

Confiabilidad
Formas alternas
Prueba-RePrueba
Divisin por mitades
Consistencia interna
Coeficiente Alpha
Kuder Richarson
Lawshe (1975) dijo que es la comunalidad o
traslapo que existe entre la ejecucin en la
prueba bajo investigacin y la habilidad para
funcionar en el dominio de ejecucin asociado a
una tarea determinada.
Novick (1985) establece que la validez de
contenido es la forma mediante la cual los
miembros del panel de evaluacin del
instrumento perciben traslapo entre la prueba y
el dominio que se est analizando.



Muchinsky (2006) por su parte, define la
validez de contenido como el grado al cual
la prueba contenga una muestra
representativa de la conducta a medirse.
El dominio de contenido normalmente es
definido o establecido por la literatura,
teora y estudios antecedentes.




Lawshe desarroll un
modelo matemtico que
utiliza la opinin de una
muestra de jueces con el
objetivo de identificar s el
tem es pertinente o no
para el medir el constructo
bajo estudio.
N
N n
CVR
e

=
Nmero de
jueces
ndice de validez de
contenido
5 0.99
6 0.99
7 0.99
8 0.75
9 0.78
10 0.62
11 0.59
12 0.56
13 0.54
14 0.51
15 0.49
20 0.42
25 0.37
30 0.33
35 0.31
40 0.29
Definir las caractersticas que deben tener los
jueces.
Seleccionar una muestra de jueces.
Administrar el instrumento a los jueces.
Hallar el coeficiente de validez de contenido
del tem.
Eliminar del instrumentos todos los temes que
no cumplen con el criterio establecido.
Hallar la validez de contenido del instrumento
(IVC).
Si la cantidad de jueces que expres que el
tem es PERTINENTE es mayor que la
cantidad de jueces que indicaron que NO ES
PERTINENTE.
CVR = PERTINENTE N
Si la cantidad de jueces que expres que el
tem es NO ES PERTINENTE es mayor que la
cantidad de jueces que indicaron que es
PERTINENTE.
CVR = (PERTINENTE NO PERTINENTE) N
Si la cantidad de jueces que expres que el
tem es NO ES PERTINENTE es igual que la
cantidad de jueces que indicaron que es
PERTINENTE.
CVR = 0
Si todos los jueces indicaron que el tem es
PERTINENTE.
CVT = .99
Nmero
del tem
Jueces
1 2 3 4 5
1 1 1 0 0 1
2 1 1 0 0 1
3 1 1 0 0 1
4 1 1 0 0 1
5 1 1 1 1 1
6 1 1 1 1 1
7 1 1 1 1 1
8 1 1 1 1 1
9 1 1 1 1 1
10 1 1 1 1 1
0 = No pertinente y el 1 = Pertinente
Es la efectividad de una prueba para predecir la
conducta individual en situaciones especficas.
Tipos de validez de criterio
Concurrente
Es el grado de relacin que existe entre las
puntuaciones de la prueba y las medidas del criterio
llevadas a cabo al mismo tiempo en que la prueba fue
administrada.
Validez predictiva
Es el grado de relacin que existe entre las
puntuaciones de la prueba y las medidas del criterio
recopiladas en el futuro.
Es el coeficiente de
correlacin entre
los resultados del
instrumento y el
criterio.
El coeficiente de
correlacin debe
ser igual o mayor a
.75 para establecer
una buena validez
de criterio.
] ) ( ][ ) ( [
2 2 2 2




=
y y n x x n
y x xy n
r
xy
Nivel de
satisfaccin
Desempeo
acadmico
6 82
2 63
1 57
5 88
2 68
3 75
La validez de constructo esta referida al grado en que
cada instrumento refleja el constructo que dice
medir, elaborndose operativamente cuando el
usuario desea hacer inferencias acerca de conductas
o atributos que pueden agruparse bajo la etiqueta de
un constructo particular.
Se refiere a qu tan exitosamente un instrumento
representa y mide un concepto terico (Bostwick y
Kyte,2005).
La organizacin de constructo requiere de la
acumulacin gradual de diversas fuentes de
informacin.
Messick (1995) establece seis criterios a
considerar al momento de establecer la
validez de constructo de un instrumento.
Contenido
Relevancia y representatividad del instrumento
Sustantivo
Razones tericas de la consistencia observada de las
respuestas.
Estructural
Configuracin interna del instrumento y
dimensionalidad.
Messick (1995) establece seis criterios a
considerar al momento de establecer la
validez de constructo de un instrumento.
Generalizacin
Grado en que las inferencias hechas a partir del
instrumento.
Se puede generalizar a otras poblaciones, situaciones
o tareas.
Externo
Relaciones del instrumento con otros instrumentos y
constructos.
Consecuencia
Consecuencias ticas y sociales del instrumento.
La validez de un instrumento de medicin se
evala sobre la base de todos los tipos de
evidencia.
Cuanto mayor evidencia de validez de
contenido, de criterio y de construccin tenga
un instrumento, este se acercar ms a
representar las variables que pretende medir.

Contenido Criterio Constructo
Validez
total
Un instrumento de medicin puede ser
confiable, pero no necesariamente vlido.
Un instrumento quizs sea consistente en los
resultados que produce, pero no mida lo que
pretende.
Los instrumentos deben ser vlidos y confiables
para que los resultados de la investigacin se
tomen en serio.
La validez y confiabilidad no se asumen, se
prueban.
La improvisacin
Para construir un instrumento se requiere
conocer muy bien la variable que se pretende
medir, as como la teora que la sustenta.
Instrumentos desarrollados en el extranjero que no
han sido validado para nuestro contexto.
Instrumento inadecuado para las personas que se
les administra.
Lenguaje muy elevado, no tomar cuenta
diferencias de gnero, edad, conocimientos,
memoria, nivel ocupacional, educativo,
motivacin para contestar entre otras situaciones.
Estilos personales de los sujetos.
Deseabilidad social, tendencia a asentir o contestar
negativamente a todo lo que se le pregunta o dar
respuestas inusuales.
Condiciones en que se administra el instrumento.
Ruidos, iluminacin, fro, demasiado largo o tedioso, el
momento, el da, la hora y el tiempo para responder.
Falta de estandarizacin del proceso de
administracin.
Instrucciones y orden de preguntas distintas,
instrumentos no equivalentes.
Aspectos mecnicos
No sea legible, faltan pginas, no haya
espacio para contestar, no se comprende.
Falta de validez de constructo
Estrechez del contenido, exclusin de
variables.
Amplitud exagerada, excesiva
introduccin de otros constructos.
Es la precisin con que el instrumento mide lo que
mide, en una poblacin determinada y en las
condiciones normales de aplicacin.
La falta de confiabilidad de un instrumento esta en
relacin con la intervencin del error.
Se considera que el error es cualquier efecto irrelevante
para los fines o resultados de la medicin que influye
sobre la falta de confiabilidad de tal medicin.
La confiabilidad se presenta por medio del coeficiente
de confiabilidad y del error estndar de medida.
Prueba-reprueba
Se aplica dos veces el mismo instrumento (el lapso
entre las aplicaciones se determina previamente), a
una misma muestra de individuos.
Las dos series de puntajes resultantes se
correlacionan con el coeficiente de correlacin de
Pearson.
Divisin por mitades o "split half method"
Se aplica el test una sola vez a una muestra. Luego,
se califica por separado los temes pares (y los
temes impares.
Las dos series de puntajes resultantes se
correlacionan con el coeficiente de Pearson.
Esta correccin se efecta con la frmula de
profeca de Spearman-Brown.
Consistencia interna
La tcnica considera que si un instrumento esta
formado por un conjunto de temes estos pueden
ser considerados como un conjunto de
instrumentos paralelos (tantos como temes tenga
el instrumento).
Luego se deriva una ecuacin para computar el
coeficiente de confiabilidad.
Consistencia interna
Kuder y Richardson derivaron varias frmulas para
el clculo del coeficiente de confiabilidad, son las
ms conocidas la KR20 y la KR21.
Se utiliza en instrumento en donde las contestaciones
son correctas o incorrectas.
Actualmente, un coeficiente ms utilizado es el
coeficiente alfa de Cronbach.
Se puede utilizar en cualquier tipo de instrumento.
La tcnica considera a
cada tem como un
subcuestionario separado
del cuestionario total.
Como esta propiedad de
paralelismo es
prcticamente imposible
para los temes, por lo
general el coeficiente alfa
de Cronbach subestima el
coeficiente de correlacin.
|
|
.
|

\
|

=

2
2
1
1
x
i
k
k
o
o
o
( )
1
2
2
2

=


n
n
x
x
o
Homogeneidad del grupo
El coeficiente de confiabilidad se afecta por la
variabilidad entre los sujetos. Mientras mayor es la
dispersin de las puntuaciones, mayor es la
confiabilidad.
Por lo tanto es posible que un cuestionario que se haya
construido con una poblacin heterognea muestre un
coeficiente de confiabilidad mucho menor cuando se
aplica a una poblacin ms homognea.
Homogeneidad del grupo
Es importante, cuando se adquiere un
instrumento construido para otra poblacin
asegurarse de que:
el coeficiente de confiabilidad se obtuvo con
una poblacin semejante a la que va a utilizar el
instrumento.
Tiempo
Si un cuestionario tiene un tiempo lmite para
completarse algunos sujetos van a terminar a
tiempo y otros no. Por lo tanto nos encontramos
ante otra variable que va a aumentar la dispersin
de puntuaciones en el cuestionario.
La varianza de esta variable "rapidez en responder"
se aade a la varianza de las puntuaciones y
aumenta la confiabilidad del instrumento.
Tiempo
La mejor estrategia es dar suficiente tiempo para
que todos o casi todos los sujetos puedan contestar
todos los temes.
La confiabilidad de los cuestionarios en los que la
rapidez para contestar es una variable importante,
debe ponerse en duda.
Tamao del cuestionario
Mientras ms largo es el instrumento, mayor es la
confiabilidad. Esto ocurre por dos razones principales:
En un cuestionario ms largo la muestra de temes es
mayor y el universo del constructo est mejor
representado.
La varianza de un cuestionario aumenta cuando aumenta
el nmero de temes. Por lo tanto mientras ms temes,
ms varianza y por lo tanto ms confiabilidad.
Cuando hay varias partes en un cuestionario y se calcula la
confiabilidad de cada subparte, estas por lo general son
bajas, pues dependen de muy pocos temes.
Sujetos
temes
Total
I II III IV V
A 5 4 5 5 5 24
B 3 2 4 4 2 15
C 4 2 4 5 5 20
D 3 4 2 2 2 13
E 5 4 1 3 3 16
Varianza 1 1.2 2.7 1.7 2.3 19.3