Vous êtes sur la page 1sur 13

Elementos tericos de Confiabilidad, Validez y el Error en Medicin

Las dos caractersticas bsicas para que un instrumento de medicin sea


considerado como "bueno", se centran en que debe ser confiable (medir lo que
debe medir, es decir, consistente) y vlido (medir lo que tiene que medir).

Confiabilidad

La confiabilidad de un instrumento de acuerdo con Polit y Hungler (1997) es el


grado de congruencia con el que se mide el atributo que supuestamente se debe
medir. Otra forma de definirla es sealar que el instrumento es exacto, es decir, es
confiable si sus mediciones reflejan con precisin los valores verdaderos del
atributo que se investiga.

Para conocer sus caractersticas bsicas se deben cubrir dos criterios:

1. El instrumento debe medir le rasgo que debe medir, y

2. Se deben obtener los mismos resultados al volver a medir el rasgo bajo


condiciones similares del individuo en cuestin.

En el proceso de la investigacin, la informacin recopilada adems de ser vlida,


debe de ser confiable, esto es, que los instrumentos deben generar resultados
similares cuando se aplican a la poblacin objeto de estudio en situaciones
similares o al mismo grupo en una segunda ocasin.

La confiabilidad suele medirse con un coeficiente de confiabilidad en donde se


debe cuidar la estabilidad y la equivalencia y la congruencia interna de las
mediciones realizadas en el instrumento.

1) Estabilidad

Se refiere al grado en que pueden obtenerse los mismos resultados en


aplicaciones repetidas. Es importante considerar la influencia de factores extraos
que pueden variar la medicin del instrumento de una aplicacin a otra (por
ejemplo, los cambios de estado de nimo, las conductas, los conocimientos, el
recordar las respuestas de alguna aplicacin previa, etc.)

La comparacin de las mediciones se realiza mediante un coeficiente de


confiabilidad.

El coeficiente de confiabilidad suele ser ms alto si la segunda prueba es


efectuada a corto plazo que si lo es a largo piazo (lapso mayor de uno o dos
meses). Los ndices de estabilidad resultan ms adecuados para la medicin de
caractersticas perdurables corno la personalidad, las aptitudes o algunos atributos
fsicos como la estatura. Uno de los mtodos ms utilizados para valorar la
estabilidad de un instrumento es el test-retest.

Test-test. Mtodo consistente en aplicar una medida (instrumento) a la misma


persona en dos ocasiones y comparar luego los resultados, esperando que stos
sean similares (que tengan una alta correlacin)

Equivalencia

Este mtodo de confiabilidad se puede utilizar cuando diferentes observadores o


investigadores utilizan un mismo instrumento para medir simultneamente el
mismo fenmeno o cuando se aplican a la par dos instrumentos que, se presume,
son paralelos. La finalidad radica en determinar la consistencia o equivalencia de
los instrumentos para proporcionar mediciones de los mismos atributos en los
mismos sujetos. El mtodo compara una observacin vs una medicin, o una
observacin vs otra observacin o una medicin vs otra medicin del mismo
fenmeno, si la escala es confiable, ambos deben recibir puntuaciones similares.

Congruencia interna

Este es el mtodo ms utilizado por los investigadores, ya que slo requiere de


una aplicacin y valora una de las ms importantes fuentes de error en la
medicin, el muestreo de reactivos. Uno de los mtodos ms antiguos y ms
utilizados comnmente para evaluar la congruencia interna es la tcnica de
divisin por mitades.

a) Mtodo de Divisin por mitades. Consiste en dividir una escala o una prueba
en dos mitades y se comparan entre s. La comparacin se realiza uniendo los
reactivos pares en un grupo y los nones en otro, y compararlos. Los puntajes de
ambas mitades deben resultar similares si la escala guarda confiabilidad.

La divisin por mitades es un procedimiento para estimar el coeficiente de


precisin de un instrumento. Si se le da a la mitad del instrumento la misma media
y la misma dispersin de puntajes, entonces es un instrumento homogneo y se
obtiene un coeficiente de equivalencia; ste, ser la mejor estimacin aproximada
del coeficiente de precisin del instrumento.

En suma, la metodologa de divisin por mitades puede usarse para estimar la


precisin de un instrumento, la cual se estima empricamente por el coeficiente de
equivalencia. Este puede computarse para instrumentos homogneos entre los
reactivos pares e impares colocados al azar o en orden de dificultad. Para
instrumentos heterogneos, el coeficiente de equivalencia debera computarse con
las mitades del instrumento igualadas, en las que los reactivos han sido igualados
no slo en dificultad sino tambin en contenido.
Si bien este procedimiento es bueno, suele subestimar de manera sistemtica la
confiabilidad de la escala en su conjunto, para evitar este tipo de errores es
importante considerar la frmula de Spearman-Brown, ya que toma en cuenta al
total de reactivos.

b) Mtodo de Spearman-Brown. Se computa el coeficiente de correlacin entre


los puntajes de las dos mitades de un mismo instrumento. Este coeficiente de
correlacin puede considerarse como el coeficiente de confiabilidad de una de las
mitades, entonces se supone que las dos mitades son paralelas y se estima el
coeficiente de confiabilidad para el instrumento completo por medio de la frmula
de Spearman-Brown.

Existen 2 mtodos de Divisines. Uno propuesto por Rulon y otro por Gutman.
Rulon propone un mtodo que no supone varianzas iguales en los sub test,
mientras que Gutman calcula los lmites inferiores para la confiabilidad
determinada por 6 coeficientes de fiabilidad.

La confiabilidad Split-Half se refiere a los resultados divididos en 2 mitades


comparativas, as se obtienen2 calificaciones y se correlacionan los reactivos.

El anlisis de confiabilidad interna de un instrumento se lleva por 2 mtodos:

-Mtodo Kunder-Richardson (Kr20): Kunder-Richardson lo fundamentaron. Si un


instrumento se considera formado por tantos instrumentos paralelos como
reactivos tenga, de manera que cada pregunta es tratada como paralelos a los
dems reactivos. Todas las preguntas y reactivos tienen lo misma media y
varianza. Uso de los mtodos de Divisiones anteriores.

Mtodo Alfa de Cronbach: Surge en 1972, gracias a Cronbach y su equipo. Hay


una mayor correlacin de inter-elementos promedio. Posibilidades de generalizar
de un conjunto a otro conjunto que representa la misma poblacin. Distincin
entera estudios G (estimacin de la confiabilidad del instrumento generalizado), y
estudios D (medida de la confiabilidad de las decisiones que pueden hacerse
acerca de un individuo o grupos)

Los datos con los que se pueden llevar a cabo anlisis de confiabilidad pueden ser
dicotmicos, ordinales o de intervalo, pero deben estar codificados
numricamente. El supuesto bsico para realizar cualquier anlisis de validez es
que "cada par de elementos debe tener una distribucin normal bivariada".

VALIDEZ

Cuando se construye un instrumento interesa primordialmente saber si tiene alta


validez. La confiabilidad tambin interesa como condicin necesaria para
mediciones vlidas. Una alta confiabilidad es un requisito necesario, pero no
suficiente para una alta validez. La validez denota el grado en que un instrumento
mide lo que se propone que debe de medir (Pick, 1994).

Es muy difcil obtener medidas de criterio no ambiguas que representen


exactamente la variable criterio que se desea medir. Por tanto, se debe distinguir
entre los criterios "verdaderos" y los intermedios disponibles. Existen distintos
procedimientos para determinar la validez de un instrumento, los principales tipos
de Validez son los de constructo, los de contenido y los de criterio.

VALIDEZ DE CONTENIDO

Se refiere al contenido del instrumento. Para saber si un instrumento tiene validez


de contenido, es porque abarca adecuadamente diversas preguntas del rasgo que
se pretende conocer. Es el grado en que los reactivos de una prueba evalan el
dominio que sta pretende cubrir. Antes de que pueda estimarse la validez de
contenido, es necesario definir explcitamente los criterios a considerar para
evaluar la variable criterio. La validez de contenido no puede expresarse por un
coeficiente de validez"

Este tipo de validez describe la adecuacin del muestreo del rea de contenido
que se pretende medir. Cobra particular importancia para aquellos que disean
una prueba con objeto de medir los conocimientos acerca de un tema de
contenido especfico. Se basa necesariamente en el criterio del investigador, pues
no existen mtodos que sean por completo objetivos para garantizar una
adecuada cobertura de contenidos Siempre es posible recurrir a expertos en el
rea de contenido a fin de analizar los reactivos y determinar si representan
adecuadamente y en las proporciones correctas el hipottico universo de
contenido. Un subtipo de validez de contenido es la Validez Nominal.

a) Validez Nominal. Apariencia de que una medida de algo es vlida; una medida
que "se ve bien" para un observador externo. Representa una forma de validez de
contenido.

VALIDEZ DE CRITERIO
Esta validez tiene carcter pragmtico, no busca cerciorarse de que tan bien mide
un atributo terico un instrumento, sino establecer la relacin entre este y algn
otro criterio. Es la relacin de las calificaciones de la prueba con otras medidas de
la misma caracterstica.

Se dice que el instrumento es vlido si sus resultados presentan una alta


correlacin con otro criterio. Por ejemplo, si la medicin del uso de
anticonceptivos entre adolescentes con vida sexual activa tiene una estrecha
correlacin con los embarazos premaritales, podra sostenerse que la validez de la
medicin es satisfactoria.

Existen 2 tipos de validez de criterio:

a) Validez Predictiva: Es la capacidad de una medida para predecir una


conducta o atributo, su objetivo es predecir cierto resultado despus de un
tiempo dado en variables de criterio medidas en los individuos de inters.
b) Validez de Concurrente: Correlacin de una prueba en el comportamiento
presente o con otras pruebas o medidas existentes. Denota la capacidad de
un instrumento para distinguir a los individuos que difieren en su condicin
actual respecto a un criterio.

VALIDEZ DE UN CONSTRUCTO.

De una teora pueden derivarse ciertas consecuencias prcticas acerca del


resultado del instrumento bajo ciertas condiciones, y estas consecuencia pueden
probarse si los resultados son los esperados, en este caso se comprueba una
validez con anlisis lgico y en la prueba de las relaciones predichas con base en
las consideraciones tericas

Caractersticas del anlisis

a) Un mtodo para determinar la validez del constructo es la tcnica de grupos


conocidos (grupos que difieren del atributo crtico a causa de unas
caractersticas conocidas).
b) El estudio de los resultados del test son influidos por el cambio de los
individuos en donde el medio influye o deja de influir en las posiciones del
individuo sobre un continuo.
c) La correlacin entre test que miden la variable no deben surgir como
resultados de semejanzas en el mtodo.
d) Las partes del test deben tener alta intercorrealcin para que se mide una
variable unitaria.
e) EL mtodo de matrices de caractersticas y mtodos mltiples se basa en
la convergencia (resultados similares en la medicin de un concepto por
distintos mtodos) y la discriminacin (capacidad de distinguir entre un
constructo conceptual de otros similares).
f) Anlisis factorial: anlisis estadstico que sirve para identificar grupos o
conglomerados con variables relacionadas, cada grupo se llama factor y
representa un atributo relativamente.

OTROS CRITERIOS PARA EVALUAR LAS MEDICIONES CUANTITATIVAS

Adems de considerar la confiabilidad y validez en un instrumento para medir, hay


otros criterios y no menos importantes.

Eficiencia: El tiempo invertido en responder un instrumento, as como el nmero


de reactivos son un parmetro de eficacia, es decir un instrumento que se
contesta en 10 min. Es ms eficaz que uno que mide el mismo atributo en 30 min.
Un instrumento que tarda ms es mayormente confiable que un instrumento que
tarde poco tiempo, pero pudiera ser poco til.

Sensibilidad: Se refiere a la medida en que un determinado instrumento detecta y


mide de modo confiable las ms pequeas variaciones de un atributo.

Existen tambin otros criterios que estn directamente vinculados con la


confiabilidad y la validez.

Objetividad. Es indispensable que un instrumento suponga una mnima posibilidad


de desacuerdo entre dos o ms investigadores independientes que lo aplicarn
para medir un mismo fenmeno.

Comprensibilidad. Tanto el investigador como el sujeto deben ser capaces de


comprender los procedimientos requeridos para garantizar mediciones precisas.

Equilibrio. El diseador del instrumento debe intentar obtener una medicin


equilibrada a fin de reducir la posibilidad de sesgos de series de respuestas y
facilitar la validez de contenido.

Rapidez. Se debe otorgar el tiempo adecuado para obtener mediciones completas,


sin que se apresurase el proceso de medicin.

Unidimensionalidad. Toda herramienta de medicin debe disear de forma tal que


produzca puntajes separados para cada concepto unitario. Un reactivo slo debe
medir un atributo y no ms.

Rango. El instrumento debe ser capaz de medir de forma significativa los valores
esperados de la variable, desde el ms pequeo hasta el ms grande.

Linealidad. El investigador busca construir mediciones que tengan la misma


precisin y sensibilidad en el rango total de valores.
Razn entre seal y ruido. En las mediciones fisiolgicas deben utilizarse
instrumentos y procedimientos que minimicen interferencias.

Reactividad. En el grado de lo posible el instrumento no deber afectar el atributo


que se mide.

Simplicidad. En el caso de que las anteriores caractersticas se cumplan, debe


corroborarse que el instrumento sea simple y no complejo para minimizar el riesgo
de error.

ERROR EN LA MEDICIN

En la elaboracin de un instrumento pueden presentarse diversas situaciones que


conlleven al error de medicin de una variable
No sistemticos (al azar) afectan la confiabilidad.
Al grado de consistencia que se logra al medir un atributo o consistencia, Qu
tanto de lo que se mide mediante la observacin en real?
Sistemticos (constantes) afectan la validez.
Identificar cules son los factores que una medicin sea poco constante.

Para medir el grado de error al medir un atributo o caracterstica se calcula a


travs de una ecuacin matemtica

Calificacin de 1: Lo observado es lo real, no hay error, si lo hay el valor es menor


a la unidad.

2 = 2 + 2

Varianza de las calificaciones obtenidas es igual a la varianza de las


calificaciones reales ms la varianza de error.

2 2 2
= =
2 2
2
= 1
2

Una variable introduce un error: No tiene que ver con las finalidades de la
medicin (confiablidad), si produce faltas de consistencia en las calificaciones de
una situacin a otra (validez)
Thorndike seala que los factores de error especfico varan de aun grupo
examinado, el tipo de prueba y las condiciones en que se realiza son fuentes
comunes de error

Las causas donde es ms frecuente que se caiga en error en el momento de


medir son tres:
1) Errores dentro de la prueba

La ambigedad en la reaccin de un reactivo, los reactivos difciles que hacen que


el sujeto tenga que adivinar, las instrucciones poco claras para dar una respuesta,
los lmites de tiempo restrictivo que fomentan apresuramiento en la lectura y en la
respuesta, la extensin propia de la prueba.

2) Aplicacin del instrumento

La falta de comprensin en las instrucciones, errores de marcaje en las horas de


respuesta (poca calidad en la impresin de las hojas), errores en el registro
tiempo, interrupciones inesperadas y otras distracciones son motivo de la
generacin de errores. Esto se observa ms cuando las pruebas tienen
instrucciones o procedimientos complejos, cuando se somete a ellos a grupos
grandes de personas, cuando los aplicadores no tienen claros los procedimientos,
as como el lugar donde se aplica (poca luz, poca ventilacin, etc.)

3) El examinado

Las causas de error ms difciles de controlar son las inherentes al sujeto


examinado. A pesar de que existan instrumentos de alta calidad, instrumentos
claros y condiciones inmejorables para su aplicacin, las caractersticas propias
del individuo puede an generar errores en la medicin.

Algunas situaciones estn relacionadas con cambios propios del individuo


profundos y a largo plazo, otras son factores transitorios asociados con influencias
especficas a mediano o corto plazo (enfermedad, atencin, estado de nimo)

a) Motivacin. Las condiciones motivacionales en las que se encuentra un


sujeto antes de contestar una prueba son un elemento importante a
considerar para evitar el error en medicin.

b) Aprendizaje, desarrollo y educacin. Todas las pruebas miden lo que el


sujeto ha aprendido en el curso de su vida, por lo que la experiencia de
determinado atributo o caracterstica por parte de quien responde puede
producir errores.

c) Experiencias con las pruebas. De la misma forma, cuando una persona


tiene o ha tenido una experiencia previa al contestar algunas pruebas, o
con algunos materiales o conocimientos.

d) Ansiedad de vida a las pruebas. Ante un elevado malestar, tensin, nervios


o molestia por la realizacin de una prueba que puede aumentar los errores
en la medicin.
e) Direccin. El que un individuo busque asesora para dar respuesta a una
prueba es un factor que hay que considerar con relativa cautela, ya que
esto puedo influir en algunos aspectos de la medicin y propiciar error.

f) Variables fisiolgicas. Estar enfermo, desvelado, o con cierto malestar


puede ser generador de error en la medicin.

Otro de los componentes bsicos en la medicin consiste en ocuparse en


identificar:

1. Qu es lo que la prueba mide y

2. Hasta qu punto mide lo que dice medir. Estos son los temas fundamentales
relacionados con la validez.

La validez se define como la proporcin de la varianza real que es relevante


(atribuible a la variable que se mide) para los fines de la prueba. Por ello tambin
se define como 1) la extensin con que la prueba mide un rasgo subyacente
hipottico o construccin o bien, 2) la relacin entre las calificaciones de la prueba
y alguna medida de criterio externo.

LA HOMOGENEIDAD Y LOS PROBLEMAS ESPECIALES DE LA


CONFIABILIDAD

La consistencia a travs del tiempo (estabilidad) y a lo largo de varias pruebas


(equivalencia) son los elementos fundamentales de la confiabilidad, el tercer
elemento es la congruencia interna.

HOMOGENEIDAD
Se utiliza este trmino al referirse a la consistencia que se ocupa de la estructura
interna de una prueba, esto es, el grado en que estn relacionados
recprocamente los reactivos de una prueba correlacionados positivamente.

TEORA DEL DOMINIO-MUESTRA

Para desarrollar una prueba debe hacerse un muestreo al azar de reactivos


tomados de ese dominio (o por lo menos eso debera intentarse), as, cualquier
prueba psicolgica puede ser considerada, se pueden realizar cualquier nmero
de pruebas psicolgicas paralelas que midan la construccin que interesa.
Al hablar de reactivos en la teora de Dominio-muestra, equivale al hablar de una
prueba psicolgica debido a que, una prueba Psicolgica es una muestra al azar
de reactivos. Este mtodo se basa en ideas tericas especficas ms que en la
relacin entre formas de pruebas psicolgicas construidas empricamente.
Medidas de Homogeneidad: ndices de la consistencia interna de una prueba
psicolgica.

Se mide el grado de correlacin de los reactivos.

ndices de Homogeneidad: Estos hacen hincapi en la estructura interna.

ndices de Confiabilidad: Correlacin entre las calificaciones obtenidas en la


prueba; es la correlacin promedio.
CUESTIONARIO

1. Cules son las dos caractersticas bsicas para que un instrumento


de medicin sea considerado bueno?

Tiene que ser vlido y confiable

2. Cul es la definicin de Polit y Hunger de confiabilidad?

Grado de congruencia con el que se mide el atributo que supuestamente se debe


medir.

3. Qu se debe cuidar en el Coeficiente de Confiabilidad?

La estabilidad y la equivalencia.

4. Qu es la estabilidad?

Se refiere al grado en que pueden obtenerse los mismos resultados en


aplicaciones repetidas.

5. En qu consiste el mtodo de equivalencia?

Determina la consistencia o equivalencia de los instrumentos para proporcionar


mediciones de los mismos atributos en los mismos sujetos. El mtodo compara
una observacin vs una medicin, o una observacin vs otra observacin o una
medicin vs otra medicin del mismo fenmeno, si la escala es confiable, ambos
deben recibir puntuaciones similares.

6. Qu es el mtodo de divisin por mitades?

La divisin por mitades es un procedimiento para estimar el coeficiente de


precisin de un Instrumento.

7. Qu es la confiabilidad Split-half?

Son los resultados en 2 mitades comparativas, cuyo fin es la correlacin de


reactivos.

8. Cuntos mtodos existen para el anlisis de confiabilidad interna de


un instrumento? Menciona sus nombres.

Son 2, el Mtodo Kunder-Richardson y el mtodo Alfa de Cronbach.

9. Qu son los indicios de homogeneidad?


Son los indicios que hacen hincapi en la estructura interna

10. Segn Summer y Summer, 2001 Qu representa la validez?

Representa el grado en que un procedimiento produce informacin genuina y


creble.

11. A qu se refiere la validez de contenido?

Al contenido del instrumento.

12. Qu se necesita para que un instrumento de investigacin sea


vlido?

Que sus resultados presenten una alta correlacin con otro criterio.

13. Qu es la Validez predictiva?

Es la capacidad de una medida para predecir una conducta o atributo, su objetivo


es predecir cierto resultado despus de un tiempo dado en variables de criterio
medidas en los individuos de inters.

14. En qu consiste la Validez concurrente?

En la correlacin de un prueba en el comportamiento presente o con otras


pruebas o medidas existentes.

15. Qu tipo de errores en variables existen y que afectan?

Sistemticos afectan la confiablidad y no sistemticas afectan la validez.

16. En que se basa el test de caractersticas y mtodos mltiples?

En la convergencia y la discriminacin

17. Qu es el anlisis factorial?

Anlisis estadstico que sirve para identificar grupos o conglomerados con


variables relacionadas

18. Qu es el criterio de Objetividad?

Es indispensable que un instrumento suponga una mnima posibilidad de


desacuerdo entre dos o ms investigadores independientes que lo aplicarn para
medir un mismo fenmeno.
19. Menciona los 3 errores donde es ms frecuente caer, al momento de
medir.

Errores dentro de la prueba, en la aplicacin del instrumento y en el examinado.

20. Qu es el criterio de sensibilidad?

Se refiere a la medida en que un determinado instrumento detecta y mide de


modo confiable las ms pequeas variaciones de un atributo.

Vous aimerez peut-être aussi