Vous êtes sur la page 1sur 10

Validez y fiabilidad

Un test debe poseer validez y fiabilidad para considerarse un instrumento


objetivo de medición.
Estos dos factores están estrechamente ligados, ya que un instrumento no
puede ser válido si no es al mismo tiempo fiable. Examinemos algunas
modalidades en relación a la validez y fiabilidad, descritos por Anastasi.
Fiabilidad significa la estabilidad o consistencia de la puntuación, obtenida
por una persona, en diferentes momentos en que se le aplique el mismo
test. Por ejemplo, si una persona obtiene un CI de 110 en una ocasión y
días después 80 al repetir el test, es obvio que esas puntuaciones ofrecen
poca confianza y por ende, el instrumento de medida utilizado carece de
fiabilidad. Cuando se dice que un test es fiable se supone que su diseñador
ha tenido en cuenta todos los indicadores que aseguran tal aseveración.
Citamos algunos de los aspectos a tener en cuenta en la fiabilidad de un
test:
Estabilidad temporal: en el ejemplo anterior la fiabilidad del test utilizado
para medir el CI se ve afectada por lo que se denomina estabilidad
temporal.
La estabilidad temporal indica el grado en que las puntuaciones de un test
quedan afectadas por las fluctuaciones diarias que se producen en el sujeto
o en el ambiente en que se aplica el test. La estabilidad temporal de un test
depende parcialmente de la longitud del intervalo sobre el que se mide.
Algunos tests muestran elevada fiabilidad tras períodos cortos, pero cuando
el intervalo de aplicación se extiende en el tiempo se observa una falta casi
absoluta de correspondencia entre las puntuaciones obtenidas en los dos
momentos diferentes. Ejemplo de ello son algunos test que miden CI en
etapa pre-escolar, que arrojan medida de estabilidad moderada dentro del
período preescolar pero que no permiten hacer predicciones de los CI del
último período de la niñez o de otras etapas posteriores de la vida.
Desviación resultante por insuficiencia del suelo en el "test".

Para cualquier tipo de sujeto, el intervalo de repetición de los tests rara vez
debe pasar de los 6 meses. En intervalos de tiempo largos es muy posible
que las condiciones de vida en las cuales se desempeña un sujeto
cambien, al punto tal que su rendimiento en los test puede mejorar o
empeorar, en relación a él mismo o en comparación con sujetos de su
misma edad, a causa de circunstancias como pueden ser: desarrollo de
habilidades por algún oficio, condiciones de su hogar o comunidad o por
otras razones como una enfermedad o trastorno emocional. Factores de
este tipo hacen necesario realizar nuevas evaluaciones en personas que ya
fueron evaluadas con anterioridad.
Fiabilidad del examinador para la aplicación y la calificación. En este
sentido casi todos los tests proporcionan procedimientos tipificados para su
aplicación y puntuación que permiten pensar que la fiabilidad del
examinador para la aplicación y calificación es alta a los fines prácticos.
Lo único a vigilar es asegurarse de que se sigue con cuidado los
procedimientos prescritos. El problema reside en el control empírico de las
condiciones bajo las cuales el test debe ser aplicado.
La validez se refiere al grado en que el test mide lo que pretende medir. De
igual forma existen varios procedimientos para determinar la validez de un
test:
- Validez de contenido. Se refiere al examen sistemático del contenido
del test para determinar si comprende una muestra representativa de
la forma de conducta que ha de medirse.
- Validez predictiva. Indica la efectividad del test en la predicción de
algún resultado futuro.
- Validez concurrente. La relación entre las puntuaciones del test y los
índices de status del criterio obtenido, aproximadamente al mismo
tiempo, se conoce como validez concurrente. Ejemplo, las
puntuaciones altas obtenidas en un test de inteligencia por un grupo
de estudiantes universitarios se contrastan con los buenos resultados
académicos obtenidos por estos. Esta convergencia entre los
resultados del test y la acumulación de notas ofrecen lo que se llama
validez concurrente.
- Validez de elaboración o de hipótesis de trabajo. La validez de
elaboración de un test es el grado en que este mide una elaboración
teórica o rasgo.

Contenido Adicional: (https://es.slideshare.net/MarielaNuez4/validez-y-


confiabilidad-32642343)

1. Análisis del instrumento.- Para que un instrumento de medición


pueda ser óptimo al momento de su aplicación, es necesario que
cumpla los siguientes principios: Validez y Confiabilidad. El rigor y la
calidad para evaluar el aprendizaje dependen, fundamentalmente, de
cómo se aborde la validez y la confiabilidad, cualidades esenciales
que deben estar presentes en el desarrollo del proceso de recoger y
analizar la información conducente a garantizar una mayor confianza
sobre las conclusiones emitidas, de manera individual y compartida,
por el evaluador. Tanto la validez como la confiabilidad se conjugan
para coadyuvar al evaluador a ser objetivo en el proceso de describir
la realidad derivada de un aprendizaje específico, el cual está
inmerso en un discurso privado y que pretende ser público a través
de la comunicación. La validez y la confiabilidad se abordan desde
diferentes perspectivas, dependiendo de la aproximación
epistemológica considerada. Factores a evitar para que el contenido
de un instrumento de Factores a evitar para que el contenido de un
instrumento de medición sea válido:
- No dar instrucciones empíricas o vagas
- Estructura sintáctica de oraciones fáciles
- Evitar preguntas inadecuadas sobre especificaciones Evitar
preguntas que sugieren respuestas
- Evitar ambigüedad en formulación de los reactivos o preguntas
que lleven a diferentes interpretaciones
- No presentar cuestionarios, escalas o pruebas demasiado
cortos
- Evitar que los ítems sean incongruentes con variables a medir
- Evitar ordenamiento inadecuado de ítems Evitar improvisar
- Evitar tomar instrumentos validados en otros contextos

2. Análisis del Instrumento-. Requisitos que debe cumplir un


Instrumento de Medición:
- Validez
- Confiabilidad
- Objetividad

3. Definición según diversos autores:

De acuerdo con Hernández, Fernández y Baptista (1998),”la validez


en términos generales, se refiere al grado en que un instrumento
realmente mide la variable que pretende medir”
Tamayo y Tamayo (1998) consideran que validar es “determinar
cualitativa y/o cuantitativamente un dato”

Según Rusque M (2003) “la validez representa la posibilidad de que


un método de investigación sea capaz de responder a las
interrogantes formuladas.

4. Validez-.Un instrumento de recolección de datos es válido cuando


mide lo que se supone debe medir en términos de contenido,
predicción, concurrencia y construcción. Campbell y Stanley (1972)
distinguen dos tipos de consideraciones para la validez cuantitativa:
la validez interna y la externa, definidas así:
- La validez interna: Se refiere al mayor o menor control que
tenemos de variables que pueden perturbar los resultados.
Ocurre cuando se puede asegurar que los cambios de la
variable dependiente se deben a los cambios de la o las
variables dependientes.
- La validez externa: Se refiere a la posibilidad de que los
resultados obtenidos en una muestra puedan ser generalizados
a la población o universo del cual fue seleccionada; así como
que puedan ser generalizados a un ambiente diferente de su
ambiente originario.

5. Validez en la Investigación Cuantitativa

La validez cuantitativa, bajo la perspectiva de la teoría positivista, se


orienta fundamentalmente hacia las técnicas e instrumentos de
medición elaborados por el evaluador, supuestos desarrollados a
partir de las teorías planteadas por el filósofo francés Auguste Comte
(1798-1857). En esa perspectiva, la validez asociada a la evaluación
del aprendizaje se concibe en términos de: (a) precisar el rasgo del
aprendizaje del evaluado que se pretende medir, como aprendizaje a
través de pruebas o tests, (b) predecir algún rasgo del aprendizaje
adicional a lo que se pretende medir, y (c) medir lo que se dice de
pruebas o tests, medir de cierto rasgo (Comte, 1896). Este tipo de
evaluación presenta diferentes interpretaciones de validez, referidas
a pruebas o tests, establecidas en los Estándares para Tests y
Manuales para Educación y Psicología (American Psychological
Association –APA-, 1985)

6. Validez de Contenido:

Está representada por el grado en que una prueba representa el


universo de estudio. Por tal motivo, deberán seleccionarse los
indicadores e ítems de tal manera que estos respondan a las
características peculiares del objeto de estudio. También se puede
señalar que se refiere a la fidelidad con que los ítems contenidos en
una prueba reflejan el constructo que se desea medir.

Por Ejemplo: Una prueba de operaciones aritméticas no tendría


validez de contenido si sólo incluye problemas de resta y excluye
problemas de suma, multiplicación y división. Si el dominio de un
instrumento es demasiado estrecho con respecto al dominio de la
variable, el primero no representará a esta.

Entendiéndose como Constructo cualquier entidad hipotética de difícil


definición dentro de una teoría científica. Un constructo es algo de lo
que se sabe que existe, pero cuya definición es difícil o
controvertida. Son constructos la inteligencia, la personalidad.

Debe hacerla un experto, pues, estos evalúan lo siguiente:

a. Si está elaborada adecuadamente la matriz de consistencia, es


decir, si el problema está formulado de acuerdo a sugerencias de la
investigación científica
b. Si los objetivos son explícitos y precisos
c. Si las variables e hipótesis tienen coherencia con objetivos y
problemas
d. Si se han desagregado las variables en dimensiones, indicadores e
ítems (operacionalización correcta de variables)
e. Si ítems del instrumento representan adecuadamente a las
variables que se pretenden medir
f. Si los ítems son suficientes
g. Si el protocolo de instrucciones del instrumento es claro

7. Validez de criterio:

Llamada también validez concurrente es más fácil de estimar, lo


único que se debe hacer es correlacionar su medición con el criterio,
y este coeficiente se toma como coeficiente de validez. Un
instrumento posee validez predictiva cuando es capaz de predecir, a
partir de los resultados que arroja, comportamientos futuros.

Ejemplo: supongamos que Fernando trata de medir el grado en que


es aceptado por Laura. Entonces decide que va a tomarla de la mano
y observará su reacción. Supuestamente, si ella no retira la mano,
esto indicaría cierta aceptación, pero para asegurarse que su
medición es válida decide utilizar otra forma de medición adicional,
por ejemplo, mirarla fijamente sin apartar la vista de sus ojos, en
apariencia, si Laura le sostiene la mirada, esto sería otro indicador de
aceptación. Así, su medición de aceptación se valida mediante dos
métodos al comparar dos criterios.

La validez de criterio es una medida del grado en que una prueba


está relacionada con algún criterio. Es de suponer que el criterio con
el que se está comparando la prueba tiene un valor intrínseco como
medida de algún rasgo o característica. En este tipo de validez, se
debe predeterminar cuál será el rasgo o criterio que se va a
correlacionar con los resultados de la prueba. Ambos valores deben
estar directamente relacionados en de que el rasgo o criterio empírico
sea pronosticable lógicamente a partir de los resultados de la prueba
a la cual se le va a medir su nivel o grado predictibilidad. Al igual que
toda prueba de correlación, si los resultados se acercan a 1, mejor
será la validez de criterio del instrumento en cuestión.

8. Validez de constructo:

Este tipo de validación busca establecer hasta qué punto un


instrumento mide una variable que es producto de un constructo que
intenta describir una realidad compleja. Es el caso, por ejemplo de
variables como “actitudes hacia discriminación racial”, “satisfacción
en el trabajo”, “clima organizacional”, que suponen cualidades
hipotéticas que explican la conducta de los sujetos. Caso contrario
sucedería con la medición de variables no complejas como “sexo”,
“edad”, “nivel de instrucción”, cuya medición no amerita la
construcción de un concepto complejo, ya que son datos
directamente observables en la realidad. Este tipo supone como paso
previo la conceptualización del rasgo o variable que se pretende
medir. Estos conceptos deben ser construidos a partir de una teoría
determinada que explique el fenómeno a estudiar. Sólo así se tendrá
claridad de la manera como se manifiesta en la realidad el atributo
que se pretende medir (Ruíz, 2002). El cuadro de operacionalización
de variables permitirá visualizar de manera organizada la complejidad
de las variables que se van a estudiar si alguna de ellas supone la
combinación de determinados indicadores en virtud de la
conceptualización realizada, es necesario corroborar a través de una
prueba empírica que tal conceptualización es válida, ya que expresa
de manera precisa el comportamiento de la variable en la realidad.
De allí, la expresión “Validez de constructo”. En última instancia, lo
que se pretende a partir de este tipo de validez es confirmar en la
práctica la capacidad explicativa del concepto que se ha construido.
Es decir, si es reflejo del fenómeno que pretende describir. Para este
tipo de validez se utilizan métodos de carácter estadístico.

Prueba de correlación: otra de las pruebas para validar el


constructo teórico de un instrumento es la prueba correlacional.
Consiste en correlacionar los valores obtenidos en la prueba piloto
del instrumento que se diseñado, con medidas obtenidas en estudios
similares con otros instrumentos que fueron construidos para medir
las mismas variables. Otro procedimiento es correlacionar los valores
obtenidos por el instrumento que se está validando con los obtenidos
por otras variables cuyo comportamiento está directamente asociado
a la variable en estudio y, por lo tanto, hipotéticamente predecible.

9. La confiabilidad se refiere al nivel de exactitud y consistencia de los


resultados obtenidos al aplicar el instrumento por segunda vez en
condiciones tan parecida como sea posible.

Bernal (2000:218) afirma que la pregunta clave para determinar la


confiabilidad de un instrumento de medición es: Si se miden
fenómenos o eventos una y otra vez con el mismo instrumento de
medición, ¿Se obtienen los mismos resultados u otros muy similares?
Si la respuesta es afirmativa, se puede decir que el instrumento es
confiable.

La importancia de garantizar la confiabilidad del instrumento viene


dada por el hecho de que las interpretaciones sobre el
comportamiento de los fenómenos estudiados se hacen sobre la
base de la confianza que se tenga en los datos recolectados. Si no se
ha demostrado la confiabilidad del instrumento, siempre habrá un
margen de duda sobre la calidad de la interpretación que se haga a
partir de los datos obtenidos.
La Fiabilidad tiene dos grandes componentes:

- La Consistencia interna: Se refiere al grado en que los distintos


ítems, partes o piezas de un test miden la misma cosa. Significa la
constancia de los ítems para operar sobre un mismo constructo de un
modo análogo.

- La Estabilidad temporal: Se refiere al grado en que un instrumento


de medida arrojará el mismo resultado en diversas mediciones
concretas midiendo un objeto o sujeto que ha permanecido
invariable.

INTEGRANTES:

Rudy Ricardo Torres Gallegos

Maclean Tohala Condori

Leonel Centeno Benegas

Diana Mamani Escobar

Dianyela Zeballos Flores

Edwin …..

Vous aimerez peut-être aussi