Vous êtes sur la page 1sur 7

1

Confiabilidad y validez de los instrumentos


Por: Delgado de Smith, Yamile, Colombo Leyda y RosmelOrfila (2002). Conduciendo la Investigación.
Editorial Comala. Caracas.

Confiabilidad y validez de los instrumentos

La confiabilidad y la validez son cualidades esenciales que deben estar presentes en todos los
instrumentos de carácter científico para la recogida de datos. En palabras de Pérez (1998:71), si
el instrumento o instrumentos reúnen estos requisitos habrá cierta garantía de los resultados
obtenidos en un determinado estudio y, por lo tanto, las conclusiones pueden ser creíbles y
merecedoras de una mayor confianza.

Uno de los mayores problemas que se debe evitar, es que la información obtenida no le
permita responder a los objetivos de la investigación. Si los instrumentos no son validados,
podrá encontrar una variada información pero sin ninguna articulación con los propósitos y
compromisos asumidos en la investigación.

Expertos (Fendel, Kurt, Taylomir, Wintther) aseguran que la información insuficiente obtenida
en las investigaciones está vinculada a la elaboración incoherente e inconsistente de los
instrumentos de recopilación de datos. Muy probablemente, no fueron diseñados con agudeza y
pensando en todo momento en los objetivos y propósitos de la investigación

Ante tal situación, deberá realizar nuevos instrumentos de recolección de datos que responda a
sus objetivos, y la información que ya tiene de su primer esfuerzo no se pierde y con seguridad
serán un apoyo o refuerzo.

Un buen instrumento de recolección de datos o medición debe tener las siguientes cualidades:
confiabilidad y validez.

La confiabilidad se refiere al nivel de exactitud y consistencia de los resultados obtenidos al


aplicar el instrumento por segunda vez en condiciones tan parecida como sea posible.

Bernal (2000:218) afirma que la pregunta clave para determinar la confiabilidad de un


instrumento de medición es:

Si se miden fenómenos o eventos una y otra vez con el mismo instrumento de medición, ¿Se
obtienen los mismos resultados u otros muy similares? Si la respuesta es afirmativa, se puede
decir que el instrumento es confiable.

Es importante lograr la elaboración de un instrumento que sea confiable. Para ello, existen
muchas vías para lograrlo. Si se tratara de un cuestionario, se puede aplicar dos veces a la
misma persona en un corto período de tiempo, y seguidamente se utiliza el índice de Bellack:

 de los acuerdos x 100


Índice =
 (acuerdos + desacuerdos)

Se considera que el instrumento es confiable si el índice de Bellack resultante es superior al


umbral arbitrario de 80. Pourtois, J., Desmet, H.(1992:187)

Esta prueba se aplica a cualquier tipo de variable o dimensión objeto de estudio.


2

Otra manera para poder determinar si un instrumento es confiable es a través del cálculo de la
medida de estabilidad por la vía del test-retest. En este procedimiento un mismo instrumento
es aplicado en dos oportunidades o más a un mismo grupo de personas, después de cierto
período de tiempo. Si la correlación entre los resultados de las diferentes aplicaciones es
altamente positiva, el instrumento se considera confiable. El valor de la correlación es un valor
ubicado entre el –1 y 1.

muy baja (0) baja regular aceptable elevado(1)

No hay confiabilidad 100% de confiabilidad

El cálculo de este coeficiente se utiliza para mediciones de variables o dimensiones que


responden a una escala de medición de intervalo o razón.
Es importante que para la aplicación de esta prueba, se tome un lapso de tiempo lo
suficientemente largo para que los sujetos se olviden de lo que contestaron y, por el otro, no
tanto que se produzcan cambios importantes. (Pérez 1998:72). Este tipo de medición se utiliza
en investigaciones cuantitativas.

También el Coeficiente alfa de Cronbach permite determinar la confiabilidad; utilizando la


fórmula si el resultado es 0.80 o más se considera aceptable el instrumento.

p*

1+p* (N-1)

En donde N es el número de items y p* el promedio de las correlaciones entre ítems.

Para el cálculo de p*, deberá aplicar:

P
P*=
NP

En donde, P es la sumatoria de las correlaciones y NP el número de correlaciones no repetidas


o no excluidas.

El cálculo del coeficiente de confiabilidad Alfa de Cronbach se utiliza para mediciones de


variables o dimensiones que responden a una escala de medición de intervalo o razón.

La confiabilidad también se puede calcular mediante la aplicación de las ecuaciones de Rulon,


Guttman, Sperman-Brown, Kuder-Richardson (KD20) para elementos dicotómicos y (KD21) en
el caso de elementos con dificultad similar.

Adicionalmente a la confiabilidad de un instrumento, se debe buscar la validez del mismo. En


este sentido, el investigador realizará un esfuerzo dirigido a la elaboración de un instrumento
que mida lo que se desea medir.

Salkind (1998:126); Hernández (1998:242) clasifican la validez en: validez de contenido,


validez de criterio y la validez de constructo.
3

La validez de contenido está representada por el grado en que una prueba representa el
universo de estudio. Por tal motivo, deberán seleccionarse los indicadores e items de tal manera
que estos respondan a las características peculiares del objeto de estudio.

La validez de criterio, llamada también validez concurrente es más fácil de estimar, lo único
que se debe hacer es correlacionar su medición con el criterio, y este coeficiente se toma como
coeficiente de validez. La validez de criterio es una medida del grado en que una prueba está
relacionada con algún criterio. Es de suponer que el criterio con el que se está comparando la
prueba tiene un valor intrínseco como medida de algún rasgo o característica.

La validez de constructo determina a través del procedimiento de análisis de factores en qué


medida los resultados de una prueba se relacionan con constructos. Un constructo es un atributo
para explicar un fenómeno.

En el análisis de factores se generan “variables artificiales”, denominadas factores que


representan constructos, los factores se obtienen de las variables originales y deben ser
interpretadas de acuerdo con éstas. Se trata, de una técnica para explicar un fenómeno completo
complejo en atención de unas cuantas variables.

Todos los instrumentos de recolección de datos (cuestionarios, test, escalas, guías de


observación, pruebas de conocimiento, etc.) debe precisar de la validez de contenido, y ésta
consiste en hacer una revisión profunda de cada ítem que estructuran el instrumento.

Para Aroca, A. (1999: 29), la validez de contenido,denominada también “lógica” o de


“muestreo”. “Se refiere básicamente al contenido del instrumento, al hecho de que el
instrumento contenga en sus elementos o ítem todos y sólo los aspectos que, de
acuerdo a los objetivos de la investigación, sea necesario (sic) averiguar para el logro
de los mismos.”

Este procedimiento de carácter lógico-racional es determinante en la configuración del


instrumento, pues a través del mismo se desechan ítem o aspectos irrelevantes que de una u otra
manera restan sentido razonado a la intención concreta de búsqueda de datos; por otra parte, la
validez de contenido permite redimensionar aquellos ítem que en su primera versión se
consideran confuso o presentan errores de sintaxis y/o semántica y que, una vez corregidos las
disyuntivas a las que diera lugar, permitan obtener los datos e informaciones que se encuentran
especificada en cada uno de los propósitos de la investigación.

De esta manera, la validez de contenido es un procedimiento al que no puede obviarse cuando


se tiene el objetivo certero de realizar una investigación de gran envergadura, y en el caso muy
particular de la Gerencia de Recursos Humanos, los instrumentos de recolección de datos han
de condensar suficientes ítem como para poder apreciar de una manera totalizadora los
aspectos, factores y variables que se conjugan para estructurar el fenómeno objeto de estudio.

Debe tenerse siempre presente que el investigador del área de Recursos Humanos tiene ante su
mirada de inquisidor científico un universo de sujetos cuyas actuaciones se corresponden con
representaciones subjetivas y las mismas son objetivadas en actos y redes de actos los cuales se
constituyen en los posibles escenarios susceptibles de ser captados a través de medios
instrumentales diseñados para fines bien definidos.

Así, de lo que se trata es de advertir que los fenómenos sociales son de una complejidad tal que
todo investigador que se aventure a su aprehensión debe disponer de instrumentos de
recolección de datos bien construidos, y es por ello que la validez de contenido está destinada a
darle coherencia y sistematicidad a los ítems que conforman el instrumento diseñado.
4

Al decir de Aroca, A. (1999: 269), El método que más se utiliza para estimar la validez de
contenido es el denominado Juicio de Expertos, el cual consiste en seleccionar un número
impar (3 o 5) de jueces (personas expertas o muy conocedoras del problema o asunto que se
investiga), quienes tienen la labor de leer, evaluar y corregir cada uno de los ítems del
instrumento so pretexto de que los mismos se adecuen directamente con cada uno de los
objetivos de la investigación propuestos.

De acuerdo con las reflexiones de la autora antes citada, se consideran expertos o jueces
aquellos sujetos que reúnan las siguientes consideraciones:

a.- Formación académica en el área y rama del quehacer científico al que diera lugar;
b.- Comprobada trayectoria experiencial de investigaciones realizadas en institutos y centros
destinados para fines bien definidos;
c.- Desarrollo de una línea (o líneas) de investigación relacionada a intereses académicos;
d.- Poseer una amplia concepción epistemológica de la ciencia y de la investigación; y,
e.- Demostrar pleno dominio de la lengua castellana, pues la sintaxis, la semántica y la
sindéresis son aspectos determinantes para dar forma interna y externa al instrumento.

Tomando como base estas características que se consideran las más deseables que debe tener un
experto encargado de validar los instrumentos de recolección de datos, se hace saber que la
validez de contenido permite al sujeto investigador lograr la aprehensión lo más objetiva posible
de la esencia de los hechos y fenómenos que estudia, es decir, se establece un perfecto
relacionamiento entre los propósitos de la investigación y el alcance en el campo real donde se
experimentan los acontecimientos.

Ahora bien, ¿de qué manera procede un experto para validar los
instrumentos de recolección de datos?

Una vez que se diseña el instrumento de recolección de datos a partir del desglosamiento de los
objetivos específicos en su factor, definición, dimensiones e indicadores, el producto
materializado en dicha herramienta se corresponde con lo que muy bien puede llamarse una
primera versión, pues como se ha especificado antes debe procederse con la “calibración” donde
el juicio de experto se corresponde con una de ellas.

En manos del experto, la primera versión del instrumento sufrirá cambios superficiales o
profundos, los cuales son importantes que sean considerados por el investigador so pretexto de
que el instrumento de recolección de datos alcance la configuración y calidad deseada. Dichos
cambios pueden ser de índole de contenido, de redacción-semántica, sindéresis, correspondencia
con los objetivos planteados, pertinencia con el tipo de investigación, relación estrecha con una
realidad concreta.

Para proceder a la validación por juicio de expertos, es importante tener a la mano un


instrumento / formato diseñado exclusivamente para servir de guía operativa a los especialistas,
quienes lo emplearán para evaluar y valorar la primera versión del instrumento de recolección
de datos.

Los autores de la presente obra sugieren tomar en cuenta los siguientes aspectos a los
fines de realizar el formato guía para validación por parte del experto:

1.- Elaborar una carta dirigida al experto, a continuación un ejemplo:

Respetado experto, a continuación se le está proporcionando un instrumento cuyo propósito


consiste en que Usted lea, evalúe y corrija cada ítem que conforma el instrumento de
recolección de datos. Dichas correcciones son de vital importancia para dar la configuración y
5

calidad definitiva al mismo antes de su aplicación a la muestra de sujetos seleccionados para los
fines específicos de la investigación.

Sin más a que hacer referencia, y confiados en que sus observaciones serán de gran utilidad, se
suscriben de Usted,

2.- Solicitar datos del experto, a continuación un ejemplo:

Nombre y Apellido
Cédula de Identidad
Institución donde trabaja
Título (s) de Pregrado
Título (s) de Postgrado
Publicaciones

3.- Suministrar al experto los datos básicos de la investigación, a saber:

Título de la Investigación
Objetivo General
Objetivos Específicos
Variables o dimensiones que se pretenden medir
Tipo de Investigación
Población objeto de Estudio

4.- Especificar los aspectos a considerar para la valoración de cada Ítem:

Redacción
Pertinencia con los objetivos
Pertinencia con el tipo de investigación

5.- Retroalimentación del Experto:

Solicitar al experto que por escrito, emita sus opiniones en torno aquellos aspectos que se
deben mantener y los que sugiere modificar y/o incorporar, indicando lugar y fecha de
realización.

Anteriormente se explicó que el investigador que pretender validar el instrumento a


través de Juicio de Experto debe proceder con 3 o 5 jueces. Una vez que los jueces
proceden a examinar y evaluar cada ítem, se comparan los resultados; realizado este
procedimiento, se integran las correcciones y sugerencias a través de las cuales se
determina el instrumento definitivo el cual se aplicará a la muestra de sujetos
seleccionados.

Para quienes elaboran instrumento, Thomas Kuhn (1971:73) señala que el hombre
que construye un instrumento para determinar las longitudes de ondas ópticas no deberá estar
satisfecho con un equipo que se limite a atribuir números determinados a líneas espectrales
particulares. No es solo un explorador o un medidor, sino que por el contrario, mediante el
análisis de su aparato, deberá mostrar en términos del cuerpo establecido de teoría óptica, que
los números que muestra su instrumento son los que corresponden en la teoría como los de
longitud de ondas.

En Ciencias Sociales, la investigación de carácter cualitativo ha adquirido una gran relevancia


desde la mitad del siglo XX, y son muchos los investigadores sociales que se suman por esta
vía de acercamiento a la realidad, por considerarla una mejor opción para la compresión de la
realidad.
6

La aceptación de la investigación cualitativa, ha tenido acogida por su carácter flexible,


adaptativo y de apertura a los cambios conforme se avanza en la investigación.

No obstante, esta investigación tiene planteado un conjunto de interrogantes, entre ellos la


confiabilidad y la validez. Estos problemas pueden que estén muy arraigados en la mente de
muchos investigadores por la mentalidad positiva de la que ha sido difícil desprenderse. Ambos
enfoques son válidos y rigurosos; se puede optar por un determinado paradigma o por la
complementariedad de ambos. Lo preciso es que con independencia de la elección hay que
acometerla con rigor.

En el caso de las investigaciones cualitativas, se pueden utilizar diversas técnicas para obtener la
convergencia de tipo metodológico, sin embargo, exige también sistematización y rigor
metodológico.

La confiabilidad en una investigación cualitativa depende fundamentalmente de la


estandarización de los registros, en los que se debe partir de una categorización ya elaborada.
Kirk y Miller (1986:7) señalan que existen tres tipos de confiabilidad en la investigación
cualitativa: confiabilidad quijostesca, confiabilidad diacrónica y confiabilidad sincrónica.

Pérez (1998:78) al referirse a la clasificación de Kirk y Miller (1986) las define de la siguiente
manera:

Confiabilidad quijotesca: se refiere a las circunstancias en las que un único método de


observación da lugar de forma continuada a una medida invariable. La originan al convertir en
rituales determinadas frases y hechos.

Confiabilidad diacrónica: consiste en la estabilidad de una observación a través del tiempo que
puede comprobarse al repetir las medidas, pero teniendo en cuenta que sólo tendría utilidad en
aspectos inalterables de un determinado período.

Confiabilidad sincrónica: implica la semejanza de las observaciones dentro del mismo período
de tiempo. Raramente implica observaciones identiicas, sino el hecho de que sean consistentes
respecto a rasgos relevantes. La investigación cualitativa, para lograr altos índices de
confiabilidad, exige la elaboración de registros descriptivos que, sin caer en la estandarización,
ayudan a regular los procesos.

En torno a la validez, esta exige, según Hansen (1979): Estimación de la medida en que las
conclusiones representan tan efectivamente la realidad empírica y estimación de si los
constructos diseñados representan o miden categorías reales de la experiencia humana.

En la investigación cualitativa tal estimación, en opinión de Aguilera (1986) se logra a través de


la triangulación, saturación y el contraste con otros colegas.

La triangulación implica reunir una variedad de datos y métodos, para referirlos al mismo tema
o problema, implica que los datos de recojan desde puntos de vista distintos y realizar
comparaciones múltiples de un fenómeno único, de un grupo utilizando perspectivas diversas y
múltiples procedimiento.

Denzin (1979:281), define la triangulación como la combinación de metodologías en el estudio


de un mismo fenómeno, Denzin (1979:281) destaca en la triangulación el control cruzado entre
diferentes fuentes de datos: personas, instrumentos, documentos o la combinación de éstos, y
Elliott (1990) indica que el principio básico subyacente en la idea de triangulación es el de
recoger observaciones y apreciaciones de una situación o algún aspecto de ella desde una
variedad de ángulos o perspectivas.
7

Para recoger la información el registro de observaciones eS fundamental, y ello según lo


expresa Delgado y Polanco (1996:21) es un cuerpo de notas que permite ir identificando
debilidades, fortalezas, inquietudes, confusiones y/o irregularidades.

Como muy bien lo plantea Le Boterf (1981), en esta etapa se trata de pasar de un conocimiento
cotidiano a un conocimiento científico y crítico, razón por la cual después de obtener la
información registrada en el cuerpo de notas, se debe proceder a agrupar las distintas opiniones,
comentarios, expresiones y los elementos concretos de la situación vivida, según las
dimensiones categoriales definidas.

Se trata de un esfuerzo dirigido a facilitar las reflexiones, descubrir relaciones, buscar


constantes y estructuras esenciales del fenómeno objeto de estudio.

En este proceso de búsqueda de información, existe consenso entre los investigadores en


reconocer las bondades de las técnicas triangulares, en tanto ellas intentan señalar o explicar
más concretamente la riqueza y complejidad del comportamiento humano con el fin de
estudiarlo desde diferentes perspectivas, haciendo uso de datos cualitativos y cuantitativos.

La triangulación implica un acercamiento a un problema a través de distintos medios, a


continuación las de mayor uso según Pérez (1998:82):

Triangulación de tiempo: intenta considerar el factor de cambio y el proceso mediante la


utilización de diseño de cortes a través de secciones y mediante diseños longitudinales para
analizar tendencias a lo largo del tiempo.

Triangulación de espacio: con técnicas transculturales, trata de vencer el parroquialismo de


estudios efectuando en el mismo país o dentro de la misma subcultura, utilizando técnicas a
través de varias culturas.

Triangulación por niveles de combinación: emplea más de un nivel de análisis de los tres
principales utilizados en las ciencias sociales, es decir, el nivel individual, el nivel interactivo
(grupos) y el nivel de colectividades y organizacional, cultural o social.

Triangulación teórica: se basa en la preferencia de teorías alternativas o competitivas sobre la


utilización de un solo punto de vista. Se emplean diferentes perspectivas coincidentes de un
mismo objetivo.

Triangulación de investigador: cuando existen varios investigadores para realizar una misma
investigación. A este tipo de triangulación también se le ha denominado como verificación
intersubjetiva. Esta verificación se lleva a cabo por medio del contraste de la información, pues
en la investigación cualitativa un grupo o equipo suele participar en todo el proceso de
investigación; por lo tanto, a través del debate, el análisis de los datos y el contraste y discusión
sobre los mismos, se logra un cierto grado de credibilidad de la información obtenida. Por
consiguiente, el nivel de objetividad logrado será muy superior al que caracterizaría un
investigador aislado.

Triangulación de metodología: utiliza el mismo método en diferentes ocasiones o bien


diferentes métodos sobre un mismo objeto de estudio. La triangulación metodológica se realiza
dentro de una colección de instrumentos o entre métodos.