Vous êtes sur la page 1sur 5

VALIDEZ

De manera tradicional, la validez se ha definido como el grado en que una prueba mide
lo que est diseada para medir. Una desventaja de esta definicin es la implicacin de
que una prueba slo tiene una validez, la cual supuestamente es establecida por un solo
estudio para determinar si la prueba mide lo que se supone debe medir. En realidad, una
prueba puede tener muchas clases de validez, dependiendo de los propsitos especficos
para los cuales fue diseada, la poblacin objetivo, las condiciones en que se aplica y el
mtodo para determinar la validez. Los mtodos por los cuales puede determinarse la
validez incluyen (1) analizar el contenido de la prueba, (2) calcular la correlacin entre
las calificaciones en la prueba y las calificaciones en el criterio de inters y (3)
investigar las caractersticas psicolgicas particulares o constructos medidos por la
prueba.
Todos esos procedimientos son tiles en la medida que mejoran la comprensin de lo
que mide una prueba y proporcionan informacin para tomar decisiones sobre la gente.
Tambin puede ser de inters evaluar la validez creciente de una prueba, es decir, qu
tanto aade la prueba a la prediccin y comprensin de los criterios que ya son
anticipados por otras medidas. A diferencia de la confiabilidad, la cual es influida slo
por los errores no sistemticos de medicin, la validez de una prueba es afectada tanto
por los errores no sistemticos como por los sistemticos (constantes). Por esta razn,
una prueba puede ser confiable sin ser vlida, pero no puede ser vlida sin ser confiable.

La confiabilidad es una condicin necesaria, pero no suficiente, para la validez.

Si un test sirve para lo que con l se pretende, decimos que es vlido. Por ejemplo, un
test de inteligencia es vlido si mide la inteligencia. Los tests son vlidos en la medida
en que miden lo que dien medir.

Podemos dintinguir entre la validez aparente y la validez comprobada:

1.- Validez aparente: hace referencia al grado en que el test parece que mide lo
que quiere medir.
2.- Validez comprobada: es la que ha sido verificada de alguna forma emprica
o experimental. La validez comprobada es emprica o terica :
3.- Validez emprica: es emprica cuando se ha comprobado de modo prctico.
Por ejemplo, un test para seleccionar conductores es vlido si distingue a los
buenos de los malos conductores, a pesar de no saber exactamente por qu lo
consigue.
4.- Validez terica: refleja el grado en que se ha comprobado con argumentos
cientficos que el test mide la propiedad o rasgo que intenta medir. Por ejemplo,
un test de inteligencia tendr validez terica cuando exista una prueba de ello
que se apoye en una verificacin lgica y experimental.

LA VALIDEZ APARENTE:

Un test tiene validez aparente si parece que mide lo que intenta medir.
No es una validez suficiente, aunque a menudo es necesaria.
Muchas veces, conviene que el test les parezca vlido a los sujetos que han de
contestarlo. En otras ocasiones, es fundamental que el test no parezca que mide
lo que mide. ste es el primer requisito de la validez efectiva. Para conseguir
sta no es suficiente con que el test parezca vlido, es preciso que se compruebe
que lo es.

LA VALIDEZ COMPROBADA:

La validez efectiva es la validez comprobada. Existen muchos modos de comprobar la


validez unos son empricos y otros lgico-experimentales.

LA VALIDEZ EMPRICA O DE CRITERIO:

Un test tiene validez emprica si se ha comprobado que sirve para alguna finalidad
prctica. Por ejemplo, un test es vlido para seleccionar conductores si distingue los
diferentes grados de pericia en la conduccin.

La validez emprica tambin se denomina validez de criterio, y para comprobarla, se


debe definir un criterio externo de validez. En el ejemplo comentado el criterio externo
es la pericia en la conduccin. El coeficiente de validez del test es la correlacin entre
el test y el criterio. Si los mejores en el test son los que conducen mejor, el test tendr
un alto coeficiente de validez respecto a ese criterio, y tendremos un test empricamente
vlido para seleccionar conductores.

Esta validez es cientficamente ciega, porque no sabemos en qu se basa la validez del


test. El test es vlido para seleccionar conductores, no sabemos por qu.

La validez emprica puede clasificarse en:

1. Validez prospectiva o predictiva o de pronstico:

Es la que se comprueba mediante la correlacin entre el test y un criterio medido


ulteriormente.

Por ejemplo, si tenemos muchos aspirantes a pilotos y queremos seleccionar a los que
tengan ms probabilidad de convertirse, pasados los estudios y prcticas, en buenos
pilotos. Podemos aplicarles ciertos tests que aprecien los requisitos de ser buen piloto, y
admitir a todos los aspirantes. Despus de los estudios y las prcticas oportunas,
mediremos a los sujetos en el criterio que garantice ser un buen piloto. Si los tests
contestados por los sujetos en el momento de la admisin tienen una alta correlacin
con la pericia como piloto, medida despus del aprendizaje, a lo mejor aos despus, se
puede afirmar que estos tests tienen alta validez prospectiva. Esta validez se ha llamado
validez prospectiva, predictiva y de pronstico, ya que permite pronosticar o predecir
convenientemente los resultados de los sujetos en el criterio, sirve para seleccionar a los
aspirantes que con ms probabilidad van a ser buenos pilotos.

2. Validez inspectiva o concomitante o concurrente:

Generalmente resulta demasiado costoso someter a prueba la validez predictiva; suele


estar fuera de las posibilidades prcticas del psiclogo.
Por ello, con frecuecia se recurre al mtodo de la validez inspectiva, concomitante o
concurrente. Es igual que el procedimiento anterior pero los tests y el criterio se miden
en el mismo periodo concomitante o concurrentemente.

Por ejemplo, se escoge una muestra oportuna de pilotos, se les aplica los tests oportunos
y se les mide en el criterio de pericia. El coeficiente de validez concomitante ser la
correlacin entre los tests y el criterio. Nos informa hasta qu punto los buenos y los
malos en el test son, en este momento, buenos y malos en el criterio. No nos garantiza
que los aspirantes con mejores resultados en los tests despus sean los mejores pilotos.

3. Validez retrospectiva:

Es la correlacin entre los tests, aplicados en cierto momento, y un criterio que se midi
anteriormente, a lo mejor, aos antes. Su finalidad es pronosticar un criterio pasado,
para averiguar desde el presente los factores y las condiciones que en el pasado
influyeron en los sujetos, y que explican algunas de las caractersticas actuales de los
sujetos.

2.2.-La validez terica:

Un test tiene validez terica si mide lo que pretende medir. La cuanta en que lo mide
est sealada por argumentos lgicos y experimentales que equivalen a su relacin con
un criterio interno.

Existen diversos tipos de validez terica, y son los siguientes:

1. VALIDEZ DE CONTENIDO O MUESTRAL:

Principalmente, hace referencia a tests de rendimiento, conocimientos o competencia


profesional.

Por ejemplo, un test de ortografa es vlido si su contenido es apropiado. Para


comprobar esta validez se examinar el campo de la ortografa y se constatar que los
items que componen el test son una muestra imparcial y suficiente de este campo.

Este tipo de validez no puede concretarse en ningn tipo de correlacin. Expresa la


relacin entre el test y el criterio interno formado por la materia a que se refiere el test.
La relacin ser ms alta a medida que est mejor representada toda la materia por el
test. Esta validez se consigue a medida que hay garantias de que se han definido
claramente los diversos aspectos de un cierto campo de conocimientos o destrezas que
el test intenta medir.

Criticar la validez muestral de un test implica mostrar que no representa adecuadamente


el campo a que se refiere.

2. VALIDEZ DE CONSTRUCTO O CONCEPTUAL:

Consiste en comprobar, segn la metodologa de la investigacin cientfica, que el test


mide la variable a que se refiere.
Se persigue garantizar cientficamente que la variable que el test intenta medir es una
variable aceptable, cuyo concepto presenta suficiente consistencia lgica dentro del
sistema terico de la psicologa y se apoya en suficientes comprobaciones
experimentales que lo verifican. Por ejemplo, antes de ofrecer un test vlido para medir
la inteligencia, habr que aclarar qu es esa inteligencia que el test intenta medir.

3. VALIDEZ FACTORIAL:

Se produce cuando se corelacionan distintos tests con un rasgo determinado y despus


se someten a una relacin factorial.

4. VALIDEZ CONGRUENTE:

Si medimos distintas variables con tests del mismo tipo, los tests que hacen referencia a
una variable han de guardar entre s correlaciones ms altas que las que tienen con los
tests de otras variables.

5. VALIDEZ DISCRIMINATIVA:

Si medimos distintas variables con tests del mismo tipo, y la misma variable con tests
de distinto tipo, estos tests de distinto tipo que hacen referencia a la misma variable han
de tener entre si correlaciones ms altas que los tests del mismo tipo que hacen
referencia a distintas variables.

6. VALIDEZ ESTRUCTURAL:

Es el grado en que el test mide una elaboracin o un rasgo terico. Cualquier dato que
d algo de informacin sobre la naturaleza del rasgo que estamos considerando y de las
condiciones que afectan a su desarrollo y manifestaciones tiene utilidad para este tipo de
validez.

FACTORES QUE AFECTAN LA VALIDEZ

La validez con relacin a criterios de una prueba puede ser influida por una serie de
factores, incluyendo las diferencias de grupo, la extensin de la prueba, la
contaminacin del criterio y la tasa base. La validez creciente de una prueba, es decir, la
contribucin de la prueba que excede a las contribuciones de otras variables, tambin
debera ser considerada al decidir si se va a utilizar la prueba con propsitos de
seleccin y ubicacin.

Diferencias de grupo.

Las caractersticas de un grupo de personas en quienes se valida una prueba incluyen


variables como sexo, edad y rasgos de personalidad. Esos factores, que en este contexto
se conocen como variables moderadoras, pueden afectar la correlacin entre una prueba
y una medida de criterio. La magnitud de un coeficiente de validez, como la de un
coeficiente de confiabilidad, tambin est influida por el grado de heterogeneidad del
grupo de validacin en lo que mide la prueba. Los coeficientes de validez tienden a ser
ms pequeos en los grupos ms homogneos, es decir, los grupos que tienen un rango
ms estrecho de calificaciones. El tamao de un coeficiente de correlacin es una
funcin de las variables de prediccin y de criterio, por lo que estrechar el rango de
calificaciones en cualquier variable tiende a disminuir el coeficiente de validez
predictiva. Como la magnitud de un coeficiente de validez vara con la naturaleza del
grupo probado, una prueba recin elaborada que resulte ser un predictor vlido de una
variable de criterio particular en un grupo de gente debe tener una validacin cruzada en
un segundo grupo. En la validacin cruzada se aplica una prueba a una segunda muestra
de personas para determinar si conserva su validez entre muestras diferentes. Debido a
la operacin de los factores del azar, la magnitud de un coeficiente de validez por lo
general se reduce en alguna medida en la validacin cruzada. En consecuencia, en la
mayor parte de los casos se considera que la correlacin entre las calificaciones de
prediccin y de criterio en la validacin cruzada es un mejor indicador de la validez
predictiva que la correlacin original prueba-criterio. La validacin cruzada, que es una
manera de determinar la generalizacin de la validez de una prueba, es decir, si la
prueba sigue siendo vlida en situaciones diferentes, tambin puede involucrar una
muestra diferente (paralela) de reactivos. Con diferentes muestras de examinados,
diferentes muestras de reactivos de la prueba, o en ambos casos, suele darse alguna
reduccin del coeficiente de validez en la validacin cruzada. Se han propuesto
frmulas para corregir dicha reduccin, pero implican ciertas suposiciones que no
siempre se cumplen.

Extensin de la prueba.

Al igual que la confiabilidad, la validez vara directamente con la extensin de la


prueba y con la heterogeneidad del grupo de personas examinadas. Hasta cierto punto,
las puntuaciones en una prueba ms larga y en una prueba administrada a un grupo de
individuos que varan de manera considerable en las caractersticas a medir tienen
varianzas ms grandes y, en consecuencia, mayor validez predictiva que las
puntuaciones de pruebas ms cortas o de pruebas aplicadas a grupos ms homogneos.
Se han propuesto frmulas que corrigen los efectos que tienen en la validez la
restriccin de rangos de calificacin y la extensin acortada de la prueba, pero slo son
apropiadas bajo ciertas circunstancias especiales.

Contaminacin de criterios.

La validez de una prueba est limitada no slo por su confiabilidad y el criterio, sino
tambin por la validez del propio criterio como medida de la variable de inters. En
ocasiones el criterio se hace menos vlido, o se contamina, por el mtodo particular de
medir las calificaciones de criterio. Por ejemplo, un psiclogo clnico enterado de que
un grupo de pacientes ya ha sido diagnosticado como psictico puede percibir mal los
signos psicticos en las respuestas de esos pacientes a las pruebas de personalidad.
Entonces el mtodo de comparacin de grupos, en el cual se comparan las calificaciones
obtenidas por los psicticos en la prueba con las obtenidas por los normales, arrojar
evidencia falsa a favor de la validez de la prueba. Dicha contaminacin del criterio
(psictico contra normal) puede controlarse por medio de un anlisis ciego, esto es,
haciendo que quien emite el diagnstico no disponga de informacin acerca de los
examinados a excepcin de sus puntuaciones en la prueba. Sin embargo, muchos
psiclogos clnicos sostienen que el anlisis ciego no es natural ya que no es la forma en
que las pruebas se emplean en realidad en los escenarios clnicos.

Vous aimerez peut-être aussi