Vous êtes sur la page 1sur 12

Universidad Arturo Michelena

Facultad de Ciencias Econmicas y Sociales


Escuela de Psicologa
Ctedra: Tcnicas Psicomtricas I
Seccin 5M

VALIDEZ:
CONCEPTOS BSICOS E
INTERPRETACIN

Aixa Lpez: 25.985.784


Vernica Lpez: 24.424.921
Victoria Veroes: 24.860.468
Tania Zambrano: 25.635.811

San Diego, Noviembre 2015

VALIDEZ: CONCEPTOS BSICOS

Qu es validez?
Si un test sirve para lo que con l se pretende, se dice que es vlido.
Por ejemplo, un test de inteligencia es vlido si mide la inteligencia. Los tests
son vlidos en la medida en que miden lo que dice medir.
Histricamente la validez se empieza a evaluar, estudiando la
comparacin del contenido de la prueba con las caractersticas de la variable
que se desea medir y se rige de Criterios desempeo en la situacin para la
cual se desea predecir la conducta. Luego, form dos tendencias desde su
invencin, que los test estn formados en base a fundamentos tericos del
tema que se desea medir y que estos tengan la posibilidad de llevarse a
comprobacin emprica. Finalmente, el ltimo punto de evaluacin de la
validez fue el constructo de la misma, es decir, las categoras formadas por
una serie de rasgos que se perciben en la conducta de manera no directa, lo
que se puede inferir a travs de lo observado.
Existen muchos modos de comprobar la validez unos son empricos y
otros lgico-experimentales, aunque esta no pueda expresarse en trminos
generales, no es posible decir coloquialmente que esta es alta o baja.
Para un test ser vlido necesita contar con ciertas caractersticas:
Validez de criterio: Un test tiene validez emprica si se ha
comprobado que sirve para alguna finalidad prctica. Por ejemplo, un
test es vlido para seleccionar conductores si distingue los diferentes
grados de pericia en la conduccin. Para comprobarla, se debe definir
un criterio externo de validez. En el ejemplo comentado el criterio
externo es la pericia en la conduccin. El coeficiente de validez del

test es la correlacin entre el test y el criterio. Si los mejores en el test


son los que conducen mejor, el test tendr un alto coeficiente de
validez respecto a ese criterio, y tendremos un test empricamente
vlido para seleccionar conductores.
Esta validez es cientficamente ciega, porque no sabemos en qu se basa
la validez del test. El test es vlido para seleccionar conductores, no
sabemos por qu.
La validez emprica puede clasificarse en:
Validez predictiva: permite pronosticar o predecir convenientemente
los resultados de los sujetos en el criterio que se vaya a estudiar, sirve
para seleccionar a los aspirantes que con ms probabilidad van a ser
buenos o destacados en dicho criterio. Es utilizada frecuentemente en
el rea organizacional. Generalmente resulta demasiado costoso
someter a prueba la validez predictiva; suele estar fuera de las
posibilidades prcticas del psiclogo.
Validez concurrente: Es igual que el procedimiento anterior pero los
tests y el criterio se miden en el mismo periodo concurrentemente. El
coeficiente de validez concurrente ser la correlacin entre los tests y
el criterio. Nos informa hasta qu punto los buenos y los malos en el
test son, en este momento, buenos y malos en el criterio. Sin embargo
no nos garantiza que los aspirantes con mejores resultados en los
tests despus sean los mejores.
Validez de contenido: expresa la relacin entre el test y el criterio
interno formado por la materia a que se refiere el test. La relacin ser
ms alta a medida que est mejor representada toda la materia por el
test. Esta validez se consigue a medida que hay garantas de que se
han definido claramente los diversos aspectos de un cierto campo de
conocimientos o destrezas que el test intenta medir .

Criticar la validez de contenido de un test implica mostrar que no


representa adecuadamente el campo a que se refiere.
Sujeta a la validez de contenido, existe una validez terica, que nunca
deben confundirse, ni entenderse de que son la misma, pues la terica es
todos los argumentos e informacin recolectada que ayudarn a construir un
test valido e tems precisos, mientras que el contenido se establece mediante
un anlisis factorial junto a lo seleccionado a medir.
Validez terica: Un test tiene validez terica si mide lo que pretende
medir. Lo elegido a medir est sealado por argumentos lgicos y
experimentales que equivalen a su relacin con un criterio interno. Es
decir que cada uno de los tems que yo redacte debe tener coherencia
con lo seleccionado a medir.
Profundizndonos ms en una validacin exitosa, se necesita de ms
caractersticas para tener una consistencia y heterogeneidad en cada tem.
Validez de constructo: existe para garantizar cientficamente que la
variable que el test intenta medir es una variable aceptable, cuyo
concepto presenta suficiente consistencia lgica dentro del sistema
terico de la psicologa y se apoya en suficientes comprobaciones
experimentales que lo verifican. Por ejemplo, antes de ofrecer un test
vlido para medir la inteligencia, habr que aclarar que tipo de
inteligencia es la que el test intenta medir.
Dentro de la validez de constructo existe una especie de sub grupos, si se
demuestra que la investigacin posee ambos tipos se puede decir que tiene
una validez de constructo excelente. Y estas son:

Validez convergente: mide la correlacin existente junto a otros tests


que tengan los mismos constructos medidos en mi test, de ser as
esta ser alta y positiva.
Validez divergente o discriminativa: mide la correlacin que tiene mi
tests con otros tests de diferentes constructos, esta debe no existir y
de ser as, es llamada baja y negativa.
Validez facie (aparente): se considera para medir, o aparentar que
mide algo cuando en realidad no lo es. No es una validez suficiente,
aunque a menudo es necesaria.
Muchas veces, conviene que el test les parezca vlido a los sujetos que
han de contestarlo. En otras ocasiones, es fundamental que el test no
parezca que mide lo que mide. ste es el primer requisito de la validez
efectiva. Para conseguir sta no es suficiente con que el test parezca vlido,
es preciso que se compruebe que lo es.
Aunque la validez valga la redundancia busca en un test es validar a toda
costa su contenido para que sea utilizado y prctico, la mayora de las veces
se ve influenciado bajo ciertas fuentes de error. Las ms comunes y que
afectan a todas de igual manera son la edad, el sexo, la cultura, y el nivel
socioeconmico. Existen otras ms especficas pero suelen afectar a
constructos ms detallados y amplios, y estas pueden ser, la inteligencia
emocional, el tiempo de respuesta, el nivel de instruccin, la capacidad
receptivas, entre otras.
Parte del control y utilidad de este concepto, es la implementacin en
el rea cognoscitiva. A partir de la fusin entre la psicometra y los procesos
derivados de la mente, se ha podido estudiar y hacer comparaciones de
manera ms rigurosa en el mbito psicolgico. Iniciaron su lazo mediante el
uso de computadores para el estudio del procesamiento mental. A travs de
distintos clculos numricos y juegos ldicos, podan observar el avance

metacognoscitivo de los examinados. Cmo era el conocimiento y control de


sus propios procesos y cules abordaban para la resolucin de problemas.
Como se puede apreciar, la aplicacin del test correcta en tiempo y vlida en
contenido, aporta en el proceso de la auto-comprensin holstica en el
individuo y su eficacia, para una mayor madurez psicolgica, reestableciendo
el equilibrio interno.
VALIDEZ: MEDICIN E INTERPRETACIN
Ahora bien, luego de seguir los pasos para la construccin de un test y
que este cuente con una validacin aceptada, llega el turno de la aplicacin y
los resultados que estos arrojen, los usuarios suelen guiarse de la validacin
publicada del instrumento ya que se cuenta con una validez de constructo
alta, pero tambin est el caso de aquellos que desean contrarrestar pues
los los resultados plasmados con los que puedan arrojar la poblacin elegida
debido a ciertos criterios locales y esto se debe a que muchas veces estos
instrumentos tienen una generalizacin con situaciones particulares. Para la
interpretacin de los criterios, se necesita de los siguientes anlisis:
Coeficiente de validez y error de estimacin
El coeficiente de validez es la correlacin que tenga el puntaje de la
prueba con el criterio. Esta correlacin se levanta en tablas o en grficas
donde expresan la probabilidad de un individuo con cierta puntuacin en la
prueba obtenga cierto nivel especfico de desempeo en una prueba, la
correlacin de los datos se realiza con la frmula Producto- Momento de
Pearson. El coeficiente tambin tiene ciertos aspectos que hacen que este se
vea afectado y depender de la muestra seleccionada, la edad, el sexo,
ocupacin y la preseleccin, esto hace que muchas pruebas tengan validez
elevada en ciertas poblaciones y nula en otras, debido a que la pericia es
distinta en los distintos escenarios. Asimismo, se ve afecto por la

heterogeneidad y la forma de la relacin entre la prueba y el criterio (si es


lineal o no).
Con respecto a la incgnita de que tan elevado debe ser un coeficiente de
validez, si bien debe de ser significativa estadsticamente, no puede
determinarse si no se toman en cuenta una serie de factores, principalmente
el investigador se debe asegurar que este coeficiente no fue influenciado por
circunstancias de muestreo o de poblacin. Se busca siempre que la validez
sea elevada a travs de la correlacin, pero se sabe que estas siempre
contienen un margen de error, el cual se conoce como el error estndar de
estimacin.
Validez del test y teora de la decisin
La teora estadstica de la decisin fue realizada por Wald, quien
comenz hablando de las decisiones que deban tomarse en el mbito de la
produccin y control de calidad en productos industriales, ms adelante fue
revisada y modificada por Cronbach y Glesser. La misma consiste en una
tcnica para tomar las mejores decisiones en situaciones especificadas, para
esto se escoge un punto de corte o razn de seleccin, para establecer que
individuos sern electos y cules rechazados, dicho punto de corte depende
de las demandas, exigencias y necesidades de los usuarios. Los criterios
dentro de la teora de la decisin, ayudan a escoger los sujetos ms
destacados, catalogndolos como aptos para la ejecucin de las actividades
por las que estn siendo estudiados.
Esta teora tuvo como antecedente los trabajos de Taylor- Russell, los
cuales consistan en unas tablas estadsticas para determinar las ganancias
o el impacto que traa consigo el uso de un instrumento o prueba para la
seleccin de candidatos, lo cual se realizaba a travs de una comparacin
con el desempeo de individuos escogidos al azar, es decir sin instrumentos.

Dichas tablas constan

de 3 condiciones que de ser cambiadas afectan

totalmente la prediccin que se pueda tener y son: el coeficiente de validez


de la prueba, la razn de uso y la tasa base de aplicantes. Un aspecto
curioso es la utilidad de la teora de la decisin, debido a que se ponen a
prueba los criterios especificados

en situaciones particulares, lo cual se

debe a que los resultados son relativamente deseados o desfavorables. El fin


de la aplicacin de la teora, es aumentar al mximo las ganancias
esperadas de los resultados.
Muchas veces se ha puesto en tela de juicio que tan eficientes y en
cunto podrn aumentar la productividad los sujetos seleccionados si las
pruebas solo arrojan que los individuos se destacan en los criterios de la
prueba, ms no aseguran que estos sean expertos en el rea, entonces se
recomienda el uso de una prueba que contenga una validez de .50 debido a
que la productividad de los sujetos es directamente proporcional a su validez.
La validez de la prueba puede variar en los criterios por consecuencia de
ciertos subgrupos existentes que difieren en caractersticas personales, estos
son catalogados como errores de prediccin y son al azar, el ms fluctuante
es el gnero, muchas veces las pruebas tienen mejor prediccin en hombres
que en mujeres, y se tienen casos en donde pruebas especializadas para
hombres, el desempeo ms alto lo han obtenido las mujeres. Otra
caracterstica pueden ser, el nivel socioeconmico, y estas son vistas como
variables moderadoras, conocidas de esta manera puesto que moderan e
influyen en la validez de la prueba; el nfasis en estas se realiz gracias a la
teora de la decisin, la cual permiti evidenciar que un tipo determinado de
prueba puede resultar ms til en ciertos subgrupos de personas que en
otras. Sin embargo los resultados de las investigaciones con respecto a las
variables moderadoras no fueron favorables, es decir, no arrojaron evidencia
de que estas pudiesen afectar la validez.

COMBINACIN DE INFORMACIN A PARTIR DE DIFERENTES TEST


Existen criterios de alta complejidad, cuya medida depende de varios
rasgos, por lo que se requiere de un tipo de prueba capaz de cubrir cada uno
de estos, pero debido a la ambigedad de los resultados que brindan las
pruebas heterogneas

es preferible utilizar un conjunto de sub pruebas

homogneas, las cuales abarcarn cada uno de los rasgos en particular, este
tipo de pruebas se conoce como bateras de test.
Asimismo, debido a la dificultad de combinar las puntuaciones de los
diversos instrumentos que componen una determinada batera de test, se
emplean dos mtodos: la ecuacin de regresin mltiple, que da una
puntuacin basada en las puntajes obtenidos en las diferentes sub pruebas,
realiza correlaciones entre las mismas as como entre el criterio y los sub
test, teniendo ms peso la correlacin con dicho criterio; debe destacarse
que la validez predictiva puede verse afectada por determinados factores
irrelevantes por lo que se debe buscar la manera de suprimir dicha
influencias, esto puede hacerse a travs de la introduccin de variables de
supresin, sin embargo la mejor manera de hacerlo es a travs de pruebas
empricas y directas.
El otro mtodo empleado consiste en el anlisis de perfiles y
puntuaciones de corte, en el mismo se eligen un conjunto de sub pruebas
consideradas apropiadas y se establece para cada una de ella
puntuaciones de corte, las cuales son aplicadas de manera estricta, es decir,
cualquiera que est por debajo de las mismas es rechazado. Este mtodo es
preferible pues permite evaluar diversas habilidades que pudiesen resultar
tiles y esenciales para, por ejemplo, un determinado puesto de trabajo,

adems de que permite evidenciar las deficiencias de los individuos, que


pudiesen llevar al fracaso.

USO DE LOS TEST PARA DECISIONES DE CLASIFICACIN


Los test psicolgicos pueden emplearse con diversos propsitos; en
primer lugar para la seleccin, en donde los sujetos son aceptados o
rechazado; tambin se emplean para la colocacin y clasificacin, en donde
no se busca aceptar o rechazar sino asignar a los sujetos a la categora o
tratamiento ms adecuado, consiste en asignar un lugar o posicin. La
diferencia entre estos dos ltimos es que el primero puede hacerse a travs
de una sola puntuacin, de una sola prueba, mientras que el segundo
requiere y comprende dos o ms criterios. Con respecto a las pruebas que
se encargan de clasificar, se debe tomar en cuenta la validez diferencial, esta
consiste en evaluar el desempeo de un individuo en tares o empleos
diferentes, en donde debe obtenerse una correlacin alta con una de las
tareas y las dems deben ser bajas o nulas (en situaciones ideales). En otras
palabras busca evaluar y determinar para cual actividad el sujeto es ms
apto, o es bueno para la misma, en diferencias de otras. En el caso de que
se traten de ms de dos tareas o actividades se emplea la tcnica estadstica
de funciones discriminantes, la cual slo evala la pertenencia o no del
individuo al grupo, no toma en cuenta el criterio.
La ventaja de las pruebas de clasificacin es que permiten un mejor
aprovechamiento de los recursos humanos, pues permiten evaluar distintas y
diversas habilidades, dentro de las cuales los individuos tienen ms
probabilidades de destacar en cualquiera de ellas, pueden explorarse sus
diversas capacidades y de esta manera se tienen ms oportunidades de
escoger a los candidatos ms adecuados para las distintas reas.

ANLISIS ESTADSTICO DEL SESGO DEL SESGO DE LA PRUEBA


Es importante que a la hora de realizar pruebas de carcter predictivo
se tenga una alta validez predictiva del criterio en particular, sin embargo
esto no siempre ocurre, como es el caso de las llamadas pruebas de
culturas, las cuales, en su esfuerzo por tomar en cuenta las diferencias
culturales, tienden a incluir aspectos poco relevantes para lo que se
pretender predecir, es por esto que lo ms conveniente resulta establecer un
criterio relevante y posteriormente investigar e indagar sobre aquellos
factores que pueden cambiar o modificarse por la influencia cultural.
Con la palabra sesgo se hace referencia a aquellos errores
constantes y sistemticos que interfieren en los resultados, no causados por
el azar; las investigaciones relacionadas con el mismo se realizan en torno a
dos aspectos: el sesgo relacionado con los coeficientes de validez, llamado
sesgo de la pendiente, puesto que al expresar las puntuaciones del criterio y
de la prueba como desviaciones estndares, la pendiente que forme la lnea
de regresin conforma el coeficiente de correlacin. Por otro lado el sesgo de
interseccin corresponde a la relacin entre las medias del grupo en la
prueba y en el criterio, con la misma busca evidenciarse si el instrumento sub
predice, es decir que predice por debajo de lo que corresponde, o si sobre
predice el desempeo del individuo, lo cual se refiere a si lo sobrevalora o
sobreestima.
Asimismo, en la actualidad se han desarrollados modelos de toma de
decisiones que permitan usar de manera justa los test, tomando en cuenta
las caractersticas particulares de los grupos minoritarios, buscando que los
mismos no resulten perjudicados y marginados; estos modelos plantean el
desarrollo de estrategias que permitan realizar instrumentos que sean

objetivos y que tambin permitan evaluar y apreciar la diversidad, de esta


manera se pudiesen suprimir los estereotipos, as como tambin mejorar el
auto concepto de estos individuos que pertenecen a las minoras e
incrementar sus oportunidades tanto en el mbito laboral como universitario.