Académique Documents
Professionnel Documents
Culture Documents
De aportar una justificacin racional sistemtica, tanto lingstica como psicolgica, para
mejorar la precisin del proceso de adaptacin, as como reunir datos acerca de la equivalencia
de todas las versiones en los distintos idiomas.
De asegurarse que el diseo de recogida de datos permite el uso de tcnicas estadsticas
apropiadas para establecer la equivalencia entre los tems correspondientes a las diferentes
versiones idiomticas del tests
Aplicar tcnicas estadsticas apropiadas para; 1) establecer la equivalencia entre las diferentes
versiones de un tests e 2) identificar componentes problemticos o aspectos del tests que
puedan ser inadecuados para alguna de las poblaciones a las que va destinado el test
De proporcionar informacin sobre la evaluacin de la validez en todas las poblaciones objetivo
a la que va dirigido el test adaptado.
De aportar datos estadsticos sobre la equivalencia de los tests para todas las poblaciones a
las que van dirigidos
No deben utilizarse preguntas no equivalentes en todas las versiones dirigidas a diferentes
poblaciones cuando se prepara una escala comn, o cuando se comparan estas poblaciones.
Sin embargo, pueden ser tiles para reforzar la validez de contenido de las puntuaciones de
cada poblacin por separado.
3. Se suele afirmar que la entrevista es un instrumento poco confiable. Discuta esta
afirmacin desde el concepto de confiabilidad presentado por Hogan y considerando
las particularidades de la entrevista como instrumento de recoleccin de datos.
La validez se relaciona con lo que mide una prueba, especficamente si mide lo que pretende
medir, en tanto que la confiabilidad solo se relaciona con la consistencia de la medicin, al
margen de lo que mida exactamente. Una medicin puede ser confiable sin ser valida; por ej.,
una prueba de qumica puede ser muy confiable, pero tal vez sea un indicador de habilidad
matemtica que de conocimiento sobre qumica. Aunque una prueba puede ser confiable sin
ser valida, no puede ser valida a menos que sea confiable.
En segundo lugar, el termino confiabilidad se distingue de el de uso cotidiano. La confiabilidad
de las pruebas tiene un sentido ms tcnico y cualitativo. Los mejores sinnimos en psicologa
del trmino tcnico de confiabilidad son consistencia, replicabilidad y fiabilidad. Una prueba
confiable, en sentido psicomtrico, es la que consistentemente genera la misma puntuacin o
una similar en el caso de un individuo. La calificacin puede replicarse (o reproducirse) al
menos con cierto margen de error. Podemos fiarnos (o depender) de que una prueba confiable
genere en buena medida la misma puntuacin en un individuo.
En 3 lugar debe distinguirse entre cambio real en el rasgo medido y fluctuaciones atribuibles a
los cambios fugaces en las circunstancias personales, la suerte de sorteo en cuanto ala forma
en que se toma una prueba, o las diferencias debidas a quien califica la prueba. Los cambios
reales en el rasgo medido no son fuente de inestabilidad (o falta de confiabilidad). Los otros
factores mencionados se consideraran normalmente fuentes de inestabilidad, aunque no lo
serian si uno trata de medir cambios en el estado anmico y emocional. No hay una
demarcacin clara entre cambios temporales de corto plazo, pero la distincin es
conceptualmente importante.
En 4 lugar, es indispensable distinguir entre errores constantes y errores no sistemticos en
las mediciones. Un error constante es aquel que genera una puntuacin sistemticamente
elevada o baja en una persona al margen de la constancia que haya en la condicin de la
persona en el rasgo medido. Por ej., considere el nivel de inteligencia de un nio cuyo idioma
materno es el espaol, pero a quien se le evala en ingles; el nivel de inteligencia del menor,
probablemente se subestime y esta subestimacin tal vez sea relativamente constante, ya sea
que al nio lo evalen el martes o el jueves. La confiabilidad no explica estos errores
constantes, solo se relaciona con errores no sistemticos. Observe que lo que se denomina
errores constantes no constituye realmente factores constantes sino tendencias que
desplazan las puntuaciones en cierta direccin.
FALTA MECHARLO CON ENTREVISTA
4. Defina y relacione los siguientes conceptos: Psicodiagnstico, Test y Anlisis
Ecoevaluativo
son otras variables que pueden hacer incomparables a dos muestras que pueden mostrar
resultados muy diferentes en un test determinado.
El sesgo en el instrumento: que puede provenir de las caractersticas del instrumento. La
familiaridad que los sujetos tienen con los estmulos presentados tiene una gran importancia.
Algunos estmulos son elementos utilizados en algunas culturas y no existen en otras o son
irrelevantes. El tem de ejemplo en el Sub. Test de Ordenamiento de lamina WISC III que
muestra a una mujer frente a una maquina expendedora de latas de gaseosa tiene muy poco
valor en culturas rabes, por ejemplo, o en zonas rurales de nuestro pas. El idioma es otra
fuente de sesgo de instrumento. La traduccin de un idioma a otro frecuentemente
subestimada, es un problema importante que requiere una metodologa especifica a seguir, con
lo que tambin se considera los modos de escritura y lectura de cada cultura (entre los idiomas
occidentales existen diferencias como que en ingles no existe la que el alfabeto sueco
contiene mas vocales, y en portugus existen distintos tipo de a. Los mtodos de respuesta
constituyen otra fuente de sesgo del instrumento. Las lminas de respuestas del Test de
Matrices Progresivas de Raven que implica completar una secuencia lgica con una figura
opcional, incluyen la figura faltante al final de la segunda fila, con lo que asume una lectura de
izquierda a derecha. Este hecho fue demostrado por Carpenter, Just y Shell (1990) en un muy
preciso estudio que implica una serie de desventajas para los sujetos de las culturas rabes
quienes involuntariamente van a intentar resolver la prueba de derecha a izquierda, forma en
que se lee su idioma.
El sesgo de administracin: incluye problemas tales como dificultades en la comunicacin, es
decir, dificultades para que el entrevistado entienda las instrucciones del entrevistador ya sea
por la dificultad de las palabras utilizadas, el modo de explicacin de las instrucciones o un
inadecuado manejo del idioma de alguna de las partes. Tambin se incluyen las alteraciones en
la manera de administrar las pruebas. Normalmente los manuales incluyen instrucciones de
administracin que en muchos casos no son adecuadas para la poblacin a aplicar. Los
administradores del Test entonces adaptan esas instrucciones segn su criterio personal. Otro
punto importante es el uso de cronmetros que produce serias alteraciones en los resultados.
Sesgo de tem: Se produce cuando el mismo tiene diferentes significados en distintas culturas.
Ciertos grupos culturales pueden obtener puntajes significativamente distintos en un tem
determinado a pesar de obtener un puntaje total similar. La deseabilidad social o la relevancia
cultural, entre otros factores, pueden producir el sesgo de tem. Tanzer (1995) demostr que
aunque la estructura factorial de un Test de autoconcepto acadmico era similar cuando se lo
aplico a estudiantes australianos y singaporeanos, existan diferencias sustanciales entre estas
muestras cuando se compararon algunos tems especficamente. Este tipo de sesgos tambin
acta en test neuropsicologicos.
26. Piense en una prueba cuyo objetivo es evaluar Inteligencia. Cmo la validara?
Explique por lo menos tres tipos de validez.
Validara una prueba cuyo objetivo es evaluar Inteligencia por medio de la Validez relacionada
con el Criterio, en el contexto de Validez Concurrente, ya que es adecuada para las pruebas
que se emplean para diagnosticar el estado actual. Revisara la concordancia entre el
desempeo en la prueba y la condicin actual en alguna otra variable. Este se diferencia de la
Validez Predictiva por el tiempo de la variable del criterio, ya que este busca pronosticar la
condicin en algn criterio a la que se llegar en el futuro. Como criterio empleara otra prueba,
demostrando la correlacin entre la prueba que se validar y algn otro instrumento que se
sabe o supone que es un indicador vlido del constructo de inters.
Una medida de criterio para las pruebas de inteligencia es el ndice de aprovechamiento
acadmico, razn por la cual se describen como medidas de aptitud acadmica. Los ndices
especficos utilizados como medidas de criterio son: las calificaciones escolares, los resultados
de pruebas de aprovechamiento, los registros de promocin y de graduacin, los honores y
reconocimientos especiales y las valoraciones de docentes e instructores sobre la inteligencia
de los individuos.
Otra validez que demostrara sera la Validez de Constructo. Este consiste en evidenciar que la
prueba mide el constructo. Utilizara el Anlisis Factorial para identificar las dimensiones
comunes que subyacen al desempeo en muchas mediciones diferentes. Esta tcnica ayuda a
comprender la estructura de las pruebas, de modo que las tcnicas son una fuente relevante
de informacin para la validez de constructo. Esta tcnica estadstica sirve para analizar las
lograda con el uso de herramientas como pruebas, entrevistas, estudios de caso, observacin
conductual y aparatos y procedimientos de medicin diseados en forma especial.
Segn Pelechano (1976), el test implica un instrumento sistemtico y tipificado que
compara la conducta de dos o ms personas.
Mikulic define los tests psicolgicos como tcnicas sistemticas que comparan la conducta de
dos o ms personas. Lo esencial de un test es poder observar si revela distintas
individualidades que se mantienen constantes en igualdad de circunstancias.
Siguiendo a Anastasi & Urbina (1998) entendemos que un test es un instrumento de evaluacin
cuantitativa de los atributos psicolgicos de un individuo. La A.P.A (1999), propone una
conceptualizacin abarcativa y exhaustiva al definir a un Test como un procedimiento
evaluativo por medio del cual una muestra de comportamiento de un dominio especificado es
obtenida y posteriormente evaluada y puntuada empleando un proceso estandarizado.
Los tests tienen tres cualidades fundamentales:
Funciones:
-Seleccin y Clasificacin, colocando al individuo en el puesto que le corresponde,
o
en
el
nivel
de
rendimiento
segn
el
contexto.
-Valoracin de los Procedimientos, valorando individuos y mtodos o decidiendo la tcnica que
es
ms
idnea.
-Verificacin de Hiptesis Cientficas, proporcionando una medida ms objetiva que la que
pudiera suministrar una simple impresin.
Estandarizacin:
Siendo determinadas de antemano para su aplicacin en distintos lugares
y tiempo, y suministrando la informacin de qu puntuaciones suelen obtener muestras
representativas correspondientes.
Objetividad: Es variables segn el test, siendo el ms objetivo aquel al que todos los
observadores le asignan el mismo valor a una ejecucin determinada.
Segn Martinez Arias, las principales caractersticas de los tests son:
-Ser medidas objetivas
-Representar una muestra de conducta
-Es una tcnica sistemtica y estandarizada
-Permite obtener puntuaciones que se pueden comparar
-Las puntuaciones obtenidas se utilizan para la prediccin o inferencia de otras conductas.
En los instrumentos psicolgico, las puntuaciones suelen interpretarse haciendo referencia a
normas que representen el desempeo de la muestra de estandarizacin en la prueba; es
decir, las normas se establecen empricamente al determinar lo que hacen en la prueba los
miembro de un grupo representativo. La puntuacin transformada de cualquier individuo se
refiere entonces a la distribucin de las puntuaciones obtenidas por la muestra de
estandarizacin para descubrir qu lugar ocupa en esa distribucin.
La teora psicomtrica desarroll orientaciones sobre la determinacin de unidades de medida
y escalas de puntuaciones en las que pueden expresarse los test, as como ayudar a su
interpretacin o normas. Segn Petersen, se definen los siguientes conceptos:
Escalamiento, es el proceso de asociar nmero a las respuestas de los sujetos a los tems o
tests.
Construccin de Normas, consiste en la recogida de datos sobre un grupo normativo de
referencia, sobre el que se obtienen estadsticos que ayudan en la interpretacin de las
puntuaciones de los tests.
Equiparacin, es el proceso que asegura la intercambiabilidad de formas mltiples de tests.
Siguiendo a Tornimbeni et al. (2004), la construccin de una escala de medicin de algn
aspecto del comportamiento humano requiere previamente un exhaustivo anlisis conceptual
del dominio o rasgo a medir. En la medicin del rendimiento se pueden utilizar pruebas
referidas a criterios o referidas a normas. Para la elaboracin de pruebas por normas, se parte
de la construccin de una tabla de especificaciones que es una tabla de doble entrada por
medio de la cual se relacionan los objetivos cuyo logro se desea evaluar con los contenidos
especficos correspondiente. A partir de esta tabla se determina la cantidad de tems que
conformar la prueba y se lleva a cabo su redaccin.
La Equivalencia Mtrica nos permite conocer si los puntajes de las distintas versiones son
comparables. El Anlisis del Funcionamiento Diferencial de los tems y la deteccin de los
sesgos en los tems o tem bias ayudarn en la Equivalencia Mtrica. Es decir, el anlisis
comparativo entre instrumentos de medida como conjuntos de tems, se debe agregar el
estudio de sus componentes individuales que evala el funcionamiento diferencial como paso
previo a una posterior evaluacin del sesgo o falta de equivalencia mtrica.
Es muy necesario un estudio normativo que evale las dimensiones semnticas de las palabras
para que se produzca una concordancia semntica que garantice la igualdad en la familiaridad
y significatividad de los trminos. Contar con pautas normativas objetivas basadas en la
frecuencia de uso de las palabras es esencial para alcanzar la equivalencia semntica y en
consecuencia la equivalencia mtrica. Resumiendo, si queremos obtener instrumentos con
equivalencia conceptual, lingstica y mtrica; debemos realizar un trabajo fundado en
habilidades y conocimientos de especialistas que tengan en cuenta la cultura, el idioma, las
metodologas de investigacin y el correcto uso de los procedimientos estadsticos. O sea, que
la calidad de la adaptacin de una prueba es el resultado de la calidad de los diversos pasos y
de la cadena de sucesivas decisiones interdependientes que se deben tomar. En este sentido
es destacable el anlisis de los sesgos o bias que se encuentran en los tems y en los
instrumentos como punto a tener en cuenta al seleccionarlos para su adaptacin.
35. Por qu Hogan (2004) habla de diferenciar los usos cotidianos de la palabra
confiabilidad? Qu diferencia fundamental existe con el uso tcnico de la palabra?
Fundamente su respuesta.
Para Hogan es necesario ser consciente de las diferencias que hay entre los usos cotidianos de
la palabra confiabilidad y su empleo tcnico en la psicometra porque tienen varios
significados relacionados que son importantes. Sin embargo, la confiabilidad de las pruebas
tiene un sentido ms tcnico y cuantitativo. Los mejores sinnimos en psicologa del trmino
tcnico confiabilidad son: Consistencia, replicabilidad y fiabilidad. Una prueba confiable es la
que consistentemente genera la misma puntuacin o una similar en el caso de un individuo.
La calificacin puede replicarse al menos con cierto margen de error. Podemos fiarnos de que
una prueba confiable genere en buena medida la misma puntuacin en un individuo.
36. Por qu considera usted que la evaluacin psicolgica es un proceso?
Ejemplifique la nocin de proceso evaluativo con el mbito jurdico.
Los tribunales se basan en datos de pruebas psicolgicas y testimonios de expertos
relacionados como una fuente de informacin para ayudar a responder si la persona es
competente para ser enjuiciada o para saber si un acusado distingua el bien del mal en el
momento de cometer el delito.
37-cul es la importancia de tener en cuenta la finalidad en la construccin de una
tcnica de evaluacin psicolgica? Qu relacin existe entre el constructo y los
reactivos?
1.
2.
3.
4.
5.
6.
7.
1.
2.
3.
4.
ORIGEN DE LAS PRUEBAS: 3 fuentes principales: necesidad practica (ej.: Binet elaboro una
prueba con el fin de identificar a los nios que posiblemente requieran de una educacin
especial.
Fundamento terico: como las matrices progresivas de Raven. (inst para medir el factor g
de la inteligencia. Luego se emplean en contextos aplicados.
Para adaptar o revisar pruebas existentes: dada la necesidad de cambio contextual se
requieren nuevos reactivos y normasTambin para personas con distintas discapacidades.
Preparacin de los reactivos:
Reactivo: posee cuatro partes:
Estimulo: al que responde el examinado (pregunta o imagen acompaada por una
pregunta oral)
Formato: o mtodo de respuesta. (seleccin o construccin de respuesta)
Condiciones: como se registra la respuesta, si hay cronometro o no
Procedimientos para calificarla ( correcto-incorrecto, puntajes o a juicio del
examinador en proyectivas)
Se eligen los tipos de reactivo ms en funcin del formato.
Seleccin de respuesta: ms de una opcin. Se denomina tambin opcin mltiple, eleccin
forzada
Puede ser V o F o formato Likert: completamente de acuerdo a completamente En
desacuerdo.
Construccin de respuesta: puede ser respuesta libre- donde no esta limitado a una serie de
opciones, o llenar un espacio en blanco- esto se usa en las pruebas de conocimiento o
evaluacin de desempeo lo q recibe mucha atencin en lo educativo, en lo labora portafolio,
y en lo conductual: poner la persona en situacin.
Para la calificacin se procede por la escala de calificacin grafica donde las respuestas. Se
convierten en forma n.
Pero tambin se puede proceder con un diferencial semntico: poniendo un adjetivo al sujeto.
Tambin hay otros tipos de calificacin: sistema de puntuaciones: puntuacin media (no
es la peor ni mejor respuesta), puntuacin plus (por tiempo) aplicar una correccin por
adivinacin, tambin en pruebas de personalidad importa la orientacin y no el grado de
acierto.
Hay dos factores clave para la buena calificacin: asegurar la confiabilidad entre calificadores
(sobre todo en construccin De respuestas) y concebir un esquema de calificacin. Tambin
otros mtodos como la calificacin holstica: consiste en que el evaluador se haga un juicio
sobre la explicacin, solo hay una calificacin general sobre la calidad del ensayo
La calificacin analtica: donde el mismo ensayo se valora en dimensiones diferentes. ()
La calificacin de rasgo primario: el grado en que un producto logra la finalidad solicitada
es el rasgo 1
Aunque el juicio de examinador es importante actualmente se utilizan sistemas de calificacin
automatizada38-A qu se refiere Hogan (2004) cuando habla de los problemas de la validez de
contenido? Nombre y explique por lo menos dos.
Los problemas de la validez de contenido ataen, por un lado, en que es difcil obtener una
especificacin clara del campo de contenido. Por ejemplo: en el contenido de los conceptos
matemticos en los grados primero a tercero, podra determinarse revisando las guas
curriculares de 5 estados; sin embargo, las guas de los planes de estudios entre ellos difieren
ligeramente. Suponga que se revisan las guas de los 5 estados, por ah 3 incluyan
conocimientos de las unidades mtricas, en los grados de 1 a 3, pero otros dos tal vez
pospongan este tema hasta el 4 grado. Cmo se maneja esto?
Por otro lado, al aplicar la validez de contenido se da al juzgar qu tan bien los reactivos de la
prueba cubren los elementos de las especificaciones de contenido. Los reactivos que tienen
una clasificacin comn pueden variar mucho en cuanto a las habilidades que exigen. Por
ejemplo: muchos reactivos diferentes aplican a una categora de contenido como hechos
bsicos de la multiplicacin todos estos reactivos son apropiados por igual? Todos miden
igual de bien la categora del contenido? Tal vez no. La persona que juzga la validez del
contenido debe examinar los reactivos reales de la prueba y no basarse exclusivamente en una
lista de las categoras. En el anlisis final, la validez del contenido exige juicio y no slo revisar
cuadros en un esquema.
39- Realice de manera sucinta un recorrido por los principales hitos en la historia de
la evaluacin psicolgica.
Desde Fernndez-Ballesteros (resea histrica)
El primer perodo conceptualizado como "mtico" resume el inters del hombre de todos
los tiempos por comprender, describir, categorizar, predecir y explicar a las personas. Es la
astrologa y el horscopo la forma evaluativa ms antigua y permanente de todos los tiempos
(aun hoy)
En un segundo momento "racional-especulativo", encontramos las races de la evaluacin
psicolgica en disciplinas tales como la filosofa (Aristteles) y la medicina. Una primera
aproximacin al diagnstico psicolgico a travs de la interpretacin del carcter y hbitos
psicolgicos a partir de las caractersticas corporales. Tambin debemos incluir aqu las
concepciones cartesianas de la dualidad en la composicin humana hacia el estudio de la
conciencia a travs de la intuicin.
Empirismo Wright (1601) sustenta que son los hechos externos, las acciones sin
mediaciones inferenciales las U.de anlisis sobre las que debe basarse la evaluacin psi.
Hipcrates la teora de los cuatro temperamentosabre el estudio de las tipologas
patolgicas.
S XVIII y XIX: aportes del positivismo y empirismo. Avances en la medicina, distintos logros q
permiten la constitucin de la psi como disciplina cientfica (avances en la medicin de lo
subjetivo por la sensacin y a travs del autoinforme Weber y Fechner) la psicofsica
contribuye a la actual psicometra, con la diferencia que por ese entonces no haba
preocupacin por medir las diferencias individualesLaplace y Quetelet: aplicabilidad de los mtodos estadsticos al Comp. Humano.
En el s XIX se produce la divisin de dos corrientes en psiquiatra: organicista y psicologistacaracteriza a este siglo: un afn clasificatorio y la bsqueda de procedimientos evaluativos de
los padecimientos psiquitricos se convierten en dos objetivos bsicos.
A partir de la escolarizacin obligatoria en algunos pases europeos de la segunda mitad del S
XIX, brinda un campo de aplicacin fructfero a los principios psicolgicos y es motivo de
abundantes investigaciones psicosociolgicas.
Cattell en 1890 el trmino "test mental" cuyo objetivo es ser "un sistema uniforme que permite
comparar y combinar en lugares y momentos diferentes", la medida de las funciones mentales.
La evaluacin psicolgica comienza a esbozarse en 1896 cuando publica un estudio realizado
con dos bateras de tests para medir aspectos psicolgicos y realiza trabajos no solo sobre
funciones perceptivas sino tambin sobre procesos superiores como memoria y asociacin
verbal.
En relacin con la Evaluacin Psicolgica, A. Binet (1875-1911) define los tres grandes
problemas de la Psicologa individual: estudiar las diferencias individuales de los procesos
psicolgicos, estudiar las diferencias psquicas en individuos aislados o en grupos de individuos
y estudiar las relaciones de diferentes procesos psquicos en un mismo individuo. As, centra la
instrumentacin de su metodologa en los "tests mentales" cuyas reglas fundamentales sern:
1) Que los mtodos sean simples y no lleven mucho tiempo; 2) que los medios de
determinacin sean independientes de la persona del examinador; 3) que puedan compararse
los resultados obtenidos por un observador con los de otro. En 1903, publica el primer test de
inteligencia. (Ficha 1)
Las races de las pruebas y la evaluacin psicolgica contempornea pueden
encontrarse en Francia a principios del Siglo XX. En 1905 Alfred Binet y un colega
haban publicado una prueba que fue diseada para ayudar a colocar a los nios parisienses en
edad escolar en clases apropiadas, esto tuvo repercusiones en Estados Unidos. En ese pas se
estaba estudiando el uso de pruebas psicolgicas por primera vez en el ejrcito. Tanto en la
primera como en la segunda guerra mundial, las pruebas cumplieron con el objetivo de
examinar con rapidez a grandes cantidades de reclutas en busca de problemas intelectuales y
emocionales. En el S.XX se produce un incremento significativo de los instrumentos de
medicin, surgen autores tratando de establecer diferencias individuales en el desarrollo y la
maduracin de los proceso mentales.
1927 Spearman publica un libro sobre el factor general de la inteligencia por otro lado esta
Piaget con planteos sobre el diagnostico del pensamiento con escalas estandarizadas para
medir la inteligencia con instrumentos clsicos facilitando tambin la exploracin cognitiva de
sujetos perturbados.
1942 Hathaway y McKinnley editan el Inventario Multifsico de Personalidad de Minnesota
que evala diferentes rasgos. 1955-1959 Cronbach: propone la validez de constructo. El
apogeo de las pruebas psicolgicas se dio en la dcada de 1950 y principios de la de 1960. Se
administraban pruebas en escuelas, en instituciones de salud mental, en dependencias
gubernamentales, etc. Prueba era el trmino usado para referirse a todo, desde la
administracin de una prueba hasta la interpretacin de la evaluacin de la misma, durante la
2 guerra m. empez a incluirse el trmino evaluacin.
Durante esta poca la evaluacin psi se caracteriza por la medicin de atributos psi tanto en la
cognicin como en la personalidad, vemos tambin en distintos mbitos la aplicacin de estos
hallazgos en la realidad socialLa psicometra se convierte as en uno de los pilares bsicos de la psicologa de las diferencias
individuales, en cuanto a la medicin de los atributos psicolgicos, dando a la evaluacin y al
diagnstico una productividad tecnolgica invalorable.
*41 Histricamente, uno de los primeros usos de las pruebas fue la evaluacin de lo que los
individuos haban aprendido en determinadas reas de contenido y por ello se comparaba el
contenido de esas categoras de pruebas con el del rea que pretendan probar. Luego, el
nfasis recay en la prediccin y actualmente existen dos tendencias una hacia el
fortalecimiento de la orientacin terica y la otra hacia una estrecha vinculacin entre la teora
y la verificacin psicolgicas mediante la comprobacin emprica y experimental de las
hiptesis.
Contribuciones de la Psicologa Cognitiva: la dcada del setenta plante un acercamiento
entre la Psicologa experimental y la Psicometra que as empieza a hacer aportaciones
importantes a la comprensin de los constructos evaluados por las pruebas de inteligencia con
mtodos informticos. Ya en los cincuenta los psiclogos cognitivos empezaron a aplicar los
conceptos del procesamiento de informacin al estudio de la solucin de problemas en el ser
humano. Entre las tareas investigadas con esos mtodos se incluyen rompecabezas, problemas
de lgica, lgebra y fsica. Los modelos cognitivos especifican los procesos intelectuales
empleados para realizar la tarea, la forma de organizacin de los procesos, el almacenamiento
del conocimiento relevante y la forma en que se representa en la memoria y se recupera
cuando se necesita. Tambin se est dando importancia a la meta cognicin que se refiere al
control que el individuo ejerce sobre su eleccin de procesos, representaciones y estrategias
para realizar tareas. La investigacin ayuda al avance en la elaboracin y uso de las pruebas. El
aporte principal es haber focalizado la atencin en los procesos de respuesta en vez de
concentrarse en los productos finales del pensamiento. El anlisis de la ejecucin en la prueba
en trminos de los procesos cognitivos especficos, sin duda, mejorar nuestra comprensin de
lo que miden las pruebas. El analizar el desempeo individual a nivel de los procesos
elementales permitir identificar los puntos fuertes y dbiles de cada persona y por ende
aumentar el uso diagnstico de las pruebas (Sternberg y Weil, 1980).
En resumen, la relacin entre psicometra y P. Cognitiva es complementaria (feedback) desde el
punto de vista de la investigacin y prctica aplicada; y recproca desde el punto de vista de la
teora y la investigacin bsica.
(Ficha 2)
Una de los debates surgidos ltimamente es el impacto de la computadora en los procesos de
evaluacin, este elemento como arma de doble filo puede implicar avances por favorecer a las
investigaciones y en el almacenamiento y tratamiento de los datos. Por otro lado no considera
la importancia del rol del psi en el proceso de evaluacin. Otro problema es la adecuacin de
test a la cultura a la cual se aplica.*
40-Qu relacin existe entre el sesgo y el contexto cultural en la adaptacin de
test? Defina cada concepto y relacinelos.
Una adaptacin implica considerar no slo las palabras utilizadas al traducir la prueba sino
tambin las variables culturales involucradas. Tres niveles de adaptacin de las pruebas
psicolgicas.
El primero corresponde al de la aplicacin, este es, la simple y llana traduccin de un test de un idioma a otro
pero sabemos que una correcta traduccin no asegura un significado unvoco.
Validez de facie: la validez de contenido no debe confundirse con la validez aparente que no es
validez en el sentido tcnico porque no se refiere a lo que la prueba verdaderamente mide sino
a lo que parece medir. Aunque usar el trmino validez puede resultar confuso,
La validez de facie es en s misma un rasgo deseable de los instrumentos, porque alude a
que la prueba parece vlida para quien la administra, quien la responde y para otros
observadores. Esta validez puede mejorarse replanteando los reactivos para que parezcan
relevantes y plausibles en medio particular en que sern usados por ejemplo es posible
elaborar una prueba de aritmtica para personal naval en la terminologa nutica sin alterar
con ello las funciones medidas.
44-En el contexto jurdico se necesita contar con tcnicas vlidas y confiables que
sustenten el diagnstico aportado. Desarrolle esta afirmacin incluyendo los
conceptos de validez y confiabilidad.
En el mbito jurdico se necesita contar con tcnicas vlidas y confiables, ya que es necesario
que el psiclogo pueda corroborar si el sujeto evaluado presenta peligrosidad para s o para
terceros; competencia para ser sometido a juicio; posee responsabilidad criminal; est
preparado para la libertad condicional o bajo palabra; para el diagnstico y evaluacin del dao
emocional; evaluacin de custodia; caractersticas del nio en pos de la eleccin de una
familia; evaluacin. Del abuso sexual y el maltrato infantil.
Por lo tanto, es necesario que la tcnica mida el constructo que deseamos evaluar, y que se
lleven a cabo de una manera en que los datos obtenidos, posean consistencia interna de las
puntuaciones. Luego trato de rever esta respuesta.
45-Mencione y describa cules son las teoras psicomtricas y los autores que las
sustentan. Explique brevemente las diferencias entre cada una de ellas.
Teoras de los Tests
Existen diversos paradigmas o modelos que permiten explicar el significado de las
puntuaciones obtenidas con los Tests. El anlisis da como resultado:
La estimacin del nivel en que poseen los sujetos la(s) caracterstica(s) que mide el test
(valores escalares de los sujetos)
La estimacin de los parmetros de los tems (valores escalares de los tems).
Toda teora de test tiene como objetivo analizar estas dos cuestiones
El objetivo de cualquier teora de tests es realizar inferencias sobre el nivel en que los sujetos
poseen la caracterstica o rasgo inobservable que mide el test, a partir de las respuestas
observables. As para medir o estimar las caractersticas latentes de los sujetos es necesario
relacionar stas con la actuacin observable en una prueba y esta relacin debe de ser
adecuadamente descrita por una funcin matemtica. Las distintas teoras de tests difieren
justamente en la funcin que utilizan para relacionar la actuacin observable en el test con el
nivel del sujeto en la variable inobservable. Y sirven para dar cuenta del error de medida
inherente a toda medicin psicolgica o estimacin del error; y proporcionar una estimacin del
rasgo o caracterstica evaluada (estimacin del rasgo)
Teora clsica de los test:
Iniciada por Spearman su principal exponente, quien crea el coeficiente de correlacin que es el
ndice numrico que expresa la relacin entre dos variables, sostiene que la puntuacin
observable de una persona en un test es una funcin de dos componentes: su puntaje
verdadero (inobservable) y el error de medicin implcito en la prueba
El puntaje verdadero de un sujeto en un test sera el promedio aritmtico de las puntuaciones
empricas obtenidas en infinitas aplicaciones
La TCT es, en sntesis, el conjunto de principios tericos y mtodos cuantitativos
derivados de ellos, que fundamentan la construccin, aplicacin, validacin e
interpretacin de distintos tipos de tests y que permiten derivar escalas
estandarizadas aplicables a una poblacin.
Se han elaborado procedimientos de anlisis cuantitativo, a destacar 3 etapas:
1 etapa que Cattell (1986) denomina itemetra, se caracteriza principalmente por la
Tienen una gran validez de contenido y pronostican muy bien el desempeo en una variedad
de contextos (validez suceptible de generalizarse a estos) aunque por cuestiones legales,
ciertos datos deben ser resguardados, estos ofrecen buena prediccin acerca del desempeo
laboral.
ENTREVISTA SEMIESTRUCTURADA: entrevista: mtodo antiguo de uso frecuente para la
evaluacin de personalidad. Proporciona informacin acerca de lo que la persona dice y hace
(conducta no verbal) pero poniendo nfasis en los contenidos verbales. Puede definirse como:
un intercambio verbal cara a cara en el cual una persona entrevistador- intenta obtener
informacin o expresiones de opinin o creencia de otra persona. (Incluye: antecedentes de
vida: acontecimientos, sentimientos, percepciones y expectativas.-)
Se emplean en distintos contextos
La entrevista es laboriosa, es tanto un arte (lograr un buen rapport) como una ciencia-dinmica
de interacciones. Es recomendable crear un buen clima cmodo y libre de distractores. Ver
temas y preguntas de la entrevista.- ver perfil y condiciones del entrevistador
Segn las caractersticas del entrevistador el tipo de estructura seleccionada.
Las entrevistas semi estructuradas se caracterizan por ser mas flexible en el contenido y en el
tiempo de las preguntas. Requieren as ms habilidad, son ideales cuando lo que se pretende
es obtener una imagen profunda de la personalidad.
COHEN- SWERDLIK
entrevista es una tcnica para recopilar informacin por medio de la discusin. Una entrevista
semi estructurada deja al entrevistador ahondar en distintas reas segn su juicio.
47-Por qu decimos qu el proceso evaluativo se construye en funcin de los
objetivos? Defina y explique cada concepto.
Proceso de construccin de los test (resumen)
Construccin de test: 3 fuentes:
Muchos test se originan en respuesta a una necesidad prctica (ver Binet, Weschler, MMPI.)
derivan de un fundamento terico importante (ej.: matrices progresivas. Raven) teoras pueden
generar nuevas pruebas, que primero se utilizaran con fines investigativos, luego se aplicaran a
distintos contextos. gran de trabajo de elaboracin de tests se dedica a adaptar o revisar los
instrumentos ya existentes, desde principios de siglo XX se conoce el impacto del lenguaje y la
cultura sobre el resultado de los test.-diferencias significativas.Para el diseo y la elaboracin del test : debemos preguntarnos: Qu medir la prueba, cual
es su formato ideal, que tipo de respuestas dar , cual es su contenido, cual es su objetivo,
para q se necesita esta prueba, quien la usara, que capacitacin necesitara esta persona y
como la aplicara, como se interpretaran los resultados?
Estas cuestiones se resuelven a partir de la concepcin terica que se tenga en psicometra
Definicin del dominio de un test: la construccin de una escala de medicin de algn aspecto
del comportamiento humano requiere previamente un exhaustivo anlisis conceptual del
dominio o rasgo a medir as como de los indicadores operacionales son adecuados para
describirlo.
En la medicin del rendimiento se pueden utilizar pruebas referidas a criterios o referidas a
normas.
En la construccin de una prueba con referencia a criterios: se define y delimita el dominio de
conductas correspondientes a cada objetivo. Siguiendo dicha definicin se elaboran los tems
que evaluarn ese dominio de conductas y todos los desempeos individuales sern referidos a
ese dominio. El dominio puede ser de conductas, objetivos, destrezas y competencias y la
amplitud del dominio vara en funcin de la finalidad del test.
Para la elaboracin de pruebas por normas: se parte de la construccin de una tabla de
especificaciones que es una tabla de doble entrada por medio de la cual se relacionan los
objetivos cuyo logro se desea evaluar con los contenidos especficos correspondientes. A partir
de esta tabla se determina la cantidad de tems que conformar la prueba y se lleva a cabo su
redaccin.
Si el dominio comprende ms de un objetivo pueden construirse subtests para cada objetivo, y
se evala el rendimiento de los sujetos en cada uno de ellos. Para la especificacin del dominio
de conductas o clase de tareas que el individuo debe realizar, seguiremos el esquema
i.
construccin de respuesta
Revisin del Test por Expertos
Las tres caractersticas que los expertos deben evaluar en cada tem son:
a) claridad semntica y correccin gramatical
b) adecuacin de su dificultad al nivel educativo y evolutivo de las personas
c) congruencia con el rasgo o dominio medido (esto ultimo refiere al grado de consistencia
entre el tem y las metas a las q pretende llegar la prueba. Sera un factor para la confiabilidad
y validez).
Se recomienda que los tems seleccionados sean aquellos en que, al menos, un 60% de los
jueces coinciden.
Es til tambin incluir preguntas que demanden informacin cualitativa sobre los tems lo que
puede facilitar un mejoramiento en el fracaso de algunos de ellos.
Anlisis y Seleccin de tems
El primer paso para obtener informacin psicomtrica sobre los tems de pruebas homogneas
consiste en administrar los elementos preliminares a una muestra amplia (superior a 300
sujetos) que sea representativa de la poblacin que se quiere evaluar en la prueba final. Para
descartar los tems que no funcionan bien debe contarse con una cantidad de sujetos por lo
menos cinco veces superior al nmero inicial de reactivos y aproximadamente el doble de tem
de los que aparecern en la versin definitiva de la medida.
El ideal ronda entre los 300 a 400 sujetos para estudios correlacionales. Al reducirse el tamao
de la muestra hacen su influencia factores determinantes que luego pueden afectar a la V Y CEl procedimiento ms empleado en el anlisis inicial de reactivos es la correlacin de cada uno
de ellos con el puntaje total de la prueba o de las sub escalas (en caso de q las tenga).
El estadstico usual es el producto momento de Pearson (r) o correlacin punto biserial si se
trata de tem dicotmicos (si/no, verdadero/falso). Los tem con correlaciones no significativas o
bajas (inferiores a .30) se eliminan o se revisan y se conservan los menos ambiguos. Los
distractores sern aquellos que obtengan correlaciones negativas con los puntajes de la
prueba.
El ndice de dificultad de los reactivos tiene un rango de 0 a 1 y se simboliza como p. Un
reactivo cuyo p es 0 est indicando que ningn sujeto contest correctamente y un reactivo
con p igual a 1 es aquel que todos los sujetos respondieron correctamente. El valor ptimo de p
para un reactivo depende de varios factores.
Si el propsito del test es identificar slo un porcentaje reducido de los mejores postulantes
para un empleo, por ejemplo, entonces los tems de la prueba deberan ser lo suficientemente
difciles y tener un valor medio-bajo de p. Para pruebas convencionales de habilidades se
recomiendan valores p entre .20 y .80.
Deben eliminarse los reactivos donde la mayora de los sujetos de la muestra obtiene el mismo
puntaje puesto que tales elementos de prueba no discriminan entre los evaluados (Bandura,
2001)
Las pruebas referidas a criterios evalan y seleccionan los tems de una forma particular,
diferente a las pruebas referidas a normas. El anlisis se realiza comparando los resultados de
un grupo antes de aplicar un programa de aprendizaje y despus del mismo, o comparando dos
grupos similares, uno de ellos, que recibi capacitacin y el otro no. Al calcular el ndice de
dificultad los resultados esperados son, tems con alta dificultad para los grupos que no han
pasado por el proceso de aprendizaje, y baja dificultad para los que han sido sometidos al
proceso de instruccin. En cuanto al ndice de discriminacin, obtenido por la comparacin
entre grupos, se espera mxima discriminacin entre los grupos y mnima entre los individuos
de un mismo grupo.
Una vez realizada la aplicacin de la prueba piloto y habiendo obtenido resultados estadsticos
sobre el comportamiento de cada tem se podrn tomar decisiones sobre cules de ellos deben
integrar la forma final del test y hacer estimaciones de su confiabilidad y validez mediante
algunos de los procedimientos ya conocidos.
La lgica de este proceso de anlisis es que todos los reactivos se relacionen con un ncleo
comn de medicin que es el constructo o dominio, informacin que se obtiene aplicando a los
reactivos de una escala el coeficiente alfa de Cronbach, debemos asegurarnos valores de.80 o
superiores. Los tems con correlaciones bajas con el puntaje total se pueden remover para
incrementar el valor del alfa. Si bien un coeficiente alfa elevado es una condicin necesaria de
unidimensionalidad esta propiedad solo es garantizada por el anlisis factorial, paso decisivo
para asegurar la unidimensionalidad de cualquier escala homognea y el primer paso en un
conjunto inicial de tem heterogneos (sin un explcito marco terico previo) este es
esencialmente un mtodo para agrupar las variables que se correlacionan fuertemente entre s
y cuyas correlaciones con las variables de otros agrupamientos es menor, es un mtodo
estadstico en el cual las variaciones en los puntajes de un nmero de variables son explicadas
por un nmero ms reducido de dimensiones o constructor (factores). Una distincin inicial:
anlisis factorial exploratorio: se extraen factores sin una estructura terica previa conjeturada
de modo explcito. (Los principales mtodos de este tipo son: Anlisis de Componentes
Principales, Ejes Principales y el de Mxima Probabilidad.
Anlisis factorial confirmatorio: los factores son definidos a priori en base a un modelo terico
y en este caso, el anlisis intenta verificar qu tan bien se adaptan los datos observables a ese
modelo.
Antes de este procedimiento hay que hacer una medida de adecuacin de muestreo que es el
KAISER-MAYER-OLIKIN que consiste en determinar si los tems estn suficientemente
interrelacionados (p: .80 o ms)
El anlisis factorial debe realizarse sobre muestra extensas no inferiores a 300 sujetos
p/obtener datos tiles.
En el enfoque psicomtrico actual, el anlisis factorial se utiliza ms como estrategia
confirmatoria de un modelo terico previo, en especial, dentro del marco metodolgico del
Modelo de Ecuaciones Estructurales. De modo contrario se corre el riesgo de obtener
estructuras puramente empricas dependientes de la muestra escogida y no replicables con
facilidad.
Estas estrategias analizadas son congruentes con la Teora Clsica de los Tests.