Vous êtes sur la page 1sur 28

1.

Defina y relacione los siguientes trminos de manera precisa: Evaluacin


Psicolgica, Medicin y Escala
Fernndez Ballesteros define la evaluacin PsicolgicaEs aquella disciplina de la psicologa
cientfica que se ocupa de la exploracin y el anlisis del comportamiento ( a los niveles de
complejidad que se estime oportunos) de un sujeto humano o grupo especificado de sujetos
con distintos objetivos bsicos o aplicados (descripcin, diagnostico, seleccin, prediccin,
explicacin, cambio y/o valoracin) a travs de un proceso de toma de decisiones en el que se
encardinan la aplicacin de una serie de dispositivos, tests y tcnicas de medida y/o
evaluacin.
La EP es una rama especfica de la psicologa que se desarrolla en distintos mbitos: clnico,
educacional, comunitario, laboral, etc. LA EP propone estrategias metodolgicas especficas
con el objetivo central de poder verificar o estimar en qu medida se alcanzan las metas de las
acciones propuestas o se accede a la obtencin de datos de un constructo o variables bajo
estudio. Las tareas en la EP clnica incluyen todos los procesos relacionados con el estudio de
individuos, grupos o comunidades en relacin al proceso de salud-enfermedad
Uno con la informacin que tiene trata de ordenarla para entenderla, el nivel de medicin sirve
simplemente para interpretar los datos
La medicin es un proceso que permite identificar y ubicar atributos de una variable con
respecto a un marco de referencia, ese marco de referencia puede ser el numrico. Cuando los
nmeros cumplen slo una funcin simblica, que sirve para categorizar, estamos en el nivel
nominal de medicin. En el SCL 90 R la variable que podemos encontrar en este nivel son el
sexo, el estado civil, etc. Cuando se puede establecer una relacin de mayor y menor, posibilita
una diferenciacin y un ordenamiento jerrquico segn categoras, este es el nivel ordinal. Por
ejemplo en e SCL, las variable miedo a desmayarme, sentirme culpable, o sentirme triste,
responden a este nivel de medicin. El nivel de medicin intervalar cuanta con un cero relativo,
o sea no indica ausencia del atributo. En el SCL la variable que se encuentra en este nivel es la
fecha que se tom.
Medir en psicologa es observar conductas y clasificarlas. Asignar nmeros a propiedades de
objetos y acontecimientos y conductas, de acuerdo con ciertas reglas.
Escalas o niveles de medicin: NOMINAL: para categorizar, clasificar, valores arbitrarios
excluyentes (sinti malestar ultimas 2 semanas si no)
ORDINAL establece relaciones de grado, de mayor a menor, ICV muy satisfecho mas o menos
poco nada
DE INTERVALOS relacin entre el valor y la medida, el 0 es arbitrario, se pueden realizar
operaciones aritmticas. EJ prueba de inteligencia
de COCIENTES Y RAZONES: el 0 implica ausencia del atributo Ejemplo: nivel de ingresos del
sujeto en la prueba LISRES.
2. Cules son los pasos para alcanzar una adecuada adaptacin de los tests
psicolgicos que provienen de otros contextos culturales?
Segn Mikulic en la ficha F2; Los efectos de las diferencias que no sean relevantes para los
objetivos centrales del estudio deben minimizarse en la medida de lo posible.
Debera de evaluarse la cuanta del solapamiento de los constructos en las poblaciones de
inters.
Adaptacin de los tests:
Los constructores/editores deberan;
De asegurarse que el proceso de adaptacin tiene en cuenta las diferencias lingsticas y
culturales entre las poblaciones a las que se dirigen las versiones adaptadas de los tests;
proporcionar datos que garanticen que el lenguaje utilizado en las instrucciones, en los propios
tem y en el manual del tests, son apropiados para todas las poblaciones culturales e
idiomticas a la que va dirigido el tests; de aportar evidencias de que las tcnicas de
evaluacin elegidas, los formatos de los tems, las reglas de los tests y los procedimientos son
familiares a todas las poblaciones a las que van dirigidos.
De facilitar evidencia de que el contenido de los tems y de los materiales de los estmulos son
familiares. A todas las poblaciones a las que van dirigidos.

De aportar una justificacin racional sistemtica, tanto lingstica como psicolgica, para
mejorar la precisin del proceso de adaptacin, as como reunir datos acerca de la equivalencia
de todas las versiones en los distintos idiomas.
De asegurarse que el diseo de recogida de datos permite el uso de tcnicas estadsticas
apropiadas para establecer la equivalencia entre los tems correspondientes a las diferentes
versiones idiomticas del tests
Aplicar tcnicas estadsticas apropiadas para; 1) establecer la equivalencia entre las diferentes
versiones de un tests e 2) identificar componentes problemticos o aspectos del tests que
puedan ser inadecuados para alguna de las poblaciones a las que va destinado el test
De proporcionar informacin sobre la evaluacin de la validez en todas las poblaciones objetivo
a la que va dirigido el test adaptado.
De aportar datos estadsticos sobre la equivalencia de los tests para todas las poblaciones a
las que van dirigidos
No deben utilizarse preguntas no equivalentes en todas las versiones dirigidas a diferentes
poblaciones cuando se prepara una escala comn, o cuando se comparan estas poblaciones.
Sin embargo, pueden ser tiles para reforzar la validez de contenido de las puntuaciones de
cada poblacin por separado.
3. Se suele afirmar que la entrevista es un instrumento poco confiable. Discuta esta
afirmacin desde el concepto de confiabilidad presentado por Hogan y considerando
las particularidades de la entrevista como instrumento de recoleccin de datos.
La validez se relaciona con lo que mide una prueba, especficamente si mide lo que pretende
medir, en tanto que la confiabilidad solo se relaciona con la consistencia de la medicin, al
margen de lo que mida exactamente. Una medicin puede ser confiable sin ser valida; por ej.,
una prueba de qumica puede ser muy confiable, pero tal vez sea un indicador de habilidad
matemtica que de conocimiento sobre qumica. Aunque una prueba puede ser confiable sin
ser valida, no puede ser valida a menos que sea confiable.
En segundo lugar, el termino confiabilidad se distingue de el de uso cotidiano. La confiabilidad
de las pruebas tiene un sentido ms tcnico y cualitativo. Los mejores sinnimos en psicologa
del trmino tcnico de confiabilidad son consistencia, replicabilidad y fiabilidad. Una prueba
confiable, en sentido psicomtrico, es la que consistentemente genera la misma puntuacin o
una similar en el caso de un individuo. La calificacin puede replicarse (o reproducirse) al
menos con cierto margen de error. Podemos fiarnos (o depender) de que una prueba confiable
genere en buena medida la misma puntuacin en un individuo.
En 3 lugar debe distinguirse entre cambio real en el rasgo medido y fluctuaciones atribuibles a
los cambios fugaces en las circunstancias personales, la suerte de sorteo en cuanto ala forma
en que se toma una prueba, o las diferencias debidas a quien califica la prueba. Los cambios
reales en el rasgo medido no son fuente de inestabilidad (o falta de confiabilidad). Los otros
factores mencionados se consideraran normalmente fuentes de inestabilidad, aunque no lo
serian si uno trata de medir cambios en el estado anmico y emocional. No hay una
demarcacin clara entre cambios temporales de corto plazo, pero la distincin es
conceptualmente importante.
En 4 lugar, es indispensable distinguir entre errores constantes y errores no sistemticos en
las mediciones. Un error constante es aquel que genera una puntuacin sistemticamente
elevada o baja en una persona al margen de la constancia que haya en la condicin de la
persona en el rasgo medido. Por ej., considere el nivel de inteligencia de un nio cuyo idioma
materno es el espaol, pero a quien se le evala en ingles; el nivel de inteligencia del menor,
probablemente se subestime y esta subestimacin tal vez sea relativamente constante, ya sea
que al nio lo evalen el martes o el jueves. La confiabilidad no explica estos errores
constantes, solo se relaciona con errores no sistemticos. Observe que lo que se denomina
errores constantes no constituye realmente factores constantes sino tendencias que
desplazan las puntuaciones en cierta direccin.
FALTA MECHARLO CON ENTREVISTA
4. Defina y relacione los siguientes conceptos: Psicodiagnstico, Test y Anlisis
Ecoevaluativo

Segn a. Blanco El psicodiagnstico... Es la asignatura que capacita para el conocimiento,


comprensin y aplicacin de la conducta de un sujeto y que permite la orientacin y prediccin,
orientacin y/o tratamiento del sujeto individual con datos procedentes de la confluencias de
fuentes mltiples y con dependencia de la intervencin psicolgica que se realice en ella
. El psicodiagnstico es un proceso a travs del cual los clnicos obtienen necesaria
comprensin del paciente para poder tomar decisiones. vila (1992) dice que el
psicodiagnstico es una disciplina especfica relacionada con la psicologa como ciencia, que no
puede resumirse en una mera tecnologa psicolgica. El psicodiagnstico brinda el estudio
descriptivos, comprensivo, y explicativo de los comportamientos de los sujetos o grupos
humanos en relacin con los contextos socioculturales. Se llama psicodiagnstico a algo que
tiene como variable el proceso salud-enfermedad.
Siguiendo a Anastasi y Urbina, un test es un instrumento de evaluacin cuantitativa de los
atributos psicolgicos de un individuo. La Asociacin de Psiclogos Americanos (1999), propone
una conceptualizacin abarcativa y exhaustiva al definir un test como un procedimiento
evaluativo por medio del cual una muestra de comportamiento de un dominio especificado es
obtenida y posteriormente evaluada y puntuada empleando un proceso estandarizado.
La evaluacin psicolgica ha vivenciado una evolucin de tipo centrfugo e integrativa, desde el
interior del sujeto hacia el anlisis de sus contextos. Esta evolucin ha sido expansiva a partir
del sujeto, (Forns y Santacana, 1993), y ha incorporado el triple anlisis de la realidad:
Como externa al sujeto: Anlisis de las circunstancias externas como entidades que por su
relacin funcional con el individuo creaban cambios o mantenan la conducta de un sujeto;
Como interactiva y constructiva con el individuo: proceso de mutua determinacin en la
interaccin sujeto y objeto
Como sustantiva en s misma: anlisis de contextos y anlisis de la incidencia de las acciones
psicosociales ejercidas sobre la conducta de los sujetos.
Hemos arribado a una evaluacin ecolgica, multicontextual y que se focaliza en plurivariables
personales, enfocada desde una perspectiva interaccional, lo que hace al afn por buscar las
modulaciones de unas variables sobre otras y las pistas causales, entre variables.
Este anlisis eco psicolgico, se caracteriza por ser (Forns, 1993):
Plurivariable: se analizan las caractersticas de un sujeto, considerndolo en s mismo como
un contexto con multiplicidad de variables de distinta naturaleza: es el contexto intrapersonal.
Ecolgico: se analiza la conducta del sujeto en el propio contexto en que se produce.
Interaccional: se analizan las relaciones de interdependencia entre las variables, en busca de
las lneas de causalidad de la conducta.
Multicontextual: se analizan variables macrocontextuales fsicas, afectivas-emocionales,
creencias y valores, etc.; las exigencias contextuales y la variabilidad situacional y temporal
entre tales contextos.
A nivel tecnolgico en esta rea se ha pasado de la simple descripcin, clasificacin, prediccin
y explicacin de la conducta de sujetos a evaluar dimensiones ambientales que permitan la
evaluacin de las relaciones hombre-medio y la evaluacin de contextos, ambientes o
situaciones especficos. El psiclogo evaluador ha incorporado a su rol el de valorador de
intervenciones la importancia del contexto (mbito geogrfico, histrico y social) en la
valoracin misma.
Tipos de evaluacin
Evaluacin del sujeto en su contexto
Aqu nos interesa fundamentalmente: a) Evaluar los ambientes significativos para el sujeto en
funcin de los objetivos de evaluacin; b) Evaluar cmo perciben los sujetos las variables
ambientales y contrastar si sus percepciones son concordantes con las de otros habitantes de
dicho contexto; c) Analizar las relaciones funcionales entre los comportamientos del sujeto y su
entorno; d) Obtener datos sobre las variables ambientales funcionalmente relacionada con los
comportamientos-criterio y que se manipularn si se requiere una intervencin; e) El ambiente
se evala en cada valoracin de programas de accin propuestos. El ambiente real es tan
importante como el ambiente percibido, a la hora de considerar el contexto en su complejidad.
Evaluacin de contextos: El ambiente puede ser estudiado desde una perspectiva ideogrfica, o
sea, un concreto contexto segn como lo percibe el sujeto. Esta evaluacin esta sustentada
desde cuatro orientaciones tericas:
Psicologa ecolgica que plantea el estudio de los escenarios de conducta.

La ecologa social cuyo exponente principal es R. Moos, centra su inters en variables


ecolgicas, dimensiones estructurales de la organizacin, caractersticas de los habitantes del
contexto y dimensiones psicosociales de grupos e instituciones. Sus objetivos son descriptivos
y clasificatorios y su concepto fundamental es el de "clima social"
El enfoque conductista-ecolgico focaliza en el anlisis de las relaciones funcionales entre el
ambiente y la conducta
El enfoque cognitivo-perceptivo se centra en el estudio del ambiente percibido y, a travs de l,
pretende llegar a formular una psicologa ambiental descriptiva y clasificatoria.
Evaluacin valorativa de intervenciones en contextos debido a que el ambiente tiene una
dimensin diacrnica relevante, es fundamental en la evaluacin de intervenciones que se
desarrolla en un tiempo determinado, tener en cuenta que el contexto sufre una serie de
modificaciones, no controladas, que pueden influir en los resultados. Por ello coincidimos con R.
Fernandez Ballesteros que tiene en cuenta 4 clases de anlisis de contextos en la evaluacin de
intervenciones; 1) el contexto gra. De pertenencia(S), definido por las condiciones fsicas,
sociales, culturales e histricas del mbito en el que se produce el problema que se pretende
tratar, motor de la intervencin; 2) el contexto de aplicacin (s), definido por las condiciones
fsicas, sociales, culturales e histricas del mbito especifico, donde se realizan los
tratamientos, se seleccionan las unidades y se observan las operaciones; 3) el contexto
diacrnico (s-), presenta a lo largo de toda intervencin y definido por los cambios que se
producen en las condiciones de s; 4) el contexto de generalizacin (S*) o ambientes donde
van a ser generalizados los resultados de las evaluaciones.
En sntesis, la evaluacin debe considerar en cualquier mbito en que pretenda analizar
cientficamente la conducta de un sujeto, grupo de sujetos o una determinada intervencin; el
contexto o entorno o ambiente especifico en el que el objeto de evaluacin se encuentra
inmerso. Falta completar
5. Porque es importante adaptar los instrumentos de evaluacin? Relacione la
adaptacin con los contextos de aplicacin.
Aplicacin
A1. Los constructores y los aplicadores de los tests deberan tratar de prever los tipos de
problema que cabe esperar, y tomar las medidas oportunas para evitarlo mediante la
preparacin de materiales e instrucciones adecuados.
A2. Quienes aplican los tests deberan de ser sensible a cierto numero de Editores relacionados
con los materiales utilizados para los estmulos, los procedimientos de aplicacin, y las formas
de respuesta, que pueden reducir la validez de las inferencias extradas de las puntuaciones.
A3. Aquellos aspectos del entorno que influyen en la aplicacin de los tests deberan de
mantenerse lo mas parecido posible para todas las poblaciones a las que va dirigido el tests.
A4. Las instrucciones para la aplicacin del test en el idioma fuente y en el objetivo deben
minimizar la influencia de la variacin no deseada.
A5. El manual del test debera de especificar todos los aspectos del test y de su aplicacin que
han de revisarse al utilizarlo en un nuevo contexto cultural.
A6. El aplicador no debe de interferir, debiendo minimizarse su influencia sobre los
examinados. Deben de seguirse al pie de la letra las reglas explicitas descritas en el manual del
test.
Una adaptacin implica considerar no slo las palabras utilizadas al traducir la prueba sino
tambin las variables culturales involucradas. Tres niveles de adaptacin de las pruebas
psicolgicas.
El primero corresponde al de la aplicacin, este es, la simple y llana traduccin de un test de
un idioma a otro pero sabemos que una correcta traduccin no asegura un significado unvoco.
La segunda alternativa es la adaptacin. En este caso a la traduccin se agrega la
transformacin, adicin o substraccin de algunos tems de la escala original. Como se explic,
algunos tems pueden cambiar su significado a travs de las culturas y, por lo tanto, necesitan
modificaciones o ser eliminados. As mismo tems que no existen en la versin original del test
pueden representar mejor al constructo en la poblacin en la cual se administrar la nueva
versin.
Finalmente, la opcin ensamble En este caso el instrumento original ha sido modificado tan
profundamente que prcticamente se ha transformado en un nuevo instrumento original con
los nuevos elementos, as se vuelve inadecuado. El ensamble tambin se da cuando el

constructo no est representado de forma adecuada por la versin original en la cultura a la


que se quiere adaptar la prueba.
Tcnicas de Traduccin
El proceso de traduccin es complejo e implica ms que la traduccin lineal de las palabras
escritas a un nuevo lenguaje. Existen dos mtodos comunes:
La traduccin directa: aqu un grupo de traductores traducen el test desde el idioma original al
nuevo idioma. Luego, otro grupo de traductores, juzga la equivalencia entre las dos versiones.
De este modo pueden realizarse las correcciones pertinentes en las dificultades o errores
identificados por los traductores.
La traduccin inversa: un grupo de traductores realiza una traduccin desde el idioma original
al nuevo idioma; luego un segundo grupo de traductores toma el test traducido (en el nuevo
idioma) y vuelve a traducirlo al idioma original. Seguidamente se realizan las comparaciones
entre la versin original y la versin retraducida al idioma original para determinar su
equivalencia.
6. Cmo mejorara la validez y confiabilidad de la entrevista como tcnica de
evaluacin? Defina los conceptos utilizados.
La entrevista es una herramienta psicologica importante, pero comparte con los metodos de
observacin los problemas de confiabilidad y validez. L aconfiabilidad requiere consistencia,
pero los entrevistadores varan en su apariencia, enfoque, estilo y, en consecuencia, en la
impresin que causan en los entrevistados. Las impresiones diferentes producen diferencias en
la conducta; una persona puede ser amistosa y comunicativa con un entrevistador, mientras
que con otro sea hostil y distante. Adems las percepciones que el entrevistador tiene del
entrevistado pueden ser distorsionadas por sus experiencias y personalidad.
La confiabilidad de una entrevista se determina, por lo regular, comparando las calificaciones
dadas a las respuestas del entrevistado por 2 o mas jueces. La magnitud de un coeficiente de
confiabilidad entre calificadores calculado a partir de esas calificaciones varia con la
especificidad de las preguntas planteadas y las conductas calificadas; por lo generales mas alta
para la entrevistas estructuradas y semiestructuradas que para las no estructuradas. Sin
embargo, aun cuando las preguntas sean bastantes objetivas y se planteen en un formato
estructurado, la confiabilidad entre calificadores de los datos de la entrevista usualmente no es
mayor de 80.
Revisiones mas recientes subrayan el hacho de que las entrevistas pueden hacerse mas validas
mediante la planeacin y estructuracin cuidadosa y el entrenamiento minucioso de los
entrevistadores. Los resultados de una entrevista tienen mayor validez cuando el entrevistador
se centra en la informacin especifica (de trabajo o clnica) y las respuestas se evalan
pregunta a pregunta (de referencia por 2 o mas evaluadores), mas que como un todo. Para
facilitar este proceso, toda la entrevista debe registrarse electrnicamente para su
reproduccin y evaluacin posterior. As, la tarea de interpretar las respuestas de un
entrevistado puede separarse de manera ms efectiva del proceso real de la entrevista. Pero
no es suficiente con el registro de una entrevista en una cinta de video, y especialmente en una
cinta de audio. Las palabras habladas y las imgenes no siempre son claras, y el tono
emocional y las variables contextuales con frecuencia se pierden en un registro electrnico. Por
esta razn, se necesita un observador humano alerta que tome buenas notas para
complementar el registro electrnico de una entrevista.
7. Establezca la relacin entre Evaluacin Psicolgica y las siguientes nociones:
Psicodiagnstico, Test y Valoracin.
P4- EVALUACION PSICOLOGICA se define el uso del trmino evaluacin argumentando que s
priorizan los aspectos positivos de la conducta humana mientras que con el trmino anglosajn
psicodiagnstico
se
detectan
patologas
es aquella disciplina de la psicologa cientfica que se ocupa de la exploracin medicin y el
anlisis del comportamiento tanto de aspectos cualitativos como cuantificables/cuantitativos
segn la tcnicas (...) de un sujeto humano o grupo especificado de sujetos con distintos
objetivos bsicos o aplicados (descripcin, diagnstico, seleccin, prediccin, explicacin,

cambio y/o valoracin) a travs de un proceso de toma de decisiones en el que se encardinan


la aplicacin de una serie de dispositivos, tests y tcnicas de medida y/o evaluacin
La "evaluacin" implica el anlisis de una serie de variables conductuales y ambientales
significativas, en un sujeto o grupo de sujetos, en un momento determinado; la "valoracin"
tiene por finalidad la estimacin del valor de un determinado tratamiento, programa o
intervencin que se ha aplicado en un contexto a un sujeto o grupo de sujetos especficos.
Un test lo que busca obtener es que un grupo o sujeto sean estimulados a realizar determinado
tipo de actividades para despus ser evaluados en relacin a su grupo de pertenencia. Un test
supones tres cosas: 1) una situacin estandarizada 2) la posibilidad de poder estimar
diferencias individuales en relacin a los datos estadsticos obtenidos 3) contar con la
informacin. Las tcnicas psicomtricas no son test, no estn hechas en base a la idea de
normas o baremos.
Definiendo, entonces, valoracin como lo hace R. Fernndez Ballesteros (1987) vemos que sta
implica un proceso mediante el cual se trata de estimar, a travs de una metodologa emprica,
si se han alcanzado una serie de objetivos socialmente relevantes formulados al aplicar una
determinada intervencin. En cuanto a la identificacin y medicin de las variables en
valoracin, se utilizan las pruebas de las ciencias sociales: observacin, informaciones de
terceros, etc.
8. Explique la siguiente afirmacin y relacinela con lo aprendido en la cursada:
La escala de ejecucin del WAIS III slo requiere adaptacin mtrica
9. Proponga algunas estrategias para superar los obstculos y limitaciones que
posee la entrevista en trminos de validez y confiabilidad.
10. Discuta la siguiente afirmacin: La evaluacin psicolgica que pretenda ser
rigurosa y responsable debe basarse en resultados obtenidos con pruebas
estandarizadas y tipificadas. Defina y relacione los conceptos utilizados.
11. Explique la siguiente afirmacin y relacinela con los pasos en la adaptacin de
tcnicas: La escala verbal del WAIS III slo requiere adaptacin lingstica
12. La informacin que se obtenga sobre la validez relacionada con un criterio en
una prueba de rendimiento, puede usarse al analizar la validez de constructo. Defina
cada una de las nociones implicada en la pregunta.
Validez en Relacin a un Criterio:
Indican la efectividad de la prueba para predecir el desempeo del individuo en actividades
especficas. La medida de criterio contra la que se validan los resultados del instrumento puede
obtenerse aproximadamente al mismo tiempo que los resultados de la prueba o despus de un
intervalo establecido
Se debe tener en cuenta la contaminacin del criterio como fuente de error en la validacin de
la prueba, es decir, una precaucin esencial es asegurar que los propios resultados no influyan
en la condicin del criterio de cualquier individuo. X ello los resultados deben mantenerse
estrictamente confidenciales. Medidas de criterio: los criterios empleados para encontrar las
distintas clases de validez que se informan en los manuales caen en determinadas categoras.
Para las pruebas de inteligencia, por ejemplo, el ndice de aprovechamiento acadmico, razn
por la cual se describen como medidas de aptitud acadmica. Los ndices especficos utilizados
como medidas de criterio son: las calificaciones escolares, los resultados de pruebas de
aprovechamiento, los registros de promocin y de graduacin, los honores y reconocimientos
especiales y las valoraciones de docentes e instructores sobre la inteligencia de los
individuos. Para muchos propsitos la medida de criterio ms satisfactoria es la que se basa en
registros de seguimiento del desempeo laboral real, criterio empleado en la validacin de
tests de inteligencia general. Es comn que se citen las correlaciones entre una prueba nueva y
pruebas validadas previamente como evidencia de validez. Existen otros procedimientos de

validacin que no desarrollaremos como el mtodo de grupos contrastados o las valoraciones


de expertos como psiquiatras, maestros, supervisores laborales, etc.
En la construccin de una prueba con referencia a criterios: se define y delimita el dominio de
conductas correspondientes a cada objetivo. Siguiendo dicha definicin se elaboran los tems
que evaluarn ese dominio de conductas y todos los desempeos individuales sern referidos a
ese dominio. El dominio puede ser de conductas, objetivos, destrezas y competencias y la
amplitud del dominio vara en funcin de la finalidad del test.
METODOS PARA VALIDEZ DE CONSTRUCTO:
Que mida el constructo tal como lo define tericamente
1 anlisis factorial: que todas las conductas del constructo esten representadas
2 correlacion con otras pruebas que midan el mismo constructo (criterio)
3 efecto de las variables emperimentales hallar diferencias entre grupos diagnosticado.
Al referirnos a la Validez, estamos hablando de que una tcnica realmente mida la variable que
dice medir. La Validez refiere a qu y cmo mide lo que mide. La Validez es el valor que ms
afecta el resultado de una prueba. Hay tres tipos: a) Predictiva: Saber en qu medida, la prueba
predice un logro o un comportamiento. b) Concurrente: Se tiene en cuenta cuando la prueba
psicomtrica se propone en lugar de otra informacin. Se obtiene mediante la aplicacin de dos
tcnicas independientes que miden el mismo constructo a los mismos sujetos y se mide la
correlacin de los resultados, c) De Contenido: Supone un examen sistemtico del contenido
para determinar si comprende una muestra representativa del constructo o variable que
pretende medir y d) Estructural o de constructo: Es el grado en que una tcnica mide un
constructo o concepto en la medida en que es buena operacionalizacin del mismo.
15-Describa los siguientes mtodos: formas alternas, consistencia interna y divisin
por mitades. Cul es la utilidad de cada mtodo? Ejemplifique uno de ellos con
alguna de las pruebas administradas.
Formas alternas: exige que haya dos formas de la prueba, que deben ser iguales o muy
similares, en trminos de cantidad de reactivos, limites de tiempo y otros factores similares.
Consiste en aplicar ambas formas de la prueba a los mismos examinados. La confiabilidad de la
misma es la correlacin, normal de Pearson, entre las puntuaciones obtenidas de las dos
formas.
Las formas alternas de la prueba pueden aplicarse en sucesin inmediata si son breves y poco
exigentes, de lo contrario quizs el intervalo sea de unos cuantos das o semanas.
Cuando se aplica en sucesin inmediata mide solo la inestabilidad o falta de confiabilidad
debida al muestreo de contenido. En pruebas con un intervalo ms amplio mide la inestabilidad
debida al muestreo de contenido y los cambios en las condiciones personales y variaciones en
la aplicacin.
No se utiliza muy a menudo por que resulta bastante difcil elaborar una prueba, ms aun dos o
ms formas alternas.
Consistencia interna: Es uno de los mtodos que se utiliza con mayor frecuencia para
expresar la confiabilidad de un instrumento psicomtrico. Hay diferentes mtodos para
determinarla: divisin por mitades, Kuder-Richarson y coeficiente alfa. Todos estos mtodos
buscan la caracterstica comn de la consistencia interna de un instrumento. Estos mtodos
generan un coeficiente de confiabilidad a manera de correlacin, si embargo estos son claros.
Divisin por mitades: Aqu se considera la aplicacin de una sola prueba pero que se
calificara por mitades, como si cada mitad fuese una forma alterna de la prueba. Luego se
correlacionan las puntuaciones sobre las dos mitades de la prueba.
La prueba no se divide exactamente en una primera mitad y en segunda mitad de la prueba
por que por lo general la segunda parte incluye reactivos ms difciles y se estar ms cansado
hacia al final de la prueba. Por lo tanto el mtodo que se utiliza es consiste en dividir la prueba
en reactivos de nmero par y non. En este caso, el resultado se conoce como confiabilidad nonpar. La correlacin entre las dos mitades no da la confiabilidad de la prueba completa, a ella
debe aplicrsele una correlacin que genera toda la confiabilidad de todo el instrumento que se
denomina Spearman-Broun.
Un ejemplo de confiabilidad basada en la consistencia interna es el inventario de calidad de
vida.

16- Cual es el modelo de evaluacin que subyace al Inventario de Respuestas de


Afrontamiento CRI? No olvide referirse al marco terico y autor de la prueba.
El modelo de evaluacin que subyace al Inventario de Respuestas de Afrontamiento es el
inventario (de papel y lpiz) que consta de una serie de preguntas a contestar en el protocolo
de repuesta cuyos autores son Rudolf H. Moos y B. Moos, es una prueba que permite analizar la
interaccin entre el individuo y su entorno a travs de un concepto central que es el
afrontamiento definido como aquellos esfuerzos cognitivos y conductuales constantemente
cambiantes que se desarrollan para manejar las demandas especificas externas y/o internas
que son evaluadas como excedentes o desbordadores de los recursos del individuo.
Este inventario ha sido traducido y adaptado por la Dra. I. M. Mikulic y su equipo de
investigacin.
Desde un marco conceptual ecolgico social, combina dos perspectivas al evaluar el
afrontamiento de un sujeto, por un lado considera la orientacin o el foco del afrontamiento y
por el otro el mtodo de afrontamiento. Desde el foco de afrontamiento las respuestas se
dividen en aproximacin o evitacin. Cada uno de estos dos grupos de repuestas se divide en
dos categoras que reflejas los mtodos de afrontamiento cognitivo y conductual.
19-Cmo construira una prueba para evaluar calidad de vida? Mencione y explique
cada paso a seguir. Hogan, T (2004)
Hay seis etapas principales en la elaboracin de pruebas, las cuales no siempre estn del todo
diferenciadas.
La elaboracin de una prueba comienza con un claro planteamiento de la finalidad del
instrumento, que consiste en delinear el o los rasgos que se medirn y la audiencia meta de la
prueba.
Luego se debe determinar si ya existe una prueba apropiada para la finalidad planteada.
La segunda etapa de diseo preliminar consta de decidir sobre las interpretaciones que se
busca dar a las puntuaciones, as como las consideraciones de orden prctico. En consecuencia
deben ahondarse los siguientes aspectos: Se debe determinar si la prueba se aplicara en forma
individual o a un grupo, el tiempo aproximado de duracin de la prueba, que formato se
utilizara para
los reactivos (opcin mltiple, verdadero o falso, etc.), la cantidad de
puntuaciones que generara la prueba, la clase de reporte de las puntuaciones, cuanta
capacitacin se necesitara para la aplicacin y la calificacin. Tambin es posible que se
necesite realizar una investigacin de antecedentes sobre el mbito que se probar la prueba.
Estas consideraciones de diseo determinaran qu clase y qu cantidad de reactivos se
redactarn y pueden conducir a una depuracin en el planteamiento de la finalidad de la
prueba.
Etapa 3 de preparacin de los reactivos: incluye tanto la redaccin de stos como su revisin.
El reactivo de una prueba posee 4 partes: el estmulo al cual responde el examinado, el formato
de respuesta, las condiciones que rigen, y los procedimientos para calificar la respuesta.
Unas ves que se han redactado los reactivos se someten a una revisin desde varias
perspectivas. En funcin de su claridad, correccin gramatical, y conformidad con las reglas
para redactar reactivos. Tambin se hace una revisin de la correccin de contenido y se
buscan posibles sesgos de gnero raciales o tnicos.
Etapa 4 Anlisis de reactivos: Esta es una etapa crucial en la elaboracin de pruebas, pues
conlleva el anlisis de los datos obtenidos al someter aprueba los reactivos. Consiste en tres
procesos muy relacionados: prueba de los reactivos, anlisis estadistico y seleccin de
reactivos. La prueba de reactivos consta de dos etapas una formal y una informal. En la etapa
informal se aplican los reactivos a unos 5 y 10 individuos similares a aquellos a los que se
pretende administrar la prueba y se les pide que comenten los reactivos y las instrucciones. La
prueba formal supone aplicar los nuevos reactivos de la prueba a muestras representativas de
la poblacin meta de examinados.
El anlisis estadstico: los procedimientos tradicionales de anlisis de reactivos, dependen de
dos conceptos: el ndice de dificultad del reactivo que alude al porcentaje de examinados que
responden de manera correcta y discriminacin del reactivo que alude a la capacidad de un
reactivo para diferenciar en trminos estadsticos en una forma deseada entre los grupos de
examinados.

Tambin un anlisis de reactivos suele ofrecer informacin sobre el comportamiento de los


distractores. Su anlisis genera informacin sobre la comprensin o malentendido en relacin a
un reactivo y sirve para efectuar la revisin de un reactivo, para ver si esta atento etc.
El anlisis factorial se emplea para ayudar a elegir los reactivos que generan relativas
puntuaciones independientes y significativas.
En cuanto a la seleccin de reactivos, de todos los reactivos preparados y evaluados se
seleccionan los que aparecern en la prueba que se estandarizara.
La quinta Etapa: programa de estandarizacin y de investigacin auxiliares
En esta etapa se generan las normas de la prueba, las cuales suelen analizarse de acuerdo al
genero, la educacin, zona geogrfica, etc. Se trata de un importante aspecto de la diligencia
que se emprende al elaborar una prueba. Uno de sus resultados ms importantes es el baremo
e implica instrucciones, cantidad de reactivos, limites de tiempo, materiales a utilizarse, etc.
La sexta y ltima etapa: preparacin de materiales finales y publicacin
Adems de la impresin de un cuadernillo, tiene que ver con las instrucciones de aplicacin e
interpretacin, manuales tcnicos, los reportes de puntuaciones y otros materiales
complementarios.
25. Qu es un sesgo? Qu tipos de sesgo conoce? Explique al menos dos de los que
considera ms frecuentes.
Segn Martinez Arias, el sesgo de los tests se convirti en un tema dominante en los aos
sesenta, utilizndose el trmino para referirse a diferencias de grupo no justificadas por el
constructo y/o por el objetivo del test.
Asimismo, Hogan dice que el sesgo en la prueba significa que una prueba funciona de manera
diferente con distintos grupos. Una prueba esta sesgada se mide diferentes constructos o
genera pronsticos distintos. Slo hay sesgo si las diferencias en los promedios no
corresponden a una diferencia real en el rasgo subyacente que la prueba trata de medir. Una
prueba sin sesgo debe generar predicciones adecuadas para varios grupos.
Otra definicin aceptada es la de Camilli y Shepard (1994): sesgo de un test es una fuente de
invalidez o de error sistemtico que se refleja en cmo un test mide a los miembros de un
grupo particular.
En las investigaciones psicomtricas sobre el sesgo, se han seguido dos aproximaciones
estadsticas para su deteccin; una de ella utiliza un criterio externo al test y la otra un criterio
interno, normalmente las puntuaciones en el propio test. Osterlind (1979) define el externo
como: Sesgo externo es el grado en que las puntuaciones del test muestran correlaciones con
variables irrelevantes para su interpretacin y ajenas a ste.. Este mismo auto define el sesgo
interno mediante las propiedades estadsticas de los tems, en cuanto que se comportan de
forma diferente en distintos subgrupos de sujetos extrados de la misma poblacin.
En el contexto de la validez relacionada con el criterio, hay dos tipos de sesgo posibles: de
interseccin y de la pendiente. El sesgo de interseccin tiene que ver con la relacin entre las
medias del grupo en la prueba y el criterio, y se exhibe si sistemticamente subpredice o
sobrepredice una ejecucin del criterio para una grupo particular. El sesgo de la pendiente
tiene que ver con el coeficiente de validez, y se produce cuando hay validez diferencial, es
decir, cuando el coeficiente de validez es significativamente diferente en dos grupos.
Van de Vijver y Tanzer (1997) identificaron diferentes fuentes de sesgo:
a) Sesgo de constructo: Este tipo de sesgo se da cuando el constructo medido no es
idntico a travs de los grupos culturales (Van de Vijver y Tanzer, 1997). La importancia que
cada cultura otorga a ciertas conductas se encuentra en esta categora. Conductas de tica y
civismo que en algunas sociedades pueden ser normales en otras pueden constituir un
verdadero rasgo de rigidez y asemejarse a una conducta obsesivo compulsivo.
Aquellos constructos, que tienen y han demostrado caractersticas universales se los denomina
ticos, mientras que aquellos que son utilizables slo en uno o pocos grupos culturales se los
denomina micos.
b) Sesgo metodolgico: Este sesgo reconoce tres formas.
El sesgo de muestra: que se da cuando las muestras son incomparables entre s. La cantidad
de aos de escolaridad que poseen los sujetos de una muestra es una variable determinante en
el desempeo del mismo en un test determinado, especialmente si se trata de un test de
habilidad. El nivel sociocultural, la motivacin, la composicin por genero y edad de los sujetos

son otras variables que pueden hacer incomparables a dos muestras que pueden mostrar
resultados muy diferentes en un test determinado.
El sesgo en el instrumento: que puede provenir de las caractersticas del instrumento. La
familiaridad que los sujetos tienen con los estmulos presentados tiene una gran importancia.
Algunos estmulos son elementos utilizados en algunas culturas y no existen en otras o son
irrelevantes. El tem de ejemplo en el Sub. Test de Ordenamiento de lamina WISC III que
muestra a una mujer frente a una maquina expendedora de latas de gaseosa tiene muy poco
valor en culturas rabes, por ejemplo, o en zonas rurales de nuestro pas. El idioma es otra
fuente de sesgo de instrumento. La traduccin de un idioma a otro frecuentemente
subestimada, es un problema importante que requiere una metodologa especifica a seguir, con
lo que tambin se considera los modos de escritura y lectura de cada cultura (entre los idiomas
occidentales existen diferencias como que en ingles no existe la que el alfabeto sueco
contiene mas vocales, y en portugus existen distintos tipo de a. Los mtodos de respuesta
constituyen otra fuente de sesgo del instrumento. Las lminas de respuestas del Test de
Matrices Progresivas de Raven que implica completar una secuencia lgica con una figura
opcional, incluyen la figura faltante al final de la segunda fila, con lo que asume una lectura de
izquierda a derecha. Este hecho fue demostrado por Carpenter, Just y Shell (1990) en un muy
preciso estudio que implica una serie de desventajas para los sujetos de las culturas rabes
quienes involuntariamente van a intentar resolver la prueba de derecha a izquierda, forma en
que se lee su idioma.
El sesgo de administracin: incluye problemas tales como dificultades en la comunicacin, es
decir, dificultades para que el entrevistado entienda las instrucciones del entrevistador ya sea
por la dificultad de las palabras utilizadas, el modo de explicacin de las instrucciones o un
inadecuado manejo del idioma de alguna de las partes. Tambin se incluyen las alteraciones en
la manera de administrar las pruebas. Normalmente los manuales incluyen instrucciones de
administracin que en muchos casos no son adecuadas para la poblacin a aplicar. Los
administradores del Test entonces adaptan esas instrucciones segn su criterio personal. Otro
punto importante es el uso de cronmetros que produce serias alteraciones en los resultados.
Sesgo de tem: Se produce cuando el mismo tiene diferentes significados en distintas culturas.
Ciertos grupos culturales pueden obtener puntajes significativamente distintos en un tem
determinado a pesar de obtener un puntaje total similar. La deseabilidad social o la relevancia
cultural, entre otros factores, pueden producir el sesgo de tem. Tanzer (1995) demostr que
aunque la estructura factorial de un Test de autoconcepto acadmico era similar cuando se lo
aplico a estudiantes australianos y singaporeanos, existan diferencias sustanciales entre estas
muestras cuando se compararon algunos tems especficamente. Este tipo de sesgos tambin
acta en test neuropsicologicos.
26. Piense en una prueba cuyo objetivo es evaluar Inteligencia. Cmo la validara?
Explique por lo menos tres tipos de validez.
Validara una prueba cuyo objetivo es evaluar Inteligencia por medio de la Validez relacionada
con el Criterio, en el contexto de Validez Concurrente, ya que es adecuada para las pruebas
que se emplean para diagnosticar el estado actual. Revisara la concordancia entre el
desempeo en la prueba y la condicin actual en alguna otra variable. Este se diferencia de la
Validez Predictiva por el tiempo de la variable del criterio, ya que este busca pronosticar la
condicin en algn criterio a la que se llegar en el futuro. Como criterio empleara otra prueba,
demostrando la correlacin entre la prueba que se validar y algn otro instrumento que se
sabe o supone que es un indicador vlido del constructo de inters.
Una medida de criterio para las pruebas de inteligencia es el ndice de aprovechamiento
acadmico, razn por la cual se describen como medidas de aptitud acadmica. Los ndices
especficos utilizados como medidas de criterio son: las calificaciones escolares, los resultados
de pruebas de aprovechamiento, los registros de promocin y de graduacin, los honores y
reconocimientos especiales y las valoraciones de docentes e instructores sobre la inteligencia
de los individuos.
Otra validez que demostrara sera la Validez de Constructo. Este consiste en evidenciar que la
prueba mide el constructo. Utilizara el Anlisis Factorial para identificar las dimensiones
comunes que subyacen al desempeo en muchas mediciones diferentes. Esta tcnica ayuda a
comprender la estructura de las pruebas, de modo que las tcnicas son una fuente relevante
de informacin para la validez de constructo. Esta tcnica estadstica sirve para analizar las

interrelaciones de los datos conductuales y reducir el nmero de variables o categoras en


cuyos trminos puede describirse el desempeo de cada individuo a un nmero relativamente
pequeo de factores o rasgos comunes. Una vez que los factores se han identificado, sirven
para describir la composicin factorial de las pruebas.
A su vez, utilizara el estudio de los Cambios en el Desarrollo para evidenciar la Validez del
Constructo. Este consiste en contrastar a grupos a edades o grados diferentes. En este caso,
cabe esperar que los nios a edades sucesivamente mayores cuenten con una capacidad
mental cada vez superior.
Un rasgo deseable de la prueba es la Validez Aparente, que no es una validez en el sentido
tcnico porque no se refiere a lo que la prueba mide verdaderamente, pero seala el hecho de
que una prueba parece medir su constructo meta.
Asimismo, utilizara la Validez de Contenido, demostrando el grado de correspondencia entre el
contenido de la prueba y el del campo de inters. El contenido de la prueba abarca una
muestra representativa de todos los posibles contenidos del campo, por lo que hay que hacer
un examen sistemtico del contenido de la prueba para determinar si cubre una muestra
representativa del rea de conducta que debe medirse.
27. Qu implica realizar un uso responsable y tico de las pruebas en la evaluacin
en contexto laboral?
En el mundo de los negocios, las pruebas se usan en particular en el rea de recursos
humanos. Los psiclogos usan pruebas y procedimientos de medicin para evaluar cualquier
conocimiento o habilidad en las que se necesite ser evaluado un empleado, un candidato a ser
empleado, para tomar decisiones de asensos, transferencias y elegibilidad para una mayor
capacitacin.
28. Mencione algunas estrategias, al menos dos, que considere tiles a los fines de
analizar los reactivos de una prueba en construccin.
El procedimiento ms empleado en el anlisis inicial de reactivos es la correlacin de cada uno
de ellos con el puntaje total de la prueba. Si el test consta de diversas subescalas, cada tem
debe correlacionarse con el puntaje total de esa parte, no con el puntaje total de la prueba.
En las pruebas de habilidades (tems dicotmicos) es importante conocer el ndice de dificultas
de cada tem, o sea el porcentaje de personas que responden acertadamente al reactivo
analizado. La proporcin de acierto de un tem es un estimador adecuado de la dificultad de un
tem. Sin embargo, esta informacin hay que complementarla con la distribucin de frecuencias
en todas las opciones de respuesta (en elecciones mltiples) y las estimaciones de proporcin
para diferentes rangos de puntuacin en la prueba total. Con la misma lgica deben eliminarse
los reactivos donde la mayora de los sujetos de la muestra obtiene el mismo puntaje puesto
que tales elementos de prueba no discriminan entre los evaluados (Bandura, 2001).
Las pruebas referidas a criterios, como explica Martinez Arias (1995), se evalan y seleccionan
los tems de una forma particular, diferente a las pruebas referidas a normas. El anlisis se
realiza comparando los resultados de un grupo antes de aplicar un programa de aprendizaje y
despus del mismo, o comparando dos grupos similares, uno de ellos que recibi capacitacin,
y el otro no.
Una vez realizada la aplicacin de la prueba piloto y habiendo obtenido resultados estadsticos
sobre el comportamiento de cada tem, se podr tomar decisiones sobre cules de ellos deben
integrar la forma final del test y hacer estimaciones de su confiabilidad y validez mediante
algunos de los procedimientos ya conocidos.
La lgica de este proceso de anlisis es obtener pruebas lo ms homogneas posible, es decir,
donde todos los reactivos se relacionen con un ncleo comn de medicin que es el constructo
o dominio, informacin que se obtiene aplicando a los reactivos de una escala el coeficiente de
Cronbach, por ejemplo.
El paso decisivo para asegurar la unidimensionalidad de cualquier escala homognea y el
primer paso en un conjunto inicial de tems heterogneos es el anlisis factorial (Martinez Arias,
1995). El anlisis factorial es esencialmente un mtodo para agrupar las variables que se
correlacionan fuertemente entre s y cuyas correlaciones con las variables de otros
agrupamientos es menor (Airen, 2003). El anlisis factorial debe realizarse sobre muestras
extensas no inferiores a 300 sujetos para obtener datos tiles.

29. Defina el concepto de confiabilidad relacionndolo con el sesgo en la medicin.


Relacinelo con el concepto de fuente de error.
Una prueba confiable es consistente y precisa. Las pruebas psicolgicas son confiables en
grados diversos. Las diferencias en el desempeo de un sujeto pueden estar causadas por
diversas razones: distinta motivacin en las diversas situaciones en que fue evaluado, distintos
niveles de cansancio o de ansiedad, estar ms o menos familiarizado con el contenido del test,
etc. Por todo ello, los puntajes de una persona contienen una cierta cantidad de error. El
puntaje que obtiene una persona en una prueba incluye un puntaje real y un margen de error
que puede aumentar o disminuir dicha puntuacin verdadera. Este error de medicin, aleatorio
e impredecible, se distingue de los errores sistemticos que tambin afectan el desempeo de
los evaluados por un test, pero de una manera ms consistente que aleatoria.
Los errores sistemticos pueden afectar a todas las observaciones por igual y ser un error
constante, o afectar a cierto tipo de observaciones de manera diferente que a otras y ser un
sesgo.
Las causas por las cuales los puntajes obtenidos por un evaluado pueden no ser confiables son
fuentes de error, y algunas fuentes son:
Al construir o adaptar un test: hay que prestar atencin a la seleccin de los tems y a la
formulacin de las consignas, cuidando principalmente el muestreo del contenido para evitar
que sea tendencioso o insuficiente. Los tests son ms confiables a medida que aumenta el
nmero de respuestas alternativas para evitar los efectos de la adivinacin.
Al administrar un test: todos los evaluados deben tener las mismas condiciones, tratando de
controlar posibles interferencias ambientales como el ruido, la iluminacin o en confort del
lugar. Las consignas deberan ser estandarizadas, especialmente en lo referido al control de los
tiempos para la realizacin del mismo.
Al evaluar un test: se deben sostener los criterios de evaluacin.
30. Qu caractersticas generales debera reunir una evaluacin ecolgica,
multicontextual y plurivariable? Defina cada uno de los trminos tcnicos empleados
en la pregunta.
La evaluacin psicolgica ha vivenciado una evolucin de tipo centrfugo e integrativa, desde el
interior del sujeto hacia el anlisis de sus contextos, incorporando un triple anlisis de la
realidad: como externa al sujeto, como interactiva y constructiva con el individuo y como
sustantiva en s misma.
De esta manera se arrib a una evaluacin ecolgica, multicontextual y que se focaliza en
plurivariables personales, enfocada desde una perspectiva interaccional, reconociendo la
influencia conjunta de una pluralidad de fenmenos para lograr la descripcin y explicacin de
la conducta.
Segn Forns (1993), el anlisis ecopsicolgico se caracteriza por ser:
Plurivariable: se analizan las caractersticas del sujeto, considerndolo en s mismo como un
contexto con multiplicidad de variables de distinta naturaleza. Este es el contexto
intrapersonal.
Ecolgico: se analiza la conducta del sujeto en el propio contexto en que se produce.
Interaccional: se analizan las relaciones de la interdependencia entre las variables, en busca de
las lneas de causalidad de la conducta.
Multicontextual: se analizan variables macrocontextuales, las exigencias contextuales y la
variabilidad situacional y temporal entre tales contextos.
31. Cmo obtendra la equivalencia mtrica de una prueba psicolgica? Incluya para
su respuesta la nocin de Baremo. Ejemplifique con una prueba utilizada en la
cursada.
32. Explique la diferencia entre las tcnicas psicomtricas y proyectivas incluyendo
los conceptos de validez y confiabilidad.
Las tcnicas psicomtricas y proyectivas pertenecen a distintos modelos centrados en el sujeto.

Las tcnicas psicomtricas pertenecen al Modelo de Atributos, el cual considera que la


conducta est determinada por atributos intrapsquicos o variables organsmicos (habilidades,
intereses o rasgos) que diferencian a unos sujetos de otros. Utilizan en general la metodologa
correlacional para determinar las diferencias individuales y ubicar al sujeto en relacin al grupo
normativo. Las variables intrapsquicas son evaluadas mediante tests estandarizados
construidos segn estrategias terico relacionales, empricas y factoriales, apoyndose en el
supuesto de estabilidad de la conducta. Tienen como objeto describir, clasificar y predecir el
comportamiento del sujeto.
En cambio, las tcnicas proyectivas pertenecen al Modelo Psicodinmico, el cual considera que
los factores intrapsquicos constituyen la causa de la conducta manifiesta y se producen bajo la
forma de impulsos, motivos, deseos y conflictos. Las variables objetos de estudio son los
procesos y los recursos adaptativos a su servicio, y la accesibilidad del sujeto al tratamiento
psicoanaltico. Su objetivo es ayudar al cambio teraputico, dndole menor importancia a la
clasificacin nosolgica o a la comparacin interindividual. El mtodo que utiliza es inductivo a
partir de observaciones clnicas, de las que se infieren los elementos dinmicos y estructurales
que dan cuerpo a la conducta y que permiten su comprensin.
Por otro lado, Fernndez Ballesteros (1980) clasifica las tcnicas y tests relacionando sus
respectivos enfoques tericos y metodolgicos.
De las tcnicas Psicomtricas dice que son altamente sofisticados, con material estandarizado
y tipificado en sus tres fases fundamentales: aplicacin, correccin e interpretacin. Tienen una
mxima estructuracin del contenido y tienen validez y confiabilidad.
De las tcnicas Proyectivas dice que son sensibles para revelar aspectos inconscientes de la
conducta, permitiendo provocar una amplia variedad de respuestas subjetivas. Son de sustrato
dinmico y material variado. Logran la proyeccin del mundo privado, permiten organizar el
campo, interpretar el material y reaccionar ante l afectivamente.
El problema ms serio de las tcnicas proyectivas es que pertenece a un modelo que tiene
presupuestos inmunes a la contrastacin emprica. Por lo tanto, resulta difcil establecer su
validez. A pesar de esto, en los ltimos aos se realizaron serios esfuerzos por mejorar la
confiabilidad de algunos instrumentos de evaluacin.
33. Refirase brevemente al nacimiento de la Psicometra. Qu aporte novedoso
implica la mirada ecopsicolgica?
Uno de los primeros en hablar de medicin en psicologa fue C. Wolff en el S. XVII, quien
adems de introducir la distincin entre una psicologa emprica y racional, introdujo tambin el
concepto de Psicometra al plantear que puede medirse la magnitud de la atencin por el
tiempo durante el cual hemos seguido un razonamiento (R. Lpez Feal, 1986). Ya en el siglo
XIX, Herbart (1776-1841) sostiene que los razonamientos de la psicologa deben ser
matemticos y se plantea la necesidad de cuantificar las diferencias son apenas perceptibles y
las diferencias individuales en la percepcin. A finales de dicho siglo, al publicarse Biometra
de Galton y Pearson se inaugura el uso de trminos como psicometra, econometra y
sociometra.
Dos hitos importantes en esta corta historia de la Psicologa y la medicin son: la fundacin de
la Sociedad Psicomtrica en 1935, con el propsito primario de promover el desarrollo de la
Psicologa como una ciencia racional cuantitativa; y la publicacin de la revista Psychometrika
en 1937 autoproclamndose revista no-estadstica y reunindose con la Asociacin Americana
de Psicologa (APA). Otro saber fundamental para esta rama del saber psicolgico, es la
bifurcacin operacional en dos vertientes de la psicologa cuantitativa, que Cronbach (1957)
denomina las dos disciplinas de la psicologa cientfica: la Psicologa Experimental, con
mediciones en situaciones controladas y manipuladas de laboratorio; y la Psicologa
Correlacional, con estudios de diferencias individuales y tests mentales clsicos.
Actualmente existen dos disciplinas acadmicas representantes de la dicotoma metodolgica
de la medicin en Psicologa: la Psicologa Experimental y la Psicometra.
34. Relacione y defina los siguientes conceptos dando cuenta de su utilidad en la
Evaluacin Psicolgica: normas, test y equivalencia mtrica.
Segn Cohen y Swerdlik (2001), la evaluacin psicolgica es la recopilacin e integracin de
datos relacionado con la psicologa, con el propsito de hacer una valoracin psicolgica,

lograda con el uso de herramientas como pruebas, entrevistas, estudios de caso, observacin
conductual y aparatos y procedimientos de medicin diseados en forma especial.
Segn Pelechano (1976), el test implica un instrumento sistemtico y tipificado que
compara la conducta de dos o ms personas.
Mikulic define los tests psicolgicos como tcnicas sistemticas que comparan la conducta de
dos o ms personas. Lo esencial de un test es poder observar si revela distintas
individualidades que se mantienen constantes en igualdad de circunstancias.
Siguiendo a Anastasi & Urbina (1998) entendemos que un test es un instrumento de evaluacin
cuantitativa de los atributos psicolgicos de un individuo. La A.P.A (1999), propone una
conceptualizacin abarcativa y exhaustiva al definir a un Test como un procedimiento
evaluativo por medio del cual una muestra de comportamiento de un dominio especificado es
obtenida y posteriormente evaluada y puntuada empleando un proceso estandarizado.
Los tests tienen tres cualidades fundamentales:
Funciones:
-Seleccin y Clasificacin, colocando al individuo en el puesto que le corresponde,
o
en
el
nivel
de
rendimiento
segn
el
contexto.
-Valoracin de los Procedimientos, valorando individuos y mtodos o decidiendo la tcnica que
es
ms
idnea.
-Verificacin de Hiptesis Cientficas, proporcionando una medida ms objetiva que la que
pudiera suministrar una simple impresin.
Estandarizacin:
Siendo determinadas de antemano para su aplicacin en distintos lugares
y tiempo, y suministrando la informacin de qu puntuaciones suelen obtener muestras
representativas correspondientes.
Objetividad: Es variables segn el test, siendo el ms objetivo aquel al que todos los
observadores le asignan el mismo valor a una ejecucin determinada.
Segn Martinez Arias, las principales caractersticas de los tests son:
-Ser medidas objetivas
-Representar una muestra de conducta
-Es una tcnica sistemtica y estandarizada
-Permite obtener puntuaciones que se pueden comparar
-Las puntuaciones obtenidas se utilizan para la prediccin o inferencia de otras conductas.
En los instrumentos psicolgico, las puntuaciones suelen interpretarse haciendo referencia a
normas que representen el desempeo de la muestra de estandarizacin en la prueba; es
decir, las normas se establecen empricamente al determinar lo que hacen en la prueba los
miembro de un grupo representativo. La puntuacin transformada de cualquier individuo se
refiere entonces a la distribucin de las puntuaciones obtenidas por la muestra de
estandarizacin para descubrir qu lugar ocupa en esa distribucin.
La teora psicomtrica desarroll orientaciones sobre la determinacin de unidades de medida
y escalas de puntuaciones en las que pueden expresarse los test, as como ayudar a su
interpretacin o normas. Segn Petersen, se definen los siguientes conceptos:
Escalamiento, es el proceso de asociar nmero a las respuestas de los sujetos a los tems o
tests.
Construccin de Normas, consiste en la recogida de datos sobre un grupo normativo de
referencia, sobre el que se obtienen estadsticos que ayudan en la interpretacin de las
puntuaciones de los tests.
Equiparacin, es el proceso que asegura la intercambiabilidad de formas mltiples de tests.
Siguiendo a Tornimbeni et al. (2004), la construccin de una escala de medicin de algn
aspecto del comportamiento humano requiere previamente un exhaustivo anlisis conceptual
del dominio o rasgo a medir. En la medicin del rendimiento se pueden utilizar pruebas
referidas a criterios o referidas a normas. Para la elaboracin de pruebas por normas, se parte
de la construccin de una tabla de especificaciones que es una tabla de doble entrada por
medio de la cual se relacionan los objetivos cuyo logro se desea evaluar con los contenidos
especficos correspondiente. A partir de esta tabla se determina la cantidad de tems que
conformar la prueba y se lleva a cabo su redaccin.
La Equivalencia Mtrica nos permite conocer si los puntajes de las distintas versiones son
comparables. El Anlisis del Funcionamiento Diferencial de los tems y la deteccin de los
sesgos en los tems o tem bias ayudarn en la Equivalencia Mtrica. Es decir, el anlisis
comparativo entre instrumentos de medida como conjuntos de tems, se debe agregar el
estudio de sus componentes individuales que evala el funcionamiento diferencial como paso
previo a una posterior evaluacin del sesgo o falta de equivalencia mtrica.

Es muy necesario un estudio normativo que evale las dimensiones semnticas de las palabras
para que se produzca una concordancia semntica que garantice la igualdad en la familiaridad
y significatividad de los trminos. Contar con pautas normativas objetivas basadas en la
frecuencia de uso de las palabras es esencial para alcanzar la equivalencia semntica y en
consecuencia la equivalencia mtrica. Resumiendo, si queremos obtener instrumentos con
equivalencia conceptual, lingstica y mtrica; debemos realizar un trabajo fundado en
habilidades y conocimientos de especialistas que tengan en cuenta la cultura, el idioma, las
metodologas de investigacin y el correcto uso de los procedimientos estadsticos. O sea, que
la calidad de la adaptacin de una prueba es el resultado de la calidad de los diversos pasos y
de la cadena de sucesivas decisiones interdependientes que se deben tomar. En este sentido
es destacable el anlisis de los sesgos o bias que se encuentran en los tems y en los
instrumentos como punto a tener en cuenta al seleccionarlos para su adaptacin.
35. Por qu Hogan (2004) habla de diferenciar los usos cotidianos de la palabra
confiabilidad? Qu diferencia fundamental existe con el uso tcnico de la palabra?
Fundamente su respuesta.
Para Hogan es necesario ser consciente de las diferencias que hay entre los usos cotidianos de
la palabra confiabilidad y su empleo tcnico en la psicometra porque tienen varios
significados relacionados que son importantes. Sin embargo, la confiabilidad de las pruebas
tiene un sentido ms tcnico y cuantitativo. Los mejores sinnimos en psicologa del trmino
tcnico confiabilidad son: Consistencia, replicabilidad y fiabilidad. Una prueba confiable es la
que consistentemente genera la misma puntuacin o una similar en el caso de un individuo.
La calificacin puede replicarse al menos con cierto margen de error. Podemos fiarnos de que
una prueba confiable genere en buena medida la misma puntuacin en un individuo.
36. Por qu considera usted que la evaluacin psicolgica es un proceso?
Ejemplifique la nocin de proceso evaluativo con el mbito jurdico.
Los tribunales se basan en datos de pruebas psicolgicas y testimonios de expertos
relacionados como una fuente de informacin para ayudar a responder si la persona es
competente para ser enjuiciada o para saber si un acusado distingua el bien del mal en el
momento de cometer el delito.
37-cul es la importancia de tener en cuenta la finalidad en la construccin de una
tcnica de evaluacin psicolgica? Qu relacin existe entre el constructo y los
reactivos?

1.
2.
3.
4.
5.
6.
7.

El proceso de elaboracin de pruebas educativas y psi comienza por lo comn con un


planteamiento sobre el/los propsitos de la prueba y el constructo o mbito de contenido que
habr de medirseSe debe definir con toda claridad: variable (s) a medir y meta, o grupo meta-Tambin debemos
preguntarnos si existe ya una prueba para alcanzar nuestro propsito, antes de elaborar una
nuevaConsiderar los aspectos del diseo preliminar:
modo de aplicacin: ser individual o a grupo
duracin: aspecto relacionado con la cantidad de reactivos y la sensibilidad de la
pruebaformato de los reactivos: opcin mltiple-V o F, Acuerdo o desacuerdo, construccin de
respuestas.
Cantidad de puntuaciones: esto es conforme al tiempo q demandara la prueba tambin.
Informes de las puntuaciones: con que exactitud se pretende informar (mtodo
computarizado o narrativo)
Capacitacin del aplicador: requiere de entrenamiento extra?
Investigacin de antecedentes: se requiere de una bsqueda bibliografa. Estndar
ESTA PRIMER ETAPA ES FUNDAMENTAL PARA EL POSTERIOR PROCESO DE SELECCIN DE
REACTIVOS!!!

1.
2.
3.
4.

ORIGEN DE LAS PRUEBAS: 3 fuentes principales: necesidad practica (ej.: Binet elaboro una
prueba con el fin de identificar a los nios que posiblemente requieran de una educacin
especial.
Fundamento terico: como las matrices progresivas de Raven. (inst para medir el factor g
de la inteligencia. Luego se emplean en contextos aplicados.
Para adaptar o revisar pruebas existentes: dada la necesidad de cambio contextual se
requieren nuevos reactivos y normasTambin para personas con distintas discapacidades.
Preparacin de los reactivos:
Reactivo: posee cuatro partes:
Estimulo: al que responde el examinado (pregunta o imagen acompaada por una
pregunta oral)
Formato: o mtodo de respuesta. (seleccin o construccin de respuesta)
Condiciones: como se registra la respuesta, si hay cronometro o no
Procedimientos para calificarla ( correcto-incorrecto, puntajes o a juicio del
examinador en proyectivas)
Se eligen los tipos de reactivo ms en funcin del formato.
Seleccin de respuesta: ms de una opcin. Se denomina tambin opcin mltiple, eleccin
forzada
Puede ser V o F o formato Likert: completamente de acuerdo a completamente En
desacuerdo.
Construccin de respuesta: puede ser respuesta libre- donde no esta limitado a una serie de
opciones, o llenar un espacio en blanco- esto se usa en las pruebas de conocimiento o
evaluacin de desempeo lo q recibe mucha atencin en lo educativo, en lo labora portafolio,
y en lo conductual: poner la persona en situacin.
Para la calificacin se procede por la escala de calificacin grafica donde las respuestas. Se
convierten en forma n.
Pero tambin se puede proceder con un diferencial semntico: poniendo un adjetivo al sujeto.
Tambin hay otros tipos de calificacin: sistema de puntuaciones: puntuacin media (no
es la peor ni mejor respuesta), puntuacin plus (por tiempo) aplicar una correccin por
adivinacin, tambin en pruebas de personalidad importa la orientacin y no el grado de
acierto.
Hay dos factores clave para la buena calificacin: asegurar la confiabilidad entre calificadores
(sobre todo en construccin De respuestas) y concebir un esquema de calificacin. Tambin
otros mtodos como la calificacin holstica: consiste en que el evaluador se haga un juicio
sobre la explicacin, solo hay una calificacin general sobre la calidad del ensayo
La calificacin analtica: donde el mismo ensayo se valora en dimensiones diferentes. ()
La calificacin de rasgo primario: el grado en que un producto logra la finalidad solicitada
es el rasgo 1
Aunque el juicio de examinador es importante actualmente se utilizan sistemas de calificacin
automatizada38-A qu se refiere Hogan (2004) cuando habla de los problemas de la validez de
contenido? Nombre y explique por lo menos dos.
Los problemas de la validez de contenido ataen, por un lado, en que es difcil obtener una
especificacin clara del campo de contenido. Por ejemplo: en el contenido de los conceptos
matemticos en los grados primero a tercero, podra determinarse revisando las guas
curriculares de 5 estados; sin embargo, las guas de los planes de estudios entre ellos difieren
ligeramente. Suponga que se revisan las guas de los 5 estados, por ah 3 incluyan
conocimientos de las unidades mtricas, en los grados de 1 a 3, pero otros dos tal vez
pospongan este tema hasta el 4 grado. Cmo se maneja esto?
Por otro lado, al aplicar la validez de contenido se da al juzgar qu tan bien los reactivos de la
prueba cubren los elementos de las especificaciones de contenido. Los reactivos que tienen
una clasificacin comn pueden variar mucho en cuanto a las habilidades que exigen. Por
ejemplo: muchos reactivos diferentes aplican a una categora de contenido como hechos
bsicos de la multiplicacin todos estos reactivos son apropiados por igual? Todos miden
igual de bien la categora del contenido? Tal vez no. La persona que juzga la validez del
contenido debe examinar los reactivos reales de la prueba y no basarse exclusivamente en una

lista de las categoras. En el anlisis final, la validez del contenido exige juicio y no slo revisar
cuadros en un esquema.
39- Realice de manera sucinta un recorrido por los principales hitos en la historia de
la evaluacin psicolgica.
Desde Fernndez-Ballesteros (resea histrica)
El primer perodo conceptualizado como "mtico" resume el inters del hombre de todos
los tiempos por comprender, describir, categorizar, predecir y explicar a las personas. Es la
astrologa y el horscopo la forma evaluativa ms antigua y permanente de todos los tiempos
(aun hoy)
En un segundo momento "racional-especulativo", encontramos las races de la evaluacin
psicolgica en disciplinas tales como la filosofa (Aristteles) y la medicina. Una primera
aproximacin al diagnstico psicolgico a travs de la interpretacin del carcter y hbitos
psicolgicos a partir de las caractersticas corporales. Tambin debemos incluir aqu las
concepciones cartesianas de la dualidad en la composicin humana hacia el estudio de la
conciencia a travs de la intuicin.
Empirismo Wright (1601) sustenta que son los hechos externos, las acciones sin
mediaciones inferenciales las U.de anlisis sobre las que debe basarse la evaluacin psi.
Hipcrates la teora de los cuatro temperamentosabre el estudio de las tipologas
patolgicas.
S XVIII y XIX: aportes del positivismo y empirismo. Avances en la medicina, distintos logros q
permiten la constitucin de la psi como disciplina cientfica (avances en la medicin de lo
subjetivo por la sensacin y a travs del autoinforme Weber y Fechner) la psicofsica
contribuye a la actual psicometra, con la diferencia que por ese entonces no haba
preocupacin por medir las diferencias individualesLaplace y Quetelet: aplicabilidad de los mtodos estadsticos al Comp. Humano.
En el s XIX se produce la divisin de dos corrientes en psiquiatra: organicista y psicologistacaracteriza a este siglo: un afn clasificatorio y la bsqueda de procedimientos evaluativos de
los padecimientos psiquitricos se convierten en dos objetivos bsicos.
A partir de la escolarizacin obligatoria en algunos pases europeos de la segunda mitad del S
XIX, brinda un campo de aplicacin fructfero a los principios psicolgicos y es motivo de
abundantes investigaciones psicosociolgicas.
Cattell en 1890 el trmino "test mental" cuyo objetivo es ser "un sistema uniforme que permite
comparar y combinar en lugares y momentos diferentes", la medida de las funciones mentales.
La evaluacin psicolgica comienza a esbozarse en 1896 cuando publica un estudio realizado
con dos bateras de tests para medir aspectos psicolgicos y realiza trabajos no solo sobre
funciones perceptivas sino tambin sobre procesos superiores como memoria y asociacin
verbal.
En relacin con la Evaluacin Psicolgica, A. Binet (1875-1911) define los tres grandes
problemas de la Psicologa individual: estudiar las diferencias individuales de los procesos
psicolgicos, estudiar las diferencias psquicas en individuos aislados o en grupos de individuos
y estudiar las relaciones de diferentes procesos psquicos en un mismo individuo. As, centra la
instrumentacin de su metodologa en los "tests mentales" cuyas reglas fundamentales sern:
1) Que los mtodos sean simples y no lleven mucho tiempo; 2) que los medios de
determinacin sean independientes de la persona del examinador; 3) que puedan compararse
los resultados obtenidos por un observador con los de otro. En 1903, publica el primer test de
inteligencia. (Ficha 1)
Las races de las pruebas y la evaluacin psicolgica contempornea pueden
encontrarse en Francia a principios del Siglo XX. En 1905 Alfred Binet y un colega
haban publicado una prueba que fue diseada para ayudar a colocar a los nios parisienses en
edad escolar en clases apropiadas, esto tuvo repercusiones en Estados Unidos. En ese pas se
estaba estudiando el uso de pruebas psicolgicas por primera vez en el ejrcito. Tanto en la
primera como en la segunda guerra mundial, las pruebas cumplieron con el objetivo de
examinar con rapidez a grandes cantidades de reclutas en busca de problemas intelectuales y
emocionales. En el S.XX se produce un incremento significativo de los instrumentos de
medicin, surgen autores tratando de establecer diferencias individuales en el desarrollo y la
maduracin de los proceso mentales.

1927 Spearman publica un libro sobre el factor general de la inteligencia por otro lado esta
Piaget con planteos sobre el diagnostico del pensamiento con escalas estandarizadas para
medir la inteligencia con instrumentos clsicos facilitando tambin la exploracin cognitiva de
sujetos perturbados.
1942 Hathaway y McKinnley editan el Inventario Multifsico de Personalidad de Minnesota
que evala diferentes rasgos. 1955-1959 Cronbach: propone la validez de constructo. El
apogeo de las pruebas psicolgicas se dio en la dcada de 1950 y principios de la de 1960. Se
administraban pruebas en escuelas, en instituciones de salud mental, en dependencias
gubernamentales, etc. Prueba era el trmino usado para referirse a todo, desde la
administracin de una prueba hasta la interpretacin de la evaluacin de la misma, durante la
2 guerra m. empez a incluirse el trmino evaluacin.
Durante esta poca la evaluacin psi se caracteriza por la medicin de atributos psi tanto en la
cognicin como en la personalidad, vemos tambin en distintos mbitos la aplicacin de estos
hallazgos en la realidad socialLa psicometra se convierte as en uno de los pilares bsicos de la psicologa de las diferencias
individuales, en cuanto a la medicin de los atributos psicolgicos, dando a la evaluacin y al
diagnstico una productividad tecnolgica invalorable.
*41 Histricamente, uno de los primeros usos de las pruebas fue la evaluacin de lo que los
individuos haban aprendido en determinadas reas de contenido y por ello se comparaba el
contenido de esas categoras de pruebas con el del rea que pretendan probar. Luego, el
nfasis recay en la prediccin y actualmente existen dos tendencias una hacia el
fortalecimiento de la orientacin terica y la otra hacia una estrecha vinculacin entre la teora
y la verificacin psicolgicas mediante la comprobacin emprica y experimental de las
hiptesis.
Contribuciones de la Psicologa Cognitiva: la dcada del setenta plante un acercamiento
entre la Psicologa experimental y la Psicometra que as empieza a hacer aportaciones
importantes a la comprensin de los constructos evaluados por las pruebas de inteligencia con
mtodos informticos. Ya en los cincuenta los psiclogos cognitivos empezaron a aplicar los
conceptos del procesamiento de informacin al estudio de la solucin de problemas en el ser
humano. Entre las tareas investigadas con esos mtodos se incluyen rompecabezas, problemas
de lgica, lgebra y fsica. Los modelos cognitivos especifican los procesos intelectuales
empleados para realizar la tarea, la forma de organizacin de los procesos, el almacenamiento
del conocimiento relevante y la forma en que se representa en la memoria y se recupera
cuando se necesita. Tambin se est dando importancia a la meta cognicin que se refiere al
control que el individuo ejerce sobre su eleccin de procesos, representaciones y estrategias
para realizar tareas. La investigacin ayuda al avance en la elaboracin y uso de las pruebas. El
aporte principal es haber focalizado la atencin en los procesos de respuesta en vez de
concentrarse en los productos finales del pensamiento. El anlisis de la ejecucin en la prueba
en trminos de los procesos cognitivos especficos, sin duda, mejorar nuestra comprensin de
lo que miden las pruebas. El analizar el desempeo individual a nivel de los procesos
elementales permitir identificar los puntos fuertes y dbiles de cada persona y por ende
aumentar el uso diagnstico de las pruebas (Sternberg y Weil, 1980).
En resumen, la relacin entre psicometra y P. Cognitiva es complementaria (feedback) desde el
punto de vista de la investigacin y prctica aplicada; y recproca desde el punto de vista de la
teora y la investigacin bsica.
(Ficha 2)
Una de los debates surgidos ltimamente es el impacto de la computadora en los procesos de
evaluacin, este elemento como arma de doble filo puede implicar avances por favorecer a las
investigaciones y en el almacenamiento y tratamiento de los datos. Por otro lado no considera
la importancia del rol del psi en el proceso de evaluacin. Otro problema es la adecuacin de
test a la cultura a la cual se aplica.*
40-Qu relacin existe entre el sesgo y el contexto cultural en la adaptacin de
test? Defina cada concepto y relacinelos.
Una adaptacin implica considerar no slo las palabras utilizadas al traducir la prueba sino
tambin las variables culturales involucradas. Tres niveles de adaptacin de las pruebas
psicolgicas.

El primero corresponde al de la aplicacin, este es, la simple y llana traduccin de un test de un idioma a otro
pero sabemos que una correcta traduccin no asegura un significado unvoco.

La segunda alternativa es la adaptacin. En este caso a la traduccin se agrega la


transformacin, adicin o substraccin de algunos tems de la escala original. Como se explic,
algunos tems pueden cambiar su significado a travs de las culturas y, por lo tanto, necesitan
modificaciones o ser eliminados. As mismo tems que no existen en la versin original del test
pueden representar mejor al constructo en la poblacin en la cual se administrar la nueva
versin.
Finalmente, la opcin ensamble En este caso el instrumento original ha sido modificado tan
profundamente que prcticamente se ha transformado en un nuevo instrumento original con
los nuevos elementos, as se vuelve inadecuado. El ensamble tambin se da cuando el
constructo no est representado de forma adecuada por la versin original en la cultura a la
que se quiere adaptar la prueba.
Tcnicas de Traduccin
El proceso de traduccin es complejo e implica ms que la traduccin lineal de las palabras
escritas a un nuevo lenguaje. Existen dos mtodos comunes:

la traduccin directa: aqu un grupo de traductores traducen el test desde el idioma


original al nuevo idioma. Luego, otro grupo de traductores, juzga la equivalencia entre las dos
versiones. De este modo pueden realizarse las correcciones pertinentes en las dificultades o
errores identificados por los traductores.

la traduccin inversa: un grupo de traductores realiza una traduccin desde el idioma


original al nuevo idioma; luego un segundo grupo de traductores toma el test traducido (en el
nuevo idioma) y vuelve a traducirlo al idioma original. Seguidamente se realizan las
comparaciones entre la versin original y la versin retraducida al idioma original para
determinar su equivalencia.
Mtodos para establecer la Equivalencia entre Tests (el origen y el traducido)
Para ello habr de implementarse un diseo experimental y un anlisis de datos obtenidos a
travs de ese diseo. 3 mtodos.
1) Administracin de la prueba en el idioma original y de la prueba traducida a sujetos bilinges
2) Administracin de la versin original y su traduccin inversa a monolinges en el idioma
original
3)Administracin de la versin original a monolinges que hablan el idioma original y de la
versin traducida a monolinges que hablan el idioma al que ha sido traducida la prueba
Una vez obtenidos los datos por medio de los diseos revisados existen varias posibilidades
estadsticas para su anlisis. Bsicamente el anlisis estar destinado a identificar la existencia
de Funcionamiento Diferencial de tems (FDI) es decir, tem que se comportan en forma
diferente a travs de las diversas muestras transculturales.
Fuentes de Sesgo
Necesitamos instrumentos con alta validez predictiva del criterio particular. Este requisito suele
descuidarse en el desarrollo de las llamadas pruebas libres de influencia cultural-donde no se
elije un criterio relevante para cuidar que no se involucre esta influencia.
Una mejor solucin es elegir un contenido relevante para el criterio e investigar luego las
posibles diferencias poblacionales de la efectividad de la prueba para el propsito pretendido.
Desde mediados de los 70 se empez a dar importancia al trmino sesgo que se emplea en
su bien establecido sentido estadstico, para desganar un error constante o sistemtico en
contraste con uno que se debe al azar.
41-Cundo se habla de formas paralelas se est haciendo referencia a validez o a
confiabilidad? Y cuando se habla de contenido? Defina los conceptos y relacinelos.
(Hogan) Cuando hablamos de formas paralelas, nos referimos a la confiabilidad. Cuando se
habla de contenido, refiere a la validez.
De formas paralelas (confiabilidad): es un mtodo para determinar la confiabilidad de una
prueba. Exige que haya dos formas de la prueba, mismas que deben ser iguales o muy
similares en trminos de la cantidad de reactivos, lmites de tiempo, especificaciones de
contenido y otros factores similares. El estudio de la confiabilidad de la forma alterna consiste

en aplicar ambas formas de la prueba a los mismos examinados.


De contenido (validez): es un tipo de validez; tiene que ver con la relacin entre el
contenido de una prueba y cierto campo de conocimiento o comportamiento bien definido. Para
que una prueba tenga validez de contenido, debe haber una correspondencia adecuada entre
el contenido de la prueba y el del campo de inters. La aplicacin de la validez de contenido
supone la nocin de muestreo, lo que significa que el contenido de la prueba abarca una
muestra representativa de todos los posibles contenidos del campo.
Relacin entre ambos: en la confiabilidad de formas paralelas se espera que haya dos
formas de la prueba, esto relacionado a la validez de contenido, se podra decir que en cada
prueba deben tener la misma cantidad de reactivos y especificaciones de contenido, y que en
estos reactivos haya una correspondencia adecuada entre el contenido de la prueba y el del
campo de inters. (Es la relacin que hice yo pero no estoy segura)
42-Cul es la relacin que puede establecer entre los conceptos: modelo terico,
constructo y reactivo?
Modelo
Modelo y teora son dos conceptos epistemolgicamente distintos (Monserrate, 1984) para
comprender el concepto de modelo debemos tener en cuenta los tres sentidos principales en
que se utiliza: analgico, formal y aplicado.
El modelo analgico es la acepcin propia y estricta del concepto de modelo y puede definirse
como aquella representacin (aproximativa o analgica) de la idea de un evento real contenida
en un constructo o teora, que cumple la misin de inspirar la comprensin de su significado
real. Es el tipo de modelo que utilizamos al hablar de modelos en evaluacin psicolgica.
En la evaluacin psicolgica, hay ciertos requisitos para que un modelo pueda ser considerado
como tal:
- Que se haya desarrollado dentro del campo conceptual de alguno de los paradigmas de la
psicologa cientfica
- Que cuente con un objeto de estudio especfico a travs de las precisiones que efecte sobre el
concepto de conducta.
- Que tenga un diseo de tecnologa propia.
- Que responda a las necesidades de evaluacin propias de una poca, cultura o problemtica de
amplio alcance social.
- Que tenga un desarrollo histrico propio, caracterizado por su introduccin y progresiva
implantacin en el mbito profesional.
Hacia finales de los aos 80 F. Ballesteros propone centrarnos en modelos: medico, dinmico,
conductual y cognitivo.
Modelos en la evaluacin psi:
Cada enfoque tiene su modelo Ballesteros propone centrarnos en 3 ejes para su clasificacin:
sujeto, teora y tcnicas.
Al referirnos a "modelo" queremos significar un constructo epistemolgico en el que
se encuentran implicados tanto los datos empricos, como los postulados tericos
que posibilitan su adecuada contextualizacin
43-Con qu elementos necesita contar una tcnica en cuanto a constructo,
estructura y reactivos para poder contar con validez de contenido? Defina cada
concepto y relacinelos.
Validez de Contenido Comprende el examen sistemtico del contenido de la prueba para
determinar si cubre una muestra representativa del rea de conducta que debe medirse.
Alude a la forma en que se operacionaliza el constructo que se va a medir en la prueba a travs
de los tems-es aplicable el tem a lo q se debe informar?
El rea de conducta por examinar debe analizarse sistemticamente para garantizar que los
reactivos cubran todos los aspectos importantes y en la proporcin correcta. Se debe tener en
cuenta no sobre-generalizar ni incluir factores irrelevantes en los resultados. Bsicamente se
deben contestar dos preguntas: a) cubre la prueba una muestra representativa de las
habilidades y conocimientos especificados? b) el desempeo en la prueba est
razonablemente libre de la influencia de variables irrelevantes?

Validez de facie: la validez de contenido no debe confundirse con la validez aparente que no es
validez en el sentido tcnico porque no se refiere a lo que la prueba verdaderamente mide sino
a lo que parece medir. Aunque usar el trmino validez puede resultar confuso,
La validez de facie es en s misma un rasgo deseable de los instrumentos, porque alude a
que la prueba parece vlida para quien la administra, quien la responde y para otros
observadores. Esta validez puede mejorarse replanteando los reactivos para que parezcan
relevantes y plausibles en medio particular en que sern usados por ejemplo es posible
elaborar una prueba de aritmtica para personal naval en la terminologa nutica sin alterar
con ello las funciones medidas.
44-En el contexto jurdico se necesita contar con tcnicas vlidas y confiables que
sustenten el diagnstico aportado. Desarrolle esta afirmacin incluyendo los
conceptos de validez y confiabilidad.
En el mbito jurdico se necesita contar con tcnicas vlidas y confiables, ya que es necesario
que el psiclogo pueda corroborar si el sujeto evaluado presenta peligrosidad para s o para
terceros; competencia para ser sometido a juicio; posee responsabilidad criminal; est
preparado para la libertad condicional o bajo palabra; para el diagnstico y evaluacin del dao
emocional; evaluacin de custodia; caractersticas del nio en pos de la eleccin de una
familia; evaluacin. Del abuso sexual y el maltrato infantil.
Por lo tanto, es necesario que la tcnica mida el constructo que deseamos evaluar, y que se
lleven a cabo de una manera en que los datos obtenidos, posean consistencia interna de las
puntuaciones. Luego trato de rever esta respuesta.
45-Mencione y describa cules son las teoras psicomtricas y los autores que las
sustentan. Explique brevemente las diferencias entre cada una de ellas.
Teoras de los Tests
Existen diversos paradigmas o modelos que permiten explicar el significado de las
puntuaciones obtenidas con los Tests. El anlisis da como resultado:
La estimacin del nivel en que poseen los sujetos la(s) caracterstica(s) que mide el test
(valores escalares de los sujetos)
La estimacin de los parmetros de los tems (valores escalares de los tems).
Toda teora de test tiene como objetivo analizar estas dos cuestiones
El objetivo de cualquier teora de tests es realizar inferencias sobre el nivel en que los sujetos
poseen la caracterstica o rasgo inobservable que mide el test, a partir de las respuestas
observables. As para medir o estimar las caractersticas latentes de los sujetos es necesario
relacionar stas con la actuacin observable en una prueba y esta relacin debe de ser
adecuadamente descrita por una funcin matemtica. Las distintas teoras de tests difieren
justamente en la funcin que utilizan para relacionar la actuacin observable en el test con el
nivel del sujeto en la variable inobservable. Y sirven para dar cuenta del error de medida
inherente a toda medicin psicolgica o estimacin del error; y proporcionar una estimacin del
rasgo o caracterstica evaluada (estimacin del rasgo)
Teora clsica de los test:
Iniciada por Spearman su principal exponente, quien crea el coeficiente de correlacin que es el
ndice numrico que expresa la relacin entre dos variables, sostiene que la puntuacin
observable de una persona en un test es una funcin de dos componentes: su puntaje
verdadero (inobservable) y el error de medicin implcito en la prueba
El puntaje verdadero de un sujeto en un test sera el promedio aritmtico de las puntuaciones
empricas obtenidas en infinitas aplicaciones
La TCT es, en sntesis, el conjunto de principios tericos y mtodos cuantitativos
derivados de ellos, que fundamentan la construccin, aplicacin, validacin e
interpretacin de distintos tipos de tests y que permiten derivar escalas
estandarizadas aplicables a una poblacin.
Se han elaborado procedimientos de anlisis cuantitativo, a destacar 3 etapas:
1 etapa que Cattell (1986) denomina itemetra, se caracteriza principalmente por la

construccin de pruebas conformadas por reactivos cuyas propiedades estadsticas eran el


centro de atencin principal. Los tests se consideraban como el producto de la integracin de
un conjunto de reactivos cuyas propiedades estadsticas tenan que ser determinadas antes de
que se les incluyera en esa prueba particular. Esto propici que el concepto de confiabilidad
adquiriera prominencia como la principal virtud de la escala y se meda a partir de la
correlacin entre los reactivos individuales y el instrumento en su conjunto. Si la correlacin era
alta, se deca que los reactivos eran los adecuados.
Pero siempre resultaba una medida de error, para la cual se desarrollaron procedimientos tales
como la divisin por mitades y los procedimientos de pruebas paralelas. Dio lugar a
contribuciones tales como las frmulas de Spearman-Brown (Spearman, 1904), KuderRichardson (Kuder & Richardson, 1937), Alfa de Cronbach (Cronbach, 1951) y a varios principios
bsicos de escalamiento, as como al uso generalizado de la curva normal, el uso de las
correlaciones mltiples y la frmula de atenuacin, etc.
2 etapa psicometra estructural: se caracteriza por el uso de las nuevas herramientas
estadsticas tales como el anlisis factorial con sus diversas variantes tcnicas, como un medio
para encontrar la "estructura natural" de las habilidades en el contexto de los factores
culturales, las dimensiones que dan lugar a la accin y al comportamiento.
Su objetivo primordial determinar la relacin que hay entre los conceptos clnicos sobre
personalidad, y los fundamentos de la investigacin experimental multivariada (cuantitativa
por naturaleza), as como analizar las interacciones dinmicas entre los rasgos y los estadios de
la personalidad. Los tests se consideraban significativos en la medida que armonizaban con los
constructos tericos formulados conceptualmente.
Hacia etapas conceptualmente ms elaboradas en que los tests se derivan de teoras del
comportamiento ms articuladas y donde cada reactivo tiene un significado conceptual
definido en un contexto terico particular. etapas elaboradas a partir de teoras ms articuladas
donde cada reactivo corresponde a un concepto en este entramado terico que subyace.
Funcional en el desarrollo de los tests es aquella que "trasciende a las aplicaciones inmediatas
y simplistas y profundiza en las leyes y formulaciones conceptuales del comportamiento: que
relaciona rasgos, procesos y estados psicolgicos con las mediciones y estrategias
estructurales" (Cattell, 1986). Ese tipo de leyes, segn Cattell, se refieren a las relaciones
sistemticas y consistentes obtenidas de los estudios empricos sobre: desarrollo, factores
hereditarios, aprendizaje mediante experiencia, y sobre la influencia de los factores
psicofisiolgicos en la conducta
Hacia etapas conceptualmente ms elaboradas en que los tests se derivan de teoras del
comportamiento ms articuladas y donde cada reactivo tiene un significado conceptual
definido en un contexto terico particular. Hacia etapas conceptualmente ms elaboradas en
que los tests se derivan de teoras del comportamiento ms articuladas y donde cada reactivo
tiene un significado conceptual definido en un contexto terico particular.
El xito de las tcnicas clsicas de seleccin de reactivos depende de qu tan parecida es la
poblacin con la cual se obtuvieron los ndices respecto de la poblacin a la que se pretenden
aplicar. Si la diferencia es grande, los ndices obtenidos de los tems no sern apropiados para
la poblacin objetivo. Como se prepara el banco de reactivos Los tems con frecuencia
denominados "experimentales", se incluyen en un test que es administrado a un grupo de
personas de tal manera que se obtienen como resultado, los ndices de esos reactivos. Por
supuesto, no todos los reactivos experimentales sern incluidos en un test particular. Por lo
tanto, se crean mltiples formas del test, cada uno de los cuales contiene diferentes reactivos
experimentales y las diferentes formas se aplican a grupos distintos de examinados. Se
incluyen en la prueba con el supuesto de q sus ndices son comparables. Si la diferencia es
grande, entonces los reactivos no son apropiados. Por otra parte, an cuando un banco de
reactivos se encuentre bien conformado, otro problema de la TCT es la precisin de la
medicin.

Teora de la generalizabilidad (desarrollada por Cronbach) parte de la idea que las


puntuaciones de prueba de una persona varan de una prueba a otra, debido a variables en la
situacin de prueba (Cohen).
Cuando se mide una variable se trata de generalizar los resultados a un dominio o universo
confiable de observaciones. La diferencia es que en la TCT se considera que la varianza de error
es de una sola clase y, en cambio, la TG reconoce que existen otros universos de
generalizacin y por lo tanto muchos puntajes de universo posibles. Solo cuando el universo se
ha definido podemos afirmar cules son las fuentes de variacin que producen error.
Las diferentes fuentes de error en esta teora se denominan facetas, trmino que introdujo
Cronbach para designar cada una de las caractersticas de la situacin de medicin que pueden
cambiar de un momento a otro y, por tanto, hacer variar los resultados obtenidos.
Segn esta teora los puntajes observados solo poseen inters si son representativos de todos
los puntajes posibles de un mismo universo. Poblacin es el conjunto de personas de las que
se extrae una muestra; y Universo es el conjunto de todos los tems posibles de un constructo;
y Universo de Condiciones de Medicin al conjunto de todas las facetas estudiadas. Las
distintas fuentes de variaciones asociadas a las facetas y a sus interacciones se estima que
contribuyen a la varianza de error y disminuyen la generalizabilidad de los puntajes observados
en las personas evaluadas.
Teora de respuesta al tem
Hambletton y Swaminathan 1985
Esta teora, fue desarrollada para resolver varios de los problemas que presentaba la TCT.
Algunos de esos problemas son: (1) El uso de ndices de los reactivos cuyos valores dependen
de la poblacin particular de la cul fueron obtenidos,
(2) La estimacin de la habilidad del examinado depende del conjunto especfico de reactivos
incluidos en la prueba.
As, las caractersticas del test y de los reactivos cambian a medida que cambia el contexto de
la prueba.
Es decir, las caractersticas del examinado y las caractersticas de la prueba no pueden
separarse en un instrumento elaborado conforme a los principios de la Teora Clsica de los
Tests; y por el contrario, cada uno slo puede ser interpretado en trminos del otro. Las
caractersticas del examinado en las cuales la teora TRI est interesada, son la "habilidad" que
mide el test. Para la TCT, la nocin de habilidad se expresa por medio del llamado puntaje
verdadero que se define como "el valor esperado a partir de la destreza observada en la
prueba en cuestin. El nivel de dificultad de la prueba se define como "la proporcin de
examinados en el grupo de inters, que contest el reactivo correctamente" el nivel de
habilidad y dificultad dependen del grupo seleccionado y de la prueba.
El nivel de discriminacin de los reactivos y los coeficientes de validez y confiabilidad de la
prueba se definen tambin en base a las caractersticas del grupo particular de examinados.
Esto significa que los coeficientes de los reactivos son dependientes del grupo al mismo tiempo
que son dependientes del test. Esta clase de dependencia es la que se trata de eliminar
mediante la TRI.
Otro problema de la TCT es que es centrada-en-el-test, ms que centrada-en-el-reactivo. No se
toma en consideracin cmo responde el examinado a un reactivo dado, y por lo tanto, no se
tienen bases para determinar qu tan bien podra desempearse un examinado particular ante
un reactivo individual. Es decir, la TCT no permite hacer predicciones acerca de cmo se
comportar un individuo o grupo particular ante un reactivo dado. Esta posibilidad de
prediccin es importante en una gran variedad de situaciones como por ejemplo, cuando se
intenta predecir el comportamiento de un profesional ante diferentes tipos de situaciones
prcticas.
Las principales caractersticas de la TRI como una alternativa a la teora clsica de los tests
son: 1. Las caractersticas de los reactivos no dependen del grupo del cul fueron obtenidos; 2.
Los puntajes que describen la habilidad del examinado no dependen del test en su conjunto; 3.
El modelo se expresa a nivel del reactivo ms que a nivel del test; 4. El modelo no requiere de

pruebas paralelas para determinar el ndice de confiabilidad; y


5. Provee una medida de la precisin de cada ndice de habilidad. Los postulados bsicos de la
TRI son:
1) El resultado de un evaluado en un tem puede ser explicado por un conjunto de factores
llamados rasgos latentes o aptitudes
2) La relacin entre la respuesta de un sujeto a un tem y el rasgo latente que subyace puede
describirse como una funcin monotnica creciente que se llama funcin caracterstica del tem
o curva caracterstica del tem (CCI) Esta funcin especfica que a medida que la aptitud
aumenta la probabilidad de una respuesta correcta al tem tambin aumenta.
31
3) Las estimaciones de la aptitud obtenidas con distintos tems seran iguales y las
estimaciones de los parmetros de los tems obtenidos en distintas muestras de examinados
sern iguales. Es decir que en la TRI los parmetros de aptitud y del tem son invariantes.
La ejecucin de un examinado en una prueba puede ser predichos por un conjunto de rasgos,
rasgos latentes y habilidades; y (2) la relacin entre las respuestas de los examinados a los
reactivos y el conjunto de rasgos que subyacen a la respuesta ante el reactivo, pueden
describirse por una funcin monotnicamente incrementada llamada funcin caracterstica del
reactivo o curva caracterstica del tem (CCI). Esta funcin especifica que a medida que el nivel
del rasgo incrementa, tambin incrementa la probabilidad de una respuesta correcta ante ese
reactivo." (p.7) Son supuestos de la TRI:
1. La unidimensionalidad del rasgo latente: que las respuestas del examinado estn
determinadas por una nica variable denominada Rasgo. Ej.: Un tem de un test espacial
medir solo habilidad espacial y no ninguna otra cosa (Ferreres Traver, 2005)
2. La independencia local: Las respuestas de un evaluado a cualquier par de tem son
independientes y la probabilidad de responder correctamente a un tem es independiente de la
probabilidad de responder correctamente cualquier otro tem (Ferreres Traver, 2005).
Existen muchos modelos de la TRI, pero los bsicos son: - Modelo Logstico de un parmetro o
Modelo de Rasch que
- Modelo Logstico de dos parmetros o Modelo de Birnbaum
- Modelo Logstico de tres parmetros
Para construir una prueba de acuerdo a los principios de la TRI, es necesario construir un banco
de reactivos con parmetros estimados para cada tem, de acuerdo al modelo. Las escalas de
esta prueba son unidimensionales ya que parten del supuesto de que cada tem (reactivo) del
test o prueba debe medir un solo rasgo o aptitudSin embargo, la TRI no se encuentra libre de problemas y su aplicacin contiene ciertos puntos
riesgosos debido a que el uso de criterios estadsticos para la seleccin de los reactivos no
asegura una prueba con contenidos completamente vlidos. Deficiencias en los procedimientos
de seleccin de los contenidos pueden generar una prueba con un bajo nivel de validez de
contenido (Hambleton, Swaminathan y Rogers; 1991). Otro problema de la TRI es que cuando
se utilizan funciones de informacin de los reactivos durante el desarrollo de una prueba, es
probable que los valores sean sobrevalorados y por lo tanto, la funcin de informacin podra
sesgarse. Una prueba construida con tems de valores elevados puede ser que no corresponda
a los de la prueba esperada. Como consecuencia, la funcin de informacin de la prueba ser
sobrevalorada y por lo tanto, habr que aadir varios reactivos adicionales para compensar
esta sobrevaloracin.
Sin embargo, una de las ventajas de la construccin de los tests de acuerdo a los modelos de la
TRI es que se pueden elaborar tests individualizados, es decir, a la medida de los sujetos que
permiten inferir en cada uno de los evaluados un verdadero valor del rasgo de la manera ms
precisa.
46-Qu
diferencia
encuentra
entre
un
inventario
y
una
entrevista
semiestructurada? Defina cada uno de ellos y ejemplifique con pruebas utilizadas en
la cursada.
AIKEN
INVENTARIOS BIOGRAFICOS FORMALES: (pg. 349) constan de una variedad de reactivos que
ataen a la historia de vida del sujeto (relaciones familiares, amistades, actividades, intereses,
etc.)

Tienen una gran validez de contenido y pronostican muy bien el desempeo en una variedad
de contextos (validez suceptible de generalizarse a estos) aunque por cuestiones legales,
ciertos datos deben ser resguardados, estos ofrecen buena prediccin acerca del desempeo
laboral.
ENTREVISTA SEMIESTRUCTURADA: entrevista: mtodo antiguo de uso frecuente para la
evaluacin de personalidad. Proporciona informacin acerca de lo que la persona dice y hace
(conducta no verbal) pero poniendo nfasis en los contenidos verbales. Puede definirse como:
un intercambio verbal cara a cara en el cual una persona entrevistador- intenta obtener
informacin o expresiones de opinin o creencia de otra persona. (Incluye: antecedentes de
vida: acontecimientos, sentimientos, percepciones y expectativas.-)
Se emplean en distintos contextos
La entrevista es laboriosa, es tanto un arte (lograr un buen rapport) como una ciencia-dinmica
de interacciones. Es recomendable crear un buen clima cmodo y libre de distractores. Ver
temas y preguntas de la entrevista.- ver perfil y condiciones del entrevistador
Segn las caractersticas del entrevistador el tipo de estructura seleccionada.
Las entrevistas semi estructuradas se caracterizan por ser mas flexible en el contenido y en el
tiempo de las preguntas. Requieren as ms habilidad, son ideales cuando lo que se pretende
es obtener una imagen profunda de la personalidad.
COHEN- SWERDLIK
entrevista es una tcnica para recopilar informacin por medio de la discusin. Una entrevista
semi estructurada deja al entrevistador ahondar en distintas reas segn su juicio.
47-Por qu decimos qu el proceso evaluativo se construye en funcin de los
objetivos? Defina y explique cada concepto.
Proceso de construccin de los test (resumen)
Construccin de test: 3 fuentes:
Muchos test se originan en respuesta a una necesidad prctica (ver Binet, Weschler, MMPI.)
derivan de un fundamento terico importante (ej.: matrices progresivas. Raven) teoras pueden
generar nuevas pruebas, que primero se utilizaran con fines investigativos, luego se aplicaran a
distintos contextos. gran de trabajo de elaboracin de tests se dedica a adaptar o revisar los
instrumentos ya existentes, desde principios de siglo XX se conoce el impacto del lenguaje y la
cultura sobre el resultado de los test.-diferencias significativas.Para el diseo y la elaboracin del test : debemos preguntarnos: Qu medir la prueba, cual
es su formato ideal, que tipo de respuestas dar , cual es su contenido, cual es su objetivo,
para q se necesita esta prueba, quien la usara, que capacitacin necesitara esta persona y
como la aplicara, como se interpretaran los resultados?
Estas cuestiones se resuelven a partir de la concepcin terica que se tenga en psicometra
Definicin del dominio de un test: la construccin de una escala de medicin de algn aspecto
del comportamiento humano requiere previamente un exhaustivo anlisis conceptual del
dominio o rasgo a medir as como de los indicadores operacionales son adecuados para
describirlo.
En la medicin del rendimiento se pueden utilizar pruebas referidas a criterios o referidas a
normas.
En la construccin de una prueba con referencia a criterios: se define y delimita el dominio de
conductas correspondientes a cada objetivo. Siguiendo dicha definicin se elaboran los tems
que evaluarn ese dominio de conductas y todos los desempeos individuales sern referidos a
ese dominio. El dominio puede ser de conductas, objetivos, destrezas y competencias y la
amplitud del dominio vara en funcin de la finalidad del test.
Para la elaboracin de pruebas por normas: se parte de la construccin de una tabla de
especificaciones que es una tabla de doble entrada por medio de la cual se relacionan los
objetivos cuyo logro se desea evaluar con los contenidos especficos correspondientes. A partir
de esta tabla se determina la cantidad de tems que conformar la prueba y se lleva a cabo su
redaccin.
Si el dominio comprende ms de un objetivo pueden construirse subtests para cada objetivo, y
se evala el rendimiento de los sujetos en cada uno de ellos. Para la especificacin del dominio
de conductas o clase de tareas que el individuo debe realizar, seguiremos el esquema

i.

propuesto por Tornimbeni et al (2004) que proponen:


Definicin del objetivo: Se establece cul/es sern los objetivos que se evaluarn a
travs de la prueba
ii. Descripcin del objetivo: Se define en trminos de conductas observables el o los objetivos a
ser evaluados. En el ejemplo anterior se especificara un objetivo de la habilidad de
comprensin tal como ser capaz de analizar el propsito del autor y su punto de vista
examinando una comunicacin escrita.
iii. Especificacin de las caractersticas de la situacin de evaluacin: se especifican todos
aquellos aspectos a tener en cuenta en la situacin de evaluacin, por ejemplo, en un texto de
divulgacin cientfica, seleccionar el prrafo e identificar la oracin donde se expresa la
intencin del autor.
iv. Caractersticas de la respuesta: Se especifica cul es la respuesta que se espera del sujeto, en
este caso, que seleccione de manera correcta el prrafo y la oracin correspondiente.

Seleccin y elaboracin de las Escalas


La medicin es la asignacin numrica de acuerdo con reglas y las escalas son las reglas de
medicin. La elaboracin de escalas puede definirse como el proceso de establecimiento de
reglas para la asignacin numrica en la medicin.
Las escalas son instrumentos usados para medir algo, ese algo en psicometra es un rasgo o
atributo psicolgico. Las escalas pueden clasificarse a lo largo de un continuo del nivel de
medicin y denominarse por su naturaleza como nominales, ordinales, de intervalo o de razn.
Quienes elaboran las pruebas disean la escala de una prueba, en la forma que cree que se
adapta mejor a la manera en que han conceptualizado la medicin del rasgo o rasgos que son
su objetivo. No hay un nico mtodo para la elaboracin de escalas, el que una escala sea de
naturaleza nominal, ordinal, de intervalo o de razn depender en parte de los objetivos de la
escala y de la legitimidad matemtica de las manipulaciones y transformaciones de los datos
resultantes.
Ej.: escalas de Likert, utilizadas para estimacionesEj.: Escala ordinal: pruebas de clasificacin- ordenacin jerrquica.
El mtodo de elaboracin de escalas particular empleado en la elaboracin de un test
depender de las variables que se van a medir, el grupo para el que se pretende la prueba (por
ejemplo los nios pueden requerir un mtodo de elaboracin de escalas menos complicado que
los adultos) y las preferencias del elaborador de la prueba.
Redaccin de tems
Existen pautas convencionales con recomendaciones como:

redactar tems congruentes con el objetivo de medicin

evitar los tems demasiado largos (de ms de 20 vocablos),

evitar las oraciones complejas con ambigedades de sentido,

evitar las frases con dobles negaciones,

evitar el uso de expresiones extremas (nunca, siempre, todos)

Evitar utilizar el lenguaje ms apropiado al nivel de maduracin y educativo de la


poblacin
Porque los errores mas comunes son ambigedad y trivialidadLos tipos de respuestas pueden ser:

seleccin de respuesta ( opcin mltiple, tem de relacin o verdadero/falso)

construccin de respuesta
Revisin del Test por Expertos
Las tres caractersticas que los expertos deben evaluar en cada tem son:
a) claridad semntica y correccin gramatical
b) adecuacin de su dificultad al nivel educativo y evolutivo de las personas
c) congruencia con el rasgo o dominio medido (esto ultimo refiere al grado de consistencia
entre el tem y las metas a las q pretende llegar la prueba. Sera un factor para la confiabilidad
y validez).
Se recomienda que los tems seleccionados sean aquellos en que, al menos, un 60% de los
jueces coinciden.

Es til tambin incluir preguntas que demanden informacin cualitativa sobre los tems lo que
puede facilitar un mejoramiento en el fracaso de algunos de ellos.
Anlisis y Seleccin de tems
El primer paso para obtener informacin psicomtrica sobre los tems de pruebas homogneas
consiste en administrar los elementos preliminares a una muestra amplia (superior a 300
sujetos) que sea representativa de la poblacin que se quiere evaluar en la prueba final. Para
descartar los tems que no funcionan bien debe contarse con una cantidad de sujetos por lo
menos cinco veces superior al nmero inicial de reactivos y aproximadamente el doble de tem
de los que aparecern en la versin definitiva de la medida.
El ideal ronda entre los 300 a 400 sujetos para estudios correlacionales. Al reducirse el tamao
de la muestra hacen su influencia factores determinantes que luego pueden afectar a la V Y CEl procedimiento ms empleado en el anlisis inicial de reactivos es la correlacin de cada uno
de ellos con el puntaje total de la prueba o de las sub escalas (en caso de q las tenga).
El estadstico usual es el producto momento de Pearson (r) o correlacin punto biserial si se
trata de tem dicotmicos (si/no, verdadero/falso). Los tem con correlaciones no significativas o
bajas (inferiores a .30) se eliminan o se revisan y se conservan los menos ambiguos. Los
distractores sern aquellos que obtengan correlaciones negativas con los puntajes de la
prueba.
El ndice de dificultad de los reactivos tiene un rango de 0 a 1 y se simboliza como p. Un
reactivo cuyo p es 0 est indicando que ningn sujeto contest correctamente y un reactivo
con p igual a 1 es aquel que todos los sujetos respondieron correctamente. El valor ptimo de p
para un reactivo depende de varios factores.
Si el propsito del test es identificar slo un porcentaje reducido de los mejores postulantes
para un empleo, por ejemplo, entonces los tems de la prueba deberan ser lo suficientemente
difciles y tener un valor medio-bajo de p. Para pruebas convencionales de habilidades se
recomiendan valores p entre .20 y .80.
Deben eliminarse los reactivos donde la mayora de los sujetos de la muestra obtiene el mismo
puntaje puesto que tales elementos de prueba no discriminan entre los evaluados (Bandura,
2001)
Las pruebas referidas a criterios evalan y seleccionan los tems de una forma particular,
diferente a las pruebas referidas a normas. El anlisis se realiza comparando los resultados de
un grupo antes de aplicar un programa de aprendizaje y despus del mismo, o comparando dos
grupos similares, uno de ellos, que recibi capacitacin y el otro no. Al calcular el ndice de
dificultad los resultados esperados son, tems con alta dificultad para los grupos que no han
pasado por el proceso de aprendizaje, y baja dificultad para los que han sido sometidos al
proceso de instruccin. En cuanto al ndice de discriminacin, obtenido por la comparacin
entre grupos, se espera mxima discriminacin entre los grupos y mnima entre los individuos
de un mismo grupo.
Una vez realizada la aplicacin de la prueba piloto y habiendo obtenido resultados estadsticos
sobre el comportamiento de cada tem se podrn tomar decisiones sobre cules de ellos deben
integrar la forma final del test y hacer estimaciones de su confiabilidad y validez mediante
algunos de los procedimientos ya conocidos.
La lgica de este proceso de anlisis es que todos los reactivos se relacionen con un ncleo
comn de medicin que es el constructo o dominio, informacin que se obtiene aplicando a los
reactivos de una escala el coeficiente alfa de Cronbach, debemos asegurarnos valores de.80 o
superiores. Los tems con correlaciones bajas con el puntaje total se pueden remover para
incrementar el valor del alfa. Si bien un coeficiente alfa elevado es una condicin necesaria de
unidimensionalidad esta propiedad solo es garantizada por el anlisis factorial, paso decisivo
para asegurar la unidimensionalidad de cualquier escala homognea y el primer paso en un
conjunto inicial de tem heterogneos (sin un explcito marco terico previo) este es
esencialmente un mtodo para agrupar las variables que se correlacionan fuertemente entre s
y cuyas correlaciones con las variables de otros agrupamientos es menor, es un mtodo
estadstico en el cual las variaciones en los puntajes de un nmero de variables son explicadas
por un nmero ms reducido de dimensiones o constructor (factores). Una distincin inicial:
anlisis factorial exploratorio: se extraen factores sin una estructura terica previa conjeturada
de modo explcito. (Los principales mtodos de este tipo son: Anlisis de Componentes
Principales, Ejes Principales y el de Mxima Probabilidad.

Anlisis factorial confirmatorio: los factores son definidos a priori en base a un modelo terico
y en este caso, el anlisis intenta verificar qu tan bien se adaptan los datos observables a ese
modelo.
Antes de este procedimiento hay que hacer una medida de adecuacin de muestreo que es el
KAISER-MAYER-OLIKIN que consiste en determinar si los tems estn suficientemente
interrelacionados (p: .80 o ms)
El anlisis factorial debe realizarse sobre muestra extensas no inferiores a 300 sujetos
p/obtener datos tiles.
En el enfoque psicomtrico actual, el anlisis factorial se utiliza ms como estrategia
confirmatoria de un modelo terico previo, en especial, dentro del marco metodolgico del
Modelo de Ecuaciones Estructurales. De modo contrario se corre el riesgo de obtener
estructuras puramente empricas dependientes de la muestra escogida y no replicables con
facilidad.
Estas estrategias analizadas son congruentes con la Teora Clsica de los Tests.

Vous aimerez peut-être aussi