Psicloga Qu es un tem? Un tem es una frase o proposicin que expresa una idea positiva o negativa respecto a un fenmeno que nos interesa conocer. Por ejemplo, el tem: "Las normas sobre utilizacin de carretillas elevadoras dictadas por la empresa, en la prctica cotidiana, son de difcil cumplimiento. Expresa una opinin sobre un tema: la poltica normativa de la empresa, y se refiere concretamente al manejo de carretillas. La posicin valorativa de tal afirmacin hecha por un individuo se puede considerar como un indicador de su opinin sobre dicha poltica normativa, sobre el uso de carretillas elevadoras, sobre la seguridad en la empresa, etc. Redaccin de tems La redaccin de los tems en el proceso de la construccin de una prueba, consiste en escribir los enunciados y dems componentes de los tems Segn lo afirman Tornimbeni et al. (2004) existen pautas convencionales para la redaccin de tems de prueba.
Estas incluyen recomendaciones tales como:
Redactar tems congruentes con el objetivo de medicin. Evitar los tems demasiado largos, por ejemplo que tengan ms de 20 vocablos. Evitar las oraciones complejas con ambigedades o de doble sentido. Evitar las frases con dobles negaciones no es cierto que no.. Evitar el uso de expresiones extremas (nunca, siempre, todos). En su formato mas simple un tem esta constituido por un tronco, enunciado o pregunta y en el formato mas frecuente, varias alternativas de respuesta: Una respuesta correcta y las dems son los distractores. Frecuentemente esta unidad bsica va acompaada por el planteamiento de: problema, texto , ilustracin, diagrama etc. que se utiliza como objeto sobre el que referir las preguntas; cuando esto es as , el tems va acompaado por una instruccin en negrita que dirige la actividad del sujeto a leer el texto, ver el grafico y responder al tem. Si esta referencia va acompaada por varios tems que preguntan sobre ella se suele hablar de un superitem. Esta estructura de tems permite mayores posibilidades a la hora de preguntar sobre referentes de una cierta complejidad y evaluar procesos cognitivos distintos. Es recomendable evitar las frases incompletas como tronco del test y sustituirlas por enunciados declarativos o interrogativos, porque estos son mas consistentes con las alternativas , que adems as estarn expresadas de forma mas completa , con ello se ponen en funcionamiento procesos cognitivos de nivel superior al de la simple memorizacin para rellenar o completar la frase. En los test de ejecucin mxima , se suelen utilizar alternativas de una nica respuesta correcta. El primer tipo de alternativa suele requerir del sujeto el recuerdo de hechos o de informacin, mientras que las de tipo de la mejor respuesta correcta requieren de juicio y discriminacin, consecuentemente son mas difciles y pueden ser utilizadas para mayor variedad de propsitos de medida, por ejemplo los tems que se refieren a nivel cognitivo, anlisis y sntesis , evaluacin etc. Hay que tener ciertas precauciones con las alternativas del tipo todas las anteriores o ninguna de las anteriores . Solo son recomendables cuando el enunciado del tem lo pida, pero no como recurso para completar el numero de alternativas. Permiten dotar de una mayor dificultad el tem.; as como tambin se debe tener cuidado de no dar pistas con el resto de alternativas. Este tipo de alternativas son compatibles con los tems del tipo de la mejor respuesta correcta. Hay que tener cuidado con el uso de determinantes o cualificadores en los tems. No suelen ser recomendables por dotar de una cierta indefinicin o subjetividad al tem. Adems pueden dar pistas sobre la respuesta correcta. Tres criterios para la confeccin de los items de una escala 1.-Los tems deben facilitar respuestas relacionadas con el fenmeno medido, aunque dicha relacin no tiene porqu ser necesariamente manifiesta. 2. -Cada tem debe declarar no slo las dos posturas extremas, sino tambin graduar las intermedias. 3.- Los tems deben ser fiables y seguros. La fiabilidad con frecuencia se logra a costa de la precisin. Cuanto ms refinada es una medicin, ms probable es que en dos medidas repetidas obtengamos puntuaciones distintas. Precisiones en la redaccin del tems Se sugiere: utilizar el lenguaje ms apropiado al nivel de maduracin y educativo de la poblacin (Osterlind, 1990).
Recomendaciones : Precisin en el lenguaje.
El tem debe ser breve, no ambiguo, ausencia de palabras irrelevantes o tautolgicas y sin trminos polismicos. Evitar palabras estereotipadas y las dotadas de prejuicio o sesgo. No conviene intentar hacerse el simptico con la redaccin de los tems. Procedimiento General de Construccin de una Prueba La estructura sintctica y la longitud de las distintas alternativas de respuesta deben ser equiparables. En las escalas Likert o test de ejecucin tpica: 1.- Los tems de acuerdo suelen tener enunciados declarativos con los que se pueda estar de acuerdo o no. 2.- Los tems de frecuencia suelen ser hechos , circunstancias o comportamientos de los que se tenga sentido preguntar cuantas veces ocurren. 3.- Los tems de evaluacin suelen ser frases cortas relativas a personas , lugares, cosas, hechos o comportamientos que las personas puedan juzgar. El tronco o enunciado del tem, en su parte fundamental debe contener la informacin necesaria y fundamental para comprender perfectamente la situacin que se plantea y el tipo de respuesta que se pide. Para ello y como recurso practico que facilite la congruencia entre el objetivo operativo propio de cada una de las casillas del cuadro de especificaciones del test; se suelen utilizar tablas que clasifican verbos de accin y los objetos directos de esa accin que son pertinentes en funcin del nivel taxonmico cognitivo pertinente para cada objetivo operativo del cuadro de especificaciones del test. Los tems se deben redactar respondiendo a la definicin del contenido del dominio psicolgico que se pretende medir algunas taxonomas con sus correspondientes verbos de accin y objetos directos a los que se va a aplicar. Recordemos que medir es asignar un valor numrico a las caractersticas de las personas , es usada para facilitar el trabajo de comparar los atributos intra e inter personal con nmeros y datos objetivos, as como sus diferentes aspectos psicolgicos , tales como el conocimiento, habilidades, capacidades personalidad etc. La psicometra, engloba la teora y la construccin de pruebas , test y otros procedimientos de medicin validos y confiables, incluye por lo tanto la elaboracin, aplicacin de procedimientos estadsticos Que permitan determinar si una prueba o test es valido o no para la medicin de una variable o conducta psicolgica previamente definida. Sin embargo, la medida de estos aspectos no directamente observable es difcil y en gran parte de la investigacin y tcnicas acumuladas en esta disciplina estn diseadas para definirlos de manera fiable antes de cuantificarlo. Los primeros trabajos de psicometra se desarrollaron para medir la inteligencia , posteriormente , la teora psicomtrica se ha aplicado a la medida de otros aspectos como los rasgos de personalidad , actitudes y creencias, rendimiento acadmico y en campos relacionados con la salud y la calidad de vida. Errores frecuentes al elaborar tems Para Nunnally (1991) los dos errores ms comunes en la redaccin de tems son: a) Ambigedad (preguntas difusas que admiten varias respuestas). b) Trivialidad (centrarse en aspectos poco importantes del rasgo o dominio en cuestin). Fases en la construccin de un test Existen diversas posibilidades de definir la secuencia de tareas, pero por lo general se partir de una teora ya existente, por ejemplo la teora psicoanaltica de las pulsiones, teniendo en cuenta sus postulados se generan las preguntas tems o tareas del test. Estos tems con la ayuda de diversos procedimientos y pruebas estadsticas , sern estudiados estableciendo su valor discriminatorio, su confiabilidad, su validez , etc. Con frecuencia se realiza una agrupacin hipottica de las caractersticas que se medirn y luego a travs de procedimientos estadsticos ( por ejemplo el anlisis factorial) se explora la intensidad o la frecuencia de presentacin del rasgo estudiado . Formatos de seleccin de respuesta Existen formatos de seleccin de respuesta y de construccin de respuesta, los primeros facilitan la calificacin automatizada y pueden aplicarse con facilidad a gran cantidad de evaluados. El formato de seleccin de respuesta en presentar una eleccin de respuestas y requerir la seleccin de una alternativa. Existen tres tipos: Los tem de opcin mltiple, Los tem de relacin y Los tem de verdadero/falso. Un reactivo de opcin mltiple consta de tres elementos un enunciado o base del tem, una alternativa u opcin correcta o clave y varias alternativas u opciones incorrectas llamadas distractores. Poseen una sola respuesta correcta Son muy sencillos de aplicar Se adaptan a resultados de aprendizaje especficos Permiten un muestreo completo del dominio a evaluar Eliminan el efecto de halo en el evaluador Facilitan la calificacin automatizada, rpida, fcil y sin divergencia de opinin o interpretacin Producen una calificacin estable en el tiempo para una misma persona o bien entre diferentes evaluadores Permiten una calificacin dictoma (0-1) o de crdito parcial (si se cuenta con software apropiado para la calificacin) Pueden medir conocimientos y habilidades de los objetivos de enseanza con la misma o mayor efectividad que otros tipos de prueba. Favorecen incrementar la confiabilidad de la prueba. Son flexibles para evaluar tanto aprendizajes sencillos como complejos. Pueden cubrir todo tipo de contenidos y disciplinas Escalas aditivas Las escalas aditivas estn constituidas por una serie de tems ante los cuales se solicita la reaccin del sujeto. El interrogado seala su grado de acuerdo o desacuerdo con cada tem (muy de acuerdo, de acuerdo, indeciso en desacuerdo, muy en desacuerdo). A cada respuesta se le da una puntuacin favorable o desfavorable. La suma algebraica de las puntuaciones de las respuestas del individuo a todos los tems da su puntuacin total que se entiende como representativa de su posicin favorable-desfavorable con respecto al fenmeno que se mide. La justificacin razonada de tales puntuaciones totales, como base para la colocacin de los individuos en una escala, es la siguiente: A un tem que puede ser admitido con diversos grados de aprobacin, se le pueden atribuir diversos "pesos", conforme a las frecuencias aprobatorias que reciba de acuerdo con la curva normal. Asimismo y por consiguiente: 1) cada individuo recibe una puntuacin proporcional a su aprobacin acumulada. 2) cada tem recibe diversos pesos segn el grado con que es aprobado. La probabilidad de acuerdo o desacuerdo con cualquiera de las series de tems favorables o desfavorables, con respecto a un objeto, vara directamente con el grado de actitud de un individuo. Un individuo con una actitud favorable responder favorablemente a muchos tems (es decir, estar de acuerdo con muchos tems favorables al objeto y disentir a los desfavorables); de un individuo ambivalente puede esperarse que responda desfavorablemente a unos y favorablemente a otros; un individuo con una actitud desfavorable responder desfavorablemente a muchos tems. El tipo de escala aditiva ms frecuentemente utilizado en el estudio de las actitudes sociales es el de Likert. Construccin de una escala aditiva tipo Likert La escala de Likert es una escala ordinal y como tal no mide en cunto es ms favorable o desfavorable una actitud, es decir que si una persona obtiene una puntuacin de 60 puntos en una escala, no significa esto que su actitud hacia el fenmeno medido sea doble que la de otro individuo que obtenga 30 puntos, pero s nos informa que el que obtiene 60 puntos tiene una actitud ms favorable que el que tiene 30, de la misma forma que 40C no son el doble de 20C pero s indican una temperatura ms alta. A pesar de esta limitacin, la escala Likert tiene la ventaja de que es fcil de construir y de aplicar, y, adems, proporciona una buena base para una primera ordenacin de los individuos en la caracterstica que se mide. La construccin de esta escala comporta los siguientes pasos: 1.- Se recoge una larga serie de tems relacionados con la actitud que queremos medir y se seleccionan, aquellos que expresan una posicin claramente favorable o desfavorable. 2.- Se selecciona un grupo de sujetos similar a aqul al que piensa aplicarse la escala. Estos responden, eligiendo en cada tem la alternativa que mejor describa su posicin personal. 3.- Las respuestas a cada tem reciben puntuaciones ms altas cuanto ms favorables son a la actitud, dndose a cada sujeto la suma total de las puntuaciones obtenidas. 4.- Para asegurar la precisin de la escala, se seleccionaran el 25 % de los sujetos con puntuacin ms alta y el 25 % con puntuaciones ms baja, y se seleccionan los tems que discriminan a los sujetos de estos dos grupos, es decir, aquellos con mayor diferencia de puntuaciones medias entre ambos grupos. 5.- Para asegurar la fiabilidad por consistencia interna, se halla la correlacin entre la puntuacin total y la puntuacin de cada tem para todos los individuos, seleccionndose los tems con coeficiente ms alto. 6.- Con los criterios anteriores de precisin y fiabilidad se selecciona el nmero de tems deseado para la escala. Para asegurar la validez del contenido, aproximadamente la mitad de los tems deben expresar posicin favorable y desfavorable la otra mitad. Ejemplo escala Likert Definiciones: anlisis del rasgo a evaluar Se trata de establecer el constructo no observable que se pretende medir con el test y los factores que podran definirlo, por ejemplo el constructo personalidad y los rasgos estructurales que la definiran , o las funciones cognitivas que la denotan. En esta fase se trata de delimitar los alcances de lo que se quiere medir , definir operacionalmente el concepto, aislarlo de otros constructos aledaos etc. Se supone que la calidad del anlisis y delimitacin clara del constructo determina en gran medida el xito de la aplicacin posterior y la consistencia interna y externa ( en trminos de fiabilidad y validez) del test que se construye.