Académique Documents
Professionnel Documents
Culture Documents
Prlogo.........1
PARTE I. R y Rcommander
INTRODUCCIN .............................................................................................................. 2 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Instalacin de R ...................................................................................................... 6 Primer contacto....................................................................................................... 8 Opciones de trabajo con R ................................................................................... 12 Obtencin de ayuda sobre R ............................................................................... 14 Paquetes ................................................................................................................. 19 R a modo de calculadora ...................................................................................... 20 Notas bsicas sobre R ........................................................................................... 21
RCOMMANDER .................................................................................................................... 23 2.1 2.2 2.3 2.4 2.4.1 Instalacin de Rcommander ............................................................................... 23 Descripcin de Rcommander .............................................................................. 26 Opciones generales de la barra de mens ........................................................... 29 Lectura e importacin de datos ........................................................................... 33 Opciones de configuracin ................................................................................ 42
MANIPULACION DE DATOS Y TRANSFORMACION DE VARIABLES ........... 44 3.1 3.1.1 3.1.2 3.1.3 3.1.4 3.1.5 3.1.6 3.1.7 3.1.8 3.2 3.2.1 3.2.2 3.2.3 3.2.4 3.2.5 Manipulacin de datos ......................................................................................... 44 Seleccionar conjunto de datos activo................................................................. 45 Actualizar conjunto de datos activo................................................................... 45 Ayuda sobre el conjunto de datos activo ........................................................... 46 Variables del conjunto de datos activo .............................................................. 46 Establecer nombres de casos ............................................................................. 47 Filtrar el conjunto de datos activo ..................................................................... 47 Eliminar los casos con valores omitidos............................................................ 49 Guardar el conjunto de datos activo .................................................................. 50 Manipulacin de variables .................................................................................. 51 Recodificar variables ......................................................................................... 52 Calcular una nueva variable .............................................................................. 54 Aadir nmero de observaciones al conjunto de datos ..................................... 55 Tipificar variables .............................................................................................. 56 Convertir variable numrica en factor ............................................................... 57
____________________________________________________________________ I
ANLISIS DE ESCALAS ............................................................................................... 62 4.1 4.2 4.3 4.3.1 4.4 4.5 4.6 4.6.1 4.6.2 4.6.3 Presentacin del ejemplo ...................................................................................... 63 Lectura de datos.................................................................................................... 65 Correccin de la prueba. Recodificacin de los tems ....................................... 69 tems inversos .................................................................................................... 71 Correccin de la prueba. Obtencin de la puntuacin ...................................... 76 Anlisis de tems.................................................................................................... 80 Anlisis de tems. ndices de forma ..................................................................... 82 Media aritmtica ................................................................................................ 82 ndice de atraccin ............................................................................................. 83 Grfico de la distribucin de respuestas ............................................................ 86
FIABILIDAD. NDICE DE DISCRIMINACIN Y COEFICIENTE ALFA ............ 89 5.1 5.2 5.3 5.3.1 5.3.2 5.3.3 5.3.4 5.3.5 5.3.6 5.4 5.4.1 5.4.2 5.4.3 5.4.4 ndices de relacin. Matriz de correlaciones ...................................................... 89 ndices de relacin. ndice de discriminacin .................................................... 93 Fiabilidad............................................................................................................... 94 Modelo lineal clsico ......................................................................................... 95 Coeficiente de fiabilidad.................................................................................... 98 Procedimientos empricos para la estimacin del coeficiente de fiabilidad ...... 99 Estimacin de la puntuacin verdadera ........................................................... 101 Coeficiente alfa................................................................................................ 106 ndices derivados del modelo factorial ............................................................ 108 Rcommander y la estimacin de la fiabilidad.................................................. 111 Matriz de correlacin ....................................................................................... 111 ndice de discriminacin y coeficiente alfa ..................................................... 113 Coeficiente Theta............................................................................................. 116 Error estndar de medida y estimacin de la puntuacin verdadera................ 116
VALIDEZ ........................................................................................................................ 119 6.1 6.2 6.2.1 Sesgo..................................................................................................................... 122 Fuentes de evidencia ........................................................................................... 124 Contenido ........................................................................................................ 124
____________________________________________________________________ II
ESTRUCTURA INTERNA. DIMENSIONALIDAD .................................................. 140 7.1 7.1.1 7.1.2 7.1.3 7.1.4 7.1.5 7.1.6 7.2 7.2.1 7.3 7.3.1 7.3.2 7.3.3 7.3.4 7.3.5 Modelo de anlisis factorial ............................................................................... 141 Supuestos y consecuencias .............................................................................. 143 Reproduccin de la matriz de correlacin ....................................................... 145 Representacin matricial ................................................................................. 146 Extraccin factorial ......................................................................................... 148 Modelo de componentes principales ............................................................... 152 Rotacin factorial ............................................................................................ 153 Etapas en la ejecucin de un anlisis factorial ................................................. 156 Interpretacin de la solucin factorial ............................................................. 157 Anlisis factorial y Rcommander .................................................................... 163 Modelo unidimensional ................................................................................... 163 Modelo bidimensional ..................................................................................... 168 Representacin grfica de la solucin factorial ............................................... 171 Estimacin de las puntuaciones factoriales ..................................................... 172 Anlisis de componentes principales ............................................................... 173
FUNCIONAMIENTO DIFERENCIAL DEL TEM .................................................. 176 8.1 8.2 8.3 8.3.1 8.4 8.4.1 8.4.2 Conceptos bsicos ............................................................................................... 177 Estandarizacin .................................................................................................. 181 Regresin logstica .............................................................................................. 182 Consideraciones sobre el funcionamiento diferencial del tem ....................... 184 Funcionamiento diferencial del tem y Rcommander ..................................... 186 Regresin logstica .......................................................................................... 186 Diferencias entre medias ponderadas .............................................................. 188
COMPARACIN ENTRE GRUPOS. (ALICIA LPEZ-JUREGUI) ................... 192 9.1 9.1.1 9.1.2 9.1.3 9.2 9.2.1 9.3 Comparacin de dos grupos. Pruebas de comparacin de medias ................ 193 Prueba para una media..................................................................................... 194 Comparacin de dos medias ............................................................................ 197 Pruebas para las varianzas ............................................................................... 204 Pruebas para las proporciones .......................................................................... 206 Tablas de doble entrada. Inferencia ................................................................. 211 Comparacin entre ms de dos grupos (ANOVA) .......................................... 215
____________________________________________________________________ III
TEST-CRITERIO. REGRESIN LINEAL ................................................................ 238 10.1 10.1.1 10.1.2 10.1.3 10.1.4 10.1.5 10.1.6 10.1.7 10.2 10.3 10.3.1 10.3.2 10.3.3 10.3.4 10.3.5 10.3.6 10.4 10.4.1 10.4.2 Regresin simple ................................................................................................. 239 Ecuacin de la recta ......................................................................................... 239 Relaciones entre variables en las ciencias sociales.......................................... 240 Estimacin de la recta de regresin ................................................................. 241 Error tpico de estimacin ............................................................................... 244 Estimacin del criterio ..................................................................................... 244 Descomposicin de la varianza y coeficiente de determinacin .................... 245 Modelo lineal ................................................................................................... 249 Regresin simple con Rcommander ................................................................. 250 Regresin mltiple .............................................................................................. 254 Modelo............................................................................................................. 254 Supuestos ......................................................................................................... 257 Estimacin de los parmetros .......................................................................... 258 Descomposicin de la varianza ....................................................................... 259 Coeficiente de determinacin mltiple ............................................................ 261 Inferencias sobre el modelo ............................................................................. 263 Correlacin mltiple con Rcommander ......................................................... 265 Diagnsticos del modelo de regresin ............................................................. 269 Representacin grfica de distribuciones multivariadas.................................. 271
11
INTERPRETACIN NORMATIVA DE PUNTUACIONES. BAREMOS ............. 274 11.1 11.2 11.3 Transformaciones lineales.................................................................................. 274 Transformaciones no lineales ............................................................................ 276 Baremos con Rcommander ............................................................................... 278
12
____________________________________________________________________ IV
-1-
1 Introduccin
En el mbito de las ciencias sociales se dispone de una variada gama de programas para el anlisis de datos, que bien bajo licencia privativa o bajo licencia libre cumplen las exigencias del usuario independientemente del tipo de explotacin o de la sencillez o complejidad de los modelos que quiera evaluar. Entre los primeros, se podran citar programas tan conocidos como PASW (antes SPSS), SAS, STATISTICA, Systat, Stata o GenStat que han copado durante aos el mercado, y han sido, y son utilizados como herramienta para la docencia por prcticamente todas las universidades tanto espaolas, europeas como americanas. Desde sus primeras versiones hasta las actuales, estos programas han ido incorporando modelos de anlisis cada vez ms complejos a la par que han ido mejorando sus interfaces grficas (GUI Graphical User Interfaces). El desarrollo de los mens contextuales basados en la gestin de ventanas los han convertido en programas de fcil manejo, y al mismo tiempo ha permitido una socializacin en el uso de modelos de anlisis complejos que son ahora accesibles al usuario medio. Sin embargo, el carcter comercial y la licencia privativa de todos ellos es una limitacin que valoro negativamente. Desde el punto de vista del profesor que asume la responsabilidad de ofrecer y facilitar al alumno las bases para una formacin continua que no finaliza con el abandono de la universidad, la accesibilidad es una caracterstica substancial. La disponibilidad de una herramienta, siempre asequible a coste 0, es un factor que debiera considerarse en la docencia, por ofrecer tanto al alumno como al futuro profesional una autonoma de trabajo efectiva que facilita el proceso de enseanza-aprendizaje. Adase, que los programas comerciales comparten otra caracterstica referida a su funcionamiento. Son herramientas cerradas, prediseadas, y en consecuencia difcilmente manipulables, que operan a travs de algoritmos -2-
implementacin entre la poblacin estadstica, lo cual garantiza su validez; es la implementacin GNU de S, lo cual garantiza la gratuidad de su distribucin. Adems R ofrece la capacidad de combinar anlisis prediseados con anlisis especficos adaptados a cada situacin concreta, lo cual garantiza su versatilidad. Validez, gratuidad y versatilidad son las cartas de presentacin de R frente al resto de software para el anlisis de datos. El entorno R, que era utilizado hasta hace poco tiempo, prcticamente slo por estadsticos o personal altamente especializado, se convierte con la ayuda de una interfaz grfica (por ejemplo, Rcommander de John Fox) en una herramienta para el anlisis de datos con un potencial inusitado, a la vez que cumple los criterios de facilidad de uso y gratuidad. Estas caractersticas convierten a R en un poderoso aliado para la enseanza del anlisis de datos, pero adems, ofrece al alumno o profesional una herramienta continuamente actualizada que le brinda la posibilidad de una autonoma de trabajo no disponible bajo cualquier ningn otro entorno (Elosua, 2009). R es un entorno de programacin y anlisis estadstico y grfico derivado del lenguaje de programacin S (Becker, Chambers y Wilks, 1988;
-3-
-4-
actualizacin de la obra de Chambers (2007), uno de los artfices del lenguaje S, es una excelente opcin. La transicin entre el SPSS o SAS al R puede acompaarse de la lectura del trabajo de Muenchen que con el ttulo R for SAS and SPSS Users ofrece dos productos; un corto y accesible en red (http://rforsasandspssusers.com /), y otro de 470 pginas publicado recientemente por Springer (Muenchen, 2009). En R confluyen caractersticas que convierten a este entorno en algo nico: es libre, tiene versiones para distintas plataformas (Windows, Linux, Unix, o Mac), est continuamente actualizado y siempre a la vanguardia de los
-5-
1.1
Instalacin de R
El primer paso en la utilizacin de R comienza con su instalacin. El proceso, aunque similar para las distintas plataformas, ser brevemente descrito para Windows (aunque parezca una contradiccin GNU-Windows). La instalacin de R bajo Windows se lleva a cabo directamente desde la pgina de CRAN (Comprehensive R Archive Network) a la que se puede acceder a travs de la direccin. http://cran.r-project.org/.
-6-
En esta pgina, una vez seleccionada la opcin Windows, aparecer una pantalla como la que se muestra en la siguiente figura,
En ella se seleccionar la opcin base que permitir la instalacin del paquete base o paquete bsico para la ejecucin de R. Las funciones incluidas en base son fcilmente ampliables a travs de los ms de 2100 paquetes o contribuciones aadidas al entorno R; cantidad que va incrementndose da a da .
-7-
El archivo de instalacin de R es el archivo con extensin .exe (R2.10.1.exe; esta es la versin activa en el momento de redaccin de este manual). Una vez seleccionado el archivo es posible guardarlo o ejecutarlo directamente. El tamao del archivo (32 megabytes) y el tipo de conexin a Internet hacen aconsejable seleccionar un repositorio (mirror; espejo de CRAN) cercano al lugar donde habitamos para agilizar la transferencia del fichero. Una vez ejecutado el archivo de instalacin, ste preguntar por el idioma deseado, as como por el directorio en el que se quiera instalar R. Por defecto, el programa se instalar en C:\Archivos de programa\R\R2.10.1, opcin que puede modificarse a conveniencia.
1.2
Primer contacto
Una vez instalado el programa es posible ejecutarlo a travs del icono de acceso directo que aparecer en el escritorio, o bien a travs de las ventanas Inicio>Todos los programas>R>R2.10.1. La primera pantalla que aparece cuando se ejecuta R recibe el nombre de consola de R (R console). En ella puede comprobarse la versin instalada (R versin 2.10.1).
-8-
La presencia del smbolo del sistema o prompt, en color rojo, (>) indica que R est listo para recibir comandos. Por ejemplo, tecleando 2 + 3 (pruebe el lector cualquier otra operacin) y pulsando <ENTER>, R devolver el resultado de la operacin aritmtica.
> 2+3 [1] 5 >
El [1] indica el orden de aparicin de los resultados. En este caso slo se ha solicitado un resultado. Si la salida hubiera sido ms compleja R reconocera cada uno de los elementos por un nmero correlativo entre corchetes que indica la posicin del resultado. El smbolo de sistema > indica que R est listo para recibir otra instruccin. Si se desea generar una serie aleatoria de nmeros que se distribuyan segn la ley normal, y despus representar su distribucin por medio de un
-9-
N=100",xlab="", ylab="frecuencia")
Se ha ejecutado este comando en tres ocasiones diferentes variando el nmero de elementos generados. La sucesin de histogramas muestra la aproximacin a la distribucin normal de la muestra a medida que aumenta el nmero de elementos generados (N=100, N=1000; N=10000). La representacin grfica obtenida slo quiere ser un ejemplo de la facilidad y versatilidad de R, propiedades ambas que se irn descubriendo a lo largo del presente manual.
20
200
1500
150
15
frecuencia 10
frecuencia
frecuencia 1000
100
500
50
-3
3 2 1 0 1 2 3
-2
-1
-2
Adems del smbolo del sistema (>), la consola de R puede presentar un smbolo + (tambin en color rojo) para indicar que la instruccin dada a R es incompleta y que no puede ejecutarse sin antes finalizar correctamente la secuencia de comandos. Por ejemplo si se teclea 3+5+ (la instruccin no est completa y por tanto R lo advierte con la presencia del smbolo +. Si ante el smbolo + se teclea algo que pueda concluir la instruccin a ejecutar (por ejemplo 7*3) R devolver el resultado de la operacin, 29.
- 10 -
Para abandonar R tras una sesin de trabajo son varias las opciones disponibles: 1.- Teclear directamente en la consola q (). 2.- Acceder a la opcin Salir a travs de la barra de mens Archivo>Salir. 3.- Pulsar directamente sobre el icono de salida .
Antes de abandonar la sesin de trabajo el sistema preguntar si se desea guardar una copia (la imagen) del rea de trabajo. Si la respuesta es afirmativa se salvarn todos los objetos creados en el rea de trabajo durante la ltima sesin; en caso contrario no se podrn recuperar los objetos creados en una sesin posterior. Tambin es posible salvar slo parte de los objetos; para ello el comando a utilizar sera save(nombre objeto, file=nombre archivo). Por defecto, la extensin utilizada para almacenar un rea de trabajo es .Rdata. Los comandos que se han ido generando se almacenan en
- 11 -
1.3
Bajo el entorno Windows (que es la plataforma que describiremos a lo largo de esta introduccin a R) existen varias opciones de trabajo, es decir, diferentes vas para la introduccin y ejecucin de instrucciones. Es posible utilizar slo una de ellas, o utilizar varias simultneamente. Las necesidades del usuario determinarn en cada caso la eleccin del modo de operar. Bsicamente se dispone de 4 modos diferentes para trabajar con R: 1. Trabajar directamente sobre la ventana de comandos (R console), tecleando los comandos en la lnea de smbolo del sistema >. Es un modo de trabajo interactivo que permite ejecutar acciones simples porque slo puede ejecutarse un comando cada vez. Las flechas de direccin facilitan el modo de operar con la consola. La flecha hacia arriba () permite acceder a comandos previos
y la flecha hacia abajo () da acceso a comandos posteriores al actual. Las flechas hacia la izquierda () y hacia la derecha () mueven el cursor en dichos sentidos dentro de una lnea. Los comandos pueden copiarse y pegarse, como en cualquier editor de textos, funciones Ctrl+C y Ctrl+V. con las
2.
Abrir y trabajar en una ventana de escritura (Script window) a la que se accede seleccionando la opcin Nuevo Script de la barra de mens, Archivo>Nuevo Script. Esta opcin permite crear cdigos ms complejos que pueden ejecutarse por bloques. Los cdigos se teclearn directamente en esta ventana o podrn ser copiados de un archivo ya existente en formato ASCII. Para ejecutar un subconjunto de comandos, se debe de marcar la seccin a ejecutar y pulsar CTRL+R o en su defecto el icono de ejecucin . Cuando
- 12 -
3.
Utilizar programas especficos de edicin de cdigos. Entre los ms utilizados se pueden o citar Tinn-R, WinEdit Emacs (http://www.sciviews.org/Tinn-R/), (http://www.winedt.com/)
(http://www.gnu.org/software/emacs/ ), software creado inicialmente para el entorno Unix bajo la filosofa GNU. Son programas de edicin especializados que facilitan enormemente el trabajo con cdigos o programas (conjuntos de instrucciones, comandos necesarios para la ejecucin de determinados trabajos) ms o menos complejos. Es la opcin preferida de los usuarios avanzados de R. 4. Utilizar interfaces grficas. Existen varias GUI (Graphical user interfaz) que facilitan el trabajo con R a personas desconocedoras de este entorno de programacin y anlisis. Entre las GUI disponibles mencionaremos, (http//www.math.csi.cuny.edu/pmg), - 13 R.NET Rkward (http://www.u.arizona.edu/~ryckman/RNet.php), Poor Mans GUI
1.4
El entorno R es extraordinariamente amplio e incorpora diversas fuentes de ayuda sobre procedimientos, comandos, paquetes o sobre la aplicacin de determinados modelos matemticos que resultan de gran utilidad ante cuestiones o dudas que surgen durante una sesin de trabajo. El modo bsico de obtencin de ayuda en R es a travs de la opcin Ayuda accesible desde la barra de mens, desde ella se pueden seleccionar varias alternativas 1.- La opcin Ayuda>Funciones R(texto) abre una ventana
- 14 -
Ambos modos dan acceso a una pgina de informacin sobre el tpico indicado. 2.- La opcin Ayuda>Ayuda Html, acciona el explorador definido por defecto y muestra un pantalla a travs de la cual se accede a la informacin almacenada en la memoria.
- 15 -
Este comando ofrece como salida una lista de todas las funciones cuyas pginas de ayuda contienen la palabra situada entre comillas. En este caso factor analysis.
- 16 -
promax.Si se desea acceder al contenido de estas funciones, a su descripcin, bastara con teclear en la consola el nombre de la funcin, y la librera que la contiene:
help(factanal,package=stats)
Este comando abrira una pgina de ayuda sobre la funcin factanal en la que se incluye una descripcin de la misma, su uso, el modo de especificar sus argumentos y un conjunto de ejemplos.
Se accede a una lista de todas las funciones que incluyen el texto entrecomillado; en este caso vector.
- 17 -
1.11. Figura.apropos()
Todas estas funciones de ayuda ofrecern informacin sobre paquetes que tengamos instalados. Sin embargo, en muchas ocasiones el inters se centra en saber si R dispone de funciones para llevar a cabo determinado tipo de anlisis, y esta informacin va ms all de las libreras instaladas. La funcin RSiteSearch() escrita directamente sobre la consola R ejecutar una bsqueda en la Web de R. Existen adems de las descritas varias fuentes de informacin sobre R disponibles en la red; R dispone de una lista de distribucin (https://stat.ethz.ch/mailman/listinfo/r-help) y de un buscador especfico sobre funciones, comandos o cuestiones relacionadas con R http://www.rseek.org/.
informacin sobre R, que incluye manuales de uso en varios idiomas, informacin sobre paquetes o listas sobre FAQ (Frequently Asked Questions) que pueden solucionar ms de una duda al usuario. Entre ellas resulta especialmente atractiva la wiki (http://wiki.r-project.org/rwiki/doku.php).
- 18 -
R es un sistema dinmico en el que las contribuciones de autores individuales se ponen a disposicin de los usuarios en forma de libreras o paquetes (packages). Cuando se instala R por primera vez se instala el paquete BASE, que puede ampliarse fcilmente por medio de paquetes adicionales que irn configurando R a la medida de las necesidades de cada usuario. Un paquete no es ms que un conjunto de funciones y datos que una vez instalados pueden activarse a travs del comando library(). La instalacin de una nueva librera es una tarea sencilla. Para ello es posible utilizar el men desplegable de la ventana de comandos de R y seleccionar la opcin instalar paquete(s)... Esta opcin abrir una ventana con un repertorio de espejos (mirrors) accesibles desde los cuales es posible transferir los paquetes deseados.
- 19 -
library(nombre del paquete). Es sencillo conocer las libreras instaladas en memoria; para obtener un listado basta con teclear el comando installed.packages(). ruta de las libreras que los contienen. R devolver informacin sobre los paquetes instalados, su versin y el nombre y
1.6
R a modo de calculadora
El modo de trabajar ms simple o primitivo con R sera utilizarlo a modo de calculadora. En este sentido R evala y devuelve los resultados de cualquier expresin introducida en la lnea de comandos. Dado que se trata de funciones bsicas que pueden diferir ligeramente de cmo son definidas en otros entornos la tabla siguiente ofrece una breve descripcin de las funciones algebraicas ms comunes
Funcin +, -, *, / abs asin acos atan exp, Round sin con tan log Operacin Suma, Resta, Multiplicacin, Divisin Valor absoluto Inversas de las funciones trigonomtricas Exponencial y logaritmo natural Redondeo Funciones trigonomtricas
- 20 -
Como ejemplo, que puede servir al lector de primer ejercicio con R se muestra la ejecucin de algunas de ellas.
> 2+3 [1] 5 > sqrt(20) [1] 4.472136 > 5%/%3 # genera la parte entera de la divisin 5/3 [1] 1 > 5%%3 [1] 2 > pi*5^2 # rea de un crculo de radio 5 [1] 78.53982 > 1000*(1+0.05)^3-100 [1] 1057.625 > sqrt(c(10,100,1000)) [1] 3.162278 10.000000 31.622777 # devuelve el resto de la divisin 5/3
1.7
R es un entorno de programacin orientado a objetos. Esto significa que dependiendo del tipo de objeto al que se aplique una funcin, es decir, dependiendo de las caractersticas de los objetos, de sus atributos, el mismo comando actuar de diferente manera. En este primer captulo, no vamos a describir los tipos de objetos, ni las caractersticas de cada uno; esto se har en la parte final de este manual introductorio. En este punto, baste mencionar que el concepto de fichero de datos con el que se trabaja bajo SPSS o BMDP (por citar dos programas comerciales) se flexibiliza bajo el entorno R, donde la unidad de anlisis u objeto ms comn es una data frame o marco de datos. Por el
- 21 -
En R los nombres de los objetos son combinaciones de letras, nmeros y el carcter .. No es posible definir el nombre de un objeto utilizando como primer carcter un nmero, sin embargo, s es posible utilizar el ..R adems es caso sensitivo; una letra mayscula es diferente de su homnima minscula
> 1.data #nombre incorrecto > .data #nombre correcto > Data #distinto de data
- 22 -
2 Rcommander
2.1
Instalacin de Rcommander
Rcommander es un paquete adicional de R concebido como una interfaz grfica (Graphical User Interface GUI) que incorpora funciones para el anlisis estadstico y generacin de grficos. Consigue, a travs de un sistema de ventanas, convertir a R en un entorno amigable que facilita enormemente su utilizacin a aquellos usuarios no familiarizados con este entorno de programacin. Trabajar en R con la ayuda de Rcommander se convierte en una experiencia similar a analizar datos bajo cualquier paquete estadstico al uso (SPSS, SAS, S-plus). Los mens desplegables que ofrece Rcommander, permiten al usuario que apenas conoce el entorno R, realizar las tareas de importar/exportar ficheros, manipular variables (recodificar, computar), seleccionar casos, describir datos, generar grficos o ajustar modelos. Pero adems, al mismo tiempo, Rcommander abre la posibilidad de modificar los comandos bsicos o aadir nuevos comandos para realizar tareas que se ajusten a necesidades especficas. Las capacidades del Rcommander (como las del entorno R) han ido y van continuamente amplindose. La versin sobre la que trabajamos fue construida para dar cobertura a un curso bsico de anlisis de datos. Esto significa que slo una pequea fraccin del potencial estadstico y de gestin de datos disponibles bajo R (actualmente son ms de 2100 los paquetes disponibles) es accesible por medio de Rcommander. En definitiva, consideramos que Rcommander (Rcmdr) es el medio ideal para acercarse a R. Constituye un entorno de trabajo que muchos usuarios no necesitarn ampliar. Sin embargo, familiarizarse con Rcommander permite
- 23 -
Una vez instalado Rcmdr es necesario cargarlo. Para ello, cuando se ejecute R se seleccionar la opcin Paquetes > Cargar y de entre el listado de libreras disponibles de elegir Rcmdr.Tambin es posible teclear directamente en la consola library(Rcmdr). La primera vez que se solicite cargar el paquete Rcmdr, R avisar que para el correcto funcionamiento de Rcmdr es necesario instalar algunos paquetes adicionales. El procedimiento de instalacin busca las libreras necesarias para el correcto funcionamiento de las funciones disponibles en Rcommander, y solicita al usuario permiso para instalar aquellos paquetes que no encontrndose previamente instalados son necesarios. El usuario slo necesitar asentir a los requerimientos del proceso de instalacin.
- 24 -
Una vez instalado y cargado Rcmdr en la consola R irn apareciendo los paquetes que ha sido necesario instalar, y la versin de Rcommander, 1.5-4., mostrando esta apariencia:
- 25 -
La aspecto.
pantalla
inicial
de
Rcommander
Graphical
user
La ventana bsica de Rcommander aparece dividida en cinco secciones: 1.- Barra de mens.
- 26 -
2.- Conjunto de datos. La segunda lnea de la pantalla principal de Rcommander informa sobre los conjuntos de datos que se encuentran disponibles en una sesin de trabajo. Aunque solamente es posible ejecutar comandos o funciones sobre un conjunto de datos activo, es posible disponer en la misma sesin de trabajo de varios conjuntos de datos que pueden ir intercambindose simplemente con seleccionarlos en la ventana en la que se indica cual es el conjunto de datos activo. Rcommander incorpora adems un editor de datos y la posibilidad de visualizarlos. El editor de datos de Rcommander podra utilizarse para introducir un pequeo conjunto de datos; sin embargo sus capacidades como editor son muy limitadas. Por ello recomendamos la utilizacin de editores ms potentes dado que los datos podrn ser importados con facilidad. Por ltimo se muestra el modelo activo, esto es, el modelo matemtico que se est aplicando sobre los datos.
La opcin de visualizar datos est fijada por defecto para poder acceder a un fichero que contiene un nmero de variables igual o menor a 100. A partir de este umbral (que puede ser modificado) se utiliza el editor de datos.
- 27 -
teclas Ctrl+r (run) para su ejecucin. Si el usuario desea escribir un comando que ocupa ms de una lnea deber comenzar la segunda lnea y siguientes con uno o ms espacios en blanco o tabuladores. La combinacin de teclas Ctrl+a seleccionar todas las lneas de la ventana de instrucciones, y Ctrl+s abrir una ventana para la grabacin del fichero de instrucciones. El hecho de que todas las acciones ejecutadas en Rcommander aparezcan en la ventana de instrucciones permite familiarizarse con el lenguaje de programacin R de modo que con un poco de dedicacin e inters se podrn reconocer y por tanto adaptar y manipular los comandos bsicos que aparecen en esta ventana.
4.- Ventana de salidas (output window) Es una ventana de edicin en la que irn apareciendo tanto los comandos a ejecutar (en color rojo) como los resultados generados por ellos (en color azul oscuro).
- 28 -
Es importante hacer notar que los grficos producidos por Rcommander generan por defecto otra ventana (dispositivo grfico) de salida. 5- Ventana de mensajes La ventana de mensajes ofrece al usuario informacin sobre los errores cometidos (mensajes en rojo), avisos (warnings) surgidos durante la ejecucin de los comandos (mensajes en verde) o informacin sobre el conjunto de datos que se est utilizando (mensajes en azul oscuro).
2.3
La barra de mens de Rcommander ofrece las siguientes opciones generales: Fichero. Permite gestionar la lectura y grabacin de ficheros de instrucciones o de ficheros de salidas generados por R.
- 29 -
Las opciones que encierra este men se refieren a la apertura y grabacin de las sesiones de trabajo bajo Rcommander. Los ficheros de instrucciones se graban por defecto con la extensin .R, mientras que las salidas generadas se almacenan en formato texto .txt. Las opciones relacionadas con el entorno de trabajo permiten guardar todos los objetos (vectores, matrices, marcos de datos...) generados durante una sesin de trabajo con el fin de poder acceder a ellos en sesiones posteriores. Estos objetos podrn ser cargados a travs de la opcin Cargar conjunto de datos desplegable dependiente de datos (Datos> que se encuentra en el men Cargar conjunto de
datos). Aunque es posible guardar la sesin de trabajo bajo cualquier extensin, la opcin de cargar los datos utiliza por defecto la extensin .Rda (Rdatos). Edicin. Las opciones que abre el men de edicin son las propias de cualquier editor al uso (cortar, copiar, pegar, buscar) que podrn ser utilizadas tanto en la ventana de instrucciones como en la ventana de salidas.
Datos Esta opcin da paso a una serie de submens relacionados con la lectura e importacin de conjuntos de datos y la manipulacin de variables contenidas en ellos.
- 30 -
Estadsticos. Accede a los submens asociados con la descripcin de datos, anlisis estadsticos bsicos, tests no paramtricos, estudio de la fiabilidad y dimensionalidad o ajuste de modelos lineales.
Grficos. Por medio de esta opcin se accede a un submen para la generacin de grficos bsicos. La gama que ofrece Rcommander es amplia, aunque al igual que todas las funciones que utiliza Rcommander es posible adaptarla a situaciones y necesidades especficas.
- 31 -
Modelos. Una vez ajustado un modelo Rcommander ofrece la posibilidad de profundizar en l por medio de informacin diagnstica sobre su ajuste que puede acompaarse adems con informacin grfica.
distribuciones estadsticas ms comunes, tanto continuas como discretas que permite generar datos, dibujar grficos, estimar cuantiles o probabilidades. Es un buen apoyo a la docencia a la par que evita el uso de tablas estadsticas.
- 32 -
Herramientas. Permite cargar distintos paquetes de R (que tienen que estar ya instalados) as como fijar varios parmetros relacionados con la configuracin de Rcommander.
Ayuda. Por medio de esta opcin se accede a un fichero que contiene informacin sobre el manejo de Rcommander.
2.4
Los datos a analizar bajo R han de definirse como el conjunto de datos activo. En el entorno R no se utiliza el trmino fichero; en su lugar se habla de objetos (vectores, matrices, factores, listas, marcos de datos, funciones). Prcticamente todo es un objeto en el entorno R. Un fichero de datos habitual en - 33 -
(lunes,
Bsicamente son tres las posibilidades que ofrece Rcommander para definir el conjunto de datos activo. Las tres son accesibles a travs del men desplegable en la opcin Datos> Nuevo Conjunto de datos, Datos>Cargar conjunto de datos, y Datos> Importar datos. 1.- Nuevo Conjunto de Datos.
- 34 -
En este ejemplo se ha creado el objeto Europa. El editor de datos de Rcommander es bastante limitado, por lo que este modo de introducir datos es adecuado solamente cuando el nmero de datos no es cuantioso.
La ventana de edicin permite asignar un nombre a cada una de las variables que se vaya a generar, y definir si la variable es de tipo numrico o de tipo carcter. Para ello basta con hacer clic en cualquiera de las columnas (var1, var2...) de la primera fila del editor.
- 35 -
Las teclas de Avance Pgina (AvPag) y Retroceso Pgina (RePag) permiten acceder a las pantallas posterior y anterior a la pantalla visible. La tecla Home sita el cursor en la primera celda de la matriz (Fila1 Columna1). La tecla End lleva al cursor a la ltima fila de la matriz. Puede redimensionarse el tamao de las columnas situndose en cualquiera de las celdas y pulsando la tecla derecha del ratn. Una vez finalizada la introduccin de datos la opcin Cerrar del men Archivo (Archivo>Cerrar) nos har abandonar la ventana de edicin. La ventana de instrucciones mostrar el siguiente comando, que indica la creacin de un marco de datos (un archivo de datos) de nombre
- 36 -
La opcin de visualizar datos mostrar la siguiente pantalla, en la que aparecen los nombres de las variables (Pas, Habitantes) y los datos correspondientes a los 25 pases de la Unin Europea que conforman este conjunto de datos.
Es importante recordar que la creacin del marco de datos no implica que los datos nombrados como Europa hayan sido grabados; si se desea trabajar con ellos en sesiones posteriores tiene que ejecutarse la opcin de guardar datos - 37 -
paquetes, permite explorar los datos que habitualmente incorporan los paquetes de R. La opcin ofrece como salida un listado de los conjuntos de datos incluidos en los paquetes.
Para utilizar alguno de ellos se selecciona la opcin Conjunto de datos en paquetes>Leer conjunto de datos desde paquete - 38 -
3.- Importar datos Esta opcin permite trabajar con datos almacenados en formato ASCII, con datos creados con software estadstico (STATA, Minitab, SPSS...) o con datos provenientes de programas como Excel o Acces. El men accesible por medio de esta opcin muestra los formatos importables desde Rcommander.
En el ejemplo mostrado a continuacin y que guiar a partir de ahora los anlisis realizados en esta introduccin a R, se importar un archivo de datos generado con SPSS, cuya extensin es .sav. Los comentarios al respecto son fcilmente generalizables para prcticamente todos los formatos de archivo especificados.
- 39 -
En primer lugar, se ha de especificar un nombre para el conjunto de datos, que no tendr porque coincidir con el nombre del archivo de datos que se va a importar. La opcin de la ventana Convertir etiquetas de valores en niveles de factor es especialmente importante en el caso de variables categricas ordenadas; por ejemplo, respuestas a tems con formato Likert en las que las opciones de respuesta se corresponden con una escala graduada. R, diferencia entre variables numricas y factores; se trata de tipos de objetos diferentes y que por lo tanto reciben un tratamiento diferente. Dentro de un anlisis de fiabilidad por ejemplo, es necesario considerar estas variables, tems, como variables numricas por lo tanto no interesara convertirlas en factores. Si seleccionamos la opcin de conversin, convertiremos esas variables numricas en variables categricas o factores, limitando de este modo su tratamiento. Por ello, dependiendo del tipo de dato y del tipo de tratamiento que se les vaya a procurar ser el investigador el que determine la conveniencia o no de convertir en factor los valores de la variable a importar. Una vez pulsada la opcin Aceptar, Rcommander permite abrir el fichero de datos a importar. El comando que genera esta opcin, utiliza la
- 40 -
Tras leer el archivo podr leerse en la ventana de mensajes: NOTA: El conjunto de datos Edi.data tiene 976 filas y 24 columnas. En el caso de que se fuera a importar un fichero en formato ASCII, formato bsico para el intercambio de ficheros entre programas, la seleccin de la opcin Datos>Importar Datos>Desde archivo de texto o portapapeles, abrir a una ventana en la que se definirn cuestiones generales de formato que determinarn la calidad de la importacin.
En este sentido son especialmente importantes el indicador de datos ausentes y el carcter decimal. En R los datos ausentes son indicados al sistema por los caracteres NA (Non Available; No disponible). Si no se especifica el
- 41 -
En la opcin Herramientas de la barra de mens es posible modificar algunas configuraciones bsicas de Rcommander referidas tanto a su aspecto, como a especificaciones que puede ser interesante adaptar a nuestros hbitos de trabajo.
- 42 -
visualizacin de las variables que forman el conjunto de datos a analizar. El investigador utiliza normalmente un orden preestablecido en la generacin de las variables, sin embargo, Rcommander por defecto ordena las variables alfabticamente. Aunque esta opcin no alterar en absoluto los resultados de ningn anlisis, es conveniente fijarla a los hbitos propios. La ventana de instrucciones o comandos de Rcommander no es una consola R aunque resulta til para la modificacin/generacin de pequeos cdigos de programacin. Para la generacin de cdigos ms o menos complicados siempre es recomendable utilizar el editor de comandos del propio R, o editores de programacin tales como el TinnR, R-Winedit, o Emacs.
- 43 -
y transformacion de
Una vez fijado el conjunto de datos activo, los mens desplegables de Rcommander permiten manipularlo y transformar sus variables. El primer tipo de acciones que se encuentran encerradas en el men Datos >Conjunto de datos activo estn relacionadas con la definicin y gestin del conjunto de datos activo; por ejemplo, la seleccin o eliminacin de casos. El segundo tipo de funciones se relaciona con la manipulacin de variables (creacin de nuevas variables, recodificacin de valores o conversin). En este captulo se describen brevemente las opciones que presenta Rcommander para ejecutar estas funciones.
3.1
Manipulacin de datos
Este apartado se relaciona directamente con las operaciones aplicadas sobre el conjunto de datos activo referidas a aspectos como la eliminacin de valores faltantes, la seleccin de casos o la exportacin del conjunto de datos. Las opciones disponibles que se muestran en la siguiente figura sern descritas con brevedad:
- 44 -
Los comandos que se ejecutan en R se aplican sobre un conjunto de datos activo (un objeto de R) lo cual no significa que no podamos disponer simultneamente de ms de un conjunto de datos. Por ejemplo, hasta ahora hemos generado un conjunto de datos Europa y hemos importado un fichero de datos de SPSS al que se ha denominado Edi.data, ambos aparecern en la ventana de Rcommander bajo el epgrafe Conjunto de Datos. Sin embargo, siempre es necesario seleccionar aqul sobre el que se va a trabajar. La opcin Datos> Conjunto de datos activo>Seleccionar conjunto de datos activo accede a una ventana de dilogo en la que se selecciona el objeto que se convertir en el conjunto activo.
El trabajo con el conjunto de datos puede dirigirse desde Rcommander o desde la consola de R. Si se trabaja con esta ltima conviene actualizar el conjunto de datos despus de un proceso de manipulacin de variables en el que se han recodificado o modificado sus valores para que incorpore las transformaciones efectuadas. La opcin Datos> Conjunto de datos activo>Actualizar conjunto de datos activo tiene como finalidad ejecutar este reajuste.
- 45 -
Los paquetes instalados en R adems de funciones y comandos incorporan bases de datos de libre acceso y disposicin. Es posible, adems, que algunos de los paquetes incorporen informacin sobre los datos que aportan; la opcin Datos>Conjunto de datos activo>Ayuda sobre el conjunto de datos activo accede a ella. Por ejemplo en uno de los paquetes que utiliza Rcommander (car) existe un conjunto de datos denominado Chile, si se ejecuta la opcin sobre informacin referida a este paquete se accede a una pgina como la que muestra la siguiente ilustracin.
Ofrece un listado con los nombres de las variables incluidas en el conjunto de datos activo. Con esta opcin es posible comprobar las variables que forman Edi.data. El comando en R que permite obtener este listado es names, y su ejecucin genera en la ventana de salidas el siguiente listado. El
- 46 -
> names(Edi.data) [1] "Edad" [7] "OD_2" [13] "IC_1" [19] "IC_7" "Sexo" "OD_3" "IC_2" "IC_8" "Peso" "OD_4" "IC_3" "IC_9" "Pesideal" "Altura" "OD_5" "IC_4" "IC_10" "OD_6" "IC_5" "BA" "OD_1" "OD_7" "IC_6" "B"
Al igual que es posible asignar nombres de variables dentro de un objeto (fichero de datos) es posible asignar nombres a cada una de las filas. Para que la asignacin sea posible es necesario disponer de una variable que incluya estos nombres de fila (rowname). Si bien en el conjunto de datos actual pudiera carecer de sentido asignar nombres a las filas, esta opcin resulta interesante en la definicin de determinadas salidas de resultados pues permitir dar un formato especfico al marco de datos. Por ejemplo, si se lleva a cabo un anlisis de tems, se podra crear como salida un objeto (marco de datos) en el que las columnas estaran formadas por varios ndices estadsticos, y se podra definir para cada fila el nombre del tem al que sta asociado.
Esta opcin del men Datos tiene como finalidad seleccionar un subconjunto de casos. La opcin Datos>Conjunto de datos
activo>Filtrar el conjunto de datos activo da acceso a una ventana que permitir llevar a cabo la seleccin. La filtracin generar un nuevo - 47 -
La ventana Expresin de seleccin es utilizada para definir la/s condicin/es que deben de cumplir los datos que se desea filtrar. En este ejemplo, se ha seleccionado una submuestra que cumple dos condiciones ser mujer y tener una altura mayor a 1,66 cm. La variable sexo es categrica y por tanto sus valores habrn de especificarse entre comillas. El nuevo conjunto de datos se llama Mujer.alta y se convierte de forma automtica en el conjunto de datos activo. En la ventana de mensajes es posible leer NOTA: El conjunto de datos mujer.alta tiene 139 filas y 24 columnas. La especificacin de las condiciones que han de cumplir las variables en una seleccin ha de regirse por los operadores lgicos que utiliza R. La siguiente tabla ofrece un resumen de la sintaxis de las expresiones lgicas disponibles en este entorno .
Operaciones de comparacin
- 48 -
Operadores lgicos & | ! xor Conjuncin (y) Disyuncin lgica (o) Negacin Disyuncin exclusiva
3.1 Tabla. Operadores lgicos
Esta opcin (Datos>Conjunto de datos activo> Eliminar los casos con valores omitidos) permite crear un archivo en el que se omiten todos los casos que presenten valores faltantes. Conviene recordar que en el entorno R los valores ausentes son codificados como NA (Non available). Es posible eliminar del conjunto de datos activos aquellos casos que presenten valores ausentes en determinadas variables; al mismo tiempo Rcommander permite crear un nuevo objeto sin NAs o escribir sobre el objeto antiguo el nuevo objeto sin NAs.
- 49 -
La opcin Datos>Conjunto
de
datos
activo>Guardar
conjunto de datos activos permite guardar el objeto de trabajo activo con extensin por defecto .Rda (datos R). Es importante recordar que independientemente de cmo se renombre el objeto de trabajo, esta opcin guarda el conjunto de datos activo que se muestra en la ventana plana Conjunto de Datos. Tambin es posible exportar los datos como archivo de texto (extensin .txt, o .dat). La opcin Datos>Conjunto de datos abre una
activo>Exportar el conjunto de datos activo seleccin de una u otra depender de los intereses del investigador.
- 50 -
Rcommander utiliza la funcin save para exportar objetos. La exportacin de datos generar el siguiente comando en la ventana de instrucciones.
save("Europa", file="C:/Europa.txt")
3.2
Manipulacin de variables
Las opciones disponibles en Rcommander para la transformacin o creacin de variables sobre el conjunto de datos activo se encuentran en el men dependiente de Datos>Modificar variables del conjunto de datos activo. La figura siguiente muestra las posibilidades incorporadas por Rcommander.
- 51 -
Permite asignar nuevos valores a las variables existentes en el conjunto de datos activo, y crear nuevas variables partiendo de valores previos. Por ejemplo, en el conjunto de datos activo Edi.data la variable Edad posee un rango de valores entre 10-27; es posible recodificar estos los valores y crear una nueva variable en la que los sujetos reciban un valor en funcin de la franja de edad en la que se encuentren. Se tratara de crear una variable con 3 niveles (por ejemplo) de modo que los sujetos que tengan menos de 14 aos reciban el valor 1, las personas con edades entre los 14 y 16 aos tengan un valor de 2, y al resto se les asigna el valor 3. La opcin recodificar variable abre una ventana de dilogo en el que selecciona la variable a modificar, se nombra la variable que se desee crear y se introducen las directrices de recodificacin, las reglas para la nueva asignacin.
- 52 -
En este ejemplo se ha recodificado una sola variable, pero es posible recodificar simultneamente un conjunto de variables (pinsese en un subconjunto de tems de un cuestionario o escala). Es importante especificar si se desea convertir la nueva variable en un factor (til para los anlisis de varianza), o se desea mantener su carcter numrico. Una vez seleccionadas las variables a modificar se podr asignar un nuevo nombre a esta variable, o en su defecto mantener el nombre anterior. Es especialmente til la opcin de poder incluir un prefijo que se aade al nombre de variable viejo para poder diferenciar las nuevas variables recodificadas. En la especificacin de las reglas de asignacin es suficiente indicar valor antiguo= valor nuevo en las situaciones en las que se recodifique una sola variable. Para una secuencia de valores consecutivos, se podran indicar todos los valores separados por medio de comas, o utilizar dos puntos ( ) para indicar a R que recodifique todos los valores comprendidos entre ellos. Cuando se han de recodificar varios valores es posible especificar slo algunos de ellos y recodificar el resto utilizando else para indicar que se asigne un valor al resto de condiciones no especificadas.
18 = 1
- 53 -
El comando que genera esta opcin en la ventana de instrucciones es recode. En l se indica el nombre de la nueva variable (Edi.data$Edad_Re), la variable a recodificar (Edad perteneciente al marco de datos Edi.data) y los valores antiguos junto a sus nuevas asignaciones.
Edi.data$Edad_Re <- recode(Edi.data$Edad, '10:13=1; 14:16=2; 17:27=3;as.factor.result=TRUE) Edi.data$sexo_ber <recode(Edi.data$sexo, '"mujer"="1"; "varn"="2"; ', as.factor.result=TRUE)
En el caso de que las variables a recodificar fueran debern utilizar las comillas si se desea
categricas es
necesario indicar los valores antiguos entre comillas; para los valores nuevos se mantener la variable como alfanumrica; en caso de que quiera reconvertirse una variable carcter en una variable numrica basta con especificar los nuevos valores sin el uso de comillas.
Esta opcin permite crear nuevas variables mediante transformaciones o combinaciones de variables ya existentes en el conjunto de datos activo o por medio de operaciones algebraicas. La nueva variable ser aadida como columna al conjunto de datos activo. En el ejemplo siguiente se ha creado una nueva variable a partir de la variable altura. La variable altura est expresada en metros y por medio de esta opcin se crear una variable cuya mtrica sean centmetros. Se trata de una simple transformacin algebraica consistente en multiplicar la variable antigua - 54 -
Las funciones aritmticas ms comunes utilizadas por Rcommander se resuman en la siguiente tabla.
Funcin Operacin Suma, Resta, Multiplicacin, Divisin Valor absoluto Inversas de las funciones trigonomtricas Exponencial y logaritmo natural Redondea Funciones trigonomtricas Raz cuadrada, Potencia Divisin entera Resto de la divisin
3.2 Tabla. Funciones algebraicas
- 55 -
Esta opcin genera una variable tipificada que se aade como nueva variable en el conjunto de datos activo. El nombre por defecto de esta nueva variable est formado por el nombre de la variable antigua sin tipificar antepuesta por ser Z.Altura. En la ventana de instrucciones se puede comprobar el comando utilizado por Rcommander para realizar la tipificacin; el comando scale genera una variable tipificada que es posteriormente aadida al marco de datos Edi.data. El proceso consiste en generar una variables de nombre .Z, aadirla al . Si la variable a tipificar es Altura, la variable tipificada
- 56 -
Un factor es una variable categrica utilizada normalmente con el fin de clasificar y reorganizar datos. Es una variable discreta con un nmero de niveles finito. Los factores en R son un modo (el ms eficiente) de almacenar variables categricas. Por defecto los niveles del factor se almacenan siguiendo el orden alfanumrico, por lo tanto en el caso de la variable sexo cuyos niveles pueden ser Varn y Mujer, mujer preceder a varn. El orden de los niveles del factor es importante porque determinar el orden en que aparecern en las tablas o grficos en los que vayan a utilizarse. Rcommander permite transformar cualquier variable en factor; es importante sin embargo tener en cuenta que las variables que vayan a convertirse en factores no han de presentar demasiadas categoras. Por ejemplo, no tendra sentido convertir en factor la variable altura. Sin embargo, s podramos convertir en factor una recodificacin de esta variable en varios niveles. La conversin de una variable en factor comienza con el siguiente cuadro de dilogo:
- 57 -
En este cuadro de dilogo se selecciona la variable que se desea convertir en factor, se le asigna un nuevo nombre (o se mantiene el antiguo), y se definen los nombres de cada uno de sus niveles o se numeran stos. La pantalla que permite asignar nombres a cada uno de los niveles del factor es la siguiente:
El comando que permite tratar una variable como factor aparece en la ventana de instrucciones:
Edi.data$IC_1 <- as.factor(Edi.data$IC_1)
La opcin de segmentacin permite generar categoras a partir de los valores de una variable existente. Segmentar una variable numrica abre una ventana de dilogo en la que se seleccionar la variable que queremos
- 58 -
El resultado es una variable con 4 valores equidistantes que muestra la siguiente tabla de frecuencias.
1 2 3 4 31
47 433 352
Si se hubiera definido un mtodo de segmentacin que mantenga segmentos con un nmero de casos similar, se hubiera obtenido una distribucin de frecuencias que se aproxima a la distribucin uniforme.
1 2 3 4
La opcin Rangos disponible en esta ventana generara una tabla de frecuencias para rangos de valores,
- 59 -
(1.83,2] 31
Edi.data$altura_seg
<-
bin.var(Edi.data$Altura,
bins=4,
method='intervals', labels=c('1','2','3','4'))
Por defecto los niveles de un factor se almacenan siguiendo un orden alfanumrico, por lo tanto Mujer precedera a Varn o 1 precedera a 2. El orden de los niveles del factor es importante porque determinar el orden en que aparecern en las tablas o grficos en los que vayan a utilizarse. Para imponer un orden predeterminado se utilizar la opcin Reordenar niveles de factor. A partir de ella se accede a una ventana en la cual se podr renombrar o mantener el nombre de la variable original. Es importante la opcin Factor de tipo ordenado porque permite considerar los factores como variables categricas ordenadas, o simplemente categricas.
- 60 -
Esta opcin es til para eliminar variables del conjunto de datos activo. Basta para ello seleccionar del siguiente cuadro de dilogo la/s variable/s a eliminar:
- 61 -
4 Anlisis de escalas
El estudio de una escala de actitudes, un inventario de personalidad o una prueba de aptitud numrica comprende un conjunto de anlisis cuya finalidad es garantizar la fiabilidad de los datos y la validez de las inferencias que se derivan de ellos. La fiabilidad es un concepto relacionado con la precisin o consistencia interna de las medidas, y la validez se centra en el estudio de evidencias que avalen el uso de las puntuaciones obtenidas (Martnez Arias, 1995; Elosua, 2005). La fiabilidad y la validez son conceptos clave que han de ser estudiados, analizados y verificados en aras a un correcto uso de los tests. Entre los acercamiento posibles al estudio de la fiabilidad de las medidas cabe diferenciar entre aquellos cuyo objetivo es analizar su estabilidad temporal y aquellos que focalizan su inters en la consistencia interna. Los primeros estiman la correlacin entre las medidas obtenidas por el mismo test en dos momentos temporales. Los segundos ofrecen un indicador del grado de covariacin entre los elementos del test. De entre los mtodos desarrollados para la evaluacin de la consistencia, el ms utilizado en la investigacin aplicada es el coeficiente alfa de Cronbach (Elosua y Zumbo, 2008). El estudio de la validez se torna un asunto ms complejo en tanto en cuanto es imposible reducir la validez de una inferencia a un indicador numrico. En la bsqueda de evidencias que avalen las inferencias construidas a partir de un test es posible diferenciar entre evidencias de tipo interno y evidencias externas (Elosua, 2003). Las primeras, incluiran un estudio de la estructura interna o dimensionalidad del test. Bsicamente, son abordadas desde el modelo del factor comn (son posibles acercamientos no lineales al tema, McDonald (1999)) a travs de anlisis factoriales que pueden ser exploratorios o confirmatorios, y a travs del anlisis de componentes principales. Su objetivo es reducir la informacin contenida en un conjunto (n) de variables observadas (tems, escalas parciales, escalas) a un nmero de factores o dimensiones (m < n)
- 62 -
4.1
La utilizacin de Rcommander en el estudio de las caractersticas de un inventario, tests o escala se presentar con el apoyo de los anlisis ejecutados sobre un conjunto de datos provenientes de una investigacin que tuvo como finalidad la adaptacin al espaol del Eating Disorder Inventory-3 (Garner, 2004; Elosua, Lpez-Juregui y Snchez, 2010); los datos pertenecen a dos de las escalas parciales de este inventario; las dos estn relacionadas con escalas para el estudio de trastornos de la conducta alimentaria: Insatisfaccin corporal (IC) y Obsesin por la delgadez (OD). La escala Insatisfaccin corporal est compuesta por 10 tems, y la escala Obsesin por la delgadez por 7. Se analizar con mayor detalle la escala Insatisfaccin Corporal. Todos los tems tienen 6 categoras de respuesta (Siempre, Casi siempre, A menudo, A veces, Pocas veces, Nunca) que se responden en la direccin sintomtica en una escala graduada con mnimo 0 y mximo 5 (0-1-2-3-4-5). Es decir a una mayor
- 63 -
1.- Edad: variable numrica 2.- Sexo: Factor con dos niveles Varn/Mujer 3.- Peso: Peso en kilogramos de cada participante 4.- Peso ideal. Peso considerado ideal por cada participante 5.- Altura. Altura en metros de cada participante 6:12.- OD_1 : OD_7.- tems perteneciente a la escala Obsesin por la delgadez 13:22.IC_1 : IC_10:tems pertenecientes a la escala Insatisfaccin Corporal
- 64 -
El anlisis psicomtrico de los datos seguir un orden secuencial similar a cualquier estudio de este tipo. Bsicamente se ajustar a las siguientes pautas.
1.- Lectura de datos 2.- Correccin de la prueba. 3.- Anlisis descriptivo de los tems 4.- Fiabilidad. ndice de discriminacin y coeficiente alfa. 5.- Validez. Estructura interna. Anlisis factorial exploratorio 6.- Validez. Comparacin de grupos 7.- Validez. Funcionamiento diferencial del tem 7.- Construccin de baremos
4.2
Lectura de datos
Los datos se encuentran en el fichero con formato ASCII Edi0.dat en el que los diferentes campos (variables) han sido delimitados por tabuladores. Tenemos que importar los datos, y para ello utilizamos la opcin Datos > Importar Datos > Desde archivo de texto o portapapeles. La ventana abierta permitir asignar un nombre al conjunto de datos en R que no tiene por qu coincidir con el nombre de fichero que est siendo importado. Es necesario especificar la informacin necesaria para la correcta lectura de los datos. En nuestro caso, tal y como puede verse en la imagen siguiente, hemos llamado al conjunto de datos Edi.data, indicamos a R que los nombres de las variables estn incluidas en el fichero, que utilizamos como separador entre variables el tabulador, y que las variables numricas utilizan la coma como signo decimal.
- 65 -
Cuando pulsemos Aceptar aparecer el comando de lectura tanto en la ventana de instrucciones como en la ventana de salida, y al mismo tiempo en la ventana de mensajes podemos comprobar el siguiente mensaje:
Edi.data <-read.table("C:/Edi0.dat", header=TRUE, sep="\t",
na.strings="NA", dec=",", strip.white=TRUE) NOTA: El conjunto de datos Edi.data tiene 976 filas y 24
columnas.
El primer comando de R asigna el fichero Edi0l.dat a un objeto R, un marco de datos (ver captulo siguiente), que se convertir a partir de ahora en el conjunto de datos activo. R ha ledo un fichero de datos compuesto por 976 filas (casos) y 24 columnas (variables). La apariencia del fichero podremos comprobarla por medio de las opciones de Editar conjunto de datos o Visualizar conjunto de datos.
- 66 -
El contenido y caractersticas de las variables que componen el marco de datos (data frame) se obtiene fcilmente a travs de la opcin
Edad Min. :10.00 1st Qu.:13.00 Median :14.00 Mean Max. NA's Min. :14.80 :27.00 : 8.00 Altura : 3rd Qu.:16.00
Peso Min. : 26.00 1st Qu.: 50.00 Median : 56.00 Mean Max. NA's OD_1 Min. :0.000 : 56.93 : 98.00 :204.00 3rd Qu.: 64.00
Pesideal Min. : 6.00 1st Qu.: 50.00 Median : 55.00 Mean Max. NA's : 56.79 : 85.00 :540.00 OD_3 Min. :0.000 1st Qu.:0.000 Median :1.000 Mean Max. NA's :1.363 :5.000 :9.000 3rd Qu.:2.000 3rd Qu.: 62.00
OD_2 Min. :0.000 1st Qu.:0.000 Median :1.000 Mean Max. NA's :1.490 :5.000 :8.000 3rd Qu.:3.000
1st Qu.:2.000 Median :3.000 Mean Max. NA's :2.756 :5.000 :3.000 3rd Qu.:4.000
:113.000
- 67 -
De este modo se logra una breve descripcin numrica de las variables que conforman el conjunto de datos en: valor mnimo (Min), valor mximo (Max), mediana (Median) y media aritmtica (Mean). Tambin nos ofrece los valores del primer y tercer cuartil; valores que dejan bajo ellos el 25% y el 75%
- 68 -
4.3
La puntuacin obtenida en un test o escala es una variable compuesta formada por combinacin lineal de variables simples o de variables compuestas. Pinsese en una escala parcial compuesta por varios tems, y en la puntuacin total obtenida por medio de las puntuaciones parciales. La variable compuesta (X) es un indicador emprico del constructo que se pretende medir. La combinacin lineal que define una variable compuesta se representa por medio de la siguiente ecuacin en la que n representa el nmero de elementos a combinar.
Xj
w1 X1 j w2 X2 j w3 X3 j ... wn Xn j
Dnde Xj es la puntuacin obtenida por el sujeto j , wi, i es el coeficiente de ponderacin del tem i, Xij, es la puntuacin obtenida por el sujeto j en el tem i.
Dado que el peso de cada uno de los elementos sobre la puntuacin total puede diferir, la ponderacin (w) es necesaria para reflejar el peso asignado a cada uno de los elementos. Por ejemplo, supongamos que la nota final en una asignatura est compuesta por los resultados obtenidos en dos exmenes diferentes, y que el peso del primer examen en la nota final es el doble que el que tendr el segundo. En este caso la variable compuesta formada por dos variables simples podra representarse del siguiente modo:
X total
2 X1 X 2
- 69 -
X
Donde
Xi
La puntuacin obtenida, X; es la representacin emprica del constructo que se desea medir. La exigencia demandada a la puntuacin total respecto a su representatividad del constructo que quiere medir se hace extensible a cada uno de sus componentes. La puntuacin final no ser representativa ni significativa del constructo medido si sus componentes no alcanzan esas caractersticas (relevancia y representatividad). Por ello, el anlisis de una escala exige el anlisis de sus componentes individuales a fin de explorar y comprobar su representatividad y consistencia. De hecho, si las variables simples no cumplen estos requisitos no podr logarse una variable compuesta que sea un indicador emprico relevante. Existen ms factores adems de la ponderacin, relacionados con la codificacin de los tems que afectan a la puntuacin emprica; entre ellos, la presencia de tems inversos y el azar. En general, y utilizando como criterio la existencia de criterios objetivos para la correccin de las respuestas dadas a un tem y, aunque existen ms formatos que los expuestos, los tems pueden clasificarse en dos grupos; aquellos que puede puntuarse en funcin de criterios objetivos (correcto, incorrecto, parcialmente correcto), y aquellos que carecen de criterios objetivos para su correccin (actitudes, intereses, personalidad). Los tems pertenecientes al primer grupo se conocen como tems de ejecucin mxima, y
- 70 -
Antes de la obtencin de la puntuacin total en una escala, es importante determinar cul es el sentido de la medida o la valencia del tem, es decir, cual es la direccin en que los tems reflejan el constructo a medir.
1.- Creo que mi estmago es demasiado grande 1.- Siempre 2.- Casi siempre 3.- Muchas veces 4.- Algunas veces 5.- Casi nunca 6.- Nunca 2.- Creo que mi estmago tiene el tamao adecuado 1.- Siempre 2.- Casi siempre 3.- Muchas veces 4.- Algunas veces 5.- Casi nunca 6.- Nunca
Ambos tems se relacionan con el mismo constructo, insatisfaccin corporal, pero en sentido contrario. La inferencia en cuanto a la insatisfaccin corporal de una persona que selecciona la opcin Siempre en el primer tem es
- 71 -
+ -
Constructo
- Constructo + + Item -
- Item +
4.3. Figura. tems inversos
Antes de proceder al anlisis sobre conjuntos de datos que contienen tems inversos, es necesario redireccionarlos situando todos los tems de la escala en el mismo sentido. Los manuales de los tests incorporan la informacin necesaria para acometer esta tarea. En general, se aplicar la siguiente regla de reconversin:
- 72 -
X'0 = 5 + 0 - 0=5
' X1 = 5 + 0 - 1=4
X'2 = 5 + 0 - 2=3
' X3 = 5 + 0 - 3=2
X'4 = 5 + 0 - 4=1
' X5 = 5 + 0 - 5=0
La utilizacin de tems inversos ofrece al investigador la posibilidad de controlar dos factores relacionados con el estilo de respuesta que pueden contaminar la puntuacin total. Por un lado la deseabilidad social o tendencia a responder en funcin de lo socialmente aceptado, y la aquiescencia o tendencia a manifestar un acuerdo sistemtico con el enunciado del tem independientemente de su contenido. Adems del control de la aquiescencia o deseabilidad social pueden existir razones de tipo terico que justifiquen la utilizacin de alguna regla de codificacin en la correccin de los tems. Un ejemplo de esta situacin es la correccin del Eating Disorder Inventory-3 (EDI-3). En el manual de este cuestionario su autor recomienda utilizar una regla de correccin segn la cual las dos categoras menos sintomticas se funden en una sola. En el caso de los tems de insatisfaccin corporal las reglas de asignacin a aplicar quedan recogidas en la siguiente tabla:
tem 1-2-6-7-9 3-4-5-8-10 Valores iniciales 5-4-3-2-1-0 5-4-3-2-1-0 Valores recodificados 4-3-2-1-0-0 0-0-1-2-3-4
Para ejecutar esta reasignacin de valores en Rcommander la opcin a seleccionar variables es Recodificar conjunto Variables de datos (Datos>Modificar del activo>Recodificar
variables).
- 73 -
La ventana de Rcommander permite seleccionar simultneamente todas aquellas variables cuya recodificacin se ajusta al mismo patrn (mantener pulsada la tecla Ctrl). En el proceso de recodificacin podemos utilizar las mismas variables del conjunto de datos activo y reasignarles los nuevos valores, o podemos crear nuevas variables que contengan los valores recodificados. Esta es la opcin por la que hemos optado y que recomendamos al lector. Tngase en cuenta que si se utilizan las mismas variables sera imposible invertir el proceso. Como resultado de la recodificacin obtenemos nuevas variables cuyo nombre es igual al de las variables ya existentes antecedidas por el prefijo Rec.
- 74 -
Una vez recodificadas las variables, podemos comprobar que R las ha aadido al conjunto de datos activo.
- 75 -
Edi.data$RecIC_1 <- recode(Edi.data$IC_1, '5=4; 4=3; 3=2; 2=1; 1=0; 0=0; ', 0=0; ', 0=0; ', 0=0; ', 0=0; ', 5=4; ', 5=4; ', 5=4; ', 5=4; ', as.factor.result=FALSE) as.factor.result=FALSE) as.factor.result=FALSE) as.factor.result=FALSE) as.factor.result=FALSE) as.factor.result=FALSE) as.factor.result=FALSE) as.factor.result=FALSE) as.factor.result=FALSE) '0=0; 1=0; 2=1; 3=2; Edi.data$RecIC_2 <- recode(Edi.data$IC_2, '5=4; 4=3; 3=2; 2=1; 1=0; Edi.data$RecIC_6 <- recode(Edi.data$IC_6, '5=4; 4=3; 3=2; 2=1; 1=0; Edi.data$RecIC_7 <- recode(Edi.data$IC_7, '5=4; 4=3; 3=2; 2=1; 1=0; Edi.data$RecIC_9 <- recode(Edi.data$IC_9, '5=4; 4=3; 3=2; 2=1; 1=0; Edi.data$RecIC_3 <- recode(Edi.data$IC_3, '0=0; 1=0; 2=1; 3=2; 4=3; Edi.data$RecIC_4 <- recode(Edi.data$IC_4, '0=0; 1=0; 2=1; 3=2; 4=3; Edi.data$RecIC_5 <- recode(Edi.data$IC_5, '0=0; 1=0; 2=1; 3=2; 4=3; Edi.data$RecIC_8 <- recode(Edi.data$IC_8, '0=0; 1=0; 2=1; 3=2; 4=3; Edi.data$RecIC_10 <- recode(Edi.data$IC_10, 4=3; 5=4; ', as.factor.result=FALSE)
4.4
Una vez recodificados los tems de la escala Insatisfaccin Corporal es posible obtener la puntuacin para esta escala. Para ello es suficiente sumar los valores en cada uno de los tems. Esta operacin generar una nueva variable (IC) que se aadir al conjunto de datos activo.
- 76 -
En el cmputo de la puntuacin total es importante recordar que en el caso de que se hubiera recodificado tems son stos los que hay que incluir y no los originales.
> Edi.data$IC <- with(Edi.data, RecIC_1+ RecIC_2+ RecIC_3+ RecIC_4+ RecIC_5+ + RecIC_6+ RecIC_7+ RecIC_8+ RecIC_9+ RecIC_10)
Una vez creada la nueva variable, para obtener informacin descriptiva sobre ella basta con seleccionar de la barra de mens la opcin Estadsticos>Resmenes>Resmenes variable IC del conjunto de variables. numricos y elegir la
- 77 -
La salida de resultados muestra que la media aritmtica de la variable IC es 12,20 (mean), su desviacin estndar (sd) es 10,22 y que el valor de la mediana es 11 (50%).
mean sd 0% 25% 50% 75% 100% 0 3 11 18 40 n NA 908 68
12.20705 10.22606
Para obtener una representacin grfica de la distribucin de estas variables Rcommander ofrece varias posibilidades accesibles en la opcin Graficas de la barra de mens. En este caso optamos por el histograma porque estamos interesados en una sola variable, la naturaleza de la variable es continua, y queremos informacin sobre la distribucin de esta variable en el total del grupo de participantes. La opcin Graficas>Histograma abre la siguiente ventana en la que se definir la variable de inters y se fijarn varios parmetros de representacin.
- 78 -
Este comando y el resto de comandos relacionados con la ejecucin de grficos abren una nueva ventana en R (dispositivo grfico); los grficos no aparecen en la ventana de salidas de Rcommander. Una vez generado el grfico es sencillo copiarlo o guardarlo bajo diferentes formatos grficos; para ello es suficiente utilizar el botn derecho del ratn (Ctrl+C, Ctrl+V).
frequency
0
0
50
100
150
200
250
300
10
20
30 Edi.data$IC
40
50
60
En el eje X del histograma se rotula el nombre de la variable (Edi.data$IC), y en el eje Y sus frecuencias absolutas (frequency). La apariencia de este grfico es muy bsica y algo tosca, pero es sencillo modificarlo y adaptarlo a los gustos y necesidades del investigador. - 79 -
4.5
Anlisis de tems
El anlisis de tems trata de estudiar las caractersticas sustantivas y formales de un conjunto de tems pertenecientes a una escala determinada. El anlisis ha de ser cualitativo y cuantitativo y siempre ha de estar conectado con los objetivos del test. El anlisis cualitativo de tems estudiar aspectos lingsticos y de contenido con el fin de analizar la adecuacin lingstica, cultural y sustantiva en relacin al objeto medido y a la poblacin diana, que garantice tanto su relevancia como su Hambleton y Zenisky, 2006). Slo tras una primera fase, ineludible, en la que un grupo de expertos evala cada uno de los tems comenzara el anlisis cuantitativo. Con el fin de que la puntuacin obtenida en el test sea significativa y representativa del dominio sobre el cual se basa la inferencia, el anlisis de tems estudiar el modo en el que stos alcanzan los objetivos marcados. pertinencia (Elosua, 2003; Elosua,
- 80 -
- 81 -
Cuando la naturaleza de la variable a analizar es dicotmica o el tem es de ejecucin mxima, la media aritmtica del tem informa sobre el nivel de dificultad del elemento; de hecho, en que la condiciones de dicotoma (correcto/incorrecto) la media aritmtica del tem se conoce como ndice de dificultad del tem (pi) interpretacin y no es ms proporcin de sujetos que desviacin responden correctamente al tem. Para formatos de respuesta no dicotmicos la de la media aritmtica requiere asociarla con la estndar del tem.
pi
1 N
N j 1
Xij
Donde pi es el ndice de dificultad del tem i , Xij, es la respuesta dada al tem i por el sujeto j N, es el nmero de sujetos.
A la pregunta comn acerca del valor ptimo del ndice de dificultad de un tem o del valor recomendable para la media aritmtica de un tem es menester responder que el anlisis de tems ha de enmarcarse siempre en el contexto de los objetivos perseguidos. Slo ellos podrn definir el nivel de discriminacin necesario y slo ellos permitirn delimitar si la informacin sobre los sujetos ha de ser ms precisa en algn punto o intervalo del continuo de medida. En funcin de los objetivos del test las medias aritmticas de las respuestas a los tems podrn ser diferentes (altas, medias o bajas). Por ejemplo, en los contextos en que la distribucin buscada sea asimtrica y se precise una discriminacin fina en los valores altos de la escala las medias aritmticas de los tems que permitan tal objetivo tendran que ser evidentemente bajas (tems difciles). Supongamos que se desee seleccionar un grupo de alumnos para la concesin de becas de alto nivel. Ese objetivo exige discriminar entre un grupo
- 82 -
Xc
4.11. Figura. Distribucin sesgada
En el caso de escalas graduadas, escalas Likert, o tems de ejecucin ptima, el concepto de ndice de dificultad carece de sentido, y habra de hablarse de la media aritmtica del tem. Sin embargo, resulta ms informativo que la media aritmtica el estudio de la distribucin de frecuencias asociada a las respuestas. De este modo obtendramos informacin sobre la atraccin que ejerce cada una de las opciones de respuesta en la muestra de inters. El nmero (o en su caso proporcin o porcentaje) de sujetos que elige cada una de las categoras del tem se conoce como ndice de atraccin del tem. En este ejemplo obtendremos la distribucin de frecuencias referida a cada uno de los tems de la escala que estamos analizando. La opcin para la - 83 -
Para salvar esta restriccin podemos hacer uso de dos opciones. Convertir las variables a analizar en factores a travs de la opcin Datos>Modificar variables del conjunto de datos activo> Convertir variable numrica en factor y optar posteriormente al anlisis de distribucin de frecuencias. Teclear directamente en la ventana de instrucciones el siguiente comando.
tabla.freq <-as.data.frame( apply(Edi.data[,25:34],2,table)) tabla.freq
Aconsejamos la segunda opcin. En ella se especifica el conjunto de datos activo (Edi.data), y las columnas que ocupan las variables que queremos analizar; los tems recodificados ocupan las posiciones 25-34 (la funcin apply ser introducida ms adelante). - 84 -
La interpretacin de la tabla es sencilla; Respecto al primer tem de la escala Insatisfaccin corporal se concluye que a 556 personas les ha sido asignada la puntuacin 0, mientras que 175 han logrado una puntuacin de 1; el valor 2 ha sido obtenido por 82 personas, el 3 por 76 participantes, y finalmente son 86 personas las que recibieron una puntuacin de 4 en este tem. Si en lugar de frecuencias absolutas el inters se centrara en la obtencin de proporciones, ser suficiente escribir en la ventana de comandos la siguiente funcin:
prop.table (tabla.freq,2)
RecIC_1 RecIC_2 RecIC_6 RecIC_7 RecIC_9 RecIC_3 RecIC_4 RecIC_5 RecIC_8 0 1 2 3 4 0.57 0.18 0.08 0.08 0.09 0.55 0.15 0.10 0.07 0.13 0.63 0.14 0.08 0.07 0.08 0.49 0.28 0.11 0.07 0.05 0.64 0.14 0.08 0.06 0.09 0.40 0.13 0.18 0.18 0.12 0.45 0.13 0.21 0.12 0.09 0.32 0.14 0.23 0.16 0.14
Los estadsticos descriptivos de estas distribuciones, la media aritmtica y la varianza, se obtienen a travs de la opcin Estadsticos > Resmenes > Resmenes numricos. En ella se seleccionarn las variables de inters dentro del conjunto de datos activo. En nuestro caso, las variables son los 10 tems recodificados. El comando que generar tal informacin es el siguiente.
- 85 -
quantiles=c(0,.25,.5,.75,1))
La funcin a aplicar es numSummary sobre las variables del conjunto de datos activo (ntese que en esta ocasin en lugar de utilizar el smbolo $ de pertenencia, se ha optado por crear un vector (c) para acceder a las variables pertenecientes al conjunto de datos activo). La ventana de salida de Rcommander ofrece una tabla con el siguiente aspecto:
mean RecIC_1 RecIC_2 RecIC_3 RecIC_4 RecIC_5 RecIC_6 RecIC_7 RecIC_8 RecIC_9
sd
0% 25% 50% 75% 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 2 0 1 2 0 1 1.5 2.0 3.0 2.0 3.0 1.0 1.0 3.0 1.0 3.0
100% 5 5 4 4 4 5 5 4 5 4
n 975 974 966 965 948 966 971 966 964 964
NA 1 2 10 11 28 10 5 10 12 12
1.0225641 1.542520 1.2063655 1.715512 1.4875776 1.448727 1.2704663 1.371921 1.6381857 1.421251 0.9057971 1.510731 0.9670443 1.304609 1.6521739 1.474175 0.8962656 1.525017
En ella aparecen la media aritmtica de cada tem (mean), la desviacin estndar (sd), el primer cuartil (25%), el segundo cuartil o mediana de la distribucin (50%), tercer cuartil (75%), nmero de sujetos (n) y el nmero de valores faltantes en cada uno de los tems (NA).
Otro modo de conseguir informacin representativa y clara sobre la distribucin de frecuencias nos lo ofrece el grfico de barras. Su obtencin es sencilla en Rcommander; basta seleccionar en la barra de mens la opcin
- 86 -
Es posible modificar el aspecto del diagrama fijando los lmites del eje de ordenadas (ylim=range(0,100), aadiendo un ttulo al mismo ylab=Frecuencias, especificando el color de las barras
(col=heat.colors(5)), o incorporando un ttulo, que en este caso identificamos con el contenido del tem (main= "Creo que mi estmago es demasiado grande"), y un indicativo del lugar que ocupa en la escala (sub=Item1).
barplot(table(Edi.data$Rec_item1),ylim=range(0,100), ylab="Frecuencias", border="blue", col=heat.colors(5),main= "Creo que mi estmago es demasiado grande", sub="Item1")
- 87 -
600
Frecuencias
Frecuencias
0 1 2 Item1 3 4
400
200
200
400
600
2 Item2
600
Frecuencias
Frecuencias
0 1 2 Item3 3 4
400
200
200
400
600
2 Item4
600
Frecuencias
Frecuencias
0 1 2 Item5 3 4
400
200
200
400
600
2 Item6
- 88 -
5 Fiabilidad.
ndice
de
discriminacin
coeficiente alfa
5.1
El estudio de las relaciones entre tems ocupa un lugar destacado en el anlisis de tems; su estudio es abordado por los ndices de relacin, que bsicamente analizan las correlaciones entre los tems o entre conjuntos de tems. Una correlacin es un ndice del grado de relacin entre dos variables, si alguna de las variables es un tem la informacin obtenida se refiere a ste ltimo. El procedimiento de estimacin de la correlacin depende de la - 89 -
p q
p X
pq
Donde p media aritmtica en el test de los sujetos que han respondido al tem correctamente, X, media aritmtica del test, q, media aritmtica en el test de los sujetos que han respondido al tem incorrectamente, X, desviacin estndar del test, p, proporcin de sujetos que han respondido correctamente q, proporcin de sujetos que han respondido incorrectamente.
Correlacin biserial (poliserial) Cuando se asume que a la variable dicotmica (o categorizada) subyace una variable latente que se distribuye segn la ley normal, la correlacin a estimar sera la correlacin biserial. En este contexto, una de las variables es continua y la otra es una variable supuestamente dicotomizada o politomizada:
p b X
p y
Donde p media aritmtica en el test de los sujetos que han respondido al tem correctamente, X, media aritmtica del test, X, desviacin estndar del test, p, proporcin de sujetos que han respondido correctamente y, la ordenada en el punto z que se corresponde al rea bajo la curva normal asociada a p.
- 90 -
bp
pq y
Para los mismos datos, la estimacin ofrecida por la correlacin biserial es mayor que la obtenida por la correlacin biserial puntual. La diferencia entre ambos ndices es mnima cuando el ndice de dificultad del tem es medio, y su diferencia crece en la medida en que el ndice de dificultad aumenta o disminuye, hasta el punto de que la correlacin biserial puede incluso ser cuatro veces mayor que la correlacin biserial-puntual (Magnuson, 1967). Correlacin Phi Se utiliza cuando ambas variables son dicotmicas.
pij
ij
pi p j
pi qi p j q j
Donde ,
pi proporcin de sujetos que responden correctamente al tem i pj, proporcin de sujetos que responden correctamente al tem j qi proporcin de sujetos que responden incorrectamente al tem i qj proporcin de sujetos que responden incorrectamente al tem j.
pueden estimar correlaciones tetracricas (policricas). En su aplicacin se asume que bajo las variables dicotomizadas (categorizadas) subyacen dos variables que se distribuyen segn la ley normal. No existe una frmula simple para la obtencin de la correlacin tetracrica; R posee entre otros, el paquete polycor a travs del cual se pueden estimar correlaciones policricas y poliseriales. - 91 -
Cov X , Y
XY X Y
Donde
es la correlacin entre X e Y, y Y, son las desviaciones estndar de las variables X e Y Cov (X,Y), es la covarianza entre las variables X e Y.
XY X
La expresin anterior es una formulacin general de la correlacin lineal entre dos variables observadas de las que la correlacin biserial-puntual y phi no son ms que casos especiales. Si las correlaciones se estiman entre todos los tems que componen una escala se obtiene la matriz de correlaciones. Esta matriz aporta informacin relevante sobre la estructura interna del test. La matriz de correlaciones es una matriz simtrica (
12 = 21.)
Los valores esperables en la matriz de correlaciones entre tems son por lo general, positivos. La aparicin de valores negativos se debe habitualmente a la presencia de tems inversos no recodificados. En el caso de que se analicen tems pertenecientes a distintas escalas parciales, las correlaciones entre tems pertenecientes a la misma escala parcial sern mayores que las estimadas entre tems pertenecientes a distintas escalas. La inspeccin de la matriz de correlaciones ofrece informacin relevante sobre la estructura interna del test. Sin embargo, a medida que aumenta al nmero de tems es difcil extraer informacin significativa y clara; habra que aplicar sobre ella procedimientos y modelos ms adecuados entre los que destaca el modelo de anlisis factorial.
- 92 -
5.2
La relacin entre cada uno de los tems que componen una escala y la escala misma se analiza habitualmente por medio del ndice de discriminacin (riX); la informacin aportada por este ndice est ligada a la consistencia interna del test. El ndice se obtiene por medio del coeficiente de correlacin entre el tem objeto de estudio y la puntuacin total. Aunque tericamente y al tratarse de una correlacin los valores del ndice de discriminacin varan en un rango de 1,1, en el contexto del anlisis de tems no tendran sentido los ndices de discriminacin negativos. A pesar de que la fijacin de puntos de corte referidos a la calidad de un ndice es siempre interpretable en funcin del contexto, entre la comunidad psicomtrica se acepta la siguiente clasificacin referida al ndice de discriminacin (Ebel, 1965; Elosua, 2005).
de
La relacin tem-test estimada por medio de la correlacin tempuntuacin total, presenta una caracterstica que es preceptivo corregir cuando el nmero de tems que componen la escala es reducido. La correlacin tem-test obtenida de este modo est inflada espuriamente por la inclusin del tem cuyo ndice de discriminacin se desea estimar en la puntuacin total de la escala. Este aumento espurio puede ajustarse fcilmente eliminando de la puntuacin total la influencia del tem y estimando el ndice de discriminacin corregido, entre el tem y un compuesto formado por el resto de tems de la escala. Este
- 93 -
i( X i)
2 i
iX X 2 X
iX
Donde
iX,
es la correlacin corregida entre el tem y la escala, es la correlacin sin corregir entre el tem y la escala, X, es la desviacin estndar de la escala i, es la desviacin estndar del tem.
i(X-i)
5.3
Fiabilidad
En todo proceso de medida por el cual se asignan valores numricos a ciertas propiedades de los objetos interfieren los errores de medida. Los errores de medida afectan a todas las medidas, sean fsicas, mdicas, qumicas o las medidas utilizadas en el marco de las ciencias sociales. Su influencia sobre el resultado final es diferente en funcin del grado de desarrollo mtrico de la ciencia en cuestin. No seran comparables los errores de medida que afectan a la medicin de una magnitud fsica con los errores de medida que acompaa toda medicin psicolgica. Una prueba del grado de fiabilidad de la primera respecto a la segunda podra obtenerse analizando sucesivas mediciones de la misma distancia y evaluando las discrepancias entre ellas. A menor discrepancia mayor fiabilidad. En el caso de la medicina por ejemplo, pinsese en las continuas mediciones de tensin arterial; en este caso -y en ausencia de variables
- 94 -
La teora clsica de tests se construye en torno al concepto de fiabilidad. Los orgenes del modelo se sitan en los trabajos de Spearman (1904, 1907, 1913), que Gulliksen sistematiza (1950) y se reformulan en la obra de Lord y Novick (1968). El objetivo del modelo es estimar la influencia de los errores de medida con el fin de obtener informacin sobre el grado de certidumbre (fiabilidad) de los datos obtenidos por el test.
MODELO
X V E
1. V 2. 3.
V ,E
e j ,ek
SUPUESTOS
E X
0
0
TEST PARALELOS:
ej
ek]
y las puntuaciones
Sin embargo con la definicin del modelo es imposible estimar el efecto del error de medida sobre las puntuaciones observadas. Por ello a la formulacin bsica del modelo es necesario aadir ciertos supuestos que permitan llevar a cabo la estimacin deseada. La puntuacin obtenida en un test (X) es una variable compuesta por dos componentes, la puntuacin verdadera (V) y la puntuacin de error (E). El error aleatorio puede incrementar o reducir la puntuacin verdadera, y para estimarla es necesario considerar los siguientes supuestos: Supuesto 1 La puntuacin verdadera de un sujeto es la esperanza matemtica de su puntuacin emprica. Es decir, si se obtuvieran repetidas veces las puntuaciones de un sujeto en un mismo test, la puntuacin verdadera se obtendra como la media aritmtica de todas las puntuaciones obtenidas en las distintas aplicaciones del test. Supuesto 2 No existe correlacin entre la puntuacin verdadera y la puntuacin de error. Los errores por definicin son errores aleatorios y por tanto no determinan la puntuacin verdadera. Supuesto 3 La correlacin entre los errores es 0. Definicin de formas paralelas Dos test son paralelos si las puntuaciones verdaderas son equivalentes y si ambas formas tiene varianzas de error equivalentes. De esos supuestos se derivan los siguientes teoremas:
- 96 -
e X V
2.- La esperanza matemtica del error de medida es 0. Es decir los errores no son sesgados.
E e
3.- La media aritmtica de la puntuacin emprica es igual a la media aritmtica de la puntuacin verdadera.
X V
Cov V , e
5.- La covarianza entre la puntuacin emprica y la puntuacin verdadera es la varianza de la puntuacin verdadera.
Cov X ,V
2 V
6.- La covarianza entre las puntuaciones empricas de dos formas paralelas es igual a la covarianza entre las puntuaciones verdaderas de dos formas paralelas.
2 V
Cov X j , X k
Cov Vj ,Vk
7.- La varianza de la puntuacin emprica es igual a la suma de la varianza de la puntuacin verdadera y de la varianza de error.
2 X 2 V 2 E
8.- La correlacin entre la puntuacin emprica y el error de medida es igual a la razn entre el error estndar de medida y la desviacin estndar de la puntuacin emprica.
Xe e X
9.- En K formas paralelas las medias aritmticas, las varianzas y las correlaciones entre ellas son equivalentes.
- 97 -
xx')
se
define como la correlacin producto momento de Pearson entre las puntuaciones empricas (X y X') obtenidas en dos formas paralelas. Si la influencia de los errores de medida en las formas paralelas fuese inexistente, las puntuaciones empricas obtenidas seran equivalentes y por tanto la correlacin entre ellas sera 1. A medida que el coeficiente de correlacin se aleja de 1 se incrementa el efecto del error de medida y por tanto se pierde estabilidad en la misma. El desarrollo de esa definicin (Elosua, 2005) deriva en el significado formal del coeficiente de fiabilidad:
XX '
2 V 2 X
El coeficiente de fiabilidad es la razn entre dos varianzas, la varianza de la puntuacin verdadera y la varianza de la puntuacin emprica. Tratndose de varianzas el valor del coeficiente de fiabilidad siempre ser positivo.
XX '
XX '
En el caso hipottico de ausencia de error de medida las varianzas emprica y verdadera coincidiran alcanzando el coeficiente de fiabilidad su mximo valor (
XX=1).
- 98 -
La correlacin entre la puntuacin verdadera y la puntuacin emprica en dos formas paralelas da lugar al ndice de fiabilidad del test ( que la raz cuadrada del coeficiente de fiabilidad.
XV),
que no es ms
XV
XX '
V X
La desviacin tpica de los errores de medida se conoce como error tpico de medida.
XX '
El error tpico de medida podra interpretarse como la desviacin estndar de las puntuaciones empricas obtenidas por un sujeto en aplicaciones reiteradas de un test, es decir, su variacin. A medida que aumenta la distribucin de las puntuaciones empricas disminuir el coeficiente de fiabilidad del test. El error tpico de medida es conocido como fiabilidad absoluta y el coeficiente de fiabilidad como coeficiente de fiabilidad relativo.
La estimacin del coeficiente de fiabilidad tal y como ha sido formulado, razn entre varianzas, no es posible dado que la nica informacin de que se dispone tras la aplicacin de un test es la puntuacin emprica. Por ello es necesaria la aplicacin de diseos que permitan su estimacin. Entre los - 99 -
- 100 -
a partir del
coeficiente de fiabilidad del test. Bsicamente existen dos procedimientos para su estimacin; el primero se apoya en el concepto de error tpico de medida y el segundo aplica el modelo de regresin lineal simple definiendo la variable dependiente como la puntuacin verdadera y la variable predictora como la puntuacin observada.
Suponiendo que la administracin repetitiva de un cuestionario a un sujeto genera una distribucin de valores empricos Xi en torno a un nico valor verdadero (Vi), es posible considerar cada una de las puntuaciones empricas como una variable aleatoria extrada de esa distribucin que se supone normal. En estas condiciones cada Xi es un estimador insesgado de la media aritmtica de la distribucin (Vi). Por lo tanto, una vez prefijado un nivel de confianza es posible estimar un intervalo de probabilidad para Vi a partir de la desviacin de las puntuaciones empricas, es decir, a partir del error tpico de medida.
2 e
f e V ~ N 0,
- 101 -
f X V ~ N V,
2 e
1.- Determinar el nivel de confianza (1- ). Es habitual fijarlo en 95% o 99% ( =0,05 y =0,01). Dada la simetra de la distribucin normal los valores Zk absolutos correspondientes a /2 y (1- /2) son los mismos. Las reas estn limitadas por los valores crticos zc= 1,96 y zc= 2,58.
- 102 -
EMax
ZK
3.- Lmites del intervalo para V. Los lmites del intervalo se obtendrn aadiendo y sustrayendo el error mximo a la puntuacin emprica correspondiente.
LSup
Linf
Xi EMax
X i EMax
Donde Lsup y Linf son los lmites superior e inferior del intervalo para la puntuacin verdadera.
En la estimacin de la puntuacin verdadera se ha utilizado el error tpico de medida; es un concepto aplicable al grupo y que asume igualdad de varianzas para todas las puntuaciones empricas; es decir, homocedasticidad. La igualdad de la distribucin de los errores de medida en todo el continuo de puntuaciones empricas es tal vez una de las mayores debilidades de la teora clsica de test; en las situaciones prcticas es difcil asumir ese supuesto. Ante esta violacin del supuesto de homocedasticidad es posible buscar alternativas en modelos derivados de la teora de respuesta al tem, o en su defecto sera posible establecer intervalos de puntuaciones empricas y estimar para cada una de ellas sus correspondientes errores tpicos de medida.
Las variables incluidas en un modelo de regresin simple X (predictor) e Y (criterio) seran asimilables a la puntuacin emprica (X) y a la puntuacin - 103 -
Y'
XY
Xi
Donde Xi puntuacin observada, XY, correlacin entre las variables X e Y, X, Desviacin estndar de la variable X, Y, desviacin estndar de la variable Y,
V'=
Donde
XX'
Xi
- 104 -
se
V .X
XX '
XX '
XX '
El error estndar de estimacin se ajusta a una distribucin normal, que es adems homocedstica, es decir equivalente para todo el continuo de valores de la variable predictora (V). Seguiramos el procedimiento habitual de estimacin: 1.- Determinar el nivel de confianza (1- ). Es habitual fijarlo en 95% o 99% ( =0,05 y =0,01). Dada la simetra de la distribucin normal los valores Zk absolutos correspondientes a /2 y (1- /2) son los mismos. Las reas estn limitadas por los valores crticos zc= 1,96 y zc= 2,58. 2.- Estimacin del error mximo. Para ello es suficiente multiplicar el valor crtico (Z /2) por el error tpico de medida.
EMax
ZK
3.- Lmites del intervalo para V. Los lmites del intervalo se obtendrn aadiendo y sustrayendo el error mximo a la puntuacin estimada correspondiente.
- 105 -
Entre todos los procedimientos disponibles para la estimacin del coeficiente de fiabilidad basados en una nica aplicacin del test se ha impuesto el coeficiente alfa de Cronbach (1951). Es un indicador del grado de covariacin de los tems de una escala, y se interpreta como coeficiente de consistencia interna.
n n n
n n 1
2 i 2 X
Cov i, j
2 X
i 1
n n 1
j 1 i 1 i j
Donde n es el nmero de tems del test, 2 i, la varianza del tem i, 2 X, la varianza del test Cov (i,j), la covarianza entre i y j .
Un modo de conceptualizar el significado del coeficiente alfa podra ser la consideracin de que los n tems de los que consta un test son paralelos y cada uno de ellos presenta un coeficiente de fiabilidad
ii'.
En esas
circunstancias y considerando que el test ha incrementado K veces su longitud, se podra obtener el coeficiente de fiabilidad del nuevo test aplicando la formula proftica de Spearman-Brown (n=K) que relaciona la longitud de un test y su fiabilidad.
XX '
n ii ' 1 (n 1)
ii '
Donde n es el nmero de tems del test ii', es el coeficiente de fiabilidad de cada tem.
- 106 -
Alfa y los procedimientos de dos mitades La literatura psicomtrica tradicional muestra multitud de modos de estimar el coeficiente de fiabilidad de un test basndose en una sola aplicacin. Todos estos mtodos asimilables a la categora genrica de mtodos de las mitades pueden considerarse casos particulares del coeficiente alfa. Alfa analiza la consistencia de un test compuesto por n tems. Si el test estuviera compuesto por dos elementos, la frmula de alfa sera equivalente a las formulas de Guttman (1945), Flanagan (1937) o Rulon (1939). las siguientes frmulas para la estimacin de la fiabilidad. Rulon
XX '
Estos
2 d 2 X
2 Donde es la diferencia entre las puntuaciones empricas d obtenidas en las dos mitades 2 X, es la varianza del test completo.
La hiptesis bsica de este procedimiento es la equiparacin entre las diferencias entre las dos mitades equivalentes extradas de un mismo test y el error de medida. En estas condiciones se asume la equivalencia entre la varianza de las diferencias y la varianza de error. Guttman-Flanagan
XX '
21
2 pa 2 X
2 im
Donde
es la varianza de las puntuaciones pares, im, es la varianza de las puntuaciones impares 2 X, es la varianza del test completo
2 pa
- 107 -
KR20
n n 1
pi qi
2 X
i 1
tem i al tem i
Donde n es el nmero de tems del test, pi, la proporcin de sujetos que responden correctamente al qi, es la proporcin de sujetos que responden incorrectamente
X 2
Esta frmula es un caso especial de alfa, dado que la varianza de un tem dicotmico puede expresarse como el producto de pi y qi. Kuder-Richardson propusieron otro ndice de consistencia interna aplicable cuando las medias aritmticas de los tems fueren equivalentes, KR21,
KR21
n n 1
X2 n
2 X
Considerando slo la matriz de correlaciones de Pearson y el modelo del anlisis factorial, McDonald (1985, pg. 217) describi como computar un
- 108 -
n
2
n 1 n
Donde n es el nmero de tems
u2
es la media aritmtica de los cuadrados de los n pesos factoriales es la media aritmtica de las unicidades de las n variables
Armor (1974) basndose en el modelo de Componentes Principales, introdujo una estimacin de la fiabilidad, el coeficiente theta, que fue desarrollado para escalas multidimensionales. El coeficiente theta para una solucin factorial simple se estimara de acuerdo con la siguiente expresin:
n n 1
1 Eigen1
Donde, n es el nmero de tems de la escala Eigen1 es el valor propio mayor correspondiente a la matriz de correlaciones
Dentro del modelo clsico de test la puntuacin observada de un sujeto en un tem (Xi) se descompone en puntuacin verdadera (Vi) y componente aleatorio o error (Ei):
X i Vi Ei
- 109 -
Xi
Donde
fi ui
es al peso factorial fi es el factor comn, que podra asociarse con la puntuacin verdadera ui es la unicidad de la variable que podra asociarse al componente de error.
Dentro del modelo factorial la fiabilidad de la puntuacin observada podra estimarse por medio de la razn entre la suma de los elementos de la matriz de varianzas/covarianzas entre puntuaciones verdaderas y la matriz de varianzas/covarianzas entre puntuaciones observadas. Novick y Lewis (1967) demostraron que el coeficiente alfa ofrece una estimacin insesgada de la fiabilidad cuando los pesos del factor comn sobre las variables son iguales, es decir, cuando las medidas son tau-equivalentes. La formula de la fiabilidad para una puntuacin compuesta, conocida como coeficiente omega (McDonald, 1999) se formalizara como:
2 i n i i 1 i 1 i 1 2 n
var(e)ii
Si en la estimacin de los valores propios, en lugar de la matrices de correlaciones producto momento de Pearson, se utilizara una matriz de correlaciones policricas (o tetracricas) sera posible obtener coeficientes de fiabilidad para escalas de respuesta ordinales que ofreceran estimaciones nosesgadas del valor del coeficiente de fiabilidad (Elosua y Zumbo, 2008).
- 110 -
Alfa es un indicador de consistencia interna que ha sido sobre-utilizado en la literatura psicomtrica aplicada. El debate sobre su uso est abierto en la investigacin psicomtrica actual (Elosua y Zumbo, 2008). Una correcta interpretacin del significado de alfa habra de tener en cuenta los siguientes puntos: La estimacin de alfa no aporta informacin alguna sobre la estabilidad de las medidas obtenidas por un test. Alfa es un indicador de consistencia interna, no de estabilidad temporal. A partir de un test compuesto por n tems es posible definir test-mitades utilizando multitud de criterios diferentes y a cada uno de ellos se le asociara un coeficiente de fiabilidad. Alfa podra interpretarse como la esperanza de los coeficientes estimables (Cronbach, 1951). Alfa no es un indicador de unidimensionalidad. Aunque el valor de alfa viene determinado por el grado de covariacin entre tems su interpretacin no es equiparable al concepto de unidimensionalidad. La presencia de varios factores correlacionados puede ser causa de covariacin (Hattie, 1984).
5.4
La obtencin de la matriz de correlaciones entre tems por medio de Rcommander se efecta con la opcin: Estadsticos > Resmenes > Matriz de correlaciones de la barra de mens. La ventana de dilogo que se abre permite seleccionar aquellas variables, tems, cuyas correlaciones definirn la matriz de correlacin. En este caso se seleccionan los tems recodificados de la escala insatisfaccin corporal.
- 111 -
- 112 -
Puede apreciarse en la tabla que los elementos de la diagonal principal de la matriz, son 1 y que la matriz es simtrica. Todos los valores estimados son positivos. La correlacin ms alta corresponde al par formado por el tem 3 y el tem 1 (r13=0,73), y el coeficiente de correlacin ms bajo se ha obtenido en el par compuesto por los tems 7 y 8 (r78=0,11). Una correcta interpretacin de esos valores va siempre ms all de la simple interpretacin cuantitativa y ha de considerar siempre el contenido de los tems.
1.- Creo que mi estmago es demasiado grande 3.- Creo que mi estmago tiene el tamao adecuado 7.- Me siento hinchado despus de una comida normal 8.- Creo que el tamao de mis muslos es adecuado
Para obtener los indicadores de consistencia interna, ndice de discriminacin y alfa, la opcin viene dada por .
- 113 -
Rcommander incorpora una funcin especfica para la estimacin de la fiabilidad segn la formulacin de Cronbach, reliability.
primera puede leerse el valor del coeficiente alfa de Cronbach (Alfa reliability); en nuestro caso su valor es 0,9109. Tras este valor, aparece la estimacin del coeficiente estandarizado que se obtendra utilizando las variables estandarizadas (Standardized alfa). Entre estos dos coeficientes es habitual utilizar el primero. La tabla de valores que genera Rcommander incluye informacin relevante para el anlisis de tems porque permite analizar el peso que tiene cada uno de los tems sobre el coeficiente de consistencia interna e incluye los ndices de discriminacin de cada uno de los mismos. En la primera columna de la tabla aparecen los nombres de los tems analizados. La segunda columna titulada Alfa, ofrece los valores de los coeficientes alfa estimados para la escala de la que se ha eliminado el tem de la fila. Por ejemplo, el primer valor - 114 -
Reliability deleting each item in turn: Alfa Std.Alfa r(item, total) RecIC_1 RecIC_2 RecIC_3 RecIC_4 RecIC_5 RecIC_6 RecIC_7 RecIC_8 RecIC_9 0.9007 0.8970 0.9006 0.8948 0.9043 0.9001 0.9258 0.8968 0.8982 0.8967 0.8931 0.8967 0.8908 0.9005 0.8959 0.9261 0.8932 0.8938 0.8929 0.6969 0.7528 0.6975 0.7930 0.6386 0.7079 0.1881 0.7566 0.7413 0.7600
RecIC_10 0.8966
- 115 -
Para estimar el coeficiente theta es necesario teclear en la ventana de edicin de Rcommander la siguiente funcin. Una vez escrita la funcin es suficiente indicar el nmero de tems de la escala (n) y la matriz de correlaciones de los tems (kor), para que R nos devuelva el valor del coeficiente theta.
theta <- function (n,kor) { lambda <- eigen(kor, only.values=TRUE)$values[1] theta.indice <- (n/(n-1))*(1-(1/lambda)) print(theta.indice)}
La funcin exige que la matriz de correlaciones entre tems haya sido asignada a un objeto de R. Dicha matriz se obtiene con la funcin cor. Por ejemplo:
kor <- cor(Edi.data[,c("RecIC_1","RecIC_2","RecIC_3","RecIC_4", "RecIC_5","RecIC_6","RecIC_7","RecIC_8","RecIC_9", "RecIC_10")], use="complete.obs")
Tras la regla de asignacin es suficiente ejecutar la funcin definida por nosotros como theta. Para ello basta teclear theta (10, kor). En nuestro caso el valor estimado para el coeficiente theta es 0,9165.
Rcommander a travs de la funcin reliability ofrece una estimacin del coeficiente alfa; para obtener una estimacin del error estndar de medida es necesario escribir en la ventana de instrucciones su
e X
frmula
XX '
- 116 -
La funcin sd estima la desviacin tpica de la variable insatisfaccin corporal que se ha obtenido previamente por medio de la adicin de los tems que la definen. Una vez escritas esas simples instrucciones en la ventana de comandos de Rcommander es suficiente marcar esas tres lneas con el ratn y presionar la opcin ejecutar para que en la ventana de resultados aparezca el valor del error estndar de medida para la escala insatisfaccin corporal, 3,05244. Conocido el valor del error estndar de medida es posible estimar con un grado de confiabilidad determinado los intervalos de confianza para la puntuacin verdadera a partir de cualquier puntuacin observada. Suponiendo que el nivel de confianza es del 95% (z = 1,96), podemos estimar los limites inferior y superior de los intervalos generando nuevas variables a travs de la opcin Datos de la barra de mens de Rcommander. Datos > Modificar variables del conjunto de datos activo > Calcular nueva variable es la opcin requerida:
- 117 -
Este procedimiento generar dos nuevas columnas en el conjunto de datos activo, y sus valores representan los lmites superior e inferior del intervalo de probabilidad en que con una confianza del 95% se situar la puntuacin verdadera de cada uno de los sujetos participantes en la investigacin. Por ejemplo sera posible afirmar con una confianza del 95% que la puntuacin verdadera de aquellas personas que obtienen una puntuacin de 35 en la escala insatisfaccin corporal estara situada en el intervalo 29 - 41 (40.978).
- 118 -
6 Validez
La construccin y utilizacin de tests y cuestionarios se asientan sobre una base que siendo tan primaria como fundamental, a veces en la prctica diaria se obvia; la validez. El uso de un test, independientemente de su mbito de aplicacin u objetivo concreto, ha de estar respaldado por un cmulo de experiencias que avalen la certeza de que las puntuaciones con l obtenidas permiten la interpretacin inicialmente propuesta y por ende, no representan cualquier otro atributo o artefacto originado por el propio instrumento o proceso de medida. La validez es el primer requisito que ha de cumplir todo instrumento de medida. Su fiabilidad, an siendo esencial, nunca supondr una garanta de uso suficiente. El concepto psicomtrico de validez es el ms importante y fundamental (Angoff, 1988). Sin embargo, es un concepto huidizo y complejo, que no se apoya como la fiabilidad en un modelo matemtico que la delimite, por lo que resulta complicado de aprehender y tratar. La dificultad de representacin que entraa es pareja al problema de la validacin de las teoras cientficas con la que podra equipararse (Cronbach y Meehl, 1955). Bajo su carcter evolutivo que a lo largo del desarrollo de la psicometra la ha envuelto de mil formas, acepciones o enfoques (convergente, discriminante, factorial, sustantiva, estructural, externa, de poblacin, ecolgica, temporal, de tarea; Messick, 1980), la validez se mantiene preeminente respecto a los dems conceptos psicomtricos. Su evolucin permite diferenciar tres etapas:
- 119 -
Los primeros trabajos sobre la validez, basados en una perspectiva pragmtica, casi aterica, la definen como una simple correlacin con alguna otra medida de la que el test es instrumento de medicin, o aseveran que un test es vlido para aquello con lo que correlaciona (Guilford, 1946). Esta visin, plasmada en las recomendaciones de 1954 (APA; AERA; MCME, 1954), diferencia entre 4 tipos de validez: las consabidas, validez de contenido, validez predictiva, validez concurrente, y finalmente validez de constructo. Si bien es cierto que en la edicin de los estndares de 1966 y 1974 (APA; AERA;MCME, 1966, 1974), se combinan la validez predictiva y
- 120 -
"La validez se refiere al grado en que la evidencia y la teora soportan las interpretaciones de las puntuaciones del test implicadas por los usos propuestos del test..... El proceso de validacin implica acumular evidencia para proveer de una base cientfica las interpretaciones propuestas de las puntuaciones. Lo que se evala, son las interpretaciones de las puntuaciones del test requeridas para los usos propuestos, no el test en s mismo." (APA; AERA; NCME; 1999, pg.9).
- 121 -
6.1
Sesgo
La importancia concedida a las implicaciones derivadas de una contextualizacin prctica o uso de un determinado instrumento de medida, ha permitido la irrupcin y afianzamiento de un concepto tan complejo como el de la validez: el sesgo. Es un trmino con connotaciones polticas, sociales, estadsticas y psicomtricas, que comienza a cobrar relevancia en la dcada de los 20 debido a la controversia surgida en Estados Unidos acerca de la parcialidad de los tests respecto a determinados grupos (Cole y Moss, 1989; Cronbach, 1975; Jensen, 1980). Desde un punto de vista estrictamente psicomtrico el sesgo queda definido como error sistemtico (Camilli y Shepard, 1994; Osterlind, 1983) originado por deficiencias en el test o en el modo en que este es usado, que produce una distorsin en el significado de las puntuaciones y contamina su interpretacin. Es necesario minimizar las causas que puedan estar en el origen del sesgo, garantizando las propiedades tcnicas del test, y explicitando las condiciones que maximicen su validez. Validez y sesgo se convierten en las dos caras de una misma moneda. El sesgo siempre supondr falta de validez, y la falta de validez puede ser el origen del sesgo. Para maximizar una y consecuentemente minimizar otra, el test habr de incorporar una descripcin detallada de cada uno de los mbitos de uso que ofrecer el marco conceptual bsico para la recopilacin de evidencias e - 122 -
- 123 -
La recopilacin de evidencias para prestar una base cientfica a la interpretacin de las puntuaciones en un uso concreto puede provenir de diversas fuentes. La importancia otorgada a cada una de ellas depender siempre de los objetivos del test, que determinarn en cada caso el tipo de evidencia ms significativa. Los ltimos estndares (AERA, APA y NCME, 1999) diferencian entre fuentes relacionadas con el contenido, el proceso de respuesta, la estructura interna, las relaciones con otras variables y las consecuencias del test, que en ningn modo suponen distintos tipos de validez sino aspectos complementarios.
6.2.1
Contenido
El anlisis del contenido de la prueba aglutina dos tipos de estudios suplementarios. Unos encaminados a evaluar las relaciones entre el constructo y el contenido del test, y otros dirigidos a valorar los factores contextuales internos y externos que puedan aadir varianza no deseada. El objetivo de los primeros es garantizar que la muestra de tems que componen la prueba es adems de relevante, representativa del constructo (Messick, 1981). Su dependencia respecto del uso concreto obliga a evaluar las distintas acepciones o significados que un mismo trmino puede poseer para diferentes grupos. Este punto es especialmente importante en la adaptacin de tests (Elosua, Hambleton y Zenisky, 2006; Elosua y Lpez, 1999, 2007). Una cuidadosa revisin desde el momento mismo de la construccin del instrumento por parte de expertos podr evitar potenciales fuentes de dificultad irrelevante, o de un uso sesgado del lenguaje, que pueda mostrar un punto de vista estereotipado o incluso irrespetuoso sobre un determinado grupo cultural o tnico (Title, 1982). Se recomienda tambin, sobre todo en los tests de rendimiento, asegurar o garantizar que la experiencia curricular de los sujetos sea la misma (Elosua, Lpez y Egaa, 2000; Linn y Harnisch, 1981).
- 124 -
- 125 -
Representacin del dominio: Consiste en analizar el contenido de los tems en funcin de las especificaciones del test. Para ello se clasifica cada uno de los tems en las dimensiones o factores definidos tras el estudio del constructo; adems del contenido, es posible analizar las demandas cognitivas o de otro tipo relacionadas con cada uno de los tems. Es posible construir ndices numricos para cada uno de los tems basndose por ejemplo en el grado de acuerdo entre jueces en la asignacin de los tems a las distintas reas de dominio. Por ejemplo el ndice de congruencia para un tem evaluado por 10 jueces expertos entre los cuales el nivel de acuerdo es de 7 sera 0,7 (7/10). Esta sencilla proporcin ofrece informacin vlida que - 126 -
Nada relevante
Muy relevante
Es posible definir distintos ndices de relevancia, sin embargo, todos tienen en comn la participacin de grupos de expertos; elemento indispensable y muchas veces obviado en la fase de construccin de un test en cualquier rea de contenido. Es importante en la evaluacin de la validez de contenido, que las reas de dominio definidas representen correctamente el constructo a medir evitando infrarrepresentaciones o varianzas relevantes. En general pueden recomendarse estas etapas en la evaluacin del contenido de test: 1.- Seleccin del grupo de expertos. Los expertos adems de conocer en profundidad el dominio de contenido deben conocer las caractersticas de la poblacin destino con el fin de que la adecuacin entre el contenido y el grupo sea mxima. Para ello es recomendable que en el grupo de expertos participen personas con caractersticas geogrficas, demogrficas y tnicas representativas
- 127 -
6.2.2
Proceso de respuesta.
- 128 -
El estudio de la evidencia centrada en el anlisis de la estructura interna evala el grado en que las relaciones entre los tems y los componentes del test conforman el constructo que se quiere medir y sobre el que se basarn las interpretaciones. Segn los ltimos estndares, se centra en el estudio de la dimensionalidad de la prueba, y del funcionamiento diferencial de los tems.
- 129 -
El estudio de la dimensionalidad cubre habitualmente dos aspectos: 1) la verificacin o refutacin de la hiptesis de unidimensionalidad, y 2) la descripcin, si procede, de la estructura multidimensional de un conjunto de datos. Estos dos objetivos implican la utilizacin de una metodologa encaminada a determinar qu y cuntos factores o en su caso rasgos explican la matriz de correlaciones, o determinan la respuesta de un sujeto. Generalmente, su objetivo es especificar y demostrar la existencia de una "estructura simple" (Thurstone, 1947), aquella, que resulta de la agrupacin de tems en ncleos dimensionalmente homogneos entre ellos, y dimensionalmente distintos entre s. De entre todos los procedimientos utilizables para ello, tal vez sea el modelo de anlisis factorial el que ha gozado de mayor popularidad, convirtindose en el ms utilizado. El anlisis factorial engloba un conjunto de tcnicas de anlisis multivariadas (McDonald, 1985) cuyo objetivo es resumir la informacin contenida en un conjunto de variables observadas por medio de un nmero reducido de variables hipotticas, conocidas normalmente como factores. Basado en el modelo lineal de Spearman, pretende reproducir las matrices de covarianzas o correlaciones entre variables, a travs de la siguiente ecuacin Z = Af +e
Dnde el vector de variables observadas Z se explica a travs de un vector de factores f, ponderado por una matriz de pesos factoriales (A) que representa las correlaciones entre las variables observadas y latentes, ms un trmino de error (e), que habitualmente en psicologa se descompone, en varianza nica y aleatoria.
Es un procedimiento que puede utilizarse como tcnica de anlisis exploratoria (Anlisis Factorial Exploratorio), o confirmatoria, para contrastar la - 130 -
La definicin ms general de funcionamiento diferencial del tem podra ser la aportada por Mellenbergh (1989), segn la cual dada una variable Z, y con respecto a otra variable G, el tem i presenta funcionamiento diferencial (FDI), si y slo si, se satisface la siguiente desigualdad para todos los valores g y z de las variables G y Z. - 131 -
f(X z)
aparentemente irrelevante al objeto de medida, habitualmente de naturaleza nominal (sexo, idioma, raza, edad...) y cuyos valores determinan la diferenciacin entre los grupos de referencia y focal.
Esta formulacin se traduce en que la probabilidad de respuesta correcta a un tem no depende nicamente del nivel del sujeto en la variable medida, sino que est condicionada por la pertenencia a un determinado grupo social, cultural, lingstico, instruccional... Esta dependencia del tem conduce a una falta de equivalencia mtrica que cuestiona su validez. La importancia de garantizar la equidad en el proceso de medicin, implcita en el concepto de validez, es el origen de la multitud de trabajos destinados tanto a la elaboracin y estudio de tcnicas diseadas para la deteccin del FDI (Berk,1982; Camilli y Shepard, 1994; Clauser y Mazor, 1998; Elosua, 1996; Fidalgo, 1996; Holland y Wainer, 1993; Martinez Arias, 1995; Millsap y Everson, 1993; Osterlind, 1983: Potenza y Dorans, 1995), como a la bsqueda de teoras explicativas que analizan sus causas (Elosua, Hambleton y Zenisky, 2006; Elosua y Lpez, 2007; Mellenbergh, 1989). Son muchos los mtodos diseados para detectarlo y muchos los estudios que comparan su efectividad bajo distintos supuestos. Bsicamente, los procedimientos de deteccin del FDI pueden clasificarse en funcin del carcter de la variable condicionante. Segn sea sta observada o latente, nos encontramos con tcnicas conocidas como invarianza condicional observada o invarianza condicional latente (Millsap y Everson, 1993). Todas ellas comparan la ejecucin en un tem por sujetos que perteneciendo a distintos grupos, presentan el mismo nivel de habilidad, de ah su calificacin de tcnicas condicionales.
- 132 -
- 133 -
El estudio de las relaciones entre la medida obtenida por el test y otras variables externas, conocida como el aspecto externo de la validez por Loevinger (1957) y Messick (1989), o como amplitud nomolgica por Embretson (1983, 1985), tal vez sea la fuente de informacin ms utilizada en el proceso de validacin. Su defensa como fuente de validez por al enfoque funcionalista (Prieto y Delgado, 1999) en la construccin de tests ha avalado su uso desde los primeros estndares de la APA. Se centra en la bsqueda de evidencias que relacionen la puntuacin con algn criterio que se espera prediga el test, o con otros tests que hipotticamente midan el mismo constructo, constructos relacionados o constructos diferentes (AERA, APA y NMCE, 1999). Los resultados de estos anlisis podran evaluar el grado en que las relaciones hipotetizadas son consistentes con la interpretacin propuesta. Es un apartado general en el que se incluyen la evidencia convergente/discriminante, las relaciones test/criterio y los estudios de generalizacin de la validez. 6.2.4.a Evidencia convergente y discriminante.
- 134 -
El estudio de las relaciones test-criterio adquiere una gran relevancia en contextos de utilidad donde es fundamental la precisin con que se efecta una prediccin. Su estudio incluye adems del grado de precisin, un anlisis de los factores que inciden directamente sobre ella, como las caractersticas propias del instrumento evaluado, la relevancia, fiabilidad y validez del criterio, y en general todos aquellos que afecten a la fiabilidad de las variables como el tamao muestral o la restriccin del rango. Los diseos utilizados para la obtencin de ndices de este tipo dependen del tiempo transcurrido entre la recogida de datos en el test y en el criterio,
- 135 -
La posibilidad de que los procesos de validacin locales puedan extenderse a nuevas situaciones est constituida por los estudios de metaanlisis, que en este mbito cumplen dos objetivos complementarios. Por un lado, unificar los resultados de aplicaciones particulares de un mismo test, y por otro, estimar la variabilidad de los resultados locales obtenidos debidos a artefactos estadsticos. En los estudios de validacin Hunter y Schmidt (1991) diferencian entre 11 posibles artefactos que sera necesario neutralizar:
Error de medida de en la en la la variable variable variable Error de medida en la variable dependiente Dicotomizacin de la variable dependiente Variacin del rango en la variable dependiente Validez de constructo imperfecta en la variable dependiente Varianza debida a factores extraos
independiente Dicotomizacin independiente Variacin del rango independiente Validez de constructo imperfecta en la variable independiente Errores de informe y transcripcin Error muestral
- 136 -
6.2.6 Consecuencias
El estudio de las consecuencias de la utilizacin de los tests es una fuente de evidencia compleja que puede traspasar los lmites de la validez como concepto enmarcado en el proceso de construccin de teoras cientficas, para llegar a tocar aspectos relacionados con la poltica social. Esta distincin e interconexin vuelve a enfatizar la importancia de la adecuacin contextual en el proceso de validacin de un instrumento de medida, que cobrar una relevancia especial en las situaciones en las que puedan existir consecuencias diferenciales para grupos socioculturales diferentes (seleccin y promocin, educacin especial...) La integracin del test con sus consecuencias, ha sido ilustrada por Messick (1989), que propone un marco de estudio de la validez en el que incluye un componente pragmtico con el que intenta enfatizar: a.- la importancia de la relacin entre la connotacin terica y las connotaciones prcticas atribuidas a las puntuaciones b.- la necesidad de valorar la relevancia y la utilidad de las puntuaciones en cada uno de los usos propuestos c.- la necesidad de conocer y en su caso controlar las consecuencias sociales del uso propuesto. Con ello se busca un equilibrio entre el valor instrumental del test o su finalidad y los efectos derivados de su uso, que slo se consigue haciendo al usuario cmplice y responsable del valor terminal del test.
- 137 -
- 138 -
Modelo fromal
Estima cin V
Validez
Modelo sustnativo
Test
- 139 -
Los constructos tericos que son objeto de investigacin por las ciencias sociales no son directamente medibles y es necesaria la utilizacin de indicadores manifiestos para su medicin. La relacin entre el constructo terico y sus indicadores manifiestos definir la validez de la medida obtenida. Es fundamental la correcta definicin de los indicadores manifiesto para que representen el constructo sin varianza irrelevante y sin infrarepresentacin. Existen modelos formales cuyo cometido se centra en el anlisis emprico de las relaciones entre variables observadas y variables latentes; entre ellos, el anlisis factorial es el modelo ms utilizado en la investigacin psicomtrica. El anlisis factorial engloba un conjunto de modelos matemticoestadsticos que analizan las relaciones de dependencia entre variables. Su objetivo es explicar la variabilidad contenida en n variables observadas por medio de m variables latentes, es decir, analizar la estructura interna o dimensionalidad de los datos. El anlisis factorial se haya estrechamente unido al estudio de la validez interna de un test o cuestionario y en el mbito psicomtrico es la tcnica ms utilizada, aunque en muchas ocasiones su utilizacin no sea correcta. Los datos a analizar estn contenidos en la matriz de covarianzas (correlaciones) entre variables; y el objetivo es explicar la variabilidad contenida en ellas asumiendo la existencia de factores o variables latentes comunes a todas ellas. Los objetivos del anlisis factorial son la parsimonia y la simplicidad de la solucin que garantizan la significatividad e interpretabilidad formal y sustantiva de los factores extrados.
- 140 -
7.1
El modelo de anlisis factorial asume la presencia de factores latentes que dan cuenta de la variacin observada en la matriz de correlaciones y establece relaciones lineales entre los factores y las variables manifiestas. Utilizando los esquemas de Wright, un modelo bifactorial podra representarse grficamente del siguiente modo:
D
1
u
1
Z
1
a a1 a a 3
4 2 1 2 1 1
D
2
u
2
Z Z
2 2
D
3
u
3
F
1
Z
3
D
7.1 Figura.
4
u
4
a
4 2
F
2
Z
4
Modelo bifactorial
Z1 = a11F1 + a12F2 + u1D1 Z2 = a 21F1 + a 22F2 + u 2D2 Z3 = a 31F1 + a 32F2 + u3D4 Z4 = a 41F1 + a 42F2 + u 4D4
- 141 -
Los elementos que integran el modelo son: Variables observadas. Son variables estandarizadas; en el ejemplo son 4 (n=4). Variables latentes, tambin conocidas como factores o dimensiones. Son de dos tipos: o Factores comunes. Son estructuras que se relacionan con ms de una variable observada; factores (m=2). o Factores especficos. Son estructuras latentes asociadas a cada una de las variables observadas. Su nmero es n. Pesos o saturaciones. Son las saturaciones de las variables sobre los factores, en funcin de los factores se distingue entre: o aij son los pesos asociados a los factores comunes. o ui son los pesos asociados a los factores especficos. Siguiendo las especificaciones grficas sera posible representar el modelo del siguiente modo: En este ejemplo existen dos
- 142 -
Zi
7.1.1 Supuestos y consecuencias
m j 1
aij Fj ui Di
Supuesto 1. Tanto los factores como las variables observadas estn estandarizados.
FDj i
=0
j i
Di Dj
=0
FjFk
=0
A partir de estos supuestos se derivan las siguientes consecuencias: Consecuencia 1. Varianza de las variables observadas. La varianza de las variables observadas se descompone en comunalidad y unicidad.
2 i
1 hi2 ui2
- 143 -
La comunalidad de una variable es el sumatorio del cuadrado de las saturaciones de los factores comunes en esa variable e indica la parte de varianza explicada por los factores comunes.
m j 1
h
Por lo tanto,
2 i
2 i1
2 i2
2 im
2 aij
2 i
hi2 ui2
m j 1
2 aij ui2
Existe una clara relacin entre el concepto de fiabilidad y el modelo factorial. En el contexto de la teora clsica de tests la unicidad de una variable puede descomponerse en dos: parte sistemtica o especfica y parte de error. La comunalidad y la parte sistemtica de la unicidad contribuiran a la puntuacin verdadera siendo equiparable la parte de error de la varianza al error de medida.
= ai2 ui2
Consecuencia 2. Correlacin entre variables observadas. La correlacin entre dos variables observadas se reproduce por medio del sumatorio de los productos de las saturaciones de los factores comunes sobre ellas. El teorema bsico del anlisis factorial establece:
m j 1
ik =
a ij a kj
Donde
ik es la correlacin entre las variables observadas i y k aij akj, son las saturaciones del factor j en las variables i y k .
- 144 -
Zi Fj
= a ij
Donde
ZiFj es la correlacin entre el factor comn j y la variable observada i aij, , es el peso del factor j sobre la variable i
A partir de los supuestos del modelo, es posible reproducir la matriz de correlaciones entre variables observadas. La matriz reproducida es una fuente de informacin bsica en el estudio del ajuste del modelo a los datos; en la media en que las diferencias entre los valores reproducidos y observados sean equivalentes la solucin factorial podr considerarse ptima.
a1 a2 a1 a2 an
Donde
a1an a2an
h12
* 21
* 12 2 2
* 1n * 2n
2 an
* n1
* n2
2 hn
ai es el peso del factor comn en la variable i , hi2, es la comunalidad de la variable i * ij, es la correlacin reproducida entre las variables i y j
A A' R*
La diagonal principal de la matriz de correlaciones reproducida est ocupada por las comunalidades. El objetivo principal del anlisis factorial es maximizar la comunalidad de las variables, es decir la parte de la varianza comn debida a los factores comunes. A medida que aumenta la comunalidad de las variables los valores de la diagonal principal de la matriz de correlaciones tendern a 1. - 145 -
resij
ij
ai a j
iF jF
resij
ij
res1n res2n
1
21
12
1n 2n
h12
* 21
* 12 2 2
* 1n * 2n
2 un
n1
n2
* n1
* n2
2 hn
La ecuacin bsica del modelo factorial expresada en lenguaje matricial adquiere la siguiente forma:
Z AF UD
Donde Z es la matriz de correlaciones entre variables observadas, F, es la matriz de factores comunes, A, es la matriz de pesos, U, es la matriz de pesos de los factores especficos D, es la matriz de factores especficos.
- 146 -
Z AF E
D o n d e E e s
F
1
F
2
Z
1
a
1 1
a
1 2
Comunalides
2 2 2 l a matriz de residuales. 1 2
Valores propios a a
3 2
Z
3
Z
4
Z1 1 Z2
a
4
a
4
a1m a2m
F1 F2
u11 0 0 u22
0 0
D1 D2
Zn 1 n 1
2 n1
a an 2
anm
Fm m 1
0 0 n n
unn
Dn n 1
n m
La matriz A recibe el nombre de matriz factorial, y recoge las saturaciones de los factores comunes en las variables observadas (aij). Cada uno de los elementos de la matriz (aij) expresa la correlacin entre la variable observada y el factor comn. El sumatorio del cuadrado de cada uno de los elementos de cada una de las columnas es el valor propio o eigenvalue del factor comn correspondiente. Los valores propios son caractersticos de los factores y se utilizan para interpretar la parte de la varianza de las variables explicada por el factor. La lectura de la matriz factorial por filas proporciona informacin sobre las comunalidades de las variables, es decir, la parte de varianza de cada variable explicada por los factores comunes.
- 147 -
R* AA'
La matriz original se obtendr sumando a la matriz de correlaciones reproducida o matriz reducida (R*) la matriz de unicidades.
R = R* + U
La extraccin factorial es el ncleo del anlisis factorial. Son muchos los procedimientos algebracos y estadsticos construidos con tal fin. Su exposicin sobrepasas los lmites de este manual y remitimos al lector a la bibliografa especializada sobre el tema, entre la cual destacaramos Comrey (1985), Gorsuch (1974), Harman (1980), Maxwell (1977), McDonald (1985) Mulaik (1972). Expondremos brevemente las bases del procedimiento de estimacin por mxima verosimilitud, por ser el que implementa factanal, la funcin que utiliza Rcommander para ejecutar el anlisis factorial. Mtodo de mxima verosimilitud Se trata de un procedimiento de estimacin estadstico que obtiene estimadores con propiedades estadsticas deseables. Es un mtodo simple aplicable a multitud de modelos diferentes. Una vez obtenido un estimador mximo-verosmil la teora general sobre estimacin por mxima verosimilitud proporciona errores estndar, test de significacin y dems resultados que son tiles en la inferencia estadstica.
- 148 -
Pr(datos parmetro)=Pr(CC+CCC++CC )=
(1- )
(1- )(1- )
(1- )3.
Los datos de nuestro experimento son fijos; los conocemos. El parmetro tambin tiene un valor fijo, pero este valor es
desconocido, y podemos estimar cual sera su valor tratando la probabilidad de los datos observados como una funcin de verosimilitud: L(parmetro datos) = L( CC+CCC++CC) =
7
(1- )3
La funcin de probabilidad y la funcin de verosimilitud vienen dada por la misma ecuacin, pero la funcin de probabilidad es una funcin de los datos con el valor del parmetro fijo, mientras que la funcin de verosimilitud es una funcin del parmetro con los datos conocidos. En la tabla siguiente se muestran distintos valores de la funcin de verosimilitud para distintos valores de .
- 149 -
(1- )3
La funcin de verosimilitud completa ha sido reproducida en la siguiente ilustracin. Aunque cada valor de L( |datos) tiene una notacin probabilstica, la funcin no es una funcin de probabilidad y el rea encerrada no es 1.
0.0000
0.0005
0.0010
0.0015
0.0020
0.0
0.2
0.4
0.6
0.8
1.0
La probabilidad de obtener la muestra de datos es pequea en relacin al parmetro . La funcin de probabilidad contiene informacin muy importante . Por ejemplo, mencionaremos que no
- 150 -
probable vistos los datos es aqul que genera una verosimilitud mayor, est valor es el estimador mximo verosmil. El estimador mximo verosmil es el mximo de la funcin de verosimilitud, es decir, aqul cuyo valor maximiza la probabilidad de obtener los datos conocidos. En este ejemplo el estimador mximo verosmil del parmetro es 0,7, que coincide con la proporcin de
caras en el experimento de lanzamiento de monedas, 7/10. En trminos de clculo, es ms sencillo maximizar el logaritmo de la funcin de verosimilitud que la funcin de verosimilitud, porque la transformacin logartmica convierte los trminos del producto en trminos aditivos.
LogL( ) x log
(n x)log(1
d log L( ) 0 d
Los estimadores mximo verosmiles son consistentes, asintticamente insesgados, asintticamente eficientes y distribuidos segn la ley normal. Siendo L( ) el valor de la funcin de verosimilitud en el punto MLE, y
G2
2log
L( ) L( )
2 log L( ) log L( )
- 151 -
Aunque, desde un punto de vista formal, el modelo de componentes principales no es un modelo de anlisis factorial, su uso como tal es comn en la investigacin aplicada. De hecho, programas con licencias privativas como el SPSS incluyen el modelo de componentes principales como un mtodo de extraccin factorial. El objetivo del modelo de componentes principales es reproducir la varianza total mientras que el anlisis factorial est interesado en la varianza comn. Esa diferencia bsica en los objetivos marca la diferencia entre los modelos. Es cierto, sin embargo, que cuando el modelo de componentes principales se utiliza como un mtodo de extraccin factorial los resultados pueden interpretarse de modo anlogo. De hecho, a medida que aumenta la varianza comn, aumenta la equivalencia entre ambos modelos. El modelo de componentes principales define a partir de de combinaciones lineales entre n variables observadas, Y componentes que explican el mximo de varianza observada. Una vez estimado un componente, su efecto es eliminado y se vuelve a estimar un segundo componente relacionado con la varianza residual.
an1 X n an 2 X n ann X n
Las diferencias entre el modelo factorial y el modelo de componentes principales podra sistematizarse del siguiente modo: a.- El anlisis de componentes principales define n componentes a partir de n variables observadas, y esos componentes se ordenan en funcin de la varianza explicada por cada uno de ellos; aunque cuando se utiliza en - 152 -
La solucin factorial generada tras someter a un conjunto de datos a un anlisis factorial cumple la ecuacin del modelo (AA'=R*), sin embargo, eso no significa que la solucin sea nica. Para cada anlisis es posible encontrar varias matrices que cumplan la condicin anterior. Entre todas las posibles soluciones habra que optar por aquella que mejor pueda interpretarse desde un punto de vista sustantivo; esta solucin habitualmente se aproxima a la estructura simple definida por Thurstone (1947). Una matriz factorial P tiene una estructura simple cuando: Cada fila en la matriz P tiene al menos un 0 (o valores prximos a 0). Es decir, cuando para cada variable existe al menos un factor que no contribuye a la varianza de la variable. Para cada factor en la matriz P existe un grupo de variables con peso nulo (o valores prximos a 0). Para cada par de columnas existirn variables con valores prximos a 0 en una y elevados en la otra. La estructura de una matriz factorial con estructura simple podra ser similar a:
- 153 -
Factor 2
Factor 3
XX XX XX XX XX XX
La rotacin factorial consiste en encontrar una nueva matriz factorial que se aproxime a la estructura simple,
P AT
Donde A es la matriz factorial T, es la matriz de transformacin.
Si partiramos de una solucin factorial como la expresada en la siguiente matriz factorial y la rotramos, podramos obtener una nueva solucin, la solucin rotada. Formalmente equivalente a la solucin original, pero ms fcil de interpretar; con pesos que se distribuyen en bloques claramente interpretables. La representacin grfica en coordenadas cartesianas, muestra la proximidad de las variables a los ejes que representan los factores en la solucin rotada, y la difcil interpretacin sustantiva de la solucin original.
- 154 -
Varimax: Formulada por Kaiser (1958), la rotacin varimax maximiza la varianza factorial. Para ello minimiza el nmero de variables con altas saturaciones. Es el procedimiento ms empleado. Qartimax: El objetivo de la rotacin quartimax es simplificar la explicacin de las variables, para ello minimiza el numero de factores comunes asociados a ellas. Es un procedimiento recomendado cuando el nmero de variables observadas es elevado. Equamax: Es un procedimiento que combina los dos anteriores.
Solucin no-rotada F1 Z1 Z2 Z3 Z4 0,780 0,799 0,767 0,789 F2 0,304 -0,328 0,462 -0,.417 Z1 Z2 Z3 Z4 Solucin rotada F1 0,348 0,802 0,229 0,857 F2 0,761 0,321 0,865 0,250
Rotaciones oblicuas Las rotaciones oblicuas son muy utilizadas en la investigacin aplicada porque habitualmente ofrecen soluciones ms interpretables, sin embargo la generalizacin de la solucin es menor que la atribuible a una rotacin
- 155 -
R* PP U2
Entre los procedimientos de rotacin oblicua, Oblimin (Jennrich y Sampson, 1966) es la ms utilizada en la
investigacin aplicada. Con el fin de controlar la correlacin entre factores, es necesario la especificacin del parmetro Delta. Un valor 0 expresara la mxima correlacin. Promax (Hendrickson y White, 1964), este procedimiento maximiza la razn entre los pesos mayores y menores.
7.2
1.- Hiptesis. Todo anlisis factorial ha de ir guiado por un conocimiento de los datos a analizar que permita formular hiptesis sobre su estructura interna. Es cierto, sin embargo que en muchos contextos de investigacin no hay hiptesis relativas a la dimensionalidad, convirtindose el anlisis factorial herramienta meramente descriptiva. En general, el estudio de la dimensionalidad latente a un conjunto de datos puede adoptar dos perspectivas; exploratoria y confirmatoria. En la primera se obtendr una descripcin de la estructura interna de los datos, en la - 156 en una
- 157 -
determinacin del nmero de factores a retener e interpretar tras un anlisis factorial, entre otras razones porque son muy sencillos de generar y de interpretar. Su justificacin para el caso de un modelo unidimensional por ejemplo, es muy simple. A medida que aumenta la diferencia entre la varianza asociada al primer factor extrado, y la varianza que explica el segundo factor extrado, mayor ser la evidencia acerca de la unidimensionalidad de los datos. Son varios los ndices construidos sobre esa base: Criterio de Carmines y Zeller (1979) Un conjunto de datos es unidimensional si el primer factor extrado explica el 40% de variabilidad observada. Criterio de Reckase (1979). Esta autor propone un punto de corte del 20% en la determinacin de la varianza que tiene que explicar un factor para poder considerar la existencia de una dimensin dominante. ndice de Lord (Lord, 1980). Para establecer el grado de relevancia del primer factor sobre el resto de factores extrados, este autor estima la razn entre la diferencia entre los dos primeros factores y la diferencia entre el segundo factor y el tercer factor.
- 158 -
8 6 4 2 0 1 3 5 7 9 11 13 15 17 19 21 23
10 8 6 4 2 0 1 3 5 7 9 11 13 15 17 19 21
- 159 -
rij rij*
ECMR
i 1 j 1
n(n 1)
Donde
rij es la correlacin entre las variables i y j, rij *, es la correlacin reproducida entre i y j n, nmero de variables analizadas.
ndices relativos Cuando la rotacin factorial se ha efectuado por medio del procedimiento de estimacin por mxima verosimilitud se puede utilizar la razn de verosimilitud como criterio para la comparacin de dos soluciones factoriales diferentes. En la comparacin de soluciones con un nmero de factores diferente, este contraste ofrece un estadstico que asintticamente se distribuye como una Chi cuadrado con grados de libertad igual a la diferencia entre los grados de libertad de los modelos evaluados (Lawley, 1940). - 160 -
2n log
Dados los problemas relacionados con el estadstico Chi cuadrado referidos a su sensibilidad con respecto al tamao de la muestra, es habitual valorar el grado de ajuste atendiendo a estadsticos bondad de ajuste. Los estadsticos de bondad de ajuste ofrecen valores que dentro de un contexto de interpretacin debern ser valorados por el investigador; es decir, no son pruebas estadsticas que rechacen o acepten una hiptesis nula. Entre ellos podramos citar el propuesto por McDonald (1999), cuyo valor es menor a 0,05 cuando el ajuste es adecuado:
RMSEA
d / gl
G g.l. N
Donde
- Qu se ha de interpretar en una solucin factorial? En la interpretacin de los factores es importante tener en cuenta las saturaciones. Tras una rotacin oblicua es necesario especificar la matriz que est siendo interpretada (correlaciones o saturaciones). - Qu saturaciones han de interpretarse? Aquellas que son significativas; en ausencia de los errores de estimacin, Stevens (1992) propuso como punto de
- 161 -
- 162 -
7.3
Dentro de los posibles modos de evaluar la dimensionalidad de un conjunto de variables, Rcommander incorpora el anlisis factorial exploratorio, el anlisis de componentes principales y el anlisis de conglomerados. Se trata de funciones bsicas en el estudio de la dimensionalidad que pueden extenderse con la utilizacin de paquetes adicionales (por ejemplo, sem). 7.3.1 Modelo unidimensional
La secuencia de seleccin para la ejecucin de un anlisis factorial es: Estadsticos>Anlisis Dimensional>Anlisis factorial.
- 163 -
Dado que estamos analizando la escala Insatisfaccin Corporal, se seleccionarn los 10 tems que la componen; los 10 tems recodificados. En esta ocasin dejaremos la opcin Expresin de seleccin en blanco porque nos interesa evaluar el modelo en el conjunto de la muestra. Como el objetivo es evaluar la unidimensionalidad de los datos la opcin de rotacin de los factores carece de sentido y por ello se marcar el cuadro Ninguno. Una vez especificados los argumentos, Rcommander nos pide el nmero de factores a extraer; fijaremos el valor 1. El procedimiento de estimacin incorporado en Rcommander es mxima verosimilitud.
- 164 -
factanal(x = ~RecIC_1 + RecIC_2 + RecIC_3 + RecIC_4 + RecIC_5 + RecIC_6 + RecIC_7 + RecIC_8 + RecIC_9 + RecIC_10, factors = 1, data = Edi.data, scores = "none", rotation = "none")
Las salidas generadas por Rcommander aparecen agrupadas en tres bloques: Unicidad (Uniquenesses), pesos factoriales (Loadings) e informacin sobre la adecuacin de los datos al modelo. Unicidad La unicidad es la parte de varianza especfica de cada variable. Como puede comprobarse, a medida que aumente la unicidad de una variable disminuye su comunalidad o varianza comn. De hecho, la varianza de una variable se descompone en unicidad y varianza comn, que en el caso de variables estandarizadas sumarn 1. Por ejemplo, para el primer tem de la escala, 1 = 0,479 + 0,7222. Los elementos son la varianza total (1), la unicidad (0,479) y la varianza comn (h2=0,7222). En los modelos unifactoriales la varianza comn (h2) es el cuadrado de la saturacin factorial (h2=a2). En el modelo de un factor, las saturaciones de las variables en los factores son correlaciones entre el factor y la variable. Desde el punto de vista de la regresin lineal se tratara de coeficientes de regresin. En nuestro ejemplo el tem con una saturacin ms baja es el tem 7, que por tanto mostrar una
- 165 -
Saturaciones:
Loadings: Factor1 RecIC_1 RecIC_2 RecIC_3 RecIC_4 RecIC_5 RecIC_6 RecIC_7 RecIC_8 RecIC_9 0.722 0.787 0.732 0.827 0.683 0.743 0.196 0.803 0.770
RecIC_10 0.803
Test of the hypothesis that 1 factor is sufficient. The chi square statistic is 822.41 on 35 degrees of freedom. The p-value is 4.29e-150
- 166 -
Para
mostrar
la
aplicacin
interpretacin
de
un
modelo
Eating Disorder
Inventory-3; insatisfaccin corporal y obsesin por la delgadez. En aras a obtener una solucin ms clara se analizarn conjuntamente cuatro tems provenientes de cada una de ellas. En la opcin de Rcommander Estadsticos>Anlisis
dimensional>Anlisis factorial podrn seleccionarse las variables a analizar, se definir el tipo de rotacin factorial y finalmente se definir el nmero de factores a extraer.
- 168 -
Dado que la configuracin a evaluar tiene dos factores, expondremos la solucin factorial no-rotada y una solucin factorial rotada con el fin de comprobar el efecto de la rotacin sobre la matriz factorial. Para ello en la opcin Rotacin de los factores se marcar en funcin de cada caso, la ventana requerida (Ninguno, Varimax o Promax). Rcommander ofrece dos procedimientos de rotacin factorial, varimax y promax. La rotacin Varimax (Kaiser, 1958) es una rotacin ortogonal, y Promax (Hendrickson y White, 1964) es una rotacin oblicua. La primera mantiene la independencia entre factores fijando su correlacin a 0; la segunda ofrece una solucin en la que los factores estn relacionados. La eleccin entre un tipo de rotacin y otra est siempre en manos del investigador. La solucin ortogonal ofrece una generalizacin mayor que la solucin oblicua. La interpretacin de la solucin ortogonal es ms sencilla que la interpretacin de la solucin oblicua. En el primer caso las saturaciones mostradas en la matriz factorial representan las correlaciones entre las variables y los factores extrados. La solucin oblicua genera dos matrices diferentes, la matriz de configuracin que muestra las saturaciones de las variables en los factores extrados. (es la salida por defecto de la funcin factanal) y la matriz de y los factores estructura que recoge las correlaciones entre las variables
- 169 -
Uniquenesses: RecIC_2 0.340 RecOD_3 0.555 Loadings: Factor1 Factor2 RecIC_2 RecIC_3 RecIC_9 RecIC_10 RecOD_3 RecOD_4 RecOD_5 RecOD_7 0.790 0.638 0.735 0.656 0.659 0.727 0.781 0.751 0.191 0.183 0.289 0.309 -0.103 -0.330 -0.194 -0.223 Factor1 Factor2 SS loadings Proportion Var Cumulative Var 4.138 0.517 0.517 0.456 0.057 0.574 RecIC_3 0.559 RecOD_4 0.363 RecIC_9 RecIC_10 0.376 RecOD_5 0.353 0.474 RecOD_7 0.386
Uniquenesses: RecIC_2 0.340 RecOD_3 0.555 Loadings: Factor1 Factor2 RecIC_2 RecIC_3 RecIC_9 RecOD_3 RecOD_4 RecOD_5 RecOD_7 0.687 0.576 0.719 0.385 0.270 0.404 0.363 0.434 0.330 0.327 0.255 0.545 0.751 0.695 0.694 Factor1 Factor2 SS loadings Proportion Var Cumulative Var Rotacin Varimax 2.298 0.287 0.287 2.296 0.287 0.574 RecIC_3 0.559 RecOD_4 0.363 RecIC_9 RecIC_10 0.376 RecOD_5 0.353 0.474 RecOD_7 0.386
RecIC_10 0.679
Solucin no rotada
- 170 -
Sera posible obtener una representacin grfica de la distribucin de los tems en el espacio bidimensional generado por ambos factores por medio de la funcin plot; que aplicada a nuestro ejemplo modo:
plot(.FA$loadings,xlim=range(-1,+1),ylim=range(-1,+1), type="n") abline(h=0,v=0); text(.FA$loadings,substring(rownames(.FA$loadings),5,6),cex=0.9)
- 171 -
1.0
2 41
0.5
5 6 7 8
Factor2
-1.0
-0.5
0.0
-1.0
-0.5
0.0 Factor1
0.5
1.0
En muchos contextos de investigacin el anlisis factorial exploratorio concluir con la evaluacin del ajuste formal del modelo despus de un proceso que incluye la secuencia de estimacin de los parmetros del modelo y rotacin de los factores extrados. Sin embargo, son numerosas las situaciones en las que
- 172 -
posibilidad de pronosticar las puntuaciones factoriales utilizando el mtodo de Bartlett y el mtodo de la regresin. El primero sugiri el uso de mnimos cuadrados ponderados para regresar las observaciones sobre los pesos ya ajustados tratando las unicidades como trminos aleatorios y las puntuaciones factoriales como parmetros. En el mtodo de la regresin, los factores son tratados como variables aleatorias.
El objetivo del anlisis de componentes principales es describir la variacin encontrada en un conjunto de datos correlacionados en trminos de un nuevo conjunto de variables no correlacionadas cada una de las cuales es una combinacin lineal de las primeras. Las nuevas variables son derivadas en un orden decreciente de importancia en el sentido de varianza explicada. Estas nuevas variables se conocen como Componentes Principales.
- 173 -
En un anlisis de componentes principales interesa que los primeros componentes den cuenta de un porcentaje de varianza elevado. Con ello se conseguira reducir la estructura de los datos a un pequeo nmero de dimensiones. La funcin que incorpora Rcommander (PC) para llevar a cabo un anlisis de componentes principales es accesible por medio de las opciones Estadsticos > Anlisis Dimensional > Anlisis de componentes principales. La ventana a la que da acceso esta opcin permite analizar la matriz de correlaciones, representar la grfica de sedimentacin y aadir los valores de los sujetos en los componentes extrados como variable/s en el conjunto de datos activo. El screeplot (grfico de sedimentacin) de Cattell es uno de los procedimientos grficos ms utilizados como apoyo en la determinacin del nmero de factores a retener en un anlisis de dimensionalidad. El screeplot generado por Rcommander presenta un aspecto que es fcilmente modificable variando los parmetros grficos que utiliza la funcin screeplot.
- 174 -
Variances 0
Comp.1
Comp.3
Comp.5
Comp.7
Comp.9
Para generar un screeplot, independientemente del anlisis de componentes principales que utiliza Rcomnander se podra transcribir cualquiera de las siguientes dos funciones en la ventana de instrucciones. La primera funcin (barplot) genera el grfico que muestra los valores propios de la matriz de correlaciones entre los tems. Al grfico generado se le ha aadido una lnea que marca el punto de corte establecido por Kaiser-Guttman en la consideracin de los factores a retener; aquellos con valores propios superiores a la unidad.
barplot(eigen(cor(Edi.data[,16:25]))$values,col=3,ylim=c(0,10),y lab="valores propios",xlab="Componentes", main="ScreePlot") abline(1,0)
Si en lugar de barras se quisieran representar los valores propios de los factores extrados por medio de puntos (como lo hace el SPSS) el comando a utilizar sera el siguiente,
a <- eigen(cor(Edi.data[,16:25]))$values plot (a, col=6, pch=9, ylim=c(0,6),ylab="valores propios",xlab="Componentes", main="ScreePlot") lines (a, lwd=2, col=6) abline(1,0)
- 175 -
El sesgo es una de las mayores amenazas contra la validez de los tests porque su presencia puede alterar el significado de las puntuaciones de un modo sistemtico y puede interferir en las inferencias derivadas de ellas. Su estudio es importante y para ello la psicometra ha diseado mtodos empricos basados en el concepto de funcionamiento diferencial del tem. Sesgo y funcionamiento diferencial del tem no son conceptos sinnimos ni conceptos equivalentes; si bien es cierto que en los primeros estadios de los estudios sobre FDI era habitual referirse a ellos como estudios de sesgo. El funcionamiento diferencial es un caracterstica formal de cuyo resultado se podra inferir (o no) la presencia de sesgo. Un estudio de funcionamiento diferencial que se limite a su deteccin en un conjunto de tems no es vlido en s mismo. El funcionamiento diferencial es
- 176 -
8.1
Conceptos bsicos
Un tem presenta funcionamiento diferencial cuando la probabilidad de respuesta correcta (o la probabilidad de respuesta sobre una categora) no depende nicamente del nivel de la persona en el rasgo intencionadamente medido por el test. Es decir, el nivel en la variable medida no explica la probabilidad de respuesta. Existen factores que ejercen su influencia sobre la probabilidad de respuesta que interactan entre ciertas caractersticas del tem y un grupo demogrfico determinado originando una alteracin entre la relacin original establecida entre el tem y la variable medida. El funcionamiento diferencial del tem no es una propiedad del tem, tampoco lo es de una poblacin concreta de examinados; la utilizacin de ese tem en ese grupo de poblacin es el origen de una interaccin que causa la presencia de funcionamiento diferencial del tem. Los tems no son sesgados en modo absoluto! El sesgo est relacionado con el uso. Mellenbergh (1989) sintetiza perfectamente la idea en una definicin formal segn la cual, dada una variable Z (constructo o variable medida), y con respecto a otra variable G (grupo), el tem i presenta funcionamiento diferencial si y slo si,
f X g, z
f X z
- 177 -
- 178 -
- 179 -
procedimientos de deteccin construidos sobre modelos formales que relacionan funcionalmente variables latentes y las respuestas al tem. Los ms importantes son los derivados del modelo del factor comn y de los modelos de respuesta al tem (TRI). Los primeros por medio del estudio de estructuras de medias y covarianzas (MACS) comparan modelos de medida anidados que van restringiendo (o liberando) parmetros en los grupos de inters (Elosua y Muiz, 2010; Elosua, 2005). Los segundos han diseado varios procedimientos que bsicamente comparan curvas caractersticas del tem, parmetros de los tems o modelos anidados derivados de la aplicacin de algn modelo de respuesta al tem (Elosua y Wells, 2008). La caracterstica principal de estos procedimientos es las fuertes restricciones sobre las que se asientan. Modelos formales manifiestos. La deteccin del FDI se basa en la aplicacin de modelos formales menos restrictivos que los anteriores, y por lo tanto su aplicabilidad es mayor. Entre los ms utilizados cabe destacar los conocidos como Mantel-Haenszel (y sus extensiones polinomiales y politmicas) y la regresin logstica. El primero est basado en el anlisis de tablas de contingencia multidimensionales, y el segundo en una comparacin de modelos anidados de regresin logstica. Procedimientos numricos. Los procedimientos incluidos en este apartado no proponen modelos de medida ni latentes ni manifiestos; sin embargo, son muy tiles. Incluiramos aqu los procedimientos grficos de anlisis de medias ponderadas, y los ndices numricos como la estandarizacin que a
- 180 -
regresin logstica y los procedimientos numricos. Ambos son sencillos de implementar por parte de lectores no expertos, eficaces y fcilmente interpretables.
8.2
Estandarizacin
La estandarizacin, es una tcnica situada dentro de los lmites generales de la TRI pues puede considerarse una versin no paramtrica de la misma y que se asienta a medio camino entre ella y los procedimientos basados en el anlisis de tablas de contingencia. Bsicamente, compara las medias en un tem obtenidas por sujetos provenientes de dos grupos que han sido emparejados en funcin de los valores alcanzados en la variable medida. Para ello se segmenta la puntuacin total en K niveles de puntuacin y se estiman las medias aritmticas en cada uno de los niveles y en cada uno de los grupos. Con ello conseguimos comparar las curvas caractersticas empricas del tem o regresiones tem-test no paramtricas estimadas en dos poblaciones distintas. Para cada uno de los niveles de habilidad la diferencia entre las medias aritmticas del tem reflejara las diferencias medias entre el grupo de referencia y el focal:
DifiK
Donde
XiFK XiRK
condicionadas al nivel de aptitud k en los
XiFK
- 181 -
STDDIFi =
k k=1
wk [ X iFK - X iRK ] =
k k=1
Los valores de este ndice se sitan en el intervalo (-1, 1). Mientras un valor positivo indica que el tem favorece el grupo focal, un valor negativo indica cierta ventaja del grupo de referencia. Estudios recientes aconsejan vigilar un tem cuando el valor del ndice supera el 5% del rango de las puntuaciones del tem.
8.3
Regresin logstica
Este mtodo modela la probabilidad de respuesta a un tem en funcin de la puntuacin emprica obtenida en el test, de la pertenencia a un grupo y de la interaccin entre ambos factores. Evala la presencia de FDI a travs del estudio de la mejora en el ajuste que produce la incorporacin sucesiva de los parmetros mencionados al modelo de regresin logstica (Puntuacin Total, Puntuacin total+ Grupo, Puntuacin total+Grupo+Puntuacin total Grupo). Para evaluar el FDI se comparan las razones de verosimilitud de los modelos anidados (total, total+grupo, total+grupo+interaccin). habilidad (Total; Modelo 1). La existencia de El modelo base se construye nicamente respecto al parmetro de la variable que indica el nivel de FDI uniforme se concluira cuando la diferencia entre el modelo base y el modelo que incluye el parmetro
- 182 -
P(u = 1)=
ez [1+ e z ]
donde, z= +
1X
2g
+ 3(Xg)
La probabilidad de respuesta depende de tres fuentes de variacin: grupo de pertenencia, nivel de aptitud, e interaccin entre ambos. Siendo g la variable indicadora del grupo de pertenencia, puede adoptar dos valores; 1 si el sujeto pertenece al grupo 1 (referencia), y 0 si pertenece al grupo 2 (focal). X representa
- 183 -
=0 y
0, y
Para su comprobacin, se compara el ajuste de modelos especificados con distintos parmetros. El procedimiento ms sencillo y rpido es evaluar el modelo base, aquel que incorpora nicamente el nivel de habilidad, con el modelo de interaccin. En caso de que se optara por el modelo extendido, es posible estudiar el origen del funcionamiento diferencial estimando el modelo para el FDI uniforme. La significacin estadstica del parmetro incorporado, se evala a travs de la razn de verosimilitud, que analiza el incremento en el ajuste producido por la incorporacin de un nuevo parmetro. Este estadstico sigue una distribucin Chi cuadrado con grados de libertad igual a la diferencia entre los grados de libertad entre los modelos (3-1=2).
Los estudios de funcionamiento diferencial del tem agrupan estudios sobre la deteccin del FDI, causas del FDI y consecuencias de la presencia del FDI. La literatura especializada ha dedicado mucho tiempo y esfuerzo en al diseo de procedimientos de deteccin (Fidalgo, 1996; Holland y Wainer, 1993) fruto de los cuales disponemos de todo un arsenal de mtodos que detectan con un alto grado de eficacia la presencia de FDI. Aunque todava van surgiendo
- 184 -
- 185 -
8.4
Son varios los paquetes y funciones que incorporan la regresin logstica binaria, ordinal y politmica en R. Entre ellas, utilizaremos la funcin lrm que viene incorporada en el paquete Design. El primer paso por tanto, ser cargar (o instalar en su defecto) el paquete.
library(Design,T)
Una vez instalado, son dos los modelos de regresin que habremos de aplicar a los tems objeto de estudio. El modelo base definido como aqul que explica las respuestas al tem en funcin de la puntuacin total, y el modelo de interaccin que adems de la puntuacin total incorpora como parmetro la interaccin entre el grupo (sexo) y la puntuacin total (IC:SEXO). Estas dos sencillas instrucciones harn que el modelo de regresin logstica para datos ordinales se ejecute sobre los datos.
fit0<-lrm (RecIC_1~IC, data=Edi.data)$stats
- 186 -
Los resultados de la aplicacin de ambos modelos ($stats) han sido asignados a dos objetos fit0 u fit1. En ellos se almacena informacin sobre el ajuste del modelo de regresin; entre los estadsticos que se incluyen nos interesan especialmente el valor de la razn de verosimilitud, guardada en la tercera posicin ([3]) y el valor del R2 que ocupa la dcima posicin en la lista de resultados. Dado que el modelo de regresin logstica se basa en la comparacin de modelos anidados solo quedar estimar la diferencia entre esos estadsticos para obtener informacin sobre el posible funcionamiento diferencial del tem. Para ello se han creado dos nuevas variables (LR.DIF y R2.DIF) que recogen la diferencia entre los valores estimados en el modelo base y en el modelo de interaccin.
LR.DIF <- fit2[3]- fit0[3] R2.DIF <- fit2[10]-fit0[10]
El valor estimado de LR.DIF es 15,48555 y el de R2.DIF 0.008411846. El valor LR.DIF sigue una distribucin Chi cuadrado con dos grados de libertad (diferencia entre los grados de libertad del modelo de interaccin y los grados de libertad del modelo base).
2)=0,00045)
(15,48;
incremento en el nmero de parmetros del modelo (Grupo, Grupo: Puntuacin) no mejora el ajuste del modelo base, y deberamos de aceptar el modelo de la interaccin. Sin embargo, no es una buena prctica llegar a conclusiones basadas en criterios de decisin estadstica construidos sobre el valor Chi cuadrado. Es necesario incorporar informacin sobre el tamao del efecto, que en el contexto de la Regresin Logstica es aportada por la diferencia en los coeficientes de determinacin. En este caso concreto el incremento en este ndice provocado por la incorporacin de parmetro en el modelo fue, 0,008. - 187 -
Regresin logstica Creo que mi estmago es demasiado grande Creo que mis muslos son demasiado gruesos Creo que mi estmago tiene el tamao adecuado Estoy satisfecho con mi cuerpo Me gusta mi trasero Creo que mis caderas son demasiado anchas Me siento hinchada despus de una comida normal Creo que el tamao de mis muslos es adecuado Creo que mi trasero es demasiado grande Creo que mis caderas tienen el tamao adecuado 15,49 27,26 39,25 6,16 4,51 2,55 1,19 20,51 1,26 4,95 <.001 <.001 <.001 <.001 0,10 0,28 0,55 <.001 0,53 0,08 0,008 0,012 0,019 0,002 0,002 0,001 0,001 0,008 0,001 0,002 -0,10 0,26 0,05 0,02 0,12 0,09 -0,09 0,25 0,00 0,05
Uno de los acercamientos ms interesantes y prometedores en el anlisis y estudio del funcionamiento diferencial (al igual que en multitud de anlisis) descansa sobre la descripcin grfica de los datos. Un grfico que plasme las diferencias condicionadas al nivel de habilidad de las medias de respuesta en funcin de los grupos ofrece informacin fcil de entender, fcil de comunicar y fcil de interpretar. Este tipo de representacin ofrece informacin sobre la magnitud y sentido de las diferencias existentes entre dos grupos a lo largo de
- 188 -
- 189 -
- 190 -
Media tem
Media tem
Mujer Varn
Mujer Varn 1 2 3 4 5 6 7 8
Nivel de Puntuacin
Nivel de Puntuacin
Media tem
Media tem
Mujer Varn
Mujer Varn 1 2 3 4 5 6 7 8
Nivel de Puntuacin
Nivel de Puntuacin
Me gusta mi trasero
4 4
Media tem
Media tem
Mujer Varn
Mujer Varn 1 2 3 4 5 6 7 8
Nivel de Puntuacin
Nivel de Puntuacin
- 191 -
- 192 -
9.1
Las pruebas de este epgrafe son aplicables a variables mtricas y obviamente estn destinadas a valorar cuestiones que involucran a las medias. Nos podemos plantear dos tipos de cuestiones distintas; Se puede mantener, una vez observados los datos, que la media de la poblacin en la escala de insatisfaccin corporal tiene un valor determinado digamosX? Existen diferencias entre dos grupos (por ejemplo chicos y chicas) en insatisfaccin corporal? Por ejemplo, supongamos que hemos aplicado Eating Disorder Inventory3 a un grupo de bailarinas de ballet y que se conoce la media en la escala de bulimia en la poblacin general. Una hiptesis a demostrar podra ser que este colectivo presenta una media en la escala de bulimia ms alta que el resto de la poblacin. Alguien podra pensar que es suficiente con calcular la media de nuestros datos y compararla con el valor de (media poblacional). Ahora bien, la conclusin obtenida con esta comparacin slo sera aplicable a esa muestra de sujetos pero el investigador lgicamente pretende la generalizacin. La prueba estadstica pertinente es la aplicacin de la prueba de comparacin de una media observada (el valor de la media de la muestra) a una media terica (el valor conocido de la media en la poblacin general). El segundo tipo de cuestin tiene que ver con la comparacin de medias observadas en dos grupos o muestras distintas. Siguiendo con la aplicacin del Eating Disorder Inventory-3 podramos preguntarnos por la diferencia en la escala de satisfaccin corporal entre chicos y chicas. Podramos sostener la hiptesis de que estas ltimas estn ms insatisfechas con su cuerpo que - 193 -
Continuando con el ejemplo de las bailarinas de ballet, supongamos que nuestro conjunto de datos procede de ese colectivo (976 chicas) a las que se ha administrado Eating Disorder Inventory, y que la media en la escala de bulimia en la poblacin general () es 3,30. Nos podramos preguntar si el colectivo de bailarinas de ballete punta ms alto en la escala de bulimia que el conjunto de la poblacin: La hiptesis nula sera: H0: =3,30 y la hiptesis alterna, H1: >3,30 La media en la escala de bulimia de las bailarinas ( x ) es 3,72; Este valor es ms alto que el poblacional. La diferencia entre el grupo de bailarinas (3,72) y la poblacin (3,30) es 0,42. Ahora bien, podemos considerar estadsticamente significativa esta diferencia? Para saberlo necesitamos aplicar la prueba de t de una muestra. La expresin que permite obtener el estadstico t de significacin es:
t
Donde,
x s/ N
media muestral
- 194 -
- 195 -
9.1 Figura. Prueba de comparacin de una media observada a una terica. Rcommander
En la ventana emergente que se abre con esta opcin del men seleccionaremos la variable de inters (B es el nombre adjudicado a la variable Bulimia). Deberemos escribir el valor hipottico (3,30) y seleccionaremos el tipo elegido de hiptesis alterna. Tambien podemos especificar el nivel de confianza elegido (1-). En Rcommander el valor por defecto es 0,95. El nivel de confianza servir para el clculo del correspondiente intervalo de confianza para la media. El valor de t obtenido con Rcommander 2,0319 y el nmero de grados de libertad (degrees of freedom, df) son 901 (n-1= 902-1 = 901; N es el nmero de casos vlidos en la variable bulimia), y el grado de significacin (p-value) es 0,04245. Por ltimo aparece la conclusin de la prueba de decisin estadstica: true mean is not equal to 3.30; Esto es, se rechaza la hiptesis nula y en consecuencia se acepta la hiptesis alterna.
7.3 7.4
- 196 -
> t.test(Edi.data$B, alternative='two.sided', mu=3.30, conf.level=.95) One Sample t-test data: Edi.data$B
t = 2.0319, df = 901, p-value = 0.04245 alternative hypothesis: true mean is not equal to 3.3 95 percent confidence interval: 3.310151 3.884971 sample estimates: mean of x 3.597561
En la salida de Rcommander
confianza. El lmite inferior es aqu 3,310151 y el lmite superior 3,884971. Qu quiere decir esto? A la luz de los datos, la media de la poblacin de la que proceden los mismos () estar comprendida, con un nivel de confianza del 95%, entre estos dos valores. Nuestra hiptesis para era 3,30, y este valor queda fuera de stos lmites por lo que no es un valor asumible para la media poblacional. 9.1.2 Comparacin de dos medias
Veamos ahora cmo contestar a la pregunta de si hay relacin entre el sexo y la insatisfaccin corporal, ms especficamente, si esta ltima es mayor en las mujeres que en los varones. Las medias en la escala de insatisfaccin corporal de chicos y chicas (Estadsticos >Resmenes >Tablas de estadsticas) son xe = 15,71 y xg .= 8,09. La diferencia es por tanto 7,62.
- 197 -
x1 x2 s*2 N1 s*2 N2
Donde,
x1
x2
*2
2 N1 1 s12 N2 1 s2 N1 N2 2
S12 varianza de la primera muestra S22 varianza de la segunda muestra N1 nmero de sujetos de la primera muestra N2 nmero de sujetos de la segunda muestra
En el numerador tenemos de nuevo una diferencia, en este caso entre dos muestras observadas o muestrales, y el denominador es una estimacin del error de muestreo de la diferencia muestral. Los grados de libertad (gl) del estadstico estarn comprendidos entre N1-1 y N2-1 y su valor viene dado por la frmula de Welch (Welch, 1938): - 198 -
gl
s12 N1 s12 N1 1 N1 1
2
2 s2 N2
1 N2
2 s2 1 N2
Donde, S12 varianza de la primera muestra S22 varianza de la segunda muestra N1 nmero de sujetos de la primera muestra y N2 nmero de sujetos de la segunda muestra.
A partir del valor de t se obtendr el grado de significacin, es decir la probabilidad asociada con el valor t. El grado de significacin (p) evala la probabilidad de la diferencia observada en los datos en el caso de que la hiptesis nula fuese cierta, es decir, si efectivamente las dos poblaciones de hombres y mujeres tuvieran medias idnticas en la escala de insatisfaccin corporal (
1 2 ).
En la ventana emergente seleccionaremos la variable que define los grupos (sexo) y la variable cuyas medias queremos comparar (insatisfaccin corporal; IC). Elegiremos tambien el tipo de hiptesis alternativa y el nivel de confianza, as como la suposicin acerca de la igualdad de varianzas en los grupos. En este ejemplo seleccionamos Diferencia>0 y dejamos las ltimas dos opciones por defecto de Rcommander; esto es, nivel de confianza 0,95 y grupos con varianzas distintas.
- 199 -
9.4 Figura. Seleccin de variables y opciones para la prueba de comparacin de dos muestras independientes
> t.test(IC~SEXO, alternative='greater', conf.level=.95, var.equal=FALSE, + data=Edi.data) Welch Two Sample t-test data: IC by SEXO t = 12.2259, df = 905.177, p-value < 2.2e-16 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 6.59255 Inf sample estimates: mean in group chica mean in group chico 15.714286 8.095694
En la salida de Rcommander se recogen el valor del estadstico t (12,2259), los grados de libertad (905,177) y el grado de significacin (pvalue =2,2e-161).
- 200 -
x1 x2 s*2 N1 s*2 N2
Donde,
x1
x2
s*2
2 N1 1 s12 N2 1 s2 N1 N2 2
S12 es la varianza de la primera muestra y S22 la varianza de la segunda muestra N1 nmero de sujetos de la primera muestra y N2 nmero de sujetos de la segunda muestra.
Los grados de libertad de este estadstico son procedimiento de obtencin del anlisis en explicado anteriormente. Rcommander
N1 N2 2 . El
es idntico al
- 201 -
xd d sd / N
Donde
xd
d
Los grados de libertad del estadstico son N-1. Por ejemplo supongamos que deseamos indagar en la conformidad de la poblacin con su peso, concretamente si el que se declara como peso ideal es inferior al peso real. Los sujetos de nuestra base de datos han contestado a las dos cuestiones por lo que podemos utilizar la prueba descrita. Escogemos la opcin adecuada en Rcommander, Estadsticos> Medias>Test t para datos relacionados, y en la ventana emergente debemos seleccionar las variables a comparar (PESO y PESIDEAL), el tipo de hiptesis alternativa y el nivel de confianza
- 202 -
9.5 Figura. Seleccin de variables y opciones para la prueba de comparacin de datos relacionados.
t = -8.8598, df = 404, p-value < 2.2e-16 alternative hypothesis: true difference in means is less than 0 95 percent confidence interval: -Inf -2.138298 sample estimates: mean of the differences -2.627160
La media observada de las diferencias entre las variables (mean of the differences) es -2,6271, y el valor t correspondiente a esta magnitud es -8,85; Cmo el nmero de diferencias es 405, los grados de libertad son 404 (df; 405-1=404) y el grado de significacin es extraordinariamente pequeo (p- value=2,2e-16). Por lo tanto, tenemos evidencia emprica para apoyar la hiptesis de que el peso ideal est por debajo del peso real. El intervalo de confianza del 95% indica que en la poblacin el peso ideal estar 2,62 kg por debajo del real.
- 203 -
La prueba ms comn de comparacin de varianzas en dos grupos es la prueba F, aunque existen otras con el mismo propsito (por ejemplo la prueba de Lvene). Este test, el test F, se aplica en la mayora de los casos como paso preliminar a la prueba t de Student de comparacin de medias, con el objeto de verificar si las varianzas son iguales. El estadstico F se obtiene mediante la razn entre las varianzas observadas en las muestras.
s12 2 s2
La probabilidad asociada a F (grado de significacin) se puede obtener de inmediato mediante la distribucin Fde probabilidad; los grados de libertad son N1-1 y N2-1. Para comprobar si la variable Bulimia tiene la misma variabilidad en las poblaciones de mujeres y varones utilizaremos la opcin Estadsticos >Varianzas>Test F para dos varianzas. En la ventana emergente se elige la variable que define los grupos a comparar (SEXO) y la variable mtrica cuyas varianzas medidas en ambos grupos se van a comparar (B Bulimia). Se marca la clase de hiptesis (por defecto bilateral) y el nivel de confianza (dejamos el valor 0,95).
- 204 -
> var.test(B ~ SEXO, alternative='two.sided', conf.level=.95, data=Edi.data) F test to compare two variances data: B by SEXO
F = 0.8926, num df = 480, denom df = 420, p-value = 0.2284 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.7411259 1.0738893 sample estimates: ratio of variances 0.8926434
Rcommander ofrece el valor de F (0,8926), los grados de libertad (480 y 420), el grado de significacin (0,2284), el tipo de hiptesis alterna y el intervalo de confianza para la razn de varianzas
2 1 2 2
En consecuencia no tenemos evidencia de que las varianzas sean diferentes en los dos grupos.
- 205 -
La prueba adecuada para comparar las varianzas de ms de dos grupos es la prueba de Bartlett. Para ejecutarla en RCommander, la opcin a elegir es Estadsticos>Varianzas> Test de Bartlett, y la salida (al igual que en casos anteriores) incluye el estadstico, los grados de libertad y el grado de significacin.
9.2
El recuento de frecuencias o las proporciones son estadsticos adecuados para las variables categricas (por ejemplo, sexo, trabajo, estado civil) y de las variables numricas categorizadas. Por ejemplo, a partir de las puntuaciones en la escala de insatisfaccin corporal (IC) se han obtenido dos grupos de sujetos, los que tienen baja insatisfaccin corporal y los que tienen alta insatisfaccin corporal; esta categorizacin puede utilizarse como criterio clnico. Para trabajar con las variables categricas se utilizan las tablas de contingencia. En las filas figura la insatisfaccin corporal, y en las columnas la edad. Tenemos dos categoras de la primera (SI/NO) y tres categoras para la edad (menores de 14 aos, entre 14 y 16 aos y mayores de 16 aos). Para obtener dos grupos de la variable Insatisfaccin Corporal se ha utilizado 18 como punto de corte. Este valor separa los dos grupos, 0 y 1. Cada combinacin de valores para estas dos variables es una celda. Por ejemplo, la celda que correponde a los sujetos menores de 14 aos con insatisfaccin corporal contiene el nmero 67. Esta tabla es 2 x 3; est compuesta por 2 filas y 3 columnas. Edad Insatisfaccin corporal - 206 >14 aos 14-16 aos 16 aos< Total
Supongamos que estemos interesados en los sujetos menores de 14 aos que estn insatisfechos con su cuerpo. Su proporcin es simplemente 67 dividido por el total de casos (900) o sea 0,074. Es decir 7,4% de estudiantes son menores de 14 aos y estn insatisfechos con su cuerpo. Para cada celda se obtiene una proporcin, dividiendo la frecuencia por el tamao total de la muestra. Todas estas proporciones configuran la distribucin conjunta de las dos variables categricas. Distribuciones marginales La distribucin de una sola variable en una tabla de doble entrada, es la distribucin marginal. Hay dos distribuciones marginales, una por cada variable categrica. Segn nuestros datos hay 651 sujetos insatisfechos con su cuerpo y 249 insatisfechos. corporal es, NO Proporcin 0,723 SI 0,277 La distribucin marginal de la variable insatisfaccin
La segunda distribucin marginal para este ejemplo es la correspondiente a la variable edad, >14 aos Proporcin 0,336 14-16 aos 0,426 16 aos < 0,238
- 207 -
NO Proporcin 77,8%
SI 22,1%
- 208 -
NO Proporcin 68,5%
SI 31,45%
Si comparamos las distribuciones condicionales podemos entrever la naturaleza de la asociacin entre la edad y la insatisfaccin corporal. En este conjunto de datos en el grupo de mayores de 16 aos tienen ligeramente ms probabilidad de estar insatisfechos con sus cuerpos que los que estn entre 14 y 16 aos y mucha ms probabilidad que los nios. Estos ltimos, los nios, muestran el porcentaje ms bajo de insatisfaccin corporal. Los datos apuntan a que la insatisfaccin corporal se incrementa con la edad. RCommander permite obtener las distribuciones conjuntas, marginales y condicionales; Para ello se elegir la opcin Estadsticos>Tablas de contingencia>Tabla de doble entrada. En la ventana emergente elegiremos las variables fila y columna; insatisfaccin corporal y edad (IC_RE y EDAD_RE). Adems se pueden especificar los porcentajes a calcular (por filas, por columnas, totales, sin porcentajes), los tests de hiptesis a realizar (Chicuadrado, test exacto de Fisher), los componentes del estadstico Chi-cuadrado y las frecuencias esperadas. El anlisis puede realizarse sobre todos los casos o bien sobre un subconjunto de ellos utilizando la expresin de seleccin adecuada.
- 209 -
> colPercents(.Table) # Column Percentages EDAD_RE IC_RE 0 1 <14 14-16 77.9 22.1 70.1 29.9 >16 68.5 31.5
La opcin Porcentajes totales permite obtener la distribucin conjunta. En la columna y fila rotuladas Total aparecen las distribuciones marginales de la insatisfaccin corporal y de la edad respectivamente.
> totPercents(.Table) # Percentage of Total <14 14-16 0 1 26.2 7.4 12.8 >16 Total 72.3 27.7 7.4 29.9 16.2
- 210 -
La adopcin de conclusiones estadsticas derivadas del etsudio de proporciones hace necesario el uso de pruebas de significacin. La hiptesis nula (Ho) de inters en una tabla de doble entrada es que no existe asociacin entre la variable fila y la variable columna. En el ejemplo anterior consistira en afirmar que las variables insatisfaccin corporal y edad no estn relacionadas. La hiptesis alterna H1 consistira en la afirmacin de que s existe una asociacin entre las dos variables. La hiptesis alternativa no especifica una direccin concreta para la asociacin, no la podemos describir como una hiptesis unilateral o bilateral, ya que incluye todas las clases posibles de asociacin. En nuestro ejempo, la hiptesis Ho de que no existe asociacin es equivalente a la afirmacin de la que las distribuciones de insatisfaccin corporal en los tres grupos de edad son iguales. Frecuencias esperadas Para contrastar la hiptesis nula se comparan las frecuencias observadas con las frecuencias esperadas bajo el supuesto de que la hiptesis nula es verdadera. Cmo se obtienen las frecuencias esperadas? Si observamos los porcentajes en el margen derecho de la tabla veremos que 27,7% (todos los grupos de edad juntos) estn insatisfechos con su cuerpo. Si la hiptesis nula de no diferencias por gnero fuese cierta, esperaramos que este porcentaje global se aplicara a todos los grupos de edad por igual. Esto es, esperaramos un 27,7% de insatisfechos en el grupo de menores de 14 aos. En la tabla veamos que el nmero de sujetos en este grupo es 303. La frecuencia esperada es por tanto
- 211 -
Frecuencias esperadas
Test de Chi cuadrado Para verificar la hiptesis nula, esto es, que no existe asociacin entre las variables fila y columna, se utiliza un estadstico que compara el conjunto completo de frecuencias observadas con el conjunto de frecuencias esperadas. Consiste en hallar las diferencias entre la frecuencia osbservada y su correspondiente valor esperado y elevar esta diferencia al cuadrado. Una diferencia grande es menos significativa si procede de una celda donde se espere una frecuencia con valor muy alto, por ello se dividide cada diferencia al cuadrado por la frecuencia esperada. Finalmente se agregan los valores correspondientes a todas las celdas.
2
> .Test$expected # Expected Counts EDAD_RE IC_RE <14 14-16 >16 0 219.17 277.76 154.07
- 212 -
Cuanta ms diferencia haya entre las frecuencias observadas y las esperadas mayor ser el valor del estadstico Chi cuadrado. Valores altos de Chi cuadrado proporcionan evidencia contra la hiptesis nula. El nmero de filas y de columnas determinan los grados de libertad de este estadstico ((l-1)(z-1)). Las distribuciones chi cuadrado son una familia descrita por un parmetro; los grados de libertad (gl; df; degree of freedom). Se escribir
2 gl
. Las
distribuciones Chi cuadrado toman nicamente valores positivos y son sesgadas a la derecha:
9.8 Figura. Distribuciones Chi cuadrado con diferentes grados de libertad (1,3,10 y 20)
- 213 -
mayor. Adems es ms preciso para tablas mayores que 2x2. Para que la aproximacin sea adecuada se requiere, en las tablas de 2x2 que las frecuencias esperadas de todas las celdas sean al menos 5. En Para el caso de tablas mayores se requerir que la media de frecuencias esperadas sea al menos 5. El valor p para el test chi cuadrado es P
2 ( f 1)( c 1)
X 2 . RCommander proporciona el
valor de X 2 y el valor de p marcando la opcin Test de independencia Chi-cuadrado en la ventana de opciones. En nuestro ejemplo el valor del estadstico chi-cuadrado es 7,1976, el nmero de grados de libertad de la distribucin es (3-1)(2-1) = 2 , y el valor de p es 0,02736.
> .Test Pearson's Chi-squared test data: .Table
El test chi cuadrado confirma que los datos contienen evidencia contra la hiptesis nula. Los sujetos de los tres niveles de edad son distintos en insatisfaccin corporal, pero no dice cmo o en qu grado difieren. Hay que completar el test estadstico con una descripcin que explique la clase de relacin presente en los datos. Si se obtienen los componentes del estadstico Chi cuadrado, podemos comprobar aquellas celdas que contribuyen en mayor medida a la discrepancia
- 214 -
> round(.Test$residuals^2, 2) # Chi-square Components EDAD_RE IC_RE <14 14-16 >16 0 1.29 1 3.38 0.28 0.42 0.72 1.11
67 83,3 83,3
9.3
Cuando se precisa la comparacin entre ms de dos grupos se podra tomar todas las posibles parejas y aplicar a cada una de ellas el test t. Sin embargo este procedimiento conducira a un incremento grave del error Tipo I. El anlisis de varianza (ANOVA o AVAR) permitir probar la significatividad de las diferencias entre varias medias sin que se incremente el error de tipo I. El mtodo ANOVA bsicamente consiste en dividir varianza de la variable dependiente en dos o ms componentes, cada uno de los cuales puede ser atribuido a una fuente identificable.
Supongamos que nos interesa averiguar si los tres diferentes grupos de edad (menores de 14 aos, 14-16 aos y mayores de 16 aos) son iguales en insatisfaccin corporal, o si por el contrario las medias son diferentes. A la - 215 -
- 216 -
a)
b)
9.9Figura. Diferentes variabilidades intragrupo. Diagramas de cajas
Ahora bien, se necesitar una prueba estadstica que permita hacer esta comparacin de modo ms preciso. Los tests vistos hasta aqu se basan en el ratio entre diferencias de alguna clase con alguna medida de la variabilidad muestral; del mismo modo en el ANOVA las diferencias entre las medias figurarn en el numerador, y el trmino de comparacin (en el denominador) se basar en la desviacin estndar subyacente, esto es, en la variabilidad dentro de los grupos.
9.4
Si la hiptesis nula fuese cierta, y todos los grupos procedieran de una sola poblacin, con una sola media (), cada media del grupo sera un estimador de esa media y tendramos estimaciones diferentes e independientes de esa media (en nuestro ejemplo tendramos tres estimaciones). Trataremos esas medias estimadas como observaciones, y calcularemos su varianza muestral ( sx 2 ). Esta varianza es la medida que utilizaremos para evaluar la medida en que las medias de los diferentes grupos estn alejadas entre s. Es obvio que cuanto ms prximos estn los valores de las medias, menor ser la varianza y a la inversa, a medida que estn ms alejados la varianza ser mayor.
- 217 -
14-16 12.89
Cmo podemos tener idea de si se trata de un valor alto o bajo? Para saberlo necesitamos un modelo, y el modelo se basa en la hiptesis nula de que las medias son iguales. Esto es, que la media de insatisfaccin corporal siempre es la misma independientemente del grupo de edad: Ho:
1= 2= 3
) es
- 218 -
cierta o falsa. Esta estimacin se obtiene a partir de una combinacin de las varianzas obtenidas dentro de cada grupo. Esta cantidad se denomina media cuadrtica del error o media cuadrtica intra (o dentro) de los grupos (MCE). Las desviaciones estndar pueden obtenerse desde la misma ventana que hemos utilizado para obtenener el listado de las medias, Estadsticos> Resmenes>Resmenes numricos seleccionando la opcin
Desviacin tpica. Rcommander nos proporciona las desviaciones estndar en la variable insatisfaccin corporal. Elevando al cuadrado estos valores obtenemos las varianzas; 111,87; 111,99 y 93,412
sd <14 >16 10.57 9.66 14-16 10.58 n NA 184 14 184 16 184 8
*2
s*2
184 1 10,5772 184 1 10,5832 184 1 9,6652 105,762 184 1 184 1 184 1
- 219 -
9.4.1.a
Estadstico F
; La primera
se basa en las diferencias entre las medias de los grupos. Si las medias son iguales (Ho cierta), esta varianza estimar . Si Ho no es cierta, dar
sistemticamente un valor mayor. La otra estimacin se basa nicamente en la variacin dentro de los grupos en torno a sus propias medias, es independiente de la hiptesis nula. Por lo tanto si Ho es cierta, estos dos valores, MCE y MCG estimarn
2
los dos estimadores tender a ser mayor que 1. La estimacin MCG ser sistemticamente mayor, (reflejando la diferencia en las medias), mientras que MCE no se ver afectada; el ratio tender a ser mayor que 1. El ratio MCG/MCE es el estadstico F, y cuando Ho es cierta sigue una distribucin F que depende de dos nmeros; los grados de libertad del numerador y los grados de libertad del denominador. En el caso de ANOVA de un factor con K grupos, los grados de libertad para el numerador son K-1 y para el denominador N-K. El test F es de una cola puesto que cualquier diferencia en las medias incrementa el estadtico F. Diferencias grandes en los grupos se traducen en un estadstico mayor. El test ser significativo si el ratio F es suficientemente grande y su probabilidad asociada (p) suficientemente pequea. En nuestro ejemplo este ratio es,
MCG MCE
- 220 -
9.4.1.b Modelo
El modelo de ANOVA de un factor intenta describir la puntuacin de un sujeto en la variable dependiente a partir de tres componentes: La media general de todas las poblaciones, que representa el efecto de los factores mantenidos constantes ( ), el efecto especfico atribuble a la variable independiente ( y el efecto de posibles variaciones aleatorias o residuales no contempladas (
k
ik
).Si tenemos K grupos y xik representa a la observacin i del grupo k el modelo establece:
- 221 -
DATOS Donde
AJUSTE
+ RESIDUAL
xik
en el modelo. En el modelo de ANOVA se asume que estas fluctuaciones o errores cumplen ciertas condiciones; los errores son normales, con media 0 e igual varianza para todos los grupos. Ser precisa la comprobacin del cumplimiento de estas condiciones para asegurar la adecuacin del anlisis.
La desviacin total de una puntuacin xik a la media general x se puede descomponer en dos partes; la desviacin de la puntuacin a la media de su grupo xk y la desviacin de la media del grupo xk a la media general x .
xik x
Esta idea queda
xik xk
xk x
Si en lugar de
nk
xik x
nk
xik xk
nk
xk x
i 1 k 1
i 1 k 1
i 1 k 1
- 222 -
Los trminos de esta ecuacin son sumas de cuadrados (SC); suma de cuadrados total (SCT), suma de cuadrados intergrupo (SCG) y suma de cuadrados del error (SCE).
xk
1 Nk
Ni i 1
xik
Los errores se estimarn mediante los residuales eik en torno a las medias muestrales.
xik xk o variacin
Para llevar a cabo el anlisis de varianza toda la informacin se organiza en una tabla que de modo estndar contiene las columnas fuentes de variacin, sumas de cuadrados, grados de libertad, medias cuadrticas, valor F y grado de - 223 -
de
Sumas
de
La fuente de variacin Modelo ofrece informacin relacionada con la variabilidad entre las medias de los grupos y Error da informacin relacionada con la variabilidad dentro de los grupos. TOTAL = MODELO+ ERROR Cada suma de cuadrados es una suma de desviaciones al cuadrado. Se utilizan habitualmente SCE, SCG, SCT, para designar las sumas de cuadrados (sums of squares) del error, de los grupos y total respectivamente. Cada suma de cuadrados mide una diferente fuente de variacin. SCT mide la desviacin entre cada observacin y la media global, xik
desviacin de las medias del los grupos en torno a la media global xk media de su grupo, xik
xk .
A cada suma de cuadrados se le asocia una cantidad denominada grados de libertad, (degrees of freedom, df). Dado que SCT mide la variacin de N observaciones en torno a la media general, los grados de libertad son N-1.
- 224 -
con K medias muestrales y sus grados de libertad son N-K. Para cada fuente de variacin se estima la media cuadrtica; este valor es la suma de cuadrados dividida por los grados de libertad.
En Rcommander el ANOVA de un factor se obtiene a travs de la opcin Estadsticos>Medias>Anova de un factor. Se seleccionan la variable que define los grupos o variable independiente (EDAD_RE) y la variable explicada o dependiente; esto es, la variable cuyas medias en los diferentes grupos vamos a comparar (en nuestro ejemplo IC). en este ejemplo trabajamos con un subconjunto;
- 225 -
La primera lnea de la tabla que proporciona Rcommander es la correspondiente al modelo, que en este caso incluye la variable independiente (EDAD_RE); La segunda fila es la correspondiente al residual. Se omite la fila correspondiente a la fuente de variacin total. Si la hiptesis nula es cierta, entonces no habr diferencias entre las medias de los grupos y la razn MCG/MCE se aproximar a 1. En nuestro ejemplo, MCG (Mean Sq) es 400 y MCE (Mean Sq) es 106; por tanto el valor del estadstico F es (400/106) 3,7813 y su grado de significacin 0,02339. Este resultado proporciona evidencia para rechazar la hiptesis nula; los grupos de edad en la poblacin no son iguales en insatisfaccin corporal. En definitiva, los datos apuntan a que existe una relacin entre las dos variables. Rcommander proporciona informacin adicional; la media de cada grupo (10,82; 10,58 y 9,66), la desviacin estndar (10,57; 10,58 y 9,66) y el nmero de sujetos por grupo (184). Comparaciones mltiples entre medias
- 226 -
- 227 -
Rcommander proporciona el grfico para los intervalos de confianza, que facilita la inspeccin de datos cuando el nmero de comparaciones es muy alto.
14-16 - <14
>16 - <14
>16 - 14-16
( -1 0 1 2
) 3 4 5 6
Linear Function
El anlisis de varianza de dos factores compara las medias de poblaciones clasificadas con arreglo a dos criterios de clasificacin diferentes, o las medias de respuesta en experimentos de dos factores. Al igual que en el modelo de un factor se asume que los datos son aproximadamente normales y que los grupos pueden tener diferentes medias pero tienen la misma desviacin estndar. Se utiliza de nuevo un estimador de la varianza comn y estadsticos F para los tests de significacin. La principal diferencia radicar en el trmino AJUSTE. El diseo de dos factores ofrece ventajas respecto al anterior, - 228 -
9.4.3.a Modelo
Designaremos con K al nmero de grupos o niveles del primer factor (Factor A) y con L al nmero de grupos o niveles del segundo factor (Factor B). En un diseo de dos factores cada nivel del primer factor (Factor A) se combina con cada nivel o grupo del segundo factor (Factor B) de modo que se compararn KxL grupos. El tamao muestral para el nivel k de A y el nivel l de B es Nkl. El nmero total de observaciones es N
Nkl .
Se asumen muestras independientes aleatorias simples de tamao nkl procedentes de KxL poblaciones normales. Aunque las medias poblacionales
kl
pueden ser diferentes, todas las poblaciones tienen la misma desviacin estndar. Tanto las medias poblacionales (
kl
( ) son
parmetros desconocidos. Si representamos por xikl la i-sima observacin de una poblacin que tiene el nivel k del factor A y el nivel l del factor B el modelo estadstico es:
xikl
=
kl
)kl
ikl
ikl
DATOS
AJUSTE
+ RESIDUAL
incluye en el modelo un nuevo trmino que recoge el efecto del segundo factor (
l ).La
xkl
1 Nkl
nikl k 1
desconocida muestrales;
s*2
Donde Nkl nmero de sujetos en el grupo kl, y Skl2 varianza del grupo kl
9.5
Si se tienen muestras independientes de KxL grupos, podemos concebir el problema inicialmente como un ANOVA de un factor con KL grupos. Cada media poblacional
kl
Las sumas de cuadrados y los grados de libertad pueden calcularse como en ANOVA unifactorial. La suma de cuadrados del modelo se calcula a partir de las desviaciones xkl
todas las observaciones. Los grados de libertad del modelo (gl) son KL-1. En el ANOVA de dos factores los trminos SCM y glm se descomponen en: un efecto principal de A (SCA; glA), un efecto principal de B (SCB; glB), y una interaccin entre ambos (SCAB; glAB). SCM = SCA + SCB + SCAB glm= glA+ glB+ glAB
- 230 -
La tabla incluye medias globales en fila y columna. Por ejemplo, la media de insatisfaccin corporal para todos los estudiantes entre 14 y 18 aos es 13,0. Para calcularlo,
Para obtener el grfico para representar las medias de los grupos debemos escoger la opcin Grficas> Grficas de las medias. A partir de este grfico se ve claramente que las chicas estn por encima en insatisfaccin corporal que los chicos, esto es, se aprecia un efecto principal para el sexo. Tambien se aprecia que los estudiantes entre 14 y 16 aos tienen mayor puntuacin en insatisfaccin corporal que los nios. En cuanto a los mayores de 16 aos, continan la tendencia ascendente en el caso de los chicos, mientras que las chicas estn por debajo del grupo de edad anterior. Los efectos principales pueden describirse por las diferencias entre las medias marginales. Por ejemplo la media para chicas es 15,7 mientras que para los chicos es 8,0. Este es el efecto principal de la variable sexo. El cuerpo de la tabla muestra que las diferencias en insatisfaccion corporal entre chicas y chicos para los tres grupos de edad son 5,3 9,3 y 7,2. Aunque la diferencia es ms acusada en el grupo de ms edad, la mayor parte de la informacin relativa a las diferencias por sexo se resumen por el efecto principal, la diferencia marginal de 7,7. De modo anlogo, el efecto principal de la edad queda resumido en las puntuaciones 10, 13 y 13,8. Ahora bien, el grfico pone de manifiesto que el efecto de la edad no es igual para chicos que para chicas. En el grupo de 14 a 16 aos la insatisfaccin es mayor que en el grupo de menores de 14, tanto para los chicos como para las chicas, si bien en el grupo de chicas el incremento es mucho ms acusado. Por otro lado, en el grupo de mayores de 16 aos, la - 232 -
- 233 -
La inferencia para el ANOVA de dos factores implica el clculo de los estadsticos F para cada uno de los efectos principales y para la interaccin. Los clculos se organizan en una tabla basada en la descomposicin de la variacin total. SCT = SCA + SCB + SCAB+SCE glt= glA+ glB+ glAB+ glE A partir de cada suma de cuadrados y sus grados de libertad se calcula la correspondiente media cuadrtica (MC=SC/gl.). La significacin de cada uno de los efectos principales y la interaccin se evala mediante un estadstico F que compara la variacin debida al efecto de inters con la variacin intra-grupo. El diseo general de la tabla es el siguiente: Fuente A B AB Error Total Grados de libertad I-1 J-1 (I-1)(J-1) N-IJ N-1 Sumas de cuadrados SCA SCB SCAB SCE SST Media cuadrtica SCA/ glA SCB/ glB SCAB/ glAB SCE/ gle SCT/ glT MCA/MCE MCB/MCE MCAB/MCE F
En el ANOVA de dos factores se plantean tres hiptesis nulas, referidas al efecto principal A, al efecto principal B y a la interaccin AB y cada una se contrasta con un estadstico F. Primero se examina el efecto de la interaccin, puesto que si existe sta puede condicionar la interpretacin del resultado de los efectos principales.
- 234 -
Para llevar a cabo ANOVA de dos factores eligiremos la opcin de Rcommander Estadsticos > Medias > ANOVA de mltiples factores.
En primer lugar introducimos el nombre que queramos dar al modelo (en nuestro caso AnovaEdadSexo), (IC).
> AnovaEdadSexo <- (lm(IC ~ EDAD_RE*SEXO, data=Edi.data))
> Anova(AnovaEdadSexo) Anova Table (Type II tests) Response: IC Sum Sq EDAD_RE SEXO EDAD_RE:SEXO Residuals 1318 12148 652 2 79267 894 Df 2 F value Pr(>F) 7.4349 0.0006275 *** 3.6779 0.0256584 *
- 235 -
La tabla ANOVA anterior muestra en la primera columna los nombres de los dos factores principales (EDAD_RE y SEXO), la interaccin entre ambos (EDAD_RE:SEXO) y los errores o residuales (Residuals). En la segunda columna figuran las sumas de cuadrados (Sum Sq); En la tercera podemos leer los grados de libertad (Df); luego aparece el valor F (F value), y por ltimo el valor de probabilidad que se le asocia o grado de significacin. El valor de p para los factores principales es muy bajo; A la derecha de estos valores se imprimen tres asteriscos, que sealan valores de significacin inferiores a 0,001. La interaccin tiene un grado de significacin (p) 0,025. Una vez generado el modelo, R lo incorpora como un objeto nuevo, con el nombre AnovaEdadSexo. Podemos elegir la opcin de la barra de men Modelos y la opcin Grficas> Grficas de los efectos para obtener el grfico siguiente:
EDAD_RE*SEXO effect plot
1 2 3
SEXO : Mujer
18
SEXO : Varn
16
14
IC
12 10 8 6 1 2 3
EDAD_RE
- 236 -
- 237 -
El fin ltimo de numerosos test o cuestionarios es la prediccin de un criterio. Cuando se quiere pronosticar el rendimiento acadmico, el xito laboral u otro tipo de conducta se utilizan medidas simples o combinadas que permitan una prediccin precisa. Aunque los contextos de prediccin son muchos y variados, en la sustitucin de un criterio por una variable (compuesto) predictor se persiguen simplicidad, sencillez y ahorro. Si para pronosticar una conducta futura o una conducta presente utilizamos tests o cuestionarios es necesario garantizar la relacin estrecha entre las inferencias derivadas de estos y el criterio a predecir para que la sustitucin quede justificada. El modelo de regresin lineal ofrece un marco terico que posibilita el estudio entre las relaciones test/criterio; su aplicabilidad depender en cada caso del cumplimiento de los supuestos del modelo por los datos. En el caso ms simple el modelo de regresin lineal explicara las relaciones entre una variable predictora y un criterio. En el contexto de la teora de tests, la variable predictora es la puntuacin obtenida en el test y la variable criterio es aquella variable que se desea predecir. La relacin entre ambas variables se conoce como coeficiente de validez del test.
Cov X , Y
XY X Y
Donde
El coeficiente de validez del test X, y Y, desviaciones tpicas del test y del criterio X Cov (X,Y), covarianza entre el test y el criterio.
XY
- 238 -
El modelo de regresin simple utiliza una sola variable predictora para el pronstico del criterio. En psicologa y educacin las predicciones se basan habitualmente en modelos ms complejos que utilizan como predictores un conjunto de puntuaciones obtenidas tras la administracin de varios tests o de la utilizacin de mtodos basados en la observacin, entrevistasSin embargo la comprensin de modelos ms complejos es ms sencilla una vez familiarizados con el modelo simple.
La utilizacin y aplicacin de un modelo matemtico implica la asuncin de varios presupuestos que en el caso del modelo de regresin simple se resumen en la relacin lineal entre la variable predictora y el criterio. Formalmente, es posible utilizar la ecuacin de una recta para explicar los efectos que producen sobre la variable dependiente (Y) los cambios en la variable predictora (X). Por ejemplo, en la siguiente ecuacin,
a bX
Y
De este modo,
X Y 0 2 1 5 2 8
2 3X
3 11
4 14
5 17
6 20
- 239 -
La interpretacin de los parmetros de la recta es clara a travs de la figura anterior: a. El parmetro a viene definido por el valor en la ordenada cuando la variable predictora es 0. En nuestro caso, a=2. Es el punto de corte de la recta en la ordenada. b. El parmetro b indica la pendiente de la recta y representa el incremento en la variable dependiente asociado al cambio de una unidad en la variable independiente (b=3).
Cuando el objetivo del investigador es profundizar en las relaciones observadas entre dos variables el primer paso es seleccionar el modelo adecuado para ello. El objetivo es resumir la informacin en un modelo matemtico. Para ello es habitual seguir una pauta que comienza con la recogida de datos (X e Y), y representar por medio de un diagrama de dispersin la distribucin de ambas. La informacin recogida grficamente es fundamental como fuente de informacin que gua la eleccin del modelo adecuado. En un diagrama de
- 240 -
En la figura anterior se muestran cuatro modelos diferentes de relacin entre variables. En la primera la relacin es lineal y positiva, a medida que se incrementan los valores de X se incrementan los valores de Y. La segunda representacin muestra una relacin lineal, intensa y negativa. A incrementos de X decrementos de Y. El tercer diagrama muestra la ausencia de relacin entre X e Y; los valores no parecen ajustarse a un patrn definido que pueda explicar su relacin. El cuarto diagrama muestra una relacin intensa y clara entre X e Y; sin embargo esta relacin no es lineal.
La estimacin de la recta de regresin tiene como objetivo ajustar una recta a la nube de puntos derivada de la representacin grfica de dos variables de modo que explique el mximo de la variabilidad observada en la variable criterio. Entre todas las posibles rectas que pueden ajustarse a la nube de puntos - 241 -
Criterio (Y)
Y=a+bX
Y Y
i i
e
i
Y=a+b X
Test (X)
X
i
Supongamos que un sujeto obtiene una puntuacin Xi en un test, y una puntuacin Yi, en el criterio. En el plano de la figura anterior puede apreciarse el punto (Xi, Yi). Si la relacin entre X e Y es lineal es posible ajustar una recta que explique esa relacin. Sin embargo, el ajuste de la recta nunca ser perfecto y siempre habr desviaciones entre los valores pronosticados (Yi) y los obtenidos (Yi). Esas desviaciones son errores de estimacin que el modelo elegido intentar minimizar. El procedimiento de estimacin utilizado es la estimacin mnimo cuadrtica que minimiza el cuadrado del errores,
N i 1
SCE
Yi Yi '
Resolviendo esa funcin, los parmetros de la recta de regresin quedaran definidos como:
- 242 -
a Y bX
Cov X , Y
2 X XY
Y X
Donde
Conocidos los parmetros de la recta de regresin, puede efectuarse la estimacin puntual de Yi; La recta de regresin puede formularse tambin del siguiente modo:
Yi ' Y
XY
Y X
XY
Y X
Xi
XY
Y X
Xi X
Donde
yi' bxi
y xy x
xi
Donde xi es la puntuacin diferencial en la variable predictora, XY, es la correlacin entre X e Y, X y Y, son las desviaciones estndar del predictor y del criterio
- 243 -
z 'y
XY X
El error de estimacin es la diferencia entre el valor pronosticado (Y) y el valor obtenido (Y) y su desviacin se conoce como error estndar de estimacin (
Y X).
YX
2 XY
Donde
Si en lugar de puntuaciones directas se utilizaran puntuaciones tpicas el error estndar de estimacin se expresara del siguiente modo:
ZY ' Z X
2 XY
Donde
El error estndar de estimacin permite estimar un intervalo de probabilidad en torno al valor pronosticado con un nivel de confianza predeterminado. Para ello se asume que el error estndar de estimacin se ajusta a una distribucin normal, que adems es homocedstica, es decir, equivalente para todo el continuo de valores de la variable predictora (X). El proceso seguira el procedimiento habitual de estimacin:
- 244 -
EMax
ZK
3.- Lmites del intervalo para Y. Los lmites del intervalo se obtendrn aadiendo y sustrayendo el error mximo a la puntuacin emprica correspondiente.
La estimacin mnimo cuadrtica ajusta una recta a la nube de puntos, la recta que genera la mnima desviacin de los errores cuadrticos. Sin embargo, el ajuste de la recta no garantiza que el modelo sea correcto para la interpretacin de los datos; es necesario analizar el ajuste entre el modelo y los datos por medio de ndices construidos con ese fin. Segn el modelo de regresin simple la puntuacin criterio (Y) se descompone en dos componentes; la puntuacin pronosticada (Y) y el error o desviacin (e).
- 245 -
e Y' Y o Y Y' e
Dado que la correlacin entre ambos elementos es nula (
2 y )
ye
=0), la
varianza de la variable compuesta Y es igual a la suma de las varianzas de sus componentes. Es decir, la varianza de la variable criterio ( la varianza derivada del modelo de regresin ( desviaciones o errores de estimacin (
2 y.x ). 2 y )
se descompone en
2 Y
2 Y'
2 YX
Utilizando el esquema ofrecido por el anlisis de varianza podramos resumir la informacin acerca de las fuentes de variacin en los datos por medio del modelo general segn el cual DATOS = AJUSTE + RESIDUAL. La variacin total en la respuesta Y se expresara por las desviaciones,
(Yi Y )
Yi ' Y
Yi Yi '
Las puntuaciones individuales varan en torno a su media a causa de la variacin dentro de la subpoblacin de respuestas para un valor determinado de Xi. Esta variacin est representada por los residuales Yi-Yi (diferencias entre el valor real y el pronosticado) que registran la dispersin de las observaciones en torno a la recta ajustada y por las diferencias asociadas a que las puntuaciones Yi corresponden a diferentes valores de la variable predictora X. El valor ajustado Yi estima la media de respuesta para un valor determinado Xi especfico. Las diferencias de estos valores respecto a la media reflejan la variacin en la media de respuesta debida a las diferencias en Xi. La desviacin global de cualquier Yi respecto a la media es la suma de esos dos componentes de desviacin.
- 246 -
(Yi Y )2 (1)
Yi ' Y (2)
Yi Yi ' (3)
Los trminos (1), (2) y (3) son las sumas de cuadrados total, del modelo y del error respectivamente; SCT=SCM+SCE. El trmino error indica las desviaciones a la recta y se traduce como residuales o fuente de variacin no explicada. Esta particin de la variacin de los datos en dos fuentes es el ncleo del anlisis de varianza. Los grados de libertad asociados con cada suma de cuadrados son N-1 para la suma de cuadrados total y 1 y N-2 para la suma de cuadrados del modelo y del error respectivamente. Se relacionan aditivamente:
glt
glm gle .
Para cada fuente, la razn entre la suma de cuadrados y los grados de
libertad es la media cuadrtica (MC). La media cuadrtica total MCT, se correspondera con la varianza muestral. La media cuadrtica del error MCE sera el estimador de
2
La hiptesis nula Ho :
MCM MCE
Cuando Ho es verdadera, este estadstico sigue una distribucin F con 1 grado de libertad en el numerador y N-2 grados de libertad en el denominador, que son los grados de libertad correspondientes a MCM y MCE.
1
Cuando
0 , MCM tiende a ser alto en relacin con MCE. Por tanto valores altos de
- 247 -
F MCM/MCE
Yi ' Y Yi Yi '
(Yi Y )2
Coeficiente de determinacin La descomposicin de la varianza es el origen de un ndice adimensional, el coeficiente de determinacin, que expresa el porcentaje de variabilidad de la variable criterio que es explicada por la variable predictora.
2 Y 2 Y 2 Y' 2 Y 2 YX 2 Y
El primer componente de la descomposicin anterior es el coeficiente de determinacin, R2. Cuando la relacin entre X e Y es perfecta, es decir, en ausencia de errores, el coeficiente de determinacin alcanzar el valor 1. Este coeficiente es el ndice ms utilizado en la determinacin del grado de aplicabilidad del modelo.
2 y' 2 y
R2
SCE SCT
- 248 -
R2 1
2 YX 2 y
Los lmites del coeficiente de determinacin son 0 y 1. Cuando la relacin entre dos variables es lineal, el coeficiente es equivalente al cuadrado de la correlacin de Pearson entre las variables ( coeficiente de determinacin.
2 XY ).
R2
2 XY
Adems del coeficiente de determinacin en el marco de la teora clsica de tests se han desarrollado varios ndices de adecuacin que son menos utilizados; entre ellos. Coeficiente de alienacin
2 XY
YX Y
E 1
2 xy
El modelo de regresin simple se construye sobre el modelo lineal que asume adems del carcter lineal de la relacin entre dos variables los siguientes supuestos: a.-La esperanza matemtica de los errores es 0
- 249 -
E(eij ) 0
b.- Homocedasticidad. La variabilidad observada en torno a la recta de regresin es constante para todos los valores de la variable predictora; es decir,
2 Y Xi o 2 e
son constantes.
E(eij , eih ) 0, j h
El conjunto formado por esas tres asunciones son conocidas como las condiciones de Gauss-Markov. d.- Normalidad de la distribucin. Aunque este supuesto no afecta a la estimacin mnimo cuadrtica es importante evaluarlo cuando el objetivo es la inferencia.
Yij ~
Y Xj
2 Y Xj
eij ~ N 0,
2 e
Como ejemplo de regresin simple se intentar predecir la Insatisfaccin corporal a partir de la variable predictora Baja Autoestima. Para ello trabajaremos nicamente con una submuestra formada por mujeres y aplicaremos el modelo de regresin lineal segn la siguiente secuencia: Estadsticos > Ajuste de modelos > Regresin Lineal. En la ventana de dilogo que nos abre esta opcin se seleccionaran la variable predictora o explicativa (Baja autoestima BA-) y la variable explicada o variable criterio (Insatisfaccin corporal IC-). La ventana Expresin de seleccin se cumplimentar con la condicin deseada; Expresin de - 250 -
Esos argumentos generan la siguiente funcin en la ventana de comandos, lm (linear model). El smbolo ~ puede interpretarse como IC explicada por medio de BA.
lm(formula = IC ~ BA, data = Edi.data, subset = SEXO == "chica")
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) BA --Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 8.3772 1.4607 0.6516 0.1036 12.86 14.10 <2e-16 *** <2e-16 ***
- 251 -
En primer lugar se ofrece informacin sobre la distribucin de los residuales (Residuals). Por definicin la media aritmtica de los errores es 0 y segn la salida de resultados la mediana de la distribucin no se aleja de ese valor (-0,37). Adems se ofrece informacin sobre el primer y el tercer cuartil de la distribucin que en valores absolutos y dada la simetra de la distribucin han de ser equivalentes. Los cuartiles estimados son -6,8 y 6,16. A continuacin se ofrecen las estimaciones de los parmetros de la recta de regresin (Coefficients). El valor interceptal o parmetro a es (Intercept) 8,37 y la pendiente de la recta es 1,4607. Segn esos parmetros la recta de regresin vendra dada por, IC = 8,37 + 1,46 BA Junto a los parmetros estimados se ofrecen los errores de estimacin para cada parmetro (Std. Error), los valores t asociados (t value) y sus correspondientes probabilidades (Pr(>|t|)). Los asteriscos junto a los valores ayudan a la interpretacin de los niveles de significacin, que vienen explicados al final de la tabla de coeficientes; por ejemplo un asterisco significa que el nivel de significacin se sita entre los valores 0,01 y 0,05. Rcommander ofrece tambin el error estndar de estimacin (Residual Standard Error), que se utiliza para la determinacin de intervalos de probabilidad en torno a la puntuacin pronosticada. Para ello es suficiente aplicar la siguiente frmula, Y Z SYX
- 252 -
- 253 -
10
20
30
10 BA
15
20
Rcommander ofrece adems intervalos de probabilidad para los parmetros de cualquier modelo; para ello basta seleccionar de la barra de mens la opcin Modelos>Intervalos de confianza, y especificar en la ventana de dialogo que se abrir, el nivel de confianza deseado.
2.5 % BA 97.5 %
La prediccin de variables en el campo de las ciencias sociales es un proceso complejo en el que intervienen un conjunto de variables predictoras cuyo peso en el pronstico es necesario evaluar. Ese es el objetivo del modelo de regresin mltiple, pronosticar los valores en una variable (la variable dependiente o variable criterio) a partir de un conjunto de variables predictoras por medio de un modelo entre cuyos parmetros se establece una relacin lineal. En un modelo de regresin mltiple intervienen los siguientes elementos: - 254 -
B0 B1 X1 B2 X 2 B3 X3 ... Bk X k
Donde Y es el criterio, , error de prediccin, B, los parmetros del modelo (pesos) Xi, variables predictoras.
En funcin del modelo el valor de un sujeto en la variable criterio dependera de K variables predictoras, K+1 pesos de regresin (B), y un error aleatorio ( ). Utilizando el algebra matricial el modelo podra expresarse del siguiente modo:
Y XB
Donde Y es el vector de puntuaciones de dimensiones (N 1), X, es la matriz de puntuaciones de las variables predictoras, de dimensiones N (K+1), en la que la primera columna est formada por 1. B, es el vector de parmetros del modelo de dimensiones ((K+1) 1) y , es el vector de errores aleatorios (N 1).
Es decir,
- 255 -
Y1 Y2 . . . YN 1 X11 1 X 21 X
1 2
. . .
N
B0 B1 . . . Bk
X12 X 22
X1k X 2k
1 X N1 X N 2
X Nk
Y1 Y2 . . . YN
1 X11 X12 1 X 21 X 22 . . . . . . . . . 1 X N1 X N 2
B0 B1 B2
. . .
N
Y1 B0 B1 X11 B2 X12 Y2 B0 B1 X 21 B2 X 22
1 2
YN
B0 B1 X N1 B2 X N 2
Cuando el modelo general es estimado en una muestra, la ecuacin de regresin se representa del siguiente modo,
- 256 -
y=Xb+e
Donde y es el vector criterio, e, es el vector residual, b, es la matriz de pesos estimados X, es la matriz de variables predictoras.
10.3.2 Supuestos
Los supuestos del modelo de regresin mltiple hacen referencia a los residuales, y dada la relacin entre estos y la variable criterio pueden ser expresados en funcin de sta ltima: a.- La linealidad es el supuesto principal del modelo. Las medias aritmticas de Y son una funcin lineal de los parmetros del modelo. En la representacin siguiente la figura de la izquierda cumple el supuesto de linealidad y la figura de la derecha no.
Y X1 , X 2 ,... X k
X1
X 2 ...
Xk
Y Y
Y Y
2 Y X1 , X 2 ,..., X k
- 257 -
Y~N
Y X1 , X 2 ,..., X k
Todos estos supuestos pueden resumirse en la siguiente especificacin expresada en trminos del error:
2
~ Nk 0,
Ik
Es decir, los errores siguen una distribucin normal de orden k, donde la media es un vector nulo (E( )=0) y la matriz de varianzas-covarianzas es (
2
IN), siendo IN una matriz identidad de orden N. En esa matriz los elementos fuera de la diagonal son 0 (las covarianzas entre errores son 0), ya que los errores son independientes, y los elementos de la diagonal principal (varianzas de error) son iguales (homocedasticidad). Si en lugar de por medio de los errores exponemos los supuestos del modelo de regresin mltiple en funcin de la variable criterio, obtendramos
Y NN X, 2IN
El mtodo de estimacin de parmetros por mnimos cuadrados minimiza el cuadrado de los errores de estimacin. Segn este procedimiento de estimacin la ecuacin matricial de obtencin del vector de parmetros sera:
- 258 -
b
Donde columna
X'X
X'y
b es el vector de pesos estimados, X, es la matriz sujetos variables predictoras con unos en la primera X, es la matriz transpuesta de X (XX)-1, es la matriz inversa de (XX) y, es el vector de puntuaciones en la variable criterio.
y' Xb
Y el vector de residuales,
e y Xb
Si se utilizan puntuaciones diferenciales en lugar de puntuaciones brutas, el parmetro B0 es 0 y la ecuacin de prediccin se expresara como:
b = C-1 Cxy xx
Donde b, es el vector de pesos, Cxx-1, es la inversa de la matriz de varianzas-covarianzas de las variables predictoras Cxy, es el vector de covarianzas entre las variables predictoras y el criterio.
La utilizacin de puntuaciones estandarizadas por su parte, situara a todas las variables en la misma escala facilitando as la interpretacin de los pesos, a los que se suele referir como pesos estandarizados :
1 R xx R xy
Donde
es el vector de pesos estandarizados Rxx 1, es la inversa de la matriz de correlaciones entre variables predictoras, Rxy, es el vector de correlaciones entre las variables predictoras y el criterio.
- 259 -
En el caso de la
regresin mltiple tambin hay un test F de ANOVA pero pone a prueba la hiptesis de que todos los coeficientes de regresin (a excepcin del intercepto) son 0. La forma general de la tabla ANOVA para la regresin mltiple es la siguiente: Fuente Modelo Error Total Grados de libertad K N-K-1 N-1 Sumas cuadrados de
2
F MCM/MCE
Yi ' Y Yi Yi '
(Yi Y )2
Los grados de libertad del modelo se incrementan de 1 a K reflejando el hecho de que se cuenta con K variables explicativas. En consecuencia los grados de libertad del error disminuyen en la misma cantidad. Las sumas de cuadrados representan fuentes de variacin. De nuevo se cumple que tanto las sumas de cuadrados como los grados de libertad son aditivos (SCT=SCM+SCE y glt=glm+gle).. El estimador de la varianza 2para nuestro modelo de nuevo viene dado por MCE de la tabla ANOVA; s2=MCE. La razn MCM/MCE es un estadstico F que sirve para verificar la hiptesis nula
Ho :
Contra la hiptesis alterna
...
H1 : al menos un
es distinto de cero
- 260 -
El coeficiente de determinacin es el indicador ms utilizado para la evaluacin del ajuste del modelo y por tanto para la evaluacin de su aplicabilidad. Se obtiene a partir de la descomposicin de la varianza en sumas de cuadrados, siendo el coeficiente de determinacin igual al primer sumando de la descomposicin:
SCT SCT
SCM SCT
SCE 1 SCT
Se interpreta como la proporcin de varianza estimada en el criterio por todas las variables implicadas en la prediccin; Sus valores estn limitados por el mximo terico de 1 y el mnimo terico de 0.
2
SCM SCT
Yi ' Y
(Yi Y )2
R2 1
SCE SCT
- 261 -
R2
2 y' y
b ' Cxy 2 Sy
' R XY
Donde b es la matriz transpuesta de los pesos de las variables predictoras, Cxy, es el vector de covarianzas entre las variables predictora y el criterio, S2y, es la varianza de la variable criterio , es el vector transpuesto de pesos beta Rxy, es el vector de correlaciones entre las variables predictoras y el criterio.
La correlacin mltiple o raz cuadrada del coeficiente de determinacin, siempre tendr valores positivos (0 R2yy 1), y puede interpretarse como el coeficiente de validez de un conjunto de variables tests- predictoras. Su valor nunca ser menor que el coeficiente de correlacin de cualquiera de las variables predictoras con el criterio.
R y'y
max rYj
El coeficiente de determinacin ajustado El coeficiente de determinacin es muy sensible al nmero de variables predictoras; a medida que aumentan stas lo hace su valor. Para compensar esa caracterstica se utiliza el coeficiente de determinacin corregido o ajustado. El coeficiente de determinacin ajustado tiene en cuenta el tamao de la muestra y el nmero de variables independientes. El coeficiente de determinacin ajustado es especialmente til para comparar modelos con diferente nmero de observaciones o variables independientes y su aplicacin es especialmente aconsejada en los estudios que incluyen tamaos muestrales reducidos. Su frmula en funcin de R 2 es:
- 262 -
2 aj
N 1 1 R2 N K 1
Cuando el nmero de observaciones es pequeo o bien el nmero de variables grande, el valor del ajuste Ra 2 incrementndose para n grande o p pequeo. Los coeficientes de determinacin sin corregir y el ajustado tienen el mismo valor cuando el modelo de regresin utilizado es el modelo simple. A medida que aumenta el nmero de variables predictoras el coeficiente ajustado va disminuyendo su valor con relacin al coeficiente no corregido. El coeficiente de determinacin ajustado aumenta a medida que disminuye la varianza residual, lo cual lo convierte en un ndice ms adecuado que el coeficiente de determinacin no corregido.
2 e 2 1 Raj 2 Y
reduce el valor de
R 2,
Una vez estimados los parmetros de regresin es importante evaluar su significacin estadstica. El estudio de la significacin se lleva a cabo en dos niveles diferentes; el primero evala la significacin de todo el modelo, y el segundo se centra en la significacin de cada uno de los parmetros de regresin estimados. La evaluacin total del modelo descansa en la evaluacin del coeficiente de correlacin mltiple. La hiptesis nula a contrastar iguala a 0 el valor del
- 263 -
Ry ' y N k 1 2 k 1 Ry ' y
Obtener intervalos de confianza para R2 no es sencillo mediante procedimientos analticos; Recientemente se han propuesto procedimientos de remuestreo (Simon, 1969) para obtenerlos (Lpez-Juregui y Elosua, 2004). Significacin de los predictores Se pueden obtener intervalos de probabilidad y tests de significacin para cada uno de los coeficientes de regresin ( i) del modelo estimado. Para cada uno de ellos la hiptesis nula a contrastar sera: H0: i=0 H1:
i
que se verifica por medio del estadstico t que sigue una distribucin de Student con N-K-1 grados de libertad.
bi ESbi
Donde bi es el parmetro de la regresin ESbi es el error estndar del estimador que puede estimarse por medio de,
y bi i 2 1 Ryy ' 1 R N k 1 2 i. y
A partir del valor del parmetro y de su error estndar de estimacin es posible establecer intervalos de probabilidad para los coeficientes de regresin estimados.
- 264 -
EMax
tc ESbi
3.- Lmites del intervalo para b. Los lmites del intervalo se obtendrn aadiendo y sustrayendo el error mximo al valor correspondiente.
LSup
bi' EMax
Linf
bi' EMax
Donde Lsup y Linf son los lmites superior e inferior del intervalo para el coeficiente regresor bi.
La utilizacin de Rcommander en la estimacin de un modelo de regresin mltiple se ilustrar evaluando un modelo que predice la Insatisfaccin Corporal a partir de las variables Baja Autoestima y Edad. Las opciones a seleccionar de la barra de mens son: Estadsticos>Ajuste de modelos>Regresin Lineal. En este ejemplo la variable pronosticada (criterio) es la insatisfaccin corporal (IC) y las variables predictoras son la edad y la baja autoestima (EDAD, BA). Utilizaremos para el anlisis una submuestra del conjunto de datos formada ntegramente por mujeres.
- 265 -
En ella se especifica que se desede explicarse la variabilidad en Insatisfaccin Corporal (IC) por medio de 2 variables, la baja autoestima (BA) y la edad (EDAD). El modelo de regresin generar un objeto que ha sido asignado a IC.BAEDAD.
Call: lm(formula = IC ~ BA + EDAD, data = Edi.data, subset = SEXO == "chica") Residuals: Min -19.8991 1Q -6.9437 Median -0.4725 3Q 5.7241 Max 25.0760
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) BA EDAD --Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 3.0660 1.4626 0.3490 2.4562 0.1040 0.1563 1.248 14.066 2.233 0.2126 <2e-16 *** 0.0261 *
- 266 -
En primer lugar, la salida muestra informacin sobre la distribucin de los residuales para este modelo. Los valores mostrados permiten obtener una primera impresin sobre la simetra de los errores en torno a su valor medio terico. La mediana de la distribucin es -0,4725, y el primer y tercer cuartil de la distribucin tienen como valores -6,9437 y 5,7241. A continuacin se muestran los valores estimados de los coeficientes de regresin (Estimate), su error estndar (Std. Error) y las pruebas de presenten coeficientes significativos al 5%. Los niveles de significacin asociadas (t value; pr(>|t|). Las dos variables incluidas en el modelo significacin para las variables baja autoestima (p<0,001) y Edad (p=0,0278) muestran que su inclusin en el modelo aporta informacin relevante sobre la variable a pronosticar. Es importante interpretar correctamente el significado de las pruebas para cada coeficiente. El valor t ofrece informacin sobre el cambio sufrido por el modelo si se elimina el efecto de la variable que se est evaluando y se deja el resto de variables tal y como estn definidas en el modelo. La prueba t no permite evaluar la significacin de las variables en un supuesto modelo reducido. El contraste de la hiptesis nula se efecta utilizando el estadstico t.
bi ESbi
Para estimar un intervalo de probabilidad para los parmetros estimados se utiliza (bj tcESbj). Donde ESb j es el error de estimacin del parmetro y tc es el valor crtico de la distribucin de Student con (N-K-1) grados de libertad - 267 -
> Confint(IC.BAEDAD, level=.95) 2.5 % BA EDAD 97.5 % (Intercept) -1.76143597 7.8935052 1.25823896 1.6669811 0.04179919 0.6561753
Por otro lado la evaluacin conjunta del modelo es significativa (F(2,4355) = 103,1; p<0,001)) es decir la informacin aportada por las variables incluidas permite predecir la variabilidad mostrada en la Insatisfaccin corporal. Es importante combinar la informacin ofrecida por las pruebas de significacin t para cada coeficiente con la tabla ANOVA para la regresin. De hecho, es fundamental estudiar la tabla ANOVA del modelo de regresin mltiple. Para ello las opciones de Rcommander seran Modelos > Test de hiptesis > Tabla ANOVA.
- 268 -
31811 438
La informacin aportada reitera en este caso el resultado anterior. La incorporacin de las dos variables predictoras es relevante en el pronstico de la variable dependiente Insatisfaccin Corporal. Con las estimaciones efectuadas se puede reflejar la ecuacin de prediccin del siguiente modo: IC=3,06+1,46 BA+0,34 EDAD De acuerdo al modelo, el valor pronosticado en Insatisfaccin Corporal a una chica de 13 aos que tiene un nivel de autoestima igual a 13, sera IC=3,06+1,46 5+0,34 13=14,78
El valor del coeficiente de determinacin (Multiple R squared) del modelo estimado es 0,3177 y el coeficiente de determinacin ajustado (Adjusted R-squared) tiene un valor de 0,3146.
Rcommander incorpora varias funciones grficas de gran utilidad en el estudio del cumplimiento de los supuestos en que se basa la regresin mltiple.
- 269 -
lm(IC ~ BA + EDAD)
Residuals vs Fitted
Standardized residuals
378 171 113
30
Normal Q-Q
3
171 378 113
20
Residuals
10
-20 -10
-2
457
-1
299
-3 -2 -1 0 1 2 3
10
15
20
25
30
35
Fitted values
Theoretical Quantiles
Scale-Location
Standardized residuals 1.5 Standardized residuals 2 3
378 171 113
299
1.0
0.5
-3 -2 -1
305
0.0
10
15
20
25
30
35
Fitted values
Residuos y valores ajustados (Residuals vs Fitted) Muestra el diagrama de dispersin referido a los modelo y a los valores valores pronosticados por el residuales. La existencia de patrones no-
aleatorios podra indicar correlaciones significativas entre el modelo y los residuales lo cual incumplira una de los supuestos del modelo de regresin. Normalidad de los residuos (Normal QQ) La distribucin normal de los errores puede evaluarse por medio del plot de cuantiles de los
- 270 -
ajustados frente a la raz del valor absoluto de los residuos. A diferencia de la primera grfica en esta se analizan los valores absolutos de los residuos para analizar su magnitud independientemente de su sentido, y se estudian sus races con el objetivo de disminuir la asimetra. Facilita el estudio de la homocedasticidad. Distancias de Cook (Residuals vs Leverage). til para
analizar la influencia de los datos en la estimacin de los parmetros del modelo. La distancia de Cook refleja la influencia de cada uno de los valores de la muestra y ofrece la distancia por la que el vector de parmetros estimados se movera si ese valor se quitara de los datos.
El estudio de la distribucin conjunta de variables es una herramienta de anlisis exploratorio muy til que ofrece un apoyo ineludible en la determinacin de cualquier modelo matemtico. Para ello Rcommander ofrece la opcin Matriz de diagramas de dispersin dentro del men Grficas. La ventana a la que se accede por medio de esa seleccin permite seleccionar las variables de inters,
- 271 -
reg.line=FALSE, 'density',
smooth=FALSE, data=Edi.data,
- 272 -
| | | | | | | | |
25
| | | | | |
| |
EDAD
20
10
15
| | | | | | | | | | | | | |
|
40
10.10
La diagonal principal de la matriz de grficas de dispersin est ocupada por los grficos de densidad de cada una de las variables de inters (Baja Autoestima, Edad e Insatisfaccin Corporal). Se aprecia el carcter sesgado de las distribuciones de las variables baja autoestima e Insatisfaccin Corporal. El resto de grficos muestran las distribuciones bivariadas entre todos los pares posibles definidos con las 3 variables.
- 273 -
10
20
30
IC
10
15
BA
La puntuacin emprica obtenida en un test no puede ser interpretada en trminos absolutos en tanto en cuanto las escalas a partir de las cuales se obtienen las puntuaciones no tienen un 0 absoluto; Que se puede inferir de la informacin contenida en el siguiente enunciado? Javier obtuvo 16 puntos en una prueba de razonamiento lgico. Nada; no podemos inferir nada sin tener ms informacin sobre la escala utilizada. La puntuacin 16 slo tiene sentido, referida al test a partir del cual se obtuvo, y con referencia a la muestra (grupo normativo) en la que se estandariz el test. Slo con ambas referencias (test y grupo) podremos concluir si la puntuacin 16 se sita por encima o por debajo de la media aritmtica del grupo, o podremos conocer a cuantas desviaciones estndar por encima o por debajo de la media se sita el valor 16; de hecho, la media aritmtica y la desviacin estndar se consideran el punto 0 y la unidad de medida de la escala. La transformacin de puntuaciones engloba el conjunto de
procedimientos o medidas encaminadas a situar la puntuacin individual con referencia al grupo, y as definir un contexto para la interpretacin de las puntuaciones. Para ello se transforman las escalas primarias o escalas brutas (Petersen, Kolen y Hoover, 1989) para que los valores obtenidos puedan ser interpretados sin hacer referencia a parmetros de escala. Bsicamente, los tipos de transformacin son dos; transformaciones lineales y transformaciones nolineales.
- 274 -
Yi
a bX i
a Y X
SY SX
Como consecuencia de una transformacin lineal la forma de la distribucin original no sufre ningn tipo de alteracin; si fuera normal en origen seguira siendo normal tras la transformacin, y si estuviera sesgada la distribucin transformada tambin lo estara. Escalas tpicas Las transformaciones lineales tpicas, convierten las puntuaciones brutas en puntuaciones estndar o puntuaciones z o puntuaciones tpicas (la literatura las reconoce de cualquiera de las tres formas). Las escalas estndar, tienen una media aritmtica de 0 y una desviacin estndar de 1 y poseen una relevancia especial en las ciencias sociales. A partir de los parmetros de transformacin (0,1) es fcil obtener el valor z correspondiente a una puntuacin bruta.
zi
Xi X SX
- 275 -
Yi
Donde
zi S
Desviacin estndar 10 15 16 10 13
- 276 -
P
Donde
fai
0,5 fi 100 N
fai, La frecuencia acumulada correspondiente a la puntuacin a transformar, fi, la frecuencia correspondiente a la puntuacin a transformar N, nmero de sujetos en la muestra.
Para una correcta interpretacin de los valores percentiles es necesario considerar que sus valores no definen escalas de intervalo, sino de orden, y las diferencias observadas entre las puntuaciones originales no son mantenidas por las escalas percentiles. Puntuaciones tpicas normalizadas A partir de los valores centiles es posible obtener puntuaciones tpicas normalizadas. Basta con relacionar las puntuaciones centiles con los valores z correspondiente al rea de la curva normal que limitan aquellas. Esta transformacin normaliza la distribucin original de las puntuaciones, por ello antes de llevarla a cabo es conveniente analizar la condicin de normalidad de los datos. Si existen diferencias significativas entre ambas (original-normal) esta transformacin no sera aconsejable (Angoff, 1984). - 277 -
transformaciones lineales que las conviertan en cualquier otra escala. En la tradicin psicomtrica la escala de estaninos o eneatipos (Flanagan, 1951) es una de las ms utilizadas. Esta escala segmenta el rango de puntuaciones en 9 intervalos de igual amplitud (no frecuencia). Los lmites de los intervalos se fijan de acuerdo a los valores de la distribucin normal
Eneatipos Lmites Percentiles 1 4 2 3 4 -0,75 23-39 5 -0,25 40-59 6 0,25 60-76 7 0,75 77-88 8 1,25 89-95 9 1,75 >95
La transformacin lineal que generara una escala eneatipo es aquella en que los parmetros de transformacin, es decir, media aritmtica y desviacin estndar, son respectivamente, 5 y 2. Adems de los eneatipos, la escala de decatipos es tambin utilizada como referencia para la interpretacin de puntuaciones en muchos manuales de tests. Tcnicamente es una escala normalizada derivada que divide el intervalo de puntuaciones en 10 categoras, y cuya media aritmtica es 5,5, y su desviacin estndar es 2.
Percentiles La obtencin de valores percentiles con Rcommander es sencilla. La opcin Resmenes Numricos dentro del men desplegable asociado a
- 278 -
En la ventana de resultados se recogern los cuantiles de la distribucin de la variable Insatisfaccin Corporal. De acuerdo a los valores mostrados se comprueba que la puntuacin en la variable Insatisfaccin Corporal que deja debajo de ella al 50% de la muestra es 18, y la puntuacin que deja sobre ella al 25% de la muestra es 11; la puntuacin centil correspondiente a la puntuacin bruta 40 es 75.
> numSummary(Edi.data[,"IC"], 0% 0 3 25% 11 50% 18 75% 100% 40 908 n 68 NA statistics=c("quantiles"),
quantiles=c(0,.25,.5,.75,1))
- 279 -
La salida adoptar el siguiente aspecto: La puntuacin correspondiente al centil 80 es 21, la asociada al centil 10 es 1, etc.
> numSummary(Datos[,"INSA_COR"], statistics=c("quantiles"), quantiles=c(0,0.10,0.20,0.25,0.30,0.40,0.50,0.60,0.70,0.75,0.80, 0.85,0.90,0.95,0.99))
0% 10% 20% 25% 30% 40% 50% 60% 70% 75% 80% 85% 90% 95% 99% 0 1 2 3 4 7 11 14 17 18 21 24 28 33 37 n 908 NA 68
Las puntuaciones centiles obtenidas de este modo, son utilizadas para describir al total de la muestra. Ahora bien, si existen factores a los que la variable de inters es sensible, es decir, si la variable que queremos describir es significativamente diferente en funcin del sexo, la edad, el estatus socioeconmicoun baremo debera de recoge tal diferenciacin. La correcta interpretacin normativa de una puntuacin emprica debera de ser lo ms prxima al grupo normativo del que proviene la persona que se va a evaluar. En
- 280 -
statistics=c("quantiles"), quantiles=c(0,.25,.5,.75,1))
Para la obtencin de un nmero de valores percentiles mayor sera suficiente aadir en el parntesis de especificacin de cuantiles (quantiles = c (0,.25,.5,.75,1)) los valores deseados separados por comas. Puntuaciones tpicas
- 281 -
Esta opcin permitir seleccionar la variable del conjunto de datos activo que se desee tipificar. La variable creada de este modo es aadida al conjunto de datos activo con un nombre igual a la variable original precedido por la letra Z. Las opciones para la visualizacin o edicin del conjunto de datos permiten comprobar sus valores. Una vez creada la variable, que evidentemente tendr una media aritmtica de 0 y una desviacin estndar de 1, podr modificarse a cualquier escala con media aritmtica y varianza preespecificada con slo escribir en la ventana de comandos la siguiente instruccin. En este caso, la escala de conversin es una escala T (media 50 y desviacin estndar 10).
Edi.data$T.escala <- 50 + (Edi.data$Z.IC*10)
Este comando crea una variable de nombre T.escala que pertenecer al conjunto de datos actual (Edi.data$), a partir de la variable Z.IC que est incluida en el conjunto de datos activo (Edi.data$). Tambin hubiera sido posible crear la variable T.escala a partir de los mens desplegables asociados a Datos>Modificar Variable del Conjunto de
- 282 -
Si se quisieran estimar los valores tpicos o transformados de modo diferencial segn el sexo habra que filtrar el conjunto de datos activo (Datos>Conjunto de datos activo > Filtrar el conjunto de datos) para poder ejecutar la orden de tipificacin slo sobre uno de los grupos.
- 283 -
12 Referencias Bibliogrficas
Ackerman, T. A. (1992). Didactic Explanation of Item Bias, Item Impact and Item Validity from a Multidimensional Perspective. Journal of Educational Measurement, 29(1), 67-91. American Educational Research Association, American Psychological Association, and National Council on Measurement in Education. (1954). Standards for Educational and Psychological Tests and Manuals. Washington, DC: American Psychological Association. American Educational Research Association, American Psychological Association, and National Council on Measurement in Education. (1966). Standards for Educational and Psychological Tests and Manuals. Washington, DC: American Psychological Association. American Educational Research Association, American Psychological Association, and National Council on Measurement in Education (1985). Standards for Educational and Psychological Testing. Washington, DC: American Psychological Association. American Educational Research Association, American Psychological Association, and National Council on Measurement in Education. (1999). Standards for Educational and Psychological Testing. Washington, DC: American Psychological Association. Angoff, W. H. (1984). Scales, Norms and Equivalent Scores. Princeton, New Jersey: Educational Testing Service. Angoff, W. H. (1988). Validity: An Evolving Concept. En H. Wainer y H. I. Braun (Eds.), Test Validity (19-32 pg.). Hillsdale, N.J.: Lawrence Erlbaum Associates. Armor, D.J. (1974). Theta Reliability and Factor Scaling. En H. Costner (Ed.): Sociological Methodology (pp. 17-50). San Francisco: Jossey-Bass. Bagozzi, R. P. (1993). Assessing Construct Validity in Personality Research: Applications to Measures of Self-Esteem. Journal of Research in Personality, 27, 49-87. Becker, R. A., Chambers, J. M. y Wilks, A. R. (1988). The New S Language: A Programming Environment for Data Analysis and Graphics. Pacific Grove, CA: Wadsworth. Berk, R. A. (Eds.). (1982). Handbook of Methods for Detecting Item Bias. Baltimore: John Hopkins University Press. Bloom, B. S. (Eds.). (1956). Taxonomy of Educational Objectives. Handbook I: The Cognitive Domain. New York: McGraw Hill. Bloom, B. S., Hastings, J. T., y Madaus, G. F. (1971). Handbook on Formative and Summative Evaluation of Student Learning. New York: McGraw Hill.
- 284 -
- 285 -
Elosua, P., Lpez, A., y Torres, A. (1999). Adaptacin al euskera de una prueba de inteligencia verbal. Psicothema, 11(1), 151-161. Elosua, P., Lpez, A., y Torres, E. (2000). Desarrollos didcticos y funcionamiento diferencial de los tems. Problemas inherentes a toda investigacin emprica sobre sesgo. Psicothema, 12(2), 198-202. Elosua, P., Lpez, A., y Egaa, J. (2000). Fuentes potenciales de sesgo en una prueba de aptitud numrica. Psicothema, 12(3), 376-382. Elosua, P., Lpez-Juregui, A. y Snchez-Snchez, F. (2010). Manual de la adaptacin al espaol del Eating Disoder Inventory-3. Madrid: TEA Elosua, P., y Lpez, A. (2002). Indicadores de dimensionalidad para tems binarios. Metodologa de las Ciencias del Comportamiento, 4(1), 121137. Elosua, P. y Lpez, A. (2007). Aplicacin de cuatro procedimientos de deteccin
- 286 -
- 287 -
- 288 -
- 289 -
- 290 -
- 291 -