CAPTULO I. INTRODUCCIN AL MODELAMIENTO DE ECUACIONES ESTRUCTURALES (MES).. 7
CAPTULO II. LAS CINCO ETAPAS DEL MES 11 Etapa 1. Especificacin del modelo. 11 Etapa 2. Modelo de medicin.. 13 Etapa 3. Estimacin del modelo (MES)... 17 Etapa 4. Prueba del modelo MES 22 Etapa 5. Modificacin del modelo... 22
CAPTULO III. MEDICIONES DE AJUSTE DEL MODELO... 23 3.1 Primer categora de ndices de ajuste. Pruebas de bondad de ajuste de covarianzas pronosticadas y observadas. 23 3.2 Segunda categora de ndices de ajuste. Pruebas de bondad de ajuste de estimacin de mxima verosimilitud... 25 3.3 Tercer categora de ndices de ajuste. Pruebas de bondad de ajuste de no centralidad... 26 3.4 Cuarta categora de ndices de ajuste. Pruebas de bondad de ajuste que comparan un modelo terico contra el modelo nulo o alternativo.. 27 3.5. Quinta categora de ndices de ajuste. Pruebas de bondad de ajuste que penalizan la falta de parsimonia.. 28
CAPTULO IV. SUPUESTOS DEL MES.. 30
CAPTULO V. CUATRO EJERCICIOS DE LISREL (PRELIS Y SIMPLIS).... 34 5.1. Ejercicio de introduccin de datos 36 5.2. Ejercicio de edicin de datos (Imputacin).. 42 5.3. Ejercicio de modelo de medicin o anlisis factorial confirmatorio.... 52 5.4. Ejercicio de Ecuacin Estructural. 71 5.5. Problemas comunes al correr LISREL. 90
Referencias. 91 Glosario... 93
ndice de tablas y figuras
Figura 1. Ejemplo de un diagrama MES.. 8 Figura 2. Especificacin del modelo 11 Figura 3. Modificacin del modelo.. 12 Figura 4. Modelo exgeno de medicin. 13 Figura 5. Disco local (C:) y carpeta Archivos del programa35 Figura 6. Carpeta LISWIN32S.EXE 35 Figura 7. Todos los programas: LISREL 88S.. 36 3 Figura 8. Men de PRELIS.. 37 Figura 9. Opcin New del men PRELIS.. 37 Figura 10. Opcin Import Data del men PRELIS.. 38 Figura 11. Opcin Open del archivo SPSS del men PRELIS 39 Figura 12. Opcin Open archivo data100.sav y guardar como PSF.... 39 Figura 13. Nuevo men PRELIS (DATA.PSF): Opcin Statistics......40 Figura 14. Nuevo men PRELIS (DATA.PSF): Opcin Output Options... 41 Figura 15. Archivo chollev.dat ... 44 Figura 16. CHOLLEV.PSF (PRELIS)... 45 Figura 17. Number of variables... 45 Figura 18. Las tres variables y sus valores.. 46 Figura 19. VAR3 de Chollev.PSF (PRELIS).. 47 Figura 20. Impute Missing Values de VAR3 de Chollev.PSF (PRELIS)... 48 Figuras 21 y 22. Output Options de VAR3 de Chollev.PSF (PRELIS).. 49 Figura 23. VAR3 sin datos faltantes de Chollev.PSF (PRELIS).....51 Figura 24. Bases de datos antes y despus de la imputacin.. 52 Figura 25. Modelo confirmatorio de seis variables observadas y dos variables latentes.... 53 Figura 26. Abrir LISREL. 54 Figura 27. Buscar carpeta LISREL.. 54 Figura 28. Seleccionar y abrir carpeta SPLEX (SIMPLIS ).... 55 Figura 29. Seleccionar y abrir archivo EX5A.SPL.. 55 Figura 30. Comandos para correr un AFC... 56 Figura 31. Grfica de resultados del AFC57 Figura 32. Grfica de trayectorias (ahora archivo EX5A.PTH).. 58 Figura 33. EX5B.SPL. AFC modificado. 63 Figura 34. Archivo EX5B.PTH modificado (grfica de trayectorias). 65 Figura 35. AFC modificado de EX5A.SPL 70 Figura 36. Archivo EX5A.PTH AFC modificado (grfica de trayectoria)..........71 Figura 37. Modelo hipottico del ejemplo de modelamiento estructural 72 Figura 38. Abrir LISREL. 73 Figura 39. Oprimir New... 73 Figura 40. Oprimir SIMPLIS Project y Aceptar.. 74 Figura 41. Nombrar y Guardar. 74 Figura 42. Escribir datos en pantalla75 Figura 43. Grfica de trayectorias (archivo .PTH).. 76 Figura 44. Modelo hipottico modificado del ejemplo de modelamiento... 83 Figura 45. Ecuacin estructural modificada en SIMPLIS... 84 Figura 46. Grfica modificada de trayectorias del MES..85
Tabla 1. ndices seleccionados de ajuste del AFC... 57 Tabla 2. Resultados del anlisis factorial confirmatorio (EX5A.OUT)..59 Tabla 3. ndices seleccionados de ajuste del AFC modificado 64 Tabla 4. Resultados del AFC modificado (EXA5B.OUT). 65 Tabla 5. ndices seleccionados de ajuste del AFC... 70 Tabla 6. Resultados de la ecuacin estructural (archivo con extensin OUT) 76 Tabla 7. ndices seleccionados de ajuste de la ecuacin estructural 82 Tabla 8. ndices de modificacin sugeridos para la ecuacin estructural 82 Tabla 9. Resultados del MES modificado85 Tabla 10.ndices seleccionados de ajuste del MES. 89 4 PRLOGO
Es para Cincel un honor poder publicar este escrito del Dr. Littlewood y la Maestra Bernal. Muy gentil y generosamente estos investigadores nos entregaron el manuscrito para ser publicado electrnicamente por este Centro de Investigacin, sin costo alguno para los lectores interesados.
Hemos ledo con atencin el manuscrito y nos ha impresionado muy positivamente que un mtodo estadstico avanzado y complejo pueda tener una presentacin tan clara y sencilla. El texto acompaa al lector paso a paso en la comprensin de los conceptos y en el manejo del programa LISREL. En realidad, su lectura atenta y la realizacin juiciosa de los ejercicios habilitan al lector para llevar a cabo el proceso y la interpretacin de su primer modelamiento de Ecuaciones Estructurales, tal como lo anuncia el ttulo del libro.
Los principios y conceptos claves son presentados con sencillez lo mismo que el procedimiento. Los ejercicios son claros y muy ilustrativos y hay referencias claves para consulta y bsqueda de ayudas en Internet.
Este trabajo paciente y metdico constituye una contribucin importante de los autores para ayudar eficazmente a quienes estn dando sus primeros pasos en el uso de esta metodologa analtica, pero tambin para refrescar y clarificar elementos claves para el investigador y usuario experimentado. Adicionalmente cuenta con el valor agregado de que sus autores son psiclogos investigadores que ubican al lector en el contexto de la psicologa y del manejo de datos de investigacin.
Esperamos que los lectores interesados obtengan el mejor provecho de la lectura y estudio del libro y nos comuniquen sus impresiones y comentarios, tanto a los autores como al editor.
El Editor
5 INTRODUCCIN
El libro explica en los captulos 1, 2 y 3 qu es el modelamiento de ecuacin estructural (MES) o Structural Equation Modeling (SEM), que es un mtodo cuantitativo que en la actualidad es utilizado por investigadores y consultores de ciencias sociales y administracin. El MES es una tcnica estadstica que permite al investigador poner a prueba modelos tericos que establecen relaciones, presumiblemente causales, entre variables latentes que se miden mediante variables observadas o indicadores. Es comn que los modelos consten de variables independientes, variables mediadoras que son a la vez dependientes e independientes, y variables dependientes. El MES requiere de dos grandes pasos: a) el anlisis factorial confirmatorio (AFC) que valida el modelo de medicin de las variables latentes (constructos) y b) la comprobacin de las trayectorias (parmetros) entre variables latentes.
En el captulo 5 se explica y muestra grficamente al lector como utilizar los programas PRELIS y SIMPLIS de LISREL que se pueden descargar gratuitamente de internet, necesarios para: importar y adaptar bases de datos; realizar anlisis factoriales confirmatorios y llevar a cabo el modelamiento de la ecuacin estructural.
El libro presenta en el captulo 5 cuatro ejercicios prcticos y los lectores familiarizados con estadstica descriptiva e inferencial bsica podrn realizar su primer modelamiento de ecuacin estructural, e interpretar los resultados. Los ejemplos usan bases de datos a las que se puede acceder una vez que se descarg el paquete LISREL.
Debido a la constante actualizacin de los paquetes estadsticos, probablemente el lector encontrar diferencias entre lo aqu presentado y el paquete descargado. Por tal motivo, los autores actualizarn el libro y darn explicaciones detalladas en seminarios especializados.
El primer autor del libro est certificado en el MES; es maestro de Psicologa Industrial-Organizacional de The University of Akron, E.U.A., Doctor en Ciencias de la Administracin de la Escuela Superior de Comercio y Administracin del Instituto Politcnico Nacional (mencin honorfica), candidato a doctor de la Facultad de Contadura y Administracin de la UNAM. Ha publicado investigaciones arbitradas relacionadas con el MES en el pas y en el extranjero; es rbitro de la Revista Interamericana de Psicologa Ocupacional (Colombia), la Academia de Ciencias Administrativas (ACACIA) y el congreso de investigacin de la Facultad de Contadura, Administracin e Informtica de la UNAM. Recibi el premio nacional de psicologa del trabajo en el 2003 y el reconocimiento del mejor trabajo de investigacin ACACIA 2007 en Procesos de Cambio y Desarrollo Organizacional. Sus lneas de investigacin se relacionan con renuncia psicolgica, rotacin de personal, desgaste ocupacional, clima organizacional, medicin de actitudes y diseo de instrumentos de medicin.
La segunda autora se gradu como psicloga organizacional de la Universidad de las Amricas y es estudiante de la maestra en Psicologa del Trabajo, las 6 Organizaciones y los Recursos Humanos de la Universidad de Valencia (Espaa), ha publicado y presentado artculos y ponencias arbitradas en congresos nacionales e internacionales. Cuenta con 10 aos de experiencia laboral en recursos humanos, administracin del cambio y consultora en empresas tales como: Deloitte, ICTS Global, Planfa Autofinanciamiento Chrysler e Intertcnica. En el 2002 recibi el premio nacional de psicologa del trabajo en la categora jvenes talentos. Sus lneas de investigacin tambin se relacionan con renuncia psicolgica, rotacin de personal, clima organizacional, medicin de actitudes y diseo de instrumentos de medicin.
La portada del libro presenta una figura de un modelamiento LISREL de una investigacin sobre evitacin del trabajo o renuncia psicolgica que puede consultarse en Gonzlez Snchez, I. Kertsz, R., Romero Gonzlez, R.E, Garca Alvarez, C.M y Littlewood, H.F. (2008). Comportamiento Organizacional: Nuevos retos. Porrua: Mxico, D.F. ISBN: 978-970-819-053-4
7 CAPTULO I. INTRODUCCIN AL MODELAMIENTO DE ECUACIONES ESTRUCTURALES (MES)
El modelamiento de ecuacin estructural (MES) es una tcnica estadstica para probar y estimar relaciones presumiblemente causales que usan una combinacin de datos estadsticos y suposiciones causales. El MES originalmente fue articulado por el genetista Sewall Wright (1921), los economistas Trygve Haavelmo (1943) y Herbert Simon (1953), y formalmente definido por Marcoulides y Schumaker (2001) y Schumacker y Lomax (2004)
El MES como lo conocemos en la actualidad es una derivacin de las investigaciones realizadas por Karl Jreskog (1970). Jreskog desarroll un anlisis de estructuras a partir de matrices de covarianzas mediante un modelo que denomin LISREL. Esta representacin propuesta tiene dos componentes: el de medicin y el estructural. El componente de medicin refleja la relacin entre las variables latentes (constructos o factores) e indicadores manifiestos (variables observadas), y se le denomina anlisis factorial confirmatorio. Por otro lado, el componente estructural refleja la relacin entre variables latentes.
El MES es un mtodo estadstico que parte de la regresin mltiple, pero es ms poderoso en cuanto al tratamiento que le da a interacciones, relaciones no lineales, correlaciones entre variables independientes, error de medicin, correlacin entre los trminos de error, mltiples variables independientes medidas por varios indicadores, y la consideracin de variables independientes latentes medidas por varios indicadores. Es as como el MES es una alternativa robusta en comparacin con la regresin mltiple, anlisis de trayectorias, series de tiempo y anlisis de covarianzas en la validacin de modelos hipotticos.
El investigador inicia su estudio mediante la especificacin de un modelo terico que describe como se miden las variables latentes y cmo se relacionan entre si dichas variables latentes. Las variables latentes son variables no observadas directamente, tales como la satisfaccin en el trabajo, justicia organizacional o compromiso organizacional; estas variables son tambin denominadas factores y son estimadas o medidas con indicadores o variables observadas, como lo son los reactivos de un cuestionario.
El primer paso consiste en llevar a cabo un anlisis del modelo de medicin (anlisis factorial confirmatorio), que consiste en verificar la validez de la medicin de variables latentes mediante sus respectivos indicadores. El segundo gran paso, consiste en especificar el modelo estructural, a fin de establecer cmo se relacionan entre s las variables latentes, de manera similar a como la regresin mltiple relaciona entre s a las variables independientes (VI) con la variable dependiente (VD). Es comn especificar el modelo mediante una grfica como la mostrada en la figura 1.
Las ventajas del MES son el uso el anlisis factorial confirmatorio (AFC) para reducir el error de medicin mediante la consideracin de varios indicadores por variable latente, el anlisis de modelos completos que contemplan la interaccin de variables, la capacidad para estudiar simultneamente ms de una variable dependiente, la capacidad para analizar variables mediadoras y manejar datos complejos como los que resultan de distribuciones no normales o bases incompletas.
Otras ventajas del MES son: no es necesario asumir medicin perfecta de los indicadores, ya que es posible estimar los trminos de error o el componente de varianza nica de cada indicador; los errores pueden estar correlacionados entre s, lo cual es importante para estudios longitudinales, por ejemplo la satisfaccin en el trabajo en un momento puede correlacionarse con la satisfaccin en un momento posterior; y las varianzas residuales o la varianzas no explicadas (1- R cuadrada) pueden correlacionar, lo cual tambin es importante en investigaciones de corte longitudinal o transversal.
El MES es usualmente utilizado como un procedimiento confirmatorio no exploratorio, mediante tres enfoques:
a. Enfoque confirmatorio puro: Se analiza un modelo con pruebas de bondad de ajuste a fin de determinar si la matriz de covarianzas es consistente con una trayectoria. Sin embargo, como otros modelos no examinados pueden ajustarse a los datos, el modelo aceptado es tan slo un modelo no rechazado. b. Enfoque de modelos alternos: Es posible probar dos o ms modelos causales a fin de identificar aquel que mejor ajusta. Existen diferentes mediciones de bondad de ajuste y generalmente se reportan tres o cuatro, como la Ji cuadrada, 9 RMSEA, GFI o NFI (explicados en el captulo 3 Mediciones de ajuste del modelo). c. Enfoque de desarrollo del modelo: Es usual que se combinen la perspectiva exploratoria y la confirmatoria. En el caso de tener un modelo deficiente, un modelo alterno es probado mediante cambios de ndices sugeridos de modificacin. Su debilidad radica en la confirmacin post-hoc del modelo, pero esto puede resolverse mediante la replicacin del estudio con una nueva muestra de sujetos.
Por s slo el MES no puede resolver ambigedades o inconsistencias en los resultados, es por ello que el juicio y la capacidad terica del investigador juegan un papel crucial en la propuesta de modelos.
. El MES propone una postura de tipo confirmatoria en contraposicin de lo propuesto por el anlisis factorial exploratorio; de esta manera, dicha postura busca poner a prueba o confirmar teoras. Por lo general, el MES comienza con una hiptesis, la cual es representada como un modelo que operacionaliza uno o ms constructos tericos mediante instrumentos de medida y termina con la prueba del modelo. Las suposiciones causales integradas en el modelo a menudo tienen implicaciones que pueden ser probadas contra los datos. Con una teora aceptada o el modelo confirmado, el MES tambin puede ser usado inductivamente mediante la especificacin del modelo y el uso de datos que estiman los valores de los parmetros. A menudo la hiptesis inicial requiere de ajustes, pero el MES rara vez es utilizado con una perspectiva exploratoria.
Entre las ventajas del MES est la capacidad para modelar constructos como variables latentes (variables que no son medidas directamente), que son estimadas en el modelo a partir de variables medidas (indicadores) que reflejan dichas variables latentes. Esto permite al investigador estimar la confiabilidad de medida del modelo, lo que en teora permite la estimacin de las relaciones estructurales entre las variables latentes. El anlisis factorial, el anlisis de trayectorias y la regresin son casos especiales del MES.
El MES es parte de una familia de tcnicas estadsticas que integra el anlisis de trayectorias y el anlisis factorial mediante paquetes estadsticos como el LISREL o el AMOS. Por ejemplo, el MES en donde cada variable slo tiene un indicador es un caso de anlisis de trayectorias (path analysis); el anlisis factorial confirmatorio (AFC) permite analizar varios constructos a la vez y sus respectivos indicadores, pero sin flechas que conectan entre si a las variables; y el modelo hbrido es aquel que permite analizar el conjunto de indicadores por constructo (variable latente) y las trayectorias (flechas) que conectan a los constructos entre si.
Los sinnimos de MES son anlisis de covarianza estructural o modelamiento de covarianza estructural. Aunque estos sinnimos sealan que el foco es el anlisis de covarianza, el MES tambin puede analizar la matriz de correlaciones y la estructura de medias de un modelo.
10 Objetivos del libro.
a. Describir en que consiste el MES. b. Que el lector pueda realizar un modelamiento de ecuacin estructural mediante el mtodo SIMPLIS de LISREL, mediante la descarga gratuita de la versin estudiantil de LISREL (http://www.ssicentral.com/lisrel/downloads.html) NO descargue el Free 15-day trial edition, S Descargue el Free student edition.
La descarga puede llevar varios minutos.
Hay varios paquetes estadsticos que realizan el MES, y el libro solamente considera el paquete LISREL. No obstante, el lector puede aplicar otro paquete como el EQS, el AMOS o el Mplus.
LISREL (Linear Structural Relations) de SSI Scientific Software, es tal vez el paquete ms reportado en revistas cientficas. Es posible descargar gratis la versin de estudiante (LISREL88StudentSetup.exe) tambin de este vnculo:
Please note that the student edition of LISREL for Windows limits the size of the model you may analyze, and that technical support is not available.
Student edition of LISREL for Windows
EQS de Peter Bentler y est disponible en: http://www.mvsoft.com/
AMOS distribuido por SPSS. Este programa puede aplicarse mediante programacin convencional o con grficas amigables: http://www.spss.com/amos/
Mplus de Brent Meuthen se encuentra en: http://www.statmodel.com/.
11 CAPTULO II. LAS CINCO ETAPAS DEL MES.
El MES tiene cinco etapas, pero son dos las principales: validacin del modelo de medicin (etapa 2) y el ajuste del modelo estructural (etapa 4), y esto se logra mediante el anlisis factorial confirmatorio (CFA) y mediante el anlisis de trayectorias entre variables latentes, respectivamente.
En la descripcin de las cinco etapas no se presentan anlisis cuantitativos, slo se explica en que consisten. En el captulo 3 se presentan y explican los ndices o estadsticos usados por el MES, y en el captulo 5 se realizan ejercicios cuantitativos que demuestran cmo llevar los diferentes pasos del MES y cmo interpretar los resultados.
Etapa 1. Especificacin del modelo.
Parte de la revisin de la literatura y la formulacin de un modelo terico. Esto consiste en identificar variables latentes (constructos) y especificar las relaciones entre las variables. Por ejemplo, un problema de investigacin se plantea como: hay relacin entre el Desempeo y la Satisfaccin en el trabajo?. En la figura 2 las variables latentes se identifican con valos y se considera la posibilidad de que ambas variables pueden ser causa, segn el sentido de ambas fechas. Pudiera slo haber una flecha, si la teora as lo indica (por ejemplo, de Satisfaccin a Desempeo, si se considera a la Satisfaccin como la causa).
Fuente: Elaboracin propia
Figura 2. Especificacin del modelo (especificacin inicial)
Si el investigador piensa que hay otras variables que anteceden a estas dos, tales como Motivacin de logro, Especificidad de la tarea e Inteligencia verbal, entonces modifica el diagrama as (figura 3). Estas tres son denominadas variables exgenas y satisfaccin en el trabajo y desempeo son llamadas variables endgenas.
Desempeo Satisfaccin en el trabajo 12
Fuente: Elaboracin propia
Figura 3: Modificacin del modelo (especificacin final)
Las flechas rectas indican una relacin causal y las flechas curvas indican que las variables correlacionan entre s (la causa es la que est al principio de la flecha y el efecto est junto a la punta de la flecha).
La inclusin de una variable trivial da a lugar a missespecification o especificacin incorrecta del modelo que resulta en la prdida de precisin de estimacin y la reproduccin inadecuada de covarianzas observadas (no habr ajuste de datos), y la exclusin de una variable relevante da a lugar a estimacin incompleta o sesgada del parmetro
Entonces, las variables latentes son variables no observadas, constructos o factores que son medidos indirectamente a travs de sus respectivos indicadores o reactivos. En la figura 3 son Motivacin de logro; Especificidad de la tarea; Inteligencia verbal; Satisfaccin en el trabajo y Desempeo y en la figura 1 Past Relation, Education, Time 1 Stress, y Time 2 Stress son las variables latentes.
La variables latentes pueden ser independientes (exgenas) que estn a la izquierda de la figura, mediadoras o dependientes (endgenas) que aparecen a la derecha de la figura. Las variables exgenas son independientes y no tienen alguna variable que las anteceda. Las variables exgenas son etiquetadas con la letra griega y las variables endgenas son identificadas con la letra griega eta q. Cabe mencionar que estos y otros smbolos que ms adelante se presentan, no son necesarios para correr el paquete LISREL
Las variables mediadoras pueden estar entre una variable exgena y una dependiente, o entre otras dos variables endgenas. Estas reciben las fechas que provienen de las variables exgenas u otra variable endgena, las cuales denotan una relacin causal.
Generalmente se asume que las variables latentes correlacionan entre s y esto se representa con una flecha curva de covarianza de doble punta, cmo entre Motivacin 13 de logro, Especificidad de la tarea e Inteligencia verbal (figura 4) y cmo entre Past Relation y Education y entre Time 1 Stress y Time 2 Stress (figura 1), de acuerdo a un fundamento terico.
Hasta aqu llega la primer etapa; se ha establecido la relacin entre variables (latentes y observadas) que se visualiza mediante un diagrama de valos, rectngulos y flechas (rectas y curvas).
Etapa 2. Modelo de medicin.
En este segundo paso, las variables latentes (no directamente observables) requieren que el modelo de medicin se especifique y se valide. El resultado es la redaccin o seleccin de variables observadas (por ejemplo, reactivos) para cada una de las variables latentes. En el ejemplo del modelo de Desempeo se mide Motivacin de logro. Especificidad de la tarea e Inteligencia verbal, con dos indicadores cada uno (figura 4). En la figura 1 Past Relation tiene tres indicadores; Education slo uno, ya que aos de educacin slo requiere de un reactivo para su medicin; y Time 1 Stress y Time 2 Stress tienen 3 indicadores cada uno.
El modelo de medicin de Desempeo contempla variables exgenas latentes (variables independientes) y variables endgenas latentes (variables dependientes), lo que significa que hay dos modelos de medicin, uno para las variables exgenas y otro para las endgenas (ver figura 4). Ambos modelos de medicin pueden agruparse y analizarse en conjunto, pero a fin de simplificar el ejemplo, slo se muestra el modelo exgeno.
Fuente: Elaboracin propia
Figura 4. Modelo exgeno de medicin. 14 Ntese que el modelo de medicin de las variables endgenas se construye de la misma manera y que puede analizarse junto con el otro modelo.
En este ejemplo (figura 4), los seis reactivos son las variables observadas o tambin llamadas variables manifiestas, que en el caso de un cuestionario son los reactivos o items. Tambin pueden denominrseles como indicadores. Aunque dos indicadores pueden ser suficientes, tres reactivos como mnimo son recomendados para estimar la confiabilidad y la validez del modelo; la especificacin de la medicin fija la varianza del error y la validez del instrumento. Es una convencin que los reactivos deben tener carga factoriales altas, por ejemplo .70 o ms en su variable latente; los smbolos son la carga de los indicadores en la variable correspondiente (figura 1).
Regresando a la figura 1, los indicadores son simbolizados con una X (X1 al X4) en el caso de las variables latentes exgenas o una Y (Y1 al Y6) en el caso de las variables endgenas; cada indicador est conectado a su respectiva variable latente mediante una flecha recta corta.
Los indicadores aparecen dentro de rectngulos y las variables latentes (Past Relation, Education, Time 1 Stress y Time 2 Stress) dentro de valos. Las cuatro flechas rectas gruesas y largas sugieren que Past Relation y Education son la causa de Time 1 Stress; y Past Relation y Time 1 Stress son causa de Time 2 Stress. La flecha curva con dos puntas indica que Past Relation correlaciona con Education y Time1 Stress correlaciona con Time 2 Stree.
Como de explic en la etapa 1, el proceso inicia con la formulacin de una teora o un modelo hipottico. Cada variable o constructo es conceptualizado como una variable de tipo latente medida por varios indicadores. Es comn que varios indicadores sean seleccionados, mediante un anlisis factorial exploratorio previo (common factor anlisis o principal axis factoring, por ejemplo), de una muestra de indicadores (reactivos); este anlisis identifica las variables latentes y sus indicadores correspondientes. Posteriormente se seleccionan tres, cuatro o cinco indicadores por variable latente y se confirman con un Anlisis Factorial Confirmatorio (AFC) en una muestra diferente de personas.
El AFC es el primer anlisis y es necesario para determinar la validez de los indicadores en una segunda muestra. Frecuentemente el AFC es referido como el modelo nulo. En este modelo, las covarianzas que aparecen en una matriz se asumen iguales a cero. En el AFC se pueden estimar uno o varios ndices de ajuste (por ejemplo NFI, RFI, IFI, TLI o NNFI, CFI, PNFI y PCFI, que son explicados en el captulo 3). El AFC parte de un modelo nulo o una lnea base contra el cual se comparan los modelos default (modelos toricos). Es posible tener cuatro opciones de modelos nulos, pero el primer modelo es el que generalmente se usa; la eleccin de modelo nulo afecta el clculo de los coeficientes de ajuste.
Modelo nulo 1: Las correlaciones entre las variables observadas se limitan a cero y se establece que las variables latentes tambin correlacionan cero entre s. Las medias y varianzas de las variables medidas no se limitan. Este es el modelo default lnea base de independencia y es el modelo default de la mayora de los casos.
15 Modelo nulo 2: Las correlaciones entre las variables observadas son todas iguales y las medias y varianzas de las variables observadas no se limitan.
Modelo nulo 3: Las correlaciones de las variables observadas se limitan a cero. Las medias tambin son limitadas a cero, pero las varianzas no se limitan. Esta opcin 3 slo aplica a modelos cuyas medias e interceptos son parmetros explcitos del modelo.
Modelo nulo 4: Las correlaciones entre las variables observadas son todas iguales. Las medias se limitan a cero. Las varianzas de las variables observadas no se limitan. Esta opcin 4 slo aplica a modelos cuyas medias e interceptos son parmetros explcitos del modelo.
Una vez elegido el modelo, procede el anlisis factorial confirmatorio (AFC).
Este anlisis se efecta para confirmar que los indicadores se agrupan en sus respectivos factores de acuerdo con la teora del investigador. El AFC es clave en el MES, puesto que evala el error de medicin del modelo y valida los factores involucrados.
Este anlisis puede hacerse mediante dos mtodos:
Modelamiento de dos pasos. Kline (1998) recomienda que primero siempre se evale el modelo de medicin y luego se proceda con el segundo paso que es la puesta en prueba del MES (etapa 4).
Modelamiento de cuatro pasos. Mulaik y Millsap (2000) sugieren cuatro pasos ms estrictos. 1. Anlisis factorial comn (exploratorio) para establecer la cantidad de variables latentes e indicadores. 2. AFC a fin de confirmar el modelo de medicin. Tambin pueden limitarse las cargas factoriales a cero de las variables medidas en otras variables latentes, para que cada variable medida cargue slo en su variable latente. 3. Prueba del MES (etapa 4). 4. Probar modelos nested o anidados a fin de identificar el mejor modelo (ms parsimnico o simple).
Confiabilidad. Una vez realizado el anlisis factorial confirmatorio y validados los constructos en una segunda muestra, es necesario determinar el nivel de error de la medicin de dichos constructos.
El coeficiente alpha de Cronbach es comnmente usado para determinar que indicadores pertenecen a la misma variable latente y el nivel de error de medicin. Este coeficiente vara entre cero y 1, y generalmente se espera que los indicadores tengan una confiabilidad de .70 o mayor. Puede haber conjuntos de indicadores con una confiabilidad inferior a .70 y con ndices aceptables de AFC superiores a .90. Esto puede ocurrir debido a una baja homogeneidad de varianza de los reactivos o a la baja cantidad de reactivos por variable latente.
El coeficiente de rho de Raykovs tambin pone a prueba la confiabilidad de un conjunto de reactivos. Raykov (1998) ha demostrado que el coeficiente alpha de 16 Cronbach puede subestimar o sobreestimar la confiabilidad de una escala. La subestimacin es comn y este coeficiente es diferente al rho de Spearman.
Posteriormente, el investigador procede con el anlisis, una vez que el modelo de medicin ha sido validado. Uno o dos modelos son comparados, uno puede ser el modelo nulo, en cuanto al ajuste con los datos empricos que estima el grado en el que las covarianzas predichas por un modelo corresponden a la varianzas observadas (datos). Los ndices de modificacin u otros coeficientes pueden ser usados para cambiar y mejorar el modelo.
Condicin previa para llevar a cabo la etapa 2 (Modelo de medicin): La identificacin.
La factibilidad del Anlisis Factorial Confirmatrio (AFC) y la estimacin del modelo estructural (MES) depende de informacin disponible y la complejidad del modelo. La factibilidad es denominada como identificacin. Tanto en el AFC como en el MES los parmetros estimados (flechas rectas que conectan de manera causal a las variables latentes, flechas curvas que correlacionan a variables latentes, flechas rectas cortas que conectan a los indicadores con su variable latente y flechas rectas cortas que determinan el error de medicin de cada indicador) determinan la matriz de covarianzas.
Eso es, se especifican un conjunto de ecuaciones donde los parmetros son las incgnitas, y si las incgnitas pueden resolverse de una sola o varias maneras, entonces se dice que el modelo es identificado; de otro modo, si no se pueden resolver las ecuaciones, se dice que el modelo est subidentificado y no puede proseguir el AFC ni el MES.
Hay tres niveles de identificacin:
a. Subidentificacin: Uno o ms de los parmetros no pueden resolverse con la matriz de covarianzas, puesto que hay ms incgnitas de parmetros que ecuaciones. b. Apenas identificado: Cuando hay informacin apenas suficiente en la matriz de covarianzas (mismo nmero de incgnitas y de ecuaciones). c. Sobreidentificacin: Hay dos o ms maneras para estimar las incgnitas de parmetros (ms ecuaciones que incgnitas).
Una condicin necesaria para identificacin es que p(p+1)/2 sea igual o mayor a los parmetros (flechas rectas y curvas) a estimar, dnde p es el nmero de variables observadas (indicadores).
En el ejemplo de variables exgenas de Desempeo (figura 4) tenemos sobreindentificacin necesaria para correr un AFC: (6*(6+1))/2 = 21: Se tienen 15 parmetros libres (flechas) a estimar y como 21 es mayor, se tienen 6 grados de libertad (21-15 = 6).
En el ejemplo completo de la figura 1 tenemos tambin sobreidentificacin necesaria para correr un MES: (9*(9-1))/2 = 36. Se tienen 26 parmetros libres a estimar y cmo 36 es mayor, se tienen 10 grados de libertad.
17 Una solucin contra la subidentificacin, es la eliminacin de uno o ms parmetros del modelo.
Ntese que el AFC y el MES son similares, la diferencia estriba que en el MES si hay relaciones causales (flechas rectas) entre variables latentes.
El lector debe advertir que el paquete LISREL se encarga de evaluar la identificabilidad y que no realizar el AFC ni el MES si no hay suficientes grados de libertad.
Etapa 3. Estimacin del modelo (MES).
Una vez que se ha validado el modelo de medicin y estimado la confiabilidad, procede este gran paso. En esta etapa se valida la relacin propuesta entre las variable latentes, como se propone en la figura 3 del ejemplo de Desempeo o en la figura 1 de Stress.
La validacin se logra al comparar la correspondencia de los datos empricos (que se obtienen a travs de los indicadores) con el modelo terico. En otras palabras, se compara la matriz de covarianzas observadas (o la matriz de correlaciones observadas) y la matriz de covarianzas tericas (o la matriz de correlaciones tericas); LISREL se encarga de obtener las matrices de covarianzas y de hacer dicha comparacin.
El modelo estructural (MES). Este modelo contiene las variables endgenas y exgenas, los efectos directos (flechas rectas) que conectan variables, correlaciones entre las variables exgenas e indicadores y los trminos de error de cada variable de acuerdo a una propuesta terica (como lo proponen los modelos de las figuras 3 y 1).
Las flechas que conectan las variables exgenas con las endgenas tienen la letra gamma y las flechas que conectan las variables endgenas entre si usan la letra beta | (coeficiente de regresin o peso beta estandarizado). El modelo usualmente es el llamado modelo default y es fundamentado en teora.
3.1 El modelo default. Este es el modelo de investigacin, ms parsimnico (simple) que el saturado y casi siempre ajusta mejor que el independiente. Eso es, el modelo default tiene una bondad de ajuste que se encuentra entre la explicacin perfecta del modelo saturado y del modelo de independencia.
3.2 El modelo saturado. Este en un modelo trivial que contiene tantas estimaciones de parmetros como grados de libertad. Ocurre cuando el modelo contiene todas las flechas posibles. La mayora de las mediciones de ajuste tienen un valor de 1.0 (muy bueno), pero debido a que este modelo no es parsimnico (simple), las mediciones de ajuste basadas en parsimonia tienen valores de cero (muy malo), y algunos ndices como el RMSEA no pueden calcularse. Estos ndices son explicados en el captulo 3.
3.3 El modelo de independencia. Este modelo asume que todas las relaciones entre variables son inexistentes, por lo que asume que las correlaciones entre variables son cero. Tambin puede considerrsele como el modelo nulo como se vi en el AFC. Mientras que el modelo saturado tiene una proporcin cero de parsimonia, este modelo 18 tiene una proporcin de parsimonia 1. La mayora de los ndices tienen un valor de cero, excepto RMSEA y GFI (explicados en el captulo 3).
3.4 Modelos MIMIC: Estos modelos tienen indicadores mltiples y mltiples modelos de independencia. Esto significa que las variables latentes tienen los acostumbrados indicadores mltiples que son causados por variables observadas adicionales. Grficamente, el modelo contiene las flechas acostumbradas que parten de las variables latentes a cada uno de los indicadores y los indicadores tienen los trminos de error. Adicionalmente, hay rectngulos que representan a las variables observadas con flechas que van a las variables latentes y flechas de covarianza que los conecta ya que son variables exgenas. El ajuste del modelo se interpreta de la misma manera, pero las variables causales observadas deben asumirse que se miden sin error. Este libro no trata este tipo de modelos y se recomienda se consulte el libro de Schumacker y Lomax (2004).
3.5 Comentarios adicionales sobre los pasos seguidos en la especificacin del modelo, y trminos comunes asociados al MES.
Se recuerda que el primer gran paso es la especificacin de las variables latentes y sus respectivas variables observadas (ver figuras 3 y 1). El paso siguiente fue el AFC que se efecto para validar la correspondencia de los indicadores con sus respectivas variables latentes. El investigador al establecer la relacin secuencial entre las variables latentes mediante flechas, est determinando que efectos son nulos, cules son fijados como una constante (usualmente 1) y cules pueden variar. Los efectos variables corresponden a las flechas del modelo, mientras que los efectos nulos no tienen flecha. Esto comnmente se representa en un diagrama como el de la figura 6 y el de la figura 1, los cuales pueden considerarse como modelos suficientemente parsimnicos porque tienen pocas flechas que conectan a las variables latentes.
Modelo parsimnico. En la especificacin del modelo es necesario determinar si este es suficientemente parsimnico o simple y para ello hay ndices de ajuste que se explican en el captulo 3. Un modelo en el que ningn efecto es limitado a cero, es uno que se ajustar a los datos, an cuando el modelo no tenga lgica. La adicin de flechas generalmente aumenta el ajuste, pero afectar la parsimona. Ntese que la falta de parsimona puede ocurrir en modelos que tienen pocas variables. Hay tres maneras para reducir la complejidad del modelo: una consiste en borrar flechas rectas que van de una variable latente a otra; otra, borrar efectos directos que van de variables latentes a indicadores; o la ltima, borrar flechas curvas (flechas con doble punta) que representan correlaciones entre trminos de error o correlaciones entre variables latentes. La letra phi u se utiliza para representar esta curva de doble punta.
Concluyendo, la recomendacin para lograr una parsimona aceptable es iniciar con un modelo simple y gradualmente aadir nuevas variable latentes y flechas, de acuerdo a una teora previamente desarrollada.
Mtricos. Antes de correr el MES a cada variable latente debe asignrsele una escala mtrica y esto puede hacerse mediante la limitacin de una de las trayectorias a uno de sus indicadores a un valor de 1. Una vez limitada esta trayectoria, las dems trayectorias se estiman. El indicador limitado a 1 es llamado reactivo referente. 19 Generalmente este indicador es el que tiene la mayor carga factorial con la variable latente. Esto se hace en el captulo de ejercicios.
Trminos de error de medicin. Error de medicin es el factor de error asociado con un indicador dado. Tal error es denominado por la letra delta oi en el caso de indicadores de constructos latentes exgenos, o denominado epsilon ci en el caso de indicadores de constructos latentes endgenos (ver figura 1). Los modelos de regresin asumen que el error es cero, pero en el MES los trminos de error son explcitamente modelados. En el caso de variables latentes que slo tienen un indicador, cmo en el caso de sexo (o Educacin de la figura 1), el trmino de error es limitado a cero.
En el caso de modelos de regresin y trayectorias, slo es posible modelar variables observadas, y solamente la variable dependiente de la regresin o las variables endgenas del modelo de trayectorias, tienen estimaciones de error. Las variables independientes en la regresin y las variables exgenas en el modelo de trayectorias se asumen medidas sin error. El modelo de trayectorias es similar al MES, ya que tambin usa valos y flechas. Es por estas razones que el MES se considera superior a la regresin y a al modelo de trayectorias.
Trminos de error estructural. Ntese que los trminos de error antes mencionados no deben confundirse con los trminos de error estructural que son tambin llamados trminos de error residual o trminos de disturbio. Este error refleja la varianza no explicada de las variables latentes endgenas debido a las causas no medidas. Se usa la letra griega zeta , para su identificacin (1-R cuadrada).
Coeficientes estructurales o de trayectorias. Son los efectos de tamao (size effect) y se presentan como valores junto a las flechas del modelo que conectan a variables latentes entre s. Tambin se le denominan pesos de regresin (coeficientes beta) y cabe mencionar que no hay intercepto.
Los coeficientes del modelo (pattern coeficientes), en el caso de los ndicadores, se les conoce como cargas factoriales o coeficientes de validez; las variables latentes del MES son similares a los factores identificados en un anlisis factorial y los indicadores tambin tienen una carga en su variable latente. Estos coeficientes se asocian con las flechas que parten de las variables latentes y llegan a los indicadores. Es un acuerdo que los indicadores deben tener una carga mnima de .70 (Schumacker y Lomax, 2004: 212), y cabe mencionar que la carga factorial puede usarse para evaluar la confiabilidad de las variables latentes.
La confiabilidad aceptable de un indicador, en relacin a su constructo (variable latente), se establece como una carga factorial mnima es .70. Considrese sl i como las cargas estandarizadas de los indicadores de una variable en particular y e i como los trminos de error respectivos, donde el error es 1 menos la confiabilidad del indicador, que es el cuadrado de la carga estandarizada del indicador.
Por ello, la confiabilidad es igual a [(SUMA(sl i 2 )]/[(SUMA(sl i 2 ) + SUMA(e i ))].
Ahora bien, la validez del modelo tambin se deriva de las cargas factoriales de los indicadores. Esta puede verse desde el enfoque de validez convergente y validez discriminante: 20 Validez convergente. Es demostrada con correlaciones aceptables entre indicadores de una misma variable latente. Indicadores de ajuste de un modelo apoyan la validez convergente con coeficientes del modelo iguales o superiores a .70.
Validez discriminante. Es demostrada cuando los indicadores de una variable latente correlacionan mejor con dicha variable latente que con otra(s) variable(s) latente(s). Este tipo de validez tambin puede determinarse cuando los ndices de modificacin (MI) no sealan la necesidad de cargar algn(os) indicador(es) con una variable latente que no le corresponde. Por otro lado, Anderson y Gerbing (1988) recomiendan probar cada par de variables latentes por separado, primero sin limitar (constreir) y luego con la correlacin limitada a 1.0, esperando que la correlacin limitada tenga un ajuste significativamente menor.
Coeficientes estructurales estandarizados. Generalmente los investigadores usan coeficientes estandarizados al calcular la matriz correlacional (o de covarianzas). La interpretacin es similar a la hecha con la regresin: si el coeficiente estructural es 2.0, entonces la variable latente dependiente aumenta en 2.0 unidades estndar por cada aumento unitario de la variable latente independiente.
En LISREL, el resultado Eta es la matriz correlacional de las variables latentes dependientes e independientes. Eta es un coeficiente correlacin no lineal y se le conoce como la solucin completamente estandarizada o Matriz correlacional para Eta.
La razn crtica y la significancia de los coeficientes de trayectorias. Cuando la razn crtica de un peso de regresin es mayor a 1.96, entonces es significativa a nivel de .05. En el caso de LISREL la razn crtica es el puntaje z.
3.5 Otros trminos relacionados con el MES.
En el punto anterior destacan el error de medicin asociados con los indicadores y las variables latentes, al que se le denomina cmo confiabilidad. Tambin destacan los coeficientes de los indicadores y de las trayectorias, puesto que son la evidencia de su validez.
Ahora se presentan otros trminos que contribuyen a determinar la varianza explicada de las variables endgenas y el modelo integral propuesto por el investigador.
Estructura factorial. Trmino general usado para referir los coeficientes del modelo (todas las cargas factoriales del modelo) y que es utilizado para determinar la varianza explicada por el modelo. Es un acuerdo que la varianza extrada del modelo como mnimo debe ser .50 . Su formula es una modificacin de la confiabilidad del constructo, y es: [(SUMA(sl i 2 )]/[(SUMA(sl i 2 ) + SUMA(e i ))].
Comunalidad. Es el cuadrado de la carga factorial y ella estima la comunalidad de cada variable. Ella mide el porcentaje de varianza de un indicador (reactivo) explicada por la variable latente (factor) y puede interpretarse como la confiabilidad de dicho indicador.
R cuadrada o la correlacin mltiple cuadrada (SMC). Hay una R cuadrada o correlacin mltiple cuadrada (SMC) para cada una de las variables latentes del modelo. 21 La SMC es el porcentaje de varianza explicada de la variable y se reporta como un ndice de ajuste de cada ecuacin del modelo estructural. SMC para la(s) variable(s) Y: Esta es reportada por LISREL e informa el porcentaje de varianza de los indicadores dependientes que se atribuyen a la(s) variable(s) latente (s) dependiente(s). SMC para la variable(s) X: Esta es reportada por LISREL e informa el porcentaje de varianza de los indicadores independientes que se atribuyen a la(s) variable(s) latente(s) independiente(s). SMC para las ecuaciones estructurales: Esta es reportada por LISREL e informa el porcentaje de varianza de la(s) variable(s) dependiente(s) latente(s) que se atribuyen a la(s) variable(s) independiente(s) latente(s).
Quantiles o Q-Plots o Stem and Leaf Plots. Son tablas que LISREL reporta y ellas ordenan los residuales estndarizados por tamao y calculan los puntos porcentuales en una distribucin muestral. Adems, los residuales son graficados contra las desviaciones normales que corresponden a dichos puntos porcentuales, llamados quantiles. Los Stem and Leaf Plots son calculados por LISREL y se muestran en el captulo 5 de ejemplos del LISREL.
3.6 Clculo de coeficientes de estimacin de MES. Con LISREL, los coeficientes del MES pueden calcularse de diversas maneras. La primera (MLE) es la ms usada:
1. Estimacin de mxima verosimilitud o maximum likelihood estimation (MLE). MLE es el ms popular y busca maximizar la probabilidad de que las covarianzas observadas sean tomadas de una poblacin. Esto es, la MLE selecciona estimaciones que tienen la mayor posibilidad de reproducir los datos observados. Los supuestos de la MLE son: los errores de estimacin s correlacionan; muestras grandes; y los indicadores se distribuyen normalmente y son medidos a nivel intervalar. En el captulo de ejemplo, se usa este mtodo. 2. Estimacin Bayesiana. Usa informacin previa acerca de los parmetros del modelo para calcular distribuciones. Este tipo de estimacin se prefiere cuando se tiene una muestra pequea, cuando la MLE arroja varianzas negativas o se tienen datos ordinales. 3. Mnimos cuadrados ponderados o weighted least squares (WLS). Se usa cuando se viola normalidad. 4. Mnimos cuadrados generalizados o generalizad least squares (GLS). Funciona bien con muestras mayores a 2,500 personas o casos y distribuciones no normales. 5. Mnimos cuadrados ordinarios o ordinary least squares (OLS). Usado para obtener estimaciones iniciales de parmetros requeridos por otros mtodos. 6. Mnimos cuadrados no ponderados o unweighted least squares (ULS). No requiere asumir normalidad y no ofrece pruebas de significancia, y es el nico modelo que depende de la escala (estimaciones diferentes para diferentes variables).
A manera de resumen, en esta etapa se ha propuesto un modelo que conecta indicadores con sus respectivas variables latentes, y que conecta variables exgenas y endgenas a fin de explicar un fenmeno. Tambin se enfatiz la importancia del clculo de coeficientes que se utilizan para estimar la confiabilidad de los indicadores y 22 las variables latentes y la validez predictiva de las variables independientes, tal cmo ocurre en el caso de la regresin mltiple.
Ahora es el turno de evaluar la validez integral del modelo; eso es, la compatibilidad de los datos observados con el modelo terico propuesto.
Etapa 4. Prueba del modelo MES.
Ahora se evala que tan bien los datos se ajustan al modelo terico, mediante las siguientes pruebas:
a. Pruebas globales de bondad de ajuste o ndices de ajuste: La ms popular es la Ji cuadrada. Kline (1998) recomienda la eleccin de cuatro ndices.
En el captulo 3 se presenta una larga lista de indicadores entre los cules el investigador puede elegir lo ms apropiados.
b. Pruebas individuales de parmetros: Se usa la prueba t de student.
Etapa 5. Modificacin del modelo.
Si no hay ajuste del modelo, que es lo ms usual, entonces el modelo debe modificarse y evaluarse de nueva cuenta. Por ejemplo, el paquete LISREL tiene la opcin de modification indices o ndices de modificacin que sugieren qu restricciones estn en desacuerdo con los datos observados; esto tambin se explica en el captulo 5 de ejercicios.
Los ndices de modificacin (IM) se relacionan con la prueba multiplicadora de Lagrange (LM). Los IM generalmente se usan para modificar los modelos a fin de obtener un mejor ajuste, y esto debe hacerse de acuerdo con la teora. Las flechas slo deben agregarse cuando existe una justificacin terica; la mejora es medida en trminos de reduccin de la Ji cuadrada.
Modificacin de modelos. La construccin es una estrategia que inicia con un modelo nulo o un modelo simple al que se le aaden trayectorias de manera gradual (una por una). Conforme se aaden trayectorias, la Ji cuadrada _2 (una prueba que se explica en el captulo 3) disminuye y mejora el ajuste del modelo. La agregacin de trayectorias debe hacerse de acuerdo a la teora
Otra estrategia de construccin consiste primero en sobreajustar el modelo y posteriormente en recortar o quitar trayectorias, una a la vez, de acuerdo a la Ji cuadrada y otros ndices de modificacin (presentados en el captulo 3), hasta obtener ndices de ajuste satisfactorios.
23 CAPTULO 3. MEDICIONES DE AJUSTE DEL MODELO.
En este captulo se presentan varias pruebas o ndices de ajuste que el investigador consulta para determinar la validez del modelo estructural, de acuerdo a la etapa 4 del captulo anterior. LISREL calcula varios de ellos, tal como se apreciar en el captulo 5 de ejercicios.
Pruebas o ndices de bondad de ajuste. Sirven para determinar si el modelo debe aprobarse o rechazarse; estos indicadores no determinan qu trayectorias son significativas. Si el modelo es aceptado, por separado el investigador debe interpretar los coeficientes de las trayectorias.
Jaccard y Wan (1996) recomiendan que como mnimo se consulten tres pruebas de las cinco categoras abajo presentadas. Por otro lado, Kline (1998) propone que cuando mnimo se consulten cuatro: Ji cuadrada; GFI; NFI o CFI; NNFI o SRMR.
Debe tenerse en cuenta que la bondad de ajuste no es lo mismo que fuerza de la relacin, ya que es posible obtener un ajuste perfecto con variables no correlacionadas. As mismo, entre ms bajas son las correlaciones entre variables, es ms fcil obtener bondad de ajuste. Pero, cuando las correlaciones son bajas, los coeficientes de trayectorias tambin sern bajos: por lo tanto, es necesario reportar pruebas de ajuste y coeficientes estructurales.
Una buena bondad de ajuste no significa que todas las partes del modelo ajusten bien. Es posible que modelos alternativos puedan ajustar mejor. Eso es, los ndices de ajuste descartan modelos, pero no indican cual es el mejor. Tambin es importante sealar que un buen ajuste no significa que las variables exgenas sean las causas de las variables endgenas. Tambin es posible obtener un mal ajuste debido a un pobre modelo de medicin (AFC) y no por un errneo modelo estructural.
Los ndices deben verse como medidas sobre qu tanto ha avanzado una especialidad o una teora: se considera que valores de .90 de CFI son aceptables, pero un CFI de .85 puede mostrar qu rea de conocimiento ha mejorado si un modelo anterior report .70.
Debe advertirse que tanto los paquetes LISREL, AMOS, EQS o MpPlus no calculan todas la pruebas abajo enlistadas, y conforme se desarrollan dichos paquetes y se publican nuevas versiones, cambian las pruebas realizables. El lector no debe olvidar que Kline (1998) propone que cuatro pruebas son suficientes para el MES.
3.1 Primera categora de ndices de ajuste. Pruebas de bondad de ajuste de covarianzas pronosticadas y observadas (ndices absolutos de ajuste).
Estas pruebas comparan la matriz de covarianzas observadas y la esperada por la teora. LISREL realiza el anlisis con este tipo de matrices, y tambin puede hacerlo con matrices correlacionales (pue da el mismo resultado).
24 1. Ji cuadrada _2. Tambin se le conoce como discrepancia, Ji cuadrada de razn de verosimilitud, o Ji cuadrada de bondad de ajuste, o CMIN (en AMOS). Esta prueba no debe ser significativa si es que hay un buen ajuste. Si la probabilidad de la Ji cuadrada es de .05 o menor, entonces se dice que la covarianza del modelo trerico es diferente a la covarianza de los datos observados. Pero, debido a que la Ji cuadrada es conservadora (propensa al error de tipo II), es conveniente descartar una Ji cuadrada significativa si otras pruebas apoyan el modelo.
Hay maneras en que la Ji cuadrada puede equivocarse: a) en el caso de grandes muestras, es mayor la probabilidad de rechazar el modelo y el error de tipo II (rechazar algo verdadero). An pequeas diferencias entre ambas covarianzas se califican como significativas y b) la Ji cuadrada es muy sensible ante desviaciones de la normalidad. Una solucin es la consulta de la prueba Satorra-Bentler scaled Chi Square (prueba 3).
2. Ji cuadrada relativa. Tambin conocida como la Ji cuadrada normal y se obtiene al dividir la Ji cuadrada entre los grados de libertad (Ji cuadrada/DF), a fin de reducir su dependencia del tamao de muestra.
Carmines y McIver (1980) proponen que el resultado de un modelo aceptable debe estar en el rango de 2:1 o 3:1. Un valor menor a 1.0 es inaceptable.
3. Ji cuadrada escalada de Satorra-Bentler. Es un ajuste a la Ji cuadrada que es castigada por la kurtosis de los datos. Este estadstico busca corregir el sesgo introducido por la anormalidad de la distribucin.
4. ndice de bondad de ajuste (GFI). Se le conoce como el gamma-hat o Jreskog-Srbom GFI. El valor de GFI vara entre cero y 1, pero pueden obtenerse valores negativos. Una muestra grande favorece el GFI. Aunque hay analoga con R cuadrada, el GFI no puede interpretarse como el porcentaje de error explicado por el modelo. Es el porcentaje de la covarianza observada explicada por la covarianza terica. Es un acuerdo que valores superiores a .90 apoyan el modelo.
5. ndice de bondad de ajuste ajustada (AGFI). Es una variante del GFI, ya que lo ajusta por sus grados de libertad: la cantidad (1-GFI) es multiplicada por la razn de los grados de libertad del modelo dividido por los grados de libertad de la lnea base del modelo, entonces AGFI es 1 menos el resultado. AGFI tambin debe ser mayor a .90
6. Residuales de la media de raz cuadrada (RMS, RMSR o RMR). En ingls se le conoce como root mean square residuals y es la media absoluta de los residuales de la covarianza. Entre ms cercano sea el valor a cero, mejor es el ajuste. Valores menores a .10 se consideran aceptables. Debido a que RMS es difcil de interpretar, es mejor usar el SRMR (ver prueba 7). El RMR no estandarizado es un coeficiente que resulta de tomar la raz cuadrada de la media de los residuales elevados al cuadrado, que es la cantidad por la cual la varianza y covarianza de la muestra difieren de la varianza y covarianza estimada. 25
7. Residual estandarizado de la raz cuadrada media (SRMR). En ingls se le denomina standardized root mean square residual y es la diferencia promedio entre las varianzas y covarianzas pronosticadas y observadas, basada en el error estndar del residual. Entre menor sea el SRMR, mejor el ajuste del modelo. Un valor inferior a .05 es considerado aceptable.
8. Hoelter N crtico. til para determinar si el tamao de muestra es adecuado. Un tamao de muestra es adecuado si la prueba Hoelter N es mayor a 200 y se calcula as: (((2.58+(2df - 1)*2)*.5)/((2chisq)/(n-1)))+1
Chisq es Ji cuadrada.
3.2 Segunda categora de ndices de ajuste. Pruebas de bondad de ajuste de estimacin de mxima verosimilitud.
Tambin son ndices absolutos de ajuste, pero de un tipo diferente. Estos ndices son apropiados para comparar modelos que han sido estimados por mxima verosimilitud (MLE) y estos no tienen puntos crticos como .90, ya que se usan para comparar modelos donde un valor menor representa un mejor ajuste.
9. Akaike criterio de informacin (AIC). Este estadstico ajusta la Ji cuadrada a fin de penalizar la complejidad del modelo por falta de parsimonia y sobreparametrizacin. AIC se usa para comparar modelos y para interpretar un slo modelo, y puede comparar modelos con diferentes nmeros de variables latentes que pueden estar o no anidadas. Entre ms bajo es el valor de AIC mejor es el ajuste del modelo (cero es el valor de mejor ajuste). La modificacin de un modelo es suspendido cuando el AIC aumenta. AIC se calcula s: (chisq/n) + (2k/(n-1)) donde k = (.5v(v+1))-df, y v es el nmero de variables y df son grados de libertad.
Cuando AIC en igual o menor a 2 no hay evidencia en contra del modelo, cuando est entre 2 y 4 hay evidencia dbil en contra del modelo y cuando es mayor a 4 hay evidencia en contra del modelo. AICC es una versin para modelos con muestras pequeas (ver tabla 2).
10. BIC p. Es un estadstico que cambia la escala de Akaike a fin de que los factores sumen 1.0. Los valores representan las probabilidades y la suma de todos los modelos da 100% y esto indica que uno de los modelos es el correcto. Un modelo que tenga .60 seala que dicho modelo tiene 60% de ser el correcto. En otras palabras, el modelo corregido es aquel con mayores posibilidades de ser el correcto.
11. BIC L. Tambin es un estadstico que cambia la escala de Akaike a fin de que los factores sumen 1.0. Valores de .05 o mayores consideran que el modelo es el ms probable.
26
12. CAIC. Tambin es consistente con AIC y penaliza las pequeas muestras y la complejidad del modelo. Entre menor es el valor de CAIC mejor es el ajuste.
13. BCC o criterio Browne-Cudeck. Este estadstico debe lograr valores de .90 o superiores y se calcula as: (chisq/n) + ((2k)/(n-v-2)), donde nes el nmero de sujetos, v es el nmero de variables, y k = (.5v(v+1))-df, donde df es grados de libertad.
14. ECVI o ndice esperado de validacin cruzada. Es til para comparar modelos no anidados como ocurre con el anlisis multimuestras usado para validar o replicar hallazgos. Al igual que AIC refleja la discrepancia entre las matrices de covarianza del modelo terico y los datos. Ente menor es el valor de ECVI mejor es el ajuste. Al comparar modelos anidados, ECVI penaliza el nmero de parmetros libres.
15. MECVI. Es el ECVI modificado y tambin es una variante de BCC y penaliza la complejidad del modelo. Entre menor es el valor MECVI, mejor es el ajuste.
16. CVI o ndice de validacin cruzada. Es similar a ECVI y MECVI, y un valor de cero indica que ambas covarianzas son similares, la de la muestra de calibracin y la de la muestra de validacin o replica. Es posible calcular una doble validacin cruzada al intercambiar los papeles de ambas muestras.
17. BIC o criterio bayesiano de informacin. Tambin se le conoce como ABIC o criterio bayesiano de informacin Akaike. Al igual que CAIC, este estadstico penaliza el tamao de muestra y la complejidad del modelo. Comparado con AIC, BCC or CAIC, BIC favorece modelos parsimnicos con pocos parmetros, y se recomienda para muestras grandes con pocos parmetros. BIC es la aproximacin del logaritmo del factor Bayes del modelo terico comparado con el modelo saturado. Si BIC es igual o menor a 2 no hay evidencia en contra del modelo, si est entre 2 y 4, hay dbil evidencia en contra del modelo, y si es mayor a 4, entonces hay evidencia en contra del modelo.
3.3 Tercer categora de ndices de ajuste. Pruebas de bondad de ajuste de no centralidad.
Estos ndices prueban la propuesta de que la Ji cuadrada es mayor a cero, en vez de usar la usual hiptesis nula de que la Ji cuadrada es igual a cero. Por lo tanto, usa la distribucin no central de Ji cuadrada y los grados de libertad asociados con el modelo saturado en vez de los asociados con el modelo de independencia. Estos estadsticos estn influidos por el tamao de muestra; entre mayor es el tamao de muestra mejor es el ajuste.
27 18. Parmetro de no centralidad (NCP). Tambin se le conoce como el parmetro de no centralidad de McDonald o DK, y es una Ji cuadrada que penaliza la complejidad del modelo. Se calcula as: ((chisqn-dfn)-(chisq-df))/(chisqn-dfn), donde chisqn y chisq son las Ji cuadradas del modelo nulo y del modelo terico, dfn y df son sus correspondientes grados de libertad. A fin de forzar la escala a 1, la conversin usada es exp(-DK/2). NPC es usada con una tabla de distribucin de Ji cuadrada de no centralidad para evaluar el poder y calcular los estadsticos RMSEA, CFI, RNI y CI. Notar que LO 90 y HI 90 son los lmites inferior y superior del intervalo de confianza del 90%.
19. CI o ndice de centralidad. Parte de la Ji cuadrada, de los grados de libertad del modelo y el tamao de la muestra. Se espera que un modelo aceptable tenga un CI igual o mayor a .90.
3.4 Cuarta categora de ndices de ajuste. Pruebas de bondad de ajuste que comparan un modelo terico con el modelo nulo o alternativo.
Usualmente el modelo de comparacin es el de independencia, puesto que es el que tiene la peor Ji cuadrada (la mayor).
20. CFI o ndice d ajuste comparativo. Tambin se le conoce por el ndice comparativo de ajuste de Bentler y compara el modelo terico con el modelo nulo que asume que las variables latentes del modelo no se correlacionan entre si (modelo de independencia). Eso es, compara la matriz de covarianza de datos observados con la matriz de covarianza del modelo nulo (matriz con ceros). CFI es similar a NFI, pero penaliza el tamao de muestra. CFI y RMSEA son los estadsticos menos afectados por el tamao de muestra, y un CFI cercano a 1.0 indica un muy buen ajuste y valores superiores a .90 se consideran aceptables. El CFI tambin es usado para evaluar variables modificantes (aquellas que crean una relacin heteroscedstica entre las variables independientes y dependientes, de tal manera que la relacin vara por clase de modificador).
CFI se calcula as: (1-max(chisq-df,0))/(max(chisq-df),(chisqn-dfn),0)), donde chisq y chisqn son las Ji cuadradas del modelo terico y del modelo nulo, y df y dfn son los grados de libertad respectivos.
21. IFI o ndice incremental de ajuste. Tambin se le denomina IFI de Bollen o Delta 2, y se calcula as: (Ji-cuadrada del modelo nulo Ji cuadrada del modelo default )/(Ji cuadrada del modelo nulo grados de libertad del modelo default). Para aceptar el modelo IFI debe ser igual o mayor a .90 y este estadstico es relativamente independiente del tamao de muestra.
22. NFI o ndice de ajuste normado. Es conocido como el ndice normado de Bentler-Bonett o Delta1. Es una alternativa del CFI, pero no requiere cumplir 28 con supuestos de la Ji cuadrada. Normado significa que vara entre 0 y 1, donde 1 es ajuste perfecto.
NFI se calcula as: (Ji cuadrada del modelo nulo Ji cuadrada del modelo default)/Ji cuadrada del modelo nulo.
El NFI refleja la proporcin en que el modelo terico mejora el ajuste en relacin con el modelo nulo. Por ejemplo, un NFI de .50 significa que el modelo mejora en un 50% el ajuste. Valores entre .90 y .95 son aceptables. Debido a que subestima el ajuste en el caso de muestras pequeas y no considera la complejidad del modelo, es preferible consultar el NNFI (TLI).
23. BBI o ndice Bentler-Bonnet. No confundirlo con el NFI. Es la Ji cuadrada del modelo terico menos la Ji cuadrada del modelo nulo, todo dividido por la Ji cuadrada del modelo nulo. El modelo debe ser superior a .90 a fin de tener buen ajuste.
24. TLI o ndice Tucker-Lewis, o NNFI . TLI es similar al NFI, pero penaliza la complejidad del modelo y es relativamente independiente del tamao de muestra.
TLI se calcula as:
(chisqn/dfn - chisq/df)/(chisqn/dfn - 1), donde chisq y chisqn son las Ji cuadradas del modelo terico y del modelo nulo, y df y dfn son los grados de libertad respectivos.
NNFI puede no estar dentro del rango 0 a 1, pero puede fijarse dentro de ese rango. Es el ndice menos afectado por el tamao de muestra y un NNFI negativo indica que la razn de modelo nulo es menor a la razn del modelo terico que ocurre cuando el modelo terico tiene pocos grados de libertad y las correlaciones son bajas.
Valores cercanos a 1.0 indican buen ajuste, se considera que valores superiores a .90 son aceptables, y el NNFI tiende a ser menor que GFI.
3.5 Quinta categora de ndices de ajuste. Pruebas de bondad de ajuste que penalizan la falta de parsimonia.
Estos ndices penalizan la complejidad del modelo y no usan los puntos de corte acostumbrados de .90. Se usan para comparar modelos y entre ms alto es el valor mejor es el ajuste.
25. PRATIO o razn de parsimonia. Es la razn de los grados de libertad del modelo terico a los grados de libertad del modelo independiente (nulo). El PRATIO no es una prueba de bondad de ajuste, pero se usa como el PNFI y el PCFI que favorecen modelos parsimnicos (modelos con pocos parmetros).
29 26. PNFI o ndice de ajuste pasimnico normado. Tambin se le denomina PNFI1 y es igual a PRATIO menos NFI. Entre ms cercano est el modelo terico al modelo saturado (trivial que explica todo), ms penalizado es el NFI. No hay valores de corte comnmente aceptados, pero un PNFI igual o mayor a .60 significa buena parsimonia, y al comparar modelos anidados, el modelo con un mayor PNFI es el mejor.
27. PCFI o ndice de ajuste de pasimonia comparado. Es igual a PRATIO por CFI, y entre ms cerca est el modelo terico al modelo saturado, ms se penaliza CFI. Al comparar modelos, el modelo con el menor PCFI es el mejor.
28. PGFI o ndice de ajuste de bondad parsimnico. PGFI es una variante del GFI, pero penaliza el GFI al multiplicarlo por la razn de los grados de libertad del modelo terico entre los grados de libertad del modelo independiente. Se considera que un PGFI igual o mayor a .60 indica buena parsimonia.
29. RMSEA o aproximacin de la raz cuadrada media del error. Se le conoce tambin como RMS o RMSE o discrepancia por grado de libertad. Se considera que un RMSEA igual o menor a .08 es satisfactorio. RMSEA es un ndice de ajuste popular porque no necesita compararse con un modelo nulo y tampoco requiere la propuesta de un modelo independiente. RMSEA tiene una distribucin relacionada con le distribucin Ji cuadrada no central y por ello no necesita de un muestro de tipo bootstrap para fijar intervalos de confianza.
RMSEA se calcula as:
((chisq/((n-1)df))-(df/((n-1)df)))*.5, donde chisq es la Ji cuadrada del modelo, df es grados de libertad y n es la cantidad de sujetos.
RMSEA corrige la complejidad del modelo, ya que el denominador es grados de libertad, pero se considera que grados de libertad es una medicin imperfecta de complejidad. Ya que RMSEA calcula el promedio de falta de ajuste por grado de libertad, es posible tener cero en falta de ajuste tanto en el modelo complejo como en el modelo simple. Por lo tanto, es conveniente tambin consultar el PRATIO, y considerar el intervalo de confianza del 90% de RMSEA donde el lmite inferior tiene valores cercanos a cero y el lmite superior valores inferiores a .08.
30. PCLOSE. Prueba la hiptesis nula de que RMSEA no es mayor a .05. Si PCLOSE es menor a .05, se rechaza la hiptesis nula y concluye que RMSEA es mayor a .05, indicando un bajo ajuste. LISREL le denomina P-Value for Test of Close Fit.
30 CAPTULO IV. SUPUESTOS DEL MES.
En los captulos anteriores se han presentado supuestos sobre la normalidad de los las variables, los grados de libertad y el tamao de la muestra. En este captulo se retoman, se tratan otros supuestos y proponen soluciones en caso de su violacin.
An cuando MES usa el anlisis de trayectorias, el MES relaja varios supuestos relacionados con el nivel de medicin de los datos, sus interacciones y la correlacin del error.
4.1. Distribucin multivariada normal de los indicadores. En el caso de la estimacin MLE, cada indicador debe estar normalmente distribuido, ya que an pequeas desviaciones de la normalidad pueden arrojar grandes diferencias en la Ji cuadrdada. Generalmente las violaciones de normalidad inflan la Ji cuadrada y el uso de mediciones ordinales o dicotmicas causan anormalidad.
El muestreo Bollen-Stine bootstrap y la prueba Ji cuadrdada ajustada Satorra- Bentler son utilizados para determinar el ajuste estructural en el caso de no normalidad. El paquete PRELIS de LISREL, puede realizar una prueba de Ji cuadrada para probar normalidad.
En el caso de datos discretos (datos categricos o datos ordinales con menos de 15 valores), se pueden considerar normales si las pruebas de sesgo (skewness) o kurtosis estn dentro de un rango de ms o menos 1.5 (Schumacker y Lomax, 2004: 69).
Severas desviaciones de normalidad ocurren con mayor frecuencia con variables binarias u ordinales. Por ello, Bollen (1989) y Jreskog y Srbom (1997) recomiendan el uso de correlaciones policricas (polychoric) junto con la estimacin WLS. LISREL, EQS y Mplus calculan la matriz de correlaciones policricas.
4.2. Distribucin multivariada normal de las variables dependientes latentes. Cada variable dependiente latente del modelo debe estar normalmente distribuida. Las variables dicotmicas violan este supuesto y por ello Kline (1998) recomienda el latent class analysis (LCA) en vez del MES. Si el modelo tiene violaciones de normalidad, pueden usarse las estimaciones de parmetros bootstrap.
4.3 Linealidad. El MES asume que la relacin entre indicadores y variables latentes, y entre variables latentes es lineal. La violacin de linealidad significa que las estimacin del ajuste del modelo y el error estndar estn sesgados (no robustos). Sin embargo, como en regresin, es posible usar transformaciones exponenciales, logartmicas y otras transformaciones no lineales. Estas transformaciones son aadidas mediante efectos cuadrticos o no lineales, o mediante una correlacin (flecha curva de doble punta).
31 4.4 Outliers o casos atpicos. La presencia de datos atpicos puede afectar el modelo. El muestreo jackknife puede identificar dichos casos. El procedimiento jackknife calcula los coeficientes de trayectorias para toda la muestra, y luego para muestras (n-1), donde elimina un caso. Lo mismo se hace con las covarianzas. Al comparar las diferencias en coeficientes de trayectorias y covarianzas entre la muestra total y muestras jackknife, es posible identificar outliers.
4.5 Datos incompletos o imputacin. Es conveniente tener una base de datos completa, o en su defecto, substituir los datos incompletos mediante un procedimiento de imputacin, debido a la posible introduccin de error de medicin que afecte el modelo. En el ejemplo 1 del captulo de ejercicios se muestra como imputar.
4.6 Subidentificacin o apenas identificacin del modelo. Como se mencion en el capitulo 2, un modelo apenas identificado ocurre cuando hay tantos parmetros por estimar como elementos en la matriz de covarianzas. Por ejemplo, si el modelo tiene una variable V1 que antecede a V2 y V3, y V2 tambin es causa de V3, entonces hay tres parmetros (flechas) en el modelo y hay tres elementos de covarianza (1,2; 1,3; y 2,3). En este caso es posible calcular las trayectorias, pero utiliza todos los grados de libertad y ya no es posible calcular pruebas de bondad de ajuste (cero grados de libertad, Ji cuadrada de cero y p no puede calcularse).
Un modelo esta subidentificado cuando hay ms parmetros por estimar que elementos en la matriz de covarianzas. Generalmente los paquetes reportan failure to converge o negative error variances
Estrategias para corregir subidentificacin o apenas identificacin:
a. Eliminar flechas de retroalimentacin o efectos recprocos b. Especificar en niveles fijos los coeficientes de estimacin que tienen confiabilidad conocida. c. Simplificar el modelo mediante la reduccin de flechas que es lo mismo que limitar un coeficiente de trayectoria a cero. d. Simplificar el modelo mediante la limitacin de flechas (estimacin de trayectorias) de las siguientes maneras: igualdad (ser igual a otro estimado); proporcionalidad (ser proporcional a otro estimado); o desigualdad (ser mayor o menor a otro estimado). Para saber que flechas deben limitarse a igual es necesario consultar critical ratios for differences; si una diferencia es menor a 1.96, entonces se acepta que ambos parmetros son iguales y se limitan dichos parmetros. e. Simplificar el modelo mediante la eliminacin de variables. f. Eliminar variables que tienen alta multicolinearidad con otras variables. g. Aadir variables exgenas. h. Tener al menos tres indicadores por variable latente. i. Elegir la opcin listwise, no pairwise, de missing data treatment. j. Considerar el uso de estimacin GLS o ULS en vez de MLE. 32 k. Si MLE (maximum likelihood estimation) es usado, hay dos soluciones ms: substituir los valores iniciales propuestos por el paquete y/o aumentar el nmero de iteraciones usadas para el logro de convergencia.
Es ideal para el MES contar con un modelo sobreidentificado, eso es, tener ms conocidos (variables observadas) que incgnitas (parmetros a estimar). Cuando hay sobreidentificacin, los grados de libertad son positivos (grados de libertad de la Ji cuadrada). Por ello, se recomienda correr un MES con datos ficticios a fin de determinar si el modelo est subidentificado o apenas identificado. Una solucin por subidentificacin consiste en aadir ms variables exgenas.
4.7 Recursividad. Los modelos recursivos nunca son subidentificados. Recursividad ocurre cuando una flecha slo va a una posicin y no tiene retroalimentacin (regreso).
4.8 No empricamente identificado por alta multicolinealidad. Un modelo puede ser tericamente identificado, pero no solucionable por problemas empricos como multicolinealidad o estimaciones de trayectoria cercanos a cero en modelos no recursivos.
Signos de multicolinearidad. a. Pesos estandarizados de regresin cercanos a 1 que dificultan el calculo de pesos de regresin diferentes para ambas trayectorias. El resultado es un peso estandarizado de regresin cercano a 1 y otro cercano a -1. Notar que los pesos varan entre -1 y 1 b. Los errores estndar de dos variables, que son causadas por una misma variable latente, son grandes en comparacin con otros errores de otras trayectorias dentro del modelo. c. Grandes covarianzas de las estimaciones de parmetros de dos trayectorias en comparacin con las covarianzas de otras trayectorias diferentes. d. Errores con varianza negativa de una variable que antecede a dos variables casi idnticas.
4.9 Datos de intervalo. La estimacin MLE asume que la medicin es de tipo de intervalo, pero en el caso de variables exgenas que son de tipo dicotmico o dummy se dificulta su uso como variable exgena, y por ello se recomienda la estimacin Bayesiana o el uso de la matriz de correlaciones policricas (LISREL).
4.10 Alta precisin. Ya sea que los datos sean de tipo intervalo u ordinal, los datos deben tener un amplio rango de valores (se recomienda un rango de 15).
4.11 Residuales aleatorios pequeos. La media de los residuales (covarianza observada menos la estimada) debe ser cero. Un modelo que ajusta bien debe tener residuales pequeos. Residuales grandes sugieren no especificacin (misspecification), como ocurre cuando se requiere aadir trayectorias al 33 modelo. La covarianza de los puntajes dependientes y los residuales debe ser cero, y la distribucin de residuales debe ser normal.
4.12 Trminos de error no correlacionados. Si los errores son especificados por el modelo, el error correlacionado puede ser estimado y modelado por MES.
4.13 Multicolinealidad. Se asume la ausencia de multicolinealidad, pero la correlacin entre variables independientes puede modelarse. Una alta multicolinealidad resulta en una matriz de covarianza a la que no puede calcularse la matriz inversa. LISREL informa que hay multicolinealidad mediante el mensaje matrix sigma is not positive definitive.
Posibles soluciones: a. En LISREL es posible aadir un ridge constant, que es un peso agregado a la diagonal de la matriz que cambia a positivo todos los nmero de la diagonal; b. quitar las variables que correlacionan alto; c. usar diferentes valores iniciales; d. usar estimacin ULS en vez de MLE; e. cambiar correlaciones tetracricas por correlaciones Pearson; y f. preferir listwise en vez de pairwie en el tratamiento de datos faltanes.
4.14 Covarianzas no cero. CFI y otros indicadores de ajuste comparan la covarianza terica con la observada. Cuando la covarianza observada se acerca a cero, no hay que explicar, y cuando las variables tiene una baja correlacin entre si, tambin ser difcil demostrar buen ajuste.
4.15 Tamao de muestra. No debe ser pequea puesto que el MES es sensible al tamao. Es comn encontrar estudios que tienen muestras entre 200 y 400 sujetos y modelos que analizan entre 10 y 15 indicadores. Kline (1998: 12) y Schumacker y Lomax (2004: 49) sealan que como mnimo se debe tener 100 sujetos, y Stevens (1996) propone 15 sujetos por cada indicador.
34 CAPTULO V. CUATRO EJERCICIOS DE LISREL (PRELIS Y SIMPLIS)
El lector puede realizar por cuenta propia cuatro ejemplos con el paquete LISREL versin estudiantil. En este capitulo se explica cmo descargar el paquete gratuito de internet y presenta imgenes que facilitan el uso de los comandos LISREL necesarios para correr el AFC , el MES y/o otros anlisis estadsticos.
El primer ejercicio (5.1) muestra cmo se preparan los datos con PRELIS, paso necesario para acceder a datos que vienen de SPSS u otras bases, o para la captura manual de datos; el segundo ejercicio (5.2) ensea cmo editar datos con PRELIS cuando el investigador se enfrenta a datos faltantes o missing; el tercer ejercicio (5.3) describe como hacer un anlisis factorial confirmatorio (AFC) mediante SIMPLIS; y el cuarto ejercicio (5.4) explica como se realiza el modelamiento de ecuacin estructural mediante SIMPLIS.
Posteriormente, es indispensable que el lector use sus propias bases de datos y repita los ejercicios de este captulo.
Pero antes de ir al primer ejercicio, es necesario tener en la computadora el paquete LISREL, ya sea en su versin estudiantil o la versin completa. A continuacin se describe paso a paso que hacer para bajar el paquete versin estudiantil.
Como primer paso, acceda a la siguiente pgina en Internet:
http://www.ssicentral.com/lisrel/downloads.html
El segundo paso consiste en dar click en el siguiente vnculo:
Student edition of LISREL for Windows
Se recomienda instalarlo en unidad C del disco duro de su computadora.
El tercer paso es abrir el LISREL y hay dos maneras de iniciar LISREL: Una es abrir C y la carpeta archivos del programa (figura 5 y figura 6) y la otra es mediante Todos los programas (figura 7).
En caso de elegir C y la carpeta archivos del programa (figura 5), de click en esa carpeta y ver que aparecen varias carpetas ms; ahora debe dar click a la carpeta LISWIN32S.EXE para iniciar LISREL (ver figura 6).
Verifique que se descarga el Free Student Edition y no el Free 25-day trial Edition! 35
Fuente. Elaboracin propia.
Figura 5: Disco local (C:) y carpeta Archivos del programa.
Fuente. Elaboracin propia.
Figura 6: Carpeta LISWIN32S.EXE
Una vez que dio click a la carpeta LISWIN32S.EXE, aparecer inmediatamente una pantalla como la de la figura 8 (Men de PRELIS). 36 La otra opcin para abrir LISREL es mediante Todos los programas (figura 7), en la que se da click en LISREL 88S y se abre la pantalla similar a la de la figura 8.
Fuente. Elaboracin propia.
Figura 7: Todos los programas: LISREL 88S
5.1. Ejercicio de introduccin de datos.
Un programa de LISREL conocido como PRELIS es usado para capturar datos que provienen de otros paquetes como SPSS o EXCEL, y para obtener: matrices de varianzas-covarianzas; matrices de correlaciones; medias y desviaciones estndar, todo ello necesario para hacer el anlisis MES en SIMPLIS o LISREL. Cabe mencionar que los datos tambin pueden ser introducidos directamente, pero en este ejemplo, se toman los datos de SPSS.
PRELIS usa una hoja de clculo y contiene un men con las opciones, tal como lo muestra la figura 8. En este caso se da click o abre File y se despliega un submen.
37
Fuente. Elaboracin propia.
Figura 8: Men de PRELIS
La opcin New o Nuevo permite la creacin de una sintaxis (sintaxis es un comando) que puede ser abierta por SIMPLIS y LISREL (figura 8 y 9). Esta opcin se usar ms adelante en el cuarto ejercicio (5.4). No la vamos a usar ahora.
La opcin Open (figura 8) sirve para abrir archivos PRELIS y LISREL, ms adelante se explica su uso.
Fuente. Elaboracin propia.
Figura 9. Opcin New del men PRELIS
Ahora, regrese a File y abra Import data (ver figura 8).
Import Data: Permite localizar archivos guardados de PRELIS (.pr2), SIMPLIS (.spl), LISREL (.ls8), SPSS (*.sav) o All files (*.*). La versin estudiantil tiene ejemplos en las carpetas pr2ex (PRELIS), splex (SIMPLIS) y ls8ex (LISREL). En este caso se busca la carpeta de Lisrel Student Examples que puede estar en el disco C (carpeta LISREL 8.8 Student examples), se abre y luego se abre la carpeta Tutorial. Los tres pasos se muestran en la figura 10. En caso de no encontrarlo, pdalo a hermanlittlewood@yahoo.com.mx.
38
Fuente. Elaboracin propia (3 pantallas).
Figura 10: Opcin Import Data del men PRELIS (en carpeta Tutorial dentro del archivo Lisrel student examples)
Para abrir un archivo SPSS, elija el archivo DATA100.sav, como muestran las figuras 10 12 y 11 13.
Asegrese que en la ventana Tipo debe seleccionarse SPSS for Windows (*.sav), ya que por default en la ventana tipo aparece la opcin Free Format Data (*.dat, *.raw).
Notar que en la ventana Tipo debe seleccionarse SPSS for Windows (*.sav), ya que por default en la ventana tipo aparece la opcin Free Format Data (*.dat, *.raw).
39
Fuente. Elaboracin propia.
Figura 11: Opcin Open (abrir) archivo SPSS del men PRELIS
Ahora, proceda a abrir el archivo data100.sav de SPSS, y luego guarde como DATA100.PSF (archivo PRELIS ). Ver figura 12.
Fuente. Elaboracin propia.
Figura 12: Opcin Open archivo data100.sav SPSS y guardar como PSF.
40 El archivo PRELIS DATA100.PSF guardado muestra un nuevo men (figura 13) que permite la edicin, transformacin, anlisis estadstico, y graficacin de los datos. La designacin es de datos ordinales puesto que las variables tienen menos de 15 categoras o intervalos. Note que se ha abierto Statistics en men y un submen.
Fuente. Elaboracin propia.
Figura 13. Nuevo men PRELIS (DATA.PSF): Opcin Statistics
Los anlisis estadsticos incluyen anlisis factorial clsico u ordinal, regresiones varias, y mtodos de cuadrados mnimos de dos pasos. Tambin es posible imputar datos (resolver casos de datos incompletos o faltantes), hacer anlisis de homogeneidad, anlisis de normalidad, y muestreo bootstrapping.
La opcin de men Output Options (figura 14) permite guardar matrices de varianzas-covarianzas y estadsticos descriptivos en archivos de sintaxis SIMPLIS o LISREL. Ahora de click en Statistics y luego de click en Output Options.
41
Fuente. Elaboracin propia.
Figura 14. Nuevo men PRELIS (DATA.PSF): Opcin Output Options.
Ahora de click en OK y se obtendr un reporte de las covarianzas que por su longitud es preferible no comentarlo en este ejercicio. Solamente se comenta que ya se tiene una matriz de covarianzas (tambin puede obtenerse una matriz de correlaciones como lo veremos en los siguientes ejercicios). Este tipo de matriz queda guardada AUTOMTICAMENTE en Tutorial de Student Examples (o en la carpeta que tiene abierta) con el nombre DATA100.COV y se usa para anlisis que se explican ms adelante en los ejercicios.
La matriz de covarianzas o de correlaciones, es necesaria para el AFC o el MES. Es importante aclarar que LISREL obtiene el mismo resultado de cualquiera de las dos matrices, pero es muy importante registrar que tipo de matriz se usa.
La matriz puede accederse mediante la opcin aqu explicada en este ejercicio, pero el investigador pudiera anotar directamente las covarianzas o correlaciones en la pantalla de LISREL, tal cmo se hace en el ejercicio 5.3. Por ello, hay dos maneras de meter covarianzas o correlaciones en LISREL
FIN DEL EJERCICIO 5.1
Seleccione: Escriba: 42 5.2. Ejercicio de edicin de datos (Imputacin).
Este ejercicio tiene la finalidad de practicar la imputacin o substitucin de datos faltantes que pueden alterar los resultados de la investigacin. Sin no faltan datos o son muy pocos los faltantes (menos del 5%), no es necesario imputar. Antes del ejercicio se explican casos de edicin requeridos, ya sea por el tipo de escala de medicin, por la restriccin de rango, as como por las diversas maneras de substituir datos faltantes mediante la imputacin.
5.2.1. La escala de medicin. La manera como se miden o escalan las variables influye en los anlisis estadsticos. Por ejemplo, con una escala de tipo nominal (por ejemplo, sexo), no deben calculrsele la media o desviacin estndar, y slo procede el clculo de porcentajes por categora. Otro ejemplo es una escala de tipo ordinal como la escala de actitud de tipo Likert que permite el ordenamiento de categoras.
PRELIS reconoce datos continuos (CO) u ordinales (OR), y puede calcular diferentes tipos de correlaciones dependiendo del nivel de medicin (nominal, ordinal, intervalar o de razn). Una matriz de varianzas-covarianzas de datos continuos (CO) usa correlaciones Pearson y una matriz de datos ordinales (OR) puede usar correlaciones tetracricas (policricas o poliseriales).
Si hay sesgo de datos (distribucin no normal), entonces puede usarse la transformacin lineal Probit, o bien puede usarse una matriz de varianza-covarianza asympttica.
5.2.2. Restriccin de rango. Datos con niveles de medicin intervalar o de razn pueden ser discretos o continuos. Por ejemplo, el nmero de hijos se reporta en enteros (discreto) y el promedio acadmico puede reportarse con decimales (continuo).
PRELIS puede definir si la variable es ordinal (OR) o continua (CO), dependiendo de la presencia de 15 puntos escalares. Si la variable tiene menos de 15 categoras, entonces se le denomina ordinal (OR) y si tiene 15 o ms, entonces es continua (CO). El criterio de 15 puntos permite que la correlacin Pearson vare entre 0 y 1. En consecuencia, una escala Likert de 5 opciones, debe usar la OR.
5.2.3. Datos faltantes. Los datos faltantes afectan el anlisis estadstico y es comn substituirlos. Las opciones para el manejo de datos faltantes son:
Listwise: Borrar sujetos de todas las variables con algn dato faltante en cualquier variable. Pairwise: Borrar al sujeto slo en aquella variable donde tenga un dato faltante. Substitucin de media: Substituir el dato faltante con la media de la variable. Imputacin por regresin: Substituir con el valor pronosticado el valor faltante. Maximum Likelihood (EM): Substituir con el valor esperado. Match Response Pattern: Parear variables con datos de variables completas.
43 La eleccin del mtodo afectar la cantidad de sujetos disponibles para el anlisis. Listwise y Pairwise tienden a sacrificar sujetos y reducir el tamao de muestra. La substitucin de media es posible cuando faltan pocos datos y la imputacin por regresin es til cuando es moderada la falta de datos. El EM se recomienda cuando es relativamente grande la falta de datos y la falta es aleatoria.
A continuacin se presenta un ejemplo PRELIS de imputacin.
La imputacin puede hacerse para una sla variable (Impute Missing Values) o para muchas variables (Multiple Imputation), mediante la opcin Statistics del men (figura 13). La imputacin individual se hace con Match Response Pattern y la mltiple con la substitucin de medias, la eliminacin de casos, o EM.
El ejemplo usado es el archivo chollev.dat (en carpeta Tutorial y tipo Free format) de niveles de colesterol de 28 pacientes que han sufrido de infarto. Se asume que los datos faltan de manera aleatoria (MAR) y que se distribuyen normalmente. El colesterol es medido a los dos das (VAR1), a los 4 das (VAR2) y a los 14 das (VAR3) del infarto, pero slo en 19 de los 28 pacientes en VAR3. Los primeros 18 renglones (figura 17) son mostrados.
Selecione Import Data, seleccione la carpeta LISREL 8.8 Student Examples, en la carpeta Tutorial (ver figura 15), abra el archivo chollev.dat en Free Format, gurdelo como chollev.psf y elija Number of variables 3 OK a fin de crear el archivo PRELIS. Antes, el archivo SPSS defini los datos faltantes para VAR3 como -.9.00.
44
Fuente. Elaboracin propia.
Figura 15: Archivo chollev.dat
Se abre la siguiente ventana (figura 16) ventana.que por default muestra como tipo PRELIS Data. Escriba en la ventana Nombre: CHOLLEV.PSF y de click en guardar.
Seleccione la opcin Free Format!! luego seleccione chollev.dat aparecer en la ventana nombre y de click en abrir cohbe.daty oprima!!
45
Fuente. Elaboracin propia.
Figura 16: Archivo CHOLLEV.PSF (PRELIS).
Al guardar se abre una nueva ventana (figura 17), ahora en number of variables seleccione 3 (porque son tres variables) y dar click en Ok se abrir la ventana que muestra la figura 19 y en ella se pueden ver las tres variables y sus valores.
Fuente. Elaboracin propia.
Figura 17: Number of variables
Como se mencion, una vez que dio click en OK, se abre una ventana que muestra las tres variables con sus respectivas variables por sujeto (figura 18).
46
Fuente. Elaboracin propia.
Figura 18: Las tres variables y sus valores
Seleccione la opcin Data del men y vea como en la figura 19 se abre el men Define variables seleccione VAR3 como la variable faltante en Missing Values y se escribe - 9.00000 y da OK: Se eligi VAR3 porque es la nica variable en la que faltan datos (marcados con -9.00)
Recuerde que solo hay datos faltantes en VAR 3 47
Fuente. Elaboracin propia.
Figura 19: VAR3 de Chollev.PSF (PRELIS), en men Data y submen Define Variables
Ahora de click en OK dos veces y guarde el valor de -9.0000 oprimiendo el cono cuadrado (parcialmente en amarillo) del men que est debajo Data y Transform.
Al oprimir cambia el color
48 A continuacin vaya al men Statistics (figura 20) y bsque Impute Missing Values (o Multiple Imputation para substituir dos o ms variables faltantes con medias).
Fuente. Elaboracin propia.
Figura 20: Impute Missing Values de VAR3 de Chollev.PSF (PRELIS).
De click en Impute Missing Values. Se abre la ventana (figura 21). Ahora ingrese VAR3 en la ventana Imputed variables y VAR1 y VAR2 en la ventana Matching Variables, y oprima Output Options para abrir una nueva ventana (figura 22) y guarde los datos transformados en cuatro nuevos archivo de PRELIS: cholnew.psf; el resultado (output) de una matriz correlacional (cholnew.cor); means o medias (cholnew.me); y desviaciones estndar (cholnew.sd). Luego oprima Run.
Tambin se puede poner a prueba la normalidad bivariada de los datos.
49
Fuente. Elaboracin propia.
Figuras 21 y 22: Output Options de VAR3 de Chollev.PSF (PRELIS).
Por el momento usted slo ha calculado los resultados DESPUS de la imputacin o substitucin de datos faltantes, y es tambin es posible hacer clculos sin imputacin al archivo chollev.psf (ANTES de la imputacin).
Puede compararse resultados ANTES y DESPUES de imputar. Ahora examine los resultados despus de la imputacin y comprelos con el antes; para ello debe ver el archivo chollev.psf y tambin el cholnew.psf. Por ejemplo la media (mean) de VAR3 antes de la imputacin es 221.474 y despus de la imputacin es 220.714, un tanto diferente.
ANTES DE LA IMPUTACIN
Number of Missing Values per Variable VAR1 VAR2 VAR3 -------- -------- -------- 0 0 9 Distribution of Missing Values Total Sample Size = 28 Number of Missing Values 0 1 Number of Cases 19 9
Effective Sample Sizes Univariate (in Diagonal) and Pairwise Bivariate (off Diagonal) VAR1 VAR2 VAR3 -------- -------- -------- VAR1 28 VAR2 28 28 VAR 19 19 19
Number of Missing Values per Variable VAR1 VAR2 VAR3 -------- -------- -------- 0 0 9 Imputations for VAR3 Case 2 imputed with value 204 (Variance Ratio = 0.000), NM= 1 Case 4 imputed with value 142 (Variance Ratio = 0.000), NM= 1 Case 5 imputed with value 182 (Variance Ratio = 0.000), NM= 1 Case 10 imputed with value 280 (Variance Ratio = 0.000), NM= 1 Case 13 imputed with value 248 (Variance Ratio = 0.000), NM= 1 Case 16 imputed with value 256 (Variance Ratio = 0.000), NM= 1 Case 18 imputed with value 216 (Variance Ratio = 0.000), NM= 1 Case 23 imputed with value 188 (Variance Ratio = 0.000), NM= 1 Case 25 imputed with value 256 (Variance Ratio = 0.000), NM= 1
Number of Missing Values per Variable After Imputation VAR1 VAR2 VAR3 -------- -------- -------- 0 0 0
Como puede apreciarse en el archivo cholnew.psf, los datos faltantes han sido substituidos (imputados) en VAR3: Caso 2 = 204, caso 4 = 142, caso 5 = 182, caso 10 = 280, etc. (ver figura 23). Cholnew.psf se abre dndole click a File, luego click a Open (asegurar que el tipo de archivo es PRELIS data (*.psf). y luego dndole click a Cholnew.PSF.
Nota: Se recomienda imputar cuando falta ms de 5% de los datos.
Ojo, abra el archivo nuevo cholnew.PSF con la opcin File Open, en la ventana Tipo debe elegirse PRELIS Data (*.psf). No vea el archivo chollev.PSF, vea cholnew.PSF. Fuente. Elaboracin propia.
Figura 23: VAR3 sin datos faltantes de cholnew.PSF (PRELIS).
La figura 24 muestra las dos bases de datos juntas, antes y despus de la imputacin. Los valores -9.000 han sido substituidos. 52
Antes Despus Figura 24: Bases de datos antes y despus de la imputacin.
A manera de resumen, en este ejercicio se substituyeron los datos faltantes y se crearon tres archivos que contienen informacin de correlaciones (cholnew.cor), medias (cholnew.me) y desviaciones estndar (cholnew.sd) necesarios para realizar el AFC y el MES.
FIN DEL EJERCICIO 5.2.
5.3. Ejercicio de modelo de medicin o anlisis factorial confirmatorio (AFC).
Como se mencion, el AFC busca validar la medicin de las variables latentes mediante sus variables observadas (indicadores o reactivos) y el diagrama de AFC muestra cmo crculos (variables latentes) se conectan con rectngulos (variables observadas), pero sin flechas rectas que conecten a variables las variables latentes entre s. Dichas flechas rectas que conectan variables latentes son usadas en el MES, un paso posterior al AFC.
Este ejemplo trata el caso de seis pruebas de aptitudes que se aplicaron a 145 estudiantes. Los archivos a utilizar son EX5A.spl y EX5B.spl de la carpeta simples (el lector los descarg al bajar LISREL). El ejemplo consiste de una matriz de varianza-covarianza y tiene seis variables observadas: 1 Visual Perception, 2 Cubes, 3 Lozenges, 4 Paragraph Comprehension, 5 Sentence Completion y 6 Word Meaning. Las primeras dos pruebas miden aptitud espacial (variable latente), las cuatro siguientes miden aptitud verbal (variable latente) y las ltimas tres miden velocidad(variable latente). El modelo inicial confirmatorio se presenta en la figura 25.
53
Fuente. Elaboracin propia.
Figura 25. Modelo confirmatorio de nueve variables observadas y tres variables latentes
Las variables observadas son los 9 rectngulos y las latentes son los 3 valos. Las trayectorias o lneas van de cada variable latente a sus variables observadas, y estas trayectorias especifican que un parmetro o carga factorial se estimar. La carga factorial al cuadrado es la comunalidad estimada de la variable.
Sintaxis SIMPLIS. Como puede observarse abajo, las instrucciones que se anotan en SIMPLIS tienen un ttulo (Confirmatory Factor Initial Model), la lista de 9 variables observadas (sensibles a maysculas y minsculas), una matriz correlacional (en este caso no se invoca a un archivo que contenga la matriz, como el archivo del ejercicio 5.1), medias y desviaciones estndar, la lista de variables latentes, las relaciones del modelo, residuales y el diagrama de trayectorias.
El lector puede comprobarlo: Abra la versin estudiantil de LISREL (LISREL 88S), y de acuerdo a las imgenes (figura 26 y figura 27): busque la carpeta de LISREL en archivos del programa (usualmente en el 54 disco C). Luego abra en la carpeta SIMPLIS el archivo EX5A.SPL (ver figuras 28, 29 y 30) dando click en Open.
Fuente. Elaboracin propia.
Figura 26. Abrir LISREL
Fuente. Elaboracin propia.
Figura 27. Buscar carpeta LISREL (en este caso LISREL 8.8 student examples, seleccionar File y Open)
55
Fuente. Elaboracin propia.
Figura 28. Seleccionar y abrir carpeta en SPLEX (SIMPLIS).
Fuente: Elaboracin propia
Figura 29. Seleccionar y abrir el archivo EX5A.SPL.
56 As se ve la sintaxis en pantalla del ejemplo EX5A.SPL: _________________________________________________________________ Nine Psychological Variables - A Confirmatory Factor Analysis Observed Variables 'VIS PERC' CUBES LOZENGES 'PAR COMP' 'SEN COMP' WORDMEAN ADDITION COUNTDOT 'S-C CAPS' Correlation Matrix From File EX5.COR Sample Size 145 Latent Variables: Visual Verbal Speed Relationships: 'VIS PERC' - LOZENGES = Visual 'PAR COMP' - WORDMEAN = Verbal ADDITION - 'S-C CAPS' = Speed Number of Decimals = 3 Wide Print Print Residuals Path Diagram End of Problem ____________________________________________________________________
Ahora, procede dar click al icono (en la barra de men, ver figura 30).
Fuente: Elaboracin propia
Figura 30. Comandos para correr un AFC
Este botn corre el anlisis SIMPLIS ! No vaya a oprimir un botn similar que tiene una P en vez de una L.
57 Van a aparecer tres ventanas (ver figura 31), la primera ventana muestra la grfica con las variables latentes en valos (Visual, Verbal y Speed) y nueve rectngulos (ver figura 32); la segunda ventana contiene los resultados (texto y tablas numricas) y se llama EX5A.OUT (ver tabla 2); y la tercera ventana contiene las instrucciones (comandos) y se llama EX5A.SPL. Las tres ventanas aparecen juntas en la misma pantalla, y es posible que las tres o algunas de las tres ventanas estn minimizadas.
Fuente: Elaboracin propia
Figura 31. Grfica de resultados del AFC
Recuerde que los resultados son presentados en la grfica EX5B.PTH (figura 32) y el archivo EX5B.OUT (tabla 2, una enorme tabla que la resume la tabla 1), dnde es posible encontrar cinco principales ndices. Pero vea la tabla 1 que no es preparada por LISREL, sino elaborada por los autores de este libro) que indican que el AFC requiere modificarse, ya que la Ji cuadrada es significativa, RMSEA es mayor a .08, y GFI no lleg a .95. Note que la tabla 2 es muy larga (cinco pginas), por eso se presenta la tabla 1 para simplificar la bsqueda de ndices.
Tabla 1. ndices seleccionados de ajuste del AFC _____________________________________________
2 = 49. 97 df = 24 p value .00143 RMSEA =.087 GFI = .928 _____________________________________________ Nota: buscarlos en el archivo EX5A.PTH Fuente: Elaboracin propia de los autores y NO de LISREL. 58 Al final de EX5A.OUT (tabla 2) se encuentran ndices por modificar (modification indices), entre los que destacan:
add Path from S-C CAPS to VISUAL a fin de disminuir la Ji cuadrada en 24.7 puntos, y.. add an Error Covariance between COUNTDOT and ADDITION a fin de disminuir la Ji cuadrada en 25.1 puntos.
Ambas modificaciones son las que ms disminuyen la Ji cuadrada.
Fuente. Elaboracin propia.
Figura 32. Grfica de trayectorias (ahora archivo EX5A.PTH).
Y tambin arroja el anlisis de resultados con la matriz de covarianzas, ndices de ajuste e ndices de modificacin, mediante el archivo EX5A.OUT (Tabla 2).
59 Tabla 2. Resultados del anlisis factorial confirmatorio (EX5A.OUT) __________________________________________________________________ DATE: 4/16/2009 TIME: 10:59
L I S R E L 8.54
BY
Karl G. Jreskog & Dag Srbom
This program is published exclusively by Scientific Software International, Inc. 7383 N. Lincoln Avenue, Suite 100 Lincolnwood, IL 60712, U.S.A. Phone: (800)247-6113, (847)675-0720, Fax: (847)675-2140 Copyright by Scientific Software International, Inc., 1981-2002
Use of this program is subject to the terms specified in the Universal Copyright Convention.
Website: www.ssicentral.com
The following lines were read from file C:\lisrel854_student\SPLEX\EX5A.SPL:
Nine Psychological Variables - A Confirmatory Factor Analysis Observed Variables 'VIS PERC' CUBES LOZENGES 'PAR COMP' 'SEN COMP' WORDMEAN ADDITION COUNTDOT 'S-C CAPS' Correlation Matrix From File EX5.COR Sample Size 145 Latent Variables: Visual Verbal Speed Relationships: 'VIS PERC' - LOZENGES = Visual 'PAR COMP' - WORDMEAN = Verbal ADDITION - 'S-C CAPS' = Speed Number of Decimals = 3 Wide Print Print Residuals Path Diagram End of Problem
Sample Size = 145
Nine Psychological Variables - A Confirmatory Factor Analysis
Correlation Matrix
VIS PERC CUBES LOZENGES PAR COMP SEN COMP WORDMEAN ADDITION COUNTDOT S-C CAPS -------- -------- -------- -------- -------- -------- -------- -------- -------- VIS PERC 1.000 CUBES 0.318 1.000 LOZENGES 0.436 0.419 1.000 PAR COMP 0.335 0.234 0.323 1.000 SEN COMP 0.304 0.157 0.283 0.722 1.000 WORDMEAN 0.326 0.195 0.350 0.714 0.685 1.000 ADDITION 0.116 0.057 0.056 0.203 0.246 0.170 1.000 COUNTDOT 0.314 0.145 0.229 0.095 0.181 0.113 0.585 1.000 S-C CAPS 0.489 0.239 0.361 0.309 0.345 0.280 0.403 0.512 1.000 60 Contina tabla 2
Nine Psychological Variables - A Confirmatory Factor Analysis
Number of Iterations = 9
LISREL Estimates (Maximum Likelihood)
Measurement Equations
VIS PERC = 0.672*Visual, Errorvar.= 0.548 , R = 0.452 (0.0910) (0.0971) 7.388 5.645 CUBES = 0.513*Visual, Errorvar.= 0.737 , R = 0.263 (0.0924) (0.101) 5.551 7.300 LOZENGES = 0.684*Visual, Errorvar.= 0.532 , R = 0.468 (0.0910) (0.0974) 7.516 5.461 PAR COMP = 0.867*Verbal, Errorvar.= 0.248 , R = 0.752
Degrees of Freedom = 24 Minimum Fit Function Chi-Square = 52.626 (P = 0.000648) Normal Theory Weighted Least Squares Chi-Square = 49.966 (P = 0.00143) Estimated Non-centrality Parameter (NCP) = 25.966 61 Contina tabla 2
90 Percent Confidence Interval for NCP = (9.461 ; 50.223)
Minimum Fit Function Value = 0.365 Population Discrepancy Function Value (F0) = 0.180 90 Percent Confidence Interval for F0 = (0.0657 ; 0.349) Root Mean Square Error of Approximation (RMSEA) = 0.0867 90 Percent Confidence Interval for RMSEA = (0.0523 ; 0.121) P-Value for Test of Close Fit (RMSEA < 0.05) = 0.0409 Expected Cross-Validation Index (ECVI) = 0.639 90 Percent Confidence Interval for ECVI = (0.524 ; 0.807) ECVI for Saturated Model = 0.625 ECVI for Independence Model = 4.691
Chi-Square for Independence Model with 36 Degrees of Freedom = 657.458 Independence AIC = 675.458 Model AIC = 91.966 Saturated AIC = 90.000 Independence CAIC = 711.249 Model CAIC = 175.477 Saturated CAIC = 268.953 Normed Fit Index (NFI) = 0.920 Non-Normed Fit Index (NNFI) = 0.931 Parsimony Normed Fit Index (PNFI) = 0.613 Comparative Fit Index (CFI) = 0.954 Incremental Fit Index (IFI) = 0.955 Relative Fit Index (RFI) = 0.880 Critical N (CN) = 118.606 Root Mean Square Residual (RMR) = 0.0755 Standardized RMR = 0.0755 Goodness of Fit Index (GFI) = 0.928 Adjusted Goodness of Fit Index (AGFI) = 0.866 Parsimony Goodness of Fit Index (PGFI) = 0.495
Nine Psychological Variables - A Confirmatory Factor Analysis
Fitted Covariance Matrix
VIS PERC CUBES LOZENGES PAR COMP SEN COMP WORDMEAN ADDITION COUNTDOT S-C CAPS -------- -------- -------- -------- -------- -------- -------- -------- -------- VIS PERC 1.000 CUBES 0.345 1.000 LOZENGES 0.460 0.351 1.000 PAR COMP 0.317 0.242 0.322 1.000 SEN COMP 0.303 0.231 0.308 0.720 1.000 WORDMEAN 0.302 0.230 0.307 0.716 0.685 1.000 ADDITION 0.226 0.173 0.230 0.182 0.174 0.173 1.000 COUNTDOT 0.274 0.209 0.279 0.221 0.211 0.210 0.529 1.000 S-C CAPS 0.232 0.177 0.236 0.187 0.179 0.178 0.447 0.542 1.000
Fitted Residuals
VIS PERC CUBES LOZENGES PAR COMP SEN COMP WORDMEAN ADDITION COUNTDOT S-C CAPS -------- -------- -------- -------- -------- -------- -------- -------- -------- VIS PERC 0.000 CUBES -0.027 0.000 LOZENGES -0.024 0.068 0.000 PAR COMP 0.018 -0.008 0.001 0.000 SEN COMP 0.001 -0.074 -0.025 0.002 0.000 WORDMEAN 0.024 -0.035 0.043 -0.002 0.000 0.000 ADDITION -0.110 -0.116 -0.174 0.021 0.072 -0.003 0.000 COUNTDOT 0.040 -0.064 -0.050 -0.126 -0.030 -0.097 0.056 0.000 S-C CAPS 0.257 0.062 0.125 0.122 0.166 0.102 -0.044 -0.030 0.000 62 Contina tabla 2
Summary Statistics for Fitted Residuals
Smallest Fitted Residual = -0.174 Median Fitted Residual = 0.000 Largest Fitted Residual = 0.257
Smallest Standardized Residual = -3.117 Median Standardized Residual = 0.000 Largest Standardized Residual = 5.007
Stemleaf Plot
- 3|10 - 2|910 - 1|984311 - 0|8766411100000000000 0|44459 1|0028 2|1239 3| 4|7 5|0 Largest Negative Standardized Residuals Residual for ADDITION and LOZENGES -3.117 Residual for COUNTDOT and PAR COMP -3.013 Residual for S-C CAPS and COUNTDOT -2.886 Largest Positive Standardized Residuals Residual for COUNTDOT and ADDITION 5.007 Residual for S-C CAPS and VIS PERC 4.650 Residual for S-C CAPS and SEN COMP 2.904
63 Contina tabla 2
The Modification Indices Suggest to Add the Path to from Decrease in Chi-Square New Estimate ADDITION Visual 10.5 -0.37 COUNTDOT Verbal 10.1 -0.28 S-C CAPS Visual 24.7 0.57 S-C CAPS Verbal 10.0 0.26
The Modification Indices Suggest to Add an Error Covariance Between and Decrease in Chi-Square New Estimate COUNTDOT ADDITION 25.1 0.62 S-C CAPS VIS PERC 9.1 0.18 S-C CAPS COUNTDOT 8.3 -0.38
Time used: 0.060 Seconds _____________________________________________________________ Fuente Elaboracin propia (LISREL).
De acuerdo con los ndices de modificacin sugeridos al final de la tabla 2, se abre el archivo EX5B.SPL (figura 33) para realizar un AFC modificado. Notar que EX5B.SPL es igual a EX5A.SPL, excepto que tiene incluida la trayectoria S-C CAPS Visual, la nica modificacin tomada en cuenta. Las comillas sencillas como en S-C CAPS se usa para el caso de variables que tienen un espacio como el que se ve entre la letras C y C. El guin alto como el que est entre PAR COMP - WORDMEAN, significa que tambin se incluye a SEN COMP. Otra opcin es escribir en la lnea 10 PAR COM SEN COMP WORD MEAN = Verbal, para incluir a SEN COMP.
Fuente: Elaboracin propia
Figura 33. EX5B.SPL AFC modificado
Ahora, procede dar click al icono (en la barra de men):
64
Para no confundirse con los resultados del archivo EX5A, cierre las tres ventanas con terminaciones (SPL, OUT y PTH).
Los resultados son presentados en la grfica EX5B.PTH (figura 34) y el archivo EX5B.OUT (tabla 3, una enorme tabla que la resume la tabla 4), dnde es posible encontrar cinco principales ndices (ver tabla 3 que no es preparada por LISREL, sino elaborada por los autores) que indican que el AFC ya quedo listo, ya que la Ji cuadrada no es significativa, RMSEA es menor a .08, y GFI lleg a .95.
Tabla 3. ndices seleccionados de ajuste del AFC modificado _________________________________________
2 = 28. 67 df = 23 p value .19138 RMSEA =.041 GFI = .958 _________________________________________ Nota: buscarlos en el archivo EX5B.PTH Fuente: Elaboracin propia de los autores (NO por LISREL)
Al final de EX5B.=OUT ya no se encuentran ndices por modificar sugeridos (modification indices).
Este botn corre el anlisis SIMPLIS ! No vaya a oprimir un botn similar que tiene una P en vez de una L.
65
Nota: Observar la flecha agregada que va de Visual a S-C CAPS Fuente: Elaboracin propia.
Figura 34. Archivo EX5B.PTH AFC modificado (grfica de trayectorias).
Tabla 4. Resultados del AFC modificado (EXA5B.OUT) _________________________________________________________________
DATE: 4/17/2009 TIME: 11:19
L I S R E L 8.54
BY
Karl G. Jreskog & Dag Srbom
This program is published exclusively by Scientific Software International, Inc. 7383 N. Lincoln Avenue, Suite 100 Lincolnwood, IL 60712, U.S.A.
Phone: (800)247-6113, (847)675-0720, Fax: (847)675-2140 Copyright by Scientific Software International, Inc., 1981-2002 Use of this program is subject to the terms specified in the Universal Copyright Convention. Website: www.ssicentral.com
The following lines were read from file C:\lisrel854_student\SPLEX\EX5B.SPL:
Nine Psychological Variables - A Confirmatory Factor Analysis 66 Contina tabla 4. Observed Variables 'VIS PERC' CUBES LOZENGES 'PAR COMP' 'SEN COMP' WORDMEAN ADDITION COUNTDOT 'S-C CAPS' Correlation Matrix From File EX5.COR Sample Size 145 Latent Variables: Visual Verbal Speed Relationships: 'VIS PERC' - LOZENGES 'S-C CAPS' = Visual 'PAR COMP' - WORDMEAN = Verbal ADDITION - 'S-C CAPS' = Speed Number of Decimals = 3 Wide Print Print Residuals Path Diagram End of Problem
Sample Size = 145
Nine Psychological Variables - A Confirmatory Factor Analysis
Correlation Matrix
VIS PERC CUBES LOZENGES PAR COMP SEN COMP WORDMEAN ADDITION COUNTDOT S-C CAPS -------- -------- -------- -------- -------- -------- -------- -------- -------- VIS PERC 1.000 CUBES 0.318 1.000 LOZENGES 0.436 0.419 1.000 PAR COMP 0.335 0.234 0.323 1.000 SEN COMP 0.304 0.157 0.283 0.722 1.000 WORDMEAN 0.326 0.195 0.350 0.714 0.685 1.000 ADDITION 0.116 0.057 0.056 0.203 0.246 0.170 1.000 COUNTDOT 0.314 0.145 0.229 0.095 0.181 0.113 0.585 1.000 S-C CAPS 0.489 0.239 0.361 0.309 0.345 0.280 0.403 0.512 1.000
Nine Psychological Variables - A Confirmatory Factor Analysis
Number of Iterations = 8
LISREL Estimates (Maximum Likelihood)
Measurement Equations VIS PERC = 0.708*Visual, Errorvar.= 0.498 , R = 0.502 (0.0868) (0.0901) 8.163 5.533
Degrees of Freedom = 23 Minimum Fit Function Chi-Square = 28.862 (P = 0.185) Normal Theory Weighted Least Squares Chi-Square = 28.674 (P = 0.191) Estimated Non-centrality Parameter (NCP) = 5.674 90 Percent Confidence Interval for NCP = (0.0 ; 23.499)
Minimum Fit Function Value = 0.200 Population Discrepancy Function Value (F0) = 0.0394 90 Percent Confidence Interval for F0 = (0.0 ; 0.163) Root Mean Square Error of Approximation (RMSEA) = 0.0414 90 Percent Confidence Interval for RMSEA = (0.0 ; 0.0842) P-Value for Test of Close Fit (RMSEA < 0.05) = 0.583
Expected Cross-Validation Index (ECVI) = 0.505 90 Percent Confidence Interval for ECVI = (0.465 ; 0.628) ECVI for Saturated Model = 0.625 ECVI for Independence Model = 4.691
Chi-Square for Independence Model with 36 Degrees of Freedom = 657.458 Independence AIC = 675.458 Model AIC = 72.674 Saturated AIC = 90.000 Independence CAIC = 711.249 Model CAIC = 160.162 Saturated CAIC = 268.953 68 Contina tabla 4.
Normed Fit Index (NFI) = 0.956 Non-Normed Fit Index (NNFI) = 0.985 Parsimony Normed Fit Index (PNFI) = 0.611 Comparative Fit Index (CFI) = 0.991 Incremental Fit Index (IFI) = 0.991 Relative Fit Index (RFI) = 0.931
Critical N (CN) = 208.748
Root Mean Square Residual (RMR) = 0.0452 Standardized RMR = 0.0452 Goodness of Fit Index (GFI) = 0.958 Adjusted Goodness of Fit Index (AGFI) = 0.917 Parsimony Goodness of Fit Index (PGFI) = 0.489
Nine Psychological Variables - A Confirmatory Factor Analysis
Fitted Covariance Matrix
VIS PERC CUBES LOZENGES PAR COMP SEN COMP WORDMEAN ADDITION COUNTDOT S-C CAPS -------- -------- -------- -------- -------- -------- -------- -------- -------- VIS PERC 1.000 CUBES 0.342 1.000 LOZENGES 0.460 0.314 1.000 PAR COMP 0.343 0.234 0.315 1.000 SEN COMP 0.328 0.224 0.301 0.720 1.000 WORDMEAN 0.326 0.222 0.299 0.716 0.685 1.000 ADDITION 0.187 0.128 0.172 0.128 0.123 0.122 1.000 COUNTDOT 0.241 0.164 0.221 0.165 0.158 0.157 0.585 1.000 S-C CAPS 0.440 0.300 0.403 0.301 0.288 0.286 0.399 0.513 1.000 Contina tabla 11.
Fitted Residuals
VIS PERC CUBES LOZENGES PAR COMP SEN COMP WORDMEAN ADDITION COUNTDOT S-C CAPS -------- -------- -------- -------- -------- -------- -------- -------- -------- VIS PERC 0.000 CUBES -0.024 0.000 LOZENGES -0.024 0.105 0.000 PAR COMP -0.008 0.000 0.008 0.000 SEN COMP -0.024 -0.067 -0.018 0.002 0.000 WORDMEAN 0.000 -0.027 0.051 -0.002 0.000 0.000 ADDITION -0.071 -0.071 -0.116 0.075 0.123 0.048 0.000 COUNTDOT 0.073 -0.019 0.008 -0.070 0.023 -0.044 0.000 0.000 S-C CAPS 0.049 -0.061 -0.042 0.008 0.057 -0.006 0.004 -0.001 0.000
Summary Statistics for Fitted Residuals
Smallest Fitted Residual = -0.116 Median Fitted Residual = 0.000 Largest Fitted Residual = 0.123
Time used: 0.050 Seconds _____________________________________________________________ Fuente: Elaboracin propia
Notar que tambin puede modificarse exitosamente el AFC realizado en EX5A.SPL si agrega una correlacin entre COUNTDOT y ADDITION, de acuerdo con lo sugerido por modification indices (EX5A.OUT), tal como muestra la figura 36. La instruccin agregada es: Let COUNTDOT ADDITION correlate. Slo se muestra la sintaxis modificada del EX5A.SPL, (figura 35), la Tabla 5 con algunos ndices (que sealan ajuste), y la grfica de trayectorias modificada EX5B.PTH archivo figura 36).
70
Fuente: Elaboracin propia
Figura 35. AFC modificado de EX5A.SPL (Let COUNTDOT ADDITION correlate).
Tabla 5. ndices seleccionados de ajuste del AFC _________________________________________
2 = 27. 97 df = 23 p value .21695 RMSEA =.039 GFI = .991 __________________________________________ Nota: buscarlos en el archivo EX5A.PTH Fuente: Elaboracin propia 71
Nota: Observar la flecha curva agregada que conecta a COUNTDOT y ADDITION. Fuente: Elaboracin propia.
Figura 36. Archivo EX5A.PTH. AFC modificado (grfica de trayectorias).
En resumen, el AFC ha sido realizado exitosamente mediante las modificaciones sugeridas por modification indices, y es posible la realizacin de la ECUACION ESTRUCTURAL en un paso siguiente. En otras palabras, las variables latentes son validamente medidas por sus respectivas variables observadas (indicadores o reactivos).
FIN DEL EJERCICIO 5.3
5.4 Ejemplo de Ecuacin Estructural.
Como ya se mencion, el MES se realiza mediante la combinacin de la tcnica AFC y el anlisis de trayectorias (modelo estructural). Las trayectorias parten de las relaciones hipotticas entre las variables latentes.
El ejemplo usado en esta seccin es otro diferente al usado en el ejemplo 5.3, se lleva a cabo al escribir directamente en la pantalla de la computadora: el ttulo del estudio (Educational Achievement Structural Equation Inicial Model); las nueve Es posible que en otro caso se requiera llevar a cabo ms de una modificacin, dependiendo del las sugerencias de modification, indices y la teora.
72 variables observadas (EdAsp OcAsp VerbAch QuantAch FamInc FaEd MoEd VerbAb QuantAb); la matriz de covarianzas; el tamao de la muestra (200); las 4 variables latentes (ASPIRE ACHIEVE HOME ABILITY); las relaciones entre las variables latentes y las variables observadas); y las instrucciones de Print Residuals, Path Diagram y End of problem. El modelo hipottico se presenta en la figura 37. Notar que a diferencia del AFC, las variables latentes se conectan con flechas rectas.
Fuente: Notas del Curso MES de Schumacker.
Figura 37. Modelo hipottico del ejemplo de modelamiento estructural.
Cabe mencionar que este ejemplo no se esta tomando de la carpeta de ejemplos de LISREL, no muestra como se realiz la preparacin de datos con PRELIS y tampoco muestra como se realiz el AFC con SIMPLIS. En este ejemplo es posible realizar el anlisis slo anotando los datos directamente en la pantalla de LISREL.
Los pasos a seguir son:
5.4.1 Abrir LISREL (Figura 38)
73
Fuente: Elaboracin propia
Figura 38. Abrir LISREL
5.4.2. Oprimir New (figura 39)
Fuente: Elaboracin propia
Figura 39. New
5.4.3 Oprimir SIMPLIS Project y Aceptar (figura 40).
74
Fuente: Elaboracin propia
Figura 40. Oprimir SIMPLIS project y aceptar
5.4.4. Nombrar (escribir Educational Achievement Structural Equation Initial Model) y Guardar (figura 41). Se puede guardar en cualquier carpeta de su eleccin, en el ejemplo se esta guardando en SPLEX.
Fuente: Elaboracin propia
Figura 41. Nombrar y Guardar.
5.4.5. Escribir datos en pantalla: anotar el ttulo y dems datos (figura 42).
75
Nota 1: La anotacin 1* indica que los parmetros han sido fijados a 1, para que as sean la variable observada de referencia de la variable latente. Nota 2: Hay 24 parmetros libres a estimarse. El modelo esta sobreidentificado ya que p(p + 1)/ 2 = 9(9 + 1) / 2 = 45, y los grados de libertad son 21 (45 menos 24). _____________________________________________________________________________ Fuente: Elaboracin propia Figura 42. Escribir datos en pantalla
5.4.6. Correr LISREL. Se oprime el botn L que est en el men.
Los resultados son la grfica de trayectorias (figura 43) denominada como archivo Educational Achievement Stuctural Equation Initial Model.PTH, los resultados (tabla 6) y los ndices de ajuste (tabla 7) denominados por el archivo Educational Achievement Stuctural Equation Initial Model.OUT
Si al correr el reporte aparece la ventana The model does not converge significa que existe un error de captura en la informacin. Verifique que todos los datos sean correctos!
76
Fuente: Elaboracin propia
Figura 43. Grfica de trayectorias (archivo .PTH).
Tabla 6. Resultados de la ecuacin estructural (archivo con extensin OUT) _____________________________________________________________________ DATE: 4/17/2009 TIME: 14:24
L I S R E L 8.54
BY
Karl G. Jreskog & Dag Srbom
This program is published exclusively by Scientific Software International, Inc. 7383 N. Lincoln Avenue, Suite 100 Lincolnwood, IL 60712, U.S.A. Phone: (800)247-6113, (847)675-0720, Fax: (847)675-2140 Copyright by Scientific Software International, Inc., 1981-2002 Use of this program is subject to the terms specified in the Universal Copyright Convention. Website: www.ssicentral.com
The following lines were read from file C:\Documents and Settings\L00622308\Mis documentos\Educational Achievement Structural Equation Initial Model.spj:
Educational Achievement Structural Equation Initial Model
Degrees of Freedom = 21 Minimum Fit Function Chi-Square = 57.17 (P = 0.00) Normal Theory Weighted Least Squares Chi-Square = 58.85 (P = 0.00) Estimated Non-centrality Parameter (NCP) = 37.85 90 Percent Confidence Interval for NCP = (18.69 ; 64.65)
Minimum Fit Function Value = 0.29 Population Discrepancy Function Value (F0) = 0.19 90 Percent Confidence Interval for F0 = (0.094 ; 0.32) Root Mean Square Error of Approximation (RMSEA) = 0.095 90 Percent Confidence Interval for RMSEA = (0.067 ; 0.12) P-Value for Test of Close Fit (RMSEA < 0.05) = 0.0059 Expected Cross-Validation Index (ECVI) = 0.54 90 Percent Confidence Interval for ECVI = (0.44 ; 0.67) ECVI for Saturated Model = 0.45 ECVI for Independence Model = 13.72
Chi-Square for Independence Model with 36 Degrees of Freedom = 2712.06
Normed Fit Index (NFI) = 0.98 Non-Normed Fit Index (NNFI) = 0.98 Parsimony Normed Fit Index (PNFI) = 0.57 Comparative Fit Index (CFI) = 0.99 Incremental Fit Index (IFI) = 0.99 Relative Fit Index (RFI) = 0.96 80 Contina tabla 6
Critical N (CN) = 136.52
Root Mean Square Residual (RMR) = 0.047 Standardized RMR = 0.048 Goodness of Fit Index (GFI) = 0.94 Adjusted Goodness of Fit Index (AGFI) = 0.87 Parsimony Goodness of Fit Index (PGFI) = 0.44
Educational Achievement Structural Equation Initial Model
Summary Statistics for Standardized Residuals Smallest Standardized Residual = -3.24 Median Standardized Residual = 0.00 Largest Standardized Residual = 6.34 Stemleaf Plot - 3|2 - 2|86643221 - 1|300 - 0|99888664000000000000 0|29 1|348 2|08 3|155 4|6 5|4 6|3 Largest Negative Standardized Residuals Residual for FaEd and VerbAch -2.63 Residual for FaEd and FamInc -2.81 Residual for MoEd and FamInc -3.24 Largest Positive Standardized Residuals Residual for FamInc and EdAsp 3.54 Residual for FamInc and OcAsp 3.11 82 Contina tabla 6
Residual for FamInc and VerbAch 5.35 Residual for FamInc and QuantAch 2.80 Residual for MoEd and FaEd 6.34 Residual for VerbAb and FamInc 4.59 Residual for QuantAb and FamInc 3.47
The Modification Indices Suggest to Add the Path to from Decrease in Chi-Square New Estimate FamInc ABILITY 35.5 0.62 MoEd ABILITY 9.8 -0.30
The Modification Indices Suggest to Add an Error Covariance Between and Decrease in Chi-Square New Estimate FaEd FamInc 7.9 -0.09 MoEd FamInc 10.5 -0.10 MoEd FaEd 40.2 0.21 Time used: 0.070 Seconds __________________________________________________________________ Fuente: Elaboracin propia
Algunos ndices de ajuste seleccionados sealan que no hay ajuste y que se requiere modificacin de la ecuacin estructural (tabla 7).
Tabla 7. ndices seleccionados de ajuste de la ecuacin estructural. _________________________________________
2 = 58. 85 df = 21 p value .00002 RMSEA =.095 GFI = .94 __________________________________________ Nota: buscarlos en el archivo Educational Achievement Structural Equation Initial Model..PTH Fuente: Elaboracin propia
Por otro lado, los ndices de modificacin (tabla 8) que aparecen en el archivo con extensin OUT sugieren que se incluya una trayectoria de FamInc a ABILITY, a fin de reducir la Ji cuadrada en 35.5 puntos y/o correlacionar MoEd y FaEd para as reducir la Ji cuadrada en 40.2 puntos.
Tabla 8. ndices de modificacin sugeridos para la ecuacin estructural. ______________________________________________________________ The Modification Indices Suggest to Add the Path to from Decrease in Chi-Square New Estimate FamInc ABILITY 35.5 0.62 MoEd ABILITY 9.8 -0.30
The Modification Indices Suggest to Add an Error Covariance Between and Decrease in Chi-Square New Estimate FaEd FamInc 7.9 -0.09 MoEd FamInc 10.5 -0.10 MoEd FaEd 40.2 0.21 ________________________________________________________________ Fuente: Elaboracin propia
83 Debido a que la reduccin de Ji cuadrada de 40.2 es la mayor, y tericamente es posible, se procede a modificar el modelo mediante el parmetro de correlacin entre MoED y FaEd (ver figura 44).
Nota: Se ha incluido una flecha curva que correlaciona FaEd y MoED Fuente: Notas del Curso MES de Schumacker.
Figura 44. Modelo hipottico modificado del ejemplo de modelamiento estructural.
De acuerdo con la figura 45 se incluye la instruccin Let the error covariances of FaEd and MoEd correlate en SIMPLIS.
84
Fuente: Elaboracin propia
Figura 45. Ecuacin estructural modificada en SIMPLIS.
Los resultados del modelamiento de ecuacin estructural se presentan en la grfica de trayectorias (figura 46), la tabla de resultados (tabla 9), y la tabla de ndices de ajuste seleccionados ( tabla 10). Los resultados muestran que los datos se ajustan al modelo terico, en otras palabras, que el modelo terico es confirmado.
Se oprime el botn L que est en el men. 85
Fuente: Elaboracin propia
Figura 46. Grfica modificada de trayectorias del MES
En la tabla 9 se muestran la matriz de covarianzas, las ecuaciones de medicin, y los ndices de ajuste.
Tabla 9. Resultados del MES modificado. _________________________________________________________________ DATE: 4/17/2009 TIME: 15:33
L I S R E L 8.54
BY
Karl G. Jreskog & Dag Srbom
This program is published exclusively by Scientific Software International, Inc. 7383 N. Lincoln Avenue, Suite 100 Lincolnwood, IL 60712, U.S.A. Phone: (800)247-6113, (847)675-0720, Fax: (847)675-2140 Copyright by Scientific Software International, Inc., 1981-2002 Use of this program is subject to the terms specified in the Universal Copyright Convention. Website: www.ssicentral.com
The following lines were read from file C:\Documents and Settings\L00622308\Mis documentos\Modified Educational Achievement Structural Equation Initial Model.spj:
86 Contina tabla 9.
Modified Educational Achievement Example Model 2 Respecified Observed variables: EdAsp OcAsp VerbAch QuantAch FamInc FaEd MoEd VerbAb QuantAb Covariance matrix: 1.024 .792 1.077 1.027 .919 1.844 .756 .697 1.244 1.286 .567 .537 .876 .632 .852 .445 .424 .677 .526 .518 .670 .434 .389 .635 .498 .475 .545 .716 .580 .564 .893 .716 .546 .422 .373 .851 .491 .499 .888 .646 .508 .389 .339 .629 .871 Sample size: 200 Latent variables: ASPIRE ACHIEVE HOME ABILITY Relationships: EdAsp = 1*ASPIRE OcAsp = ASPIRE VerbAch = 1*ACHIEVE QuantAch = ACHIEVE FamInc = 1*HOME FaEd MoEd = HOME VerbAb = 1*ABILITY QuantAb = ABILITY ASPIRE = HOME ABILITY ACHIEVE = ASPIRE HOME ABILITY Let the error covariances of FaEd and MoEd correlate Path Diagram End of problem
Sample Size = 200
Modified Educational Achievement Example Model 2 Respecified
Degrees of Freedom = 20 Minimum Fit Function Chi-Square = 19.17 (P = 0.51) Normal Theory Weighted Least Squares Chi-Square = 18.60 (P = 0.55) Estimated Non-centrality Parameter (NCP) = 0.0 90 Percent Confidence Interval for NCP = (0.0 ; 12.67)
Minimum Fit Function Value = 0.096 Population Discrepancy Function Value (F0) = 0.0 90 Percent Confidence Interval for F0 = (0.0 ; 0.064) Root Mean Square Error of Approximation (RMSEA) = 0.0 90 Percent Confidence Interval for RMSEA = (0.0 ; 0.056) P-Value for Test of Close Fit (RMSEA < 0.05) = 0.91
Expected Cross-Validation Index (ECVI) = 0.35 90 Percent Confidence Interval for ECVI = (0.35 ; 0.42) ECVI for Saturated Model = 0.45 ECVI for Independence Model = 13.72
Chi-Square for Independence Model with 36 Degrees of Freedom = 2712.06 Independence AIC = 2730.06 Model AIC = 68.60 Saturated AIC = 90.00 Independence CAIC = 2768.74 Model CAIC = 176.05 89 Contina tabla 9.
Saturated CAIC = 283.42
Normed Fit Index (NFI) = 0.99 Non-Normed Fit Index (NNFI) = 1.00 Parsimony Normed Fit Index (PNFI) = 0.55 Comparative Fit Index (CFI) = 1.00 Incremental Fit Index (IFI) = 1.00 Relative Fit Index (RFI) = 0.99
Critical N (CN) = 391.00
Root Mean Square Residual (RMR) = 0.015 Standardized RMR = 0.015 Goodness of Fit Index (GFI) = 0.98 Adjusted Goodness of Fit Index (AGFI) = 0.95 Parsimony Goodness of Fit Index (PGFI) = 0.44
The Modification Indices Suggest to Add an Error Covariance Between and Decrease in Chi-Square New Estimate VerbAb VerbAch 8.4 -0.09
Time used: 0.060 Seconds _________________________________________________________________ Fuente: Elaboracin propia
Finalmente, la tabla 10 presenta ndices seleccionados que apoyan el ajuste de los datos con el modelo hipottico. el modelo ha sido validado!
Tabla 10. ndices seleccionados de ajuste del MES. _________________________________________
2 = 18.60 df = 20 p value .55 RMSEA =.00 GFI = .98 __________________________________________ Nota: buscarlos en el archivo Modified Educational Achievement Structural Equation Initial Model..PTH Fuente: Elaboracin propia
Ha terminado el anlisis SEM mediante el uso de SIMPLIS que es la opcin sencilla de LISREL. La versin LISREL para estudiantes tambin tiene carpetas con ms ejemplos que el lector puede realizar por cuenta propia y con la ayuda del libro A Beginners Guide to Structural Equation Modeling publicado en el 2004 por Randall E. Schumacker y Richard G. Lomax.
FIN DEL EJERCICIO 5.4
90
5.5. Problemas comunes al correr LISREL.
Son cuatro los problemas comunes a los que nos enfrentamos al realizar el MES: La carencia de una teora o hiptesis fundamentadas; la introduccin errnea de texto (p.e. una minscula por una mayscula) que resulta en model does not converge; la omisin de comandos o el uso de comandos incorrectos; y multicolinealidad que impide el clculo de la matriz inversa y que se reporta como Matrix to be analayzed is not positive definitive.
Por estas causas, es conveniente partir de una teora bien fundamentada antes de inciar el anlisis con LISREL, y verificar que la introduccin de datos, texto y comandos se correcta.
Ahora resta que el lector proceda pacientemente a aplicar el MES mediante LISREL a su base de datos. Tener el cuenta que es usual que el modelo no ajuste en el primer intento, y que probablemente se requerirn modificaciones del modelo de acuerdo con los ndices de modificacin sugeridos y con supuestos tericos.
En el caso de no encontrar o haber descargado los archivos de ejercicios LISREL, es posible consultar y pedrselos a los autores a la cuenta de correo electrnica hermanlittlewood@yahoo.com.mx
91 Referencias
Anderson, C. & Gerbing, D. W. (1988). Structural equation modeling in practice: A review and recommended two-step approach. Psychological Bulletin 103 (3), 411-423.
Annimo (s/f). SEM introduction. Recuperado el 15 de abril del 2009 de http://www.cob.unt.edu/slides/Paswan/BUSI6280/SEM1_Intro.pdf
Bollen, Kenneth A. (1989). Structural equations with latent variables. NY: Wiley. A leading, readable text on structural modeling.
Carmines, E. G. and McIver, J.P. (1981). Analyzing models with unobserved variables: Analysis of covariance structures. Pp. 65-115 in George W. Bohmstedt and Edward F. Borgatta, eds., Social Measurement. Thousand Oaks, CA: Sage Publications
Garson, D. (s/f). Structural Equation Modeling. Recuperado el 15 de abril del 2009 de http://faculty.chass.ncsu.edu/garson/PA765/structur.htm .
Haavelmo, T. (1943).The statistical implications of a system of simultaneous equations. Econometrica 11:1-2. Reprinted in D.F. Hendry and M.S. Morgan (Eds.), The Foundations of Econometric Analysis, Cambridge University Press, 477-490.
Jaccard, J. and Choi K. W. (1996). LISREL approaches to interaction effects in multiple regression. Thousand Oaks, CA: Sage Publications.
Jreskog, K.G. (1970). A general method for the analysis of covariance structures. Biometrika, 57, 239-251.
Jreskog, K. G. & Srbom, D. (1997). LISREL 8: A guide to the program and applications. Chicago, IL: SPSS Inc
Kline, R. B. (1998). Principles and practice of structural equation modeling. NY: Guilford Press.
Marcoulides, G.A. and Schumacker, R.E. (2001). New Developments and Techniques in Structural Equation Modeling. London: Lawrence Eribaum Associates.
Mulaik, S. A. & Millsap, R. E. (2000). Doing the fouyr-step right. Structural Equation Modeling 7, 36-73
Raykov, T. (1998). Coefficient alpha and composite reliability with interrelated nonhomogeneous items Applied Psychological Measurement, 22(4), 375-385
Schumacker, R. E. and Lomax, R. G. (2004). A beginner's guide to structural equation modeling, Second edition. Mahwah, NJ: Lawrence Erlbaum Associates.
92 Simon, H. (1953). Causal ordering and identifiability, in Hood, W.C.; Koopmans, T.C., Studies in Econometric Method, New York: Wiley, pp. 4974
Stevens, J, (1996), Applied multivariate statistics for the social science, New Jersey: Lawrence Erlbaum Associates.
Thompson, B. (2000). Ten commandments of structural equation modeling. Pp. 261- 284 in L. Grimm & P. Yarnell, eds. Reading and understanding more multivariate statistics. Washington, DC: American Psychological Association.
Wright, S. S. (1921). Correlation of causation. Journal of Agricultural Research, 20, 55785.
93 Glosario.
Letras griegas del modelo de medicin (observar figura 1):
Recordar que LISREL no requiere de estps smbolos.
i (xi subndice i): Son las variables latentes exgenas, Past relationship y Education, respectivamente. xi (x subndice i): Son los indicadores (variables observadas) de las variables exgenas latentes. Hay tres para Past relationship. x1 es un reactivo de interaccin, x2 un reactivo de amor y x3 un reactivo de calidad percibida. x (lambda subndice x): Son las cargas de los indicadores xi en las variables latentes exgenas. 11 es la carga de 1 a x1, 31 es la carga de 1 a x3. Son similares a cargas factoriales. Notar que las flechas apuntan a los indicadores (reactivos). Una persona alta en la variable latente debe tambin tener altos puntajes en los indicadores. oi (delta): Son errores de medicin de los indicadores xi. Se consideran como varianza aleatoria o varianza nica. Es posible que estos errores correlacionen entre s. LISREL los coloca en una matriz llamada uo. Los errores significan que las mediciones observadas son imperfectas. u (phi): Es la matriz de varianza-covarianzas de las variable exgenas. u11 es la varianza de 1 y u22 es la varianza de 2. |21 es la covarianza entre 1 and 2. Se muestra con una lnea curva de doble punta. Aunque la covarianza se muestra, la figura no muestra las varianzas. q1 (eta subndice i): Son las variables latentes endgenas. stress at time 1 y stress at time 2. yi (y subndice i): Son los indicadores de las variables latentes endgenas, q1 y q2. y1 es un indicador de depresin, y2 es un indicador de estrs autoreportado, e y3 es un indicador de frustracin. y4, y5, y6 son los mismos indicadores, pero medidos en el tiempo 2. y (lambda subndice y): Son las cargas de los indicadores yi en las variables endgenas latentes. 11 es la carga de q1 a y1. 62 is la carga de q2 a y6. Esto es similar a cargas factoriales. La diferencia con el anlisis factorial convencional (exploratorio) es que los indicadores slo cargan en un factor especfico, por ejemplo, x1 tiene una carga de cero en q2. Esto se muestra con la ausencia de 12, ya que 12 = 0. ci (epsilon): Son los errores de medicin de los indicadores yi. Se consideran como varianza aleatoria o varianza nica. Es posible que estos errores correlaciones entre s. Cuando la misma escala es usada en ambos puntos del tiempo, es de esperarse que los e errores se correlacionen. LISREL coloca estos errores en la matriz uc.
Letras griegas del modelo estructural (observar figura 1):
(Xi): Variables latentes exgenas (1 Past relationship y 2 Education). q (Eta): Variables latentes endgenas (q1 stress at time one y q2 stress at time two). (Gamma): Trayectorias estructurales, coeficientes de regresin o peso beta estndarizado que va de una variable exgena a una variable endgena. En la figura 1 hay trayectorias que van de 1 a q1, 1 a q2, y 2 a q1. Son llamadas 11, 21, e 12. 94 Nota: el primer subndice es consecuencia y el segundo es predictor, de tal manera que 21 significa de Xii 1 a Eta 2. | (Beta): Trayectorias estructurales, coeficientes de regresin o pesos betas estndarizados que va de una variable endgena a otra variable endgena. Hay una trayectoria que va de q1 a q2, y se le llama |21. , (Zeta): Estos son las varianzas no explicadas de una variable latente (1-R cuadrada). Hay dos, ,1 y ,2. Notar que estos residuales pueden correlacionarse y se denominan como ,21.
Trminos.
Anlisis de Covarianza (ANCOVA). Es una tcnica estadstica que analiza la relacin entre una variable dependiente y dos o ms independientes, eliminando y controlando el efecto de al menos una de estas independientes. Anlisis Factorial Confirmatorio (AFC o CFA en ingls). Una variante del anlisis factorial que prueba propuestas tericas acerca de la estructura de un conjunto de mediciones. Alfa de Cronbach o Cronbachs alpha. Medida comn de confiabilidad de un conjunto de indicadores (reactivos). Los valores varan entre 0 y 1.0, donde valores altos indican confiabilidad aceptable. Correlacin. Coeficiente que indica la fuerza y direccin de la relacin entre dos variables. Vara entre -1.00 y 1.00. Confiabilidad. Se refiere al grado en que su aplicacin repetida al mismo tiempo sujeto y objeto produce iguales resultados. La confiabilidad de un instrumento de medicin se determina mediante diversas tcnicas estadstica. Covarianza. Parmetro que indica el grado en que dos variables varan simultneamente o en conjunto. Una matriz de varianza- covarianza es una matriz simtrica con varianzas en la diagonal y covarianzas fuera de la diagonal. La covarianza asympttica es una matriz de grandes muestras. Error. Es una inconsistencia en las respuestas de una persona a una escala, es un rompimiento con el patrn ideal de intensidad de la escala. Cuando el nmero de errores es excesivo, la escala no presenta reproductividad y no puede aceptarse. La reproductividad se determina mediante un coeficiente. Estadstica. Ciencia que se ocupa del estudio de fenmenos de tipo genrico, normalmente complejos y enmarcados en un universo variable, mediante el empleo de modelos de reduccin de la informacin y de anlisis de validacin de los resultados en trminos de representatividad. La estadstica aplicada a las ciencias sociales estudia el comportamiento de una poblacin mediante un estudio cuyo propsito es hacer inferencias a partir de un subconjunto de datos, llamado muestra, tomados de ella. Estadstica Descriptiva. Se refiere a los mtodos de recoleccin, descripcin, visualizacin y resumen de los datos que pueden ser presentados en forma numrica grfica. Es una rama de la estadstica aplicada. Estadstica Inferencial. Se refiere a la generacin de los modelos y predicciones relacionadas con los fenmenos estudiados, teniendo en cuenta el aspecto aleatorio y la incertidumbre en las observaciones. Extrapola los resultados obtenidos en el anlisis de los datos y a partir de ello predecir acerca de la poblacin, con un margen de confianza conocido. Se apoya fuertemente en el clculo de probabilidades. Estadstica Paramtrica. Es la que requiere que los elementos que integran las muestras contengan elementos parmetros o medibles. 95 Estadstica No Paramtrica. Estudia las pruebas y modelos estadsticos cuya distribucin subyacente no se ajusta a los llamados criterios paramtricos. Su distribucin no puede ser definida a priori, pues son los datos observados los que la determinan. La utilizacin de estos mtodos se hace recomendable cuando no se puede asumir que los datos se ajusten a una distribucin normal o cuando el nivel de medida empleado no sea, como mnimo, de intervalo Estimacin mxima de verosimilitud o maximum likelihood estimation. Tcnica estadstica usada para estimar simultneamente todos los parmetros del modelo. LISREL. Procedimiento y paquete de anlisis de Linear Structural RELations de conjuntos de variables latentes y observables, y de su estructura de covarianzas. Realiza anlisis factorial confirmatorio y anlisis de trayectorias. Modelamiento de ecuacin estructural (MES o SEM en ingls). Tcnica estadstica multivariada que combina el anlisis factorial confirmatorio y el anlisis estructural de trayectorias. Modelo anidado (nested). Modelo que usa los mismos constructos que otro modelo, pero difiere en el nmero o tipos de relaciones causales. Cuando una trayectoria es modificada, se dice que el modelo esta anidado en el modelo original. Modelo de medicin. Submodelo de modelamiento de ecuacin estructural que especifica indicadores por constructo y evala la confiabilidad y validez de los constructos involucrados. Modelo estructural. Conjunto de relaciones entre variables o constructos; establece una secuencia o trayectoria presumiblemente causal entre variables independientes y variables dependientes. Multicolinealidad. Grado en el que una variable independiente vara con otras variables independientes. Altos niveles de multicolinealidad afectan los supuestos estadsticos de independencia de las variables. Pearson correlation (correlacin producto momento de Pearson). Calcula la relacin entre dos variables de tipo intervalar y que estn normalmente distribuidas. Polychoric correlation (correlacin policrica). Calcula la relacin entre dos variables de tipo intervalar y que estn normalmente distribuidas, pero que estn agrupadas en dos categories (correlacin tetracrica) o en mltiples categoras ordenadas (correlacin policrica). Polyserial correlation (correlacin poliserial).Calcula la relacin entre una variable de tipo intervalar y de distribucin continua, y una variable discreta de dos valores como ocurre con sexo (correlacin point-biserial) o que tiene ms de dos valores igualmente espaciados (correlacin point-polyserial). PRELIS. Es un acrnimo de PRE-processor de LISREL y es til para preparar bases de datos y obtener las matrices de correlaciones y covarianzas necesarias pare el MES. Regresin Mltiple. Es un mtodo para analizar el efecto de dos o ms variables independientes sobre una dependiente. Es una extensin de la regresin lineal slo que con un mayor nmero de variables independientes. Sirve para predecir el valor de una variable dependiente conociendo el valor y la influencia de las variables independientes incluidas en el anlisis. SIMPLIS. Es un acrnimo de SIMPLe english para LISREL que contiene una sintaxis o commandos simples necesarios para llevar a cabo aplicaciones LISREL en Windows. Validez. Es el grado en que un instrumento refleja un dominio realmente mide la variable que pretende medir. Ejemplo: un instrumento para medir inteligencia vlido debe medir inteligencia y no la memoria. Validez de constructo. Tipo de validez que determina qu tanto un instrumento de medicin efectivamente mide un constructo terico. 96 Variable observada o indicador. Valor observado que se usa para medir indirectamente un constructo terico o variable latente. Es una variable operacionalizada; un ejemplo es un reactivo o conjunto de reactivos de un cuestionario. Variable. Es una propiedad que puede variar y cuya variacin es susceptible de medirse. La variable se aplica a un grupo de personas u objetos, los cuales pueden adquirir diversos valores respecto a la variable. Variable dependiente. Es el efecto resultante de la manipulacin de la variable independiente. La variable dependiente no se manipula, sino que se mide para ver el efecto de la variable independiente sobre ella. Variable endgena. Constructo que es una consecuencia dependiente de una variable exgena. En el diagrama de trayectorias, las flechas apuntan a variables endgenas que se representan con un valo. Variable exgena. Constructo que predice o antecede a una o ms variables endgenas. En el diagrama de trayectorias, la flecha parte de ella y sale de un valo. Variable independiente. Es la que se considera como supuesta causa en una relacin entre variables; es una condicin antecedente. Variable latente. Constructo que no es directamente observable o medible, pero que puede ser medido indirectamente mediante variables observables.
Trmino estadstico en espaol Trmino estadstico en ingls Moda Mode Mediana Median Media Mean Desviacin estndar Standard deviation Varianza Variance Mximo Maximum Mnimo Minimum Rango Range