Académique Documents
Professionnel Documents
Culture Documents
INTRODUCCIN
II.OBJETIVOS
III.BREVE HISTORIA
Hasta fines de 1960, tablas de contingencia - bidireccional cruz
formada por las tablas de clasificacin variables categricas normalmente se analizaron mediante el clculo de chi-cuadrado los
valores de prueba la hiptesis de la independencia. Cuando los
cuadros consista de ms de dos variables, los investigadores que
calcular el chi-cuadrados de tablas de dos vas y, a continuacin, de
nuevo por mltiples sub-cuadros formados a partir de ellos, a fin de
determinar si las asociaciones y / o interacciones que tienen lugar
entre las variables.
Birch en (1963) da origen indirecto a los modelos logartmico
lineales, a raz de un trabajo sobre problemas de asociacin entre
tres variables categoriales. Desde entonces, este procedimiento ha
venido siendo desarrollado y/o difundido por una serie de autores,
como Baker (1981), Benedetti y Brown (1978a; 1978b), Bishop,
Fienberg y Rolland (1975), Brown (1975; 1976), Fienberg (1977),
Goodrnan (1968; 1970; 1971; 1972a; 1972b; 1973; 1979; 1984),
Haberman (1974; 1978; 1979), Knoke y Burke (1982), Kotze (1982) y
Upton (1978), entre otros. En la dcada de 1970 el anlisis de las
transferencias de datos clasificados cambiado de manera
espectacular con la publicacin de una serie de documentos sobre
loglinear modelos de Luisiana Goodman. Aparecido muchos otros
libros en esa poca sobre la base de la labor de Goodman (Bishop,
Finberg y Holanda 1975; Haberman 1975).
Ahora los investigadores se introdujeron a una amplia variedad de
modelos que podran ser montados en los cruzan con los datos. Por
lo tanto, la introduccin del modelo loglinear siempre con un
compromiso formal y riguroso mtodo de seleccin de un modelo o
modelos para describir las asociaciones entre las variables.
Hasta los aos 60 las tablas de contingencia de 22 eran analizadas
calculando estadsticos tipo _2 para testear independencia. Cuando
las tablas involucraban ms variables se sola repetir este anlisis
para las subtablas para determinar las interacciones o asociaciones
entre las variables. A partir de los 70 con los trabajos de Goodman y
la difusin de estos en libros como el de Bishop, Finberg y Holland
(1975) y Haberman (1975) hubo un cambio sustancial en el
tratamiento de estos problemas, en particular con la inclusin de los
modelos loglineales.
El modelo loglineal puede ser visto como un caso del GLM para datos
con distribucin Poisson. Los modelos loglineales se usan con
IV.MARCO TEORICO
GENERALES
DEL
ANLISIS
IV.2.1.1.
Modelo de No Efectos
IV.2.1.2.
IV.2.1.4.
IV.2.1.5.
Modelo de Independencia
IV.2.1.6.
Modelo saturado
IV.2.2.1.
IV.2.2.2.
IV.2.2.3.
Modelos con dos Interacciones de dos
Factores
IV.2.2.4. Modelo
con
todas
las
Interacciones
de
dos
Factores
IV.2.2.5.
Modelo Saturado
MODELOS
BSICOS
reflejara que:
simplificada
o
caractersticas:
estandarizada,
que
tiene
las
siguientes
Por ejemplo:
Tabla de Contingencia del anlisis de la relacin que existe entre la
preferencia de la poblacin de vivir en casa o apartamento en Dos
principales ciudades:
VIVIR EN CASAS
VIVIR EN APART.
CARACAS
10
40
50
VALENCIA
30
20
50
50
50
100
a la proporcin
Sin
estudios
1 grado 39
2 y 3 11
grado
Total
80
Norm Opti
al
ma
49
11
Tot
al
301
123
35
110
58
60
39
21
24
353
167
275
262
148
56
821
Concepto anlogo a la Teora de los Residuos que se utiliza en los Mtodos de Regresin Mltiple para
identificar los Datos Atpicos contenidos en una serie de datos.
La prueba de Mxima Verisimilitud de Pearson (LRT, L2 G2 tal como se le conoce en diferentes textos),
es una prueba estadstica de la bondad de ajuste entre dos modelos. Un modelo relativamente ms
complejo se compara a un modelo ms simple para ver si se comparan significativamente bien para un
juego de datos en particular. El LRT slo es vlido si compara a modelos jerrquicamente anidados. Es
decir, el modelo ms complejo slo debe diferir del modelo simple por la adicin de una o ms variables;
de tal forma que agregando variables adicionales se obtenga una bondad de ajuste mayor. Sin embargo, se
llega a un punto cuando agregar variables adicionales NO mejorar significantemente la bondad de ajuste
del modelo ms simple. El LRT mantiene un criterio objetivo seleccionando entre los posibles modelos.
El LRT se inicia con una comparacin de los Chi Cuadrados de la forma:
L2 2 * ( Ln 2 1 Ln 2 2 )
Es decir, se evala la diferencia de los logaritmos neperianos de los Chi-Cuadrados, basados en la
diferencia de los Grados de Libertad. El LRT sigue aproximadamente al 2 del modelo.
L2 2 * ( Ln 2 1 Ln 2 2 )
Es decir, se evala la diferencia de los logaritmos neperianos de los
Chi-Cuadrados, basados en la diferencia de los Grados de Libertad. El
LRT sigue aproximadamente al 2 del modelo.
Se define como Modelo Saturado (o Completo) a aquel que contiene
TODOS los posibles efectos principales y TODAS las posibles
combinaciones (efectos de 2do., 3er. o ensimo orden) de la Variables
seleccionadas que lo componen.
Debido a que el Modelo Loglineal Saturado, puede reproducir
perfectamente la data estudiada, debido a que contiene todas las
Donde:
( frecuencia ) : Representa la Frecuencia de cada celda o cuadrcula de la
X :
de
la
Variable
Y :
de
la
Variable
Z :
de
la
Variable
XxY :
XxZ :
YxZ :
XxYxZ :
Se puede citar la analoga de este concepto al del Anlisis Factorial para la Regresin Mltiple. El
Anlisis Factorial, permite obtener un Modelo de Regresin Lineal Mltiple ms simple y con menos
variables, mediante la eliminacin de Variables No Significativas, pero a la vez manteniendo un
resultado aceptable a un nivel de confianza predeterminado.
6
EL test de Completa Independencia implica que en el modelo jerrquico todas las variables sean
independientes entre s. Esto se obtiene al comparar los Chi-Cuadrados de cada variable, con la
Relacin Jerrquica
Para un Modelo con Tres (3) Variables de Diseo A, B C, se pueden
obtener una gran cantidad de Modelos Jerrquicos de Orden Inferior,
como por ejemplo los siguientes:
Ln ( frecuencia ) A B C
Ln( frecuencia ) B C
Ln ( frecuencia ) C
Hiptesis Nula ( 2 obtenido de la Tabla para su correspondiente Grados de Libertad). Donde se debe
cumplir que:
2 i 2 0 y p 0.0001
Si lo anterior se cumple, indica que el Modelo Jerrquico independiente es significantemente diferente del
Modelo Saturado, sugiriendo que ese Modelo Jerrquico contiene la variable o variables necesarias para
obtener una buena correlacin o ajuste
AxBxC
AxB
AxC
BxC
INICIO
FIN
Eliminar Modelo no significativo
2i 2 0
p 0.01
El ajuste de modelos