Académique Documents
Professionnel Documents
Culture Documents
-2014 1
Ejemplo
Una investigación trata de explicar el estado de los pacientes de un tipo no agresivo
de cáncer en función de las variables:
b
Tabla 1 Resumen del modelo
R cuadrado Error típ. de la
Modelo R R cuadrado corregida estimación
a
1 ,761 ,579 ,559 ,298
a. Variables predictoras: (Constante), Intrusiones, Pronmed,
Evitación
b. Variable dependiente: Resultados
b
Tabla 2 ANOVA
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
a
1 Regresión 7,582 3 2,527 28,448 ,000
Residual 5,508 62 ,089
Total 13,091 65
a. Variables predictoras: (Constante), Intrusiones, Pronmed, Evitación
b. Variable dependiente: Resultados
a
Tabla 3 Coeficientes
Coeficientes no Coeficientes
estandarizados tipificados
Modelo B Error típ. Beta t Sig.
1 (Constante) ,276 ,110 2,506 ,015
Pronmed ,010 ,001 ,655 7,608 ,000
Evitación -,017 ,006 -,277 -2,828 ,006
Intrusiones ,006 ,006 ,095 ,999 ,322
a. Variable dependiente: Resultados
Los resultados parecen convincentes, con una prueba F global significativa y en las
pruebas t-Student individuales se obtienen resultados coherentes: hay relación signi-
ficativa del estado con el pronóstico (a mejor pronóstico mejor estado) y con el
afrontamiento de evitación (a más evitación peor estado). Pero hay dos problemas:
• El estado Y no es continuo y la interpretación de los coeficientes B1 y B2 es
forzada
• Algo más fuerte es que los valores de las variables predictoras no resultan en
valores 0 o 1 de la variable respuesta Estado (Y) sino en valores decimales e inclu-
so fuera de rango, lo que es inadmisible. Por ejemplo:
lidos. Necesitamos cambiar la forma del modelo que relaciona la variable respuesta
Y con las variables independientes.
El modelo
Sea 1 la probabilidad de un evento A de interés, entonces repre-
senta cuantas veces es más probable que ocurra A a que no ocurra (“chance de A”) y
su logaritmo neperiano (que se llama “logit”) mide de modo continuo y de
-∞ a +∞ cómo cambia esta chance. En el modelo de regresión logística ponemos esta
medida de la chance en función de las variables independientes:
Gráficamente:
Figura 1 Relación entre p y Logit(p)
1 5.0
0.01 -4.6 4.0
0.05 -2.9 3.0
logit p = ln(p/(1-p)
2.0
0.10 -2.2
1.0
0.20 -1.4
0.0
0.30 -0.8 -1.0
0.40 -0.4 -2.0
0.50 0.0 -3.0
0.60 0.4 -4.0
0.70 0.8 -5.0
0.80 1.4 0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00
0.90 2.2 p
0.95 2.9
0.99 4.6 1
EST-203 ESTADISTICA II Arturo Calderón G.-2014 4
(2) Ajuste del modelo (con el R2 de Nagelkerke y la matriz de confusión que SPSS
llama “Tabla de Clasificación”).
(3) Contrastes individuales para cada Xj, H0: βj=0 vs H1 donde H1 puede ser de una
cola o de dos colas (con el Test de Wald).
(4) Importancia relativa de cada v.i. con el indicador Exp(B) (que se interpreta en
términos del cociente : A mayor exponencial Exp(B), más importante la
correspondiente v.i.
Ejemplo
En el estudio de cáncer y la asociación de los resultados del tratamiento con ciertas
variables clínicas y psicológicas, aplicamos el procedimiento Binary Logistic del mó-
dulo Regression SPSS a la base de datos CANCER.SAV (en intranet), obteniendo
varios cuadros, pero los que se interpretan son:
Primero: El Test global de H0: β1=β2=β3=0 que SPSS llama “Prueba omnibus”, en
donde se mira la significación del modelo
Tabla 1 Pruebas omnibus sobre los coeficientes
del modelo
Chi
cuadrado gl Sig.
Paso 1 Paso 45,695 3 ,000
Bloque 45,695 3 ,000
Modelo 45,695 3 ,000
Segundo: Evaluamos el ajuste del modelo final, en la tabla “Resumen del modelo”
(“Model Summary”) que muestra el R2 de Nagelkerke de 0.724 indica que hay una
verosimilitud de 72.4% en este modelo en comparación con el modelo donde no se
postula ninguna v.i. como asociada a la mejoría.
EST-203 ESTADISTICA II Arturo Calderón G.-2014 5
También es importante ver la tabla “matriz de confusión” que SPSS llama “Tabla de
clasificación” (“Classification Table”)
Tabla 3 Tabla de clasificacióna
Pronosticado
Resultados Porcentaje
Observado Empeoró/Sin cambio Mejoró correcto
Paso 1 Resultados Empeoró/Sin cambio 14 4 77,8
Mejoró 3 45 93,8
Porcentaje global 89,4
a. El valor de corte es .500
Se encuentra que el modelo clasifica bien al 77.8% de casos donde no hubo mejora y
al 93.8% de casos donde sí la hubo. En promedio, el modelo logra clasificar bien al
89.4% de los casos, que es un % apreciable en relación al 50% que se espera si se
hace clasificación al azar.
Cuarto: Evaluamos la importancia relativa de las v.i. significativas con el Exp(B), que
se interpreta en términos de la chance donde ' , que en este caso sería
la probabilidad de mejoría. Exp(B) figura en la última columna de la tabla “Variables
en la ecuación”. En general, a mayor valor más importancia relativa.
Tabla 4 Variables en la ecuación
B E.T. Wald gl Sig. Exp(B)
a
Paso 1 Pronmed ,082 ,021 14,950 1 ,000 1,085
Evitación -,162 ,078 4,331 1 ,037 ,851
Intrusiones ,059 ,081 ,528 1 ,467 1,061
Constante -1,611 1,178 1,870 1 ,171 ,200
a. Variable(s) introducida(s) en el paso 1: Pronmed, Evitación, Intrusiones.
En cambio en el caso de Evitación: Exp(B2)=0.851 indica que por cada punto adi-
cional en Evitación la nueva chance de mejoría es 0.851 veces la antigua (pues
B2<0).