Académique Documents
Professionnel Documents
Culture Documents
Regresin Logstica
Conceptos y definiciones
Es un modelo clsico de regresin lineal simple o mltiple, pero
donde la variable dependiente es binaria o dicotmica.
X3
X5
X1
X2
X4
XITO
FRACASO
138
Permite modelizar la probabilidad de que ocurra un evento dado
una serie de variables independientes.
Razones para utilizar la Regresin Logstica
(1) La razn Odds Ratio es una variable discreta (dicotmica) cuyo
comportamiento sigue una distribucin binomial, invalidando el supuesto
bsico de normalidad.
(2) La Funcin de Relacin es una regresin intrnsecamente no lineal.
(3) La varianza de una variable dicotmica no es constante, al cambiar
los valores de las Xi los puntos de Y se abren en un abanico que refleja la
heterocedasticidad.
En Economa
* Podemos querer distinguir entre riesgo de crdito alto y
bajo.
* Empresa rentable o no rentable.
* Empresa bajo riesgo financiero o no.
* xito de Ventas frente a fracaso en ventas.
* Compradores (consumidores) frente a no
compradores.
En Veterinaria:
V. Dependiente (alcanza, no alcanza el peso al
destete)
V. Independientes: Raza, Peso al Nacer, Ganancia de
peso, Indice de Quetelet.
139
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
Odds Ratio
Razn de ventajas
Razn de oportunidades
Razn de desigualdades
Razn de momios
Transformacin logstica
Razn de verosimilitud
Cociente de posibilidades
Oportunidad Relativa
Odds Ratio:
Odds _ Ratio
P
Q
Odds _ Ratio
probabilid ad _ xito
1 probabilid ad _ xito
0,50
1
1 0,50
O un xito es a un fracaso (1 a 1)
0,75
3
1 0,75
Regresin logstica
140
Razn d(eE
Ve)nt
ajae
s
Odds
Odds( E ) e
e
OR
e
e
ln OR ( OR )
Modelo sin interaccin
p
bo b1 X 1 b2 X 2 ... bk X k
ln
1 p
p
b0 b1 X 1 b2 X 2 b3 ( X 1 * X 2 ) b4 X 22
ln
1 p
141
Curva Logstica
Si Z=0 entonces Y= 0.5
Si Z tiende a + infinito entonces Y= 1
Si Z tiende a - infinito entonces Y= 0
16
murieron.
En
cada
nio
se
registr
la
142
((mg/100ml). Queremos predecir, mediante estos dos valores, si un
nio determinado tiene ms probabilidad de sobrevivir o de morir.
Grupo (1=sobrevivientes; 2=fallecidos)
X=hemoglobina
Y=bilirrubina
Grupo Hb
BILI
18.7
2.2
17.8
2.7
17.8
2.5
17.6
4.1
17.6
3.2
17.6
1.0
17.5
1.6
17.4
1.8
17.4
2.4
17.0
1
1
Grupo Hb
BILI
15.4
2.2
15.3
2.0
15.3
2.0
15.1
3.2
14.8
1.8
14.7
3.7
14.7
3.0
14.6
5.0
0.4
14.3
3.8
17.0
1.6
14.3
4.2
16.6
3.6
14.3
3.3
Grupo Hb
BILI
14.3
3.3
14.1
3.7
14.0
5.8
13.9
2.9
13.8
3.7
13.6
2.3
13.5
2.1
13.4
Grupo Hb
BILI
12.2
3.5
12.2
2.4
12.0
2.8
12.0
3.5
11.8
2.3
11.8
4.5
11.6
3.7
2.3
10.9
3.5
13.3
1.8
10.9
4.1
12.5
4.5
10.9
1.5
12.3
5.0
10.8
3.3
143
16.3
4.1
10.6
3.4
16.1
2.0
10.5
6.3
16.0
2.6
10.2
3.3
16.0
0.8
9.9
4.0
15.8
3.7
9.8
4.2
15.8
3.0
9.7
4.9
15.8
1.7
8.7
5.5
15.6
1.4
7.4
3.0
15.6
2.0
5.7
4.6
15.6
1.6
15.8
1.8
15.4
4.1
12.3
5.6
Grupo Hb
BILI
Grupo Hb
BILI
9.5
3.6
5.3
2.8
9.4
3.8
5.1
5.8
9.2
5.6
3.4
3.9
8.8
5.6
7.6
4.7
7.4
6.8
7.1
5.6
6.7
5.9
5.7
6.2
5.5
4.8
5.3
4.8
144
ANEMIA
Wald
Coefficient
-2.36928
-0.49530
0.53762
P
0.3394
0.1639
0.0005
Deviance
40.06
P-Value
0.9999
Degrees of Freedom
78
Convergence criterion of 0.01 met after 5 iterations
Cases Included 81
Missing Cases 0
sobrevivencia 0 1 Bili 2 Hb
Sobrevivencia 2,30 0,495Bili 0,53Hb
Del cuadro de ANOVA se concluye que la hemoglobina es un factor
pronstico importante; la bilirrubina no.
145
Bondad de ajuste del modelo
La bondad de ajuste del modelo se prueba con el estadstico de
Desviacin. El estadstico de Desviacin sigue una distribucin jicuadrado con n-k-1 grados de libertad. Dicho estadstico compara el
modelo actual con el modelo saturado.
Modelo Saturado:
Es aquel que tiene tantos parmetros como puntos de datos
Deviance
40.06
P-Value
0.9999
Degrees of Freedom
78
Lo cual revela, que no se rechaza Ho. En consecuencia, el modelo
es bueno.
Contribucin relativa de cada variable independiente
A continuacin, tras haber probado la bondad del modelo nos
queda por evaluar el grado de contribucin de cada una de las
variables independientes al modelo.
El estadstico de prueba est basado en el cociente entre el
coeficiente de regresin y el error estndar del coeficiente de
regresin. En la regresin logstica, a este cociente se le llama:
Estadstico de Wald que sigue una distribucin normal.
146
Constant
BILI
Hb
Wald=Coef/SE
-0.96
-1.39
3.46
P
0.3394
0.1639
0.0005
la
funcin
discriminante
de
Fisher,
que
es
una
Sobrevivientes
Fallecidos
Diferencia (S F)
Media
(S+F)/2
13.897
7.756
6.141
10.827
3.090
4.831
-1.741
3.961
fallecer.
As, si un neonato tiene un valor de hemoglobina de 16 y de
Bilirrubina 3,2, aplicando la funcin discriminante obtenida:
Z = 0.6541 Hb - 0.3978 Bili
147
Z = 0.6541 (16) - 0.3978 (3,2)=9,227 como este valor numrico
es superior a 5,506 el neonato tiene mayor probabilidad de vivir que
de morir.
Esta situacin puede ser ms claramente apreciada en un diagrama
de dispersin que muestre la funcin discriminante:
Observe que hay dos puntos negros del lado de los sobrevivientes
stos son dos neonatos mal clasificados por la funcin, pero en
trminos generales la funcin de discriminante se comporta bien.