Vous êtes sur la page 1sur 11

Captulo X

Regresin Logstica
Conceptos y definiciones
Es un modelo clsico de regresin lineal simple o mltiple, pero
donde la variable dependiente es binaria o dicotmica.

X3
X5

X1
X2

X4

XITO
FRACASO

Es decir, adopta slo dos valores posibles: xito y fracaso, positivo


y negativo, muerto y vivo, buen y mal desempeo, parasitado o no,
aprobado o no aprobado.
La regresin logstica es un tipo especial de regresin que se utiliza
para explicar y predecir una variable categrica binaria (dos grupos)
en funcin de varias variables independientes que a su vez pueden
ser cuantitativas o cualitativas.

138
Permite modelizar la probabilidad de que ocurra un evento dado
una serie de variables independientes.
Razones para utilizar la Regresin Logstica
(1) La razn Odds Ratio es una variable discreta (dicotmica) cuyo
comportamiento sigue una distribucin binomial, invalidando el supuesto
bsico de normalidad.
(2) La Funcin de Relacin es una regresin intrnsecamente no lineal.
(3) La varianza de una variable dicotmica no es constante, al cambiar
los valores de las Xi los puntos de Y se abren en un abanico que refleja la
heterocedasticidad.

Aplicaciones de la Curva Logstica

En Economa
* Podemos querer distinguir entre riesgo de crdito alto y
bajo.
* Empresa rentable o no rentable.
* Empresa bajo riesgo financiero o no.
* xito de Ventas frente a fracaso en ventas.
* Compradores (consumidores) frente a no
compradores.

En Veterinaria:
V. Dependiente (alcanza, no alcanza el peso al
destete)
V. Independientes: Raza, Peso al Nacer, Ganancia de
peso, Indice de Quetelet.

Expresiones de la Regresin Logstica


El valor terico recibe diferentes nombres
(Sinnimos) en la Literatura Cientfica:

139

(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)

Odds Ratio

Razn de ventajas
Razn de oportunidades
Razn de desigualdades
Razn de momios
Transformacin logstica
Razn de verosimilitud
Cociente de posibilidades
Oportunidad Relativa

Odds Ratio:

Odds _ Ratio

P
Q

Odds _ Ratio

probabilid ad _ xito
1 probabilid ad _ xito

Este cociente expresa que si P=0,50 entonces el cociente vale uno:


Odds _ Ratio

0,50
1
1 0,50

O un xito es a un fracaso (1 a 1)

Si P=0,75 entonces el cociente es:


Odds _ Ratio

0,75
3
1 0,75

O tres xitos por un fracaso (3 a 1)

El modelo logstico se basa en el logaritmo natural de este cociente

Regresin logstica

140

Razn d(eE
Ve)nt
ajae
s
Odds

Odds( E ) e
e

OR

e
e
ln OR ( OR )
Modelo sin interaccin

p
bo b1 X 1 b2 X 2 ... bk X k
ln
1 p
p
b0 b1 X 1 b2 X 2 b3 ( X 1 * X 2 ) b4 X 22
ln
1 p

141
Curva Logstica
Si Z=0 entonces Y= 0.5
Si Z tiende a + infinito entonces Y= 1
Si Z tiende a - infinito entonces Y= 0

Interpretacin de los coeficientes estimados Betas:


Un coeficiente beta positivo aumenta la Odds Ratio
(OR)(es decir, la probabilidad de ocurrencia del suceso
aumenta).
Un beta negativo disminuye la OR
Ejemplo de aplicacin
Los datos que se dan a continuacin pertenecen a 79 nios
afectados de enfermedad hemoltica neonatal, de los cuales 63
sobrevivieron

16

murieron.

En

cada

nio

se

registr

la

concentracin de hemoglobina en el cordn umbilical, X (medida en


gramos por cien mililitros) y la concentracin de bilirrubina, Y

142
((mg/100ml). Queremos predecir, mediante estos dos valores, si un
nio determinado tiene ms probabilidad de sobrevivir o de morir.
Grupo (1=sobrevivientes; 2=fallecidos)
X=hemoglobina
Y=bilirrubina
Grupo Hb

BILI

18.7

2.2

17.8

2.7

17.8

2.5

17.6

4.1

17.6

3.2

17.6

1.0

17.5

1.6

17.4

1.8

17.4

2.4

17.0

1
1

Grupo Hb

BILI

15.4

2.2

15.3

2.0

15.3

2.0

15.1

3.2

14.8

1.8

14.7

3.7

14.7

3.0

14.6

5.0

0.4

14.3

3.8

17.0

1.6

14.3

4.2

16.6

3.6

14.3

3.3

Grupo Hb

BILI

14.3

3.3

14.1

3.7

14.0

5.8

13.9

2.9

13.8

3.7

13.6

2.3

13.5

2.1

13.4

Grupo Hb

BILI

12.2

3.5

12.2

2.4

12.0

2.8

12.0

3.5

11.8

2.3

11.8

4.5

11.6

3.7

2.3

10.9

3.5

13.3

1.8

10.9

4.1

12.5

4.5

10.9

1.5

12.3

5.0

10.8

3.3

143

16.3

4.1

10.6

3.4

16.1

2.0

10.5

6.3

16.0

2.6

10.2

3.3

16.0

0.8

9.9

4.0

15.8

3.7

9.8

4.2

15.8

3.0

9.7

4.9

15.8

1.7

8.7

5.5

15.6

1.4

7.4

3.0

15.6

2.0

5.7

4.6

15.6

1.6

15.8

1.8

15.4

4.1

12.3

5.6

Grupo Hb

BILI

Grupo Hb

BILI

9.5

3.6

5.3

2.8

9.4

3.8

5.1

5.8

9.2

5.6

3.4

3.9

8.8

5.6

7.6

4.7

7.4

6.8

7.1

5.6

6.7

5.9

5.7

6.2

5.5

4.8

5.3

4.8

144

Antes de proceder con el


anlisis estadstico hay que
recodificar la variable grupo
como 0 y 1 .

Secuencia de Instrucciones en el STATISTIX


STATISTICS>LINEAR MODELS>LOGISTIC REGRESSION

Student Edition of Statistix 8.0

ANEMIA

Unweighted Logistic Regression of CATEGO


Predictor
Variables
Constant
BILI
Hb

Wald
Coefficient
-2.36928
-0.49530
0.53762

Std Error Coef/SE


2.47984
-0.96
0.35580
-1.39
0.15534
3.46

P
0.3394
0.1639
0.0005

Deviance
40.06
P-Value
0.9999
Degrees of Freedom
78
Convergence criterion of 0.01 met after 5 iterations
Cases Included 81

Missing Cases 0

Ecuacin de regresin logistica

sobrevivencia 0 1 Bili 2 Hb
Sobrevivencia 2,30 0,495Bili 0,53Hb
Del cuadro de ANOVA se concluye que la hemoglobina es un factor
pronstico importante; la bilirrubina no.

145
Bondad de ajuste del modelo
La bondad de ajuste del modelo se prueba con el estadstico de
Desviacin. El estadstico de Desviacin sigue una distribucin jicuadrado con n-k-1 grados de libertad. Dicho estadstico compara el
modelo actual con el modelo saturado.

Modelo Saturado:
Es aquel que tiene tantos parmetros como puntos de datos

Se plantea un sistema hipottico constituido por hiptesis nula y


alterna:
Ho: el modelo es de buen ajuste a los datos
H1: el modelo no es de buen ajuste
Utilizando un nivel alpha de significacin, la regla de decisin es:
Rechace Ho si la Desviacin es significativa (esto es, est asociada
a un valor P<0,05). El cuadro de ANOVA dado muestra que:

Deviance
40.06
P-Value
0.9999
Degrees of Freedom
78
Lo cual revela, que no se rechaza Ho. En consecuencia, el modelo
es bueno.
Contribucin relativa de cada variable independiente
A continuacin, tras haber probado la bondad del modelo nos
queda por evaluar el grado de contribucin de cada una de las
variables independientes al modelo.
El estadstico de prueba est basado en el cociente entre el
coeficiente de regresin y el error estndar del coeficiente de
regresin. En la regresin logstica, a este cociente se le llama:
Estadstico de Wald que sigue una distribucin normal.

146

Constant
BILI
Hb

Wald=Coef/SE
-0.96
-1.39
3.46

P
0.3394
0.1639
0.0005

Se aprecia que la bilirrubina no es significativa, es decir,no hace


una contribucin significativa al modelo; la hemoglobina s.
Esto nos debe llevar a reflexionar sobre si la Bilirrubina debe
continuar en el modelo pues su aporte no es significativo. En otras
palabras, la bilirrubina debe ser excluida del modelo.

La Regresin Logstica como funcin discriminante


A partir de las medias de X e Y; de la matriz de varianzascovarianzas se puede obtener una funcin discriminante lineal
(parecida

la

funcin

discriminante

de

Fisher,

que

es

una

combinacin lineal de las variables involucradas).


Las medias y sus diferencias son:
X

Sobrevivientes
Fallecidos
Diferencia (S F)
Media
(S+F)/2

13.897
7.756
6.141
10.827

3.090
4.831
-1.741
3.961

Sustituyendo en la funcin discriminante los promedios, obtenemos:


Z = 0.6541 X - 0.3978 Y
Z = (0.6541)(10.827)+(-0.3978)(3.961) = 5.506 (punto de corte)
La funcin discriminante tiene como punto de corte 5,506, as si un
neonato tiene un valor numrico dado por la funcin mayor a este
valor,

la probabilidad es ms alta a sobrevivir y caso contrario a

fallecer.
As, si un neonato tiene un valor de hemoglobina de 16 y de
Bilirrubina 3,2, aplicando la funcin discriminante obtenida:
Z = 0.6541 Hb - 0.3978 Bili

147
Z = 0.6541 (16) - 0.3978 (3,2)=9,227 como este valor numrico
es superior a 5,506 el neonato tiene mayor probabilidad de vivir que
de morir.
Esta situacin puede ser ms claramente apreciada en un diagrama
de dispersin que muestre la funcin discriminante:

Observe que hay dos puntos negros del lado de los sobrevivientes
stos son dos neonatos mal clasificados por la funcin, pero en
trminos generales la funcin de discriminante se comporta bien.

Vous aimerez peut-être aussi