Vous êtes sur la page 1sur 5

Contaminacion en Santiago de Chile

Universidad Catolica de la Santsima Concepcion


Facultad de Ingeniera
Estudiante: Diego Quiroga Alcazar
3 de Noviembre, 2014

1.

Introducci
on

Existe un alto interes en conocer cu


ales son los factores que verdaderamente influyen en definicion de Alerta
de Emergencia por contaminaci
on atmosferica. El personal tecnico del Departamento ha logrado consolidar
aleatoriamente desde 1997 a 2014, una base de datos de 500 registros, con las siguientes variables:
OBSER: Observaci
on seleccionada al azar
TEMPE: Temperatura media del da anterior a la resolucion (o C)
CO: Mon
oxido de carbono (ppm)
DAZUFRE: Di
oxido de Azufre (ppm)
RESTRI: Si exista restricci
on vehicular el da anterior
VIENTO: Velocidad del viento (nudos)
META: Concentraci
on de metano (ppm)
RESOL: Resoluci
on de la I. Municipalidad de Santiago
GOB: Coalici
on de Gobierno de Chile

2.

Modelo de Regresi
on Logstico

Se desea generar un modelo de Regresi


on Logstico dado que la variable dependiente RESOL es una variable
binaria. Para la generaci
on del modelo nos basaremos en un criterio de Parsimona, vale decir, menos variables es
mejor. Primero desarrollaremos dos modelos principales, uno que considera el efecto de la variable GOB y otro
que no considera un potencial efecto de la variable ya mencionada. Los resultados que se generaron mediante
R, son los siguientes:

(Intercept)
TEMPE
CO
DAZUFRE
RESTRI
VIENTO
META
GOB

Estimate
-2.0089
-0.0619
-0.0141
0.1963
6.0208
-0.1465
0.2819
-4.9124

Std. Error
1.1870
0.1010
0.0301
0.1047
0.9415
0.0358
0.2431
0.9096

z value
-1.69
-0.61
-0.47
1.87
6.40
-4.09
1.16
-5.40

P-value
0.0906
0.5396
0.6389
0.0608
0.0000
0.0000
0.2461
0.0000

Tabla 1: Modelo Logit Binario considerando la variable GOB

(Intercept)
TEMPE
CO
DAZUFRE
RESTRI
VIENTO
META

Estimate
-4.9168
0.0468
-0.0145
0.2275
4.7508
-0.1304
0.1533

Std. Error
0.9852
0.0774
0.0231
0.0955
0.5012
0.0275
0.1804

z value
-4.99
0.61
-0.62
2.38
9.48
-4.74
0.85

P-value
0.0000
0.5449
0.5320
0.0172
0.0000
0.0000
0.3953

Tabla 2: Modelo Logit Binario sin considerar variable GOB

2.1.

Factores de Riesgo

Como se puede apreciar en la Tabla 1. se tiene que las variables TEMPE, CO, DAZUFRE y META no son
significativas (considerando un valor de significancia de un 5 %), vale decir que estas variables no seran factores
de riesgo.
Para el caso del modelo sin considerar la variable GOB, se tiene que las variables TEMPE, CO y META no son
significativas para el modelo, vale decir que a un nivel de significancia del 5 %, no se rechaza la hipotesis de que
los par
ametros de las variables mencionadas sean 0.
Sin embargo, se recomienda ir probando todos los modelos posibles hasta llegar al mejor. Para ello, se realizar
a
un proceso de Stepwise-Backward.
R cuenta con una funci
on para realizar el proceso descrito anteriormente, basandose en el Criterio de Informaci
on de Akaike1 .
El resultado de aplicar el proceso de Stepwise-Backward es el siguiente:

(Intercept)
DAZUFRE
VIENTO
GOB
RESTRI

Estimate
-1.6866
0.2507
-0.1436
-4.7878
5.9557

Std. Error
0.8334
0.0703
0.0349
0.8613
0.8887

z value
-2.02
3.57
-4.12
-5.56
6.70

P-value
0.0430
0.0004
0.0000
0.0000
0.0000

Tabla 3: Resultado de aplicar Stepwise-Backward, considerando variable GOB


Como se puede apreciar, del modelo general habamos despreciado la variable DAZUFRE por no ser significativa,
pero, la combinaci
on
optima (en terminos de reducir el n
umero de variables) si la considera como significativa
para el modelo. Es por lo anteriormente mencionado que no es recomendable sacar todas las variables no significativas del modelo, sino que ir probando todas las combinaciones posibles.
Para el modelo Logit Binario sin considerar la variable GOB, se tiene el siguiente resultado:

(Intercept)
DAZUFRE
VIENTO
RESTRI

Estimate
-3.9342
0.2331
-0.1248
4.8806

Std. Error
0.6873
0.0561
0.0267
0.4885

z value
-5.72
4.15
-4.67
9.99

P-value
0.0000
0.0000
0.0000
0.0000

Tabla 4: Resultado de aplicar Stepwise-Backward, sin considerar GOB


1 El Criterio de Informaci
on de Akaike (AIC por sus siglas en ingl
es) es un estadstico que relaciona el cociente de verosimilitud
con el n
umero de par
ametros que ajustamos con el modelo.

En este caso el modelo considera como no significativas a las variables TEMPE, CO y META, lo cual implica
que no son consideradas factores de riesgo.

2.2.

Interpretaci
on de los Factores de Riesgo

Los coeficientes de los factores de riesgo considerando la variable GOB son los siguientes:

Coefficients
exp(Coefficients)

(Intercept)
-1.69
0.19

DAZUFRE
0.25
1.28

VIENTO
-0.14
0.87

GOB
-4.79
0.01

RESTRI
5.96
385.93

Tabla 5: Coeficientes de los Factores de Riesgo considerando GOB


El aumento de la concentraci
on de Di
oxido de Azufre en una ppm implica que la probabilidad de que se decrete
alerta ambiental aumenta en 1,28 veces. Si la velocidad del viento aumenta en un nudo, entonces la probabilidad
de que se decrete alerta ambienta aumenta 0,87 veces. Si el gobierno de turno es de Concertacion (GOB=1), la
probabilidad de que se decrete alerta ambiental es 0,01 veces mayor de que si el gobierno fuese de Alianza. Lo
anterior es razonable, debido a que si bien la decision es tomada por el gobierno, esta no es de tipo poltica y
se encuentra regida por evaluaciones tecnicas de la calidad del aire. En general, esas evaluaciones se realizan en
invierno, temporada en que aparecen la mayor cantidad de enfermedades respiratorias. Si se decreta restricci
on
vehicular el da anterior, entonces la probabilidad de que se decrete Alerta de Emergencia por contaminaci
on
atmosferica aumenta en 385,93 veces 2 .
Ahora veamos el caso de que no se considere la variable GOB. Los coeficientes obtenidos para el modelo son los
siguientes:

Coefficients
exp(Coefficients)

(Intercept)
-3.93
0.02

DAZUFRE
0.23
1.26

VIENTO
-0.12
0.88

RESTRI
4.88
131.71

Tabla 6: Coeficientes de los Factores de Riesgo sin considerar GOB


Siguiendo la misma metodologa que considerando la variable GOB, se tiene que si mantenemos constantes
todos los factores excepto la variable DAZUFRE, y esta aumenta en un ppm, entonces la probabilidad de
que se decrete Alerta por Contaminaci
on medioambiental sera 1,26 veces mayor. En el caso del viento, si este
aumenta en un nudo su velocidad, entonces la probabilidad de decretar Alerta medioambiental sera 0,88 veces
mayor. Finalmente, si el da anterior hubo restriccion vehicular, entonces la probabilidad de que haya Alerta
medioambiental es 131,71 veces mayor que si no hubiese restriccion.

2.3.

Intervalos de Confianza

Los intervalos de confianza del modelo general vienen a dar mayor evidencia de cuales son aquellas variables que
fueron eliminadas del modelo, para obtener uno de tipo Parsimonioso. Los resultados para el caso que considera
a la variable GOB y el caso de la que no considera a la variable GOB se pueden apreciar en las siguientes tablas:

2 Cada

interpretaci
on se realiz
o manteniendo como u
nico factor a la variable nombrada y manteniendo constantes las dem
as.

(Intercept)
TEMPE
CO
DAZUFRE
RESTRI
VIENTO
META
GOB

Lmite Inferior
0.01
0.77
0.93
1.02
85.61
0.80
0.85
0.00

Lmite Superior
1.30
1.15
1.04
1.54
3894.12
0.92
2.20
0.03

Tabla 7: Intervalos de confianza para exp(B), considerando variable GOB y N. confianza 95 %


Si observamos la Tabla 7. los intervalos de confianza de las variables TEMPE, CO y META contienen al 13 ,
por lo tanto esto da mayor evidencia de que aquellas variables no son significativas para el modelo. La variable
DAZUFRE si bien desde el punto de vista del test individual no era una variable significativa, esto no se ve
evidenciado en los Intervalos de Confianza.
(Intercept)
TEMPE
CO
DAZUFRE
RESTRI
VIENTO
META

Lmite Inferior
0.00
0.90
0.94
1.05
46.24
0.83
0.82

Lmite Superior
0.05
1.22
1.03
1.52
335.38
0.92
1.67

Tabla 8: Intervalos de confianza para exp(B), sin considerar variable GOB y N. confianza 95 %
El resultado es de forma an
aloga para el modelo que no considera a la variable GOB. Es decir, las variables que
no son significativas para este modelo, como TEMPE, CO y META contienen al 1 en su intervalo. Por lo tanto
esto da mayor evidencia de que estas variables no son significativas para el segundo modelo.

2.4.

Bondad de Ajuste

La bondad de ajuste nos indica el poder que posee el modelo para hacer predicciones. En otras palabras, la
proporci
on de varianza explicada por el modelo Logit.
Para el modelo que considera a la variable GOB, se obtuvo un R2 de Nagelkerke de 0,9130, lo cual indica que
la eficacia predictiva de la probabilidad de ocurrencia de la variable dependiente es de 91,30 %. Por lo tanto el
8,7 % restante viene explicado por aquellas variables que no fueron incluidas en el modelo.
En el modelo que no considera a la variable GOB, se obtuvo un R2 de Nagelkerke de 0,833. Esto indica que
el modelo posee una eficacia predictiva de la probabilidad de la variable dependiente de un 83,33 %. El 16,7 %
restante es explicado por las variables que no feron incluidas.

2.5.

Modelos Predictivos

El modelo que considera a la variable GOB es el siguiente:

RESOL =

3 Si

e1,6866+0,2507DAZU F RE0,1436V IEN T O4,7878GOB+5,9557REST RI


1 + e1,6866+0,2507DAZU F RE0,1436V IEN T O4,7878GOB+5,9557REST RI

solo consideramos el estimador B, los intervalos de aquellas variables que no sean significativas contienen al 0.

El modelo que no considera a la variable GOB es el siguiente:

RESOL =

3.

e3,9342+0,2331DAZU F RE0,1248V IEN T O+4,8806REST RI


1 + e3,9342+0,2331DAZU F RE0,1248V IEN T O+4,8806REST RI

Conclusiones

Una de las principales conclusiones que podemos obtener es que matematicamente, la variable GOB genera un
aporte significativo al modelo predictor, sin embargo desde el punto de vista causal este no debera ser incluido.
Lo anterior debido principalmente a que si bien la decision es tomada por el gobierno, esta no es de tipo poltica
y se basa principalmente en evaluaciones y mediciones tecnicas de la calidad del aire.
Cabe destacar que los modelos de Regresi
on Logsticos son bastante u
tiles cuando uno desea explicar una
variable respuesta de tipo binaria u ordinal, en funcion de un grupo de variables y factores.

4.

Referencias bibliogr
aficas

1. Gujarati, D. (2010). Econometra. Mexico D.F: Mc Graw Hill, 541-596.


2. Pinheiro, J. & Bates, D. R: Akaikes An Information Criterion,
http://stat.ethz.ch/R-manual/R-patched/library/stats/html/AIC.html

Vous aimerez peut-être aussi