Taller Metodos Regresion Logistica

Mediante un modelo de regresión logística, la posible asociación entre el cáncer
de vejiga, el consumo de café y el ambiente de residencia. Se eligen 50 pacientes

con cáncer y 50 individuos sin la enfermedad y se definen tres variables: CÁNCER
con los valores 0 (no cáncer) y 1 (cáncer), CAFÉ con los valores 0 (sin consumo
de café) y 1 (consumo de café) y MEDIO con los valores 0 (medio rural) y 1 (medio
urbano).
Los resultados se resumen en la tabla siguiente:
café no café
urbano rural urbano rural
Cáncer 32 1 15 2
No cáncer 15 10 15 10
La "chi-cuadrado del modelo" (19,504 è p=0,000) corresponde al contraste para el

modelo completo. Aunque también se puede hacer la prueba para comparar un
modelo con Café y Medio con otro que sólo contenga Café:
En este caso de un bloque con una sola variable, la prueba sería equivalente a la
de Wald para Medio. El que no coincidan exactamente (12,040 la de Wald y
16,864 la del logaritmo del cociente de verosimilitudes) es debido a que ambas
son aproximadas. Si la discrepancia fuera muy grande indicaría que el tamaño
muestral es pequeño para aplicar estas pruebas.
Prueba de Hosmer-Lemeshow
Es otra prueba para evaluar la bondad del ajuste de un modelo de regresión

logística, aunque su uso está más discutido que la anterior. La idea es si el ajuste
es bueno, un valor alto de la p predicha se asociará (con un frecuencia parecida a
la p) con el resultado 1 de la variable binomial. Se trata de calcular para cada
observación del conjunto de datos las probabilidades de la variable dependiente
que predice el modelo, agruparlas y calcular, a partir de ellas, las frecuencias
esperadas y compararlas con las observadas mediante la prueba c2.
La prueba de Hosmer-Lemeshow da como resultado:
Área bajo la curva ROC
La prueba de Hosmer-Lemeshow evalúa un aspecto de la validez del modelo: la

calibración (grado en que la probabilidad predicha coincide con la observada).
El otro aspecto es la discriminación (grado en que el modelo distingue entre

individuos en los que ocurre el evento y los que no).
Como medida de la discriminación se usa el área bajo la curva ROC construida

para la probabilidad predicha por el modelo, que representa, para todos los pares
posibles de individuos formados por un individuo en el que ocurrió el evento y otro
en el que no, la proporción de los que el modelo predice una mayor probabilidad
para el que tuvo el evento.
Para estudiar interacción hay que crear la variable producto CAFXME. El
modelo completo es:
Como ya se dijo antes, para este esquema de muestreo el coeficiente a0 no

significa nada, a1 es el aumento del logaritmo del odds por consumir café en un
ambiente rural,a2 es el aumento del logaritmo del odds por vivir en un ambiente
urbano, con respecto al rural, sin consumir café y a3 modeliza la posible
interacción o dicho en otros términos el "sobre aumento" por ambas cosas
(consumir café en un medio urbano). El primer contraste a realizar es sobre la
interacción, es decir, H0: a3=0.
Con la prueba del logaritmo del cociente de verosimilitudes, el modelo completo es

significativo (p=0,000). Con la prueba de Wald para el término de interacción, no
se puede rechazar (p=0,296) la hipótesis nula de no existencia de interacción y,
por tanto, habría que volver a ajustar a un modelo que tuviera solamente las
variable CAFÉ y MEDIO, Sin embargo, y a efectos didácticos, se va a estudiar el
efecto de un error de tipo II en dicho contraste. Supóngase, por lo tanto, que el
coeficiente a3 es realmente distinto de 0. En este caso no puede hablarse de
un odds ratio para el café, sino que habría un odds ratio para el café en el medio
rural y otro distinto en el medio urbano. Según el modelo, el odds ratio estimado
para el café en el medio rural es:
y su intervalo de confianza al 95%:
Ahora, el odds ratio estimado para el café en el medio urbano es:
Para calcular su intervalo de confianza se necesita estimar la varianza de
y, por tanto, su intervalo de confianza al 95%:
Obsérvese que en el caso de que exista interacción, los resu
ltados son radicalmente distintos para el medio urbano (el odds ratio para el café
es 2,134) que para el medio rural (el odds ratio para el café es 0,5). Si se
comparan estos resultados con los del modelo sin el término de interacción:
Se observa, como era de esperar, un estimador para el odds ratio del café,
intermedio entre los calculados en el supuesto anterior. Conviene, por
consiguiente, calcular la potencia del contraste con el que se rechazó la existencia
de interacción. El contraste fue:
H0: a3 = 0
H1: a3 ¹ 0
y la potencia es: 1 – b = Prob(rechazar H0|H1 verdadera). Con el nivel de

significación a=0,05, se rechaza H0 si
es decir si
Concretando H1, por ejemplo a3=1, se trata de calcular la probabilidad de

encontrar
si a3 fuera 1. Teniendo en cuenta la normalidad de
Es decir, la potencia del contraste es efectivamente muy baja y habría que ser
muy prudente a la hora de comunicar los resultados de este estudio.
Por ende seria mejor para la estimación posterior del modelo que este fueseeliminada la variable
café la cual su P-VALUE es demasiado alto y no se pudio

Taller Metodos Regresion Logistica

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Taller Metodos Regresion Logistica

Transféré par

Droits d'auteur :

Formats disponibles

Mediante un modelo de regresión logística, la posible asociación entre el cáncer

de vejiga, el consumo de café y el ambiente de residencia. Se eligen 50 pacientes

Los resultados se resumen en la tabla siguiente:

La "chi-cuadrado del modelo" (19,504 è p=0,000) corresponde al contraste para el

Es otra prueba para evaluar la bondad del ajuste de un modelo de regresión

La prueba de Hosmer-Lemeshow da como resultado:

Área bajo la curva ROC

La prueba de Hosmer-Lemeshow evalúa un aspecto de la validez del modelo: la

El otro aspecto es la discriminación (grado en que el modelo distingue entre

Como medida de la discriminación se usa el área bajo la curva ROC construida

Como ya se dijo antes, para este esquema de muestreo el coeficiente a0 no

Con la prueba del logaritmo del cociente de verosimilitudes, el modelo completo es

y su intervalo de confianza al 95%:

Ahora, el odds ratio estimado para el café en el medio urbano es:

Para calcular su intervalo de confianza se necesita estimar la varianza de

y, por tanto, su intervalo de confianza al 95%:

Obsérvese que en el caso de que exista interacción, los resu

y la potencia es: 1 – b = Prob(rechazar H0|H1 verdadera). Con el nivel de

Concretando H1, por ejemplo a3=1, se trata de calcular la probabilidad de

si a3 fuera 1. Teniendo en cuenta la normalidad de

Vous aimerez peut-être aussi