Vous êtes sur la page 1sur 5

Mediante un modelo de regresión logística, la posible asociación entre el cáncer

de vejiga, el consumo de café y el ambiente de residencia. Se eligen 50 pacientes


con cáncer y 50 individuos sin la enfermedad y se definen tres variables: CÁNCER
con los valores 0 (no cáncer) y 1 (cáncer), CAFÉ con los valores 0 (sin consumo
de café) y 1 (consumo de café) y MEDIO con los valores 0 (medio rural) y 1 (medio
urbano).

Los resultados se resumen en la tabla siguiente:

café no café
urbano rural urbano rural
Cáncer 32 1 15 2
No cáncer 15 10 15 10

La "chi-cuadrado del modelo" (19,504 è p=0,000) corresponde al contraste para el


modelo completo. Aunque también se puede hacer la prueba para comparar un
modelo con Café y Medio con otro que sólo contenga Café:

En este caso de un bloque con una sola variable, la prueba sería equivalente a la
de Wald para Medio. El que no coincidan exactamente (12,040 la de Wald y
16,864 la del logaritmo del cociente de verosimilitudes) es debido a que ambas
son aproximadas. Si la discrepancia fuera muy grande indicaría que el tamaño
muestral es pequeño para aplicar estas pruebas.

Prueba de Hosmer-Lemeshow

Es otra prueba para evaluar la bondad del ajuste de un modelo de regresión


logística, aunque su uso está más discutido que la anterior. La idea es si el ajuste
es bueno, un valor alto de la p predicha se asociará (con un frecuencia parecida a
la p) con el resultado 1 de la variable binomial. Se trata de calcular para cada
observación del conjunto de datos las probabilidades de la variable dependiente
que predice el modelo, agruparlas y calcular, a partir de ellas, las frecuencias
esperadas y compararlas con las observadas mediante la prueba c2.

La prueba de Hosmer-Lemeshow da como resultado:

Área bajo la curva ROC

La prueba de Hosmer-Lemeshow evalúa un aspecto de la validez del modelo: la


calibración (grado en que la probabilidad predicha coincide con la observada).

El otro aspecto es la discriminación (grado en que el modelo distingue entre


individuos en los que ocurre el evento y los que no).

Como medida de la discriminación se usa el área bajo la curva ROC construida


para la probabilidad predicha por el modelo, que representa, para todos los pares
posibles de individuos formados por un individuo en el que ocurrió el evento y otro
en el que no, la proporción de los que el modelo predice una mayor probabilidad
para el que tuvo el evento.
Para estudiar interacción hay que crear la variable producto CAFXME. El
modelo completo es:

Como ya se dijo antes, para este esquema de muestreo el coeficiente a0 no


significa nada, a1 es el aumento del logaritmo del odds por consumir café en un
ambiente rural,a2 es el aumento del logaritmo del odds por vivir en un ambiente
urbano, con respecto al rural, sin consumir café y a3 modeliza la posible
interacción o dicho en otros términos el "sobre aumento" por ambas cosas
(consumir café en un medio urbano). El primer contraste a realizar es sobre la
interacción, es decir, H0: a3=0.

Con la prueba del logaritmo del cociente de verosimilitudes, el modelo completo es


significativo (p=0,000). Con la prueba de Wald para el término de interacción, no
se puede rechazar (p=0,296) la hipótesis nula de no existencia de interacción y,
por tanto, habría que volver a ajustar a un modelo que tuviera solamente las
variable CAFÉ y MEDIO, Sin embargo, y a efectos didácticos, se va a estudiar el
efecto de un error de tipo II en dicho contraste. Supóngase, por lo tanto, que el
coeficiente a3 es realmente distinto de 0. En este caso no puede hablarse de
un odds ratio para el café, sino que habría un odds ratio para el café en el medio
rural y otro distinto en el medio urbano. Según el modelo, el odds ratio estimado
para el café en el medio rural es:

y su intervalo de confianza al 95%:

Ahora, el odds ratio estimado para el café en el medio urbano es:

Para calcular su intervalo de confianza se necesita estimar la varianza de

y, por tanto, su intervalo de confianza al 95%:

Obsérvese que en el caso de que exista interacción, los resu

ltados son radicalmente distintos para el medio urbano (el odds ratio para el café
es 2,134) que para el medio rural (el odds ratio para el café es 0,5). Si se
comparan estos resultados con los del modelo sin el término de interacción:
Se observa, como era de esperar, un estimador para el odds ratio del café,
intermedio entre los calculados en el supuesto anterior. Conviene, por
consiguiente, calcular la potencia del contraste con el que se rechazó la existencia
de interacción. El contraste fue:

H0: a3 = 0
H1: a3 ¹ 0

y la potencia es: 1 – b = Prob(rechazar H0|H1 verdadera). Con el nivel de


significación a=0,05, se rechaza H0 si

es decir si

Concretando H1, por ejemplo a3=1, se trata de calcular la probabilidad de


encontrar

si a3 fuera 1. Teniendo en cuenta la normalidad de

Es decir, la potencia del contraste es efectivamente muy baja y habría que ser
muy prudente a la hora de comunicar los resultados de este estudio.

Por ende seria mejor para la estimación posterior del modelo que este fueseeliminada la variable
café la cual su P-VALUE es demasiado alto y no se pudio

Vous aimerez peut-être aussi