Regresión Logística

REGRESIÓN LOGÍSTICA
Joel Christian Roque Henriquez

jroqueh@ins.gob.pe
Tesis II
24/09/2018
Índice o tabla de contenidos
• Generalidades
• Prueba de hipótesis para los parámetros
• Bondad de ajuste
• Interpretación de los coeficientes de regresión
• Algunas precauciones importantes
• Regresión logística: un brevísimo ejemplo
• Fuente de información
Generalidades
• Es una de las herramientas más versátiles con las que todo
analista puede contar.
• Proporciona una solución de análisis multivariado para los
diseños clásicos de cohorte y caso-control, que va más allá de
las posibilidades de las tablas clásicas y de la Prueba de
Mantel-Haenszel.
• Posibilita un análisis de regresión cuando la variable
dependiente (VD) está medida en forma dicotómica. También
proporciona una base para dar solución al problema de
modelar con variables dependientes multinomiales u ordinales.
• Se ocupa de estimar la probabilidad de ocurrencia de una VD
en función de un determinado perfil de predictores (variables
independientes del modelo o VI).
11/10/2018 Nombre y apellido del docente.
Prueba de hipótesis para los parámetros
• Para responder a la pregunta de si una variable es relevante
para el problema o no, el recurso más usado es la realización
de una prueba de hipótesis. Debe aclararse que el término
“relevante” no aluda a la importancia biológica o causal de la
variable. Se refiere exclusivamente a si, desde el punto de
vista estadístico, su presencia tiene una concomitancia real
con la variable de respuesta.
• El “LR test” nos permite evaluar al modelo de forma global,
determinando si hay diferencia significativa entre el modelo
nulo (sin incluir covariables) y el modelo sintetizado (que
incluye a una o más covariables). En otras palabras: “…sirve
para evaluar si las variables X1, X2,…, Xk tomadas en
conjunto, contribuyen efectivamente a “explicar” las
modificaciones que se producen en P(Y=1)” (Silva, 1995)
11/10/2018 Nombre y apellido del docente.
Bondad de ajuste
El criterio para evaluar la Bondad de ajuste en la RL es
similar al empleado en otros modelos de regresión: se
realiza la comparación entre los valores predichos por el
modelo y los observados en la muestra. A partir de esta
observación se puede obtener, al menos, dos tipos de
indicadores de la “bondad de ajuste” que son de uso
común en la RL:
La pseudo R2: generalmente basada en la “deviance” y
que tiene diferentes versiones de cálculo.
La prueba de Hosmer-Lemeshow: que utiliza un
estadígrafo X2 para valorar la diferencia significativa entre
predicciones y observaciones.
Interpretación de los coeficientes de regresión
Se pueden proponer al menos dos formas:
1. Del modelo RL se puede deducir que 𝑂𝑅 𝑥 = 𝑒 𝛽𝑗 ; de
𝑗
modo que, el coeficiente de regresión pasa a modificar
exponencialmente a la base natural para determinar el
riesgo.
2. El coeficiente de regresión expresa el cambio que se
produce en ln(odds) cuando 𝑥𝑖 aumenta en una unidad
y el resto de las variables permanece inalterada (Silva,
1995).
Algunas precauciones importantes
Tamaño de muestra: Freeman (1987; citado por Silva,
1995) señala que el número de elementos muestrales
debe ser superior a (10)*(k+1), donde k es el número de
covariables.
Colinealidad: Los resultados derivados de la colinealidad
entre las covariables del modelo afectan, en general, la
estimación de parámetros del mismo. Por ejemplo, cuando
tres variables han sido generadas a partir de una cuarta,
digamos que son operaciones de suma, y todas participan
del modelo, entonces la estimación de parámetros no es
viable. En un caso menos extremo, si la correlación es alta
pero no es la máxima, entonces lo que se pierde es
confiabilidad de los resultados (Silva, 1995).
Algunas precauciones importantes
Monotonía: “un problema a nuestro juicio suficientemente
enfatizado concierne al hecho de que, para que la regresión
logística tenga un sentido claro, las variables explicativas deben
tener una relación monótona con la probabilidad del evento que
se estudia. Esto quiere decir que la relación entre cada variable
X y P(Y=1) tiene que ser o bien directa o bien indirecta. Dicho
aún de otro modo, debe evitarse que X sea tal que P(Y=1)
aumente con X para cierto rango de valores y disminuya para
otro rango de valores de X.
Este fenómeno indeseable se produce, por ejemplo, con la edad
de la madre (X) y la probabilidad de que el hijo sea “de bajo
peso”. En esta situación P(Y=1) disminuye en la medida que X
se acerca desde la izquierda al intervalo 18-35, y vuelve a
crecer para edades superiores a 35…(Silva, 1995).
Regresión logística: un brevísimo ejemplo
Utilizaremos la siguiente base ficticia sobre un estudio
caso control de hábitos de fumar (factor o VI) y cáncer de
pulmón (evento o VD).
Regresión logística: un brevísimo ejemplo
Vemos que los OR estimados para ambas VI son significativos,

y que las dos se constituyen como riesgo. En el caso del hábito
de fumar concluimos: tras controlar la otra variable predictora,
los que fuman (fuma=1) tienen 25.2 veces el riesgo de los que
no, de contraer cáncer de pulmón.
Fuente de información
Silva, L. (1995). Excursión a la regresión logística en
ciencias de la salud. La Habana: Díaz de los Santos.

Regresión Logística

Transféré par

Informations du document

Description originale:

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Regresión Logística

Transféré par

Droits d'auteur :

Formats disponibles

REGRESIÓN LOGÍSTICA

Joel Christian Roque Henriquez

Vemos que los OR estimados para ambas VI son significativos,

Vous aimerez peut-être aussi