0 évaluation0% ont trouvé ce document utile (0 vote)
93 vues14 pages
Este documento presenta una introducción a la regresión logística. Explica que la regresión logística permite modelar variables dependientes dicotómicas en función de variables independientes. Cubre temas como pruebas de hipótesis para los parámetros del modelo, bondad de ajuste, interpretación de los coeficientes, y precauciones como el tamaño de muestra y la colinealidad. También incluye un breve ejemplo de regresión logística para predecir el riesgo de cáncer de pulmón basado en hábit
Este documento presenta una introducción a la regresión logística. Explica que la regresión logística permite modelar variables dependientes dicotómicas en función de variables independientes. Cubre temas como pruebas de hipótesis para los parámetros del modelo, bondad de ajuste, interpretación de los coeficientes, y precauciones como el tamaño de muestra y la colinealidad. También incluye un breve ejemplo de regresión logística para predecir el riesgo de cáncer de pulmón basado en hábit
Este documento presenta una introducción a la regresión logística. Explica que la regresión logística permite modelar variables dependientes dicotómicas en función de variables independientes. Cubre temas como pruebas de hipótesis para los parámetros del modelo, bondad de ajuste, interpretación de los coeficientes, y precauciones como el tamaño de muestra y la colinealidad. También incluye un breve ejemplo de regresión logística para predecir el riesgo de cáncer de pulmón basado en hábit
jroqueh@ins.gob.pe Tesis II 24/09/2018 Índice o tabla de contenidos • Generalidades • Prueba de hipótesis para los parámetros • Bondad de ajuste • Interpretación de los coeficientes de regresión • Algunas precauciones importantes • Regresión logística: un brevísimo ejemplo • Fuente de información Generalidades • Es una de las herramientas más versátiles con las que todo analista puede contar. • Proporciona una solución de análisis multivariado para los diseños clásicos de cohorte y caso-control, que va más allá de las posibilidades de las tablas clásicas y de la Prueba de Mantel-Haenszel. • Posibilita un análisis de regresión cuando la variable dependiente (VD) está medida en forma dicotómica. También proporciona una base para dar solución al problema de modelar con variables dependientes multinomiales u ordinales. • Se ocupa de estimar la probabilidad de ocurrencia de una VD en función de un determinado perfil de predictores (variables independientes del modelo o VI). 11/10/2018 Nombre y apellido del docente. Prueba de hipótesis para los parámetros • Para responder a la pregunta de si una variable es relevante para el problema o no, el recurso más usado es la realización de una prueba de hipótesis. Debe aclararse que el término “relevante” no aluda a la importancia biológica o causal de la variable. Se refiere exclusivamente a si, desde el punto de vista estadístico, su presencia tiene una concomitancia real con la variable de respuesta. • El “LR test” nos permite evaluar al modelo de forma global, determinando si hay diferencia significativa entre el modelo nulo (sin incluir covariables) y el modelo sintetizado (que incluye a una o más covariables). En otras palabras: “…sirve para evaluar si las variables X1, X2,…, Xk tomadas en conjunto, contribuyen efectivamente a “explicar” las modificaciones que se producen en P(Y=1)” (Silva, 1995) 11/10/2018 Nombre y apellido del docente. Bondad de ajuste El criterio para evaluar la Bondad de ajuste en la RL es similar al empleado en otros modelos de regresión: se realiza la comparación entre los valores predichos por el modelo y los observados en la muestra. A partir de esta observación se puede obtener, al menos, dos tipos de indicadores de la “bondad de ajuste” que son de uso común en la RL: La pseudo R2: generalmente basada en la “deviance” y que tiene diferentes versiones de cálculo. La prueba de Hosmer-Lemeshow: que utiliza un estadígrafo X2 para valorar la diferencia significativa entre predicciones y observaciones. Interpretación de los coeficientes de regresión Se pueden proponer al menos dos formas: 1. Del modelo RL se puede deducir que 𝑂𝑅 𝑥 = 𝑒 𝛽𝑗 ; de 𝑗 modo que, el coeficiente de regresión pasa a modificar exponencialmente a la base natural para determinar el riesgo. 2. El coeficiente de regresión expresa el cambio que se produce en ln(odds) cuando 𝑥𝑖 aumenta en una unidad y el resto de las variables permanece inalterada (Silva, 1995). Algunas precauciones importantes Tamaño de muestra: Freeman (1987; citado por Silva, 1995) señala que el número de elementos muestrales debe ser superior a (10)*(k+1), donde k es el número de covariables. Colinealidad: Los resultados derivados de la colinealidad entre las covariables del modelo afectan, en general, la estimación de parámetros del mismo. Por ejemplo, cuando tres variables han sido generadas a partir de una cuarta, digamos que son operaciones de suma, y todas participan del modelo, entonces la estimación de parámetros no es viable. En un caso menos extremo, si la correlación es alta pero no es la máxima, entonces lo que se pierde es confiabilidad de los resultados (Silva, 1995). Algunas precauciones importantes Monotonía: “un problema a nuestro juicio suficientemente enfatizado concierne al hecho de que, para que la regresión logística tenga un sentido claro, las variables explicativas deben tener una relación monótona con la probabilidad del evento que se estudia. Esto quiere decir que la relación entre cada variable X y P(Y=1) tiene que ser o bien directa o bien indirecta. Dicho aún de otro modo, debe evitarse que X sea tal que P(Y=1) aumente con X para cierto rango de valores y disminuya para otro rango de valores de X. Este fenómeno indeseable se produce, por ejemplo, con la edad de la madre (X) y la probabilidad de que el hijo sea “de bajo peso”. En esta situación P(Y=1) disminuye en la medida que X se acerca desde la izquierda al intervalo 18-35, y vuelve a crecer para edades superiores a 35…(Silva, 1995). Regresión logística: un brevísimo ejemplo Utilizaremos la siguiente base ficticia sobre un estudio caso control de hábitos de fumar (factor o VI) y cáncer de pulmón (evento o VD). Regresión logística: un brevísimo ejemplo
Vemos que los OR estimados para ambas VI son significativos,
y que las dos se constituyen como riesgo. En el caso del hábito de fumar concluimos: tras controlar la otra variable predictora, los que fuman (fuma=1) tienen 25.2 veces el riesgo de los que no, de contraer cáncer de pulmón. Fuente de información Silva, L. (1995). Excursión a la regresión logística en ciencias de la salud. La Habana: Díaz de los Santos.