Vous êtes sur la page 1sur 11

Estadstica Inferencial II

AEF - 1025

Unidad 1 Regresin lineal simple y mltiple


1.1. Regresin Lineal Simple. 1.1.1. Prueba de Hiptesis en Regresin Lineal Simple. 1.1.2. Calidad del Ajuste Regresin Lineal Simple. 1.1.3. Estimacin y Prediccin por Intervalo en regresin lineal simple. 1.1.4. Uso de Software. 1.2. Regresin Lineal Mltiple. 1.2.1. Pruebas de Hiptesis en Regresin Lineal Mltiple. 1.2.2. Intervalos de Confianza y Prediccin en regresin mltiple. 1.2. 3.Uso de un software estadstico. 1.3. Regresin no lineal

En este documento se encuentra el temario y material desarrollado. 1.1.

Regresin Lineal Simple.

Introduccin El trmino "regresin" fue acuado por Sir Francis Galton (1822-1911), primo de Charles Darwin. Galton estudiaba la eugnica, trmino tambin introducido por s mismo para definir el estudio de la mejora de la raza humana a partir de los caracteres hereditarios. Galton estudi la altura de los hijos con relacin a la altura de sus padres, y prob que la altura de hijos altos regresaba hacia la media de la altura de la poblacin a lo largo de sucesivas generaciones. En otras palabras, hijos de padres extraordinariamente altos tendan a ser en promedio ms bajos que sus padres, e hijos de padres muy bajos tendan a ser en promedio ms altos que sus padres. En la actualidad, el trmino de regresin se utiliza siempre que se busca predecir una variable en funcin de otra, y no implica que se est estudiando si se est produciendo una regresin a la media. Anteriormente a Galton se debe mencionar a Legendre (1752-1833), quien introdujo el mtodo de los mnimos cuadrados utilizndolos para definir la

longitud de 1 metro como una diez millonsima parte del arco meridional. Con posterioridad a Galton, las propiedades de las tcnicas de regresin fueron estudiadas por Edgeworth, Pearson y Yule. La tcnica de regresin lineal simple est indicada cuando se pretende explicar una variable respuesta cuantitativa en funcin de una variable explicativa cuantitativa tambin llamada variable independiente, variable regresora o variable predictora. Por ejemplo, se podra intentar explicar el peso en funcin de la altura. El modelo intentara aproximar la variable respuesta mediante una funcin lineal de la variable explicativa. Las suposiciones que se realizan al aplicar las tcnicas de regresin lineal son: -El modelo propuesto es lineal (es decir existe relacin entre la variable explicativa y la variable explicada, y esta relacin es lineal). Es decir se asume que: var.respuesta= 0+ var. explicativa 1+0 Siendo 0 el trmino independiente (constante o intercept), 1 el coeficiente de regresin de la variable explicativa (pendiente o slope) y es una variable aleatoria que se llama error residual. -La variable explicativa se ha medido sin error. -El valor esperado de del modelo es cero. -La varianza de (y por lo tanto de la variable respuesta) es constante. -Los son independientes entre s. -Si se desean realizar contrastes de hiptesis sobre los parmetros (coeficientes) o sobre el modelo, tambin es necesario que la distribucin de sea normal. Para estudiar la validez del modelo es necesario confirmar estas hiptesis mediante el estudio de los residuos (valores observados - valores predichos): normalidad, tendencias, etc. Cuando no se cumplen los criterios de aplicacin es necesario realizar transformaciones a las variables, o bien para obtener una relacin lineal o bien para homogeneizar la varianza.

Regresin lineal simple. Tiene como objeto estudiar cmo los cambios en una variable, no aleatoria, afectan a una variable aleatoria, en el caso de existir una relacin funcional entre ambas variables que puede ser establecida por una expresin lineal, es decir, su representacin grfica es una lnea recta. Cuando la relacin lineal concierne al valor medio o esperado de la variable aleatoria, estamos ante un modelo de regresin lineal simple. La respuesta aleatoria al valor x de la variable controlada se designa por Yx y, segn lo establecido, se tendr

De manera equivalente, otra formulacin del modelo de regresin lineal simple sera: si xi es un valor de la variable predictora e Yi la variable respuesta que le corresponde, entonces Ei es el error o desviacin aleatoria de Yi . Definicin VALOR MEDIO. Constante que representa el centro de gravedad de la ley de probabilidad de una variable aleatoria y que, en casos de notable simetra en la funcin de densidad, puede interpretarse que dicha constante nos seala la zona donde se sitan los valores de mxima probabilidad de la variable aleatoria. El valor medio o valor esperado de una variable aleatoria X se define como

siempre que dicho valor exista, donde f es la funcin de densidad de la variable.

Estimacin de parmetros.

En un grupo de 8 pacientes se miden las cantidades antropomtricas peso y edad, obtenindose los siguientes resultados: Resultado de las mediciones edad 12 8 10 11 7 7 10 14 peso 58 42 51 54 40 39 49 56 Existe una relacin lineal importante entre ambas variables? Calcular la recta de regresin de la edad en funcin del peso y la del peso en funcin de la edad. Calcular la bondad del ajuste En qu medida, por trmino medio, vara el peso cada ao? En cunto aumenta la edad por cada kilo de peso? Solucin: Para saber si existe una relacin lineal entre ambas variables se calcula el coeficiente de correlacin lineal, que vale:

ya que

Por tanto el ajuste lineal es muy bueno. Se puede decir que el ngulo entre el vector formado por las desviaciones del peso con respecto a su valor medio y el de la edad con respecto a su valor medio, , es:

es decir, entre esos vectores hay un buen grado de paralelismo (slo unos 19 grados de desviacin). La recta de regresin del peso en funcin de la edad es

La recta de regresin de la edad como funcin del peso es

que como se puede comprobar, no resulta de despejar en la recta de regresin de Y sobre X. La bondad del ajuste es

por tanto podemos decir que el de la variabilidad del peso en funcin de la edad es explicada mediante la recta de regresin correspondiente. Lo mismo podemos decir en cuanto a la variabilidad de la edad en funcin del peso. Del mismo modo puede decirse que hay un de varianza que no es explicada por las rectas de regresin. Por tanto la varianza residual de la regresin del peso en funcin de la edad es

y la de la edad en funcin del peso:

Por ltimo la cantidad en que vara el peso de un paciente cada ao es, segn la recta de regresin del peso en funcin de la edad, la pendiente de esta recta, es decir, b1=2,8367 Kg/ao. Cuando dos personas difieren en peso, en promedio la diferencia de edad entre ambas se rige por la cantidad b2=0,3136 aos/Kg de diferencia.

Vous aimerez peut-être aussi