Ministerio del Poder Popular para la Planificacin y Finanzas
Caracas Los Cortijos
Profesora: Integrantes:
Olivares, Erika Carvajal, Yessica Da Silva, Ernesto Gmez, Keiver
Los Cortijos 31-10-2011 Ajuste de una Recta de Regresin En estadstica la regresin lineal o ajuste lineal es un mtodo matemtico que moderniza la relacin entre una variable dependiente Y, las variables independientes Xi y un trmino aleatorio . Este modelo puede ser expresado como:
Donde 0 es la interseccin o trmino "constante", las son los parmetros respectivos a cada variable independiente, y p es el nmero de parmetros independientes a tener en cuenta en la regresin. La regresin lineal puede ser contrastada con la regresin no lineal. La regresin ser lineal cuando la funcin de ajuste seleccionada sea una funcin lineal, una recta, se habla tambin de recta de regresin. La primera forma de regresiones lineales documentada fue el mtodo de los mnimos cuadrados, el cual fue publicado por Legendre en 1805, y en dnde se inclua una versin del teorema de Gauss-Mrkov. Etimologa El trmino regresin se utiliz por primera vez en el estudio de variables antropomtricas: al comparar la estatura de padres e hijos, result que los hijos cuyos padres tenan una estatura muy superior al valor medio tendan a igualarse a ste, mientras que aquellos cuyos padres eran muy bajos tendan a reducir su diferencia respecto a la estatura media; es decir, "regresaban" al promedio. La constatacin emprica de esta propiedad se vio reforzada ms tarde con la justificacin terica de ese fenmeno.
El trmino lineal se emplea para distinguirlo del resto de tcnicas de regresin, que emplean modelos basados en cualquier clase de funcin matemtica. Los modelos lineales son una explicacin simplificada de la realidad, mucho ms gil y con un soporte terico por parte de la matemtica y la estadstica mucho ms extenso. Pero bien, como se ha dicho, podemos usar el trmino lineal para distinguir modelos basados en cualquier clase de aplicacin. Supuestos del modelo de regresin lineal Para poder crear un modelo de regresin lineal, es necesario que se cumpla con los siguientes supuestos: La relacin entre las variables es lineal. Los errores en la medicin de las variables explicativas son independientes entre s. Los errores tienen varianza constante. (Homocedasticidad) Los errores tienen una esperanza matemtica igual a cero (los errores de una misma magnitud y distinto signo son equiprobables). El error total es la suma de todos los errores. Aplicaciones de la regresin lineal Lneas de tendencia Una lnea de tendencia representa una tendencia en una serie de datos obtenidos a travs de un largo perodo. Este tipo de lneas puede decirnos si un conjunto de datos en particular (como por ejemplo, el PBI, el precio del petrleo o el valor de las acciones) han aumentado o decrementado en un determinado perodo. Se puede dibujar una lnea de tendencia a simple vista fcilmente a partir de un grupo de puntos, pero su posicin y pendiente se calcula de manera ms precisa utilizando tcnicas estadsticas como las regresiones lineales. Las lneas de tendencia son generalmente lneas rectas, aunque algunas variaciones utilizan polinomios de mayor grado dependiendo de la curvatura deseada en la lnea. Medicina En medicina, las primeras evidencias relacionando la mortalidad con el fumar tabaco vinieron de estudios que utilizaban la regresin lineal. Los investigadores incluyen una gran cantidad de variables en su anlisis de regresin en un esfuerzo por eliminar factores que pudieran producir correlaciones espurias. En el caso del tabaquismo, los investigadores incluyeron el estado socio- econmico para asegurarse que los efectos de mortalidad por tabaquismo no sean un efecto de su educacin o posicin econmica. No obstante, es imposible incluir todas las variables posibles en un estudio de regresin. En el ejemplo del tabaquismo, un hipottico gen podra aumentar la mortalidad y aumentar la propensin a adquirir enfermedades relacionadas con el consumo de tabaco. Por esta razn, en la actualidad las pruebas controladas aleatorias son consideradas mucho ms confiables que los anlisis de regresin. Rectas de regresin La regresin es una tcnica estadstica utilizada para simular la relacin existente entre dos o ms variables. Por lo tanto se puede emplear para construir un modelo que permita predecir el comportamiento de una variable dada.
La regresin es muy utilizada para interpretar situaciones reales, pero comnmente se hace de mala forma, por lo cual es necesario realizar una seleccin adecuada de las variables que van a construir las ecuaciones de la regresin, ya que tomar variables que no tengan relacin en la prctica, nos arrojar un modelo carente de sentido, es decir ilgico.
La regresin es una tcnica estadstica utilizada para simular la relacin existente entre dos o ms variables. Por lo tanto se puede emplear para construir un modelo que permita predecir el comportamiento de una variable dada.
La recta de regresin de Y sobre X es aquella que minimiza la suma de cuadrados de las diferencias entre los valores de Y, y los correspondientes Y (para el mismo valor de X) medidos en dicha recta.
Caractersticas
Tambin se le conoce con el nombre de Recta de los mnimos cuadrados. El promedio de la sumatoria de las distancias al cuadrado a esa recta es menor que el promedio de la sumatoria de las distancias al cuadrado a cualquier otra recta. Las relaciones estadsticas son relaciones promedio. Es un buen resumen. Es una representacin espacial de r. Es una representacin de la asociacin que hay entre dos variables cuantitativas.
Las rectas de regresin son las rectas que mejor se ajustan a la nube de puntos (o tambin llamado diagrama de dispersin) generada por una distribucin binomial. Matemticamente, son posibles dos rectas de mximo ajuste: La recta de regresin de Y sobre X:
La recta de regresin de X sobre Y:
La correlacin ("r") de las rectas determinar la calidad del ajuste. Si r es cercano o igual a 1, el ajuste ser bueno y las predicciones realizadas a partir del modelo obtenido sern muy fiables (el modelo obtenido resulta verdaderamente representativo); si r es cercano o igual a 0, se tratar de un ajuste malo en el que las predicciones que se realicen a partir del modelo obtenido no sern fiables (el modelo obtenido no resulta representativo de la realidad). Ambas rectas de regresin se intersecan en un punto llamado centro de gravedad de la distribucin. Este tipo de ajuste es de inters en varias situaciones diferentes 1. Cuando tenemos una serie de entradas y salidas, para las cuales no sabemos si existe una relacin funcional, pero lo sospechamos, como en la figura anterior. En este caso, la bondad de la recta de regresin (esto es, cunto se aproxima a los datos) nos informa de si esta relacin existe o no. 2. Cuando tenemos un conjunto de datos, de los cuales sabemos con seguridad que deberan estar alineados y queremos emplear la recta de mejor ajuste para determinar alguna cantidad indirecta. Por ejemplo, supongamos que conocemos una serie de pares de valores de tensin V frente a intensidad de corriente I para un cable y queremos determinar la resistencia de acuerdo con la ley de Ohm, V = IR. En lugar de determinar una resistencia para cada dato, buscaremos la recta de mejor ajuste, cuya pendiente ser la resistencia buscada. 3. Las rectas de mejor ajuste tambin pueden usarse para hallar el valor de la salida para entradas que no hayamos medido experimentalmente. Esto es lo que se conoce como interpolacin si x se encuentra en el mismo intervalo que los datos experimentales y extrapolacin si est fuera de ste. 4. Cuando tenemos un conjunto de datos para los cuales existe una relacin funcional complicada, como la ilustrada en la figura, pero para la cual sabemos que en determinadas regiones, ms o menos grandes, la conducta es aproximadamente lineal. En este caso, si nos restringimos a una de estas regiones, podemos aproximar la funcin por la recta de mejor ajuste, lo que simplifica los clculos. Por supuesto, en este caso la recta de mejor ajuste depender de la regin en que nos encontremos, por lo que deberemos ser conscientes en todo momento de los lmites de validez de la aproximacin que empleemos. En estas aproximaciones tambin podemos emplear la recta de mejor ajuste para interpolar. Sin embargo, las extrapolaciones son mucho ms arriesgadas, ya que podemos salirnos de los lmites de validez. El clculo de la recta de mnimos cuadrados es inseparable del trazado de la grfica correspondiente. Antes incluso de determinar la pendiente y la ordenada en el origen de la recta de mejor ajuste, podemos establecer si los puntos estn ms o menos alineados. Para ello, antes de hacer ningn clculo, situamos los puntos en una grfica, sea por ordenador o sobre papel milimetrado. Una simple inspeccin de su posicin nos indicar si es conveniente ajustar una recta, si necesitramos una funcin ms complicada o si no se ve ninguna relacin entre las entradas y las salidas. Igualmente en esta fase podemos descartar algn punto que se aparte excesivamente del resto. En este caso, dicho punto no se incluir en los clculos, aunque si debe indicarse en la grfica. Debe rodearse por un pequeo crculo, como indicacin de que no ha sido considerado. Aplicando esto a nuestra lista de datos, eliminamos el punto , que en lo sucesivo no ser incluido en los clculos, salvo que indiquemos lo contrario. La nube de puntos resultantes quedara cubiertos por una elipse (que no hay que trazar). Los puntos estarn tanto ms alineados cuanto ms se aproxima esta elipse a una recta, esto es, cuanto ms estrecha es. Las grficas que se hagan, sean exclusivamente de los datos experimentales, de rectas de mnimos cuadrados, u otras solicitadas explcitamente, deben adjuntarse al final de la memoria, estando convenientemente etiquetadas. Toda grfica deber ir numerada y con un ttulo explicativo. Si hay varias curvas o rectas trazadas en la misma hoja se indicar cul es cada una.