Vous êtes sur la page 1sur 12

Universidad Don Bosco

Facultad de Ingeniera

Evaluacin: Trabajo cooperativo N3: Regresin y Correlacin.

Alumnos: Aguilar Hernndez, Kevin Rodolfo AH120463 Carrillo Caldern, Vladimir Arturo. CC121955 Maltez Hernndez, Diana Abigail MH120437 Lara Sosa, Alejandro Jess LS120399
Morales Pineda, Christian Alexander MP121117

Asignatura Estadstica I

Fecha de Entrega. Ciudadela Don Bosco, 4 de noviembre del 2013.

1. DEFINICION DE LOS CONCEPTOS DE REGRESION Y CORRELACION Regresin:


La regresin estadstica o regresin a la media es la tendencia de una medicin extrema a presentarse ms cercana a la media en una segunda medicin. La regresin se utiliza para predecir una medida basndonos en el conocimiento de otra.

Correlacin:
En probabilidad y estadstica, la correlacin indica la fuerza y la direccin de una relacin lineal y proporcionalidad entre dos variables estadsticas. Se considera que dos variables cuantitativas estn correlacionadas cuando los valores de una de ellas varan sistemticamente con respecto a los valores homnimos de la otra: si tenemos dos variables (A y B) existe correlacin si al aumentar los valores de A lo hacen tambin los de B y viceversa. La correlacin entre dos variables no implica, por s misma, ninguna relacin de causalidad

2. LINEA DE REGRESION O RECTA DE MINIMOS CUADRADOS


Se llama lnea de mejor ajuste y se define como la lnea que hace mnima la suma de los cuadrados de las desviaciones respecto a ella de todos los puntos que corresponden a la informacin recogida. La recta de los mnimos cuadrados que aproxima el conjunto de puntos (x1, y1), (x2, y2), (x3, y3),., (xn, yn) tomando en cuenta a Y como variable dependiente tiene por ecuacin Y=ax+b (ecuacin pendiente-ordenada al origen) A esta ecuacin suele llamarse recta de regresin de Y sobre X, y se usa para estimar los valores de Y para valores dados de X. El trabajo consiste en encontrar las constantes a y b las cuales se llaman coeficientes de regresin. Estos coeficientes de regresin se obtienen mediante las ecuaciones llamadas ecuaciones normales las cuales se obtienen as: Sea y=ax+b Luego las ecuaciones normales son: y=ax+nb (1) (2)

xy=ax2 + bx

Las constantes quedan fijadas al resolver simultneamente las ecuaciones anteriormente encontradas, es decir, al resolver el anterior sistema de ecuaciones. Que se llaman las ecuaciones normales para la recta de mnimos cuadrados.

3. Dos ejemplos de aplicacin de la recta de mnimos cuadrados.


1) Los costos de las jornadas de trabajo en una empresa constructora en medio ao se presentan a continuacin. Cules sern los costos en una jornada de trabajo de 40 horas?
MES ENERO FEBRERO MARZO ABRIL MAYO JUNIO TOTAL HORAS (X) 10.00 12.50 17.50 20.00 50.00 30.00 140.00 COSTO (Y) 400 500 500 600 1,500 900 4,400

Solucin: MES ENERO FEBRERO MARZO ABRIL MAYO JUNIO TOTAL HORAS (X) 10.00 12.50 17.50 20.00 50.00 30.00 140.00 COSTO (Y) 400 500 500 600 1,500 900 4,400 (X)(Y) 4000 6250 8750 12000 75000 27000 133,000 X2 100 156 306 400 2,500 900 4,363

Luego sustituyendo en las ecuaciones normales, resulta:

1. 2.

Por tanto; a= 27.667 y b= 87.747 Entonces

( )

Con esta ecuacin de mnimos cuadrados se pueden predecir los costos totales aproximados de acuerdo a las horas laboradas. Los costos en una jornada de trabajo de 40 horas son: R/ 2) Los siguientes dados relacionan la cantidad diaria de accidentes de trnsito en las rutas de acceso de un centro comercial de San Salvador con la cantidad de gente que llega diariamente al centro comercial. -Si las visitas fueran fueran de 4 miles de personas. Cuntos accidentes de trnsito se esperan? X Visitas diarias al centro comercial (en miles) 2 3 2.5 3.1 Solucin: X 2 3 2.5 3.1 10.5 Y 3 4 3 6 16 XY 6 12 7.5 18.6 44.1 X2 4 9 6.25 9.61 28.86 Y Cantidad de accidentes automovilsticos diarios 3 4 3 6

Total:

Luego sustituyendo en las ecuaciones normales, resulta:

1. 2.

Por tanto a= 2.2077 y b= -1.8506

Entonces con la ecuacin de recta de mnimos cuadrados

( )

Para X= 4 (miles de visitas)

( )

R/ Se esperan aproximadamente 7 accidentes de transito

4. ESCRIBE TRES TIPOS DE CURVAS REDUCIBLES A LA FORMA LINEA. FUNCIN EXPONENCIAL, POTENCIAL Y LOGARTMICA

El problema de ajustar un modelo potencial, de la forma Y=AX+ b y uno Exponencial Y=AB^ X se reduce al de la funcin lineal, con solo tomar logaritmos.

Modelo potencial:
Si tomamos logaritmos en la expresin de la funcin potencial, obtendremos: Log Y = log A +b log X Como vemos es la ecuacin de una recta: Y=a+bX, donde ahora a = log A. De modo que el problema es sencillo, basta con transformar Y en log Y y X en log X y ajustar una recta a los valores transformados. El parmetro b del modelo potencial coincide con el coeficiente de regresin de la recta ajustada a los datos transformados, y A lo obtenemos mediante el antilog(a).

Modelo exponencial:
Tomando logaritmos en la expresin de la funcin exponencial, obtendremos: logY = logA + logB X Tambin se trata de la ecuacin de una recta Y=a+bX, pero ahora ajustndola a logY y a X; de modo que, para obtener el parmetro A del modelo exponencial, basta con hacer antilog(a), y el parmetro B se obtiene tomando antilog (b).

Modelo logartmico:
La curva logartmica Y = a + b logX es tambin una recta, pero en lugar de estar referida a las variables originales X e Y, est referida a logX y a Y.

Hemos visto, cmo, a pesar de ser inicialmente modelos mucho ms complejos que el de una recta, estos tres ltimos se reducen al modelo lineal sin ms que transformar adecuadamente los datos de partida. Ejemplo: Las cifras siguientes son datos sobre el porcentaje de llantas radiales producidas por cierto fabricante que an pueden usarse despus de recorrer cierto nmero de millas: Miles de Millas recorridas (X) Porcentaje til (Y) 1 99 2 95 5 85 15 55 25 30 30 24 35 20 40 15

a) Ajustar los datos a una curva exponencial usando el mtodo de mnimos cuadrados Se llena la siguiente tabla: X 1 2 5 15 25 30 35 40 X= 153 Y 99 95 85 55 30 24 20 15 Log Y 1996 1978 1929 1740 1477 1380 1301 1176 logY=1297759 X^2 1 4 25 225 625 900 1225 1600 X^2= 4605 X log Y 1996 3955 9647 26105 36928 41406 45536 47044 XlogY=21261769

Por otra parte se tiene que

( ) ( ) ( )

( (

) )

Entonces sustituimos para encontrar log y log asi:

1297759= (8) log+ log (153)

21261769= log (153) + log (4605)

Utilizando una herramienta para resolver el sistema de ecuaciones as como en clase obtenemos que:

Log = 2.02749722 = Log = -0.02119205 = 0.9523749198 Por otra parte se sabe que: Log Y= Log +X Log Y= Entonces Log Y= 2.02749722 0.02119205X ( )( )

5. RESUELVA UN EJEMPLO DE APLICACIN DE LA PARABOLA DE MINIMOS CUADRADOS


La siguiente tabla muestra la poblacin de un pas en los aos 1960-2010 en intervalos de 5 aos. Ajustar los datos a una parbola de mnimos cuadrados

Ao

1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010

Poblacin 4.52 5.18 6.25 7.42 8.16 9.12 10.92 11.62 12.68 13.12 13.97 (millones) a) Ajustar los datos a una parbola de mnimos cuadrados b) Estimar la poblacin para los aos

2015

2020

SOLUCIONES: a) Ajustar los datos a una parbola de mnimos cuadrados Realizamos la siguiente tabla AO 1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010 = X -5 -4 -3 -2 -1 0 1 2 3 4 5 0 Y 4.52 5.18 6.25 7.42 8.16 9.12 10.92 11.62 12.68 13.12 13.97 102.96 XY -22.6 -20.72 -39.47 -14.84 -8.16 0 10.92 23.24 38.04 52.48 69.85 109.46 X^2 25 16 9 4 1 0 1 4 9 16 25 110 X^3 -125 -64 -27 -8 -1 0 1 8 27 64 125 0 X^4 625 256 81 16 1 0 1 16 81 256 625 1958 (X^2)Y 113 82.88 56.25 29.68 8.16 0 10.92 46.48 114.12 209.92 349.25 1020.66

Con estos datos y por medio de las ecuaciones que formamos podemos realizar la parbola de mnimos cuadrados as:

Formando las ecuaciones:

Encontrando las constantes a, b y c

102.96= a(11)+ b(0) + c(110) 109.46= a (0) + b(110) +c(0) 1020.66=a(110)+ b(0)+c(1958)
Usando una herramienta para resolver el sistema de ecuaciones as como en clase obtenemos las constantes a, b y c que tiene el siguiente valor:

a= 9.4641 b=0.9950 c=-0.010


Con el valor de estas constantes, podemos armar nuestra ecuacin de parbola de mnimos cuadrados as:

b) Estimar la poblacin para los aos 2015 y 2020 Para el ao de 2015 se tiene un X=6, entonces la poblacin es:

( )

( )

Para el ao 2020 le corresponde un X=7, entonces la poblacin es:

( )

( )

6. DEFINA LOS SIGUIENTES CONCEPTOS

Variacin total.
Vase la siguiente grafica que representa el diagrama de la variacin total.

En la grafica se ha trazado, entre los puntos (x,y) que constituyen el diagrama de dispersin, la lnea terica media aritmtica de la ecuacin de regresin y la lnea que representa la

de Y. Si levantamos una perpendicular desde un valor cualquiera de

X, por ejemplo en X1, la desviacin total de Y con respecto a su media , queda dividida en dos variaciones: variacin no explicada y la variacin explicada es decir:

Variacin total = variacin no explicada + variacin explicada.

Variacin explicada:
Es la variacin en con respecto a su media , y se le llama variacin explicada.

Variacin no explicada:
Se refiere a otros factores que pueden influir en el comportamiento de la variable dependiente; por ejemplo, en el caso de probar un abono qumico en la fertilizacin de una determinada parcela cultivada de caf, donde X son las distintas aplicaciones de abono y Y la produccin; las variaciones en la produccin Y tambin pueden deberse a otras variables como el tipo de suelo, el clima, etc. Entonces, como estas variables no entran en el anlisis del comportamiento de la produccin, a (Yvariacin no explicada. )2 se le llama

El coeficiente de correlacin, expresado en funcin de estas variaciones es:

Coeficiente de determinacin r2
Al cuadrado de r se le llama coeficiente de determinacin o sea:

El coeficiente r2 expresa la proporcin de la varianza de Y asociada con la varianza de Xi.

Coeficiente de correlacin r
Ya hemos dicho anteriormente, que la correlacin mide la intensidad o fuerza con que estn relacionadas las variables, y ser medida por el coeficiente r de relacin. Tipos de correlacin: Atendiendo a la relacin de las variables: a) Correlacin directa o positiva: cuando por aumentos en la variable independiente ocurren tambin aumentos en la variable dependiente; o, si disminuye la variable independiente, ocurren disminuciones en la variable dependiente.

b) Correlacin inversa o negativa: cuando por aumentos en la variable independiente ocurren disminuciones en la variable dependiente; o, si disminuye la variable independiente, ocurren aumentos en la variable dependiente. El coeficiente r de correlacin toma valores entre 0 y 1 para la positiva; y para la correlacin inversa o negativa el valor de r oscilara entre 0 y -1. Un valor de r=1 r=-1 se interpreta diciendo que existe correlacin perfecta entre las variables. En forma positiva o negativa respectivamente. Un valor de r=0, significa que no existe ninguna relacin entre las variables; por ejemplo si quisiramos relacionar las variables inteligencia y estatura; es obvio que el valor dar sera cero, o un valor acercndose a cero. De lo dicho anteriormente se concluye que entre ms se acerca el valor de ra 1 ms asociacin existe entre las variables, y entre ms se acerque a cero menos relacin hay entre las variables

Bibliografa

http://www.monografias.com/trabajos16/metodos-lineales/metodos-lineales.shtml

Estadstica: Elementos de estadstica descriptiva y probabilidad, Gildaberto Bonilla, 2da edicin San Salvador, El Salvador UCA Editores, 1993 (impresin de 2012). Estadstica Elemental, Robert Johnson, Grupo editorial Iberoamrica 1990, Impreso en Mxico, D.F. Enero, 1991. Estadstica para ciencias e ingeniera, John B Kennedy and Adam M. Neville, segunda edicin, 1982, HARLA, S.A de C.V

Vous aimerez peut-être aussi