Vous êtes sur la page 1sur 9

CORRELACIN

KELLY VANESSA CHVEZ ESPAA

COD. 1453861

LINA MARCELA CERN BARONA

COD. 1410025

Trabajo final de Inferencia Estadstica

Carlos Eduardo Cobo

Ingeniero Electricista

Maestra en Administracin de Empresas

Doctorado en Nuevas Tendencias de Direccin de Empresas

UNIVERSIDAD DEL VALLE

FACULTAD DE CIENCIAS DE LA ADMINISTRACIN

SANTIAGO DE CALI

2016
CORRELACIN

La correlacin es una herramienta utilizada para determinar la dependencia, naturaleza o relacin


que puede existir entre dos o ms variables; en otras palabras se usa para determinar y pronosticar
si las modificaciones en una de las variables realizaran cambios en la otra. Algunos ejemplos que
se pueden mencionar son:

Establecer si hay o no hay relacin entre los gastos de


publicidad y las ventas de un determinado producto.
Determinar si hay o no hay una relacin entre la cantidad
de pacientes embarazadas infectadas por el zika del
ltimo ao y los bebs nacidos con microcefalia del mismo
periodo.
Saber si hay una relacin entre los kilmetros por galn
de gasolina de un vehculo y el tamao del motor del
mismo.

Se debe tener en cuenta que existen dos tipos de variables:

a) Variable dependiente: Es aquella cuyas caractersticas se tratan de modificar mediante la


manipulacin de la variable independiente.
b) Variable independiente: Es aquella que se manipula para analizar y observar como esta
incide en la variable dependiente.

Tipos de relacin:

Relacin directa entre X y Y: Consiste en que al manipular la variable independiente, se


afecta directamente la variable dependiente. Por ejemplo el nmero de ventas de carros
anuales y el nivel de contaminacin del aire; en el ejemplo anteriormente nombrado, al
aumentar las ventas de los carros, se aumenta tambin la contaminacin del aire.
Relacin inversa entre X y Y: Este tipo de variable consiste en que al ser aumentada la
variable independiente, la variable dependiente disminuye y viceversa. Un ejemplo claro es
cuando aumentan los ndices de inflacin de un pas y disminuye el consumo de los
pobladores; al disminuir la inflacin, se observar que el consumo vuelve a subir.
Relaciones de asociacin y no de causa y efecto: La asociacin no necesariamente
implica una relacin de causa y efecto entre las variables. Cuando una persona adquiere un
carro de la empresa Audi, puede que tambin consuma gasolina extra para su vehculo pero
la variable independiente en este caso sera el nivel de ingresos del individuo.

Diagramas de dispersin:

El diagrama de dispersin es un grfico que me permite representar la relacin entre las variables.
En el eje Y se sita la variable dependiente o por estimar; en el eje X se ubica la variable
independiente o por manipular.

Tipos de dispersin segn la grfica:

a) Recta directa: Muestra la relacin directa


b) Recta inversa: Muestra la relacin inversa
c) Curvilnea directa: Muestra la asociacin directa
d) Curvilnea inversa: Muestra la asociacin inversa
e) Ninguna relacin: No permite ver relacin o asociacin alguna entre las variables.
Estimacin mediante la recta de regresin:

Esto se realiza utilizando una ecuacin matemtica para predecir los valores de una variable con
relacin a la otra. En las relaciones lineales entre dos variables se utiliza la ecuacin Y = a + bX,
donde

Y es la variable dependiente.
a es la interseccin en Y.
2 1
b es la pendiente de la recta: =
2 1
X es la variable independiente

Mtodo de mnimos cuadrados:

Es el mtodo que se utiliza para calcular la ecuacin para una lnea dibujada a travs de un diagrama
de puntos de dispersin; se usa para ajustar la grfica si ninguno de los puntos pasa sobre esta.
Para esto la ecuacin de la recta de regresin lineal es = a + bX o la lnea de estimacin, donde:

que se lee que Y estimado o Y gorro, es el valor de la variable Y para un valor de X dado.
A es la interseccin en Y.
b es la pendiente de la recta.
X es el valor de la variable independiente en el rango de los datos.

EL COEFICIENTE DE DETERMINACIN
Es la principal forma con la que se puede medir la fuerza que tiene la asociacin que hay entre las
variables X y Y; como se utiliza una muestra de puntos para desarrollar rectas de regresin, se le
llama tambin coeficiente de determinacin muestral, el cual se deriva de la variacin de los valores
de Y en un conjunto de datos alrededor de la recta de regresin ajustada y su propia media.

Variacin de los valores de Y alrededor de la recta de regresin. ( )2

Variacin de los valores de Y alrededor de su propia media. ( )2

Coeficiente de determinacin muestral ( )2


2 = 1
( )2

Ejemplo de aplicacin:

Servientrega S.A. desea saber la relacin que puede existir entre el tiempo empleado de la
mensajera puerta a puerta y la distancia que se debe recorrer para la entrega de un determinado
producto1. Los datos obtenidos son los siguientes:

Distancia (km) 825 215 1070 550 480 920 1350 325 670 1215
Tiempo (das) 3,5 1 4 2 1 3 4,5 1,5 3 5

a. Realice un diagrama de dispersin a partir de los datos obtenidos

1
Club ensayos, Ciencias, Estadstica, Junio 2015.
https://www.clubensayos.com/Ciencia/Estadistica/2563842.html
b. Determine la mejor ecuacin que se ajuste a los datos.

Paso 1. Realizo una tabla con los datos obtenidos.

X Y X*Y X2 Y2
825 3,5 2887,5 680625 12,25
215 1 215 46225 1
1070 4 4280 1144900 16 Distancia vs Tiempo
550 2 1100 302500 4 10

Tiempo
Ecuacin: y = 0,0036x + 0,1181
480 1 480 230400 1 5 Coeficiente de determinacin: R = 0,9005

920 3 2760 846400 9 0


0 500 1000 1500
1350 4,5 6075 1822500 20,25
Distancia
325 1,5 487,5 105625 2,25
670 3 2010 448900 9
1215 5 6075 1476225 25
7620 28,5 26370 7104300 99,75

Media
Y 2,85
Media
Y2 8,1225

Paso 2. Determine la ecuacin que se ajusta a los datos a travs del mtodo de mnimos cuadrados
partiendo de la ecuacin lineal Y = a + bX

Donde a que es la interseccin con el eje Y se obtiene con la frmula: =

.
Y b que es la pendiente se obtiene con la frmula: =
2 ()2

Calculamos entonces b: Calculamos a:


10.(26370)(7620).(28,5) 28,5(0,003585)(7620)
= =
10.(7104300)(7620)2 10

28,5(27,3177)
=
263700217170
=
7104300058064400 10

1,1823
= 3,585103 =
10

= 0,003585 = 0,11823

Reemplazamos en la funcin de la lnea recta Y = a + bX y tenemos ya la ecuacin para este caso.

Y = 0,003585X + 0,11823

Paso 3. Hallar el coeficiente de determinacin.

Primero se debe hallar el error estndar del estimado con la frmula:


2 . 2
= 2 = 2
2
99,750,11823(28,5)0,003585.(26370)
= 2 =
99,75
2,852
102 10
99,75
2 = 2,852
10
1,448445
= 2 = 9,975 8,1225
8
2 = 1,8525
2
2 = 1
2
= 0,18105525 (0,4255)2
2 = 1
1,8525
= 0,4255
0,1810
2 = 1
1,8525

Hallamos el coeficiente de determinacin 2 = 1 0,0977


2 = 0,9023
Primero se halla la varianza de la
variable separable con la frmula:

Ejemplo 1:

Ajustar los siguientes datos a una lnea recta:

X Y X*Y X2 Y2
1 2 2 1 4
Correlacin de X y Y
2 3 6 4 9
10
2 4 8 4 16
y = 1,5628x + 1,6224
3 4 12 9 16 R = 0,9415
5
4 4 16 16 16
4 6 24 16 36 0
25 25 25 0 1 2 3 4 5
5 5
6 7 42 36 49
27 35 135 111 171

Media de
Y 3,375
Media de
Y2 13,875

81352735
= = 0,8491
8111272
350,849127
= = 1,5094
8
= , + , Ecuacin de la recta.

Ejemplo 2. Para el siguiente conjunto de datos:


a. Dibuje un diagrama de dispersin.2

X Y X*Y X2 Y2
13 6,2 80,6 169 38,44 Relacin entrede
la X
construccin
Relacin frente a Yde

Ventas de lnea blanca


16 8,6 137,6 256 73,96 casas y las ventas de lnea blanca
15
14 7,2 100,8 196 51,84 (miles)
y = 0,7051x - 2,8718

(miles)
11 4,5 49,5 121 20,25 1015
R = 0,9888
y = 0,7051x - 2,8718

Y
17 9 153 289 81
510 R = 0,9888
9 3,5 31,5 81 12,25
5
13 6,5 84,5 169 42,25 0
00 5 10 15 20
17 9,3 158,1 289 86,49
0 5 10 15 20
18 9,5 171 324 90,25 X
Construccion de casas (miles)
12 5,7 68,4 144 32,49
140 70 1035 2038 529,22

Media de Y 14
Media de
Y2 203,8

b. Desarrolle la ecuacin de estimacin que mejor describa a los datos.


10103514070
= = 0,7051 c. Pronostique Y para X = 10, 15, 20
1020381402
700,7051140 = 0,7051() 2,8718 = ,
= = 2,8718
10 = 0,7051() 2,8718 = ,
= , , Ecuacin de = 0,7051() 2,8718 = ,
la recta.

Ejemplo 3. Las ventas de lnea blanca varan segn el estado de mercado de casas nuevas: cuando
las ventas de casas nuevas son buenas, tambin se reflejan stas en las cifras de lavaplatos,
lavadoras de ropa, secadoras y refrigeradores. Una asociacin de comercio compil los siguientes
datos histricos (en miles de unidades) de las ventas de lnea blanca y la construccin de casas. 3

Construccin de casas
2 2,5 3,2 3,6 3,3 4 4,2 4,6 4,8 5
(miles)
Ventas de lnea blanca
5 5,5 6 7 7,2 7,7 8,4 9 9,7 10
(miles)

a. Desarrolle una ecuacin para la relacin entre las ventas de lnea blanca (en miles) y la
construccin de las casas (en miles).

2
Levin/Rubio, ESTADSTICA PARA ADMINISTRACIN Y ECONOMA, Regresin Simple y Correlacin,
Aplicaciones Ejercicio 12.2, Ed. Pearson, 7 edicin.
3
Levin/Rubio, ESTADSTICA PARA ADMINISTRACIN Y ECONOMA, Regresin Simple y Correlacin,
Aplicaciones Ejercicio 12-16, Ed. Pearson, 7 edicin.
X Y X*Y X2 Y2
2 5 10 4 25
2,5 5,5 13,75 6,25 30,25
3,2 6 19,2 10,24 36
3,6 7 25,2 12,96 49
3,3 7,2 23,76 10,89 51,84
4 7,7 30,8 16 59,29
4,2 8,4 35,28 17,64 70,56
4,6 9 41,4 21,16 81
4,8 9,7 46,56 23,04 94,09
5 10 50 25 100
37,2 75,5 295,95 147,18 597,03

Media de Y 4,65
Media de
Y2 18,3975

10295,9537,275,5
= = 1,7156
10147,1837,22
75,51,715637,2
= = 1,1681
10
= , + , Ecuacin de la recta.

b. Interprete la pendiente de la recta de regresin.

La pendiente de la recta es el valor en el que se incremente Y cuando la variable X aumenta en


una unidad, y para el caso de la ecuacin actual, la pendiente aumenta en 1,7156 (valor en miles
de pesos).
ANEXO

Con Microsoft Excel se puede hallar la ecuacin de la recta y el coeficiente de determinacin


siguiendo los siguientes pasos:

1. Realizar la tabla con los datos de las columnas X, Y, X*Y, X2 y Y2


2. Seleccionar los valores de las columnas X y Y, dar clic en insertar, clic en grficos de
dispersin.
3. Cuando aparece el grfico dar clic derecho sobre uno de los puntos de este y escoger la
opcin Agregar lnea de tendencia.
4. Clic derecho sobre la lnea de tendencia del grfico y seleccionar formato de lnea de
tendencia.
5. Seleccionar los tems que dicen presentar ecuacin en el grfico y presentar el valor R
cuadrado en el grfico.
6. Dar los formatos a ttulos, tamaos y tipos de fuente, etc.
BIBLIOGRAFA

Club ensayos, Ciencias, Estadstica, Junio 2015.


https://www.clubensayos.com/Ciencia/Estadistica/2563842.html

Levin/Rubio, ESTADSTICA PARA ADMINISTRACIN Y ECONOMA, Regresin Simple y


Correlacin, Aplicaciones Ejercicio 12.2, Ed. Pearson, 7 edicin.

Levin/Rubio, ESTADSTICA PARA ADMINISTRACIN Y ECONOMA, Regresin Simple y


Correlacin, Aplicaciones Ejercicio 12-16, Ed. Pearson, 7 edicin.

Vous aimerez peut-être aussi