Académique Documents
Professionnel Documents
Culture Documents
Las técnicas de regresión y correlación cuantifican la asociación estadística entre dos o más
variables. La regresión lineal simple expresa la relación entre una variable dependiente Y y
una variable independiente X, en términos de la pendiente y la intersección de la línea que
mejor se ajuste a las variables.
La correlación simple expresa el grado o la cercanía de la relación entre las dos variables en
términos de un coeficiente de correlación que proporciona una medida indirecta de la
variabilidad de los puntos alrededor de la mejor línea de ajuste- Ni la regresión ni la
correlación dan pruebas de relaciones causa – efecto.
Y = a + bx,
donde
y = variable dependiente
x = variable independiente.
Los valores de la pendiente b y la intersección a se obtienen usando las ecuaciones normales
escritas en la forma conveniente.
xy n XY
b
x
2
2
nX
a Y bx
Una línea de regresión describe la relación entre un valor dado de la variable independiente X
y la media µy.x de la distribución de probabilidad correspondiente de la variable dependiente
Y. El punto estimado, o pronóstico, es la media de la distribución para un valor dado X.
S y. X
Y 2
a Y b XY
n2
Estimación de intervalo
2
2
1 (X X )
S IND S y . x 1
n ( X X )2
Para muestras grandes (n≥100), la ecuación anterior puede ser aproximada. Usando la
distribución normal (Z) más que la , en la forma de YC ± ZSY.X También la significancia de la
pendiente de la línea de regresión (b) puede ser probada usando la siguiente expresión.
b
t calc
Sb
1
S b SY . X
X )2
( X
donde
Correlación
El coeficiente de correlación lineal simple r es un número entre -1 y 1 que indica qué tan bien
describe la ecuación lineal la relación entre las dos variables. Como se muestra en la siguiente
figura, r se designa como positiva si Y se incrementa cuando lo hace X, y negativa si Y
decrece al incrementarse X. Una r de cero indica una ausencia de relación entre las dos
variables.
La desviación de todos los puntos (Y) de la línea de regresión (Yc) consiste en la desviación
contabilizada por la línea de regresión (explicada) y la variación aleatoria (no explicada).
3
Variación total = explicada + no explicada
(Y Y ) 2
(Yc Y ) 2 (Y Yc ) 2
(Y Y )
2
C
r 2
(Y Y ) 2
r
(Y Y )
c
2
(Y Y ) 2
n XY X Y
r
n X 2
X
2
n Y 2
( Y ) 2
La significancia de cualesquier valor de r puede probarse estadísticamente con una hipótesis
para mostrar que no existe correlación. Para probarlo, el valor de r es comparado con un valor
de tablas para un tamaño de muestra y un nivel de significancia dados.
Ejemplo
4
Permisos de Embarques de
construcción (X) conglomerado (Y)
15 6
9 4
40 16
20 6
25 13
25 9
15 10
35 16
En el siguiente diagrama de dispersión se puede ver que los datos no son perfectamente
lineales; sin embargo, se puede hacer un enfoque lineal sobre este periodo corto.
n X Y XY X2 Y2
1 15 6 90 225 36
2 9 4 36 81 16
3 40 16 640 1600 256
4 20 6 120 400 36
5 25 13 325 625 169
6 25 9 225 625 81
7 15 10 150 225 100
8 35 16 560 1225 256
Totales 184 80 2146 5006 950
5
X 23
Y 10
xy n XY
b
x
2
2
nX
2146 8( 23)(10)
b
5006 8( 23)(23)
b = 0.395
a Y bx
a = 10 – 0.395(23)
a = 0.915
Y = a + bx
Y = 0.915 + 0.395X
X = 30
Y = 0.915 + 0.395(30)
Y = 12.76 ≈ 13
Dados los datos de los permisos y embarques calcúlese la desviación estándar de la regresión
6
Por lo tanto, la desviación estándar de la regresión es
S y. X
Y 2
a Y b XY
n2
S Y . X 2.2 embarques
Donde el valor de t (de la tabla estadística) para n-2 = 8-2 = 6 grados de libertad, y dónde
según tablas:
t = 2.447
7
X–X (X – X)2
-8.00 64
-14.00 196
17.00 289
-3.00 9
2.00 4
2.00 4
-8.00 64
12.00 144
0.00 774
X= 30 permisos
2
1 (X X )
S IND S y . x 1
n ( X X )2
1 (30 23) 2
S IND 2.2 1 2.40
8 774
SIND
Coeficiente de correlación
n XY X Y
r
n X 2
X
2
n Y 2
( Y ) 2
8(2146) (184)(80)
r
8(5006) (184) 8(950) (80)
2 2
2448
r 0.90
7430400
BIBLIOGRAFÍA
8
Monks Joseph G. Administración de operaciones, serie Schawm., 1ª edición, México D.F.,
Mc. Graw Hill., p.p. 170–174.