Vous êtes sur la page 1sur 28

INFERENCIA ESTADISTICA

Ing. JHONNY DEL AGUILA TORRES


CORRELACIÓN Y
REGRESIÓN LINEAL
SIMPLE
UNIDAD IV
CORRELACION Y REGRESIÓN LINEAL SIMPLE

• Correlación Lineal simple


• Regresión Lineal simple
CORRELACION LINEAL SIMPLE

Análisis de correlación simple


Conjunto de técnicas estadísticas empleado para
medir la intensidad de la relación entre dos variables

Variable dependiente
La variable que se va a predecir o estimar.

Variable independiente
Una variable que proporciona las bases para el
cálculo.
Diagrama de dispersión
Diagrama que refleja la relación entre dos variables
Si X y Y denotan las dos variables, entonces un diagrama
de dispersión muestra la localización de los puntos (x, y)
en un sistema de coordenadas rectangulares.
80
70
60
50
Unidades

40
30
20
10
0
0 10 20 30 40 50
Llamadas
Coeficiente de correlación
Medida de la intensidad de la relación entre dos
variables
Coeficiente de Determinación: R2
Nos indica la porción de la variación total de la
variable dependiente Y que se explica o se debe a la
variación en la variable independiente X.

Variación total - Variación no explicada


r 
2

Variación total

Coeficiente de No Determinación: 1- R2
es la proporción de la variación total
en la variable dependiente (Y), que no se debe
a la variación en la variable independiente (X)
RECTA DE LOS MINIMOS CUADRADOS:
y = a + bx,
donde a y b se calculan por las siguientes formulas:
y = a + b x,
• Donde b es la pendiente de la línea de regresión y nos indica el
aumento (si es positiva) o disminución (si es negativa) en la variable
dependiente Y por cada unidad en la variable independiente X.
ERROR ESTÁNDAR DE
ESTIMACIÓN:
• Mide la dispersión con respecto a una recta promedio,
denominada Recta de Regresión de Mínimos
Cuadrados, mide la dispersión de los valores
observados, con respecto a la recta de Regresión.

 a
Y 2
  Y   b  XY 
S yx 
n2
EJEMPLO:

El director de personal de una empresa que tiene un


importante grupo de vendedores, debe entrevistar y
seleccionar nuevo personal. Ha diseñado una prueba que
ayuda a seleccionar los mejores aspirantes para su personal
de ventas.

A fin de verificar la valides de una prueba como


instrumento de predicción de las ventas semanales, eligió
al azar cinco vendedores experimentados y aplicó la
prueba a cada uno. (Desde luego, en la práctica real, para
determinar la valides de la prueba se debía haber
seleccionado un grupo mucho mayor.)

La puntuación que cada vendedor obtuvo en la prueba


después se emparejó con las ventas semanales:
Los datos fueron los siguientes
Vendedor Puntuación Ventas
en la semanales en
prueba miles de $
(X) (Y)
Sr. J. A. Amber 4 5
Sr. B. N. Archer 7 12
Sra. G. D. Smith 3 4
Sr. A. B. Malcolm 6 8
Sra. A. Goodwin 10 11
Construya un diagrama de dispersión
Diagrama de dispersión

13
12 7; 12
11 10; 11
Ventas semanales en miles

10
9
de dolares (Y)

8 6; 8
7
6
5 4; 5
4 3; 4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10 11
Puntuación en la prueba (X)
Calcule el coeficiente de correlación.
Comente.
X Y x2 y2 xy
4 5 16 25 20
7 12 49 144 84
3 4 9 16 12
6 8 36 64 48
10 11 100 121 110
x = 30 y= 40 x2 = 210 y2 =370 xy =274
Sustituyendo en la formula los valores encontrados y
realizando los cálculos obtenemos:

El coeficiente de correlación de 0.88 indica una


relación muy intensa entre las puntuaciones
de prueba y las ventas semanales.
Calcule e interprete los coeficientes
de determinación y no determinación.

• Coeficiente de Determinación:
R2 = (0.88)2 = 0.77
77% de la variación en las ventas fue debido a la variación en los
puntajes de la prueba.
• Coeficiente de No Determinación:
1- R2 = 1-0.77 = 0.23
23% de la variación en las
ventas semanales no fue
debido a la variación en los
puntajes de la prueba.
Determine la ecuación de la recta de regresión de
mínimos cuadrados y trace en el diagrama de
dispersión.
Sustituyendo los valores de
a y b el la ecuación de la recta
obtenemos
• y = 1.2 +1.133x
• Donde X: Puntuación en la prueba
Y: Ventas semanales en miles de $
• Por cada puntuación en la prueba las ventas semanales del
vendedor aumentan en $1133.
Para graficar la recta de regresión de mínimos cuadrados en el
diagrama de dispersión demos dos valores cuales quiera a x y
calculamos la y, sustituyendo en la ecuación y = 1.2 +1.133x
X 4 6
Y 5.7 8
Diagrama de dispersión
13
12 7; 12
11 10; 11
Ventas semanales en miles

10
9
de dolares (Y)

8 6; 8
7
6
5 4; 5
4 3; 4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10 11
Puntuación en la prueba (X)
Calculamos el Error Estándar de Estimación

 a
Y 2
  Y   b  XY 
S yx 
n2

370  1.2(40)  1.133(274)


S yx   1.963
5 2 (miles de dólares)
Si un vendedor obtuvo una nota de 4 en
la prueba, se espera que vende $5700, y
si obtiene una nota de 6 puntos sus ventas
esperadas serán aproximadamente de $8000
con un error estándar de $1963
Problema propuesto
• Una empresa comercial tiene establecimientos en varias grandes áreas
metropolitanas. La gerente general de ventas planea lanzar al aire un anuncio
comercial por televisión en las estaciones locales al menos dos veces antes
de una venta gigante que empezará el sábado y terminará el domingo. Planea
tener las cifras de las ventas de video-caseteras del sábado y el domingo en
sus diferentes locales y parearlas con el número de veces que apareció el
comercial en la televisión. El objetivo fundamental de la investigación es
determinar si existe relación entre el número de veces que se transmitió el
anuncio y las ventas de sus productos. Los pares de datos son:
Localización de Número de Ventas de sábado
televisora transmisiones y domingo
de anuncios (en miles de
dólares)
Buffalo 4 15
Albano 2 8
Erie 5 21
Syracuse 6 24
Rochester 3 17
PRONOSTICOS
Regresión Simple
Ajuste y proyección de una serie histórica
Año DEMANDA (Y) Consumo
(# cabezas)
2005 10

2006 20

2007 30
Valores proyectados
2008 45 ( se asume la tendencia)

2009 70 Registros históricos +


de consumo = + +
2010 90 + +
2011 125 + Función de ajuste = Interpreta la tendencia
+
+
2012 150
Años
2013 180

2014 220

2015 270
Demanda
Año X DEMANDA (Y) XY X2 Y2

2005 -5 10 -50 25 100


2006 -4 20 -80 16 400
2007 -3 30 -90 9 900
2008 -2 45 -90 4 2025
2009 -1 70 -70 1 4900
2010 0 90 0 0 8100
2011 1 125 125 1 15625
2012 2 150 300 4 22500
2013 3 180 540 9 32400
2014 4 220 880 16 48400
2015 5 270 1350 25 72900

TOTALES 0 1210 2815 110 208250


Pronostico de la Demanda

b = 110+ x.(25.59)

Año X CALCULO DEMANDA (Y)


2016 6 263.54 264
2017 7 289.13 290
2018 8 314.72 315
2019 9 340.31 341
2020 10 365.90 366
2021 11 391.49 392
Cuidado con la sobreestimación!
……………Y con la subestimación
SUBESTIMACION
DE LA DEMANDA

Demanda proyectada

# de Unidades

SOBREESTIMACION
DE LA DEMANDA

Demanda real a posteriori

ESTA SOBRESTIMACION
PUEDE LLEVAR A
SOBREDIMENSIONAR
EL PROYECTO

Tiempo
GRACIAS

Vous aimerez peut-être aussi