Vous êtes sur la page 1sur 23

Análisis de Regresión

Por:
Roberto Bula
Análisis de Regresión
En los negocios, en las ciencias naturales en la
planificación de los recursos humanos y del gasto, en
todas las ciencias, generalmente, se pueden expresar las
relaciones funcionales entre dos o más variables.
Ejemplo:
•El peso y la talla. A mayor talla mayor peso.
• La experiencia y la productividad del personal de la
empresa. A mayor años de experiencia mayor es la
productividad.
En estos ejemplos, la relación funcional es directa o
positiva.
Análisis de Regresión
• El análisis de regresión es una herramienta
estadística poderosa y versátil, que permite
cuantificar, a través de una función
matemática, la relación entre dos o más
variables.
• En la relación de variables se considera la
presencia de una variable dependiente en
función de una (regresión simple) o más
variables independientes (regresión múltiple).
Una función matemática de Y con respecto a X,
es representada por:
Y=f(x),
es decir, la ecuación matemática que representa
en el plano cartesiano la relación de dos
variables.
Función matemática
• Ejemplos de dos funciones
matemáticas

Y=f (x) Y  aY=f


 (x)
bX
Y e x

Función No Lineal Función Lineal


Objetivos de la Regresión

Los dos objetivos fundamentales de este análisis


serán,

1. Determinar si dichas variables están asociadas


y en qué sentido se da dicha asociación (es decir,
si los valores de una de las variables tienden a
aumentar –o disminuir- al aumentar los valores
de la otra); y

2. Estudiar si los valores de una variable pueden


ser utilizados para predecir el valor de la otra.
Diagrama de Dispersión
(Nube de Puntos):
El análisis de regresión o la aplicación de esta herramienta
estadística, puede iniciar con la verificación de la relación entre
dos variables, representando los datos en una gráfica, llamada
Diagrama de Dispersión.
El Diagrama de Dispersión, es la representación gráfica de los
puntos o pares ordenados (x,y) en el plano cartesiano. También
es llamado Nube de Puntos.
El par (X, Y), es el punto coordenada de las dos variables de
estudio. Un punto coordenada, será por ejemplo, tu peso y talla.
Donde para una misma unidad se le toman dos mediciones (X y
Y). Supóngase que su peso y talla es 125 lbs y 1.60 de estatura
el punto coordenada, será (1.60, 125 lbs). Esto es considerando
la talla como la variable independiente (X) y al peso como la
variable dependiente (Y).
25/02/2016 Mgtra. Elisa Mendoza G.
Diagrama de Dispersión
La buena interpretación del diagrama de dispersión
es el primer paso para un buen análisis de los
datos X,Y. Observe los distintos modelos, como
ejemplo.
Relación directa e inversa
330 100

280 No hay 90 Relación


Correlación 80 directa (fuerte).
230
70
180
60
130
50
80 40
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200

Para valores de X por encima de la •Para valores de X mayores que la media


media tenemos valores de Y por le corresponden valores de Y mayores
encima y por debajo en también.
proporciones similares. No hay Paras valores de X menores que la media
correlación. le corresponden valores de Y menores
también.
Esto se llama relación directa.
80
70 Relación
inversa
60
50
Para los valores de X mayores que
40
30
la media le corresponden valores
20 de Y menores. Esto es relación
10
0 inversa o decreciente.
140 150 160 170 180 190 200
Relación entre variables

100
90
80
70
60
50
40
30
140 150 160 170 180 190 200
Modelo de Regresión
• La ecuación de una gráfica lineal o modelo
de regresión para el caso “Regresión
Lineal Simple”, es:

Donde:
Y = variable dependiente
X= variable independiente (regresora o explicativa)
a= coeficiente de intersección. Es el valor donde la recta corta
el eje de Y.
b= coeficiente de pendiente. Es la pendiente de la recta.
Cálculo de los Coeficientes

• La ecuación de regresión es estimada a


partir de los datos de una muestra.
• Para determinar la ecuación de regresión
lineal, hay que despejar los coeficientes
estimados a y b.
• La fórmula de estos coeficientes son
obtenidas por métodos matemáticos y
estadísticos denominados “Mínimos
Cuadrados”.
Cálculo de los
Coeficientes
• Las fórmulas para estimar los
coeficientes son:
Ejemplo
Considere los datos del ejemplo anterior:

Cálculos
2
X Y XY x
2 6 12 4
3 15 45 9
4 23 92 16
5 28 140 25
6 32 192 36
Suma 20 104 481 90
Media 4 20.8

Dado que la media de Y es 20.8 aˆ  Y  bˆX


y la media de X es 4 y el
coeficiente pendiente es
positivo (6.5). Se reemplazan
los valores en la ecuación.
Ecuación de regresión
ˆ
Y  5.2  6.5 X
Los coeficientes de regresión indican que:
Coeficiente “a”
•Para un X = 0, Y será igual a –5.2 (pérdida o decrecimiento de Y).
Coeficiente “b”
•Si X crece en una unidad, entonces Y aumentará 6.5 veces más.

Utilizando Gráfica de Excel, recuerde que puede incluir la


ecuación correspondiente a sus datos.
Práctica
• Con los siguientes datos, confeccione la gráfica de
dispersión y exprese la ecuación de regresión:

Y X
(ingreso de los padres Diagram a de dispersión del ingreso de los
(promedio de
en miles de dólares) padres y los prom edios de calificaciones de
calificaciones)
sus hijos

4 21
5
3 15 4

Prom edio
3.5 15 3
2
2 8 1
3 12 0
0 5 10 15 20 25
3.5 18
Ingreso
2.5 6
2.5 12

Ecuación de
Regresión Y=1.40+0.12X
Correlación
El análisis de correlación agrupa técnicas para medir
el grado de asociación o relación entre dos o más
variables.
En 1900, Karl Pearson, desarrolló el coeficiente de
correlación, el cual describe la magnitud entre dos
conjuntos de variables de intervalo o de razón. Éste
coeficiente se designa como “r” y con frecuencia se le
llama r de Pearson. El coeficiente de correlación toma
valores de –1 hasta 1.

-1 -0.5 0 +0.5 +1
Fuerte correlación negativa Correlación débil o nula Fuerte correlación positiva
Correlación
En el análisis de regresión se busca relacionar
variables que permitan predecir o explicar una
variable independiente. Por tanto, la relación que se
espera entre las variables independientes con la
variable dependiente, es que sea de moderada a fuerte
correlación.

-1 -0.5 0 +0.5 +1
Fuerte correlación negativa Correlación débil o nula Fuerte correlación positiva
Coeficiente de
correlación
Fórmula:

Si el coeficiente de correlación entre X y Y es bajo,


entonces la ecuación de regresión no es buena para
predecir o pronosticar. Por lo tanto es necesario
investigar otras variables independientes.
Entrenando el ojo:
correlaciones positivas
330 130
120
280 110
230 100
90
180 80
70
130 60
80 50
r=0,1 40
r=0,4
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200

100 100
90 90
80 80
70 70
60 60
50 50
40 r=0,8 40 r=0,99
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Entrenando el ojo:
correlaciones negativas
90 80
80 70
70 60
60 50
50
40
40
30
30
20 20
10 r=-0,5 10 r=-0,7
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200

80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 r=-0,95 10 r=-0,999
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Coeficiente de
determinación: R2
Dado que la magnitud del coeficiente de correlación es
expresada como fuerte, moderada o débil, esto no da un
significado preciso de la variabilidad de Y.
Sin embargo, el coeficiente de determinación, indica la
proporción de la variación de Y que es explicada por X.
En términos porcentuales, entre más se acerca la
proporción de explicación a 100%, mejor es la
explicación que le da X a la variación de Y. Esto
permitirá una ajuste perfecto y mejores predicciones
estadísticas.
Coeficiente de
determinación
Fórmula:

El coeficiente de determinación se expresa como R2, y


varía desde 0 (poca o ninguna explicación), hasta 1
(buena proporción de explicación de X sobre Y). Estos
valores se pueden expresar en términos porcentuales
multiplicándolos por 100.
Igualmente que en el coeficiente de correlación, se
espera que R2 sea de moderado a alto.
Práctica
• Se recolectaron los valores
mensuales por gastos de publicidad y
costo de Pasajeros
número de pasajeros para los n=15 Observación
publicidad (en miles)
meses más recientes. Utilice Gastos
1 10 15
de publicidad como la variable
2 12 17
independiente. Realice un análisis de
3 8 13
regresión lineal simple para:
4 17 23
• Determinar si existe relación entre 5 10 16
estas dos variables. 6 15 21
• Encuentre la ecuación o modelo 7 10 14
de regresión. 8 14 20
• Indique si este modelo es bueno 9 19 24
utilizarlo para pronosticar el 10 10 17
número de pasajeros en los 11 11 16
próximos meses. 12 13 18
13 16 23
• Qué interpretación hace de los 14 10 15
hallazgos encontrados. 15 12 16

Vous aimerez peut-être aussi