Vous êtes sur la page 1sur 22

UNIVERSIDAD PRIVADA ALAS PERUANAS

MAESTRÍA EN ADMINISTRACIÓN Y DIRECCIÓN DE EMPRESAS


MÉTODOS CUANTITATIVOS Y ESTADÍSTICA APLICADA
PRUEBA DE SIGNIFICANCIA DE REGRESIÓN LINEAL CON MINITAB
1) MODELO DE REGRESIÓN
Es aquella ecuación que describe cómo se relaciona “y” con “x” y con un término de error Y=β0+
β1 x+ ε, donde β0 ; β1 son parámetros del modelo, y ε es una variable aleatoria.
Un supuesto del modelo de regresión lineal simple y ε, es que la media o valor esperado de ε es
cero. Una consecuencia de este supuesto es que la media o valor esperado de y, representado por
E(y), es igual a β0+ β1 x.
2) ECUACIÓN DE REGRESIÓN
La ecuación de regresión para la regresión lineal simple es:
E ( y )   0  1 x

 0  ordenada

Donde  1  Pendiente
E ( y )  Media ó Valor esperado de " y"

E(y)
β1>0

β0

E(y) se relaciona positivamente con x


E(y)

β0

β1<0

E(y) se relaciona negativamente con x

1 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA


E(y)

β1=0
β0

x
“y” no se relaciona con “x”

3) ECUACIÓN DE REGRESIÓN ESTIMADA


Como los valores de los parámetros β0 ; β1 no se conocen en la práctica, entonces se deben
estimar por lo parámetros bo y b1 respectivamente usando los datos de la muestra.
La ecuación de regresión estimada, o simplemente ecuación de regresión se escribe de la siguiente
n

  x  x  y  y 
i i
manera y  b0  b1 x donde b1  i 1
2
; b0  y  b1 . x
n

  x  x
i 1
i

n n

n  xi . yi
 x .y i i  i 1 i 1
n
Una fórmula alternativa para b1 es: b1  i 1
2
 n 
n   xi 
 xi   i 1 
2

i 1 n

2 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA


EJEMPLO
En la pizzería Armand, se reunieron datos de una muestra de 10 restaurantes ubicado cerca de
centros educativos. Para la i-ésima observación o restaurante de la muestra, xi es el tamaño de la
población estudiantil, en miles, y yi son las ventas trimestrales en miles de dólares. Los valores xi y
yi para los 10 restaurantes de la muestra se resumen en la siguiente tabla

Restaurantes(i) Población estudiantil Ventas trimestrales


miles (xi ) (miles de dólares) (yi)
1 2 58
2 6 105
3 8 88
4 8 118
5 12 117
6 16 137
7 20 157
8 20 169
9 22 149
10 26 202
a) Hallar la ecuación de regresión estimada calculando los valores de bo y b1.
b) Para una población de 27 000 estudiantes ¿Cuál será sus ventas trimestral?
Resolución
1) HALLAMOS LA ECUACIÓN DE REGRESIÓN LINEAL
Se deben capturar los datos en una hoja de trabajo de Minitab. En este caso se digitaron los datos de
población en la columna C1 y los datos de ventas trimestrales en la columna C2.

Restaurantes(i) Población estudiantil Ventas trimestrales


miles (xi ) (miles de dólares) (yi)
1 2 58
2 6 105
3 8 88
4 8 118
5 12 117
6 16 137
7 20 157
8 20 169
9 22 149
10 26 202

Paso1. Seleccione el menú desplegable Estadísticas


Paso2. Seleccione el menú desplegable Regresión
Paso3. Escoja la opción Regresión
Paso4. Cuando aparezca el cuadro de diálogo Regresión:
Escriba VD-VENTASALES en el cuadro de Respuesta
Escriba VI-POBLACION en el cuadro de Predictores
Seleccione OK

3 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA


Análisis de regresión: Venta-trimestral vs. Pobla-estudiantes

La ecuación de regresión es
Venta-trimestral = 60.0 + 5.00 Pobla-estudiantes

Coef.
Predictor Coef de EE T P
Constante 60.000 9.226 6.50 0.000
Pobla-estudiantes 5.0000 0.5803 8.62 0.000

S = 13.8293 R-cuad. = 90.3% R-cuad.(ajustado) = 89.1%

PRESS = 2583.30 R-cuad.(pred) = 83.58%


Análisis de varianza
Fuente GL SC MC F P
Regresión 1 14200 14200 74.25 0.000
Error residual 8 1530 191
Total 9 15730
TABLA CON EL MINITAB
Ajuste Residuo
Obs Pobla-estudiantes Venta-trimestral Ajuste SE Residuo estándar
1 2.0 58.00 70.00 8.22 -12.00 -1.08
2 6.0 105.00 90.00 6.38 15.00 1.22
3 8.0 88.00 100.00 5.59 -12.00 -0.95
4 8.0 118.00 100.00 5.59 18.00 1.42
5 12.0 117.00 120.00 4.52 -3.00 -0.23
6 16.0 137.00 140.00 4.52 -3.00 -0.23
7 20.0 157.00 160.00 5.59 -3.00 -0.24
8 20.0 169.00 160.00 5.59 9.00 0.71
9 22.0 149.00 170.00 6.38 -21.00 -1.71
10 26.0 202.00 190.00 8.22 12.00 1.08

4 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA


2) CÁLCULO DE LA ECUACIÓN DE REGRESIÓN EN FORMA ALGEBRAICA

Restaurante i xi yi xi  x yi  y  x  x  y  y 
i i  x  x
i
2

1 2 58 -12 -72 864 144


2 6 105 -8 -25 200 64
3 8 88 -6 -42 252 36
4 8 118 -6 -12 72 36
5 12 117 -2 -13 26 4
6 16 137 2 7 14 4
7 20 157 6 27 162 36
8 20 169 6 39 234 36
9 22 149 8 19 152 64
10 26 202 12 72 864 144

Totales ∑= 140 ∑= 1300 ∑= 2840 ∑= 568

n

  xi
140
 media  x  i 1   14
 n 10
 n

 i 1
yi
1300
 media  y    130
 n 10
La ecuación de regresión lineal es: y  b0  b1 x
n

  x  x  y  y 
i 1
i i
donde: b1  2
; b0  y  b1 . x
n

  x  x
i 1
i

n n

n  x . y i i

 x .y i i  i 1 i 1
n
Una fórmula alternativa para b1 es: b1  i 1
2
n
 
n   xi 
 xi2   i 1 
i 1 n
n

  x  x  y  y 
i 1
i i
2840
b1  2
 5
n 568
  x  x
i 1
i

b0  y  b1. x  130  5(14)  60


Luego la ecuación de regresión lineal es: y  60  5 x

5 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA


3) COEFICIENTES DE DETERMINACIÓN

Restaurante i xi yi ^ ^
^
2
y i  60  5 x i  
yi  y i
 yi 
 y i 
 
1 2 58 70 -12 144
2 6 105 90 15 225
3 8 88 100 -12 144
4 8 118 100 18 324
5 12 117 120 -3 9
6 16 137 140 -3 9
7 20 157 160 -3 9
8 20 169 160 9 81
9 22 149 170 -21 441
10 26 202 190 12 144
Totales ∑= 140 ∑= 1300 ∑= 1530

2
^
 10 
Suma de cuadrados debida al error: SSE    y i  y i   1530
i 1  

Restaurante i xi yi 2
xi  x yi  y  y  y
i

1 2 58 -12 -72 5184


2 6 105 -8 -25 625
3 8 88 -6 -42 1764
4 8 118 -6 -12 144
5 12 117 -2 -13 169
6 16 137 2 7 49
7 20 157 6 27 729
8 20 169 6 39 1521
9 22 149 8 19 361
10 26 202 12 72 5184
Totales ∑= 140 ∑= 1300 ∑= 15730

n 2

Suma de cuadrados del Total: SST   yi  y


i 1
   15730

n 2
^ 
SSR    y i  y i   14200
i 1  

6 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA


Restaurante i xi yi ^ ^ 2
y i  60  5 xi yi  yi ^ 
 yi  yi 
 
1 2 58 70 -60 3600
2 6 105 90 -40 1600
3 8 88 100 -30 900
4 8 118 100 -30 900
5 12 117 120 -10 100
6 16 137 140 10 100
7 20 157 160 30 900
8 20 169 160 30 900
9 22 149 170 40 1600
10 26 202 190 60 3600
Totales ∑= 140 ∑= 1300 ∑=14200

n 2
^ 
Suma de cuadrados debida a la Regresión: SSR    y i  y i   14200
i 1  

Relación entre SST, SSR y SSE: SST  SSR  SSE


donde:
SST=Suma de cuadrados del total
SSR=Suma de cuadrados debida a la regresión
SSE=Suma de cuadrados debida al error

 SSR  SST  SSE



SST  SSR  SSE    15730  1530
  14200

4) COEFICIENTE DE DETERMINACIÓN
Este coeficiente asume valores entre 0 y 1. Está definido por:
SSR
r2 
SST
SSR 14200
Para nuestro ejemplo: r 2    0.9027  90.27 %
SST 15730

5) COEFICIENTE DE CORRELACIÓN DE LA MUESTRA


 rxy  ( signo de b1 ) Coeficiente de det er min ación

 2
 rxy  ( signo de b1 ). r
Donde
 r  ( signo de b ) r 2
 xy 1

Para nuestro ejemplo tenemos:   (  ) 0.9027
  0.9501

Donde b1=pendiente de la ecuación y  b0  b1 x

7 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA


6) PRUEBA DE SIGNIFICANCIA
ERROR CUADRADO MEDIO (MSE)
Error cuadrado medio, es la estimación de  2 . Se define por:
SSE
 2  MSE 
n2
Donde n es el tamaño de la muestra y gl= n-2 (grados de libertad)
SSE 1530 1530
Para nuestro ejemplo:  2     191.25
n  2 10  2 8

ERROR ESTANDAR DE LA ESTIMACIÓN


Está definido por la raíz cuadrado de la estimación  2
SSE
s  MSE 
n2
Para nuestro ejemplo: s  MSE  191.25  13.829

7) DISTRIBUCIÓN MUESTRAL DE b1



Valor esperado : E (b1 )  1
 
 Desviación estándar : b1  2
n

 i 1

xi  x 

 Forma de la distribución : Normal

8) DESVIACIÓN ESTÁNDAR ESTIMADA DE b1


Está definida por:
s
sb1 
n 2

  x  x
i 1
i

s 13.829
Para nuestro ejemplo: sb1    0.5803
n 2 568
  x  x
i 1
i

9) PRUEBA t DE SIGNIFICANCIA EN LA REGRESIÓN LINEAL SIMPLE


Planteamiento de hipótesis
 H 1 : 1  0

 H 0 : 1  0
b1
Estadístico de prueba: t 
sb1

8 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA


Regla de rechazo:
Con el estadístico de prueba: Rechazar H 0 si t  t ó t  t 
2 2

Con el valor de p: Rechazar H 0 si el valor de p  


Donde t  se basa en una distribución t con n-2 grados de libertad.
2

10) Prueba de hipótesis para nuestro ejemplo


b 5
t 1   8.62
sb1 0.5803

Con   0.01 ; gl  n  2  10  2  8

t1   t0.995  t0.005  3.355


2

Gráfica de distribución
T, df=8
0.4

0.3
Densidad

0.2

Rechazo Rechazo
Aceptación
0.1

0.005 0.005
0.0
-3.355 0 3.355
X
t=8.62

Interpretación
Como t  t0.005 entonces rechazamos la hipótesis nula Ho y llegamos a la conclusión, de que con un
nivel de significancia de 1%, 1 no es igual a cero (0). La evidencia estadística es suficiente para
concluir que tenemos una relación importante entre la población de estudiantes y las ventas
trimestrales.

9 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA


11) PRUEBA DE SIGNIFICANCIA MEDIANTE CORRELACIÓN
Planteamiento de hipótesis
 H 1 :  xy  0

 H 0 :  xy  0
n2
Estadístico de prueba: t  rxy .
1  rxy2
Regla de rechazo:
Rechazar H 0 si t  t ó t  t 
2 2

Donde t  se basa en una distribución t con n-2 grados de libertad.


2

12) Prueba de hipótesis con correlación para nuestro ejemplo

n2 10  2
Calculamos: t  rxy . 2
 0.9501.  8.61
1  rxy 1  (0.9501) 2
Con   0.01 ; gl  n  2  10  2  8

t1   t0.995  t0.005  3.355


2

Gráfica de distribución
T, df=8
0.4

0.3
Densidad

0.2

Rechazo Rechazo
Aceptación
0.1

0.005 0.005
0.0
-3.355 0 3.355
X
t=8.61

Interpretación
Como t  t0.005 entonces rechazamos la hipótesis nula Ho y llegamos a la conclusión, de que con un
nivel de significancia de 1%, 1 no es igual a cero (0). La evidencia estadística es suficiente para
concluir que tenemos una relación importante entre la población de estudiantes y las ventas
trimestrales.

10 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA


PRUEBA F DE FISHER PARA LA ECUACIÓN DE REGRESIÓN LINEAL

Usamos una prueba F, basada en la distribución F de probabilidad, para probar si la regresión es significativa.
Como sólo hay una variable independiente, la prueba F debe indicar la misma conclusión que la prueba t;
esto es, si la prueba t indica que β1≠ 0 y que en consecuencia hay una relación significativa, la prueba F
también indicará una relación significativa. Pero cuando hay más de una variable independiente, sólo se
puede usar la prueba F para ver si hay una relación significativa general.

CUADRADO MEDIO DEBIDO A LA REGRESIÓN (MSR)


Llamado también regresión de cuadrado medio, se representa por MSR (mean square regression). En
general, se tiene
SSR
MSR 
Grados de libertad de la regresión
Se verifica que los grados de libertad de la regresión siempre son iguales a la cantidad de variables
independientes, es decir:
SSR
MSR 
Número de var iables independientes
Prueba F de la significancia en la Regresión Lineal simple
Planteamiento de hipótesis
 H 1 : 1  0

 H 0 : 1  0

Estadístico de prueba
MSR
F
MSE
Regla de rechazo

Con el estadístico de prueba: Rechazar Ho si F > Fα


Con el valor de p : Rechazar Ho si el valor de p < α

Donde Fα se basa en una distribución F con u grado de libertad en el numerador y n-2 grados de libertad en
el denominador.

TABLA GENERAL DE ANÁLISIS DE VARIANZA PARA REGRESIÓN LINEAL SIMPLE

Fuente de variación Suma de cuadrados Grados de libertad Cuadrado medio F de Fisher


Regresión SSR 1 SSR MSR
MSR  F
1 MSE
Error SSE n-2 SSE
MSE 
n2
TOTAL SST n-1

EJEMPLO

11 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA


En nuestro ejemplo de la pizzería Armand tenemos los siguientes datos:
La ecuación de regresión lineal es: y  60  5 x
SSR=14200
SSE=1530
SST=15730

H :   0
Planteamiento de hipótesis  1 1
 H 0 : 1  0

Se tiene:
SSR 14200
MSR    14 200
1 1
SSE 1530 1530
MSE     191.25
n  2 10  2 8

El estdístico de prueba F de Fisher


MSR 14200
F   74.25
MSE 191.25

Gráfica de distribución
F, df1=1, df2=8

0.4

0.3
Densidad

Rechazo
0.2
Aceptación

0.1

0.01
0.0
0 11.26
X
F=74.25

Interpretación
Como F  74.25  F  11.26 entonces rechazamos la hipótesis nula Ho y aceptamos la hipótesis
alterna H1 llegando a la conclusión, de que con un nivel de significancia de 1%, 1 no es igual a cero
(0). La evidencia estadística es suficiente para concluir que tenemos una relación importante entre la
población de estudiantes y las ventas trimestrales.

12 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA


TABLA DE ANALISIS DE VARIANZA

Fuente de variación Suma de cuadrados Grados de libertad Cuadrado medio F de Fisher


Regresión SSR=14200 1 SSR MSR
MSR   14200 F  74.25
1 MSE
Error SSE=1530 n-2=10-2=8 SSE
MSE   191.25
n2
TOTAL SST=15730 n-1=10-1=9

EJERCICIOS DE APLICACIÓN
1. Los siguientes datos corresponden a la altura (pulgadas) y peso (libras) de nadadoras:
Altura 68 64 62 65 66
Peso 132 108 102 115 128
a) Trace un diagrama de dispersión para esos datos, con la altura como variable independiente
b) ¿Qué indica el diagrama de dispersión que trazó en el inciso a) acerca de la relación entre las dos
variables?
c) Plantee la ecuación de regresión estimada calculando los valores de b0 y b1.
d) Si la altura de una nadadora es 63 pulgadas, ¿Cuál sería el peso que usted le estimaría?

2. Un gerente de ventas reunión los datos siguientes relacionados con las ventas anuales y en años de
experiencia.
Vendedores Años de experiencia Ventas anuales(miles dólares)
1 1 80
2 3 97
3 4 92
4 4 102
5 6 103
6 8 111
7 10 119
8 10 123
9 11 117
10 13 136

a) Forme una ecuación de regresión estimada con la que se puedan predecir las ventas anuales,
dados los años de experiencia.
b) Use la ecuación de regresión estimada para predecir las ventas anuales de un vendedor con 9 años
de experiencia.
c) Con un nivel de significancia del 5%, determine si se relacionan los años de experiencia con las
ventas anuales.

13 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA


3. Los datos siguientes son los sueldos mensuales, y, “y” promedios de calificaciones, x, para
estudiantes que obtuvieron su licenciatura en administración, con especialización en sistema de
información.
Calificación Sueldo mensual (dólares)
2.6 3300
3.4 3600
3.6 4000
3.2 3500
3.5 3900
2.9 3600
a) Halle la ecuación de regresión lineal
b) Determinar SST, SSR Y SSE
c) Calcule el coeficiente de determinación r2. Haga comentarios sobre la bondad del ajuste.
d) ¿Cuál es el valor del coeficiente de correlación para la muestra?
e) ¿indica la prueba t una relación tangible (con significancia) entre el promedio de calificaciones y
el salario mensual? ¿Cuál es su conclusión? Use α=0.05
f) Determine si hay una relación con significancia con la prueba F. ¿Cuál es su conclusión? Use
α=0.05
g) Forme la tabla de análisis de Varianza (ANOVA)

4. Un hospital de una gran ciudad contrató a un sociólogo para investigar la relación entre el número de
días que faltan sin permiso los empleados, por año, y la distancia, (en millas), de su hogar a su
trabajo. Se eligió una muestra de 10 empleados y se reunieron los siguientes datos
Distancia al trabajo Número de días ausente
1 8
3 5
4 8
6 7
8 6
10 3
12 5
14 2
14 4
18 2
a) Trace un diagrama de dispersión para estos datos. ¿Parece razonable una relación lineal? Explique
porque.
b) Desarrolle la ecuación de regresión estimada con cuadrados mínimos.
c) ¿Existe una relación significativa entre las dos variables? Use α=0.05

5. Un profesor de mercadotecnia se interesa en la relación entre las horas de estudio y los puntos totales
obtenidos en su curso. A continuación vemos los datos reunidos con 10 alumnos que acaban de tomar
el curso.

Horas de estudio Total de puntos obtenidos


45 40
30 35
90 75
60 65

14 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA


105 90
65 50
90 90
80 80
55 45
75 65

a) Desarrolle una ecuación de regresión que muestre cómo se relaciona el total de puntos obtenidos
con las horas de estudio.
b) Pruebe la significancia del modelo con α=0.05
c) Prediga los puntos totales que obtendrá Marcos Gonzales si pasó 95 horas estudiando.

6. GASTOS Y APROVECHAMIENTO DE LOS ALUMNOS


¿Se relaciona el aprovechamiento de los alumnos con lo que invierte en educación es estado donde
viven? En muchas comunidades los causantes de hacen esta importante pregunta, cuando los distritos
escolares les piden aumentar la cantidad de impuestos invertida en educación.
Con Frecuencia se emplea en estados unidos, el programa NAEP (National Assessment of
Educational Progress: Evaluación nacional del progreso educativo) para medir el aprovechamiento
educativo de los alumnos. La tabla1 muestra el gasto por alumno por año, y la calificación NAEP
compuesta por 35 estados que participaron en ese programa. La calificación compuesta por es la suma
de las calificaciones obtenidas en matemáticas, ciencias y lectura en la prueba NAEP de 1996. L
calificación máxima posible es 1300. En la tabla2 se muestran los gastos por alumno para los 14
estados que no participaron en las encuestas de NAEP.

Tabla1: Gasto por alumno y calificaciones compuestas en los


estados que participaron en el programa NAEP

Estado Gastos por alumnos(dólares) Calificación compuesta


Louisiana 4049 581
Mississipi 3423 582
California 4917 580
Hawai 5532 580
South Carolina 4304 603
Alabama 3777 604
Geogia 4663 611
Florida 4934 611
New Mexico 4097 614
Arkansas 4060 615
Delaware 6208 615
Tennessee 3800 618
Arizona 4041 618
West Virginia 5247 625
Maryland 6100 625
Kentucky 5020 626
Texas 4520 627
New York 8162 628
North Carolina 4521 629
Rhode Island 6554 638
Washington 5338 639
15 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA
Missouri 4483 641
Colorado 4772 644
Indiana 5128 649
Utah 3280 650
Wyoming 5515 657
Connecticut 7629 657
Massachusetts 6413 658
Nebraska 5410 660
Minnesota 5477 661
Iowa 5060 665
Montana 4985 667
Wisconsin 6055 667
North Dakota 4374 671
Maine 5561 675

Tabla2: Gastos por alumno y por estado que no participaron en el programa NAEP

Estado Gasto por alumno (dólares)


Idaho 3602
South Dakota 4067
Oklahoma 4265
Nevada 4658
Kansas 5164
Illinois 5297
New Hampshire 5387
Ohio 5438
Oregon 5588
Vermont 6269
Michigan 6391
Pennsylvania 6579
Alaska 7890

a) Prepare resúmenes gráficos y numéricos para los datos


b) Aplique el análisis de regresión para investigar la relación entre la cantidad gastada por alumno y la
calificación compuesta en la prueba NAEP. Describa lo que encontró.
c) ¿Cree usted que la ecuación de regresión estimada, planteada para esos datos, se puede usar para
estimar las calificaciones compuestas en los estados que no participaron en el programa NAEP?
d) Determine estimados de calificaciones compuestas para los estados que no participaron en el
programa NAEP.
e) Con base en su análisis, ¿Cree usted que el nivel de aprovechamiento educativo de los alumnos se
relaciona con lo que el estado invierte en educación?

16 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA


REGRESIÓN CUADRÁTICA
El ajuste se realiza mediante una función polinómica de segundo grado (una parábola). Esta puede escribirse
como f ( x)  a  bx  cx 2 . Por tanto hay que buscar el mínimo de la función:
n 2
f ( a, b, c)    yi  a  bxi  cxi 2  y resulta que el mínimo (a,b,c) se obtiene resolviendo el sistema:
i 1
n n n
 2
 na  b.i 1
x i  c. 
i 1
x i  i 1
yi

 n n
2
n
3
n

  i
a. x  b. x i  c.  x i   xi yi
 i 1 i 1 i 1 i 1
 n 2 n
3
n
4
n
2
a  xi  b. xi  c. xi   xi yi
 i 1 i 1 i 1 i 1

Ejemplo
Restaurantes(i) Población estudiantil Ventas trimestrales
miles (xi ) (miles de dólares) (yi)
1 2 58
2 6 105
3 8 88
4 8 118
5 12 117
6 16 137
7 20 157
8 20 169
9 22 149
10 26 202

REGRESIÓN CUADRÁTICA CON MINITAB


Paso1. Seleccione el menú desplegable Estadísticas
Paso2. Seleccione el menú desplegable Regresión
Paso3. Escoja la opción Gráfica de línea ajustada
Paso4. Cuando aparezca el cuadro de diálogo Gráfica de línea ajustada:
Escriba VD-VENTASALES en el cuadro de Respuesta
Escriba VI-POBLACION en el cuadro de Predictores
Seleccione OK

Análisis de regresión polinomial: Venta-trimestral-yi vs. Pobla-estudiantes-xi


La ecuación de regresión es
Venta-trimestral-yi = 60.15 + 4.970 Pobla-estudiantes-xi + 0.00106 Pobla-estudiantes-xi**2

S = 14.7840 R-cuad. = 90.3% R-cuad.(ajustado) = 87.5%

Análisis de varianza
Fuente GL SC MC F P
Regresión 2 14200.0 7100.01 32.48 0.000
Error 7 1530.0 218.57
Total 9 15730.0

Análisis de varianza secuencial

Fuente GL SC F P
Lineal 1 14200.0 74.25 0.000
Cuadrática 1 0.0 0.00 0.992

17 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA


Matemáticamente la ecuación de regresión cuadrática es:
f ( x)  60.15  4.970 x  0.00106 x 2

18 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA


PARA NUESTRO ESTUDIO DEBEMOS TOMAR VALORES EN EL PRIMER CUADRANTE:

EJERCICIOS DE APLICACIÓN
1) Se tiene los siguientes datos para dos variables, x e y.
x 22 24 26 30 35 40
y 12 21 33 35 40 36
a) Obtenga una ecuación de regresión estimada para los datos, que tenga la forma
^
y  b0  b1 x  b2 x 2 .
b) En cuento al inciso a), ¿Tiene significancia la relación entre x, x2 y y ? Use α=0.05
c) Prediga el valor de y cuando x=25
d) Prediga el valor de x cuando y=28

19 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA


REGRESIÓN CÚBICA

El ajuste se realiza mediante una función polinómica de tercer grado. Esta puede escribirse como
f ( x)  a  bx  cx 2  dx3 . Por tanto hay que buscar el mínimo de la función:
n 2
f ( a, b, c, d )    yi  a  bxi  cxi 2  dxi 3  y resulta que el mínimo (a,b,c,d) se obtiene resolviendo el
i 1
sistema:
n n n n
 2 3
 na  b .i 1
x i  c. 
i 1
x i  d .i 1
xi  
i 1
yi

 n n
2
n
3
n
4
n

  i
a. x  b. x i  c.  xi  d . xi   xi yi
 i 1 i 1 i 1 i 1 i 1
 n n n n n
a x 2  b. x3  c. x 4  d . x 5  x 2 y

 i 1 i  i 1
i i 1
i i 1
i i 1
i i

 n n n n n
a x 3  b. x 4  c. x 5  d . x 6  x 3 y
 i 1
i  i 1
i i 1
i i 1
i i 1
i i

Ejemplo
Restaurantes(i) Población estudiantil Ventas trimestrales
miles (xi ) (miles de dólares) (yi)
1 2 58
2 6 105
3 8 88
4 8 118
5 12 117
6 16 137
7 20 157
8 20 169
9 22 149
10 26 202

REGRESIÓN CÚBICA CON MINITAB


Paso1. Seleccione el menú desplegable Estadísticas
Paso2. Seleccione el menú desplegable Regresión
Paso3. Escoja la opción Gráfica de línea ajustada
Paso4. Cuando aparezca el cuadro de diálogo Gráfica de línea ajustada:
Escriba VD-VENTASALES en el cuadro de Respuesta
Escriba VI-POBLACION en el cuadro de Predictores
Seleccione OK

Análisis de regresión polinomial: Venta-trimestral-yi vs. Pobla-estudiantes-xi


La ecuación de regresión es
Venta-trimestral-yi = 36.93 + 13.17 Pobla-estudiantes-xi
- 0.6999 Pobla-estudiantes-xi**2
+ 0.01669 Pobla-estudiantes-xi**3

S = 13.8170 R-cuad. = 92.7% R-cuad.(ajustado) = 89.1%

20 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA


Análisis de varianza

Fuente GL SC MC F P
Regresión 3 14584.5 4861.52 25.47 0.001
Error 6 1145.5 190.91
Total 9 15730.0

Análisis de varianza secuencial

Fuente GL SC F P
Lineal 1 14200.0 74.25 0.000
Cuadrática 1 0.0 0.00 0.992
Cúbico 1 384.5 2.01 0.206

Matemáticamente la ecuación de regresión cuadrática es:


f ( x)  36.93  13.17 x  0.6999 x 2  0.01669 x3

Ploteo de f ( x)  36.93  13.17 x  0.6999 x 2  0.01669 x3 con el software MATLAB

21 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA


EJERCICIOS DE APLICACIÓN
2) Se tiene los siguientes datos para dos variables, x e y.
x 9 32 18 15 26
y 10 20 21 16 22
a) Obtenga una ecuación de regresión estimada para los datos, que tenga la forma
^
y  b0  b1 x  b2 x 2  b3 x 3 .
b) En cuento al inciso a), ¿Tiene significancia la relación entre x, x2 , x3 y y ? Use α=0.05
c) Prediga el valor de y cuando x=20
d) Prediga el valor de x cuando y=24

22 DR. SORIA QUIJAITE JUAN JESÚS ESTADÍSTICA APLICADA

Vous aimerez peut-être aussi