Vous êtes sur la page 1sur 19

1.- INVESTIGAR EL TEMA.

“PRUEBAS DE HIPÓTESIS PARA LOS COEFICIENTES


DE REGRESIÓN.”
CONCEPTO: Planteamiento de una hipótesis estadística Una hipótesis estadística es una
afirmación sobre los valores de los parámetros de una población o proceso, que es
susceptible de probarse a partir de la información contenida en una muestra representativa
que es obtenida de la población.
H0 : p = 0.08 ← Hipótesis Nula HA : p < 0.08 ← Hipótesis Alternativa
El nombre de hipótesis nula, se deriva del hecho que comúnmente se plantea como una
igualdad.
La estrategia a seguir para probar una hipótesis es suponer que la H0 es verdadera, y que
en caso de ser rechazada por la evidencia que aportan los datos, se aceptará la HA.
ESTADÍSTICO DE PRUEBA.
La hipótesis nula es verdadera mientras no se demuestre lo contrario.
El estadístico de prueba es un número calculado a partir de los datos y la hipótesis nula,
cuya magnitud permite discernir si se rechaza o no la H0.
CRITERIO DE RECHAZO.
Es el conjunto de posibles valores del estadístico de prueba que llevan a rechazar la H0.
PRUEBAS DE UNA Y DOS COLAS
La ubicación de la región de rechazo depende de si la hipótesis es bilateral o unilateral.
H0 : p = 0.08 ← Unilateral HA : p < 0.08H0 : p = 0.08HA : p ≠ 0.08 ← Bilateral
EJEMPLO:
ESTIMADOR (Y*)

ESTIMADOR DEL ERROR.

MEDIDA DEL GRADO EN EL CUAL DOS VARIABLES ESTÁN RELACIONADAS


COVARIANZAS LINEALMENTE.
Sxy = 1,478 Sxx = 910 X media = 17 Syy = 2580.857143 y media = 158.2857
Valores esperados de los estimadores: β0 = 130.674725 β1 = 1.62417582
CUADRADO MEDIO DEL ERROR SCE
Es la suma de cuadrados del error y mide la variabilidad no explicada por la recta de
regresión.
SCE= 180.325536n = 14
FORMULACIÓN DE LAS HIPÓTESIS
Es necesario evaluar que tan bien el modelo explica la relación entre X y Y.La hipótesis de
mayor interés plantea que la pendiente (β1) es significativamente diferente de cero. H0 : β1
= 0 HA : β 1 ≠ 0 Con respecto al parámetro β0 (Intersección al eje y) : H0 : β0 = 0 HA : β 0
≠0
ANÁLISIS DE REGRESIÓN
Sxy= 1,478 X media = 17Sxx = 910 y media = 158.2857Syy = 2580.8571 β0 =
130.674725CME = 15.02712799 Β1 = 1.62417582n = 14
ESTADÍSTICO DE PRUEBA
Estadístico de prueba para β1 : para β0 : La H0 se rechazan si: α= 5% = 0.05
15. 54.0471 > t (0.025, 12) 54.0471 > 2.17912.6391 > t (0.025, 12) 12.6391 > 2.179 Se
rechazan las H0 para ambos parámetros.
ANÁLISIS DE VARIANZA SCR
Es la suma de cuadrados de la regresión y mide la variabilidad explicada por la recta de
regresión.
Β1 = 1.62417582Sxy= 1,478
FORMULACIÓN DE LA HIPÓTESIS
H0 : β1 = 0 HA : β 1 ≠ 0 Estadístico de prueba:
La H0 se rechaza si: F0 > F (α, 1, n-2) α= 5% = 0.05 n= 12
18. 159.71 > F(0.05, 1, 12) 159.71 > 4.75 El modelo de regresión es significativo
Conclusiones se han rechazado las hipótesis nulas en ambos análisis (de regresión y de
varianza) concluyendo que la ecuación de regresión: Resistencia = 130.67 + 1.62 % Fibra
Es significativo por lo tanto podemos afirmar que nuestro modelo es importante para
predecir la resistencia en nuestro ejemplo.
2.- INVESTIGAR LAS REQUISITOS, LIMITACIONES Y APLICACIONES DE LA
REGRESION LINEAL MULTIPLE.
Utilizamos la regresión múltiple cuando estudiamos la posible relación entre varias variables
independientes (predictoras o explicativas) y otra variable dependiente (criterio, explicada,
respuesta).
Por ejemplo, podemos estudiar la inteligencia humana tomando el IQ como variable
respuesta, y es posible que consideremos que puede estar relacionado con otras variables
como: el tamaño del cerebro, el tamaño de la persona y su sexo. Podríamos añadirlas al
estudio como variables independientes.
Un modelo de regresión múltiple podría ofrecer una respuesta del tipo:
IQ = 80 + 0.02 Volumen cerebro + 0.15 Tamaño – 0.8 Sexo,
donde la variable sexo es una variable dicotómica o indicadora, codificada como 0 para las
mujeres y 1 para los hombres. Para interpretar un modelo así hay que ser muy cautelosos.
Los modelos de regresión múltiple nos informan de la presencia de relaciones, pero no de
su mecanismo causal.
Otra fuente de problemas de interpretación es la relación entre variables independientes o
colinealidad. Por ejemplo, el sexo puede parecer influir en la inteligencia según la ecuación,
pero hay que considerar que las mujeres son habitualmente más pequeñas que los
hombres. Si observamos los signos, apreciamos que compensa el efecto de una con la
otra.

APLICACIONES DE LA REGRESIÓN MÚLTIPLE


La regresión múltiple se utiliza para la predicción de respuestas a partir de variables
explicativas. Pero no es ésta realmente su aplicación más común en investigación. Sus
usos más comunes son los siguientes:
Identificación de variables explicativas. Nos ayuda a crear un modelo donde se seleccionen
las variables que puedan influir en la respuesta, descartando las que no aporten
información.
Detección de interacciones entre variables independientes que afectan a la variable
respuesta.
Identificación de variables. Aunque es un problema difícil, es de interés en investigación no
experimental.

REQUISITOS Y LIMITACIONES DE LA REGRESIÓN MÚLTIPLE


Existen ciertos requerimientos necesarios para poder utilizar la técnica de regresión
múltiple:

 Linealidad: Se supone que la variable respuesta depende linealmente de las


variables explicativas. Si la respuesta no aparenta ser lineal, debemos introducir en
el modelo componentes no lineales.
 Normalidad y equidistribución de los residuos: Para tener un buen modelo de
regresión múltiple no es suficiente con que los residuos sean pequeños. La validez
del modelo requiere que se distribuyan de modo normal y con la misma dispersión
para cada combinación de valores de las variables independientes.
 Número de variables independientes: Una regla que se suele recomendar es la de
incluir al menos 20 observaciones por cada variable independiente que estimemos
a priori interesantes en el modelo. Números inferiores nos llevarán posiblemente a
no poder obtener conclusiones y errores de tipo II.
 Colinealidad: Si dos variables independientes están estrechamente relacionadas y
ambas son incluidas en un modelo, muy posiblemente ninguna de las dos sea
considerada significativa, aunque si hubiésemos incluido sólo una de ellas, sí. Una
técnica muy simple para detectar la colinealidad consiste en examinar los
coeficientes del modelo para ver si se vuelven inestables al introducir la nueva
variable.
 Observaciones anómalas: Debemos poner especial cuidado en identificarlas y
descartarlas si procede, pues tienen gran influencia en el resultado. A veces, son
sólo errores en la entrada de datos, pero de gran consecuencia en el análisis.
3.- SE PRETENDEN ESTIMAR LOS GASTOS EN ALIMENTACIÓN DE UNA FAMILIA EN
BASE A LA INFORMACIÓN QUE PROPORCIONAN LAS VARIABLES REGRESORAS
'INGRESOS MENSUALES ‘NÚMERO DE MIEMBROS DE LA FAMILIA’. PARA ELLO SE
RECOGE UNA MUESTRA ALEATORIA SIMPLE DE 15 FAMILIAS.

SOLUCIÓN:

Y X Z
Gasto Ingresos Tamaño XY X^2 XZ YZ Z^2
Alimentación
1.- 0.43 2.1 3 0.903 4.41 6.3 1.29 9
2.- 0.31 1.1 4 0.341 1.21 4.4 1.24 16
3.- 0.32 0.9 5 0.288 0.81 4.5 1.6 25
4.- 0.46 1.6 4 0.736 2.56 6.4 1.84 16
5.- 1.25 6.2 4 7.75 38.44 24.8 5 16
6.- 0.44 2.3 3 1.012 5.29 6.9 1.32 9
7.- 0.52 1.8 6 0.936 3.24 10.8 3.12 36
8.- 0.29 1 5 0.29 1 5 1.45 25
9.- 1.29 8.9 3 11.481 79.21 26.7 3.87 9
10.- 0.35 2.4 2 0.84 5.76 4.8 0.7 4
11.- 0.35 1.2 4 0.42 1.44 4.8 1.4 16
12.- 0.78 4.7 3 3.666 22.09 14.1 2.34 9
13.- 0.43 3.5 2 1.505 12.25 7 0.86 4
14.- 0.47 2.9 3 1.363 8.41 8.7 1.41 9
15.- 0.38 1.4 4 0.532 1.96 5.6 1.52 16

8.07 42 55 32.063 188.08 140.8 28.96 219


ECUACIÓN
X Y Z Ti
42a+ 55b+ 15c = 8.07
188.08a+ 140.8b+ 42c = 32.063
140.8a+ 219b+ 55c = 28.96

X Y Z
Δ S= 42 55 15 42 55 1268338.8
188.08 140.8 42 188.08 140.8 1252627.6
140.8 219 55 140.8 219 15711.2

Ti Y Z
Δ X= 8.07 55 15 8.07 55 234718.635
32.063 140.8 42 32.063 140.8 232381.955
28.96 219 55 28.96 219 2336.68

X Ti Z
Δ Y= 42 8.07 15 42 8.07 203490.234
188.08 32.063 42 188.08 32.063 202281.804
140.8 28.96 55 140.8 28.96 1208.43

X Y Ti
Δ Z= 42 55 8.07 42 55 751953.154
188.08 140.8 32.063 188.08 140.8 754474.143
140.8 219 28.96 140.8 219 -2520.9884

ΔS 15711.2 ΔX= x 0.14872702


ΔX 2336.68 s
ΔY 1208.43
ΔY= y 0.07691519
ΔZ -2520.9884 s

ΔZ= z -0.16045804
s
a 0.14872702
b 0.07691519
c -0.16045804 (A) (B) 0.07691519
y= 0.14872702+ + © -0.16045804
4.-

Solución:

y x z xy X^2 yz z^2
1 2 17 2 4 17 289
3 1 15 3 1 45 225
4 3 13 12 9 52 169
6 4 10 24 16 60 100
7 5 9 35 25 63 81
10 8 8 80 64 80 64
15 7 6 105 49 90 36
16 9 5 144 81 80 25
18 11 3 198 121 54 9
20 12 4 240 144 80 16
100 62 90 843 514 621 1014

Ecuación:
y=ax+bz+c
Δ∑y=a∑x+b∑z+cn=
62a+90b+10c=100
Δ∑xy=a∑x^2+b∑xz+c∑x= 514a+405b+62c=843
Δ∑yz=a∑xz+b∑z^2+c∑z= 405a+1014b+90c=621
x y z
ΔS= 62 90 10 62 90
514 405 62 514 405
405 1014 90 405 1014
(2259900+2259900+52119600) -(1640250+3897816+4163400)=30294

ti y z
Δx= 100 90 10 100 90
843 405 62 843 405
621 1014 90 621 1014
(3645000+3465180+8548020) -(2515050+6286800+6828300)=28050

x ti z
Δy= 62 100 10 62 100
514 843 62 514 843
405 621 90 405 621
(4703940+2511000+3191940) -(3414150+2387124+4626000)=-20394

x y ti
Δz= 62 90 100 62 90
514 405 843 514 405
405 1014 621 405 1014
(15593310+30727350+52119600) -(16402500+52947724+28727460)= 312576

ΔS= 30244
Δx= 28050
ΔX= x 0.927
Δy= -20394 s
Δz= 312576
ΔY= y -0.6743
s

a= 0.927 ΔZ= z 10.3351409


s
b= -0.6743
c= 10.3351409

y= (A) 0.927+ (B) -0.6743 + © 10.3351409

4a.- El gerente de una empresa estudia las posibles relaciones entre beneficios
anuales, gastos en publicidad anuales y horas extraordinarias anuales de los
empleados. Para ello utiliza datos, de estas tres variables, proporcionadas por
algunas empresas del sector. Se desea saber:
SOLUCIÓN:
Beneficios Gastos de horas extras xy x^2 xz yz z^2
publicidad
(millones) y (millones) x (100 horas) z
1.3 0.3 4 0.39 0.09 1.2 5.2 16
3.5 1.5 9 5.25 2.25 13.5 31.5 81
2.8 0.7 6 1.96 0.99 4.2 16.8 36
3 1.1 7.5 3.3 1.21 8.25 22.5 56.25
3.3 1.2 8 3.96 1.94 9.6 26.4 64
4 2 7 8 4 19 28 49
3.7 2 8 7.4 4 16 29.6 64
21.6 8.8 49.5 30.26 13.48 66.75 160 366.25

Ecuación

Δ∑y=a∑x+b∑z+cn= 8.8a+49.5b+7c=21.6
Δ∑xy=a∑x^2+b∑xz+c∑x= 13.48a+66.75b+8.8c=30.26
Δ∑yz=a∑xz+b∑z^2+c∑z= 66.75a+366.25b+49.5c=160

ΔS= x y z
8.8 49.5 7 8.8 49.5
13.48 66.75 8.8 13.48 66.75
66.75 366.25 49.5 66.75 366.25
(29076.3+29076.3+34559.35)-
(31188.9375+28362.4+33029.37)=131.242

Δx= ti y z
21.6 49.5 7 21.6 49.5
30.26 66.75 8.8 30.26 66.75
160 366.25 49.5 160 366.25

(71369.1+69696+77579.075)-(74760+69616.8+74144.565)= 122.81

Δy= x ti z
8.8 21.6 7 8.8 21.6
13.48 30.26 8.8 13.48 30.26
66.75 160 49.5 66.75 160

(13181.256+12687.84+15097.6)-
(14138.985+12390.4+14412.816)=24.495

Δz= x y ti
8.8 49.5 21.6 8.8 49.5
13.48 66.75 30.26 13.48 66.75
66.75 366.25 160 66.75 366.25

(93984+99982.822+106640.28)-
(96240.15+97527.98+106761.6)=77.372

ΔS= 131.2425 ΔX= x 0.93


Δx= 122.81 s
Δy= 24.495
ΔY= y 0.18
Δz= 77.372
s

a= 0.93 ΔZ= z 0.58


b= 0.18 s
c= 0.58

y= (A) 0.93 + (B) 0.18 + © 0.58

5.- Supongamos que obtenemos los siguientes datos en el estudio de la relación


citada sobre la inteligencia y la motivación como predictores de la calificación final
obtenida en el bachillerato en una muestra de 12 sujetos:
SOLUCIÓN:
X Z Y
Sujetos Inteligencia Motivación Notas XY X^2 XZ YZ Z^2
1 85 10 4 340 7225 850 40 100
2 100 20 5 500 10000 2000 100 400
1 95 35 8 760 9025 3325 280 1225
4 80 30 7 560 6400 2400 210 900
5 180 45 10 1800 32400 8100 450 2025
6 90 25 6 540 8100 2250 150 625
7 110 10 6 660 12100 1100 60 100
8 120 15 7 840 14400 1800 105 225
9 80 10 4 320 6400 800 40 100
10 95 15 4 380 9025 1425 60 225
11 160 15 6 960 25600 2400 90 225
12 150 45 9 1350 22500 6750 405 2025

1345 275 76 9010 163175 33200 1990 8175

ECUACIÓN
X Y Z Ti
1345a+ 275b+ 12c = 76
163175a+ 33200b+ 1345c = 9010
33200a+ 8175b+ 275c = 1990

X Y Z
S= 1345 275 12 1345 275 4.0567E+10
163175 33200 1345 163175 33200 4.0356E+10
33200 8175 275 33200 8175 211398750

Ti Y Z
X= 76 275 12 8.07 55 704675842
9010 33200 1345 32.063 140.8 882033629
1990 8175 275 28.96 219 -177357788

X Ti Z
Y= 1345 76 12 42 8.07 3347031688
163175 9010 1345 188.08 32.063 3702416497
33200 1990 275 140.8 28.96 -355384809

X Y Ti
Z= 1345 275 76 42 55 8.9213E+10
163175 33200 9010 188.08 140.8 8.6884E+10
33200 8175 1990 140.8 219 2329048748

S 211398750
X -177357788 ΔX = x -0.83897274
s
Y -355384809
Z 2329048748 ΔY = y -1.68111121
s

ΔZ = z 11.0173251
s
a -0.83897274
b -1.68111121
c 11.0173251

(A)-0.83897274
y= + (B)-1.68111121 + © 11.0173251

6.- La siguiente tabla recoge información sobre el diámetro (en pulgadas), la altura
(en pies) y el volumen (en pies cúbicos) del tronco de distintos cerezos en una
determinada región.
SOLUCIÓN:
Diametro (y) Altura Volumen xy x^2 xz yz z^2
(x) (z)
8.3 70 10.3 581 4900 721 85.49 106.09

8.6 65 10.3 559 4225 669.5 88.58 106.09

8.8 63 10.2 554.4 3969 642.6 89.76 104.04

10.5 72 16.4 756 5184 1180.8 172.2 268.96

10.5 81 18.8 850.5 6561 1522.8 197.4 353.44

10.8 83 19.7 896.4 6889 1635.1 212.76 388.09

11 66 15.6 726 4356 1029.6 171.6 243.36

11 75 16.3 825 5625 1222.5 179.3 265.69

79.5 575 117.6 5748.3 41709 8623.9 1197.09 1835.76

Ecuación
Δ∑y=a∑x+b∑z+cn=
575a+117.6b+8c=79.5
Δ∑xy=a∑x^2+b∑xz+c∑x=
41709a+8623.9b+575c=5748.3
Δ∑yz=a∑xz+b∑z^2+c∑z=
.9a+1835.76b+117.6c=1197.09
x y z
ΔS= 575 117.6 8 575 117.6
41709 8623.9 575 41709 8623.9
8623.9 1835.76 117.6 8623.9 1835.76

(583148118+583148118+612541710.7)-
(594973209.7+606948150+576825459.8)=91127.2

ti y z
Δx= 79.5 117.6 8 100 90
5748.3 8623.9 575 843 405
1197.09 1835.76 117.6 621 1014
(80626565.88+41992020+6838416)-(82588675.61+105556200+8922312)= -
67610185.73

x ti z
Δy= 575 79.5 8 575 79.5
41709 5748.3 575 41709 5748.3
8623.9 1197.09 117.6 8623.9 1197.09
(
388700046+394220028.8+399435414.5)-
(396582115+395787881.3+389945782.8)=39710.2

Δz= x y ti
575 117.6 79.5 575 117.6
41709 8623.9 5748.3 41709 8623.9
8623.9 1835.76 1197.09 8623.9 1835.76

(5936061059+5829757090+6087133250)
(5912546271+6067687045+42300043.22)=5830418040

ΔS= 91127.2 ΔX = x -741.931


Δx= -67610185.7 s
Δy= 39710.2
Δz= 5830418040 ΔY = y 0.435
s
a= -741.931
ΔZ = z 63981.095
b= 0.435 s
c= 63981.095

y= (A) -741.931 + (B) 0.435 + © 63981.095


7.- La siguiente tabla incluye información acerca del peso (en kg.), la altura (en cm.),
contorno de cintura (en cm.) de 12 individuos.

SOLUCIÓN:
X Z Y
Peso Altura Cintura XY X^2 XZ YZ Z^2
74 168 62 4588 5476 12432 10416 28224
92 196 75 6900 8464 18032 14700 38416
63 170 60 3780 3969 10710 10200 28900
72 175 71 5112 5184 12600 12425 30625
58 162 66 3828 3364 9396 10692 26244
78 169 62 4836 6084 13182 10478 28561
85 190 79 6715 7225 16150 15010 36100
85 186 74 6290 7225 15810 13764 34596
73 176 70 5110 5329 12848 12320 30976
62 170 66 4092 3844 10540 11220 28900
80 176 71 5680 6400 14080 12496 30976
72 179 69 4968 5184 12888 12351 32041
ECUACIÓN
X Y Z Ti
894a+ 2127b+ 12c = 825
67748a+ 158668b+ 894c = 61899
158668a+ 374559b+ 2117c = 146072
894 2117 825 61899 67748 158668 146072 374559

X Y Z
ΔS= 894 2127 12 894 2127 9.0652E+11
67748 158668 894 67748 158668 9.0653E+11
158668 374559 2117 158668 374559 -11690712

Ti Y Z
ΔX= 825 2127 12 825 2127 8.331E+11
61899 158668 894 61899 158668 8.331E+11
146072 374559 2117 146072 374559 -4866915

X Ti Z
ΔY= 894 825 12 894 825 3.5293E+11
67748 61899 894 67748 61899 3.5293E+11
158668 146072 2117 158668 146072 2274198

X Y Ti
ΔZ= 894 2127 825 894 2127 6.2545E+13
67748 158668 61899 67748 158668 6.2546E+13
158668 374559 146072 158668 374559 -844252878

ΔS -1.20E+07
ΔX -4866915
ΔY 2274198
ΔZ -8.40E+08
ΔX = x 0.40557625
s

ΔY = y -0.1895165
s

a 0.405576 ΔZ = z 70
b -0.18952 s
c 70

y= (A)0.405576 + (B)-0.18952 + ©70

8.- Se pretende estudiar la posible relación lineal entre el precio de pisos en miles de
euros, en una conocida ciudad española y variables como la superficie en m2 y la
antigüedad del inmueble en años.
Y X Z
Precio Superficie Antiguedad XY X^2 XZ YZ Z^2
200 100 20 20000 10000 2000 4000 400
120 70 15 8400 4900 1050 1800 225
155 120 30 18600 14400 3600 4650 900
310 150 20 46500 22500 3000 6200 400
320 90 12 28800 8100 1080 3840 144
400 227 400 90800 51529 90800 160000 160000
100 75 100 7500 5625 7500 10000 10000
80 65 80 5200 4225 5200 6400 6400
75 80 75 6000 6400 6000 5625 5625
169 150 169 25350 22500 25350 28561 28561
110 120 110 13200 14400 13200 12100 12100
210 100 210 21000 10000 21000 44100 44100
200 125 200 25000 15625 25000 40000 40000
180 137 180 24660 18769 24660 32400 32400
140 90 140 12600 8100 12600 19600 19600
95 110 95 10450 12100 10450 9025 9025

2864 1809 1856 364060 229173 252490 388301 369880


ECUACIÓN
X Y Z Ti
1809a+ 1856b+ 16c = 2864
229173a+ 252490b+ 1809c = 364060
252490a+ 369880b+ 1856c = 388301

X Y Z
ΔS= 1809 1856 16 1809 1856 3.05174E+12
229173 252490 1809 229173 252490 3.01988E+12
252490 369880 1856 252490 369880 31851560552

Ti Y Z
ΔX= 2864 1856 16 2864 1856 4.80039E+12
364060 252490 1809 364060 252490 4.7391E+12
388301 369880 1856 388301 369880 61286266784

X Ti Z
ΔY= 1809 2864 16 1809 2864 3.95429E+12
229173 364060 1809 229173 364060 3.95964E+12
252490 388301 1856 252490 388301 -5352909565

X Y Ti
ΔZ= 1809 1856 2864 1809 1856 5.90736E+14
229173 252490 364060 229173 252490 5.91343E+14
252490 369880 388301 252490 369880 -6.06812E+11

S 31851560552 ΔX = x 1.92412132
X 61286266784
s
Y -5352909565
Z -6.06812
ΔY = y -0.168058
s

a 1.92412132 ΔZ = z -1.9051E-10
b -0.168058
c -1.905

(A) (B) -0.168058


y= 1.92412132+ + © -1.905