Académique Documents
Professionnel Documents
Culture Documents
Contenido terico:
Observe que en este archivo se han registrado 474 observaciones para un total de 10
variables.
Puede solicitar un reporte de frecuencias para alguna variable de inters, como por
ejemplo Categora laboral (catlab)
Ejercicio 1.
Seleccione una muestra aleatoria simple de 50 empleados
Para ello debe seguir los pasos siguientes:
Datos Seleccionar casos
Por defecto siempre estarn activos Todos los casos. Elija Muestra aleatoria de casos,
haga clik en el botn Ejemplo
Importante:
En la ventana anterior note que: por defecto se encuentra activa, en el
recuadro inferior de Resultado, la opcin: Descartar casos no seleccionados.
Esto permite realizar la seleccin sin eliminar el caso no seleccionado.
Observacin:
Ejercicio 2.
Seleccione una muestra aleatoria sistemtica de 50 empleados
Recuerde que para l aplicacin de un muestreo sistemtico debemos determinar el valor
de K correspondiente al salto sistemtico o perodo de seleccin.
N 474
9,48 K 9
n
50
10
12
Lo que se busca en la primera expresin es encontrar los registros cuya divisin con el
valor de K nos de residuo CERO. La segunda expresin busca establecer un tope hasta
donde se debe verificar estos cocientes. Dado que el valor de K, al ser redondeado al
menor entero, suele ocasionar que sobren casos para realizar ms selecciones, esta
segunda expresin evitar que se tomen ms observaciones que las establecidas para la
muestra.
Observe que:
Si id = 1 1 + (9 7) entre 9 no muestra resto CERO el registro 1 no ser
seleccionado
13
Observe que los dos ltimos casos seleccionados son precisamente: X439 y X448
para cada estrato. El archivo de datos ha utilizar sigue siendo Employee data.sav. No
olvide que primero debe observar que tenga todos los casos del archivo disponibles.
Ejercicio 3.
Seleccione una muestra aleatoria estratificada de 50 empleados con asignacin
proporcional a la categora laboral.
Dado que la muestra se desea asignar proporcionalmente a la categora laboral podemos
solicitar una tabla de frecuencias para esta variable y as conocer el tamao de cada
estrato
En seguida hacemos los clculos para la determinacin del tamao de muestra para cada
estrato (categora laboral)
Categora Laboral
Administrativo
Seguridad
Directivo
Total
Frecuencia Proporcin
363
27
84
474
,7658
,0570
,1772
1,0
ni = ( Ni / N ) * n
38
3
9
38,3
2,8
8,9
50
15
16
El resultado ser un nuevo archivo de datos que considera solo los 363 casos
correspondientes a Administrativos.
18
Observe que hasta aqu se ha logrado conformar el estrato que llamaremos Seguridad
que cuenta con 27 casos registrados.
19
ADMINISTRATIVO
21
Es importante que est conciente que al elegir esta opcin los casos no seleccionados
sern eliminados sin posibilidad de volverles a recuperar.
22
SEGURIDAD
Del estrato Seguridad seleccionaremos con una muestra aleatoria simple de 3 de los 27
casos
23
DIRECTIVO
Si hacemos lo propio para el estrato de Directivos lograremos obtener este archivo
reducido a 9 casos de los 84 que muestra inicialmente.
Finalmente puede unir los tres archivos en uno solo teniendo la muestra total de 50
registros
24
25
26
GUA DE LABORATORIO 2
TEMA: INTERVALOS DE CONFIANZA Y PRUEBA DE HIPTESIS
Contenido Terico
Introduccin
Parmetro
Media poblacional ()
Intervalos de Confianza
Pruebas de Hiptesis
2
1
22
Antes de iniciar el uso del programa para este tema, cabe indicar lo siguiente:
El SPSS asume siempre (ya sea para analizar uno o dos poblaciones) que las
muestras provienen de poblaciones infinitas. Es decir, no considera en sus clculos
el factor de correccin de poblaciones finitas (f.c.p.f.).
Para el caso de una media poblacional y dos medias poblacionales solo analiza el
caso cuando la varianza poblacional es desconocida. Es decir, siempre usa la
distribucin T tanto para obtener los estadsticos de prueba como los intervalos de
confianza.
Para el caso de pruebas de diferencia de medias poblacionales de muestras
independientes o muestras relacionadas solo realiza la hiptesis cuando el valor
hipottico es igual a cero.
La prueba de hiptesis para la razn de varianzas poblacionales lo realiza mediante
la prueba de Levene y no mediante la prueba F de Fisher.
El p-valor solo lo obtiene para pruebas de tipo bilateral, por lo que se debe tener
mucho cuidado si se quiere utilizar estos valores en casos unilaterales.
26
Conceptos
El p valor (o sig)
Cuando se interpretan los reportes en pruebas de hiptesis, las conclusiones estn
basadas en una regla de decisin; sta se establece tendiendo en cuenta el riesgo que
asume el investigador de cometer un error de tipo I, siendo la probabilidad de este error
el nivel de significacin . Pero en algunas ocasiones, sin embargo, la decisin a tomar
puede realizarse con un nivel de significacin diferente, con lo cual seria til conocer
que tipo de decisin se puede adoptar segn el nivel de significacin real de una prueba
basndose en los datos observados. Este concepto actuar como contrapuesto al nivel de
significacin elegido antes de realizar la prueba.
p-valor: probabilidad que, bajo H0 el estadstico de contraste tome un valor al menos
tan alejado como el realmente obtenido.
Cuanto ms pequeo sea el p-valor mayor es la evidencia en contra de H0.
Ejemplo1
27
1,281 1,288 1,292 1,289 1,291 1,293 1,293 1,291 1,289 1,288
1,287 1,291 1,290 1,286 1,289 1,286 1,295 1,296 1,291 1,286
a) Determine un intervalo del 90% de confianza para la media del dimetro exterior.
Solucin:
Ingresamos a la opcin indicada anteriormente y pasamos la variable del recuadro
de la izquierda al de la derecha, utilizando el botn
de la siguiente manera:
Dado que desea un intervalo al 90% de confianza se debe dar un clic en el botn
Opciones con lo cual aparecer la siguiente ventana
28
y all se debe indicar el nivel de confianza, posteriormente dar clic en Continuar para
volver a la ventana principal.
Al hacer clic en aceptar obtenemos:
Estadsticos para una muestra
N
Dimet ro exterior
20
Media
1.28960
Desv iacin
tp.
.003500
Error tp. de
la media
.000783
Dimetro exterior
t
1647.613
gl
19
Sig. (bilateral)
.000
Dif erencia
de medias
1.289600
Solucin:
Para probar la hiptesis de que la longitud media del dimetro exterior es de 1,29
procedemos de la misma manera que en la parte a)
29
= 0,05.
Procedimiento:
Media
20
Desviacin tp.
1,28960
,003500
media
,000783
Como H 0 : 1,29 frente a H1 : 1,29 se trata por tanto de una prueba de hiptesis
Prueba para una muestra
de dos colas (bilateral), el estadstico de prueba toma el valor -0,511. En este caso no
Valor de prueba = 1.29
podemos rechazar la hiptesis nula, el valor p de 0,615 es mayor que el nivel de
90% Interv alo de
significacin de 0,10.
conf ianza para la
Dimetro exterior
t
-.511
gl
19
Sig. (bilateral)
.615
Dif erencia
de medias
-.000400
dif erencia
Inf erior
Superior
-.00175
.00095
30
Bajo un nivel de significacin del 10% concluimos que la longitud media del dimetro
exterior de los tubos usados en el cableado elctrico es de 1,29 pulgadas
Valor de la estadstica
de prueba
Observacin:
Puede calcularse el intervalo de confianza de la media sumando a la media
hipottica los valores -0,00175 y 0,00095 de la tabla anterior y obtenemos el
mismo resultado que en la parte a)
Cuando la prueba de hiptesis es de una sola cola se debe observar el signo del
tcalculado
Si el t calculado es negativo:
El sig de una prueba unilateral izquierda es sig/2; y el sig de una prueba
unilateral derecha es 1-sig/2.
Si el t calculado es positivo:
El sig de una prueba unilateral izquierda es 1-sig/2; y el sig de una prueba
unilateral derecha es sig/2.
H 0 : 1, 29
H1 : 1, 29
31
Ejemplo 2.
Premium
35,0
34,5
31,6
32,4
34,8
31,7
35,4
35,3
36,6
36,0
Normal
40,0
29,6
32,1
35,4
34,0
34,8
34,6
34,8
32,6
32,2
34.5
Suponga que el rendimiento de combustible se distribuye normalmente
32
En Variable de agrupacin se debe definir los cdigos de los grupos que se desean
comparar. Para definir los cdigos se ingresa el al botn Definir grupos y
posteriormente se da un clic en el botn Continuar:
33
Como nos piden un intervalo del 99% de confianza dar un clic al botn Opciones
para definir ah el nivel de confianza.
Estadsticos de grupo
Rend
Tipo_gas
Gasolina sin
plomo premium
Gasolina sin
plomo normal
Desv iacin
tp.
Media
Error tp. de
la media
10
34.370
1.8105
.5725
10
33.980
2.6720
.8450
F
Rend
Se han asumido
v arianzas iguales
No se han asumido
v arianzas iguales
0,535 >0,01: No se
rechaza la hiptesis
nula de varianzas
iguales
Sig.
.401
.535
gl
Sig. (bilateral)
Dif erencia
de medias
Error tp. de
la dif erencia
.382
18
.707
.3900
1.0207
-2.5479
3.3279
.382
15.825
.707
.3900
1.0207
-2.5955
3.3755
Lmite inferior de
confianza para la
diferencia de
medias asumiendo
varianzas iguales
Lmite Superior de
confianza para la
diferencia de
medias asumiendo
varianzas iguales
Podemos apreciar que el SPSS nos brinda los resultados para varianzas
desconocidas asumiendo varianzas iguales y diferentes.
Para determinar cual de los dos intervalos es el correcto debemos utilizar la Prueba
de Levene y comparar el Sig =0.535 de la Prueba de Levene con el . Como en este
caso el sig> asumimos los resultados obtenidos para varianzas homogneas
34
H 0 : P2 N2
H 1 : P2 N2
De igual manera que para intervalos de confianza, para determinar si las varianzas
son homogneas o no, debemos hacer uso del Sig =0.535 de la Prueba de Levene y
compararlo con el .
Como en este caso el sig> asumimos los resultados obtenidos para varianzas
homogneas
Para evaluar la hiptesis de inters
H0 : P N
H1 : P N
=0,01
Prueba de muestras independientes
Prueba de Lev ene
para la igualdad de
v arianzas
F
Rend
Se han asumido
v arianzas iguales
No se han asumido
v arianzas iguales
Sig.
.401
.535
gl
Sig. (bilateral)
Dif erencia
de medias
Error tp. de
la dif erencia
.382
18
.707
.3900
1.0207
-2.5479
3.3279
.382
15.825
.707
.3900
1.0207
-2.5955
3.3755
p = 0,707 >0,01: No se
rechaza la hiptesis nula
de medias iguales
35
Conclusin:
Bajo un nivel de significacin del 1% concluimos que los rendimientos medios de
ambos tipos de gasolinas no son diferentes.
Ejemplo 3.
Se realiz un estudio para determinar si el nivel de exportacin (en miles de $) de 10
exportadores de esprragos ha variado. Se recolect la siguiente informacin:
Exportador
Ao
1
10
2006
17,5
17,2
15,8
16,2
17,4
15,8
17,7
17,6
18,3
18.0
2007
19,2
17,4
16.0
18,1
17.0
16,3
18,3
16,4
18.0
19,2
36
Solucin:
Comenzamos introduciendo los datos de cada ao en dos columnas diferentes en el
editor Vista de datos del SPSS.
Ingresamos a la opcin indicada anteriormente y pasamos los datos de cada columna
en los recuadros con encabezado Variable1 y Variable2. Esta versin del SPSS
permite hacer varias comparaciones a la vez.
Si quiere hacer la diferencia del segundo grupo menos el primer grupo puede hacer
uso del botn
Media
Par 1
Desviacin tp.
Error tp. de la
media
ao1
17,1300
10
,90068
,28482
ao2
17,5900
10
1,15993
,36680
ao1 y ao2
Correlacin
10
,590
Sig.
,073
37
-,46000
Desviacin
Error tp. de la
tp.
media
,96171
,30412
Sig.
Inferior
-1,14797
Superior
,22797
t
-1,513
gl
9
H0 : D 0
H1 : D 0
=0,01
sig = 0,165 > no se rechaza H0.
Conclusin
Existe suficiente evidencia estadstica a un nivel de significacin de 0,05 para no
rechazar H0.
Por lo tanto no podemos afirmar que los niveles de exportacin han variado.
38
(bilateral)
,165
GUA DE LABORATORIO 3
TEMA: ANLISIS DE VARIANZA
39
N
1
2
3
4
5
6
I
0,08
0,10
0,09
0,07
0,09
0,06
Sitios
II
0,15
0,09
0,11
0,10
0,08
0,13
III
0,13
0,10
0,15
0,09
0,09
0,17
IV
0,05
0,11
0,07
0,09
0,11
0,08
40
41
c) A partir de los resultados de (a), use las pruebas de Duncan y DMS para probar
42
Con relacin a la pregunta (a), los datos proporcionan prueba suficiente que indiquen
diferencias en el contenido medio de ozono entre los cuatro sitios? Use =0,05.
Como sig =0.035 < 0,05 , entonces se concluye que s hay diferencias en el
contenido medio de ozono entre los cuatro sitios.
43
44
45
46
47
Subconjuntos homogneos
48
49
50
Posicin
800
570
565
583
528
547
521
Temperatura (C)
825
1063
1080
1043
988
1026
1004
850
565
510
590
526
538
532
51
En Variable dependiente:
colocar densidad
En factores fijos:
posicin y temperatura
En modelo
52
Para obtener las comparaciones mltiples, en la primera pantalla dar click en Post Hoc
y seleccionar DMS (en ingls LSD) y la prueba de Duncan.
53
54
yijk yij.
y ij.
Salidas
Factores inter-sujetos
Temperatura
Posicin
800
825
850
1
2
Eti queta
del valor
800 C
825 C
850 C
Posicin 1
Posicin 2
N
6
6
6
9
9
55
a
Contraste de Levene sobre la igualdad de las varianzas error
gl1
gl2
5
12
Signif icacin
.084
Fuente
Modelo corregido
Interseccin
Temperatura
Posicin
Temperatura * Posicin
Error
Total
Total corregida
Suma de
cuadrados
tipo III
953320.278a
9072380.056
945342.111
7160.056
818.111
5370.667
10031071.0
958690.944
gl
5
1
2
1
2
12
18
17
Media
cuadrtica
190664.056
9072380.1
472671.056
7160.056
409.056
447.556
F
426.012
20270.958
1056.117
15.998
.914
Signif icacin
.000
.000
.000
.002
.427
1. Media global
Variable dependiente: Densidad
Media
709.944
Error tp.
4.986
2. Temperatura
Estimaciones
Variable dependiente: Densi dad
Temperatura
800 C
825 C
850 C
Media
552.333
1034.000
543.500
Error tp.
8.637
8.637
8.637
56
Diferenci a ent re
medias (I-J)
-481.667*
8.833
481.667*
490.500*
-8.833
-490.500*
Error tp.
12.214
12.214
12.214
12.214
12.214
12.214
Intervalo de confianza al 95 %
a
para la di ferencia
a
Significacin L mite inferior L mite superior
.000
-508.279
-455.054
.483
-17.779
35.446
.000
455.054
508.279
.000
463.888
517.112
.483
-35.446
17.779
.000
-517.112
-463.888
Contrastes univariados
Variable dependiente: Densidad
Suma de
cuadrados
Contraste 945342.111
Error
5370.667
gl
2
12
Media
cuadrtica
472671.056
447.556
F
1056.117
Significacin
.000
3. Posicin
Estimaciones
Variable dependiente: Densidad
Posicin
Posicin 1
Posicin 2
Media
729.889
690.000
Error tp.
7.052
7.052
(I) P osicin
Posicin 1
Posicin 2
(J) P osicin
Posicin 2
Posicin 1
Diferenci a ent re
medias (I-J)
39.889*
-39.889*
Error tp.
9.973
9.973
Interval o de confianza al 95 %
a
para la di ferencia
a
Significacin Lmite i nferior Lmite superior
.002
18.160
61.618
.002
-61.618
-18.160
57
Contrastes univariados
Variable dependiente: Densidad
Contraste
Error
Suma de
cuadrados
7160.056
5370.667
gl
1
12
Media
cuadrtica
7160.056
447.556
F
15.998
Significacin
.002
Cada prueba F contrasta el efecto si mple de Posi cin en cada combi nacin de nivel es
del resto de los efectos mostrados. Estos contrastes se basan en las comparaciones por
pares, li nealmente independientes, entre las medias marginal es estimadas.
4. Temperatura * Posicin
Variable dependiente: Densi dad
Temperatura
800 C
825 C
850 C
Posicin
Posicin 1
Posicin 2
Posicin 1
Posicin 2
Posicin 1
Posicin 2
Media
572.667
532.000
1062.000
1006.000
555.000
532.000
Error tp.
12.214
12.214
12.214
12.214
12.214
12.214
Temperatura
Comparaciones mltiples
Variable dependiente: Densidad
DMS
(I) Temperatura
800 C
825 C
850 C
(J) Temperatura
825 C
850 C
800 C
850 C
800 C
825 C
Diferencia entre
medias (I-J)
-481.67*
8.83
481.67*
490.50*
-8.83
-490.50*
Error tp.
12.214
12.214
12.214
12.214
12.214
12.214
58
Subconjuntos homogneos
Densi dad
Duncana,b
Temperatura
850 C
800 C
825 C
Significacin
N
6
6
6
Subconjunto
1
2
543.50
552.33
1034.00
.483
1.000
Grficos de perfil
1100
1000
900
800
700
600
500
800 C
825 C
850 C
Temperatura
1100
1000
900
800
700
600
500
Posicin 1
Posicin 2
Posicin
59
48.2
53.1
51.2
58.6
Cuadrilla B
49.5
52.9
50.0
60.1
Cuadrilla C
50.7
56.8
19.9
62.4
Cuadrilla D
48.6
50.6
47.5
57.5
Cuadrilla E
47.1
51.8
49.1
55.3
Cuadrilla F
52.4
57.2
53.5
61.7
60
61
62
Subconjuntos homogneos
63
Cuadrilla
64
Subconjuntos homogneos
Grficos de perfil
65
66
67
68
Continuar y Aceptar
69
GUA DE LABORATORIO 4
TEMA: PRUEBAS CHI CUADRADO
70
Contenido Terico:
Prueba de Independencia
Prueba de Homogeneidad
Introduccin
Una de las mayores utilidades de la distribucin Ji-Cuadrado est en que permite
comparar frecuencias observadas (frecuencias obtenidas en un experimento o
muestreo) con frecuencias esperadas segn un modelo supuesto (hiptesis nula).
Esta caracterstica de la distribucin Ji-cuadrado permite efectuar las siguientes
pruebas:
Prueba de independencia.
Prueba de homogeneidad de subpoblaciones.
Pruebas de bondad de ajuste a una distribucin de probabilidades.
La metodologa en cada uno de los tres casos es muy similar. La diferencia principal
est en la forma en que se calculan las frecuencias esperadas, ya que estas
dependern de la hiptesis nula en cuestin.
Departamento
Electrodomsticos
Ropa
Herramientas
Frecuencias observadas
Valor del vale
$10
$50
$100+
22
26
54
33
31
22
41
43
19
Pruebe si el valor del vale se relaciona con lo que el cliente compra. Use = 0,05.
71
72
Para obtener las frecuencias esperadas y los porcentajes fila, columna y total,
ingresar a Casillas y marcar lo que se necesite analizar:
73
74
75
NOTA: Cabe recordar que la prueba chi-cuadrado propone como condicin que las
frecuencias esperadas sean mayores que 5. En el ltimo reporte del SPSS se indica que
el 48% de las casillas tienen frecuencia esperada inferior a 5 por lo que ser necesario
juntar columnas (en este caso).
77
78
79
80
81
GUA DE LABORATORIO 5
TEMA: REGRESIN LINEAL Y NO LINEAL
82
Contenido Terico:
Matriz de correlaciones.
Regresin curvilineal.
Introduccin
En el anlisis estadstico se tienen mtodos que nos permiten determinar si dos o ms
variables se relacionan. La relacin entre variables nos permite disponer de los
elementos suficientes para, en base a una muestra de pares de datos de las variables,
realizar estimaciones de las proyecciones para uno o ms datos de una de las variables
involucradas.
En esta oportunidad nos ocuparemos de la correlacin y la regresin entre los datos de
dos variables numricas utilizando SPSS para el anlisis correspondiente.
A continuacin se muestra la base de datos con la que se explicar los procedimientos
involucrados al realizar un anlisis de regresin lineal simple.
Los datos corresponden a las ventas totales por ao de cada una de 11 regiones en las
que una compaa opera. Dicha compaa se dedica a la venta de repuestos para
automviles. Se pretende estimar el valor de las ventas futuras conociendo el nmero de
distribuidoras establecidas en cada regin y el nmero de automviles vendidos para
cada regin.
83
MATRIZ DE CORRELACIONES
El primer paso que daremos consiste en revisar si existe correlacin entre las variables
de esta base de datos, con este fin realizaremos la matriz de correlaciones. Analizando
esta matriz se podr determinar cul de las variables independientes: Regin, N de
distribuidoras o N de autos vendidos, est ms correlacionada con la variable
dependiente Ventas.
Para realizar la matriz de correlaciones:
Coeficiente de correlacin.
84
Clic en aceptar.
VARIABLE
La secuencia es:
85
Arrastre la Variable
Ventas a la casilla de
Dependientes.
Arrastre la variable
Nro_distrb a la casilla de
Independiente.
Clic en Aceptar.
86
Por el momento slo se proceder a obtener la ecuacin del modelo as como algunos
valores representativos para la validacin de dicho modelo.
Un anlisis ms riguroso del modelo y su validacin se har para el caso de regresin
lineal mltiple.
Resultados obtenidos:
Resumen del modelo
Modelo
1
R
.739a
R cuadrado
corregida
.496
R cuadrado
.546
Error tp. de la
estimacin
9.7718
Regresin
Residual
Total
Suma de
cuadrados
1033.836
859.393
1893.229
gl
1
9
10
Media
cuadrtica
1033.836
95.488
F
10.827
Sig.
.009a
Coeficientesa
Modelo
1
(Constante)
Nro distribuidoras
Coef icientes no
estandarizados
B
Error tp.
10.881
6.409
.012
.004
Coef icientes
estandarizad
os
Beta
.739
t
1.698
3.290
Sig.
.124
.009
87
Para el caso desarrollado (regresin lineal simple), esta prueba es anloga a la prueba de
verificacin global.
Una forma grfica de verificar la relacin lineal entre Y con X es realizar un grfico de
dispersin, el cul muestra la posible tendencia y/o relacin posible entre variable
dependiente e independiente.
La secuencia para obtener dicho grfico es la siguiente:
88
89
Analizaremos los diferentes modelos curvilneos que puedan formarse para determinar
cul de ellos es el mejor. Los datos se muestran a continuacin:
La secuencia para realizar una regresin curvilnea es la siguiente:
Men Analizar >> Regresin >> Estimacin Curvilnea. . .
Arrastre la variable
Salario a Dependientes
Arrastre la variable
Experiencia
Independientes
Aceptar
90
R
cuadrado
,757
56,218
18
,000
26,270
1,334
Logartmica
,850
102,140
18
,000
18,034
10,768
Inversa
,626
30,149
18
,000
45,516
-34,376
Cuadrtico
,876
60,189
17
,000
19,126
3,363
Potencia
,800
71,854
18
,000
20,614
,309
Exponencial
,645
32,662
18
,000
26,521
,036
Lineal
gl1
gl2
Sig.
Constante
b1
b2
-,087
Se puede apreciar que los Valores P (Sig) son inferiores a = 0.05, por tanto en todos
los casos existe correlacin.
Si estudiamos los valores de R2 (Rcuadrado) nos podemos percatar de que el modelo
cuadrtico es el modelo ms eficiente (ms cercano a 1). Mientras que el modelo
logartmico es el segundo.
Para decidir realizamos nuevamente el anlisis con los modelos con mayor eficiencia
(mayor R2)
91
Logartmica
R cuadrado
,922
R cuadrado
Error tpico de
corregida
la estimacin
,850
,842
4,018
gl
Media
cuadrados
Regresin
Residual
Total
Sig.
cuadrtica
1648,640
1648,640
290,538
18
16,141
1939,178
19
102,140
,000
Coeficientes
Sig.
estandarizados
B
Error tpico
ln(Aos de experiencia)
10,768
1,065
(Constante)
18,034
2,099
Beta
,922
10,106
,000
8,590
,000
En este caso el valor P para el coeficiente de la variable independiente (aos de experiencia) es menor que
= 0.05, por tanto se puede decir que es significativa para el modelo.
92
Cuadrtico
Resumen del modelo
R
R cuadrado
,936
R cuadrado
Error tpico de la
corregida
estimacin
,876
,862
3,757
gl
Media
cuadrados
Regresin
Residual
Total
Sig.
cuadrtica
1699,211
849,606
239,967
17
14,116
1939,178
19
60,189
,000
Coeficientes
Coeficientes no estandarizados
Coeficientes
Sig.
estandarizados
B
Error tpico
Beta
Aos de experiencia
3,363
,519
2,194
6,480
,000
Aos de experiencia ** 2
-,087
,022
-1,367
-4,040
,001
19,126
2,232
8,568
,000
(Constante)
En este caso el valor P para los coeficientes de la variable independiente (aos de experiencia) son
menores que = 0.05, por tanto se puede decir que son significativas para el modelo.
93
Cbico
Resumen del modelo
R
R cuadrado
,936
R cuadrado
Error tpico de la
corregida
estimacin
,876
,853
3,872
ANOVA
Suma de
gl
Media
cuadrados
Regresin
Residual
Total
Sig.
cuadrtica
1699,253
566,418
239,925
16
14,995
1939,178
19
37,773
,000
Coeficientes
Coeficientes no estandarizados
Coeficientes
Sig.
estandarizados
B
Error tpico
Beta
Aos de experiencia
3,300
1,303
2,153
2,532
,022
Aos de experiencia ** 2
-,081
,134
-1,259
-,602
,556
Aos de experiencia ** 3
,000
,004
-,070
-,053
,959
19,255
3,356
5,737
,000
(Constante)
En este caso el valor P para los coeficientes de grado 2 y 3 de la variable independiente (aos de
experiencia) son mayores que = 0.05, por tanto se puede decir que no son significativas para el modelo.
94
95
GUA DE LABORATORIO 6
TEMA: REGRESIN LINEAL MLTIPLE
96
Contenido:
Anlisis de Multicolinealidad
Modelo final.
Precio de una
Nivel de
Dividendo Nmero de acciones
accin (P) endeudamiento (D)
(DR)
en circulacin(SO)
52,50
12,00
2,10
100
14,25
3,40
0,69
37
35,21
7,10
1,70
68
45,21
10,40
1,81
90
17,54
4,00
0,70
32
22,00
5,10
0,88
45
37,10
8,50
1,50
78
29,12
6,70
1,20
60
46,32
10,65
1,85
95
49,30
11,34
2,00
99
97
Para determinar la tabla de correlacin entre las variables involucradas en el modelo realizamos
lo siguiente:
Aceptar.
98
Precio de
una accin
(Y) (US$)
Correlacin de
Precio de una Pearson
accin (Y)
Sig. (bilateral)
(US$)
N
Correlacin de
Nivel de
Pearson
endeudamien
to (X1) (x100 Sig. (bilateral)
US$)
N
Dividendo
(X2) (US$)
Nmero de
acciones en
circulacin
(X3) (miles)
Correlacin de
Pearson
Sig. (bilateral)
N
Correlacin de
Pearson
Sig. (bilateral)
Nivel de
endeudamient Dividendo (X2)
o (X1) (x100
(US$)
US$)
10
,995
**
,995
**
,985
**
,991
**
,000
,000
,000
10
10
10
**
,000
,965
**
,000
10
10
10
**
**
,965
,991
,000
10
,985
Nmero de
acciones en
circulacin
(X3) (miles)
,975
**
,000
,000
10
10
10
10
**
**
**
,991
,991
,000
,975
,000
,000
,000
10
10
10
10
Podemos observar que existe una alta correlacin entre la variable dependiente (precio
de una accin) y independientes, pero tambin la correlacin es alta entre las variables
independientes.
Traslade la variable
Precio de una Accin
(P) a la casilla de
Dependientes.
Traslade las
variables restantes a la
casilla
de
Independientes.
Aceptar
R cuadrado
1,000
R cuadrado
Error tp. de la
corregida
estimacin
1,000
,999
,36223
ANOVA
Modelo
Suma de
gl
Media
cuadrados
Regresin
1
Residual
Total
Sig.
cuadrtica
1685,572
561,857
,787
,131
1686,359
4282,036
,000
100
En forma conjunta las variables son significativas para el modelo, considerando un nivel
de significacin del 5% (P-Valor = 0,000). Las hiptesis que se proponen son las
siguientes:
H0 : i = 0
H1 : i 0
El siguiente cuadro permite analizar la contribucin individual de cada variable
regresora al modelo propuesto:
Coeficientes
Modelo
Coeficientes no
estandarizados
B
Coeficientes
tipificados
Error tp.
(Constante)
-,480
,374
Nivel de endeudamiento
(X1) (x100 US$)
3,371
,294
10,727
-,097
Sig.
Beta
-1,283
,247
,771
11,452
,000
1,022
,422
10,493
,000
,042
-,185
-2,297
,061
1
Dividendo (X2) (US$)
Nmero de acciones en
circulacin (X3) (miles)
Procedimiento:
Men Analizar >>
Regresin
>>
Lineales . . .
En el cuadro
dialogo slo se debe
elegir Adelante en
Mtodo.
Aceptar
o
1
2
R cuadrado
Error tp. de
cuadrado
corregida
la estimacin
,995
,990
,988
1,47901
1,000
,999
,999
,45976
ANOVA
Modelo
Suma de
gl
Media
cuadrados
Regresin
1
cuadrtica
1668,859
1668,859
17,500
2,187
Total
1686,359
Regresin
1684,879
842,440
1,480
,211
1686,359
Residual
Residual
Total
Sig.
762,918
,000
3985,359
,000
102
Coeficientes
Modelo
Coeficientes no
Coeficientes
estandarizados
tipificados
B
(Constante)
1
Error tp.
,407
1,332
4,350
,157
(Constante)
-,814
,437
Nivel de endeudamiento
2,785
,186
9,437
1,084
Nivel de endeudamiento
Sig.
Beta
,306
,768
27,621
,000
-1,862
,105
,637
14,943
,000
,371
8,706
,000
,995
Beta dentro
Sig.
Correlacin
Estadsticos de
parcial
colinealidad
Tolerancia
Nmero de acciones en
,371
8,706
,000
,957
,069
,279
1,020
,342
,360
,017
-2,297
,061
-,684
,012
Nmero de acciones en
-,185
Modelo final.
Luego, el programa nos entrega el mejor modelo. En este caso las variables de
prediccin seleccionadas son Nivel de endeudamiento (X1) y Dividendos(X2), observe
que X1 y X3 no deberan de estar juntos en el modelo. Aqu se descart la variable X3.
Ntese que se ha seleccionado el modelo con las variables X1 y X3 puesto que en la
tabla Resumen del modelo, el valor de R cuadrado es mayor que si se eligiera el modelo
con solo la variable X1 (0,990 contra 0,999)
103
Modelo
1,000
R cuadrado
Error tp. de la
corregida
estimacin
R cuadrado
a
,999
,999
,45976
ANOVA
Suma de
Modelo
1
cuadrados
Regresin
Residual
Total
gl
Media cuadrtica
1684,879
842,440
1,480
,211
1686,359
Sig.
3985,359
,000
Coeficientes
Coeficientes no
estandarizados
B
Modelo
(Constante)
Error tp.
Coeficientes
tipificados
Sig.
Beta
,407
1,332
,306
,768
4,350
,157
,995 27,621
,000
(Constante)
-,814
,437
-1,862
,105
2,785
,186
,637 14,943
,000
9,437
1,084
,371
,000
8,706
104
Supuesto de normalidad.
Otro supuesto del modelo es la
normalidad que presentan los
errores. Para verificar este supuesto
podemos realizar el grfico de
probabilidad normal.
105
106
Supuesto de homocedasticidad
Analizar/Regresin/lineales en grficos , se selecciona y se transfiere al eje Y la
variable ZRESISD , se selecciona y se transfiere al eje X la variable ZPRED ,
Continuar/ Aceptar.
107