Académique Documents
Professionnel Documents
Culture Documents
Henry Martnez
Coordinadores:
Analista de Sistemas:
Programador:
INTRODUCCIN ......................................................................................................... 2
MARCO TERICO....................................................................................................... 7
ESTADSTICA DESCRIPTIVA............................................................................................. 7
Distribuciones de frecuencias: .................................................................................................................. 8
Medidas de tendencia central:................................................................................................................... 9
Medidas de dispersin............................................................................................................................. 10
Probabilidades......................................................................................................................................... 11
Medicin de la probabilidad............................................................................................................... 13
MODELO ESTADSTICO.......................................................................................... 73
En SPSS, la mayora de los clculos estadsticos que se pueden realizar estn basados en el proceso de
sintaxis. Para especificar los procesos que se pueden realizar mediante el editor de datos, solo
hablaremos de las Pruebas de Hiptesis, las cuales envuelven adems algunos otros temas estadsticos
como los intervalos de confianza y las medidas de tendencia central..................................................... 73
ESTADSTICA DESCRIPTIVA............................................................................................................ 73
Anlisis de Frecuencias...................................................................................................................... 74
Anlisis Exploratorio ......................................................................................................................... 75
Tablas................................................................................................................................................. 78
Tablas bsicas................................................................................................................................ 78
Tablas de Frecuencias ........................................................................................................................ 80
Medias................................................................................................................................................ 80
Comparacin con una Media Emprica. ............................................................................................. 81
Prueba de Levene de Homogeneidad de Varianzas ........................................................................... 83
Comparacin de muestras dependientes............................................................................................. 84
ANLISIS DE VARIANZA .................................................................................................................. 84
Anova de un factor............................................................................................................................. 84
ESTADSTICA DESCRIPTIVA
En esta parte se pretende hacer un pequeo repaso de algunos
conceptos bsicos desarrollados en los cursos Estadstica I y
II; que son de gran utilidad para la mayor explotacin de la
herramienta en que se constituye SPSS 11.5.
Como base del amplio campo de la Estadstica, se deben
tratar
los
conceptos
ms
bsicos
de
la
estadstica
descriptiva. La estadstica descriptiva una serie de tcnicas
que permite analizar series de datos y trata de extraer
conclusiones sobre el comportamiento de variables, las cuales
pueden ser de dos tipos:
Variables cualitativas o atributos: no se pueden medir
numricamente.
Variables cuantitativas: tienen valor numrico.
Las variables tambin se pueden clasificar en:
Variables unidimensionales: slo recogen informacin
sobre una caracterstica.
Variables bidimensionales: recogen informacin sobre dos
caractersticas de la poblacin.
Variables pluridimensionales: recogen informacin sobre
tres o ms caractersticas.
Por su parte, las variables cuantitativas se pueden
clasificar en discretas y continuas:
Variables Discretas: slo pueden tomar valores enteros.
Por ejemplo, puede ser 1, 2, 3...., etc., pero nunca
podr ser 3,45 por ejemplo.
Variables Continuas: pueden tomar cualquier valor real
dentro de un intervalo. Por ejemplo, cualquier nmero
decimal o fraccionario, como 80,3; 94,57.
Cuando se estudia el comportamiento de una variable hay que
distinguir los siguientes conceptos:
Individuo: cualquier elemento que porte informacin
sobre el fenmeno que se estudia. As, si estudiamos la
altura de los nios de una clase, cada alumno es un
individuo; si estudiamos el precio de la vivienda, cada
vivienda es un individuo.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA
Distribuciones de frecuencias:
Las distribuciones de frecuencias son una herramienta que
facilita el anlisis de un conjunto de datos y variables de
una muestra, que constituyen un conjunto de informacin.
El anlisis de frecuencias emplea dos aspectos, conocidos
como frecuencias absolutas y relativas, las cules son
simples y acumuladas. Para facilitar la comprensin de estos
conceptos, se puede visualizar la siguiente tabla:
Variable Frecuencias absolutas
(Valor) Simple
Acumulada
x
X
x
X1
X2
...
n1
n2
...
Xn-1
nn-1
Xn
Nn
Frecuencias relativas
Simple
Acumulada
x
X
n1
f1 =
n1 + n2
f2 =
...
...
n1 + n2 +...+ fn-1
nn-1
/ n
S n
fn =
n1 / n f1
n2 / n f1 + f2
...
= nn-1 f1
+
f2
+...+fn-1
nn / n S f
Xn =
n1
n2
n3
nn -1
nn
Medidas de dispersin
Estudia la distribucin de los valores de la serie,
analizando si estos se encuentran ms o menos concentrados, o
ms o menos dispersos.
Existen diversas medidas de dispersin, entre las ms
utilizadas estn las siguientes:
Rango: Mide la amplitud de los valores de la muestra y
se calcula por diferencia entre el valor ms elevado y
el valor ms bajo.
Varianza: Mide la distancia existente entre los valores
de la serie y la media. Se calcula como sumatoria de las
diferencias al cuadrado entre cada valor y la media,
multiplicadas por el nmero de veces que se ha repetido
cada valor. La sumatoria obtenido se divide por el
tamao de la muestra.
n
Var ( x ) =
( Xi Xm ) 2
i =1
n 1
10
Probabilidades
La probabilidad es un rea muy importante para el anlisis
estadstico, ya que permite calcular la posibilidad de la
ocurrencia de un evento dado, conocido como experimento. Para
su estudio es necesario el conocimiento de la teora de
conjuntos, ya que algunas tcnicas estn basadas en su
conocimiento. Se han logrado desarrollar algunas tcnicas,
apoyadas esencialmente en la teora matemtica, que permiten
deducir la ocurrencia de esos eventos con mayor facilidad.
Una de las condiciones y de gran importancia para el estudio
probabilstico es que El experimento tiene que ser aleatorio,
es decir, que pueden presentarse diversos resultados, dentro
de un conjunto posible de soluciones, y esto an realizando
el experimento en las mismas condiciones. Otros conceptos
necesarios para la probabilidad son:
Suceso elemental: hace referencia a cada una de las
posibles soluciones que se pueden presentar. Ejemplo: al
lanzar una moneda al aire, los sucesos elementales son
la cara y el sello.
Suceso
compuesto:
es
un
subconjunto
de
sucesos
elementales, por ejemplo; lanzamos un dado y queremos
que salga un nmero par. El suceso "numero par" es un
suceso compuesto, integrado por 3 sucesos elementales:
el 2, el 4 y el 6.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA
11
12
13
14
ESTADSTICA INFERENCIAL
La estadstica inferencial consiste en analizar y deducir
resultados obtenidos mediante la aplicacin de tcnicas
estadsticas. Para simplificar el anlisis se incluyen
ciertos conceptos muy utilizados en esta parte de la
estadstica, como parmetro, estimador y estimacin. Esta
parte se subdivide en distribuciones de muestreo, intervalos
de confianza y pruebas de hiptesis.
Distribuciones de muestreo
Las distribuciones de muestreo son herramientas muy tiles
para el anlisis de un conjunto de datos. Permiten, a partir
de una muestra, obtener una aproximacin a una medida
poblacional. Se pueden elaborar distribuciones para medias
muestrales, proporciones muestrales, varianzas muestrales y
poblacionales.
Para hallar distribuciones de muestreo eficientes existen
tcnicas de muestreo que se utilizan para no tener que
trabajar con toda la poblacin. Estas tcnicas pueden ser:
15
PARAMETRO
CONDICIONES
DISTRIBUCION ASOCIADA
x (media
muestral)
(media
poblacion
al)
Si 2
conocida
Si 2
desconocida
Normal N( ,
s2
(varianza
muestral)
(varianza
poblacion
al)
(n-1)
/n)
grados de libertad.
Chi cuadrado:
libertad
(n-1)
grados
16
p
(proporci
n
muestral)
x1-x2
(diferenc
ia de
medias
muestrale
s)
s21 y s22
(cociente
de
varianzas
muestrale
s)
p1-p2
(diferenc
ia de
proporcio
nes
muestrale
s)
P
(propor.
poblacion
al)
12
(diferenc
ia de
medias
poblacion
al)
2
2
1/ 2
(cociente
de
varianzas
poblacion
ales)
p1-p2
(diferenc
ia de
proporcio
nes
poblacion
ales)
Si 21 y 22
conocida
Si 21 y 22
desconocidas
(*)
Normal N( 1- 2,
( 21/n1)+( 22/n2))
T(n1-n2-2) grados de libertad
D = sup F ( x ) FT ( x )
s
UNIVERSIDAD NACIONAL COLOMBIA
x
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA
17
donde los valores de Fs(x) son las frecuencias relativas acumuladas de los valores.
Intervalos de confianza
Los intervalos de confianza son una herramienta muy til en
la estimacin estadstica, esta puede ser de dos tipos:
Puntual: es aquella que se realiza sobre un parmetro
dado, mediante a transformacin de algunos estimadores.
Para evaluar este tipo de estimacin es necesario
conocer las propiedades deseables de los estimadores,
las cuales son:
a) Insesgamiento: Esta propiedad se puede evaluar de la
siguiente manera, si la esperanza del estimador T es igual al
parmetro, es decir:
E(T)=
Aunque tambin
estimador:
se
puede
realizar
E(T)-
empleando
el
sesgo
del
= sesgo(T)
= E(T- )2
18
d) Consistencia: Un estimador de
estimador T se acerca a 0 cuando
aumenta el tamao de la muestra.
es
consistente
si
el
PARAMETRO
(media
poblacional
)
INTERVALO DE CONFIANZA
(x
Z1- Si 2 conocida
/2( / n))
(x
Z1- Si 2 desconocida
19
s2
(varianza 2
muestral)
(varianza
poblacional
)
p(proporcin
P(proporci
muestral)
n
poblacional
)
x1-x2
1- 2
(diferencia de (diferencia
medias
de
medias
poblacional
muestrales)
)
/2(s/
n))
(((n-1)*s2)/
(p Z1-
/2(
/2);
((n-1)*s2)/
P(1-P)/n))
s21
y
s22 21/ 22
(cociente
de (cociente
varianzas
de
muestrales)
varianzas
poblacional
es)
((s21)/((s22)*F(v1-v2)12
2
/2);((s 1)/((s 2)*F(v1v2) /2)
p1-p2
(diferencia de
proporciones
muestrales)
p1-p2
(diferencia
de
proporcione
s
poblacional
es)
1- /2))
Si 21 y 22
conocida
Si 21 y 22
desconocid
y
as
supuestas
iguales.
Si 21 y 22
desconocid
as
y
supuestas
diferentes
Prueba de Hiptesis.
Una hiptesis estadstica es una asuncin relativa a una o
varias poblaciones, que puede ser cierta o no. Las hiptesis
estadsticas se pueden contrastar con la informacin extrada
de las muestras y tanto si se aceptan como si se rechazan se
puede cometer un error
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA
20
Error
( )
tipo
no Decisin
correcta
H0falsa
I Decisin
correcta
Error
( )
tipo
II
Donde
representa la probabilidad de error tipo I, y se
relaciona con los intervalos de confianza en que representa
un nivel de significanca para la prueba, es decir, la
confiabilidad que se tiene en cuenta par no cometer errores;
y
representa la probabilidad de error tipo II, es decir,
la probabilidad de no rechazar una hiptesis nula que es
falsa. Algunos detalles para tener en cuenta son:
1
y
estn inversamente relacionadas.
2 Slo pueden disminuirse las dos, aumentando n = tamao de
muestra.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA
21
donde
representa
=
<
>
22
Yi = 1 + 2Xi + + kXki + Ui
Donde:
Y: Es la variable endgena o explicada cuyo comportamiento se
quiere analizar.
X : Es cada una de las variables exgenas o explicativas y
que
son
consideradas
como
las
causas
que
crean
transformaciones en la variable endgena.
B : Son los parmetros cuyo valor desconozco y voy a estimar.
A travs de la estimacin de los parmetros obtengo una
cuantificacin de las relaciones existentes entre la Y y cada
una de las X.
U: Perturbacin aleatoria que recoge el efecto conjunto de
otras variables no directamente explicitadas en el modelo,
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA
23
24
25
26
27
Segn
el momento del
distingue entre:
tiempo
al
que
hacen
referencia
se
28
29
30
31
32
1
2
.
N
Datos
Datos
Datos
Datos
Datos
Datos
Datos
Datos
Datos
Datos
Datos
Datos
33
34
www.uesiglo21.edu.ar/pdfs%20dpto%20economia/
microeconomia_Mirta_Santana/UNIDAD06.pdf
VALOR
ESTIMADO
78.17
80.24
74.03
86.31
75.22
65.54
72.43
85.61
60.8
81.88
79.11
59.93
75.27
85.88
76.64
PRECIO DE
VENTA
94.1
101.9
88.65
115.5
87.5
72
91.5
113.9
69.34
96.9
96
61.9
93
109.5
93.75
OBSERVACIN
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
VALOR
ESTIMADO
84.36
72.94
86.5
66.28
79.74
72.78
77.9
74.31
79.85
84.76
81.61
94.92
79.82
77.96
79.07
PRECIO DE
VENTA
106.7
81.5
94.5
69
96.9
86.5
97.9
83
97.3
100.8
97.9
90.5
97
92
95.9
35
Donde
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA
36
Consecuencias:
37
38
Es
un
mtodo
que
minimiza
la
suma
de
cuadrados
y tal que
de
las
estimadores de
sea mnima.
39
40
Los
estimadores
por
mnimos
cuadrados
tienen
ciertas
propiedades interesantes, son funciones lineales, insesgados
y de varianza mnima.
1) Son funciones lineales de las observaciones reales de Y
si
adems
41
Anlogamente
cuadrados
son
42
43
44
donde
45
De
una
manera
As, se pueden
probabilsticas
similar
efectuar
se obtiene:
las
siguientes
especificaciones
46
47
48
estimacin
estar
de
dada
por
que
es
igual
a
y0
que
consideramos
anteriormente. Aunque la prediccin es la misma, el error de
la prediccin no es el mismo, como as tampoco la varianza.
El error de la prediccin en este caso est dado por
idntico al de
varianza est dada por
donde nuevamente t /2 proviene de una distribucin t con (n2) grados de libertad. Obsrvese que el ancho del intervalo
de confianza de E(y/x=x0) es menor que el ancho del intervalo
de prediccin de y0.
Nota: El trmino E(y/x) es una media, un parmetro de una
poblacin de valores y, y y es una variable aleatoria que
oscila alrededor de E(y/x) . El valor medio de y cuando x=x0
es muy diferente de un valor de y escogido al azar del
conjunto de todos los valores y para los cuales x=x0. Siempre
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA
49
como la suma de
50
no
en estas dos
del ajuste en
la recta se
SCE=0, y por
o bien
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA
51
52
53
54
55
y que
En
este
caso
el
estadstico
de
prueba
est
dado
por
56
Adems esto
si no hay
distinto de
Como bajo
normal, el
57
donde
i: indica uno de los valores de la poblacin para
variable
: es la ordenada al origen
j: es la pendiente de la relacin lineal entre y y xj
j: trmino de error
Los supuestos del modelo estn dados por :
cada
58
y no los
59
sea mnima.
El procedimiento es el mismo que el planteado en el caso de
la regresin lineal simple, slo que aqu se obtiene un
conjunto de (k+1) ecuaciones normales, que se resuelven
simultneamente para obtener las (k+1) estimaciones. La
resolucin de estas ecuaciones no es particularmente difcil
pero requiere de muchas operaciones matemticas que no sern
desarrolladas en este mdulo. En la prctica se emplean
programas computacionales para obtener estas estimaciones.
En el caso de dos variables predictoras 2 1 x y x los
estimadores por mnimos cuadrados del modelo de regresin
lineal mltiple
estn dadas por
donde
Ejemplo: Supongamos
que estamos interesados en explicar o
predecir los cambios en los niveles de inversin conjunta de
un grupo de empresas. Las variables a considerar son X1:
ndice de precio de 500 acciones de las empresas, y X2: es la
utilidad retenida de las empresas (en miles de millones).
Estamos interesados en relacionar el ndice de precios de las
500 acciones y el nivel de inversiones de un trimestre con la
inversin en el trimestre siguiente. El modelo que se plantea
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA
60
es
tabla:
INVERSIN
62.3
71.3
70.3
68.5
57.3
68.8
72.2
76
64.3
77.9
INDICE
398.4
452.6
509.8
485.4
445.7
539.8
662.8
620
632.2
703
NIVEL
16.2
17.4
14.8
14.6
8.2
14.9
15.1
14.3
10.9
16
INVERSION
84.3
85.1
90.8
97.9
108.7
122.4
114
123
126.2
137
INDICE
581.8
707.1
776.6
875.3
873.4
943.7
830.6
907.5
905.3
927.4
NIVEL
16.2
16.4
20.4
20.5
26.1
29
24.6
27.8
23.3
21.6
61
62
63
la
x1, x2 y x3
proporcin de la
en forma conjunta
varianza
de
que
son
los
coeficientes
de
determinacin
parciales
que
miden
cuanto
de
la
variabilidad de y
est explicada por x i despus de
incluir x j en la regresin.
o
64
65
Prediccin
Considerando el modelo de regresin que planteamos al inicio
de esta seccin, el inters se centra en predecir el valor de
y0, en base a los valores de x10, x20,........., xk0, y por lo
tanto:
Para
calcular
la
varianza
de
necesitamos
conocer
las
66
67
68
69
70
y por lo
tanto el estadstico
.
Los posibles valores que puede tomar d estn entre 0 y 4,
como se muestra a continuacin:
71
72
ESTADSTICA DESCRIPTIVA
Siempre que vamos a realizar un anlisis estadstico de una
serie de datos, es aconsejable realizar previamente una
Estadstica Descriptiva de las variables, ya sea para obtener
informacin sobre las mismas, o simplemente para chequear
posibles errores. Algunas de las posibilidades para realizar
estadstica descriptiva con SPSS son:
Anlisis de Frecuencias
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA
73
Anlisis Exploratorio
Tablas
Anlisis de Frecuencias
El
procedimiento
Frecuencias
nos
permite
obtener
una
descripcin de la distribucin de una variable con:
Tablas de Frecuencias
Histogramas y Grficos de Barras
Clculo de Percentiles, Medidas de Tendencia Central y
de Dispersin
Para ejecutar tal procedimiento debemos seleccionar en el
men Analizar, la opcin Estadsticos Descriptivos y el botn
Frecuencias, entonces se abre el cuadro de dilogo:
74
Anlisis Exploratorio
El
procedimiento
Explorar
nos
ofrece
las
siguientes
posibilidades:
Representar grficamente los datos,
Examinar visualmente las distribuciones para varios
grupos de datos y
Realizar pruebas Normalidad y Homogeneidad sobre los
mismos.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA
75
76
77
78
79
Tablas de Frecuencias
Medias.
80
81
82
Dij = X ij X
Dij
i
nj
nj
j =1 i =1
( Dij D j ) 2
SCint er =
k
j =1
n j ( D j Dt ) 2
k
j =1
(n j 1) = N k
SCint er
k 1
83
En este procedimiento
comparamos las medias
de
dos
poblaciones
normales
dependientes
(las
mismas
medidas
bajo
circunstancias
distintas
o
datos
relacionados).
El
procedimiento se elige
con el men Analizar,
la opcin Prueba T para muestras relacionadas de la opcin
Comparar Medias.
La ventana que se abre muestra:
Variables relacionadas: este campo recoge los pares de
variables que se van a comparar. Se marcan con el curso
de la lista que muestra el SPSS y se llevan a este campo
pulsando en el botn con un tringulo a la derecha.
Y el botn Opciones: este campo tiene la misma utilidad
que en los procedimientos anteriores.
ANLISIS DE VARIANZA
Anova de un factor.
84
85
Error tpico
PIB
58
Mnimo
3478,00
Mximo
4737955
Media
324751,8
Desv. tp.
781999,6
Asimetra
4,250
Curtosis
20,123
Asimetra
,314
Curtosis
,618
58
59,80
7292450
412543,2
1211752
4,228
19,951
,314
,618
58
-1,44
32,56
15,4764
9,01746
,066
-1,130
,314
,618
58
1461,04
538476,00
83792,75
115147,9
2,008
4,161
,314
,618
58
1048,71
167090,00
44919,44
42615,21
,761
-,411
,314
,618
58
Covarianza
N
Correlacin de Pearson
Sig. (bilateral)
Suma de cuadrados y
productos cruzados
Covarianza
N
6,1E+11
9,2E+11
58
58
,975**
1
,000
.
UNIVERSIDAD
NACIONAL
COLOMBIA
FACULTAD
DE
CIENCIAS
ECONMICAS
5,3E+13
8,4E+13
UNIDAD DE INFORMTICA
9,2E+11
58
1,5E+12
58
86
4000000,00
PIB
3000000,00
2000000,00
1000000,00
un
el
0,00
0,00
2500000,00
5000000,00
Sin
embargo,
revisando
el
grfico, no pareciera que los
datos
formaran
una
lnea
perfecta de correlacin; sin
embargo si se encuentran muy
juntos, lo que indica el valor
de la correlacin de Pearson.
El paso siguiente es plantear
modelo de regresin simple para
Pib explicado en trminos del
7500000,00
gasto pblico.
R
,975a
R cuadrado
,950
R cuadrado
corregida
,949
Error tp. de la
estimacin
176824,53150
Cambio en
R cuadrado
,950
Cambio en F
1058,815
gl1
gl2
1
56
Sig. del
cambio en F
,000
Durbin-W
atson
,770
87
Regresin
Residual
Total
Suma de
cuadrados
3,311E+13
1,751E+12
3,486E+13
gl
1
56
57
Media
cuadrtica
3,31E+13
3,13E+10
F
1058,815
Sig.
,000a
Coeficientes
estandarizad
os
Beta
,975
t
2,660
32,539
88
Variables
introducidas
a
M, I, G, X
Variables
eliminadas
.
Mtodo
Introducir
Modelo
1
Estadsticos de cambio
R cuadrado Error tp. de la Cambio en
Sig. del
Durbin-W
R
R cuadrado corregida
estimacin R cuadrado Cambio en F
gl1
gl2
cambio en F atson
,983a
,965
,963150644,74598
,965
370,740
4
53
,000
1,285
Regresin
Residual
Total
Suma de
cuadrados
3,365E+13
1,203E+12
3,486E+13
gl
4
53
57
Media
cuadrtica
8,41E+12
2,27E+10
F
370,740
Sig.
,000a
89
Coeficientesa
Coeficientes no
estandarizados
Modelo
1
(Constante)
G
I
X
M
B
20248,397
,623
-225,113
1,094
-,902
Error tp.
41800,143
,026
2835,104
,321
1,162
Coeficientes
estandarizad
os
Beta
,965
-,003
,161
-,049
t
,484
24,382
-,079
3,414
-,777
Sig.
,630
,000
,937
,001
,441
90
Variables introducidas/eliminadasb
Modelo
1
2
Variables
introducidas
a
M, I, G, X
Variables
eliminadas
.
Mtodo
Introducir
Hacia
atrs
(criterio:
Prob. de
F para
eliminar
>= ,100).
Hacia
atrs
(criterio:
Prob. de
F para
eliminar
>= ,100).
atpicos.
En el siguiente paso, SPSS me calcula
uno de los escenarios del modelo.
d
Resumen del modelo
Modelo
1
2
3
R
R cuadrado
,983a
,965
,983b
,965
,982c
,965
Estadsticos de cambio
R cuadrado Error tp. de la Cambio en
Sig. del
Durbin-W
corregida
estimacin R cuadrado Cambio en F
gl1
gl2
cambio en F atson
,963150644,74598
,965
370,740
4
53
,000
,964149252,24548
,000
,006
1
53
,937
,964148865,24719
,000
,715
1
54
,401
1,199
91
Coeficientes no
estandarizados
Modelo
1
(Constante)
G
I
X
M
(Constante)
G
X
M
(Constante)
G
X
B
20248,397
,623
-225,113
1,094
-,902
18082,689
,622
1,093
-,930
1488,385
,607
,871
Error tp.
41800,143
,026
2835,104
,321
1,162
31382,310
,025
,317
1,099
24427,223
,017
,178
Beta
t
,965
-,003
,161
-,049
,965
,161
-,051
,940
,128
,484
24,382
-,079
3,414
-,777
,576
24,610
3,445
-,846
,061
35,899
4,900
Sig.
,630
,000
,937
,001
,441
,567
,000
,001
,401
,952
,000
,000
Modelo
2
3
I
I
M
Beta dentro
-,003a
-,010b
-,051b
t
-,079
-,326
-,846
Sig.
,937
,746
,401
Correlacin
parcial
-,011
-,044
-,114
Estadsticos
de
colinealidad
Tolerancia
,609
,668
,178
Caso 2
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA
92
Current salary
Age of employee
Work experience
Beginning salary
Educational level
N vlido (segn lista)
N
Estadstico
474
474
474
474
474
474
Mnimo
Estadstico
6300
23,00
,00
3600
8
Mximo
Estadstico
54000
64,50
39,67
31992
21
Media
Estadstico
13767,83
37,1861
7,9886
6806,43
13,49
Desv. tp.
Estadstico
6830,265
11,78724
8,71541
3148,255
2,885
Asimetra
Estadstico Error tpico
2,125
,112
,864
,112
1,510
,112
2,853
,112
-,114
,112
Curtosis
Estadstico Error tpico
5,378
,224
-,562
,224
1,696
,224
12,390
,224
-,265
,224
93
incluidas
y
el
significativas.
segundo,
sin
las
variables
menos
R
,896a
,895b
R cuadrado
,803
,802
R cuadrado
corregida
,801
,800
Error tp. de la
estimacin
3047,415
3052,771
Cambio en
R cuadrado
,803
-,001
Cambio en F
476,786
2,653
gl1
4
1
gl2
469
469
Sig. del
cambio en F
,000
,104
Durbin-W
atson
a. Variables predictoras: (Constante), Work experience, Beginning salary, Educational level, Age of employee
b. Variables predictoras: (Constante), Work experience, Beginning salary, Educational level
c. Variable dependiente: Current salary
Regresin
Residual
Total
Regresin
Residual
Total
Suma de
cuadrados
1,771E+10
4,355E+09
2,207E+10
1,769E+10
4,380E+09
2,207E+10
gl
4
469
473
3
470
473
Media
cuadrtica
4,43E+09
9286737,8
5,90E+09
9319408,2
F
476,786
Sig.
,000a
632,605
,000b
94
1,994
Coeficientes no
estandarizados
Coeficientes
estandarizad
os
Modelo
B
Error tp.
1
(Constante)
-363,338 1026,807
Beginning salary 1,750
,060
Educational level282,162
67,774
Age of employee-32,901
20,198
Work experience-45,555
27,450
2
(Constante) -1464,582 774,204
Beginning salary 1,749
,060
Educational level294,379
67,476
Work experience-80,304
17,305
Beta
,807
,119
-,057
-,058
,806
,124
-,102
t
-,354
29,270
4,163
-1,629
-1,660
-1,892
29,198
4,363
-4,641
Modelo
2
Beta dentro
-,057a
Age of employee
t
-1,629
Sig.
,104
Correlacin
parcial
-,075
Estadsticos
de
colinealidad
Tolerancia
,346
0
,3
00
6,
00
5,
00
4,
00
3,
00
2,
00
1,
00
0, 0
,0
-1 0
,0
-2 0
,0
-3 0
,0
-4
Frecuencia
Prob acum esperada
Histograma
0,0Regresin
0,0
Residuo tipificado
,3
,5
,8
1,0
95
30000
20000
20000
10000
10000
Current salary
Current salary
0
-10000
-10000
10000
20000
30000
-10000
-20000
-20
-10
10
20
30
40
Work experience
Beginning salary
10000
Current salary
-10000
-20000
-10
-8
-6
-4
-2
Educational level
96
Correlaciones
Current salary
Beginning salary
Work experience
Educational level
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Current salary
1
.
474
,880**
,000
474
-,097*
,034
474
,661**
,000
474
Beginning
Work
Educational
salary
experience
level
,880**
-,097*
,661**
,000
,034
,000
474
474
474
1
,045
,633**
.
,327
,000
474
474
474
,045
1
-,252**
,327
.
,000
474
474
474
,633**
-,252**
1
,000
,000
.
474
474
474
El coeficiente de correlacin de Pearson se encuentra entre 1 y 1 como ya lo hemos visto. En este caso y como tambin se
puede apreciar en la grfica, el mayor coeficiente de
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA
97
Correlacin en SPSS:
En el men Analizar, Correlaciones, Divariadas, se encuentra
esta opcin, la cual me despliega un cuadro de dilogo en el
que se incluyen las variables.
Regresin:
Para
realizar
un
anlisis de regresin,
es
necesario
haber
establecido
la
variable independiente
en
funcin
de
las
independientes.
Despus, vamos al men
Analizar, Regresin, Lineal
principal de esta opcin:
desplegamos
la
ventana
99
En esta casilla
se incluye la
Aqu se incluyen
MTODO
INTRODUCIR
PASOS SUCESIVOS
ELIMINAR
HACIA ATRS
EXPLICACIN
Procedimiento
para
la
seleccin
de
variables en las que todas las variables se
introducen en un primer paso.
En cada paso se introduce la variable
independiente que no est ya incluida y que
tenga la probabilidad para F ms pequea,
si esa probabilidad es suficientemente
pequea. Las variables ya introducidas en
la ecuacin de regresin se eliminan de
ella si su probabilidad para F llega a ser
suficientemente grande. El mtodo culmina
cuando ya no hay ms variables candidatas a
ser incluidas o eliminadas.
Procedimiento
para
la
seleccin
de
variables en la que todas las variables de
un bloque se eliminan en un solo paso.
Procedimiento de seleccin de variables en
el que se introducen todas las variables en
la ecuacin y despus se van excluyendo una
tras otra. Aquella variable que tenga la
menor correlacin parcial con la variable
dependiente ser la primera considerada
para la exclusin. Si satisface el criterio
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA
100
HACIA DELANTE
Dando clic en la
opcin GRFICOS se
despliega
esta
ventana,
la cual:
Igualmente
aqu
podemos
generar
histogramas, grfico de probabilidad
normal y los grficos parciales.
Seleccionando
la
opcin
GUARDAR
podemos exportar valores relacionados
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA
101
El estadstico de
Durbin-Watson
sobre los
residuos, me
permite
El
botn
ESTADSTICOS
me
arroja
a
la
ventana
que
se
encuentra
a
la
izquierda;
en
ella,
podemos
seleccionar
los
estadsticos para
la
regresin
entre
diferentes
opciones
y
dependiendo
de
las
necesidades
del investigador.
102
103
k
A
104
105
Error
estndar:
Estadstico
que
indica
el
grado
de
incertidumbre con el que una estimacin obtenida en una
muestra se acerca al verdadero valor en la poblacin.
Estadstica: Es una ciencia de las matemticas encargada del
estudio del comportamiento de una poblacin mediante un
anlisis cuyo propsito es hacer inferencias a partir de un
subconjunto de datos, llamado muestra, tomados de ella.
Estadstica inferencial o inductiva: Sirve extrapolar los
resultados obtenidos en el anlisis de los datos y a partir
de ello predecir acerca de la poblacin, con un margen de
confianza conocido. Se apoya fuertemente mediante el clculo
de probabilidades.
Estadstica descriptiva o deductiva: Se construye a partir de
los datos y la inferencia sobre la poblacin no se puede
realizar, al menos con una confianza determinada, la
representacin de la informacin obtenida de los datos se
representa mediante el uso de unos cuantos parmetros,
tablas y algunas graficas planteadas de tal forma que den
importancia los mismos datos a travs de parmetros que
caractericen la distribucin.
Estadstico: Es el trmino que se utiliza para designar al
profesional que se dedica al anlisis de la informacin
estadstica, al que en ocasiones tambin se le conoce como
estadgrafo.
Estadgrafo: Es el trmino utilizado para designar a la
persona dedicada a las tareas propias de la estadstica,
aunque en ocasiones tambin es frecuente que se utilice para
designar
a
la
variable
que
define
una
distribucin
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA
106
el trmino
estadstico
factores de
sexo.
107
Es el cociente Fi /N .
108
para
indicar
la
prediccin
109
xi
n
Polgono
de
frecuencias:
Representaciones
grficas
alternativas
al
histograma
de
frecuencias.
Estos
se
construyen a partir de los puntos medios de cada clase. La
utilizacin de los puntos medios o marcas de clase son
llevados al escenario grfico mediante la utilizacin de los
polgonos de frecuencias. Se construye uniendo los puntos
medios de cada clase localizados en las tapas superiores de
los rectngulos utilizados en los histogramas de las
grficas. Su utilidad se hace necesaria cuando desean
destacarse las variables de tendencia central, como son
media, modas y medianas.
Pictogramas: El pictograma consiste en la utilizacin de
smbolos para representar un conjunto de datos.
110
111
112
113
114
www.spss.com
www.statsofting.com
www.uesiglo21.edu.ar/pdfs%20dpto%20economia/
microeconomia_Mirta_Santana/UNIDAD06.pdf
www.uesiglo21.edu.ar/pdfs%20dpto%20economia/
microeconomia_Mirta_Santana/UNIDAD07.pdf
www.etsii.upm.es/ingor/estadistica/
docencia/apuntes/tema11.pdf
www.monografas.com
cca.uprm.edu/agronomia/profesores/base/rmacchiavelli/
extra/agro6600/conferencia22.htm
www.economia.ufm.edu.gt/catedraticos/ jhcole/regresion.pdf
115