Vous êtes sur la page 1sur 26

ESTADÍSTICA DESCRIPTIVA CON SPSS

(2602) Estadística Económica


Joaquín Alegre y Magdalena Cladera

SPSS es una aplicación para el análisis estadístico. En este material se


presentan los procedimientos básicos de este programa para la gestión y el
análisis descriptivo de datos. Concretamente, los contenidos son los siguientes:

1. Entorno de trabajo .........................................................................1


2. Etiquetado de las variables y los valores .......................................4
3. Selección de casos ........................................................................7
4. Transformación de las variables ....................................................9
5. Análisis descriptivo de variables cualitativas................................12
6. Análisis descriptivo de variables cuantitativas .............................15
6.1. Distribución de frecuencias e histograma .............................15
6.2. Estadísticos descriptivos ......................................................15
7. Asociación de variables cualitativas.............................................21
8. Correlación...................................................................................24

1. ENTORNO DE TRABAJO
Tipos de archivos
- Archivos de datos. Extensión .sav.
- Resultados: Extensión .spo.
- Sintaxis: Extensión .sps.
Importación de datos desde Excel
Es suficiente con abrir el archivo desde SPSS. Si el archivo tiene varias hojas
debe indicarse cual es la que quiere utilizarse, así como el rango de celdas en
el que se encuentran los datos que desean importarse, si éste es distinto al que
aparece por defecto. Una vez abierto, se guarda con extensión .sav.
Ejemplo 1. En la Figura 1, Figura 2 y Figura 3 se presentan los pasos a seguir
para abrir el archivo EDT02.xls desde SPSS.

1
Figura 1

Figura 2

2
Figura 3

Exportación de datos a Excel


Es suficiente con, desde SPSS, guardar el archivo que se desea exportar con
extensión *.xls.
Ejemplo 2. En la Figura 4 y la Figura 5 se presentan los pasos a seguir para
guardar el archivo EDT02.sav como archivo de Excel.

Figura 4

3
Figura 5

2. ETIQUETADO DE LAS VARIABLES Y LOS VALORES


Cada una de las variables de una base de datos de SPSS tiene un nombre que
puede tener hasta ocho caracteres. Un nombre tan corto puede ser poco
informativo, de manera que resulta conveniente especificar, además, una
etiqueta para la variable, es decir, una definición que permita identificar
fácilmente su contenido.
Por otra parte, también es de gran utilidad a la hora de interpretar los
resultados de los análisis estadísticos, tener etiquetados los valores de las
variables cualitativas, es decir, asociar a cada uno de los valores una definición
que exprese su significado.
Vista de datos y Vista de variables
En un archivo de datos de SPSS hay dos pestañas:
- Vista de datos (Figura 6), en la que se tienen los valores de las variables
para cada observación.
- Vista de variables (Figura 7), en la que se presenta la información sobre
diversas características de las variables (nombre, tipo, anchura,
decimales, etiqueta, valores perdidos, columnas, alineación, medida).

4
Figura 6

Figura 7

El etiquetado de las variables y los valores se lleva a cabo desde la pestaña


Vista de variables, tal y como se explicará a continuación.

5
Etiquetado de las variables
El etiquetado de una variable consiste en especificar una definición, lo más
breve y clara posible, que permita identificar con claridad el significado de dicha
variable.
Ejemplo 3. En la Figura 8 se muestra como la variable días se ha etiquetado
con la expresión Días de estancia en las Islas.

Figura 8

Haciendo clic se puede


modificar el nombre de
la variable Haciendo clic se puede
escribir la etiqueta de la
variable

Etiquetado de los valores


Las categorías de una variable cualitativa suelen representarse por valores
numéricos. El etiquetado de los valores consiste en especificar para cada uno
de ellos una breve definición que permita identificar cual es la categoría de la
variable que representan.
Ejemplo 4. En la Figura 9 se muestra el procedimiento de etiquetado de los
valores de la variable edad, para indicar que el valor 1 se corresponde con
Menores de 30 años, el valor 2 con Entre 30 y 45 años, etc.

6
Figura 9

3. SELECCIÓN DE CASOS
En ocasiones interesa trabajar sólo con una parte de los datos, con aquellos
que cumplen determinadas características, para lo que es útil la opción
Seleccionar casos del menú Datos.
Ejemplo 5. De la Figura 10 a la Figura 12 se muestra como se seccionarían las
observaciones correspondientes a los turistas menores de 30 años.

Figura 10

7
Figura 11

En este cuadro se
escribe la condición
que deben cumplir
los datos que se
van a seleccionar

Figura 12

!!!
Si se activa esta opción
se perderán de forma
irrecuperable todas las
observaciones que no se
seleccionen

Para volver a trabajar con todas las observaciones se activa la opción Todos
los casos en el cuadro de diálogo de la Figura 13.

8
Figura 13

4. TRANSFORMACIÓN DE LAS VARIABLES


Las opciones Calcular y Recodificar del menú Transformar permiten realizar
transformaciones en las variables o crear nuevas variables a partir de las ya
existentes en la base de datos.
Ejemplo 6. En la Figura 14 se ilustra como utilizar la opción Calcular para
obtener una variable que contenga el gasto en euros (geuros) a partir de la
variable de gasto en pesetas (gtotal).

9
Figura 14

Expresión utilizada
para el cálculo de
la nueva variable

Nombre de la
nueva variable

La opción Recodificar permite, por ejemplo, agrupar un conjunto de valores de


una variable categórica, agrupar en intervalos una variable cuantitativa,
cambiar la codificación de los valores, etc.
Existen dos opciones:
- Recodificar en la misma variable. Se substituye la variable original por
la/s variable/s recodificada/s.
- Recodificar en distintas variables. Se mantiene la variable original y se
añade/n la/s variable/s con la nueva codificación.
Ejemplo 7. De la Figura 15 a la Figura 17 se muestra el procedimiento a seguir
para recodificar la variable nacionalidad, de manera que los valores superiores
a 4 queden recogidos en una única categoría representada por el valor 5. En
primer lugar se selecciona Recodificar Î En distintas variables del menú
Transformar.

10
Figura 15

2
1

Nombre y
etiqueta de la
nueva variable

Figura 16

Tomarán valor 5
en la variable
recodificada

Los valores 1
superiores a 4 en
la variable original

2
Figura 17

Se quedan igual
en la variable
recodificada

El resto de valores
(1 a 4) de la
variable original

11
Si en algún momento se quiere un resumen de las variables contenidas en una
base de datos de SPSS, sus características y su etiquetado, se puede obtener
seleccionando la opción Mostrar información de datos del menú Archivo, o bien
seleccionando la opción Información del archivo del menú Utilidades.
Por otra parte, para ver en la base de datos las etiquetas de los valores, se
tiene que seleccionar la opción Etiquetas de valor en el menú Ver.

5. ANÁLISIS DESCRIPTIVO DE VARIABLES CUALITATIVAS


La opción Frecuencias del menú Analizar Î Estadísticos Descriptivos permite
obtener distribuciones de frecuencias, representaciones gráficas de dichas
distribuciones, y los estadísticos descriptivos más utilizados.
Ejemplo 8. De la Figura 18 a la Figura 22 se expone el procedimiento a seguir
para realizar un análisis descriptivo básico de la variable edad. Los resultados
que se obtienen son los de la Figura 23.

Figura 18

12
Figura 19

Figura 20

Figura 21

13
Figura 22

Figura 23

Estadísticos

EDAD
N Válidos 575
Perdidos 3
Mediana 2,00
Moda 1

EDAD

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos MENOS DE 30 AÑOS 263 45,5 45,7 45,7
ENTRE 30 Y 45 204 35,3 35,5 81,2
ENTRE 45 y 60 87 15,1 15,1 96,3
MÁS DE 60 AÑOS 21 3,6 3,7 100,0
Total 575 99,5 100,0
Perdidos Sistema 3 ,5
Total 578 100,0

EDAD

Perdido
MÁS DE 60 AÑOS

ENTRE 45 y 60

MENOS DE 30 AÑOS

ENTRE 30 Y 45

14
6. ANÁLISIS DESCRIPTIVO DE VARIABLES CUANTITATIVAS

6.1. Distribución de frecuencias e histograma


Para obtener la distribución de frecuencias de una variable cuantitativa es
conveniente agrupar los valores en intervalos. Posteriormente puede obtenerse
la distribución de frecuencias y su representación gráfica de la forma descrita
en el epígrafe anterior.
Otra forma de representar gráficamente la distribución de frecuencias de una
variable cuantitativa es mediante un histograma. Para obtenerlo puede
utilizarse una de estas dos alternativas:
- Se sigue el procedimiento descrito en el epígrafe 5, y en el cuadro de
diálogo de la Figura 21 se activa la opción Histogramas.
- Se selecciona la opción Histograma del menú Gráficos.
En ambos casos se obtiene el mismo resultado.
Ejemplo 9. En la Figura 24 se tiene el histograma del gasto total.

Figura 24

GASTO TOTAL PC Y DIA


60

50

40

30

20
Frecuencia

10 Desv. típ. = 4720,52


Media = 10353,9
0 N = 535,00
10
30 0,0
50 0,0
70 0,0
90 0,0
11 0,0
13 00
15 00
17 00
19 00
21 00
23 0
25 00
0
0
0
0
0
0
0 ,0
0 ,0
0 ,0
0 ,0
00 , 0
0 ,0
00 , 0
0,
0

GASTO TOTAL PC Y DIA

6.2. Estadísticos descriptivos


El procedimiento expuesto en el epígrafe 5 también permite obtener los
principales estadísticos descriptivos de una variable cuantitativa. Los
estadísticos que interese obtener se seleccionan en el cuadro de diálogo de la
Figura 19.
Alternativamente, se puede utilizar la opción Estadísticos descriptivos Î
Descriptivos del menú Analizar.

15
Ejemplo 10. Para obtener un resumen de los principales estadísticos
descriptivos de la variable días puede procederse de la forma que se muestra
en la Figura 25 y la Figura 26. Los resultados que se obtienen son los de la
Figura 27.

Figura 25

Figura 26

16
Figura 27

Estadísticos descriptivos

Estadístico Error típico


DÍAS DE ESTANCIA N 578
Rango 28
Mínimo 2
Máximo 30
Media 10,19 ,17
Desv. típ. 3,983
Varianza 15,862
Asimetría ,882 ,102
Curtosis 1,892 ,203
N válido (según lista) N 578

Otra alternativa, algo más completa que las anteriores, consiste en seleccionar
la opción Estadísticos descriptivos Î Explorar del menú Analizar. Esta opción
permite obtener un resumen de los principales estadísticos descriptivos de
posición central y de dispersión, percentiles, valores extremos, y
representaciones gráficas como el histograma o el diagrama de caja.
Ejemplo 11. De la Figura 28 a la Figura 31 se muestra la utilización de la
opción Explorar para obtener los principales instrumentos que permiten realizar
un análisis descriptivo de la variable días. Los resultados que se obtienen son
los de la Figura 32.

Figura 28

17
Figura 29

Figura 30

Figura 31

18
Figura 32

Explorar
Resumen del procesamiento de los casos

Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
DÍAS DE ESTANCIA 578 100,0% 0 ,0% 578 100,0%

Descriptivos

Estadístico Error típ.


DÍAS DE ESTANCIA Media 10,19 ,166
Intervalo de confianza Límite inferior 9,86
para la media al 95% Límite superior
10,51

Media recortada al 5% 10,07


Mediana 8,00
Varianza 15,862
Desv. típ. 3,983
Mínimo 2
Máximo 30
Rango 28
Amplitud intercuartil 7,00
Asimetría ,882 ,102
Curtosis 1,892 ,203

Percentiles
Promedio DÍAS DE ESTANCIA 5 6,00
ponderado(definición 1) 10 7,00
25 7,00
50 8,00
75 14,00
90 14,00
95 14,00
Bisagras de Tukey DÍAS DE ESTANCIA 25 7,00
50 8,00
75 14,00

19
Valores extremos

Número
del caso Valor
DÍAS DE ESTANCIA Mayores 1 307 30
2 331 30
3 340 30
4 43 21
5 102 21a
Menores 1 360 2
2 111 2
3 110 2
4 550 3
5 540 3b
a. En la tabla de valores extremos mayores sólo se muestra
una lista parcial de los casos con el valor 21.
b. En la tabla de valores extremos menores sólo se muestra
una lista parcial de los casos con el valor 3.

DÍAS DE ESTANCIA
Histograma
300

200

100
Frecuencia

Desv. típ. = 3,98


Media = 10,2
0 N = 578,00
2,5 7,5 12,5 17,5 22,5 27,5
5,0 10,0 15,0 20,0 25,0 30,0

DÍAS DE ESTANCIA

40

30 307
331
340

20

10

-10
N= 578

DÍAS DE ESTANCIA

20
7. ASOCIACIÓN DE VARIABLES CUALITATIVAS
La distribución de frecuencias conjunta de dos variables cualitativas, así como
las medidas estadísticas que permiten analizar su asociación, tanto si se trata
de variables nominales como de variables ordinales, se pueden obtener
mediante la opción Descriptivos Î Tablas de contingencia del menú Analizar.
Ejemplo 12. El procedimiento a seguir para el análisis de la asociación entre la
edad y la intención de retorno se muestra en la Figura 33 a la Figura 36. Los
resultados que se obtendrían son los presentados en la Figura 37.

Figura 33

21
Figura 34

Figura 35

22
Figura 36

Figura 37

Resumen del procesamiento de los casos

Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
PIENSA VOLVER A
PASAR LAS
543 93,9% 35 6,1% 578 100,0%
VACACIONES EN
NUESTRA ISLA * EDAD

Tabla de contingencia PIENSA VOLVER A PASAR LAS VACACIONES EN NUESTRA ISLA * EDAD

EDAD
MENOS DE ENTRE ENTRE MÁS DE
30 AÑOS 30 Y 45 45 y 60 60 AÑOS Total
PIENSA VOLVER A SI Recuento 205 158 73 17 453
PASAR LAS Frecuencia esperada 208,6 156,8 70,9 16,7 453,0
VACACIONES EN % de PIENSA
NUESTRA ISLA VOLVER A PASAR
45,3% 34,9% 16,1% 3,8% 100,0%
LAS VACACIONES
EN NUESTRA ISLA
% de EDAD 82,0% 84,0% 85,9% 85,0% 83,4%
% del total 37,8% 29,1% 13,4% 3,1% 83,4%
NO Recuento 45 30 12 3 90
Frecuencia esperada 41,4 31,2 14,1 3,3 90,0
% de PIENSA
VOLVER A PASAR
50,0% 33,3% 13,3% 3,3% 100,0%
LAS VACACIONES
EN NUESTRA ISLA
% de EDAD 18,0% 16,0% 14,1% 15,0% 16,6%
% del total 8,3% 5,5% 2,2% ,6% 16,6%
Total Recuento 250 188 85 20 543
Frecuencia esperada 250,0 188,0 85,0 20,0 543,0
% de PIENSA
VOLVER A PASAR
46,0% 34,6% 15,7% 3,7% 100,0%
LAS VACACIONES
EN NUESTRA ISLA
% de EDAD 100,0% 100,0% 100,0% 100,0% 100,0%
% del total 46,0% 34,6% 15,7% 3,7% 100,0%

23
Pruebas de chi-cuadrado

Sig. asintótica
Valor gl (bilateral)
Chi-cuadrado de Pearson ,826a 3 ,843
Razón de verosimilitud ,835 3 ,841
Asociación lineal por
,738 1 ,390
lineal
N de casos válidos 543
a. 1 casillas (12,5%) tienen una frecuencia esperada inferior a 5.
La frecuencia mínima esperada es 3,31.

Medidas direccionales

Error típ. Sig.


a
Valor asint. T aproximada aproximada
Nominal Lambda Simétrica ,000 ,000 .b .b
por nominal PIENSA VOLVER A
PASAR LAS b b
VACACIONES EN ,000 ,000 . .
NUESTRA ISLA
dependiente
EDAD dependiente ,000 ,000 .b .b
Tau de Goodman PIENSA VOLVER A
y Kruskal PASAR LAS c
VACACIONES EN ,002 ,003 ,844
NUESTRA ISLA
dependiente
EDAD dependiente ,001 ,002 ,765c
a. Asumiendo la hipótesis alternativa.
b. No se puede efectuar el cálculo porque el error típico asintótico es igual a cero.
c. Basado en la aproximación chi-cuadrado.

Medidas simétricas

Sig.
Valor aproximada
Nominal por Coeficiente de
,039 ,843
nominal contingencia
N de casos válidos 543
a. Asumiendo la hipótesis alternativa.
b. Empleando el error típico asintótico basado en la hipótesis
nula.

8. CORRELACIÓN
Para obtener una matriz de correlaciones entre dos o más variables se dispone
de la opción Correlaciones Î Bivariadas del menú Analizar.
Ejemplo 13. En la Figura 38 se tiene el cuadro de diálogo utilizado para
solicitar la matriz de correlaciones de las variables de satisfacción, y en la
Figura 39 se tienen los resultados obtenidos.

24
Figura 38

25
Figura 39

Correlaciones

NIVEL DE NIVEL DE
SATISFACCIÓ SATISFACCIÓ NIVEL DE NIVEL DE
NIVEL DE NIVEL DE N CALIDAD N CALIDAD SATISFACCI SATISFACCI
SATISFACCI SATISFACCI ALOJAMIENT MEDIOAMBIE ÓN PRECIO ÓN PRECIO
ÓN GLOBAL ÓN PLAYAS O NTE COMIDAS OCIO
NIVEL DE SATISFACCIÓN Correlación de Pearson 1 ,417** ,481** ,472** ,314** ,342**
GLOBAL Sig. (bilateral) . ,000 ,000 ,000 ,000 ,000
N 531 509 491 491 498 458
NIVEL DE SATISFACCIÓN Correlación de Pearson ,417** 1 ,273** ,390** ,199** ,207**
PLAYAS Sig. (bilateral) ,000 . ,000 ,000 ,000 ,000
N 509 533 504 506 513 476
NIVEL DE SATISFACCIÓN Correlación de Pearson ,481** ,273** 1 ,520** ,223** ,214**
CALIDAD ALOJAMIENTO Sig. (bilateral) ,000 ,000 . ,000 ,000 ,000
N
491 504 514 500 498 464

NIVEL DE SATISFACCIÓN Correlación de Pearson ,472** ,390** ,520** 1 ,280** ,297**


CALIDAD Sig. (bilateral) ,000 ,000 ,000 . ,000 ,000
MEDIOAMBIENTE N 491 506 500 514 499 467
NIVEL DE SATISFACCIÓN Correlación de Pearson ,314** ,199** ,223** ,280** 1 ,761**
PRECIO COMIDAS Sig. (bilateral) ,000 ,000 ,000 ,000 . ,000
N 498 513 498 499 522 474
NIVEL DE SATISFACCIÓN Correlación de Pearson ,342** ,207** ,214** ,297** ,761** 1
PRECIO OCIO Sig. (bilateral) ,000 ,000 ,000 ,000 ,000 .
N 458 476 464 467 474 481
**. La correlación es significativa al nivel 0,01 (bilateral).

26

Vous aimerez peut-être aussi