Académique Documents
Professionnel Documents
Culture Documents
El SPSS (Statistical Pakage for Sciens Socials) es un software que inicialmente fue
concebido para aplicaciones en las ciencias sociales, aunque hoy en da, se usa casi en todos
los escenarios cientficos en los que se necesita algn tratamiento estadstico de los datos.
Este programa resulta ser una herramienta fundamental para el investigador, sobre todo
cuando la cantidad de datos por procesar es numerosa o cuando las tcnicas son
sofisticadas.
Este curso est orientado a ilustrar el manejo bsico del sistema, incluyendo la
formacin la base de datos, el manejo de archivos, la generacin de reportes en tablas y
grficos, el clculo de indicadores estadsticos de resumen y la contrastacin de hiptesis
estadsticas.
2
1. COMO INICIAR EL PROGRAMA SPSS VERSION 19
Para iniciar el programa se hace clic en el acceso directo de SPSS, inmediatamente abre
la ventana que se muestra en la figura 1.
3
Fila de variables
Columna
Casos / Individuos
4
2. USO DEL EDITOR DE DATOS
En la primera celda que lleva la palabra Nombre se ingresan los nombres de las variables del
instrumento.
CLIC
En la segunda celda se hace clic en Tipo, inmediatamente se despliega el siguiente dialogo mostrado
en la figura 5:
5
El programa elige por defecto el Tipo numrico, lo que no significa necesariamente que la variable
sea numrica, slo indica la forma de ingreso del cdigo. En este mismo dialogo se selecciona de una
vez lo correspondiente a la tercera columna seleccionando Anchura que indica la amplitud de
caracteres, en la columna de Decimales se coloca 0, cuando sea necesario.
6
Figura 7: Despliegue de la celda de medida
Es muy importante no errar en ste punto, pues muchos procedimientos estadsti cos
dependen de ello.
Se hace clic en vista de datos, luego se comienzan a colocar los datos, como se muestra
en la figura 9.
7
cdigos en variables cualitativas.
Todos los anlisis estadsticos se encuentran en la opcin Analizar del men principal Se
hace clic en Analizar, desplegndose el dialogo, mostrado en la figura 10, se selecciona
Estadstico descriptivo, desplegndose otro dialogo y en este se escoge descriptivo.
8
Figura 10: Dialogo del Descriptivo
As queda el cambio una vez cliqueado sobre la flecha
9
Figura 12: Dialogo del Descriptivo
Tambin se le puede hacer clic en Frecuencia, desplegndose el dialogo mostrado en la figura 13.
10
Figura 14: Dialogo de Frecuencias
11
Figura 16: Archivo demo.sav en el Editor de datos
El archivo de datos aparece en el Editor. En l, si sita el cursor sobre un nombre de variable (las
cabeceras de columnas), aparecer una etiqueta de variable ms descriptiva (si se ha definido
etiqueta para esa variable).
Por defecto, aparecen los valores de los datos reales. Para visualizar etiquetas:
Ahora aparecern las etiquetas de valor descriptivas para facilitar la interpretacin de las
respuestas.
12
Figura 18: Etiquetas de valor en el Editor de datos
En lugar de escribir todos los datos directamente en el Editor de datos, puede leer datos
desde aplicaciones como Microsoft Excel. Tambin puede leer los encabezados de las columnas
como nombres de variables.
Abra demo.xls.
Aparecer el cuadro de dilogo Apertura de origen de datos de Excel, que permite especificar si
se incluyen los nombres de las variables en la hoja de clculo, as como las casillas que se desea
importar.
13
Figura 19: Cuadro de dilogo Apertura de origen de datos de Excel
Asegrese de que est seleccionada la opcin Leer nombre de variables de la primera fila
de datos.
Si los encabezados de las columnas no cumplen las normas de denominacin de variables de IBM
SPSS Statistics, se convertirn en nombres de variables vlidos y los encabezados originales de las
columnas se guardarn como etiquetas de variable. Si desea importar slo una parte de la hoja de
clculo, especifique el rango de casillas que se va a importar en el campo de texto Rango.
Los datos aparecern en el Editor de datos, con los encabezados de las columnas utilizados como
nombres de variables. Al no poder contener espacios los nombres de variables, se han quitado los
espacios de los encabezados de las columnas originales.
Por ejemplo, el Estado civil del archivo de Excel se ha convertido en la variable Estado civil. El
encabezado de la columna original se conservar como etiqueta de la variable.
14
Figura 20: Datos de Excel importados
En muchos anlisis es necesario calcular nuevas variables a partir de las existentes en la base
de datos o recodificarlas para cumplir con ciertas exigencias de la investigacin. Puede realizar
transformaciones de los datos de todo tipo, desde tareas sencillas, como la agrupacin de categoras
para su anlisis posterior, hasta otras ms avanzadas, como la creacin de nuevas variables basadas en
ecuaciones complejas e instrucciones condicionales.
Clculo de variables
Utilice el cuadro de dilogo Calcular para calcular los valores de una variable basndose en
transformaciones numricas de otras variables.
Puede crear nuevas variables o bien remplazar los valores de las variables
existentes. Para las nuevas variables, tambin se puede especificar el tipo y la
etiqueta de variable.
15
Puede utilizar una gran variedad de funciones preincorporadas, incluyendo
funciones aritmticas, funciones estadsticas, funciones de distribucin y
funciones de cadena.
Escriba el nombre de una sola variable de destino. Puede ser una variable existente o una
nueva que se vaya a aadir al conjunto de datos activo.
Para crear una expresin, puede pegar los componentes en el campo Expresin o escribir
directamente en dicho campo.
Si los valores contienen decimales, debe utilizarse una coma(,) como indicador decimal.
16
Para las nuevas variables de cadena, tambin debern seleccionar Tipo y etiqueta para
especificar el tipo de datos.
El cuadro de dilogo Si los casos permite aplicar transformaciones de los datos para subconjuntos de
casos seleccionados utilizando expresiones condicionales. Una expresin condicional devuelve un
valor verdadero, falso o perdido para cada caso.
17
Calcular variable: Tipo y etiqueta
Por defecto, las nuevas variables calculadas son numricas. Para calcular una nueva variable de
cadena, deber especificar el tipo de los datos y su ancho.
Etiqueta. Variable descriptiva opcional de hasta 255 bytes de longitud. Puede introducir una
etiqueta o utilizar los primeros 110 caracteres de la expresin de clculo como la etiqueta.
Tipo. Las variables calculadas pueden ser numricas o de cadena (alfanumricas). Las variables de
cadena no se pueden utilizar en clculos aritmticos.
Funciones aritmticas
Funciones estadsticas
Funciones de cadena
Funciones de fecha y hora
Funciones de distribucin
Funciones de variables aleatorias
Funciones de valores perdidos
Funciones de puntuacin
Si desea obtener ms informacin y una descripcin detallada de cada funcin, escriba funciones en
la pestaa ndice del sistema de ayuda.
18
Recodificacin de valores
Los valores de datos se pueden modificar mediante la recodificacin. Esto es particularmente til
para agrupar o combinar categoras. Puede recodificar los valores dentro de las variables existentes
o crear variables nuevas que se basen en los valores recodificados de las variables existentes.
El cuadro de dilogo Recodificar en las mismas variables le permite reasignar los valores de las
variables existentes o agrupar rangos de valores existentes en nuevos valores. Por ejemplo, podra
agrupar los salarios en categoras que sean rangos de salarios.
Puede recodificar las variables numricas y de cadena. Si selecciona mltiples variables, todas deben
ser del mismo tipo. No se pueden recodificar juntas las variables numricas y de cadena.
Debe tener cuidado con esta opcin, porque se pierde los valores de la variable original.
Seleccione las variables que desee recodificar. Si selecciona mltiples variables, todas
debern ser del mismo tipo (numricas o de cadena).
Pulse en Valores antiguos y nuevos y especifique cmo deben recodificarse los valores.
19
Si los casos para esto es igual al que se describe para Contar apariciones.
Este cuadro de dilogo permite definir los valores que se van a recodificar. Todas las
especificaciones de valores deben pertenecer al mismo tipo de datos (numricos o de cadena) que
las variables seleccionadas en el cuadro de dilogo principal.
Valor antiguo. Determina el valor o los valores que se van a recodificar. Puede recodificar valores
individuales, rangos de valores y valores perdidos. Los rangos y los valores perdidos del sistema no
se pueden seleccionar para las variables de cadena, ya que ninguno de los conceptos es aplicable
a estas variables. Los rangos incluyen sus puntos finales y los valores definidos como perdidos por
el usuario que estn dentro del rango.
Valor. Valor antiguo individual que se va recodificar en un valor nuevo. El valor debe ser el
mismo tipo de datos (numrico o de cadena) que el de las variables que se van recodificar.
Perdido por el sistema. Valores asignados por el programa cuando los valores de sus datos
no estn definidos de acuerdo al tipo de formato que haya especificado, cuando un
campo numrico est vaco, o cuando no est definido un valor como resultado de un
comando de transformacin. Los valores numricos perdidos del sistema se muestran
como puntos. Las variables de cadena no pueden tener valores perdidos del sistema, ya
que es lcito cualquier carcter en las variables de cadena.
Perdido por el sistema o usuario. Observaciones que tienen valores que el usuario ha
declarado perdidos o que son desconocidos y se les ha asignado el valor perdido del
sistema, lo que se indica mediante un punto (.).
Todos los dems valores. Cualquier valor no incluido en una de las especificaciones de la
lista
Valor nuevo. Es el valor individual en el que se recodifica cada valor o rango de valores
antiguo. Puede introducir un valor o asignar el valor perdido del sistema.
20
Perdido por el sistema. Recodifica el valor antiguo especificado como valor perdido por el
sistema. El valor perdido por el sistema no se utiliza en los clculos. Adems, los casos con
valor perdido por el sistema se excluyen de muchos procedimientos. No disponible para
variables de cadena.
21
Recodificar en distintas variables
El cuadro de dilogo Recodificar en distintas variables le permite reasignar los valores de las
variables existentes o agrupar rangos de valores existentes en nuevos valores para una variable
nueva. Por ejemplo, podra agrupar los salarios en una nueva variable que contenga categoras de
rangos de salarios.
Si selecciona mltiples variables, todas deben ser del mismo tipo. No se pueden recodificar
juntas las variables numricas y de cadena.
Figura 24: Cuadro de dilogo Recodif. en distintas var. (Recodificar en distntas variables)
Si los casos para esto es igual al que se describe para Contar apariciones.
22
Recodificar en distintas variables: Valores antiguos y nuevos
Este cuadro de dilogo permite definir los valores que se van a recodificar.
Valor antiguo. Determina el valor o los valores que se van a recodificar. Puede recodificar valores
individuales, rangos de valores y valores perdidos. Los rangos y los valores perdidos del sistema no se
pueden seleccionar para las variables de cadena, ya que ninguno de los conceptos es aplicable a estas
variables. Los valores antiguos deben ser del mismo tipo de datos (numricos o de cadena) que la
variable original. Los rangos incluyen sus puntos finales y los valores definidos como perdidos por el
usuario que estn dentro del rango.
Valor. Valor antiguo individual que se va recodificar en un valor nuevo. El valor debe ser el
mismo tipo de datos (numrico o de cadena) que el de las variables que se van recodificar.
Perdido por el sistema. Valores asignados por el programa cuando los valores de sus datos
no estn definidos de acuerdo al tipo de formato que haya especificado, cuando un campo
numrico est vaco, o cuando no est definido un valor como resultado de un comando de
transformacin. Los valores numricos perdidos del sistema se muestran como puntos. Las
variables de cadena no pueden tener valores perdidos del sistema, ya que es lcito cualquier
carcter en las variables de cadena.
Perdido por el sistema o usuario. Observaciones que tienen valores que el usuario ha
declarado perdidos o que son desconocidos y se les ha asignado el valor perdido del sistema,
lo que se indica mediante un punto (.)
Todos los dems valores. Cualquier valor no incluido en una de las especificaciones de la lista
Antiguo->Nuevo. Aparece en la lista Antiguo->Nuevo como ELSE.
Valor nuevo. Es el valor individual en el que se recodifica cada valor o rango de valores
antiguo. Los valores nuevos pueden ser numricos o de cadena.
Valor. Valor en el que se va a recodificar uno o ms valores antiguos. El tipo de datos (numrico
o de cadena) del valor introducido debe coincidir con el tipo de datos del valor antiguo.
Perdido por el sistema. Recodifica el valor antiguo especificado como valor perdido por el
sistema. El valor perdido por el sistema no se utiliza en los clculos. Adems, los casos con
valor perdido por el sistema se excluyen de muchos procedimientos. No disponible para
variables de cadena.
Copiar los valores antiguos. Retiene el valor antiguo. Si algunos de los valores no requieren la
recodificacin, utilice esta opcin para incluir los valores antiguos. Cualquier valor antiguo que
no se especifique no se incluye en la nueva variable, y los casos con esos valores se asignan al
valor perdido por el sistema en la nueva variable.
23
Las variables de los resultados son cadenas. Define la nueva variable recodificada como variable de
cadena (alfanumrica). La variable antigua puede ser numrica o de cadena.
Convertir cadenas numricas en nmeros. Convierte los valores de cadena que contienen nmeros en
valores numricos. A las cadenas que contengan cualquier elemento que no sea nmero y un carcter
de signo opcional (+ -), se les asignar el valor perdido por el sistema.
El cuadro de dilogo Recodificacin automtica le permite convertir los valores numricos y de cadena
en valores enteros consecutivos. Si los cdigos de la categora no son secuenciales, las casillas vacas
resultantes reducen el rendimiento e incrementan los requisitos de memoria de muchos
procedimientos. Adems, algunos procedimientos no pueden utilizar variables de cadena y otros
requieren valores enteros consecutivos para los niveles de los factores.
24
Figura 26: Cuadro de dilogo Recodificacin automtica
La nueva variable, o variables, creadas por la recodificacin automtica conservan todas las
etiquetas de variable y de valor definidas de la variable antigua. Para los valores que no
tienen una etiqueta de valor ya definida se utiliza el valor original como etiqueta del valor
recodificado. Una tabla muestra los valores antiguos, los nuevos y las etiquetas de valor.
Los valores de cadena se recodifican por orden alfabtico, con las maysculas antes que las
minsculas.
Los valores perdidos se recodifican como valores perdidos mayores que cualquier valor no
perdido y conservando el orden. Por ejemplo, si la variable original posee 10 valores no
perdidos, el valor perdido mnimo se recodificar como 11, y el valor 11 ser un valor perdido
para la nueva variable.
Seleccionar casos proporciona varios mtodos para seleccionar un subgrupo de casos basndose
en criterios que incluyen variables y expresiones complejas. Tambin se puede seleccionar una
muestra aleatoria de casos. Los criterios usados para definir un subgrupo pueden incluir:
Valores y rangos de las variables
Rangos de fechas y horas
Nmeros de caso (filas)
Expresiones aritmticas
Expresiones lgicas
Funciones
25
Figura 26: Cuadro de dilogo Seleccionar casos
Resultado
Esta seccin controla el tratamiento de casos no seleccionados. Puede elegir una de las siguientes
alternativas para tratar los casos no seleccionados:
o Descartar casos no seleccionados. Los casos no seleccionados no se incluyen en el anlisis,
pero se conservan en el conjunto de datos. Podr utilizar los casos no seleccionados ms
adelante en la sesin, si desactiva el filtrado. Si selecciona una muestra aleatoria o si
26
selecciona los casos mediante una expresin condicional, se generar una variable con el
nombre filter_$ que tendr el valor 1 para los casos seleccionados y el valor 0 para los casos no
seleccionados.
o Copiar casos seleccionados a un nuevo conjunto de datos. Los casos seleccionados se copiarn
a un nuevo conjunto de datos, lo que mantendr inalterado el conjunto de datos original. Los
casos no seleccionados no se incluirn en el nuevo conjunto de datos y se mantendrn en su
estado original en el conjunto de datos original.
o Eliminar casos no seleccionados. Los casos no seleccionados se eliminarn del conjunto de
datos. Slo se pueden recuperar los casos eliminados saliendo del archivo sin guardar ningn
cambio y abrindolo de nuevo. La eliminacin de los casos ser permanente si se guardan los
cambios en el archivo de datos.
Nota: Si elimina los casos no seleccionados y guarda el archivo, no ser posible recuperar estos
casos.
27
Si el resultado de una expresin condicional es verdadero, se incluir el caso en el subconjunto
seleccionado.
Si el resultado de una expresin condicional es falso o perdido, no se incluir el caso en el
subconjunto seleccionado.
La mayora de las expresiones condicionales utilizan al menos uno de los seis operadores de
relacin (<, >, <=, >=, =, and ~=) de la calculadora.
Las expresiones condicionales pueden incluir nombres de variable, constantes, operadores
aritmticos, funciones numricas (y de otros tipos), variables lgicas y operadores de relacin.
Cualquier anlisis estadstico se realiza a partir de la opcin del men Analizar. Se hace un clic
en Analizar y aparece el siguiente cuadro de dilogo.
28
Anlisis descriptivo:
Este anlisis se logra a partir del cuadro de dialogo Analizar, Estadsticos descriptivos, descriptivos.
29