Vous êtes sur la page 1sur 27

254

507

CREACION DE GRAFICOS

Pulse en Barra (si no est


seleccionada).

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

508

CREACION DE GRAFICOS

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
255
509

CREACION DE GRAFICOS

Arrastre la variable Servicio


inalmbrico [inalam] al eje x.

Pulse con el botn derecho


del ratn en Tiene PDA [pda]
y elija Nominal como nivel de
medida.
Arrastre la variable Tiene
PDA [pda] a la zona de
colocacin de agrupacin
situada en la esquina
superior derecha del lienzo.
Pulse en Aceptar para
crear el grfico.

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

510

CREACION DE GRAFICOS

Puede editar los grficos y las


tablas pulsando dos veces en
ellos en el panel de contenidos
de la ventana Visor y, a
continuacin, puede copiar y
pegar los resultados en otras
aplicaciones. Abordaremos
esos temas ms adelante.

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
256
511

LECTURA DE DATOS

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

512

ESTRUCTURA BASICA DE ARCHIVOS DE


DATOS DE SPSS STATISTICS

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
257
513

LECTURA DE ARCHIVOS DE DATOS


DE SPSS STATISTICS

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

514

LECTURA DE ARCHIVOS DE DATOS


DE SPSS STATISTICS

Acceda a demo.sav y
bralo. Consulte Archivos
muestrales si desea obtener
ms informacin.

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
258
515

LECTURA DE ARCHIVOS DE DATOS


DE SPSS STATISTICS

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

516

LECTURA DE DATOS DE HOJAS


DE CALCULO

Tambin puede leer los


encabezados de las
columnas como
nombres de variables.

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
259
517

LECTURA DE DATOS DE HOJAS


DE CALCULO

Seleccione Excel (*.xls)


para el tipo de archivo que
desea ver.
Abra demo.xls .

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

518

LECTURA DE DATOS DE HOJAS DE CALCULO

En Excel 95 o posterior,
tambin se pueden
especificar las hojas de
clculo que se desea
importar.
Asegrese de que est
seleccionada la opcin Leer
nombre de variables de la
primera fila de datos. Esta
opcin
p lee los encabezados
Si los encabezados de las columnas no cumplen las normas de denominacin de columnas como nombres
de variables de SPSS Statistics, se convertirn en nombres de variables de variables.
vlidos y los encabezados originales de las columnas se guardarn como
etiquetas de variable.

Si desea importar slo una parte de la hoja de clculo, especifique el


rango de casillas que se va a importar en el campo de texto Rango.

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
260
519

LECTURA DE DATOS DE HOJAS DE CALCULO

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

520

USO DEL EDITOR DE DATOS

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
261
521

INTRODUCCION DE DATOS NUMERICOS

Pulse en la pestaa Vista de


variables, que se encuentra en la
parte inferior de la ventana Editor
de datos.

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

522

INTRODUCCION DE DATOS NUMERICOS

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
262
523

INTRODUCCION DE DATOS NUMERICOS

Se asignar automticamente
el tipo de datos Numrico a
las nuevas variables.

Si no introduce nombres de
variable, se crearn nombres
nicos automticamente. No
obstante estos nombres no son
obstante,
descriptivos ni recomendables
para archivos de datos ms
grandes.
Pulse en la pestaa Vista de
datos para seguir introduciendo
los datos.

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

524

INTRODUCCION DE DATOS NUMERICOS

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
263
525

INTRODUCCION DE DATOS NUMERICOS

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

526

INTRODUCCION DE DATOS NUMERICOS

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
264
527

EXAMEN DE ESTADISTICOS DE RESUMEN


PARA VARIABLES INDIVIDUALES

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

528

NIVEL DE MEDIDA

Categricas. Datos con un


nmero limitado de valores o
categoras distintas (por
ejemplo, gnero o estado civil).
Tambin se hace referencia a
estos datos como datos
cualitativos. Las variables
categricas pueden ser
variables de cadena
(alfanumricas) o variables
numricas que utilizan cdigos
numricos p para representar
p a
las categoras (por ejemplo, 0 =
Soltero/a y 1 = Casado/a). Hay
dos tipos bsicos de datos
categricos:

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
265
529

NIVEL DE MEDIDA

Ordinal. Datos
categricos en los que las
categoras tienen un orden
significativo, pero sin una
distancia medible entre las
categoras. Por ejemplo,
hay un orden para los
valores alto, medio y bajo
pero no se puede calcular
la "distancia" entre los
valores.

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

530

NIVEL DE MEDIDA

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
266
531

MEDIDAS DE RESUMEN PARA DATOS


CATEGORICOS

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

532

MEDIDAS DE RESUMEN
PARA VARIABLES DE ESCALA

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
267
533

SPSS EJEMPLO

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

534

1.5 MATTHEW
JULIA

1.0 LUCY
JENNIFER
.5 NICOLE

0.0

JOHN
-.5 PAMELA
THOMAS ARTHUR

-1.0
Component2

-1.5
15 FRED

-2.0
-1.5 -1.0 -.5 0.0 .5 1.0 1.5 2.0

Component1

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
268
535

Agglomeration Schedule

Stage Cluster First


Cluster Combined Appears
Stage Cluster 1 Cluster 2 Coefficients Cluster 1 Cluster 2 Next Stage
1 3 6 .026 0 0 8
2 2 5 .078
0 8 0 0 7
3 4 9 .224 0 0 5
4 1 7 .409 0 0 6
5 4 10 .849 3 0 8
6 1 8 1.456 4 0 7
7 1 2 4.503 6 2 9
8 3 4 9.878 1 5 9
9 1 3 18.000 7 8 0

Number of clusters: 10 6 = 4

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

536

1.5 MATTHEW
JULIA

1.0 LUCY
JENNIFER
.5 NICOLE

0.0

JOHN
-.5 PAMELA
THOMAS ARTHUR
Cluster Number of Ca

-1.0 4
ponent2

3
-1.5 FRED
2
Comp

-2.0 1
-1.5 -1.0 -.5 0.0 .5 1.0 1.5 2.0

Component1

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
269
537

MODO VISUAL

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

538

MODO VISUAL

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
270
539

ANALISIS UNIVARIABLE
La mayora de estos objetivos se alcanzan realizando un anlisis descriptivo
de las variables. Concretamente utilizaremos medidas de tendencia central y
de dispersin para describir las caractersticas de las variables cuantitativas
y de las tablas de frecuencias y porcentajes para las variables cualitativas.
Para ello utilizaremos,
utilizaremos esencialmente,
esencialmente los procedimientos de SPSS que
aparecen en la ltima columna de la siguiente tabla:

Representaciones Procedimientos de
Tipo de variable ndices analticos
grficas SPSS

Media, mediana, moda,


desviacin tpica,
rango, amplitud Histograma, grfico Descriptivos,
Cuantitativa intercuartlica, prueba de caja Explorar, Tablas
de normalidad

Diagrama de barras,
Frecuencias, diagrama de lneas,
Cualitativa Frecuencias, Tablas
porcentajes, moda, etc. diagrama de
sectores

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

540
DETECTAR ERRORES EN LA CODIFICACION
DE LAS VARIABLES CUALITATIVAS
Y CUANTITATIVAS
Vamos a entender por errores de codificacin a todos aquellos valores que estn
fuera del rango de las variables cuantitativas y a cdigos numricos o no numricos
no definidos para representar a categoras de las variables cualitativas.

Ejemplo: Estamos interesados en estudiar si la opinin acerca de la ley de


matrimonios entre parejas del mismo sexo depende de la edad y del sexo. Para ello,
seleccionamos una muestra de sujetos mayores de edad y les pedimos que nos den
su opinin acerca de la ley eligiendo una de las opciones de una escala que va
desde 1 (muy desfavorable) hasta 7 (muy favorable). Los datos los hemos escrito en
una archivo de SPSS y hemos realizado un anlisis descriptivo bsico utilizando el
procedimiento frecuencias para las todas las variables incluidas en el archivo y el
procedimiento descriptivos para las cuantitativas.

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
271
541
DETECTAR ERRORES EN LA
CODIFICACION DE LAS VARIABLES
CUALITATIVAS Y CUANTITATIVAS
Para realizar el anlisis descriptivo, hemos seleccionado las opciones que
aparecen en los cuadros siguientes y hemos obtenido las siguientes tablas. A
partir de la informacin que nos proporcionan las tablas, podemos identificar
errores de codificacin en las variables medidas?

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

542
CARACTERIZAR LAS DISTRIBUCIONES DE LAS
VARIABLES EN CUANTO A SU TENDENCIA CENTRAL,
DISPERSION Y FORMA (NORMALIDAD)
Para ello, utilizaremos tanto ndices numricos como grficos.
Estadsticos de tendencia central

Media aritmtica.

Mediana: una vez ordenados los datos, es el valor que deja el mismo nmero de
observaciones a su derecha que a su izquierda.

Media truncada: es la media de la variable eliminando el 5% de las colas inferior y


superior de la distribucin. De esta forma se eliminan valores extremos y es por
tanto un estadstico robusto.

M-estimadores: son estadsticos robustos pues se definen ponderando cada valor


d la
de l distribucin
di t ib i en funcin
f i de
d su distancia
di t i all centro
t d la
de l misma.
i L
Las
observaciones centrales se ponderan por el mximo valor (la unidad),
disminuyendo los coeficientes de ponderacin a medida que las observaciones se
alejan del centro.

Existen distintas formas de ponderar: Humbert (pondera con valor uno los valores
situados a menos de 1339 de la mediana), Tukey (pondera con cero los valores
situados a 4385 de la mediana), Andrews (pondera con cero los situados a
42066 de la mediana), etc.
Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
272
543

CARACTERIZAR LAS DISTRIBUCIONES DE LAS


VARIABLES EN CUANTO A SU TENDENCIA CENTRAL,
DISPERSION Y FORMA (NORMALIDAD)

Estadsticos de dispersin
Rango
R
Varianza
Desviacin tipo
Amplitud intercuartlica (AI)

Estadsticos de forma
Asimetra
Kurtosis
K t i

Prueba de normalidad de Kolmogorov

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

544

CARACTERIZAR LAS DISTRIBUCIONES DE LAS


VARIABLES EN CUANTO A SU TENDENCIA CENTRAL,
DISPERSION Y FORMA (NORMALIDAD)

Histograma Grfico de caja Grfico Q-Q


QQ

16

14

12

10

Desv. tp. = 3.57


2
Media = 7.1

0 N = 49.00
0.0 2.5 5.0 7.5 10.0 12.5 15.0

DIG

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
273
545

CARACTERIZAR LAS DISTRIBUCIONES DE LAS


VARIABLES EN CUANTO A SU TENDENCIA CENTRAL,
DISPERSION Y FORMA (NORMALIDAD)
Figura 1. Tipologas de histogramas

(Xmx 1) Xi
Xi

log10 Xi log10 Xmx 1 Xi

Figura 2. Tipologas de grficos Q-Q

1 1
Xi Xmx 1 Xi

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

546
CARACTERIZAR LAS DISTRIBUCIONES DE LAS
VARIABLES EN CUANTO A SU TENDENCIA CENTRAL,
DISPERSION Y FORMA (NORMALIDAD)
Para caracterizar a las variables cuantitativas, utilizaremos el procedimiento
Explorar de SPSS con las variables cansancio emocional, despersonalizacin,
realizacin personal y depresin total medidas en una muestra de odontlogos.
Los cuadros de dilogo con las opciones bsicas recomendadas son los
siguientes:

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
274
547

CARACTERIZAR LAS DISTRIBUCIONES DE LAS


VARIABLES EN CUANTO A SU TENDENCIA CENTRAL,
DISPERSION Y FORMA (NORMALIDAD)

Con las opciones


p seleccionadas hemos obtenido
informacin que nos permite responder a las siguientes
cuestiones de las variables analizadas:
1. Identificar las medidas de tendencia central y de
dispersin.
2. Comparar la media con la mediana y con los
estimadores robustos.
3. Evaluar mediante inspeccin visual la normalidad de las
variables.
4. Evaluar utilizando la prueba de significacin la
normalidad de las variables.

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

548

DETECTAR DATOS ATIPICOS


Llamamos datos atpicos a aquellas observaciones que se encuentran alejadas del
resto de las observaciones en una variable (atpico univariable) o en la distribucin
conjunta de dos o ms variables (atpico multivariable). Los valores atpicos
multivariantes resultan de combinaciones de valores muy y inusuales. Las consecuencias
de una sola observacin atpica pueden ser graves, pues pueden distorsionar las
medias y las desviaciones tpicas de las variables y destruir o construir relaciones entre
ellas.
Ejemplo
Los valores atpicos pueden deberse a lo siguiente:
I. Errores en la codificacin de los valores de las variables, errores en la codificacin
de valores perdidos, errores de medida, errores en la transcripcin.
II Observaciones que no proceden de la poblacin de la que se ha extrado la muestra.
II. muestra
III. Observaciones atpicas debidas a que la distribucin de la variable en la poblacin
tiene valores ms extremos que los de una distribucin normal.
Los valores atpicos debidos a I y II, una vez detectados, deben ser eliminados o
recodificados como valores perdidos. En el caso III, suelen retenerse y analizar su
incidencia en los anlisis posteriores.

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
275
549

DETECTAR DATOS ATIPICOS

Para considerar a una observacin como atpica existen diferentes criterios:


Se consideran atpica aquellas observaciones que estn, en valores absolutos, a
p de la media ((Z>3 o Z<-3),
ms de tres desviaciones tipo ), p
pero la aplicacin
p de
este para criterio depende del tamao de la muestra.
En el grfico de caja, como ya hemos vistos, son observaciones atpicas con
puntuaciones superiores o inferiores a 1,5*AI. Desde 3*AI se califican de
extremos.
Otra regla simple es considerar sospechosas aquellas observaciones tales que

xi med x
4,5
MEDA( x)
Donde Med(x) es la mediana y MEDA(x) es la mediana de las desviaciones
absolutas de x con respeto a la mediana.

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

550

DETECTAR DATOS ATIPICOS


Los criterios para detectar atpicos a nivel univariante no tienen que identificar atpicos
multivariantes. Para ello se puede utilizar, aunque no exenta de problemas, la distancia de
Mahalanobis.
La distancia de Mahalanobis es la distancia al centro de gravedad ponderada por la matriz de
varianzas covarianzas. Una observacin multivariante resultar sospechosa si su distancia
supera el valor de chi-cuadrado para k (nmero de variables) y un nivel de significacin de
0,001.
Algunos de los grficos disponibles en SPSS implementan los criterios anteriores para detectar
datos atpicos. Los siguientes cuadros de dilogo corresponden a los grficos recomendados
para detectar atpicos:

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
276
551

DETECTAR DATOS ATIPICOS

Con la secuencia de cuadros de dilogo sobre la matriz obtenemos los


siguientes grficos.

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

552

DETECTAR DATOS ATIPICOS


Caras de Chernoff

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
277
553
DETECTAR DATOS ATIPICOS
Grficos de estrella
sujeto 1 sujeto 2
zcan
4
zcan zcan 2
1 4 0
0 2 zsatisfa -2 zdespe
zsatisfa -1 zdespe zsatisfa 0 zdespe -4
fr
-2
2 sujeto
j t 1 -2
2

zdepre zrea zdepre zrea zdepre zrea

2
1

0
zcan d
zdespe zrea zdepre
d zsatisfa
ti f
-1

-2
-3

-4

-5

Grficos de lnea

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

554

LINEALIDAD
Muchos procedimientos de anlisis se basan en el patrn de
correlaciones de Pearson entre variables cuantitativas. El coeficiente de
correlacin mide el grado de asociacin lineal entre variables y no es
adecuado utilizarlo cuando el patrn de covariacin no es lineal. Es
importante tambin que los coeficientes de correlacin sean fiables y,
bajo determinadas circunstancias, pueden ser mucho ms grandes o
mucho ms pequeos de lo que deberan ser.
Variables compuestas: En muchas investigaciones es frecuente utilizar
variables compuestas (sumas, promedios, etc.) que se obtienen a partir
de varios tems. Las correlaciones entre variables compuestas que
comparten tems individuales en su definicin suelen estar infladas.
Presencia de valores atpicos: Los valores atpicos como ya hemos
demostrado pueden inflar o reducir significativamente las correlaciones
entre variables.
Restriccin de rango: Las correlaciones muestrales pueden ser
inferiores a las poblacionales cuando, en la muestra, el rango de
respuestas de uno o ambas de las variables analizadas est restringido.

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
278
555

LINEALIDAD

La herramienta ms til para obtener informacin, a nivel


exploratorio, de la relacin entre dos variables cuantitativas
es el diagrama de dispersin, o nube de puntos. Se
construye representando, en el plano cartesiano, los
valores de las variables medidas. La inspeccin visual del
grfico de dispersin nos permite identificar valores
atpicos
p y el tipo
p de relacin entre las variables.

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

556
LINEALIDAD
100
10
80
5
60
0
40
-5
20
-10
0
0 1 -15
15

40
30 35
30
25 25
20 20
15
15 10
10 5
0
5
0 5 10 15 20
0

300
250
200
150
100
50
0
0 5 10 15 20

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
279
557

LINEALIDAD

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

558

LINEALIDAD
Grfico

80,00

60,00
hrv_b

40,00

20 00
20,00

20,00 40,00 60,00 80,00 100,00


hrv_a

Diagrama de dispersin por defecto

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING
280
559
ANALISIS EXPLORATORIO DE DATOS (II). ANALISIS DE
DOS VARIABLES CUANTITATIVAS. DIAGRAMA DE
DISPERSION CON SPSS
Grfico

hrv_a
hrv_b
hrv_c
hrv_d
hrv_fa
imp_a
imp_b
imp_c
imp_d

hrv_a hrv_b hrv_c hrv_d hrv_fa imp_a imp_b imp_c imp_d

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

560

LINEALIDAD

grup
ctrl
phob

80,00

60,00
hrv_b

40,00

20,00

20,00 40,00 60,00 80,00 100,00


hrv_a

Ing. Jos Luis Salazar - jsalazar@expo.intercade.org - Consultor Intercade

INTERCADE www.intercade.org
CONSULTANCY & TRAINING

Vous aimerez peut-être aussi