Académique Documents
Professionnel Documents
Culture Documents
Curso 1998/99
1. Introduccin
2. Inicio
3. Pasos generales para realizar anlisis estadsticos
Seleccionar una base de datos
Ventana Filiere
Introducir parmetros en el modelo
- Hoja de variables
- Hoja de individuos
- Hoja de ponderacin
Salvar Filiere y ejecutar
4. Edicin de resultados
5. Creacin de una nueva base de datos
Ventana de ttulo
Ventana Variables
Ventana Modalidad de una variable nominal
Ventana Individuos
Ventana Valores
Guardar, cerrar, guardar como y salir
6.
7. Representacin grfica de planos factoriales
Para iniciar la visualizacin
Comando Graphique
Comando Edition
Comando Selection
Comando Habillage
Comando Dessin
Carecterizar los distintos grupos o modalidades
8. Estadstica descriptiva
Histogramas
2
Descripcin de modalidades
Descripcin de variables continuas
Tablas de variables nominales
Cruces de variables continuas
9. Anlisis de componentes principales
10.
11.
12.
Descripcin de factores
13.
Anlisis de clasificacin
Clasificacin jerrquica y mixta
Particin del dendograma
Descripcin de las clases
Introduccin
El paquete estadstico SPAD es una herramienta destinada al anlisis exploratorio de
datos multidimensionales. Est orientado al anlisis estadstico descriptivo de grandes tablas de
datos obtenidos a partir de encuestas.
Se basa en las tcnicas factoriales que tiene como fundamento el lgebra lineal,
descomponiendo la matriz de datos mediante sus valores propios. La idea subyacente de esta
metodologa es que se puede calcular las distancias entre las lneas y las columnas de una tabla
rectangular utilizando distintos tipos de medidas (correlaciones, coeficientes de contingencia,
etc.).
Adems, desarrolla tcnicas de clasificacin de los elementos de la tabla (filas o
columnas) a partir de los vectores propios, obteniendo caracterizaciones estadsticas
automticas de las distintas clases.
Inicio
Se aprieta dos veces en el icono SPAD (Winspad3)
Aparecen automticamente tres ventanas
(Mthodes)
Ventana de programacin
trabajar principalmente con esta ventana. En el caso de que esta ventana no aparezca o que
queramos abrir una nueva, en el men Principal, vamos al comando Filierie y escogemos
Nouevelle Filiere. Se pueden abrir tantas ventanas Filiere como queramos seleccionando en la
ventana principal del SPAD el comando Filiere: nouvelle para crear una nueva base o bien
para recuperar alguna ventana de programacin ya archivada.
Anlisis factoriales
Anlisis de clasificacin
Cuando el icono del mtodo est en gris, pinchamos dos veces en el icono, y
dependiendo del mtodo, nos saldrn distintas pantallas que hemos de cumplimentar.
Normalmente nos saldrn las siguientes hojas que en todos los casos habr que rellenar:
Hoja de variables
Aparece una ventana con todas las variables disponibles.
Hemos de seleccionar en el recuadro Selection de variables el tipo de variables
y su estatus.
Una vez seleccionado el tipo de variable y sus caractersticas, aparecen en la
ventana superior las variables disponibles. Hemos de escoger las variables que nos
interesen en funcin del anlisis concreto. Con las fechas hacia arriba y hacia abajo las
elegimos.
Esta pantalla podemos obtener diversa informacin acerca de las variables en
estudio (si son variables nominales las frecuencias de las modalidades y su tanto por
ciento; si son continuas, la media, desviacin tpica, mnimo y mximo) .
Hoja de individuos
Seleccionamos los individuos que nos interesan en funcin de nuestros
objetivos. Podemos seleccionar
codificacin.
Si queremos aplicar el filtro lgico para escoger los individuos:
6
Hoja de ponderacin
Si queremos dar ms importancia a unos individuos que a otros, los
ponderamos mediante una variable de ponderacin. Por defecto, todos los
individuos son iguales (ponderacin uniforme).
Salvar Filiere y ejecutar
Una vez cumplimentado los parmetros del modelo, aceptamos y nos aparece
de nuevo la ventana Filiere. Si el nmero que aparece al lado del icono est en verde,
significa que al menos el mtodo puede funcionar ( lo que no implica que est bien
diseado estadsticamente).
Con la confianza de esperar que nuestro mtodo sea el correcto y que los
parmetros (variables, individuos, etc.) estn bien definidos procedemos a salvar el
mtodo estadstico diseado apretando F5. Si no hemos dado un nombre a este
procedimiento, nos pedir que le demos un nombre y posteriormente una pequea
descripcin del mtodo.
Edicin de resultados
Una vez ejecutado el mtodo podemos estudiar los distintos resultados obtenidos
pinchando dos veces el icono de texto que aparece a la derecha del icono del mtodo.
Aparece una nueva ventana Editueur de Rapport y los resultados aparecen
estructurados en forma de rbol en la ventana Plan du rapport.
Seleccionamos el ttulo de inters y los resultados aparecen en una nueva ventana de
texto. Estos resultados se pueden copiar, imprimir, salvar, etc.
Ventana de ttulo
Por defecto, cuando creamos una base de datos nueva, aparece la ventata Entete. En la
ventana Entete hay un recuadro (titre) donde escribimos el nombre de la base de datos y
podemos aportar una breve descripcin de esta base (sous). Una vez identificado el contenido
de la base que vamos a crear, apretamaos el botn Autres vues y se abren simultneamente
cuatro ventanas. Si no se abren las ventanas, en la barra de herramientas de la ventana Editeur
de donnes aparecen cuatro iconos con forma de ventana con los siguientes nombres: ent, var,
mod, ind, val.
9
Ventana Variables
Ventana Variables: los distinos campos que aparecen en esta ventana son:
de modalidades
Ventana Modalidad de una variable nominal
Ventana Modalites de una variable nominal: define las modalidades de la variable
nominal seleccionada.
Ventana Individuos
Ventana Individus: identifica y etiqueta a los individuos. Se crean apretando Ctrl A.
Ventana Valores
Ventana Valeurs: asignamos a cada individuo sus valores correspondientes.
Guardar, cerrar, guardar como y salir.
Cuando ya hemos introducido los datos, seleccionamos en la ventana Editeur de donees,
el comando Fichier para guardar, salir, guardar como, etc. Si queremos guardar los
datos, seleccionamos en el submen Enregistrer, y automticamente nos pedir un
nombre para el fichero. Para salir del editor de datos, Quitter.
10
Este programa permite estudiar grficamente los planos factoriales del tipo ACP, AFC
y ACM.
Para iniciar la visualizacin
1. O bien abriendo un grfico que ya hemos creado y salvado con anterioridad, o bien
si estamos ejecutando un determinado mtodo, seleccionando el icono grfico en
forma de ejes que aparece a la derecha del mtodo.
2. Aparece la ventana preselections pour un nouveau graphique. En ella
seleccionamos las variables y frecuencias activas e ilustrativas, etc., as como las
particiones si las hubiera. La seleccin concreta de lo que podemos representar
depender del anlisis efectuado.
3. Si el fichero contiene muchos individuos, lo mejor es no representarlos. En cambio,
si el fichero es pequeo, no hay ningn inconveniente en representar todos los
individuos.
4. Apretamos OK.
Comando Graphique
Podemos abrir, cerrar, salvar, salvar como (por ejemplo podemos salvar el grfico
como un fichero bmp), imprimir, etc.
Si deseamos cambiar los ejes factoriales representados, elegimos los factores deseados
(F1, F2, F3, F4, etc..) (Changer les axes o bien el botn ejes que aparece en la barra de
herramientas). Nos indica la cantidad de informacin que posee cada factor.
Comando Edition
Permite copiar el grfico o la seleccin en el portapapeles.
Para borrar del grfico los puntos seleccionados Effacer
Comando Selection
Este men nos permite efectuar la seleccin de los puntos de inters en base a los
siguientes criterios (tambin se pueden utilizar los botones de la barra de herramientas)
11
Des categories
Seleccionamos las categoras que deseemos (individuos activos e ilustrativos,
variables activas e ilustrativas).
Des variables per liste
Seleccionamos una a una las variables que nos interesa representar.
Si son variables nominales, incluso podemos escoger qu modalidades
seleccionamos.
Des individus per liste y Des individus per filtre logique
Seleccionamos los individuos que deseamos que aparezcan uno a uno o bien
mediante filtros lgicos
Point par point, Par cadrage, Par segments
Si slo queremos seleccionar de punto en punto, apretamos el botn puntoflecha de la barra de herramientas y sealamos el punto en el grfico.
Si queremos seleccionar una regin de puntos, repetimos el paso anterior con el
botn puntos-rectngulo.
Si deseamos seleccionar segmentos, igual al anterior pero con el botn rectaflecha.
Tous les points y Tous les segments
Seleccionamos todo el grfico (incluido trayectorias)
Filtrage statistique de la selection
Nos permite seleccionar los puntos ms significativos en funcin de criterios
estadsticos. Se da un valor mximo por ejemplo 80 (80%) ya sea de contribucin
(AFC o ACM) o bien coseno (ACP) y se seleccionan todos los puntos que tengan una
contribucin igual o superior al 80%.
Deselection totale
Anulamos las selecciones anteriores. Podemos realizar esta tarea con el botn
punto-flecha-punto.
Comando Habillage
Permite trabajar con los puntos seleccionados anteriormente
12
14
Estadstica descriptiva
Se dispone de los siguientes procedimientos para describrir las distintas variables:
15
Hoja de Histogramas-Discretizacin
16
17
18
DESCRIPTION DES
DESCRIPTION DE:
CARACTERISATION
CARACTERISATION
19
20
EN LIGNE
:
EN COLONNE :
Sexe de l'enqut(e)
Exercez-vous en ce moment une activit professionnelle
POIDS TOTAL :
315.
POIDS
% COLONNE
TABLEAU
EN LIGNE
: Sexe de l'enqut(e)
EN COLONNE : Exercez-vous en ce moment une activit professionnelle
MOYENNES DE : Age de l'enqut(e)
POIDS TOTAL :
315.
POIDS
| oui, plein t | oui, temps p | non
| n'a jamais t | ENSEMBLE
MOYENNE
|
|
|
|
|
ECART-TYPE
|
emps
|
artiel
|
|
ravaill
|
---------------------+--------------+--------------+--------------+--------------+-------------|
88
|
7
|
38
|
5
|
138
masculin
|
38.432 |
43.714 |
58.605 |
21.600 |
43.645
|
11.310 |
14.380 |
15.653 |
1.855 |
16.007
---------------------+--------------+--------------+--------------+--------------+-------------|
55
|
22
|
73
|
27
|
177
fminin
|
36.709 |
38.545 |
49.384 |
47.704 |
43.842
|
11.042 |
12.172 |
18.137 |
20.370 |
17.015
---------------------+--------------+--------------+--------------+--------------+-------------|
143
|
29
|
111
|
32
|
315
ENSEMBLE
|
37.769 |
39.793 |
52.541 |
43.625 |
43.756
|
11.239 |
12.931 |
17.871 |
20.988 |
16.581
21
22
23
24
25
26
27
Nos ayuda a interpretar los factores obtenidos a partir de un anlisis factorial. Cada
factor se describe por los elementos ms significativos (pueden ser individuos, modalidades,
variables continuas) ya sean activos o ilustrativos empleados en el anlisis anterior.
Por defecto, slo interpreta los tres primeros factores, pero podemos evidentemente
caracterizar los factores que deseemos.
Si deseamos seleccionar ms elemento definitorios de los ejes, en parmetros
porcentajes seleccionamos 30, 40 50 (por defecto viene el 20% de todas las posibilidades).
DESCRIPTION DES AXES FACTORIELS
DESCRIPTION DU FACTEUR 1
PAR LES MODALITES ACTIVES
+---------------------------------------------------------------------------------------------------------------------------+
| ID. | V.TEST |
LIBELLE MODALITE
|
LIBELLE DE LA VARIABLE
|
POIDS
| NUMERO |
|---------------------------------------------------------------------------------------------------------------------------|
| Di02 |
-2.39 | Discoteca poco
| Discoteca
|
8.00 |
1 |
|---------------------------------------------------------------------------------------------------------------------------|
|
Z O N E
C E N T R A L E
|
|---------------------------------------------------------------------------------------------------------------------------|
| Le03 |
3.90 | Lectura mucho
| Lectura
|
4.00 |
15 |
+---------------------------------------------------------------------------------------------------------------------------+
DESCRIPTION DU FACTEUR 2
PAR LES MODALITES ACTIVES
+---------------------------------------------------------------------------------------------------------------------------+
| ID. | V.TEST |
LIBELLE MODALITE
|
LIBELLE DE LA VARIABLE
|
POIDS
| NUMERO |
|---------------------------------------------------------------------------------------------------------------------------|
| Ba03 |
-3.03 | Bares mucho
| Bares
|
7.00 |
1 |
|---------------------------------------------------------------------------------------------------------------------------|
|
Z O N E
C E N T R A L E
|
|---------------------------------------------------------------------------------------------------------------------------|
| Le02 |
2.74 | Lectura poco
| Lectura
|
6.00 |
15 |
+---------------------------------------------------------------------------------------------------------------------------+
DESCRIPTION DU FACTEUR 3
PAR LES MODALITES ACTIVES
+---------------------------------------------------------------------------------------------------------------------------+
| ID. | V.TEST |
LIBELLE MODALITE
|
LIBELLE DE LA VARIABLE
|
POIDS
| NUMERO |
|---------------------------------------------------------------------------------------------------------------------------|
| Mu02 |
-3.47 | Msica nada
| Msica
|
8.00 |
1 |
|---------------------------------------------------------------------------------------------------------------------------|
|
Z O N E
C E N T R A L E
|
|---------------------------------------------------------------------------------------------------------------------------|
| Mu01 |
2.95 | Msica poco
| Msica
|
5.00 |
15 |
+---------------------------------------------------------------------------------------------------------------------------+
28
Anlisis de clasificacin
78%
22%
22%
22%
56%
28%
22%
28%
22%
29
30
PARANGONS
CLASSE
1/ 3
EFFECTIF:
4
---------------------------------------------------------------------------|RG | DISTANCE | IDENT.
||RG | DISTANCE | IDENT.
|
+---+-----------+--------------------++---+-----------+--------------------+
| 1|0.55500
|Individu n 1
|| 2|0.55500
|Individu n 2
|
| 3|0.55500
|Individu n 9
|| 4|0.55500
|Individu n 10
|
+---+-----------+--------------------++---+-----------+--------------------+
CLASSE
2/ 3
EFFECTIF:
10
---------------------------------------------------------------------------|RG | DISTANCE | IDENT.
||RG | DISTANCE | IDENT.
|
+---+-----------+--------------------++---+-----------+--------------------+
| 1|0.92447
|Individu n 12
|| 2|0.95447
|Individu n 4
|
| 3| 1.1345
|Individu n 8
|| 4| 1.1645
|Individu n 16
|
| 5| 1.2330
|Individu n 17
|| 6| 1.2630
|Individu n 7
|
| 7| 1.3745
|Individu n 13
|| 8| 1.9873
|Individu n 11
|
| 9| 2.2205
|Individu n 3
|| 10| 2.2890
|Individu n 18
|
+---+-----------+--------------------++---+-----------+--------------------+
CLASSE
3/ 3
EFFECTIF:
4
---------------------------------------------------------------------------|RG | DISTANCE | IDENT.
||RG | DISTANCE | IDENT.
|
+---+-----------+--------------------++---+-----------+--------------------+
| 1|0.49902
|Individu n 5
|| 2|0.49902
|Individu n 15
|
| 3| 1.0840
|Individu n 14
|| 4| 1.2062
|Individu n 6
|
+---+-----------+--------------------++---+-----------+--------------------+
31
Podemos describir las clases en funcin de las modalidades, individuos, variables, etc.
Por defecto, trabajaremos con los parmetros que ya vienen implementados. Si
deseamos cambiar el nvel de significacin (por defecto el 1%), vamos a la hoja de
caracterizacin de la particin, luego a caracterizar las clases, y en los botones de opciones,
donde pone Seuil (aparece por defecto 1) ponemos un 5 para trabajar al nivel del 5%.
DESCRIPTION DE PARTITION(S)
DESCRIPTION DE LA COUPURE 'a' DE L'ARBRE EN 3 CLASSES
CARACTERISATION DES CLASSES PAR LES MODALITES
CARACTERISATION PAR LES MODALITES DES CLASSES OU MODALITES
DE COUPURE 'a' DE L'ARBRE EN 3 CLASSES
CLASSE 1 / 3
---------------------------------------------------------------------------------------------------------------------------------V.TEST PROBA ---- POURCENTAGES ---- MODALITES
IDEN POIDS
CLA/MOD MOD/CLA GLOBAL CARACTERISTIQUES
DES VARIABLES
---------------------------------------------------------------------------------------------------------------------------------22.22 CLASSE 1 / 3
aa1a
4
2.94 0.002
80.00 100.00 27.78 Discoteca mucho
Discoteca
Di03
5
2.28 0.011
57.14 100.00 38.89 Bares mucho
Bares
Ba03
7
2.28 0.011
57.14 100.00 38.89 Estudios primarios
Estudios
Es01
7
2.00 0.023
50.00 100.00 44.44 Lectura nada
Lectura
Le01
8
---------------------------------------------------------------------------------------------------------------------------------CLASSE 2 / 3
---------------------------------------------------------------------------------------------------------------------------------V.TEST PROBA ---- POURCENTAGES ---- MODALITES
IDEN POIDS
CLA/MOD MOD/CLA GLOBAL CARACTERISTIQUES
DES VARIABLES
---------------------------------------------------------------------------------------------------------------------------------55.56 CLASSE 2 / 3
aa2a
10
3.08 0.001 100.00
80.00 44.44 Discoteca poco
Discoteca
Di02
8
2.28 0.011 100.00
60.00 33.33 Lectura poco
Lectura
Le02
6
2.28 0.011 100.00
60.00 33.33 Estudios medios
Estudios
Es02
6
1.89 0.029 100.00
50.00 27.78 Msica poco
Msica
Mu01
5
---------------------------------------------------------------------------------------------------------------------------------CLASSE 3 / 3
---------------------------------------------------------------------------------------------------------------------------------V.TEST PROBA ---- POURCENTAGES ---- MODALITES
IDEN POIDS
CLA/MOD MOD/CLA GLOBAL CARACTERISTIQUES
DES VARIABLES
---------------------------------------------------------------------------------------------------------------------------------22.22 CLASSE 3 / 3
aa3a
4
3.41 0.000 100.00 100.00 22.22 Lectura mucho
Lectura
Le03
4
2.94 0.002
80.00 100.00 27.78 Discoteca nada
Discoteca
Di01
5
2.94 0.002
80.00 100.00 27.78 Estudios superiores Estudios
Es03
5
2.08 0.019
75.00
75.00 22.22 Bares nada
Bares
Ba01
4
1.70 0.044
60.00
75.00 27.78 Msica mucho
Msica
Mu03
5
----------------------------------------------------------------------------------------------------------------------------------
32