Vous êtes sur la page 1sur 0

Iniciacin al Stagraphics 1

PRCTICAS DE ESTADSTICA DESCRIPTIVA



INTRODUCCIN AL MANEJO DE STATGRAPHICS


I. INTRODUCCIN Y CONCEPTOS BSICOS


El programa Statgraphics es un software que est diseado para facilitar el anlisis estadstico de
datos. Mediante su aplicacin es posible realizar un anlisis descriptivo de una o varias variables,
utilizando grficos que expliquen su distribucin o calculando sus medidas caractersticas. Entre sus
muchas prestaciones, tambin figuran el clculo de intervalos de confianza, contrastes de hiptesis,
anlisis de regresin, anlisis multivariantes, as como diversas tcnicas aplicadas en Control de
Calidad.
El programa trabaja en un entorno WINDOWS y se puede arrancar de tres formas:
Ejecutando el programa SGWIN.EXE
Directamente haciendo doble clic sobre el icono correspondiente
Desde el men Inicio y seleccionando sucesivamente Programas/Statgraphics Plus 5.1/ Sgwin)

Su pantalla principal es la siguiente:



(Para salir del programa seleccionamos en la barra de men ARCHIVO...SALIR DE
STATGRAPHICS o simplemente se cierra la ventana principal de la aplicacin)

Iniciacin al Stagraphics 2
En la pantalla principal de Statgraphics, podemos distinguir los siguientes elementos:

1. Barra de men
2. Barra de herramientas
3. Barra de tareas

Analicemos ahora cada uno de los elementos que podemos encontrar en la ventana principal.

Barra de men



La barra de men siempre estar disponible al utilizar el programa, de forma que sea posible
seleccionar el anlisis deseado.

Al hacer clic con el ratn sobre cada una de las palabras que componen la barra, aparecer un
men desplegable con otras opciones asociadas. As tendremos:

Archivo: permite realizar operaciones de carcter general: abrir, cerrar o grabar ficheros,
imprimir y salir de Statgraphics.

Edicin: como en otras aplicaciones en entorno Windows, este men esta asociado a diversas
opciones de edicin: cortar, copiar, pegar, deshacer...

Grficos, Descripcin, Comparacin, Dependencia, Avanzado: al presionar con el ratn sobre
ellos tendremos acceso a diversos mens de anlisis de Statgraphics que se irn analizando a
lo largo de este manual.

SnapStats!!, Ver, Ventana, Ayuda: tienen disponible varias opciones de formato y ayuda, de
forma similar a otras aplicaciones que trabajan en el mismo entorno.

Barra de herramientas



La barra de herramientas tiene como funcin asociar iconos (botones rpidos) con algunas de las
opciones ms frecuentemente utilizadas de la barra de men. Si se seala con el ratn cualquier
botn de la barra, aparecer una breve descripcin de la funcin asociada.

Barra de tareas

Incluye iconos asociados que contendrn los datos que se analizan, comentarios personales sobre
el anlisis, resultados del anlisis efectuado y comentarios e interpretaciones del programa de los
resultados obtenidos. El conjunto de estos elementos forma el Statfolio.




Iniciacin al Stagraphics 3
Statadvisor: herramienta incorporada al programa, que interpreta de forma sencilla los
resultados obtenidos.

Statgallery: permite almacenar los resultados (grficos incluidos) del anlisis realizado. Al
realizar cualquier anlisis estadstico, el sistema genera una ventana de anlisis, que estar
dividida en paneles conteniendo las diferentes partes del anlisis. Haciendo clic con el botn
derecho del ratn sobre cada uno de estos paneles y seleccionando Copiar ventana a Galera,
podremos incluir el panel del Statgallery al utilizar la opcin de Copiar una vez posicionados
con el ratn sobre el panel de destino. (La configuracin de los paneles del Statgallery es
seleccionable sin ms que desplazar con el ratn las barras horizontales y verticales).

Sin Nombre Comentarios y Statreporter: opciones de Statgrafics que permiten introducir los
comentarios de usuario para su posterior edicin.

Ventana de datos: hoja de clculo que contiene los datos que se van analizar. Pueden
introducirse directamente desde el teclado o recuperarse desde un fichero ya grabado.
(ARCHIVO...ABRIR...ABRIR DATOS).

Al conjunto de los elementos anteriores se le denomina Statfolio, que puede almacenarse bajo
un nombre nico (fichero .spg) activando la opcin ARCHIVO...GUARDAR... GUARDAR
STATFOLIO. Si abrimos un Statfolio previamente guardado y continuamos con el anlisis
estadstico, cualquier modificacin que se realice sobre los datos se transmitir
automticamente sobre todos los anlisis previamente realizados, por lo que la principal
utilidad del Statfolio es repetir un anlisis sistemticamente sobre distintos conjuntos de datos.

TRABAJAR CON DATOS EN STATGRAPHICS

Los datos que van analizarse mediante Statgraphics pueden introducirse directamente desde el
teclado en la ventana de datos. Los datos pueden agruparse formando una variable (cada una de
las columnas de la hoja de clculo de constituye la ventana de datos).

Para poder analizar una variable (es decir, los datos que contiene) es necesario definirla realizando
las siguientes operaciones:
Seleccionamos la columna en la que queremos introducir los datos. Para ello hacemos clic
sobre la etiqueta de la columna (Inicialmente ser Col_1)

Iniciacin al Stagraphics 4
Pulsamos con el botn derecho del ratn sobre la columna seleccionada. Aparecer un men del
que seleccionamos la opcin Modificar Columna:

























En esta pantalla escribiremos el nombre de la variable (mximo 32 caracteres, sin blancos ni signos
especiales y utilizando siempre una letra como primer carcter), y el tipo de variable (Numrica si
vamos a analizar nmeros). Tras pulsar ACEPTAR ya estamos en condiciones de introducir los
datos en las distintas celdas que componen la columna.

A continuacin vemos como se han introducido un conjunto de datos agrupados en la variable
EJEMPLO

Iniciacin al Stagraphics 5
Statgraphcis permite introducir columnas calculadas como una transformacin de otras columnas
previamente definidas. Para ello realizaremos las siguientes operaciones:
1. Seleccionamos la columna donde queremos que aparezcan los datos calculados
2. Hacemos clic con el botn derecho del ratn y elegimos la opcin Generar datos del men
que aparece
3. Componemos, en la ventana que aparece, la expresin para el clculo de los nuevos datos:
(en este caso multiplicaremos por 2 la variable EJEMPLO)


Al pulsar ACEPTAR nos aparecer en la ventana de datos el clculo deseado:


Los ficheros de datos generados pueden almacenarse para anlisis posteriores. Para ello, en el
men ARCHIVO seleccionaremos GUARDAR DATOS / GUARDAR DATOS COMO... y elegiremos
el nombre y la ubicacin del archivo deseada. (Podrn recuperarse posteriormente con la opcin
ABRIR / ABRIR DATOS del men ARCHIVO).
Iniciacin al Stagraphics 6
II. ESTADSTICA DESCRIPTIVA / GRFICOS DE DATOS

La Estadstica Descriptiva se ocupa de presentar, de forma resumida, la informacin ms importante
de un conjunto de datos. Para ello se calculan sus medidas centrales (media, mediana...) y se da
una medida de cmo estn los datos dispersos en torno a esos valores centrales (varianza,
desviacin tpica, rango...). Asimismo, tras un anlisis descriptivo, se dispondr de una
representacin de los datos en forma de grficos, de forma que sea posible detectar valores
atpicos, tendencias o agrupaciones.

Las diferentes opciones de anlisis descriptivo de las que dispone Statgraphics estn incluidas en la
opcin DESCRIPCIN de la barra de men.

Mostraremos las opciones ms importantes de un anlisis descriptivo a travs de un ejemplo. Se
forma la base de datos con una serie de personas a las que se les ha medido su altura, peso,
nmero de pie (zapatos), estatura del padre y sexo, como aparece a continuacin:



Resumen estadstico

El Resumen Estadstico nos reproduce hasta 19 estadsticos (valores numricos caractersticos) de
un conjunto de datos.

Para ello, en la pantalla de entrada de datos tendremos que introducir la variable que se quiere
analizar, tal y como aparece a continuacin:
Iniciacin al Stagraphics 7


Una vez seleccionada la variable a analizar, debe marcarse la opcin de RESUMEN ESTADSTICO
en el men de OPCIONES TABULARES:



Iniciacin al Stagraphics 8
Por defecto, aparecern calculados los estadsticos de uso ms comn, como puede verse en la
figura que sigue:



Sin embargo pueden seleccionarse otros estadsticos que Statgraphics calcula sin ms que
haciendo clic con el botn derecho del ratn sobre el panel de RESUMEN ESTADSTICO y activar
la opcin de OPCIONES DE VENTANA:



Iniciacin al Stagraphics 9
Activando la opcin de cualquiera de los estadsticos que estn incluidos en la ventana que
aparece, el resultado de su clculo se mostrar inmediatamente por pantalla al apretar el botn
ACEPTAR.

El RESUMEN ESTADSTICO puede obtenerse simultneamente para varias variables, sin ms que
entrar en al anlisis mltiple de variables: DESCRIPCIN... DATOS NUMRICOS ANLISIS
MULTIDIMENSIONAL.


Tabla de frecuencias

La tabla de frecuencias nos permite resumir la distribucin de los datos contenidos en una variable.
Al igual que el RESUMEN ESTADSTICO, la opcin de la TABLA DE FRECUENCIAS se activa en
el men de OPCIONES TABULARES del anlisis descriptivo de una variable. Como resultado del
anlisis, Statgraphcis crea una serie de intervalos que constituyen una particin del rango de los
datos estudiados; la tabla nos dar informacin del nmero de datos que tienen su valor dentro de
cada intervalo.



El nmero de observaciones en cada intervalo ser la frecuencia absoluta, mientras que el
porcentaje que esas observaciones representa frente al total se llama frecuencia relativa. (El
programa presenta tambin las frecuencias acumuladas para cada una de los intervalos).
Iniciacin al Stagraphics 10
El nmero de intervalos (tambin llamados clases) en los que se divide el rango de los datos puede
modificarse haciendo clic con el botn derecho del ratn sobre la tabla y seleccionando la opcin
OPCIONES DE VENTANA:


La tabla de frecuencias no slo puede aplicarse a datos numricos, sino tambin a variables
cualitativas. As en el fichero cardata.sf se recogen diferentes variables de automviles junto con el
nombre de su fabricante:



Veamos como podemos aplicar la tabla de frecuencias a la variable que contiene el fabricante del
vehculo. Para ello se sigue DESCRIPCIN... DATOS CUALITATIVOS... TABULACIN, se procede
a incluir la variable make que contiene la marca del coche, se ACEPTA y despus se marca la
opcin TABLA DE FRECUENCIAS del men de Opciones Tabulares (botn amarillo). El resultado
es el que continuacin se muestra:


Iniciacin al Stagraphics 11


Donde obtenemos informacin sumaria de los vehculos que aporta cada fabricante a la muestra y
de su frecuencia de aparicin.

Histograma de frecuencias

Los histogramas de frecuencias son representaciones grficas de las tablas de frecuencias
estudiadas con anterioridad, donde a cada intervalo o clase en que se divide el rango de los datos,
se le asigna una barra cuya altura es proporcional a la frecuencia de aparicin de sus elementos.

El histograma se encuentra en las opciones grficas del men DESCRIPCIN... DATOS
NUMRICOS ANLISIS UNIIDIMENSIONAL, tal y como puede verse en la figura que sigue:


Iniciacin al Stagraphics 12

El resultado se muestra en la siguiente pantalla:
Histograma
140 150 160 170 180 190 200
ALTURA
0
4
8
12
16
20
24
f
r
e
c
u
e
n
c
i
a

Donde podemos ver que el histograma presenta informacin sobre la variable analizada. En los
datos analizados, la altura ms frecuente entre los individuos analizados est entre 174 y 182 cms.

Percentiles

Los percentiles de una variable proporcionan informacin sobre como estn distribuidos los datos
estudiados. El percentil de orden k de una distribucin es una valor que es mayor que el k % de los
valores que toma la variable. As el percentil 10 es aquel valor de los datos estudiados que es
mayor que el 10% de las observaciones. Son importantes los percentiles 25 (cuartil inferior), 50
(mediana) y 75 (cuartil superior). Los percetiles pueden obtenerse en la opcin opciones tabulares
del men DESCRIPCIN... DATOS NUMRICOS ANLISIS UNIIDIMENSIONAL.

Iniciacin al Stagraphics 13
El resultado es el siguiente:
________________________________________________________________
Per cent i l es par a ALTURA

1, 0%= 151, 0
5, 0%= 154, 0
10, 0%= 162, 0
25, 0%= 168, 0
50, 0%= 175, 0
75, 0%= 180, 0
90, 0%= 183, 0
95, 0%= 185, 0
99, 0%= 190, 0

El St at Advi sor
- - - - - - - - - - - - - -
Est e cuadr o muest r a l os per cent i l es de l a muest r a par a ALTURA. Los
per cent i l es son val or es baj o l os cual es se encuent r an por cent aj es
espec f i cos de dat os. Puede ver l os per cent i l es gr f i cament e
sel ecci onando Gr f i co Cuant i l de l a l i st a de Opci ones Gr f i cas.
________________________________________________________________

Diagrama de caja

El diagrama de caja es una representacin grfica de una variable en la que a partir de sus
percentiles se obtiene informacin sobre la distribucin de sus observaciones (concentracin o
dispersin de los datos o existencia de valores atpicos).

El diagrama de caja se construye a partir de los percentiles 25%, 50% (mediana) y 75 %. Como
medida de la dispersin se utiliza el rango intercuartlico (percentil 75 % - percentil 25%) de manera
que cualquier dato que se aleje de los percentiles 25 75% una distancia superior a 1,5 veces el
rango intercuartlico se considera atpico.

Para obtener el diagrama de caja de una variable se sigue la ruta DESCRIPCIN... DATOS
NUMRICOS ANLISIS UNIIDIMENSIONAL....y se marca GRFICO DE CAJ A Y BIGOTES en el
men de opciones grficas.


Iniciacin al Stagraphics 14
El resultado es el siguiente:
Grfico de Caja y Bigotes
ALTURA
150 160 170 180 190

En el diagrama se debe observar: la forma de los rectngulos que forman la caja (cuanto ms
estrechos sean, indicarn una mayor concentracin de datos); la posicin de la media, marcada con
una cruz, respecto de la mediana, lnea central de la caja (la coincidencia de ambas indica simetra
de la distribucin), y la existencia de valores ticos (quedan fuera de los segmentos de longitud 1,5
veces el rango intercuartlico colocados a derecha a izquierda).

En ocasiones puede ser til observar simultneamente dos diagramas de la caja: por ejemplo para
la variable altura en la que se separan los valores de las observaciones en funcin del diferente
sexo de los individuos. Esta opcin est disponible en el men DESCRIPCIN... DATOS
NUMRICOS ANLISIS DE SUBGRUPO....y se incluyen las variables como aparece de acuerdo
con la disposicin de nuestros datos.

El resultado obtenido (tras seleccionar la opcin de GRFICO DE CAJ A Y BIGOTES en el men de
opciones grficas) es el siguiente:
Grfico de Caja y Bigotes
ALTURA
S
E
X
O
1
2
150 160 170 180 190


Iniciacin al Stagraphics 15
De forma que es posible analizar simultneamente una variable discriminada segn el criterio de
seleccin.

(Esta misma representacin simultnea de grficos tambin est disponible cuando se quiera
observar el histograma de una variable).

Diagrama de sectores

El diagrama de sectores proporciona informacin sobre las categoras en que puede dividirse una
variable (y la importancia relativa de las mismas).

Para ensayar su aplicacin utilizaremos el fichero cardata.sf que contiene datos de diferentes
automviles fabricados en el mundo. Siguiendo el men DESCRIPCIN... DATOS
CUALITATIVOS... TABULACIN


y activamos la opcin de DIAGRAMA DE SECTORES en el men de Opciones Grficas, veremos el
diagrama de sectores que nos dar la distribucin de las diferentes categoras en que puede
dividirse la variable make (que contiene marcas de coches) cuando la variable origin toma el valor 3
(lo que equivale a estudiar nicamente coches fabricados en J apn).
Diagrama de Sectores de make
make
Datsun
Honda
Mazda
Nissan
Subaru
Toyota
27,27%
20,45%
20,45%
2,27%
4,55%
25,00%


Iniciacin al Stagraphics 16
De modo que es posible analizar grficamente la importancia relativa de los fabricantes de coches
radicados en J apn.

Diagrama de barras

Mediante este grfico es posible obtener informacin sobre las diferentes categoras en que puede
dividirse una variable.
As por ejemplo en el fichero cardata.sf podemos analizar los coches fabricados en Amrica (origin
= 1), en Europa (origin =2) o en J apn (origin=3) sin ms que hacer DESCRIPCIN... DATOS
CUALITATIVOS... TABULACIN.



Y seleccionar la opcin DIAGRAMA DE BARRAS de las Opciones Grficas.

Diagrama de Barras de origin
0
20
40
60
80
100
f
r
e
c
u
e
n
c
i
a
1 2 3

La representacin del grfico de barras permite cruzar dos variables y analizar por ejemplo el
nmero de cilindros del automvil (variable cylinder) segn su origen (variable origin).

Para ello seleccionamos el men DESCRIPCIN... DATOS CUALITATIVOS... TABULACIN
CRUZADA.


Iniciacin al Stagraphics 17


Activando la opcin del DIAGRAMA DE BARRAS de las Opciones Grficas, se obtiene:



cylinders
f
r
e
c
u
e
n
c
i
a
Diagrama de Barras para cylinders segn origin
origin
1
2
3
0
10
20
30
40
50
3 4 5 6 8



Lo que nos permite hacer un anlisis de las dos variables: por ejemplo puede verse que coches con
8 cilindros slo son fabricados en Amrica.

Iniciacin al Stagraphics 18
Grficos de dispersin o Scatterplots

Los grficos de dispersin proporcionan informacin acerca de la distribucin de una variable. Son
especialmente tiles los grficos XY, pues permiten analizar la relacin entre dos variables.

Para visualizarlos se sigue el men GRFICOS... GRFICOS DE DISPERSINGRFICO X-Y:



Como resultado obtenemos eL diagrama que nos permite ver la distribucin conjunta de ambas
variables, y por tanto su relacin lineal, en la que al aumentar la altura de una persona tambin lo
har su peso. (Como puede verse, tambin est permitida la seleccin de valores de las variables
mediante una variable de seleccin, en el caso estudiado sexo)

Grfico de PESO frente a ALTURA
150 160 170 180 190
ALTURA
47
57
67
77
87
P
E
S
O

Vous aimerez peut-être aussi