Vous êtes sur la page 1sur 14

Estad stica Descriptiva

Luis A. Navarro H.
Marzo, 2013

Indice
1 Introducci on al Minitab 1.1 Entorno de Trabajo del Minitab . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Estad stica Descriptiva 2.1 Variables . . . . . . . . . . . . . . . . . 2.2 Distribuciones de Frecuencias . . . . . . 2.3 Res umenes Gr acas . . . . . . . . . . . 2.3.1 Gr aco para Datos Cualitativos . 2.3.2 Gr aco para Datos Cuantitativos 2.4 Medidas de Resumen . . . . . . . . . . . 2.4.1 Medidas de Posici on . . . . . . . 2 2 4 4 4 9 9 9 10 10

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

Cap tulo 1

Introducci on al Minitab
El software Minitab contiene un conjunto de m etodos estad sticos implementados y listo para ser utilizados en cada problema que se tenga que resolver y en donde se involucre el azar. Los m etodos estad sticos son dirigidos para diversas areas de ingenier a, negocios, ciencia y tecnolog a, etc., y comunidad en general. Entre los m etodos estad sticos contenidos en el Minitab tenemos a Estad stica Descriptiva, modelos lineales y no lineales, an alisis multivariado, control estad stico de procesos, etc., entre otros. No obstante, se debe tener en consideraci on que no es posible asimilar en su totalidad esta disponibilidad de recursos sino se acompa na de un conocimiento previo de los conceptos que soportan dichos m etodos estad sticos. Para iniciar el Minitab, se debe seleccionar la siguiente ruta en el men u del Windows, Inicio > Programas > Minitab > Minitab 16 Statistical Software

1.1

Entorno de Trabajo del Minitab

Es el espacio de trabajo del Minitab, y comprende la ventana Worksheet y la ventana Session ver Figura 1.1.

AL MINITAB CAP ITULO 1. INTRODUCCION

Figura 1.1: Entorno de Trabajo del Minitab

Cap tulo 2

Estad stica Descriptiva


La Estad stica Descriptiva comprende m etodos de an alisis estad stico para explorar, describir y resumir informaci on mediante la tabulaci on de los datos y presentaci on de estos mediante gr aco y tablas. La tabulaci on de estos datos se representan mediante distribuciones de frecuencias y dependen del tipo de medici on de los datos que se disponga. La estad stica descriptiva permite explorar la informaci on a partir de los datos recopilados permitiendo la b usqueda de patrones de comportamiento que muchas veces a simple vista no resultan detectados. Muchas veces, un an alisis descriptivo precede a un proceso de an alisis y construcci on de modelos matem aticos. Es decir, un an alisis exploraci on de los datos precede tambi en a la formulaci on de conjeturas o hip otesis a ser contrastadas con un estudio posterior.

2.1

Variables

La medici on de los datos ser a hecha teniendo en cuenta que si se trata de datos num ericos o cuantitativos, nos referiremos como variable, mientras que si se trata de datos no num ericos o cualitativos, nos referiremos como atributo. Las variables se sub dividen en discretos y continuos, mientras que los atributos se sub dividen en nominal y ordinal. Una variable discreta puede tomar valores nitos o innitos contables, y una variable continua puede tomar una innidad no contable de valores. En este breve material se tratar a de organizar y resumir informaci on contenida en variables de un conjunto de datos

2.2

Distribuciones de Frecuencias

La distribuci on de una variable est a determinado por los valores que toma esta variable y la frecuencia con que los toma. En un conjunto de datos la frecuencia absoluta de un valor (o de un intervalopara el caso de una variable continua), es el n umero de veces que la variable toma este valor (o pertenece a este intervalo para el caso de una variable continua) A continuaci on, se denir a la distribuci on de frecuencia para una variable cuantitativas. Suponga que se ha recopilado un conjunto de datos de tama no N de una variable estad stica X. Denici on Una tabla que resume los datos de una variable estad stica se denomina de distribuci on de frecuencia

CAP ITULO 2. ESTAD ISTICA DESCRIPTIVA

Para el caso de variables cuantitativas, una distribuci on de frecuencias pueden ser de dos tipos: simple o agrupadas en intervalos. Una distribuci on de frecuencias simples presenta los datos en su forma extensaVer Figura 2.1. La primera columna representa los distintos valores de la variable.

Figura 2.1: Distribuci on de frecuencias de una variable cuantitativadatos simples

Denici on Se denomina frecuencia absoluta al n umero de veces que se repite un valor. La frecuencia absoluta del valor xi se representa por ni . Se dene a la frecuencia relativa a la raz on entre la frecuencia absoluta y el total de observaciones. La frecuencia relativa i del valor xi es dado por fi = n N para i = 1, 2, ..., k Denici on La frecuencia absoluta acumulada Ni correspondiente al valor xi es el n umero de observaciones menores o iguales que xi , viene dado por Ni = n1 + n2 + ... + ni = Ni1 + ni donde i = 1, 2, ..., k y N1 = n1 . Se dene a la frecuencia relativa acumulada de xi a la proporci on Fi de elementos menores o iguales que xi , y es dado por Fi = f1 + f2 + ... + fi = Fi1 + fi = donde i = 1, 2, ..., k y F1 = f1 Ejemplo 1.1 Se dispone de un registro de 120 datos sobre edades de trabajadores de una compa n a minera (Archivo Trab Altura.MTW) y se desea obtener una distribuci on de frecuencias de estos valores.
Soluci on.- Para obtener dicha distribuci on utilizando el Minitab se deben ejecutar los siguientes pasos: Paso 1 Se debe convertir la Variable Num erica Edad para una variable no Num erica EdadText. Para ello ejecutar la siguiente secuencia de acciones en el Minitab, Data > Change Data Type > Numeric to Text... Seleccionar la variable Edad y etiquetar la nueva variable tipo texto EdadText, luego teclee OK. Ver Figura 2.2 Paso 2 Para obtener la distribuci on de frecuencias se ejecuta Stat > Tables > Tally Individual Variables..., seleccionar todas las opciones disponiblesPara obtener las frecuencias absolutas y relativas respectivamente, luego OK. Ver Figura 2.3

Ni N

En el ejemplo anterior, se debe observar que si una variable num erica puede tomar muchos posibles valores, no es muy conveniente obtener una distribuci on de frecuencia en estas condiciones pues complicar a la descripci on que se busca de dicha distribuci on. Cuando en la

CAP ITULO 2. ESTAD ISTICA DESCRIPTIVA

Figura 2.2: Conversi on de datos num ericos para no num ericos

Figura 2.3: Frecuencias absolutas y relativas

CAP ITULO 2. ESTAD ISTICA DESCRIPTIVA

muestra existen muchos diferentes valores y por lo tanto mucha variabilidad se recomienda, a un a costa de perder informaci on, agrupar los datos en clases o intervalos para obtener una distribuci on de frecuencias agrupados en intervalos. Para la obtenci on de dicha distribuci on de frecuencias agrupados se divide el rango de valores en intervalos, y a continuaci on se cuenta el n umero de observaciones que hay en cada intervalo. Los elementos de una distribuci on de frecuencias agrupados son los mismos que en una distribuci on de frecuencias simple, en donde en la primera columna se colocan los intervalos de clase.Ver Figura 2.4

Figura 2.4: Distribuci on de frecuencias de una variable cuantitativadatos agrupados

Ejemplo 1.2 [Continuaci on Ejemplo 1.1] Se dispone de un registro de 120 datos sobre Estatura de trabajadores de dicha compa n a minera y se desea obtener una distribuci on de frecuencias agrupados
Soluci on.- Para obtener dicha distribuci on utilizando el Minitab se deben ejecutar los siguientes pasos: Paso 1 Generar una nueva variable Frecuencia (crear una nueva variable mediante codicaci on) ejecutando las siguientes acciones Data>Code>Numeric to Text. Identicar el m nimo y el m aximo de estos valores para determinar un n umero posible de intervalos de claseen este caso el m nimo y m aximo son 1,48 y 1,84. Determinar el n umero de intervalos de clase como sus l mites inferior y superior. La Figura 2.5 muestra un ejemplo para el caso de valores de la variable Estatura on de frecuencias de datos agrupados se ejecuta Stat > Paso 2 Para obtener la distribuci Tables > Tally Individual Variables..., seleccionar todas las opciones disponiblesPara obtener las frecuencias absolutas y relativas respectivamente, luego OK. Ver Figura 2.6

Para el caso de una variable cualitativa (valores no num ericos) la situaci on es similar. La Figura 2.7 muestra la distribuci on de frecuencias para una variable cualitativaLa primera columna representa los distintos valores de la variable Ejemplo 1.3 [Continuaci on Ejemplo 1.1] Se dispone de un registro de 120 datos sobre Tabaquismo de trabajadores de dicha compa n a minera y se desea obtener una distribuci on de frecuencias de estos valores no num ericos.

CAP ITULO 2. ESTAD ISTICA DESCRIPTIVA

Figura 2.5: Distribuci on de frecuencias datos agrupados

Figura 2.6: Frecuencias absolutas y relativas para datos agrupados

Figura 2.7: Distribuci on de frecuencias de una variable cualitativa

CAP ITULO 2. ESTAD ISTICA DESCRIPTIVA

Soluci on.- Para obtener la distribuci on de frecuencias se ejecuta Stat > Tables > Tally Individual Variables..., seleccionar todas las opciones disponiblesPara obtener las frecuencias absolutas y relativas respectivamente, luego OK. Ver Figura 2.8

Figura 2.8: Frecuencias absolutas y relativas para una variable cualitativa

2.3

Res umenes Gr acas

En esta secci on se presentar a representaciones gr acas de las distribuciones de frecuencias de variables num ericas y no num ericas

2.3.1

Gr aco para Datos Cualitativos

Gr aco de Barras Se representan las distintas modalidades en el eje de las abscisas, dibujando sobre cada una de ellas un rect angulo cuya altura es igual a la correspondiente frecuencia absoluta ni o relativa fi . Se utiliza tambi en para el caso de representaci on gr aca de variables cuantitativas discretas Gr aco Circular o de Sectores Consiste en representar sobre un c rculo los diferentes atributos teniendo en cuenta que cada sector circular tiene un angulo proporcional a la correspondiente frecuencia. El angulo de o cada sector circular se calcula multiplicando por 360 la frecuencia relativa.

2.3.2

Gr aco para Datos Cuantitativos

Histograma La idea del Histograma es representar frecuencias por medio de areas. Se construye dibujando sobre cada intervalo un rect angulo de area proporcional a la frecuencia absoluta correspondiente a dicho intervalo. Si las longitudes de los intervalos no son iguales, cada rect angulo ni tendr a una altura igual a la densidad de la frecuencia di = ci , con ci siendo la longitud del i- esimo intervalo. Si por el contrario, las longitudes de los intervalos son iguales, se utiliza como altura la frecuencia absoluta ni . Un gr aco que se origina como consecuencia de la construcci on del Histograma es el Pol gono de Frecuencia. Este gr aco se forma al unir los puntos medios de las bases superiores de los rect angulos del histograma y cerrar el pol gono cortando el eje de las abscisas, de forma que el area encerrada entre el pol gono de frecuencias y el eje horizontal coincida con el area del Histograma.

CAP ITULO 2. ESTAD ISTICA DESCRIPTIVA Diagrama de Puntos

10

Si el conjunto de datos es peque no, el diagrama de puntos es un gr aco que mejor describe la informaci on y brinda informaci on similar al histograma. Para su construcci on, se divide el rango de variaci on de los datos en un n umero adecuado de intervalos; Cada dato se representa con un punto sobre la correspondiente marca de clase o localizaci on del intervalo;

2.4

Medidas de Resumen

En la secci on anterior se deni o a la distribuci on de frecuencias de una variable estad stica como una representaci on gr aca y/o una tabla de frecuencias. Muchas veces, es de inter es resumir informaci on de todo el conjunto de datos en medidas u nicas de posici on, dispersi on, o forma de la distribuci on de frecuencias. Estas deniciones de las diferentes medidas corresponden solamente a una variable num erica. El Minitab permite analizar y resumir una distribuci on de frecuencias, calculando estas medidas de posici on, dispersion y de forma a partir del conocimiento de los datos recopilados de una variable estad stica de tipo num erico.

2.4.1

Medidas de Posici on

Es posible hablar de medidas de posiciones centrales como la media (aritm etica, geom etrica), la mediana y la moda; y medidas de posici on no centrales como los cuartiles, deciles y percentiles. En lo que sigue se dispone de un conjunto de datos representados a trav es de la variable estad stica X, cuya distribuci on de frecuencias viene dada por X = {xi , ni }.

Media
Denici on Se dene la media aritm etica de una variable estad stica de tipo cuantitativo como la suma de todos los valores entre el n umero total de observaciones. La f ormula para el c alculo de la media es dado por x=
k k 1 1 (x1 n1 + ... + xk nk ) = xi ni = xi fi N N i=1 i=1

Para el caso de distribuciones de frecuencias agrupadas el valor xi representa la marca de clase, que es el representante de cada intervalo. Propiedades 1. La media es el centro de gravedad de la distribuci on de frecuencias
k i=1

(xi x)ni

2. Efecto de un cambio de escala en los datos. Si y = bx entonces y = bx 3. Efecto de un cambio de origen en los datos. Si y = a + bx entonces y = a + bx

CAP ITULO 2. ESTAD ISTICA DESCRIPTIVA

11

Mediana
La media aritm etica es afectada por valores extremos de manera que un valor muy grande o muy peque no afecta el valor de la media. Con el prop osito de disponer de un valor promedio que dependa de la magnitud de los datos se dene la mediana Denici on Siempre que se disponga de los datos ordenados de menor a mayor. Se dene la Mediana, como aquel valor que deja a la derecha y a la izquierda el mismo n umero de observaciones Por lo tanto, el valor de la Mediana no depende del valor de los datos, sino de la posici on que ocupa dentro de la muestra. C alculo de la Mediana Se trata de encontrar un valor cuya frecuencia acumulada sea igual N/2. Datos no Agrupados En distribuciones no agrupadas en intervalos se siguen los siguientes pasos: Se ordenan los datos de menor a mayor Se obtienen las frecuencias acumuladas Ni y se calcula N/2 Si existe alg un dato xi de modo que Ni = N/2, la Mediana ser a cualquier valor dentro del intervalo < xi , xi+1 > y se toma como mediana el punto medio, es decir Me = (xi + xi+1 )/2 Caso contrario, la Mediana es el primer dato tal que Ni > N/2 Datos Agrupados En el caso de distribuciones agrupadas en intervalos, es necesario conocer en que intervalo se encuentra la Mediana (intervalo mediano), para posteriormente calcularla de modo aproximado. Los pasos a seguir son los siguientes Se calculan las frecuencias Ni y N/2 Se localiza el intervalo mediano, que es el primer intervalo cuya frecuencia acumulada es igual o mayor que N/2 Una vez localizado el intervalo mediano se aplica la f ormula Me = Li1 +
N 2

Ni1 ci ni

Esto u ltimo se deduce de la l nea recta que pasa por < Li1 , Ni1 > y < Li , Ni >, en donde se debe cumplir N Ni1 Me Li1 = 2 Li Li1 Ni Ni1 Ver Figura 2.9

Moda
Denici on La Moda es el valor de los datos con mayor frecuencia La Moda es entonces el valor que se repite m as veces y por tanto no tiene porque ser u nica. En distribuciones agrupadas se usa de nuevo una f ormula aproximada. Comenzamos suponiendo que todos los intervalos tienen la misma longitud. Se debe proceder de la siguiente manera

CAP ITULO 2. ESTAD ISTICA DESCRIPTIVA Los datos se distribuyen de manera uniforme en cada intervalo

12

Una vez localizado el intervalo modal la moda esta m as pr oxima al intervalo contiguo con mayor frecuencia, de modo que la distancia entre la Moda y los intervalos contiguos es inversamente proporcional a las frecuencias de esos intervalos En el caso de intervalos de distinta longitud, se trabaja con las densidades de cada i intervalo (di = n on h de la siguiente relaci on de ci ). La Moda se obtiene de la soluci proporcionalidad inversa observada en la Figura 2.10 ni+1 (Li h) = ni1 (h Li1 ) o ni+1 h Li1 = ni1 Li h despejando h se obtiene que la Moda es ni+1 M o = Li1 + ci ni1 + ni+1

Figura 2.9: C alculo de la Medianadatos agrupados

Figura 2.10: C alculo de la Modadatos agrupados

CAP ITULO 2. ESTAD ISTICA DESCRIPTIVA

13

Cuantiles: Cuartiles, Deciles y Percentiles


Los cuantiles son medidas de posici on no centrales que permiten dividir a los datos en grupos, de manera que cada grupo contiene el mismo n umero de observaciones. Comenzamos con los Cuartiles. En todo lo que sigue suponemos que los datos est an ordenados de menor a mayor. Cuartiles Los Cuartiles de una distribuci on son tres valores(primer cuartil segundo cuartil o Mediana y tercer cuartil), que dividen a la distribuci on en cuatro partes iguales, conteniendo cada parte el 25% de los datos. En el caso de distribuciones no agrupadas en intervalos, el c alculo de los cuartiles se realiza de manera similar a la Mediana. En el caso de distribuciones agrupadas se comienza localizando el intervalo donde se sit ua el cuartil, que ser a el primer intervalo tal que Ni > rN/4. Enseguida se aplica la f ormula Qr = Li1 + (r/4)N Ni1 ci ni r = 1, 2, 3

Donde, < Li1 , Li ]: Es el intervalo donde se encuentra el cuartil ni : Es la frecuencia del intervalo ci = Li Li1 : Longitud del intervalo Ni1 : Frecuencia acumulada del intervalo anterior Deciles Los Deciles de una distribuci on de frecuencias son nueve valores que dividen a la distribuci on en diez partes iguales, conteniendo cada parte el 10% de los datos. Para su c alculo en distribuciones agrupadas se procede de manera similar que los cuarteles. Una vez determinado el intervalo donde se encuentra el correspondiente decil, se aplica la f ormula Dr = Li1 + (r/10)N Ni1 ci ni r = 1, 2, ..., 9

Percentiles Los Percentiles de una distribuci on de frecuencias son noventa y nueve valores que dividen a la distribuci on en cien parte iguales, conteniendo cada parte el 1% de los datos. En distribuciones agrupadas se aplica la f ormula Pr = Li1 + (r/100)N Ni1 ci ni r = 1, 2, ..., 99

Una vez que se han determinado los intervalos en donde se encuentra el percentil.

Vous aimerez peut-être aussi