Académique Documents
Professionnel Documents
Culture Documents
Contreras T
ESTADISTICA
FIME
ESTADSTICA DESCRIPTIVA
En esta parte aprenderemos a trabajar con los datos y a resumirlos, de manera grfica y numrica, para convertirlos en informacin til para el problema en estudio. La estadstica descriptiva trata dos aspectos: el obtener informacin de los datos tambin conocido como anlisis exploratorio de datos y por otro lado se preocupa de la "presentacin de resultados". En este parte hablaremos sobre: Tipos de Variables Mtodos grficos y numricos para describir variables cualitativas - Tablas de distribucin de frecuencias. - Grficos para variables cualitativas: Sectorial y de Barras. Mtodos grficos para describir variables cuantitativas - Grfico de Puntos. - Diagrama de Tallo y Hojas. - Histograma. Mtodos numricos para describir variables cuantitativas - Medidas de Tendencia Central: Promedio, Mediana, Moda. - Medidas de Dispersin: Rango, Desviacin Estndar, Rango entre Cuarteles. - Medidas de Posicin Relativa. Transformaciones lineales y estandarizacin Definiciones: Unidad es el objeto que observamos. Cuando el objeto es una persona, lo referimos como sujeto. Observacin es la informacin o caracterstica que registramos de cada unidad. Una caracterstica que puede variar de unidad en unidad es llamada variable. Una coleccin de observaciones con una o ms variables se llama base de datos.
Variables cualitativas son aquellas que clasifican las unidades en categoras. Las categoras pueden tener un orden natural (ordinales) o no (nominales). Las variables cualitativas tambin se llaman variables categricas. Con estas variables podemos contar
1
Prof. V. Contreras T
ESTADISTICA
FIME
nmero de casos, comparar entre categoras, pero no podemos realizar operaciones numricas. Variables cuantitativas tienen valores numricos que representan medidas (largo, peso, etc.) o
frecuencias (nmero de). Tiene sentido realizar operaciones numricas con estas variables. Adems distinguimos dentro de las variables cuantitativas las discretas y las continuas. Una variable discreta es aquella en la cul se puede contar el nmero posible de valores. Una variable continua puede tomar cualquier valor en un intervalo dado. Ejemplo Nominal: est asociada a nombres. Ejemplo: Marca de auto, Sexo, Religin. Ordinal: tiene asociado un orden. Ejemplo: Nivel educacional, Estado nutricional, Nivel Socioeconmico. Discreta: slo puede tomar un nmero finito (o contable) de posible valores. Ejemplo: El nmero de respuestas correctas en una prueba de 5 preguntas de V o F. Continua: puede tomar cualquier valor en un intervalo(s). Ejemplo: Cantidad de agua en un vaso de 50 ml.
Prof. V. Contreras T
ESTADISTICA
FIME
DISTRIBUCION DE FRECUENCIAS
Lo primero que hacemos al querer describir variables cualitativas es contar cuntas unidades caen en cada categora de la variable. Esto lo presentamos en una tabla de distribucin de frecuencias, por ejemplo de la variable cualitativa: Razn de visita:
Grficos para variables cualitativas. Una vez que conocemos la distribucin de la variable, nos interesa presentarla de alguna manera grfica, uno de los grficos o diagramas ms usados en variables cualitativas son los diagramas sectoriales o de torta y los grficos de barra. Un grfico sectorial (o de torta) muestra la distribucin de una variable cualitativa dividiendo un crculo en partes que corresponden a las categoras de la variable, tal que el tamao (ngulo) de cada pedazo es proporcional al porcentaje de tems en cada categora. Un grfico de barras muestra la distribucin de una variable cualitativa listando las categoras o valores de la variable en el eje X y dibujando una barra sobre cada categora. La altura de la barra es igual al porcentaje de tems en esa categora. Las barras deben tener el mismo ancho.
3
Prof. V. Contreras T
ESTADISTICA
FIME
Prof. V. Contreras T
ESTADISTICA
FIME
Prof. V. Contreras T
ESTADISTICA
FIME
Prof. V. Contreras T
ESTADISTICA
FIME
Formas de distribuciones
Los trminos usados para describir la forma de una distribucin son: Simtrica: La distribucin puede ser dividida en dos partes alrededor de un valor central y cada parte es el reflejo de la otra. Sesgada: Un lado de la distribucin se alarga ms que el otro. La direccin del sesgo es la direccin del lado ms largo. Unimodal: La distribucin tiene un nico mximo que muestra el o los valores ms comunes en los datos. Bimodal: La distribucin tiene dos mximos. Esto resulta a menudo cuando la muestra proviene de dos poblaciones. Uniforme: Los valores posibles tienen la misma frecuencia
Prof. V. Contreras T
ESTADISTICA
FIME
Prof. V. Contreras T
ESTADISTICA
FIME
Usando el SPSS se tiene el diagrama de Tallos y Hojas para los datos de gastos semanales de la tienda VENDO
Diagrama de dispersin
Tambin llamado Scatterplot, muestra la dispersin de datos bivariados, los cuales consisten de observaciones pareadas obtenidas desde dos variables numricas. Es usado para detectar la posible relacin entre las dos variables.
Prof. V. Contreras T
ESTADISTICA
FIME
Diagrama de Cajas: Tambin llamado Boxplot, muestra la dispersin de la variable en estudio. Es usando para comparar la variabilidad de dos o ms conjuntos de datos.
es:
10
Prof. V. Contreras T
ESTADISTICA
FIME
2. LA MEDIANA Es el valor que ocupa la posicin central de un conjunto de observaciones ordenadas. El 50% de las observaciones son mayores que este valor y el otro 50% son menores. Para Datos No agrupados.
= El menor intervalo
Prof. V. Contreras T
ESTADISTICA
FIME
3. LA MODA Es el valor, clase o categora que ocurre con mayor frecuencia y sus caractersticas son: - Puede no existir o existir ms de una moda - Su valor no se ve afectado por los valores extremos en los datos - Se utiliza para analizar tanto la informacin cualitativa como la cuantitativa - Es una medida inestable cuando en nmero de datos es reducido. Para Datos No Agrupados. Por ejemplo, durante los ltimos 32 das el valor de las compras en peridicos fue: { 5.2, 10.2, 7.0, 7.1, 10.2, 8.3, 9.4, 9.2, 6.5, 7.1, 6.6, 7.8, 6.8, 7.1, 8.4, 9.6, 8.5, 5.7, 6.4, 10.1, 8.2, 9.0, 7.8, 8.2, 5.3, 6.2, 9.1, 8.6, 7.0, 7.7, 8.3, 7.5 } Moda = Mo = 7.1; Es el valor ms frecuente, ocurre 3 veces. Para Datos Agrupados.
12
Prof. V. Contreras T
ESTADISTICA
FIME
4. MEDIA GEOMTRICA Corresponde al valor representativo central de observaciones estrechamente relacionadas entre s tales como tasas de: inters, inflacin, devaluacin, variacin, crecimiento, disminucin. El promedio geomtrico de los valores: es:
secuenciales y
13
Prof. V. Contreras T
ESTADISTICA
FIME
5. PROMEDIO PONDERADO Cuando se desea encontrar el promedio de valores (X1 X2 ... Xk ) que ocurren con frecuencias (f1,f2 ... fk ) diferentes se debern ponderar los valores observados con pesos diferentes:
6. PROMEDIO TOTAL Corresponde al valor promedio representativo de grupos de observaciones separadas o diferentes y que podran estar consolidadas en tablas de frecuencia independientes, por tanto:
14
Prof. V. Contreras T
ESTADISTICA
FIME
7. MEDIA ARMNICA El promedio armnico de los valores: (X1 X2 ..... Xn ) donde ninguno toma el valor cero es:
Este promedio se utiliza para que los valores extremos no afecten al valor del promedio. Los valores extremos s afectan cuando se usa el promedio aritmtico o el promedio geomtrico.
15
Prof. V. Contreras T
ESTADISTICA
FIME
PERCENTILES, CUARTILES Y DECILES Para Datos Agrupados Percentiles: Son 99 valores que dividen a un conjunto de datos en 100 partes iguales.
Cuartiles: Son 3 valores Q1; Q2 y Q3 que dividen a los datos en 4 partes iguales El Cuartil 3 (Percentil 75%) se ubicar en el cuarto intervalo
Deciles: Son 9 valores D1, D2; D3; D4; D5; D6; D7; D8 y D9 que dividen a un conjunto de datos en 10 partes iguales.
16
Prof. V. Contreras T
ESTADISTICA
FIME
Para Datos No Agrupados El lugar o posicin donde se encuentran los cuartiles para n datos ordenados es:
17
Prof. V. Contreras T
ESTADISTICA
FIME
B. MEDIDAS DE VARIABILIDAD 1. AMPLITUD O RANGO Sean los valores: (x1 x2 x3 ... xn ). La amplitud o rango de estos dato es A=(Xmax-Xmin) 2. VARIANCIA Para Datos No Agrupados
Para Datos Agrupados La variancia de los valores: (x1 x2 ... xk ) que ocurren con las frecuencias (f1 f2 ... fk ) es:
18
Prof. V. Contreras T
ESTADISTICA
FIME
3. DESVIACIN ESTNDAR Es una medida de variabilidad que corresponde a la raz cuadrada de la variancia. Este indicador tiene la misma unidad de medida en la que se expresa el promedio.
4. COEFICIENTE DE VARIABILIDAD Es una medida de variabilidad de los datos que se expresa en porcentaje en la cual se compara la desviacin estndar con el respectivo valor del promedio de los datos:
C. MEDIDA DE FORMA: ASIMETRIA O SESGO Evala el grado de distorsin o inclinacin que adopta la distribucin de los datos respecto a su valor promedio tomado como centro de gravedad. El coeficiente de asimetra de Pearson es:
19
Prof. V. Contreras T
ESTADISTICA
FIME
GRAFICA DE CAJAS
El diagrama de caja se construye de la siguiente manera: Dibujar la caja que empieza en el primer cuartil y termina en el tercer cuartil. Dibujar la mediana con una lnea dentro de la caja Localizar los dos valores adyacentes por medio de la escala a lo largo del eje horizontal, y unamos a la caja con lneas horizontales llamados Bigotes. Cualquier valor atpico sospechoso se marca en el grfico con un (*) y est entre los bordes internos y externos los valores atpicos extremos se marcan con un crculo () y est.an fuera del borde externo NOTAS Los valores adyacentes son las ltimas observaciones en el conjunto ordenado antes del borde interno. Los bordes internos tambin son llamados limite inferior y limite superior y estn dadas por . los bordes externos estn dadas por .
20
Prof. V. Contreras T
ESTADISTICA
FIME
Si la distancia entre la mediana y los cuartiles es aproximadamente la misma podemos deducir que la distribucin de los datos es ms o menos simtrica como como se ve en el histograma y en el diagrama de tallo y hoja.
Del ejemplo, valores de compras en peridicos en los ltimos 32 dias del Hotel AAA { 5.2, 10.2, 7.0, 7.1, 10.6, 8.3, 9.4, 9.2, 6.5, 7.1, 6.6, 7.8, 6.8, 7.1, 8.4, 9.6, 8.5, 5.7, 6.4, 10.1, 8.2, 9.0, 7.8, 8.2, 5.3, 6.2, 9.1, 8.6, 7.0, 7.7, 8.3, 7.5 } Se tiene la grafica de cajas:
21
Prof. V. Contreras T
ESTADISTICA
FIME
22
Prof. V. Contreras T
ESTADISTICA
FIME
23