Académique Documents
Professionnel Documents
Culture Documents
OBJETIVO
El estudiante distinguir y aplicar los diferentes tipos de medidas de dispersin, as como sus ventajas y desventajas de cada uno de ellos.
TEMARIO
MAPA CONCEPTUAL INTRODUCCIN 7.1 RANGO ACTIVIDADES DE APRENDIZAJE 7.2 DESVIACIN MEDIA ABSOLUTA ACTIVIDADES DE APRENDIZAJE 7.3 VARIANZA PARA DATOS AGRUPADOS Y NO AGRUPADOS ACTIVIDADES DE APRENDIZAJE 7.4 DESVIACIN ESTNDAR ACTIVIDADES DE APRENDIZAJE 7.5 COEFICIENTE DE VARIACIN ACTIVIDADES DE APRENDIZAJE 7.6 MEDIDAS DE FORMA: ASIMETRA Y CURTOSIS ACTIVIDADES DE APRENDIZAJE AUTOEVALUACIN
MAPA CONCEPTUAL
7.1 RANGO
INTRODUCCIN
En esta unidad se tratarn las medidas de dispersin para datos agrupados y no agrupados.
7.1 RANGO
Se denomina rango o rango estadstico al intervalo de menor tamao que contiene a los datos; es calculable mediante la resta del valor mnimo al valor mximo; por ello, comparte unidades con los datos. Permite obtener una idea grosera de la dispersin estadstica de los datos. Por ejemplo, para una serie de datos de carcter cuantitativo como es la estatura tal y como:
x1 = 185,x2 = 165,x3 = 170,x4 = 182,x5 = 155 Es posible ordenar los datos como sigue:
x(1) = 155,x(2) = 165,x(3) = 170,x(4) = 182,x(5) = 185 La notacin x(i) indica que se trata del elemento i-simo de la serie de datos. De este modo, el rango sera la diferencia entre el valor mximo (k) y el mnimo; o, lo que es lo mismo: W = x(k) x(1) En nuestro ejemplo, con cinco valores, nos da que W = 185-155 = 30.
ACTIVIDAD DE APRENDIZAJE
El estudiante resolver problemas de rango, proporcionados por el profesor, de la bibliografa sugerida.
La desviacin media mide la cantidad promedio que varan los datos respecto a su media. La definicin es: Desviacin media. Es la media aritmtica de los valores absolutos de las desviaciones de los datos respecto a su media.
Ejemplo:
El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la lnea de produccin son (en ml): 85.4, 85.3, 84.9, 85.4, y 84.0. Cul es la desviacin media de las observaciones muestreadas? XX 85.4 85.4 85.3 84.9 84.0 + 0.4 + 0.4 + 0.3 - 0.1 - 1.0 |X - | 0.4 0.4 0.3 0.1 1.0
= 2.2
2.2 = 5 = 0.44
En el caso de que los datos se encuentren agrupados en una distribucin de frecuencia la frmula es:
Ejemplo:
xi [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) 12.5 17.5 22.5 27.5 32.5 fi 3 5 7 4 2 21 xi fi 37.5 87.5 157.5 110 65 457.5 |x - x| 9.286 4.286 0.714 5.714 10.174 |x - x| fi 27.858 21.43 4.998 22.856 21.428 98.57
La desviacin media tiene dos ventajas. Utiliza para su cmputo todos los elementos de la serie de datos y es fcil de entender. Sin embargo, es difcil trabajar con valores absolutos y por ello la desviacin media no es usada frecuentemente. Cuando la suma de las desviaciones parciales absolutas es igual a cero, la desviacin media no es una medida de variabilidad aceptable. Por ejemplo, tenemos dos series de datos:
Claramente observamos que la serie B tiene una dispersin mayor que la serie A, sin embargo en ambos casos la desviacin media es cero.
ACTIVIDAD DE APRENDIZAJE
El estudiante resolver problemas de desviacin media para datos agrupados y no agrupados, proporcionados por el profesor, de la bibliografa sugerida.
Varianza. Es la media aritmtica de las desviaciones cuadradas de los datos respecto a la media de una distribucin estadstica La varianza se representa por Varianza para datos no agrupados
Para simplificar el clculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores
xi [10, 20) [20, 30) [30,40) [40, 50) [50, 60 [60,70) [70, 80) 15 25 35 45 55 65 75
fi 1 8 10 9 8 4 2 42
Propiedades de la varianza
1. La varianza ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
3. Si todos los valores de la variable se multiplican por un nmero la varianza queda multiplicada por el cuadrado de dicho nmero.
4. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total.
1. La varianza, al igual que la media, es un ndice muy sensible a las puntuaciones extremas. 2. En los casos que no se pueda hallar la media tampoco ser posible hallar la varianza. 3. La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones estn elevadas al cuadrado.
ACTIVIDAD DE APRENDIZAJE
El estudiante resolver problemas de varianza para datos agrupados y no agrupados, proporcionados por el profesor, de la bibliografa sugerida.
La
varianza. Es decir, la raz cuadrada de la media de los cuadrados de las puntuaciones de desviacin La desviacin tpica se represen a por
Para simplificar el clculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores:
:: [ 10, 20) [ 20, 30) [ 30, 40) [ 40, 50) [ 50, 60) [ 60, 70) [ 70, 80)
xi 15 25 35 45 55 65 75
fi 1 8 10 9 8 4 2 42
ACTIVIDAD DE APRENDIZAJE
El estudiante resolver problemas de desviacin tpica o estndar para datos agrupados y no agrupados, proporcionados por el profesor, de la bibliografa sugerida.
7.5 COEFICIENTE DE VARIACIN El coeficiente de variacin es la relacin entre la desviacin tpica de una muestra y su media
El coeficiente de variacin permite comparar las dispersiones de dos distribuciones distintas, siempre que sus medias sean positivas. Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre s. La mayor dispersin corresponder al valor del coeficiente de variacin mayor.
Ejercicio:
Una distribucin tiene x = 140 y = 28.28 y otra x = 150 y = 25. Cul de las dos presenta mayor dispersin?
ACTIVIDAD DE APRENDIZAJE
El estudiante resolver problemas de coeficiente de variacin, proporcionados por el profesor, de la bibliografa sugerida.
Las medidas de la asimetra, al igual que la curtosis, son medidas de la forma de la distribucin, es frecuente que los valores de una distribucin tiendan a ser similares a ambos lados de las medidas de centralizacin. La simetra es importante para saber si los valores de la variable se concentran en una determinada zona del recorrido de la variable.
As<0
As=0
Si la diferencia es positiva, diremos que hay asimetra positiva o a la derecha, en el caso de que sea negativa diremos que hay asimetra negativa o a la izquierda. No obstante, esta medida es poco operativa al no ser una medida
relativa, ya que est influida por la unidad en que se mida la variable, por lo que se define el coeficiente de Asimetra como:
Esta medida es muy fcil de calcular, pero menos precisa que el coeficiente de asimetra de Pearson. El coeficiente de asimetra de Pearson, se basa en la comparacin con la media de todos los valores de la variable, as que es una medida que se basar en las diferencias , como vimos en el caso de la dispersin, si medimos la
media de esas desviaciones seran nulas, si las elevamos al cuadrado, seran siempre positivas por lo que tampoco serviran, por lo tanto precisamos elevar esas diferencias al cubo. Para evitar el problema de la unidad, y hacer que sea una medida escalar y por lo tanto relativa, dividimos por el cubo de su desviacin tpica. Con lo que resulta la siguiente expresin:
Curtosis El Coeficiente de Curtosis analiza el grado de concentracin que presentan los valores alrededor de la zona central de la distribucin. Se definen 3 tipos de distribuciones segn su grado de curtosis:
Distribucin mesocrtica: presenta un grado de concentracin medio alrededor de los valores centrales de la variable (el mismo que presenta una distribucin normal).
g 2 = 0 (distribucin mesocrtica)
Distribucin leptocrtica : presenta un elevado grado de concentracin alrededor de los valores centrales de la variable.
Distribucin platicrtica: presenta un reducido grado de concentracin alrededor de los valores centrales de la variable.
g2 < 0 (distribucin platicrtica)
Donde:
n = total de datos xi = Cada uno de los datos xm = Media Los resultados pueden ser los siguientes: g2 = 0 (distribucin mesocrtica). g2 > 0(distribucin leptocrtica ). g2 < 0 (distribucin platicrtica) . Ejemplo:
Vamos a calcular el Coefiente de Curtosis de la serie de datos referidos a la estatura de un grupo de alumnos, recordemos que la media de esta muestra es 1,253.
Variable (Valor) Frecuencias absolutas Simple fi 1,20 1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30 1 4 4 2 1 2 3 3 4 3 3 Acumulada fa 1 5 9 11 12 14 17 20 24 27 30 Frecuencias relativas Simple fr 3,3% 13,3% 13,3% 6,6% 3,3% 6,6% 10,0% 10,0% 13,3% 10,0% 10,0% Acumulada far 3,3% 16,6% 30,0% 36,6% 40,0% 46,6% 56,6% 66,6% 80,0% 90,0% 100,0%
Luego:
g2 = (1/30) * 0,00004967 ------------------------------------------- - 3 = -1,39 ((1/30) * (0,03046667))^2
Por lo tanto, el Coeficiente de Curtosis de esta muestra es -1,39, lo que quiere decir que se trata de una distribucin platicrtica, es decir, con una reducida concentracin alrededor de los valores centrales de la distribucin, aunque tampoco en este caso esta deviacin de la simetra est suficientemente alejada del 0 para ser considerada significativa (se encuentra entre -2 y 2).
ACTIVIDAD DE APRENDIZAJE
El estudiante resolver problemas de medidas de forma, proporcionados por el profesor, de la bibliografa sugerida.
AUTOEVALUACIN
I. Instrucciones: Lea detenidamente los siguientes conceptos respuesta a la que corresponda dicho concepto. y subraye la
1) De los siguientes datos: 9, 7, 11, 10, 13 y 7. El resultado de 9.5 corresponde a: A) Media B) Varianza C) Desviacin media D) Desviacin estndar
2) Analiza el grado de concentracin que presentan los valores alrededor de la zona central de la distribucin. A) Varianza datos no agrupados B) Varianza datos agrupados C) Coeficiente de variacin D) Coeficiente de curtosis
1. Al grado en que los datos numricos tienden a extenderse alrededor de un valor medio, se le llama .
2. La
se obtiene de la frmula:
3. La
es
la
relacin
entre
la
1. La varianza es la caracterstica de una muestra o poblacin que cuantifica su dispersin o variabilidad. 2. Se utiliza para calcular la desviacin estndar de datos agrupados
( )
( ) ( )
3. Se denomina rango estadstico al intervalo de menor tamao que contiene a los datos; es calculable mediante la resta del valor mnimo al valor mximo; por ello, comparte unidades con los datos. 4. La distribucin mesocrtica presenta un reducido grado de concentracin alrededor de los valores centrales de la variable. 5. La desviacin media mide la cantidad promedio que varan los datos respecto a su media. 6. El rango intercuartlico divide a los valores mustrales, una vez ordenados, en cuatro de observaciones. partes homogneas en cuanto a nmero
( )
( )
( )
IV. Instrucciones: Observe las siguientes grficas, y mencione asimetra que cada una tiene.
el tipo de