Académique Documents
Professionnel Documents
Culture Documents
.
.
.
.
.
.
a
k
f
k
h
k
Total.
=
= 1
CARACTERES CUANTITATIVOS
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
31
Consideramos una variable estadstica X que, en una muestra de tamao n extrada
de una poblacin estadstica, toma los valores x
1
<x
2
<x
3
< ...<x
k
, definimos los
siguientes conceptos :
Tamao de la
muestra
n
Llamamos tamao muestral al nmero de observaciones
realizadas, es decir, al nmero total de datos.
= + ++ =
Frecuencia
Absoluta
f
i
Llamamos frecuencia absoluta de un valor x
i
de la variable
estadstica X al nmero de veces que aparece repetido dicho
valor en el conjunto de las observaciones realizadas.
= ; 0 ; = 1, 2, 3, .
Frecuencia
Absoluta
Acumulada
F
i
Llamamos frecuencia absoluta acumulada en el valor x
i
a
la suma de las frecuencias absolutas de los valores inferiores
o iguales a l.
Evidentemente, los valores x
i
han de estar ordenados de
forma creciente, como ya se ha indicado, y la frecuencia
absoluta acumulada del ltimo valor ser igual a n.
=
Frecuencia
Relativa
hi
Llamamos frecuencia relativa de un valor x
i
de la variable
estadstica X al cociente entre la frecuencia absoluta y el
nmero de observaciones realizadas.
= ; = 1 ; 0 1.
Frecuencia
Relativa
Acumulada
H
i
Llamamos frecuencia relativa acumulada en el punto x
i
al
cociente entre la frecuencia absoluta acumulada y el nmero
de observaciones realizadas.
= ; = 1
En las observaciones realizadas en una muestra o poblacin, puede ocurrir:
1. Que la variable estadstica tome pocos valores diferentes (ya sea grande o
pequeo el tamao de la muestra).
2. Que, en una muestra de gran tamao, la variable estadstica tome muchos
valores diferentes, ya se trate de variable estadstica discreta como de variable
estadstica continua (este ltimo caso es el ms habitual).
En el primer caso no es
necesario agrupar los datos, y
la tabla de distribucin presenta
el siguiente aspecto (ordenando
X
i
f
i
h
i
F
i
H
i
x
1
f
1
h
1
F
1
H
1
x
2
f
2
h
2
F
2
H
2
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
32
los datos de menor a mayor) :
.
.
.
.
.
.
.
.
.
.
x
k
F
k
h
k
F
k
=n H
k
=1
Total.
=
= 1
En el segundo caso por tratarse de variable continua o discreta pero con un nmero de
datos muy grande, es aconsejable AGRUPAR LOS DATOS EN CLASES.
Rango (R).
=
Nmero de clases (m).
Determinamosatreves de la regla de sturges.
= 1 + 3.322 Log ( )
Amplitud de clases (C).
=
Tabla de frecuencias de
una variable estadstica
agrupada en intervalos.
Intervalos
de clase
Marcas
de clase
Xi
f
i
h
i
F
i
H
i
[a
0
a
1
) x
1
f
1
h
1
F
1
H
1
[a
1
a
2
) x
2
f
2
h
2
F
2
H
2
.
.
.
.
.
.
.
.
.
.
.
.
[a
k
a
k+1
) x
k
F
k
h
k
F
k
=n H
k
=1
Total.
=
= 1
MEDIDAS DE TENDENCIA CENTRAL.
Son estadgrafos de posicin que son interpretados como valores que permiten a un
conjunto de datos dispersos, podra asumirse que estas medidas equivalen a un centro
de gravedad que adoptan un valor representativo para todo un conjunto de datos
predeterminados.
Estas medidas son:
1. Promedio Aritmtico (Media Aritmtica).
2. Mediana.
3. Moda.
4. Promedio Geomtrico.
5. Promedio Total.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
33
6. Media armnica.
MEDIDAS DE POSICIN
Percentiles.
Cuartiles
Deciles
MEDIDAS DE VARIABILIDAD (dispersin)
Son estadgrafos de dispersin que permiten evaluar el grado de homogeneidad,
dispersin o variabilidad de un conjunto de datos. Estas medidas son:
1. Amplitud o rango.
2. Varianza.
3. Desviacin estndar.
4. Coeficiente de variabilidad.
MEDIDAS DE FORMA
Evala la forma que adopta la distribucin de frecuencias respecto al grado de
distorsin (inclinacin) que registra respecto al valor promedio tomado como
centro de gravedad, el grado de apuntamiento (elevamiento) de la distribucin de
frecuencias. A mayor elevamiento de la distribucin de frecuencia significar
mayor concentracin de los datos en torno al promedio, por tanto, una menor
dispersin de los datos. Estas medidas son:
1. Asimetra o sesgo.
2. Curtosis.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
34
1. LA MEDIA ARITMTICA.
Para Datos no Agrupados.
El promedio aritmtico de un conjunto de valores (X
1
, X
2,
X
3
,.., Xn) es:
=
n
=
1 + 2 + 3 + +
Ejemplo:
Durante los ltimos 32 das el valor de las compras (soles) en peridicos fue:
5.2 10.2 7.0 7.1 10.2 8.3 9.4 9.2 6.5 7.1 8.2
6.6 7.8 6.8 7.2 8.4 9.6 8.5 5.7 6.4 10.1 9.1
9.0 7.8 8.2 5.3 6.2 8.6 7.0 7.7 8.3 7.5
El promedio aritmtico del valor de las compras en peridicos es:
=
n
=
250.2
32
= 7.82
Para Datos Agrupados.
Rango (R).
= = 10.2 5.2 = 5
Nmero de clases (m).
Determinamos atreves de la regla de sturges.
= 1 + 3.3 Log( ) = 1 + 3.3 (32) = 5.97 6
Amplitud de clases (C).
= =
5
6
= 0.83
=
Donde: fi = frecuencia en la clase K sima.
X
i
= marca de clase en el intervalo K imo.
Ejemplo.
Para los gastos diarios en peridicos del hotel agrupados en una tabla de
frecuencia:
Intervalo X
i
f
i
h
i
F
i
H
i
[5.2 - 6.0) 5.62 3 0.09 3 0.09
[6.0 - 6.9) 6.45 5 0.16 8 0.25
[6.9 - 7.7) 7.28 6 0.19 14 0.44
[7.7 - 8.5) 8.12 8 0.25 22 0.69
[8.5 - 9.4) 8.95 5 0.16 27 0.84
[9.4 - 10.2] 9.78 5 0.16 32 1.00
Total 32 1
0
2
4
6
8
10
5.62 6.45 7.28 8.12 8.95 9.78
f
i
Xi
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
35
El promedio aritmtico es:
=
=
5.62 3 + 6.45 5 + + 9.78 5
32
=
251.40
32
= .
Durante los 32 das el hotel tuvo un gasto promedio en peridicos de 7.86 soles
2. LA MEDIANA.
Es al valor que ocupa la posicin central de un conjunto de observaciones ordenadas. El
50% de las observaciones son mayores que este valor y el otro 50% son menores.
Para Datos no Agrupados.
La ubicacin de la mediana de n datos ordenados se determina por: (n+1)/2.
Ejemplos.
En los 7 datos ordenados: {4, 5, 5, 6, 7, 8, 9}.
La ubicacin de la mediana es:
( )
=4, Luego el valor de la mediana: Me = 6.
En los 8 datos ordenados: {3, 4, 5, 5, 6, 7, 8, 9}.
La mediana se ubica en el lugar
( )
=4.5, Luego el valor de la mediana es:
=
( )
=5.5
Para Datos Agrupados.
= +
L
i
: Limite inferiordel intervalo que contiene a la mediana.
F
i-1
: Frecuencia acumulada en la clase anterior i sima.
F
i
: Frecuencia en la clase que contiene a la mediana.
H
i-1
: Frecuencia relativa acumulada en la clase anteriori sima.
h
i
: Frecuencia relativa en la clase que contiene a la mediana.
C
i
: Amplitud del intervalo de clase
Ejemplo. Para los gastos diarios en peridicos del hotel en una tabla de frecuencias.
L
a mediana es: =7.7+ 0.83 =7.9
El 50% de los das el hotel gast menos de 7.9 soles en la compra de peridicos.
Intervalo
De clase
Marca
de clase
X
i
Frecuencia
Absoluta
f
i
Frecuencia
Relativa
h
i
Frec. Acum.
Absoluta
F
i
Frec. Acum.
Relativa
H
i
[5.2 - 6.0) 5.62 3 0.09 3 0.09
[6.0 - 6.9) 6.45 5 0.16 8 0.25
[6.9 - 7.7) 7.28 6 0.19 14 0.44
[7.7 - 8.5) 8.12 8 0.25 22 0.69
[8.5 - 9.4) 8.95 5 0.16 27 0.84
[9.4 - 10.2] 9.78 5 0.16 32 1.00
Total 32 1
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
36
3. LA MODA.
Es el valor; clase o categora que ocurre con mayor frecuencia y sus caractersticas son:
Puede no existir o existir ms de una moda.
Su valor no se ve afectado por los valores extremos en los datos.
Se utiliza para analizar tanto la informacin cualitativa como la cuantitativa.
Es una medida inestable cuando en nmero de datos es reducido.
Para Datos no Agrupados.
Por ejemplo, Durante los ltimos 32 das el valor de las compras en peridicos
fue:
5.2 10.2 7 7.1 10.2 8.3 9.4 9.2
6.6 7.8 6.8 7.1 8.4 9.6 7.1 5.7
Moda =Mo= 7.1; es el valor ms frecuente, ocurre tres veces.
Ejemplo: 2, 2, 5, 5, 7, 7, 7, 7, 9, 9, 9, 10; Mo = 7 y 9 Serie bimodal
Ejemplo: 6, 5, 6, 6, 3, 4, 6, 6, 7 Mo = 6 Serie Unimodal
Ejemplo: 13, 15, 12, 11, 20, 22 No tiene Moda o se dice que
cada dato es una moda
Para Datos Agrupados.
= +
+
Donde: =( )
=( )
f
i
= valor de mayor frecuencia.
Ejemplo.
El gasto diario en peridicos del hotel *** agrupados en una tabla de
frecuencias.
=7.7+
2
2+3
0.83 =8.03
Donde:
=7.7
=(86) =2
=(85) =3
El gasto diario en peridicos ms frecuente es 8.03soles.
Intervalo X
i
f
i
h
i
F
i
H
i
[5.2 - 6.0) 5.62 3 0.09 3 0.09
[6.0 - 6.9) 6.45 5 0.16 8 0.25
[6.9 - 7.7) 7.28 6 0.19 14 0.44
[7.7 - 8.5) 8.12 8 0.25 22 0.69
[8.5 - 9.4) 8.95 5 0.16 27 0.84
[9.4 - 10.2] 9.78 5 0.16 32 1.00
Total 32 1
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
37
4. MEDIA GEOMTRICA.
La media geomtrica simple de n observaciones X
1
, X
2
, X
3
,..,X
n
positivos, esta
dado por la raz ensima del producto de los n valores observados. El promedio
geomtrico de los valores: (X
1
, X
2
, X
3
,..,X
n
) es :
Para Datos no Agrupados.
=
.
Ejemplo.
Hallar la media geomtrica de los nmeros 3, 5, 8, 3, 5, 2.
Solucin.
En este caso n = 6, entonces la media geomtrica es:
= = 3.915
Para Datos Agrupados.
Si los datos estn agrupados en clases, la media geomtrica ponderada, es la raz
ensima del producto de las marcas de clases elevadas a sus respectivas
frecuencias, es decir.
= ( ) ( ) ( )
Donde: = , X
i
= Marca de clase, f
i
= Frecuencia absoluta simple,
m = nmero de clases.
Aplicando logaritmo a ambos lados miembros de la ecuacin anterior se tiene:
Log = [ + +,,+ ]
= ; Luego.
=
=1
Ejemplo.
=
28.46
= 7.749
Intervalo X
i
f
i
log (X
i
) f
i
* log(Xi)
[5.2 - 6.0) 5.62 3 0.749 2.248
[6.0 - 6.9) 6.45 5 0.81 4.048
[6.9 - 7.7) 7.28 6 0.862 5.174
[7.7 - 8.5) 8.12 8 0.909 7.275
[8.5 - 9.4) 8.95 5 0.952 4.759
[9.4 - 10.2] 9.78 5 0.99 4.952
Total ( ): 32 28.46
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
38
Desventajas de la media geomtrica.
Est limitado para valores positivos para que pueda ser interpretado.
Si algn valor de la variable es cero, la media geomtrica ser cero.
Si aparece algn valor negativo, el estadgrafo toma un valor imaginario.
5. PROMEDIO PONDERADO
Cuando se desea encontrar el promedio de valores (X
1
, X
2
, X
3
,..,X
n
) que ocurren con
frecuencias (f
1
,f
2
,.f
n
)diferentes se debern ponderar los valores observados con pesos
diferentes:
=
Donde Wi = f
i
/n se denominan ponderaciones o pesos.
Ejemplo.
En una agencia de viajes se han vendido 200 pasajes a los precios siguientes:
Precio de venta (soles)
Xi
Numero de pasajes
f
i
Ponderacin
Wi
Xi*Wi
12 60 0.30 3.60
14 100 0.50 7.00
16 40 0.20 3.20
Total 200 1 = 13.8
El precio promedio de venta de los 200 pasajes es de 13.8 soles
6. PROMEDIO TOTAL
Corresponde al valor promedio representativo de grupos de observaciones separadas o
diferentes y que podran estar consolidadas en tablas de frecuencia independientes, por
tanto:
=
+
+ +.+
n
i
: Numero de observaciones en el grupo i-simo.
: Promedio correspondiente el grupo i-simo
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
39
Ejemplo.
Promedio del grupo A: Promedio del grupo B:
X =
4(7.5) +16(12.5) +5(17.5)
25
=12.7X
=
8(2.5) +10(7.5) +16(12.5) +6(17.5)
40
=10
X =
25(12.7) +40(10)
65
=11.04
7. MEDIA ARMNICA.
La media armnica M
h
o X de n trminos no nulos X
1
, X
2
, X
3
,..,X
n
, es el reciproco
de la media aritmtica de los recprocos de esos trminos. Es decir.
Para Datos no Agrupados.
X =
n
+ +.+
Ejemplo.Calcular el rendimiento promedio para el caso de tres automviles que
recorrieron 500 kilmetros y cada auto tuvo el rendimiento siguiente:
Auto A B C
Rendimiento(Km/galn) 50 62.4 77.6
X =
3
+
.
+
.
=
3
0.0489121
=61.334
Km
galn
Verificacin.
Auto Km Rendimiento Total de galones
X =
1500
24.4561
=61.334
A 500 50 10
B 500 62.4 8.0128
C 500 77.6 6.4433
Total 1500 24.4561
GUPO A
Nota Xi fi
5 10 7.5 4
10 15 12.5 16
15 20 17.5 5
Total 25
GUPO B
Nota Xi fi
0 5 2.5 8
5 10 2.5 10
10 15 12.5 16
15 20 17.5 6
Total 40
Promedio
Total
Grupo X f
i
A 12.7 25
B 10 40
Total 65
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
40
Para Datos Agrupados.La media armnica para datos tabulados (media
armnica ponderada) se define por:
X =Mh=
n
Donde:
m = nmero de clases, Xi = marca de clase, fi = frecuencia absoluta de cada clase.
MEDIDAS DE POSICIN.
Las medidas de posicin equivalen a los valores que puede tomar una variable
caracterizados por agrupar a cierto porcentaje de observaciones en la muestra o
poblacin.
Las medidas de posicin son ideales para obtener informacin adicional a partir de
datos resumidos, es decir, que presentan perdida de informacin por agrupamiento en
intervalos de clase.
PERCENTILES.
Son 99 valores que dividen a un conjunto de datos en 100 partes iguales.
Para Datos Agrupados.
= +
Ejemplo.
Calcular el tercer cuartil (Percentil 75%) de los gastos diarios en peridicos de la tabla
anterior.
Solucin.
1. Se determina n/4.
2. De la tabla, la frecuencia absoluta acumulada inmediatamente superior a 3n/4 = 24 es F
5
= 27,
luego F
5-1
= 22. Por tanto en intervalo de clase que contienen a es [8.5 9.4)
= +
=8.5+
( 22)
5
0.83=8.8
El 75% de los datos analizados sern menores a 8.8 y el 25% restante sern superiores.
DECILES.
Son nueve valores D
1
, D
2
, D
3
, D
4
, D
5
, D
6
, D
7
, D
8
, y D
9
, que dividen a un conjunto de
datos en 10 partes iguales.
1. Se construye la tabla de frecuencias absolutas acumuladas.
2. Se determina k*n/10.
3. Se identifica a la clase que contiene a D
k
, identificado a la frecuencia absoluta
acumulada F
i
inmediatamente superior a k*n/10.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
42
Ejemplo.
Calcular el decil siete (Percentil 70%) de los gastos diarios en peridicos de la tabla de
frecuencia anterior.
= +
=8.5+
( . 17)
5
0.83=9.396
70% de los datos sern menores a 9.396 y el 30% restante sern superiores a 9.396.
Para Datos no Agrupados.
El lugar o posicin donde se encuentran los cuartiles para n datos ordenados es:
Cuartil Q
1
= P
25%
Q
2
= P
50%
Q
3
= P
75%
Posicin
25(n+1)
100
50(n+1)
100
75(n+1)
100
Ejemplo.
Supngase que los siguientes datos representan los salarios por da de 12 trabajadores
de una compaa muy grande seleccionados aleatoriamente (en soles)
9 10 12 3 5 7 15 10 9 11 13 11
Determinar el primer cuartil de la muestra.
Solucin.
1. Los datos ordenados en forma ascendente son:
3 5 7 9 9 10 10 11 11 12 13 15
X
1
X
2
X
3
X
4
X
5
X
6
X
7
X
8
X
9
X
10
X
11
X
12
2. Como n = 12, = =3.25. Esto significa que el valor de Q
1
es el tercer
dato ms 25% de la diferencia entre los valores de las observaciones tercero y
cuarto. As, el valor de la tercera observacin es 7 y el del cuarto es 9, entonces
Q
1
= 7 + (9-7)*0.25 =7.5 soles.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
43
Ejemplo:
Determine los cuartiles y decil 8 de los 13 datos ordenados siguientes:
10 11 11 12 12 13 13 13 14 15 17 18 20
X
1
X
2
X
3
X
4
X
5
X
6
X
7
X
8
X
9
X
10
X
11
X
12
X
13
Percentil Posicin Incremento % Valor del cuartil
Q
1
= P
25
0.25(13+1) = 3.5 50% Q
1
= 11+(12-11)*0.50 =11.5
Q
2
= P
50
0.50(13+1) = 7 0% Q
2
= 13
Q3 = P
75
0.75(13+1) = 10.5 50% Q
3
= 15+(17-15)*0.50 = 16
Q
8
= P
80
0.80(13+1) = 11.2 20% P
80
= 17+(18-17)* 0.20 = 17.2
MEDIDAS DE VARIABILIDAD.
1. AMPLITUD O RANGO
Sean los valores:x
1
, x
2
, x
3
,..,x
n
la amplitudo rango de estos datos es
R = (X
max
- X
min
).
2. VARIANZA Y DESVIACIN TPICA.
Estas medidas son las ms utilizadas en el estudio de la dispersin. La varianza
mide la dispersin de los datos con respecto a su media aritmtica y la
desviacin tpica o desviacin estndar es simplemente la raz cuadrada positiva
de la varianza.
Para Datos no Agrupados.
Definicin de de varianza poblacional. La varianza poblacional finita de N
elementos X
1
, X
2
, X
3
,..,X
n
, se define como la media aritmtica del cuadrado
de las desviaciones de las observaciones con respecto a su media , y se denota
por es decir.
N
x
n
i
i
=
=
1
2
2
) (
=
1
2
_
2
) X (
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
44
Por lo tanto,
2
1
2
2
x
n
x
s
n
i
i
=
=
La diferencia entre
( ) ( )
es grande para muestras pequeas, y
es mnima para muestras grande, prcticamente son iguales. Entonces, para
muestras grandes 60, puede usarse cualquiera de las formulas. Para
muestras pequeas se usa
( )
, lo cual es llamada varianza muestral o
tambin varianza corregida, y se acostumbra denotar por . Es decir la varianza
muestral estar definida por:
=
( )
1
=
1
Ejemplo.
Calcular la varianza de los cuatro datos siguientes: (Xi: 3, 4, 6 y 7)
=
n
=
3+4+6+7
4
=
20
4
=5
1
=
3 +4 +6 +7
41
=
10
3
=3.333
Para datos Agrupados.
n
f X x
s
n
i
i i
=
=
1
2
2
* ) (
=
( )
1
=
1
Ejemplo.
Los gastos diarios en peridicos del hotel agrupados en la tabla de frecuencias.
= .
Intervalo
De clase
Marca
de clase
X
i
Frecuencia
Absoluta
f
i
X
i
*F
i
( X
i
- )
2
*f
i
[5.2 - 6.0) 5.62 3 16.85 15.10
[6.0 - 6.9) 6.45 5 32.25 9.94
[6.9 - 7.7) 7.28 6 43.70 2.00
[7.7 - 8.5) 8.12 8 64.93 0.53
[8.5 - 9.4) 8.95 5 44.75 5.94
[9.4 - 10.2] 9.78 5 48.92 18.50
Total = 32 = 251.40 = 52.00
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
45
=
( )
1
=
52
31
=1.68
3. DESVIACIN ESTNDAR.
Es una medida de variabilidad que corresponde a la raz cuadrada de la varianza.
Este indicador tiene la misma unidad de medida en la que se expresa el
promedio.
= =
( )
1
Entonces, =1.68 =1.3soles.
Propiedades dela varianza.
La varianza de un conjunto de observaciones x
1
, x
2
, x
3
,..,x
n
,
siempre es un nmero no negativo. Esto es
( ) 0
La varianza de una constante es cero.
( ) =0
Si a cada observacin x
1
, x
2
, x
3
,..,x
n
, se adiciona o resta una
constante k>0, la varianza del nuevo conjunto de valores y
1
, y
2
,
y
3
,..,y
n
, donde y
i
=x
i
K, i=1, 2,.,n, coincide con la varianza del
conjunto original. Es decir
( ) = ( ).
( ) = ( ) = ( ) ( ) = ( ), donde a y b son
constantes.
4. COEFICIENTE DE VARIACIN.
Es una medida de variabilidad de los datos que se expresa en porcentaje en la
cual se compara la desviacin estndar con el respectivo valor del promedio de
los datos.
. .=
Grado de variabilidad de los datos Coeficiente de variabilidad
Con variabilidad baja Menos de 10%
Con variabilidad moderada De 10% a 30%
Con variabilidad alta Ms de 30%
En el ejemplo anterior el coeficiente de variabilidad es:
. .=
.
.
= . %
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
46
MEDIDAS DE FORMA.
1. ASIMETRA O SEGO.
Evala el grado de distorsin o inclinacin que adopta la distribucin de los
datos respecto a su valor promedio tomando como centro de gravedad. El
coeficiente de asimetra de pearson es:
=
3( )
Grado de asimetra Valor del sesgo
Simetra perfecta Cero: El promedio es igual a la mediana
Sesgo positivo Positivo: Promedio mayor que la mediana
Sesgo negativo Negativo: Promedio menor que la mediana
Asimetra Positiva Simtrica Asimetra Negativa
(Promedio > Mediana) Promedio = Mediana Promedio < Mediana
En el ejemplo anterior losgastos diarios en peridicos el promedio es 7.8, la
mediana es 7.90 y la desviacin estndar 1.3, por lo tanto es sesgoes
ligeramente negativo -0.23.
CURTOSIS.
Evala el grado de apuntamiento de la distribucin, el coeficiente es:
=
( )
Grado de Apuntamiento Valor de Curtosis
Mesocrtica (distribucin normal) 0.263
Leptocrtica (Elevada) Mayor a 0.263 se aproxima a 0.5
Platicrtica (Aplanada) Menor a 0.263 se aproxima a 0.
K
u
=0.263 K
u
> 0.263 K
u
< 0.263 MesocurticaLeptocrticaPlaticrtica
(Normal)
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
46
MEDIDAS DE FORMA.
1. ASIMETRA O SEGO.
Evala el grado de distorsin o inclinacin que adopta la distribucin de los
datos respecto a su valor promedio tomando como centro de gravedad. El
coeficiente de asimetra de pearson es:
=
3( )
Grado de asimetra Valor del sesgo
Simetra perfecta Cero: El promedio es igual a la mediana
Sesgo positivo Positivo: Promedio mayor que la mediana
Sesgo negativo Negativo: Promedio menor que la mediana
Asimetra Positiva Simtrica Asimetra Negativa
(Promedio > Mediana) Promedio = Mediana Promedio < Mediana
En el ejemplo anterior losgastos diarios en peridicos el promedio es 7.8, la
mediana es 7.90 y la desviacin estndar 1.3, por lo tanto es sesgoes
ligeramente negativo -0.23.
CURTOSIS.
Evala el grado de apuntamiento de la distribucin, el coeficiente es:
=
( )
Grado de Apuntamiento Valor de Curtosis
Mesocrtica (distribucin normal) 0.263
Leptocrtica (Elevada) Mayor a 0.263 se aproxima a 0.5
Platicrtica (Aplanada) Menor a 0.263 se aproxima a 0.
K
u
=0.263 K
u
> 0.263 K
u
< 0.263 MesocurticaLeptocrticaPlaticrtica
(Normal)
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
46
MEDIDAS DE FORMA.
1. ASIMETRA O SEGO.
Evala el grado de distorsin o inclinacin que adopta la distribucin de los
datos respecto a su valor promedio tomando como centro de gravedad. El
coeficiente de asimetra de pearson es:
=
3( )
Grado de asimetra Valor del sesgo
Simetra perfecta Cero: El promedio es igual a la mediana
Sesgo positivo Positivo: Promedio mayor que la mediana
Sesgo negativo Negativo: Promedio menor que la mediana
Asimetra Positiva Simtrica Asimetra Negativa
(Promedio > Mediana) Promedio = Mediana Promedio < Mediana
En el ejemplo anterior losgastos diarios en peridicos el promedio es 7.8, la
mediana es 7.90 y la desviacin estndar 1.3, por lo tanto es sesgoes
ligeramente negativo -0.23.
CURTOSIS.
Evala el grado de apuntamiento de la distribucin, el coeficiente es:
=
( )
Grado de Apuntamiento Valor de Curtosis
Mesocrtica (distribucin normal) 0.263
Leptocrtica (Elevada) Mayor a 0.263 se aproxima a 0.5
Platicrtica (Aplanada) Menor a 0.263 se aproxima a 0.
K
u
=0.263 K
u
> 0.263 K
u
< 0.263 MesocurticaLeptocrticaPlaticrtica
(Normal)
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
47
REPRESENTACIN GRFICA.
GRFICOS DE CAJAS.
Existe una gran variedad de graficas estadsticas para extraer informacin acerca de las
propiedades de un conjunto de datos.
Una grafica til para reflejar propiedades de los datos es la grafica de caja (box
plots) que se basa en la medida(o en la media), los cuartiles y valores extremos. La
caja representa el rango intercuartil que encierra el 50% de los valores y tiene la
mediana (Me) dibujada dentro. El rango intercuartil tiene como extremos el percentil
75, P
75
(cuartil superior) y el percentil 25, P
25
(cuartil inferior).
Adems de la caja se incluya la extensin de los datos mediante segmentos que se
extienden de la caja hacia el valor mximo (U) y hacia el valor mnimo (L) de los datos.
Es te recuadro se dibuja con el eje de la variable en forma horizontal o vertical como se
indica en la figura que sigue.
De un grafico de caja, se obtiene informacin de los datos acerca de:
La centralizacin (observado la ubicacin de la mediana)
La dispersin o variabilidad (mediante en rango intercuartil: RI=P
75
-P
25
)
La asimetra (comparado: Me - P
25
con P
75
- Me)
Las colas (por la longitud de los segmentos que salen de los lados de la caja)
Los datos atpicos o discordantes o raros llamados outliers (aislados) son aquellos
que se ubican fuera del intervalo.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
47
REPRESENTACIN GRFICA.
GRFICOS DE CAJAS.
Existe una gran variedad de graficas estadsticas para extraer informacin acerca de las
propiedades de un conjunto de datos.
Una grafica til para reflejar propiedades de los datos es la grafica de caja (box
plots) que se basa en la medida(o en la media), los cuartiles y valores extremos. La
caja representa el rango intercuartil que encierra el 50% de los valores y tiene la
mediana (Me) dibujada dentro. El rango intercuartil tiene como extremos el percentil
75, P
75
(cuartil superior) y el percentil 25, P
25
(cuartil inferior).
Adems de la caja se incluya la extensin de los datos mediante segmentos que se
extienden de la caja hacia el valor mximo (U) y hacia el valor mnimo (L) de los datos.
Es te recuadro se dibuja con el eje de la variable en forma horizontal o vertical como se
indica en la figura que sigue.
De un grafico de caja, se obtiene informacin de los datos acerca de:
La centralizacin (observado la ubicacin de la mediana)
La dispersin o variabilidad (mediante en rango intercuartil: RI=P
75
-P
25
)
La asimetra (comparado: Me - P
25
con P
75
- Me)
Las colas (por la longitud de los segmentos que salen de los lados de la caja)
Los datos atpicos o discordantes o raros llamados outliers (aislados) son aquellos
que se ubican fuera del intervalo.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
47
REPRESENTACIN GRFICA.
GRFICOS DE CAJAS.
Existe una gran variedad de graficas estadsticas para extraer informacin acerca de las
propiedades de un conjunto de datos.
Una grafica til para reflejar propiedades de los datos es la grafica de caja (box
plots) que se basa en la medida(o en la media), los cuartiles y valores extremos. La
caja representa el rango intercuartil que encierra el 50% de los valores y tiene la
mediana (Me) dibujada dentro. El rango intercuartil tiene como extremos el percentil
75, P
75
(cuartil superior) y el percentil 25, P
25
(cuartil inferior).
Adems de la caja se incluya la extensin de los datos mediante segmentos que se
extienden de la caja hacia el valor mximo (U) y hacia el valor mnimo (L) de los datos.
Es te recuadro se dibuja con el eje de la variable en forma horizontal o vertical como se
indica en la figura que sigue.
De un grafico de caja, se obtiene informacin de los datos acerca de:
La centralizacin (observado la ubicacin de la mediana)
La dispersin o variabilidad (mediante en rango intercuartil: RI=P
75
-P
25
)
La asimetra (comparado: Me - P
25
con P
75
- Me)
Las colas (por la longitud de los segmentos que salen de los lados de la caja)
Los datos atpicos o discordantes o raros llamados outliers (aislados) son aquellos
que se ubican fuera del intervalo.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
48
Diagrama de Causa-Efecto
1.- El espesor de recubrimiento de un material de acero es evaluado en una sesin de
tormenta de ideas. El problema de variacin del espesor (la cual es del 10%) que se seala
es por una serie de causas, que fueron clasificadas en: equipos sin calibracin, personal sin
entrenamiento, especificaciones mal estructuradas, mal diseo de la maquina, variacin del
material, antigedad de la maquina, personal mal seleccionado, sin procedimientos,
velocidad sin control, alta temperatura, ambiente de trabajo contaminado, material
defectuoso, personal sin experiencia, sin instrumentos de control.
Las causas fueron clasificadas segn se muestra en el cuadro 1:
CUADRO 1
Material Variacin del material
Material defectuoso Materia prima de mala calidad
Proveedores no adecuados
Maquinaria Antigedad de la maquinaria
Mal diseo de la maquina
Equipos sin calibracin
Mtodo Sin procedimientos
Especificaciones mal estructuradas
Medio Ambiente Alta temperatura
Ambiente de trabajo contaminado
Mano de Obra Personal sin entrenamiento
Personal sin experiencia
Personal mal seleccionado
Medicin Sin instrumentos de control
Velocidad sin control
10%
espesor en
Variacion del
Entorno
Mediciones
Mtodos
Material
Mquinas
Personal
Personal mal seleccionado
Personal sin experiencia
Personal sin entrenamiento
Equipos sin calibracin
Mal diseo de la maquina
Antigedad de la maquinaria
Material defectuoso
material
Variacin del
estructuradas
Especificaciones mal
Sin procedimientos
Velocidad sin control
control
Sin instrumentos de
contaminado
Ambiente de trabajo
Alta temperatura
P
r
o
v
e
e
d
o
r
e
s
n
o
a
d
e
c
u
a
d
o
s
M
a
te
r
i a
p
r
im
a
d
e
m
a
la
c
a
l
id
a
d
diagrama de causa efecto
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
49
Diagrama de Pareto
1.- En la empresa Las Malvinas el ensamblaje de mangueras ha sido criticado debido a que
presenta muchos defectos. De 14993 ensamblajes inspeccionados en un ao, un total de
1509, el 10.1% estaban defectuosos. El reporte de inspeccin se muestra en el cuadro 2:
CUADRO 2
Defectos Turno 1 Turno 2 Turno 3 Total
Muy corto 30 35 26 91
Muy largo 44 44 44 132
Sin roscas 70 69 70 209
Fugas 330 321 347 998
Daadas 8 11 5 24
Retrabajado 22 20 13 55
Total 504 500 505 1509
La gerencia expres su preocupacin por que los tres turnos no cuentan con igual supervisin,
lo que puede contribuir al problema. Desarrolle un Diagrama de Pareto para el total de
defectos en los tres turnos y un Diagrama de Pareto para cada turno.
Diagrama de Pareto para el total de defectos en los tres turnos.
Total 998 209 132 91 55 24
Porcentaje 66.1 13.9 8.7 6.0 3.6 1.6
% acumulado 66.1 80.0 88.7 94.8 98.4 100.0
Defectos Otro Retrabajado Muy corto Muy largo Sin roscas Fugas
1600
1400
1200
1000
800
600
400
200
0
100
80
60
40
20
0
T
o
t
a
l
P
o
r
c
e
n
t
a
j
e
Diagrama de Pareto de Defectos
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
50
Diagrama de Pareto para cada turno.
Turno 1 330 70 44 30 22 8
Porcentaje 65.5 13.9 8.7 6.0 4.4 1.6
% acumulado 65.5 79.4 88.1 94.0 98.4 100.0
Defectos Otro Retrabajado Muy corto Muy largo Sin roscas Fugas
500
400
300
200
100
0
100
80
60
40
20
0
T
u
r
n
o
1
P
o
r
c
e
n
t
a
j
e
Diagrama de Pareto de Defectos
Diagrama de Dispersin
1.- En un equipo de mejora se obtienen los siguientes datos, que recogen el nmero de
defectos por lote e conjuntos de 10 000 piezas en funcin del tiempo de
tratamiento al que se someten:
Obs #
Defectos
Tiempo
(Seg)
Materia
Prima
Obs #
Defectos
Tiempo
(seg)
Materia
Prima
1 48 809 B 26 47 837 A
2 52 834 B 27 53 840 A
3 54 838 B 28 58 850 B
4 50 854 A 29 54 843 A
5 48 822 A 30 43 819 A
6 51 842 A 31 54 856 A
7 52 851 A 32 52 862 A
8 59 868 B 33 56 835 B
9 54 841 B 34 55 844 B
10 54 844 B 35 55 852 A
11 44 811 A 36 58 858 B
12 54 819 B 37 57 843 B
13 48 830 A 38 52 825 B
14 47 836 A 39 58 867 B
15 58 850 B 40 57 851 B
16 57 857 B 41 51 812 B
17 54 863 A 42 51 821 B
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
51
18 49 811 B 43 50 831 B
19 49 820 A 44 56 841 B
20 48 826 A 45 50 843 A
21 52 832 B 46 49 850 A
22 50 837 A 47 52 841 B
23 49 839 A 48 50 855 A
24 54 839 B 49 46 829 A
25 56 842 B 50 49 838 A
a) Realice un diagrama de dispersin entre la variable nmero de defectos por lote y la
variable tiempo de tratamiento al que se someten. Que comentarios puede hacer al
respecto.
2.- Fiber Borrad fabrica forros interiores de techo para la industria automotriz. La
gerente de manufactura est preocupada por la calidad de este producto. Sospecha
que un defecto en particular, las rasgaduras de la tela, est relacionado con el
tamao de las actuales partidas de produccin. Un asistente ha recopilado los datos
que se encuentran en la tabla, basndose en los registros de produccin:
Partida Tamao Defecto (%) Partida Tamao Defecto (%)
1 1000 3.5 1 6500 1.5
2 4100 3.8 2 1000 5.5
3 2000 5.5 3 7000 1.0
4 6000 1.9 4 3000 4.5
5 6800 2.0 5 2200 4.2
6 3000 3.2 6 1800 6.0
7 2000 3.8 7 5400 2.0
8 1200 4.2 8 5800 2.0
9 5000 3.8 9 1000 6.2
10 3800 3.0 10 1500 7.0
y = 0.164x - 85.57
R = 0.399
40
42
44
46
48
50
52
54
56
58
60
800 810 820 830 840 850 860 870 880
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
52
a) Dibuje un diagrama de dispersin para estos datos
b) Existe alguna relacin entre el tamao de la partida y el porcentaje de defectos?
Qu consecuencias tiene esto para los negocios de Fiber Borrad?
7000 6000 5000 4000 3000 2000 1000
7
6
5
4
3
2
1
Tamao
D
e
f
e
c
t
o
(
%
)
Grfica de dispersinde Defecto (%) vs. Tamao
GRFICO DE BARRAS
Cuadro N 01: Distribucin de plntulas de tornillo segn su altura (en milmetros).
Brunas-UNAS/Tingo Mara. Mayo 2011
mi Li Ls
Marca de Clase
(Xi)
Grupos
Frecuencia
(fi)
(Fi) (hi) (Hi) (hi%) (Hi%)
1 14 18.0 16 17.0 29 29 0.121 0.121 12.1% 12.1%
2 18.0 22.0 20 21.0 24 53 0.100 0.221 10.0% 22.1%
3 22.0 26.0 24 25.0 27 80 0.113 0.333 11.3% 33.3%
4 26.0 30.0 28 29.0
30
110 0.125 0.458 12.5% 45.8%
5 30.0 34.0 32 33.0 34 144 0.142 0.600 14.2% 60.0%
6 34.0 38.0 36 37.0 24 168 0.100 0.700 10.0% 70.0%
7 38.0 42.0 40 41.0 24 192 0.100 0.800 10.0% 80.0%
8 42.0 46.0 44 45.0 26 218 0.108 0.908 10.8% 90.8%
9 46.0 50.0 48 50.0 22 240 0.092 1.000 9.2% 100.0%
Total 240 1.000 100%
Fuente: Facultad de Recursos de la UNAS.
Del cuadro anterior realice el grafico de barras.
Grfico N 01. Distribucin porcentual de plntulas de tornillo segn su altura
(en milmetros). Brunas-UNAS/Tingo Mara. Mayo 2011
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
53
Fuente: Facultad de Recursos de la UNAS.
GRFICO DE SECTORES.
1. Se ha llevado a cabo una encuesta a personas elegidas al azar de la ciudad de
Tingo Mara en Julio Agosto del 2012 para analizar su opinin sobre la
calidad de una nueva conserva que se desea introducir en el mercado. Los
resultados observados fueron los siguientes: (2 pts)
Bueno Regular Malo Malo Bueno Regular Malo Bueno Regular Malo Bueno Regular
Regular Excelente Excelente Regular Regular Excelente Excelente Regular Excelente Excelente Regular Excelente
Malo Bueno Bueno Malo Malo Bueno Bueno Malo Bueno Bueno Malo Bueno
Excelente Malo Regular Excelente Excelente Malo Regular Excelente Malo Regular Excelente Malo
Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo
Excelente Malo Excelente Excelente Excelente Malo Excelente Excelente Malo Excelente Excelente Malo
Malo Excelente Bueno Regular Malo Excelente Bueno Regular Malo Excelente Malo Excelente
Solucin
Cuadro N 02: Distribucin de personas segn su opinin sobre la calidad de una
nueva conserva que se desea introducir en el mercado. Tingo Mara. Julio Agosto del
2012.
Opinin sobre la conserva fi Fi hi Hi hi% Hi%
Bueno 13 13 0.15 0.15 15% 15%
Regular 14 27 0.17 0.32 17% 32%
Malo 33 60 0.39 0.71 39% 71%
Excelente 24 84 0.29 1.00 29% 100%
Total 84 1.00 100%
Fuente: Elaboracin Propia
0.0%
2.0%
4.0%
6.0%
8.0%
10.0%
12.0%
14.0%
16.0%
[14 - 18>
12.1%
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
53
Fuente: Facultad de Recursos de la UNAS.
GRFICO DE SECTORES.
1. Se ha llevado a cabo una encuesta a personas elegidas al azar de la ciudad de
Tingo Mara en Julio Agosto del 2012 para analizar su opinin sobre la
calidad de una nueva conserva que se desea introducir en el mercado. Los
resultados observados fueron los siguientes: (2 pts)
Bueno Regular Malo Malo Bueno Regular Malo Bueno Regular Malo Bueno Regular
Regular Excelente Excelente Regular Regular Excelente Excelente Regular Excelente Excelente Regular Excelente
Malo Bueno Bueno Malo Malo Bueno Bueno Malo Bueno Bueno Malo Bueno
Excelente Malo Regular Excelente Excelente Malo Regular Excelente Malo Regular Excelente Malo
Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo
Excelente Malo Excelente Excelente Excelente Malo Excelente Excelente Malo Excelente Excelente Malo
Malo Excelente Bueno Regular Malo Excelente Bueno Regular Malo Excelente Malo Excelente
Solucin
Cuadro N 02: Distribucin de personas segn su opinin sobre la calidad de una
nueva conserva que se desea introducir en el mercado. Tingo Mara. Julio Agosto del
2012.
Opinin sobre la conserva fi Fi hi Hi hi% Hi%
Bueno 13 13 0.15 0.15 15% 15%
Regular 14 27 0.17 0.32 17% 32%
Malo 33 60 0.39 0.71 39% 71%
Excelente 24 84 0.29 1.00 29% 100%
Total 84 1.00 100%
Fuente: Elaboracin Propia
[14 - 18> [18- 22> [22 - 26> [26 - 30> [30 - 34> [34 - 38> [38 - 42>
12.1%
10.0%
11.3%
12.5%
14.2%
10.0% 10.0%
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
53
Fuente: Facultad de Recursos de la UNAS.
GRFICO DE SECTORES.
1. Se ha llevado a cabo una encuesta a personas elegidas al azar de la ciudad de
Tingo Mara en Julio Agosto del 2012 para analizar su opinin sobre la
calidad de una nueva conserva que se desea introducir en el mercado. Los
resultados observados fueron los siguientes: (2 pts)
Bueno Regular Malo Malo Bueno Regular Malo Bueno Regular Malo Bueno Regular
Regular Excelente Excelente Regular Regular Excelente Excelente Regular Excelente Excelente Regular Excelente
Malo Bueno Bueno Malo Malo Bueno Bueno Malo Bueno Bueno Malo Bueno
Excelente Malo Regular Excelente Excelente Malo Regular Excelente Malo Regular Excelente Malo
Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo Malo
Excelente Malo Excelente Excelente Excelente Malo Excelente Excelente Malo Excelente Excelente Malo
Malo Excelente Bueno Regular Malo Excelente Bueno Regular Malo Excelente Malo Excelente
Solucin
Cuadro N 02: Distribucin de personas segn su opinin sobre la calidad de una
nueva conserva que se desea introducir en el mercado. Tingo Mara. Julio Agosto del
2012.
Opinin sobre la conserva fi Fi hi Hi hi% Hi%
Bueno 13 13 0.15 0.15 15% 15%
Regular 14 27 0.17 0.32 17% 32%
Malo 33 60 0.39 0.71 39% 71%
Excelente 24 84 0.29 1.00 29% 100%
Total 84 1.00 100%
Fuente: Elaboracin Propia
[38 - 42> [42 - 46> [46 - 50]
10.0%
10.8%
9.2%
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
54
Grfico N 02: Distribucin de personas segn su opinin sobre la calidad de una
nueva conserva que se desea introducir en el mercado. Tingo Mara. Julio Agosto del
2012.
Fuente: Elaboracin Propia
HISTOGRAMA.
1. La Biomasa de los recursos hidrobiolgicos del Per en los aos de 2004 a 2009
se da en la siguiente tabla:
Recurso 2004 2005 2006 2007 2008 2009
Jurel 5300 5000 4330 7000 2800 4303
Caballa 1511 450 1700 1900 1300 1052
Sardina 4200 2500 2700 1750 4500 3680
Anchoveta 1500 6500 6000 4500 5900 3060
a) Construya su grafico correspondiente para los recursos hidrobiolgicos del Per
en los aos 2005, 2008 y 2009 e interprete. (2 pts)
Grafico N 03. Biomasa de los recursos hidrobilogicos: 2005 2009.
Fuente: INSTITUTO DEL MAR PERUANO (IMARPE)
Malo
39%
Excelente
29%
0
1000
2000
3000
4000
5000
6000
7000
2005
JUREL ANCHOVETA
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
54
Grfico N 02: Distribucin de personas segn su opinin sobre la calidad de una
nueva conserva que se desea introducir en el mercado. Tingo Mara. Julio Agosto del
2012.
Fuente: Elaboracin Propia
HISTOGRAMA.
1. La Biomasa de los recursos hidrobiolgicos del Per en los aos de 2004 a 2009
se da en la siguiente tabla:
Recurso 2004 2005 2006 2007 2008 2009
Jurel 5300 5000 4330 7000 2800 4303
Caballa 1511 450 1700 1900 1300 1052
Sardina 4200 2500 2700 1750 4500 3680
Anchoveta 1500 6500 6000 4500 5900 3060
a) Construya su grafico correspondiente para los recursos hidrobiolgicos del Per
en los aos 2005, 2008 y 2009 e interprete. (2 pts)
Grafico N 03. Biomasa de los recursos hidrobilogicos: 2005 2009.
Fuente: INSTITUTO DEL MAR PERUANO (IMARPE)
Bueno
15%
Regular
17%
Malo
39%
2008 2009
ANCHOVETA SARDINA CABALLA
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
54
Grfico N 02: Distribucin de personas segn su opinin sobre la calidad de una
nueva conserva que se desea introducir en el mercado. Tingo Mara. Julio Agosto del
2012.
Fuente: Elaboracin Propia
HISTOGRAMA.
1. La Biomasa de los recursos hidrobiolgicos del Per en los aos de 2004 a 2009
se da en la siguiente tabla:
Recurso 2004 2005 2006 2007 2008 2009
Jurel 5300 5000 4330 7000 2800 4303
Caballa 1511 450 1700 1900 1300 1052
Sardina 4200 2500 2700 1750 4500 3680
Anchoveta 1500 6500 6000 4500 5900 3060
a) Construya su grafico correspondiente para los recursos hidrobiolgicos del Per
en los aos 2005, 2008 y 2009 e interprete. (2 pts)
Grafico N 03. Biomasa de los recursos hidrobilogicos: 2005 2009.
Fuente: INSTITUTO DEL MAR PERUANO (IMARPE)
Regular
17%
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
55
GRFICO DE LINEAS.
PROBLEMAS RESUELTOS.
1. Los siguientes datos corresponden a un muestra aleatoria de la altura en milmetros
(mm) de plantulas de tornillo (cedrelingacatenaeformis) perteneciente a la familia de
las Fabaceae en una parcela de 50x10 mts
2
, realizada en el Brunas-UNAS de la
ciudad de Tingo Mara en mayo 2011.
32 26 26 44 32 15 48 22 22 39 15 26 21 45 16 23
46 26 44 42 36 43 19 29 35 42 37 44 32 41 33 21
17 29 32 29 50 14 24 14 49 35 17 32 33 26 30 16
32 32 26 35 32 41 20 32 47 18 28 17 29 50 26 28
21 28 44 14 39 27 17 15 28 14 37 32 34 27 40 32
17 45 28 31 17 33 41 18 36 26 17 31 38 31 44 36
22 26 33 39 19 49 50 33 22 33 50 31 42 27 21 23
38 48 34 22 48 36 29 23 33 41 32 17 20 18 24 25
43 15 17 31 27 22 39 28 31 19 23 37 32 19 39 43
33 40 22 44 23 15 14 44 23 25 14 35 41 50 21 20
35 41 38 30 29 40 22 39 41 18 42 37 34 46 39 30
50 46 35 44 42 27 18 15 37 39 16 50 20 50 34 29
41 20 36 25 42 19 36 39 21 17 43 44 36 23 30 23
41 23 45 15 37 27 18 23 14 22 35 33 15 30 49 49
33 45 45 22 15 46 49 45 29 24 19 25 45 27 49 21
La informacin fue obtenida de la Facultad de Recursos de la UNAS.
a) Construya un cuadro de distribucin de frecuencias adecuado. (3pts)
b) Determine las medidas de tendencia central e interprete. (6pts)
c) Determine las medidas de dispersin e interprete. (4pts)
d) Construya su grfico correspondiente e interprete. (3pts)
Solucin
PASOS PARA AGRUPAR DATOS Funcin en Excel
Del
Ejemplo
Tamao de muestra: ( n ) = CONTAR(Seleccionar BD
3
) 240
Valor Mximo = MAX() 50
Valor Mnimo = MIN() 14
Rango (R)= Valor Mximo - Valor Mnimo 36
Aplicando la regla de STURGES:
N de intervalos (m) = 1+3.3*log (n) 8.855
m redondeado = REDONDEAR() 9
Amplitud (C ) = R/[m = redondeado] 4
3
BD: base de datos.
Ing. Wilmer J. Bermdez Pino Estadstica Aplicada
56
Cuadro N 01: Distribucin de plntulas de tornillo segn su altura (en milmetros).
Brunas-UNAS/Tingo Mara. Mayo 2011
mi Li Ls
Marca de Clase
(Xi)
Grupos
Frecuencia
(fi)
(Fi) (hi) (Hi) (hi%) (Hi%)
1 14 18.0 16 17.0 29 29 0.121 0.121 12.1% 12.1%
2 18.0 22.0 20 21.0 24 53 0.100 0.221 10.0% 22.1%
3 22.0 26.0 24 25.0 27 80 0.113 0.333 11.3% 33.3%
4 26.0 30.0 28 29.0
30
110 0.125 0.458 12.5% 45.8%
5 30.0 34.0 32 33.0 34 144 0.142 0.600 14.2% 60.0%
6 34.0 38.0 36 37.0 24 168 0.100 0.700 10.0% 70.0%
7 38.0 42.0 40 41.0 24 192 0.100 0.800 10.0% 80.0%
8 42.0 46.0 44 45.0 26 218 0.108 0.908 10.8% 90.8%
9 46.0 50.0 48 50.0 22 240 0.092 1.000 9.2% 100.0%
Total 240 1.000 100%
Fuente: Facultad de Recursos de la UNAS.
~ Promedio muestral (X).
=
( )
Promedio muestral = 31.4333333
Mediana muestral (Me).
= +