Vous êtes sur la page 1sur 15

1.

Para el conjunto de datos siguiente:


3
4
7
9
10

10
12
14
15
17

19
20
21
25
27

27
29
31
31
34

34
34
36
37
38

38
39
43
45
47

48
48
52
53
56

56
59
62
63
64

67
67
69
72
73

74
74
76
79
80

Determinar las medidas de tendencia central, cuartil3, y decil 6


2. De acuerdo con los datos publicados en la revista Hombre bellos en su nmero
de febrero de 1990, las cuotas anuales de 40 compaas para un seguro de
$25.000 por marino incluido en la tripulacin son las siguientes:
82 - 85 - 86 - 87 - 87 - 89 - 89 - 90 - 91 - 91 - 92 - 93 - 94 - 95 - 95 -95 - 95 - 95 - 97 98 - 99 - 99 - 100 - 100 - 101 - 101 - 103 - 103- 103 - 104 - 105 - 105 - 106 - 107 107 - 107 - 109 - 110 - 110 111
Determinar las medidas de tendencia central y cuartil3
3. Se seleccionaron 20 bateras aleatoriamente de un proceso de fabricacin, y
se llev a cabo una prueba para determinar la duracin de stas. Los
siguientes datos representan el tiempo de duracin en horas para las 20
bateras:

48,8

54,9

49,3

56,8

52,5

57,3

52,7

53,1

58,1

58,7

58,9

58,9

59,6

60,4

61,6

62,3

62,7

63,3

64,4

65,7

a) Calcular: media aritmtica y mediana.


b) Determinar cuartil 3 y decil 7.
Los siguientes datos corresponden a la cantidad de asientos vacos que reportaron 50 autobuses forneos
en un domingo.

11

10

12

10

12

10

12

11

a) Construir el grfico de la distribucin de frecuencia relativa acumulada.


b) Calcular: media aritmtica, moda, Cuartil 1 y decil 5

12

Como la diferencia entre los valores extremos es 111 - 82 = 29, al decidir -por ejemploutilizar 6 clases, el intervalo de cada clase ser aproximadamente de $5. Para establecer
los lmites de cada clase, hay que considerar la unidad ms cercana con respecto a la
cual se miden las observaciones. En este caso se va a redondear al dolar ms cercano.
Con estos datos podemos establecer la siguiente tabla:

9. ESTADSTICA DESCRIPTIVA
9.1 Unidades estadsticas y caracteres.
. Se llaman unidades estadsticas o individuos a los componentes de una determinada
poblacin de datos centro del estudio estadstico.
Cada uno de los individuos de la poblacin puede describirse segn uno o
varios caracteres.
Cada uno de los caracteres estudiados puede presentar dos o ms modalidades.
Las modalidades son las diferentes situaciones posibles del carcter, y deben ser al
mismo tiempo, incompatibles y exhaustivas.
Ejemplo 1:
El personal de una empresa (unidades estadsticas), del cual puede ser realizado un
estudio estadstico de su edad, sexo, antigedad, sueldo, etc. (caracteres). Por ejemplo,
de la antigedad podra subdividirse en "menos de tres aos", "entre tres y diez aos" y
"ms de diez aos" (modalidades).
Ejemplo 2:
La totalidad de barcos fabricados en un determinado periodo de tiempo (unidades
estadsticas), de la que se hace un estudio del material de fabricacin, capacidad,
modalidades de uso, etc. (caracteres). Por ejemplo, en cuanto a las modalidades de uso
pueden ser: transporte y mercancas.
* Carcter cualitativo y cuantitativo.
Un caracter se dice cualitativo si sus diversas modalidades no son expresables
numricamente (por ejemplo: sexo, profesin...).

Un caracter se dice cuantitativo si sus diversas modalidades se expresan


numricamente (por ejemplo: sueldo, edad, ...). A este nmero se le llama variable
estadstica.
NOTA: Nosotros en este tema nos limitaremos a tratar nicamente caracteres

cuantitativos.
Una variables estadstica se llama discreta si sus valores son nmeros aislados (por
ejemplo, nmeros enteros como sucede en el caso de "nmero de hijos", pues nadie
tiene 1,57 hijos ).
Una variable estadstica se llama continua si sus valores pueden ser cualquier
nmero (por ejemplo, el "tamao de una pieza").
9.2 Distribuciones estadsticas de una carcter.
Consideremos una poblacin estadstica de n indivduos descrita segn el carcter C,
cuyas k modalidades son:
C1, C2, ... , Ci, ... , Ck

ni el nmero de individuos que presentan la modalidad Ci , y se la llama


"frecuencia absoluta" de la modalidad Ci.
Se designa por

Por otra parte, se llama "frecuencia relativa" o simplemente "frecuencia" de la


modalidad Ci a la proporcin:

Como las modalidades son a la vez incompatibles y exhaustivas, la suma de las


frecuencias absolutas es igual a la poblacin total, y la suma de las frecuencias es igual
a la unidad, es decir:

Cuando la variable estadstica es continua, las modalidades del carcter son las clases
de valores posibles definidas por los extremos de clase. Por ejemplo, si designamos
poreo, ..., ei, ..., ek los elementos de clase, tal como se muestra en la grfica:

entonces la clase n i estar definida por el intervalo:

* Marca de la clase n i viene definida por:

* Distancia entre las marcas de las clases n i y n i+1 viene definida por:

* Amplitud de la clase n i viene definida por:

* Frecuencia relativa acumulada: es la proporcin de observaciones cuyos valores


son menores o iguales al lmite superior de la clase, o, en forma equivalente, menores
que el lmite inferior de la siguiente clase.
Una observacin: La cantidad de clases a emplear para clasificar los datos en un
conjunto estn en ntima dependencia del total de observaciones de ste. Si la cantidad
de observaciones es relativamente pequea, la cantidad de clases a emplear ser
cercana a 5. Si existe una cantidad sustancial de datos, la cantidad de clases debe
encontrarse entre 8 y 12, aunque generalmente no suele superarse a 15.
Ejemplo 3:
De acuerdo con los datos publicados en la revista Sea men's en su nmero de febrero
de 1980, las cuotas anuales de 40 compaas para un seguro de $25.000 por marino
incluido en la tripulacin son las siguientes:
$ 82 - 85 - 86 - 87 - 87 - 89 - 89 - 90 - 91 - 91 - 92 - 93 - 94 - 95 - 95 -95 - 95 - 95 - 97 98 - 99 - 99 - 100 - 100 - 101 - 101 - 103 - 103- 103 - 104 - 105 - 105 - 106 - 107 - 107
- 107 - 109 - 110 - 110 - 111
Como la diferencia entre los valores extremos es 111 - 82 = 29, al decidir -por
ejemplo- utilizar 6 clases, el intervalo de cada clase ser aproximadamente de $5. Para
establecer los lmites de cada clase, hay que considerar la unidad ms cercana con

respecto a la cual se miden las observaciones. En este caso se va a redondear al dolar


ms cercano. Con estos datos podemos establecer la siguiente tabla:
Agrupamiento y frecuencias absolutas y acumuladas del ejemplo 3
f

Lmites de clase

Marca de clase

Frecuencia, i

82-86
87-91
92-96
97-101
102-106
107-111
Totales

84
89
94
99
104
109

3
7
8
8
7
7
40

Frecuencia

f /n

relativa i

Frec. acumulada

3/40 = 0,075
7/40 = 0,175
8/40 = 0,200
8/40 = 0,200
7/40 = 0,175
7/40 = 0,175

3
10
18
26
33
40

Frec. relativa
acumulada
3/40 = 0,075
10/40 = 0,250
18/40 = 0,450
26/40 = 0,650
33/40 = 0,825
40/40 = 1,000

1,000

9.3 Representacin grfica de las distribuciones


Aunque una tabla estadstica encierra toda la informacin disponible, para realizar
una sntesis visual de los datos es recomendable pasarla a forma grfica. El principio de
la representacin de los caracteres es la proporcionalidad de las reas con las
frecuencias absolutas. Se pueden utilizar diagramas de sectores, o de rectngulos
(denominadohistogrma) . Tambin se pueden representar las frecuencias acumuladas,
dando lugar a la denominada curva de distribucin, denotada por F(x).

Representacin grfica por sectores de los datos del ejemplo 3.

Histograma de los datos del ejemplo 3.

Curva de distribucin de los datos del ejemplo 3.

Otra caracterstica grfica til de un conjunto de datos, es la distribucin de


frecuencia relativa acumulativa u ojiva. Se trata de una poli-lnea que se obtiene
trazando en el eje vertical la frecuencia relativa acumulada (ltima columna de la tabla)
de cada clase y en el eje horizontal el lmite inferior de la clase siguiente, y uniendo con
segmentos los puntos consecutivos as obtenidos.
El principal uso de la distribucin acumulativa es lo que comnmente se conoce
como cuantles.
En una distribucin de frecuencia relativa acumulativa se define cuantl como el valor
bajo el cual se encuentra una determinada proporcin de los valores de la distribucin.
El valor del cuantl se lee en la direccin opuesta, en el eje horizontal, a la proporcin
correspondiente deseada sobre el eje vertical. El cuantl ms comn es el percentl. Por
ejemplo, qo.2 es el valor bajo el cual se encuentra el 20% de los valores de la
distribucin, y qo.9 es el valor bajo el cual se encuentra el 90% de los valores de la
distribucin, tal como se aprecia en la grfica adjunta.

9.4 Descripcin numrica de una variable estadstica.

Para todo conjunto de datos hay dos medidas destacables: la localizacin de su


centro, y su variabilidad. La tendencia central de un conjunto de datos es la
disposicin de stos para agruparse ya sea alrededor del centro o de ciertos valores
numricos.
La variabilidad de un conjunto de datos es la dispersin de las observaciones en el
conjunto.
* Caractersticas de tendencia central:
Se llama mediana al valor de la variable estadstica que divide en dos bloques iguales
a los individuos de la poblacin, suponiendo que estn ordenados por valor creciente
del carcter.
Si la cantidad de observaciones es un nmero impar, la mediana es el valor de la
observacin que se encuentra a la mitad del conjunto ordenado. Si la cantidad de
observaciones es par, la mediana es la media aritmtica de las dos observaciones que se
encuentran en la mitad del conjunto ordenado.
Para datos agrupados, la mediana es aquel valor que divide en dos partes iguales la
distribucin de frecuencia relativa. La frmula en este caso viene dada por:
Mediana = L + c(j/fm)
donde L es el lmite inferior de la clase donde se encuentra la mediana, f m es la
frecuencia de esa clase, y j es la cantidad de observaciones en esta clase que son
necesarias para completar un total de n/2.
Se llama moda de una variable estadstica al valor del carcter que tiene mayor
frecuencia. En el caso de que haya varios valores compartiendo la frecuencia mxima
esta modapuede tener una utilidad muy limitada.
Para el caso de datos agrupados, la moda es el punto medio de la clase que presenta
una mayor frecuencia.
Se llama media de una variable estadstica, denotada por
los valores posibles por sus respectivas frecuencias:

a la suma ponderada de

Cuando la variable estadstica es contnua, es decir, los datos estn agrupados, los
valores xi son las marcas de clase de cada uno de los intervalos.

Ejemplo 4:
Calcular las tres medidas de tendencia central para el ejemplo 3.
Solucin: Teniendo en cuenta que eran 40 observaciones, se obtiene que: la
mediana es la medida de los dos valores correspondientes a las observaciones 20 y 21,
despus de haberlas ordenado en orden creciente, es decir: (98+99)/2 = 98,50.
La media en este caso es:

En cuanto a la moda es 95, el valor que ms se repite, con una frecuencia de 5


observaciones.
* Caractersticas de tendencia central:
Se denomina varianza de una variable estadstica, y se denota por s al promedio del
cuadro de las distancias entre cada observacin y la media:

Se llama desviacin tpica de una variable estadstica, s, a la raz cuadrada positiva de


la varianza:

Para ciertos casos, tanto en en la frmula de s como en la de s, podemos expresar el


recorrido del ndice i entre 1 y n, en lugar de entre 1 y k, por ejemplo, para la varianza
podemos poner:

De aqu podemos extraer otra frmula muy empleada, para ello desarrollamos el
cuadrado:

y por tanto, la desviacin tpica (o desviacin estndar) puede expresarse tambin:

Ejemplo 4:
Calcular la varianza y la desviacin estndar para los datos del ejemplo 3.
Solucin: En primer lugar debemos hallar la suma de los cuarenta valores y la suma
de sus cuadrados:

y ahora, segn la frmula que acabamos de obtener:

Para datos agrupados la varianza y la desviacin tpica pueden calcularse de forma


aproximada mediante las siguientes expresiones:

Ejemplo 5:
Calcular los valores aproximados de la varianza y la desviacin estndar para los
datos del ejemplo 3 considerndolos como agrupados.
Solucin: Con los datos del ejemplo 3 podemos establecer la siguiente tabla ( NOTA:
En xi se coloca el punto medio de la clase):
xi

fi

x i

fi.xi

84
89
94
99
104
109

3
7
8
8
7
7

7056
7921
8836
9801
10816
11881

21 168
55 447
70 688
78 408
75 712
83 167

Total

40

384 590

Ahora establecemos las siguientes cantidades:

Por lo tanto, tenemos:

Se llama desviacin media al promedio de los valores absolutos de la diferencia entre


cada observacin y la media de las observaciones. La desviacin media viene dada por:

Para datos agrupados, el valor aproximado de la desviacin media se expresa:

Ejemplo 6:
Hallar la desviacin media para los valores no agrupados del ejemplo 3.
Solucin: Solamente tenemos que considerar la expresin para la desviacin media,
que en este caso es:

D.M = 264,2/40 = 6,61


La desviacin mediana es el promedio de los valores absolutos de las diferencias entre
cada observacin y la mediana de stas. La desviacin mediana viene dada por:

El recorrido, R, de las observaciones en un conjunto de datos es la diferencia entre el


valor ms grande y el ms pequeo del conjunto.
El recorrido intercuantil es la diferencia entre los percentiles 75-avo y 25-avo.
El recorrido interdecil es la diferencia entre los percentiles 90-avo y 10-avo (dcimo).
* Resumen de las medidas numricas descriptivas para el ejemplo 3.
Medida
numrica
Medida
Mediana
Moda
Varianza
Desv. estndar
Desv. media
Desv. mediana
Recorrido

Datos no
agrupados
97,90
98,50
95,00
61,015
7,81
6,61
6,60
29,0

Datos agrupados
97,75
98,25
96,50
61,217
7,82
6,63
6,57
---

Rec. intercuantil
Rec. interdecil

-----

12,50
22,00

Ejercicios para el alumno:


1. Los siguientes datos son los tiempos, en minutos, necesarios para que 50 clientes
de un banco comercial lleven a cabo una transaccin bancaria:
2,3
2,4
3,3
1,8
7,8
3,1
2,4
0,4
4,2
6,3

0,2
4,4
9,7
4,7
0,8
3,7
4,6
1,2
1,2
7,6

2,9
5,8
2,5
0,7
0,9
7,2
3,8
1,1
0,5
1,4

0,4
2,8
5,6
6,2
0,4
1,6
1,5
5,5
6,8
0,5

2,8
3,3
9,5
1,2
1,3
1,9
2,7
3,4
5,2
1,4

a) Construir una distribucin de frecuencia relativa.


b) Construir una distribucin de frecuencia relativa acumulada.
c) Con los resultados del apartado (b), determinar los recorridos intercuantil e
interdecil.
d) Con los datos agrupados, calcular: media, mediana, moda, desviacin estndar,
desviacin media y desviacin mediana.
e) Verificar los resultados del apartado (d) calculando las mismas medidas para los
datos no agrupados.
2. La demanda diaria, en unidades de un cierto producto, durante 30 das de trabajo
es:
38
67
28
49
47

35
63
25
78
66

76
33
36
48
58

58
69
32
42
44

48
53
61
72
44

59
51
57
52
56

a) Construir la distribuciones de frecuencia relativa y de frecuencia relativa


acumulada
b) Con la distribucin acumulada, determinar los tres cuantiles.
c) Calcular la media, mediana, moda, desviacin estndar, desviacin media y

desviacin mediana, empleando tanto los datos agrupados como los no agrupados, y
comparar los dos conjuntos de resultados.
3. Los siguientes datos agrupados representan los pagos por almacenamiento para los
50 ms grandes detallistas durante el ao 1979.
Lmites de clase

Frecuencias

1,10 - 1,86
1,87 - 2,63
2,64 - 3,40
3,41 - 4,17
4,18 - 4,94
4,95 - 5,71
5,72 - 6,48
6,49 - 7,25

4
14
11
9
7
1
2
2

a) Construir el grfico de la distribucin de frecuencia relativa acumulada.


b) Con los resultados del apartado (a), determinar los recorridos intercuantil e
interdecil.
c) Calcular: media, mediana y moda.
d) Calcular la varianza, desviacin estndar, desviacin media y desviacin mediana.
4. La siguiente informacin agrupada representa el nmero de puntos anotados por
equipo y por juego en la Liga Nacional de Ftbol Americano durante la temporada de
1973:
Grupo
0-3
4-10
11-17
18-24
25-31
32-38
39-45
46-52

Frecuencia
27
66
91
70
57
34
16
3

a) Construir el grfico de la distribucin de frecuencia relativa


b) Calcular: media, mediana y moda.
c) Calcular la varianza, desviacin estndar y desviacin media.
5. Se seleccionaron 20 bateras aleatoriamente de un proceso de fabricacin , y se
llev a cabo una prueba para determinar la duracin de stas. Los siguientes datos
representan el tiempo de duracin en horas para las 20 bateras:

52,5
58,9
62,3
56,8

62,7
57,3
64,4
53,1

58,9
60,4
52,7
58,7

65,7
59,6
54,9
61,6

49,3
58,1
48,8
63,3

a) Calcular: media y mediana.


b) Determinar desviacin estndar, desviacin media y desviacin mediana.
c) Determinar los recorridos intercuantil e interdecil.

Otras pginas sobre Estadstica Descriptiva en Internet:


- Introduccin a la Estadstica Descriptiva (desde la Universidad Catlica de
Valparaso - Chile)
- Introduccin a la Estadstica Descriptiva (desde AulaFcil)
- Conceptos bsicos de Estadstica (desde CICA)
- Comprensin y uso de la Estadstica (por Fernando Valdes - Universidad Romulo
Gallegos)
- Estadstica Descriptiva y Probabilidades (por Mara Jos Japn & Jos Garca)
- Curso de Estadstica Descriptiva (desde la Universidad de Antioqua - Colombia)
- Curso de Estadstica (por Victor Larios desde la UNEQ - Mjico)
- Descriptive Statistics Introduction (by Jay Hill teacher from the UIUC)

Vous aimerez peut-être aussi