Vous êtes sur la page 1sur 40

Diagrama de barras

Un diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo
discreto.
Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los valores de la variable, y
sobre eleje de ordenadas las frecuencias absolutas o relativas o acumuladas.
Los datos se representan mediante barras de una altura proporcional a la frecuencia.
Ejemplo:

Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguneo ha dado el
siguiente resultado:

Grupo sanguneo

fi

AB

20

Polgonos de frecuencia

Un polgono de frecuencias se forma uniendo los extremos de las barras mediante segmentos.
Tambin se puede realizar trazando los puntos que representan las frecuencias y unindolos
mediante segmentos.
Ejemplo:

Las temperaturas en un da de otoo de una ciudad han sufrido las siguientes variaciones:

Hora

Temperatura

12

12

14

15

11
2

18

12

21

10

24

1 El siguie n te diagram a de bar ras indica e l co lo r de pe lo de lo s alu mno s de la clase


de Mar io . Co mp le ta la tabla co n las fr e cue ncias abso lutas co rr e spo ndie nte s a cada
co lo r y r espo nde las sig uie nte s pr e gun tas:

Color de pelo

fi

Rubio

Pelirrojo

Moreno

Q u tipo de pe lo pr e do mina e n la clase ?

Pr e do mina e l pe lo

C unto s estu dian te s so n pe lir ro jo s?

C unto s estu dian te s hay e n to tal e n clase de Mar io?

2 El siguie n te po lgo no de fr e cue ncia mue s tra la me dia de te mpe ratura diar ia e n
una ciuda d po laca a lo lar go lo s sie te d a de una se mana. Co m ple ta la tabla y
r e spo nde a las pre gu ntas :

Hora

Temperatura

Q u da hiz o me no s fr o ?

Hiz o me no s fr o e l da

L a mayor a de lo s d as, la te mpe ratura fue bajo ce r o o so bre ce ro ?

ce r o.

C ul fue la te mpe ratura lo s do s pr ime ro s das?

L a te mpe ratura fue de

3 El siguie n te diagram a de bar ras mue stra las no tas de lo s alumno s de una clase
de una clase de 3 ESO. C o mple ta la tab la y re spo nde a las pr e gunta s:

Nota

fi

Insuficiente
Suficiente
Bien
Notable
Sobresaliente

Q u no ta e s la ms co mn?

C unto s estu dian te s han suspe ndi do la asi gnat ura?

Han suspe nd ido

e stud iante s.

C unto s estu dian te s han apr o bado la asignat ura?

Han apr o bado

e stud iante s.

C unto s estu dian te s hay e n la clase ?

H ay

est udian te s.

4 L o s siguie n te s valo re s indican e l nme r o de co midas al da que hace un gr upo de


qu ince amigo s :
3, 4, 2, 3, 4, 3, 4, 5, 4, 5, 3, 4, 5, 3, 4.
C o mple ta la ta bla y re spo nde a las pr e gun tas que se plante an .

N de comidas

Personas

2
3
4
5
6

Sa bie ndo que lo s expe r to s r e co mie nda n co me r 5 vece s al da, po de mo s de cir q ue


la mayor a de e sto s ami go s co me cor re ct ame nte ?

C unto s de ello s co me n s lo 2 vece s al da?

C untas vece s al da co me la mayor a de las pe r so nas e ncue stadas?

Un dia gr a m a de s ec to r es se pue de util iz ar para to do ti po de var iable s , pe r o se usa


fr e cue nte me nte para las var ia ble s c ua lit a t iva s .

L o s dat o s se r e pr e se ntan e n un c r c ulo , de mo do que e l ngulo de


cada sec t or e s pr o por c io na l a la fr ec uenc ia a bso luta co rr e spo ndie n te .

El diagram a cir cular se co nstr u ye co n la ayu da de un trans po r tado r de ngu lo s.

Ejem plo :

En un a clase de 3 0 alumno s, 1 2 j ue gan a balo nce sto, 3 practic an la nataci n , 9 jue ga n


al f tbo l y el re sto no prac tica ning n de po r te .

Alumnos

ngulo

Baloncesto

12

144

Natacin

36

Ftbol

108

Sin deporte

72

Total

30

360

Histograma

Un histograma es una representacin grfica de una variable en forma de barras.


Se utilizan para variables continuas o para variables discretas, con un gran nmero de datos, y que se han
agrupado enclases.
En el eje abscisas se construyen unos rectngulos que tienen por base la amplitud del intervalo, y
por altura, lafrecuencia absoluta de cada intervalo.
La superficie de cada barra es proporcional a la frecuencia de los valores representados.

Polgono de frecuencia

Para construir el polgono de frecuencia se toma la marca de clase que coincide con el punto medio de
cada rectngulo.
Ejemplo:

El peso de 65 personas adultas viene dado por la siguiente tabla:

ci

fi

Fi

[50, 60)

55

[60, 70)

65

10

18

[70, 80)

75

16

34

[80, 90)

85

14

48

[90, 100)

95

10

58

10

[100, 110)

105

63

[110, 120)

115

65

65

Histograma y polgono de frecuencias acumuladas

Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene el histograma de
frecuencias acumuladas o su correspondiente polgono.

11

Histogramas con intervalos de amplitud diferente

Para construir un histogramas con intervalo de amplitud diferente tenemos que calcular las alturas de
los rectngulosdel histograma.

hi es la altura del intervalo.


fi es la frecuencia del intervalo.
ai es la amplitud del intervalo.
Ejemplo:

En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por
un grupo de 50 alumnos.

fi

[0, 5)

15
12

hi

[5, 7)

20

10

[7, 9)

12

[9, 10)

50

Un parmetro estadstico es un nmero que se obtiene a partir de los datos de una distribucin estadstica.
Los parmetros estadsticos sirven para sintetizar la informacin dada por una tabla o por una grfica.
Tipos de parmetros estadsticos

Hay tres tipos parmetros estadsticos:


De centralizacin.
De posicin
De dispersin.
13

Medidas de centralizacin

Nos indican en torno a qu valor (centro) se distribuyen los datos.


La medidas de centralizacin son:
Media aritmtica

La media es el valor promedio de la distribucin.


Mediana

La mediana es la puntacin de la escala que separa la mitad superior de la distribucin y la inferior, es


decir divide la serie de datos en dos partes iguales.
Moda

La moda es el valor que ms se repite en una distribucin.


Medidas de posicin

Las medidas de posicin dividen un conjunto de datos en grupos con el mismo nmero de individuos.
Para calcular las medidas de posicin es necesario que los datos estn ordenados de menor a mayor.
La medidas de posicin son:
Cuartiles

Los cuartiles dividen la serie de datos en cuatro partes iguales.


Deciles

Los deciles dividen la serie de datos en diez partes iguales.


Percentiles

Los percentiles dividen la serie de datos en cien partes iguales.


Medidas de dispersin

Las medidas de dispersin nos informan sobre cuanto se alejan del centro los valores de la distribucin.
Las medidas de dispersin son:
14

Rango o recorrido

El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica.
Desviacin media

La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a
la media.
Varianza

La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media.


Desviacin tpica

La desviacin tpica es la raz cuadrada de la varianza.


La moda es el valor que tiene mayor frecuencia absoluta.
Se representa por Mo.
Se puede hallar la moda para variables cualitativas y cuantitativas.
Hallar la moda de la distribucin:
2, 3, 3, 4, 4, 4, 5, 5 Mo = 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la mxima,
la distribucines bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el promedio de las dos
puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8Mo = 4
Clculo de la moda para datos agrupados

15

1 Todos los intervalos tienen la misma amplitud.

Li es el lmite inferior de la clase modal.


fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.
Tambin se utiliza otra frmula de la moda que da un valor aproximado de sta:

Ejemplo:

Calcular la moda de una distribucin estadstica que viene dada por la siguiente tabla:

fi

[60, 63)

[63, 66)

18

[66, 69)

42

[69, 72)

27

[72, 75)

100
16

2 Los intervalos tienen amplitudes distintas.

En primer lugar tenemos que hallar las alturas.

La clase modal es la que tiene mayor altura.

La frmula de la moda aproximada cuando existen distintas amplitudes es:

Ejemplo:

En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por
un grupo de 50 alumnos. Calcular la moda.

fi

hi

[0, 5)

15

[5, 7)

20

10

17

[7, 9)

[9, 10)

12

50

Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de menor a mayor.
La mediana se representa por Me.
La mediana se puede hallar slo para variables cuantitativas.

Clculo de la mediana

1. Ordenamos los datos de menor a mayor.


2. Si la serie tiene un nmero impar de medidas la mediana es la puntuacin central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6Me = 5

3. Si la serie tiene un nmero par de puntuaciones la mediana es la media entre las dos puntuaciones
centrales.
7, 8, 9, 10, 11, 12Me = 9.5

Clculo de la mediana para datos agrupados


18

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de
las frecuencias absolutas.

Es decir tenemos que buscar el intervalo en el que se encuentre

Li es el lmite inferior de la clase donde se encuentra la mediana.

es la semisuma de las frecuencias absolutas.


Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
La mediana es independiente de las amplitudes de los intervalos.
Ejemplo:

Calcular la mediana de una distribucin estadstica que viene dada por la siguiente tabla:

fi

Fi

[60, 63)

[63, 66)

18

23

[66, 69)

42

65

19

[69, 72)

27

92

[72, 75)

100

100

100/2 = 50
Clase de la mediana: [66, 69)

La media aritmtica es el valor obtenido al sumar todos los datos y dividir el resultado entre
el nmero total de datos.
es el smbolo de la media aritmtica.

Ejemplo:

Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.

Media aritmtica para datos agrupados


20

Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la media es:

Ejercicio de media aritmtica

En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula
la puntuacin media.

xi

fi

xi fi

[10, 20)

15

15

[20, 30)

25

200

[30,40)

35

10

350

[40, 50)

45

405

[50, 60

55

440

[60,70)

65

260

[70, 80)

75

150

42

1 820

21

Propiedades de la media aritmtica

1. La suma de las desviaciones de todas las puntuaciones de una distribucin respecto a la media de la
misma igual acero.

La suma de las desviaciones de los nmeros 8, 3, 5, 12, 10 de su media aritmtica 7.6 es igual a 0:
8 7.6 + 3 7.6 + 5 7.6 + 12 7.6 + 10 7.6 =
= 0. 4 4.6 2.6 + 4. 4 + 2. 4 = 0

2. La suma de los cuadrados de las desviaciones de los valores de la variable con respecto a
un nmero cualquiera se hace mnima cuando dicho nmero coincide con la media aritmtica.

3. Si a todos los valores de la variable se les suma un mismo nmero, la media


aritmtica queda aumentada en dichonmero.

4. Si todos los valores de la variable se multiplican por un mismo nmero la media


aritmtica queda multiplicada por dicho nmero.

Observaciones sobre la media aritmtica

1. La media se puede hallar slo para variables cuantitativas.


22

2. La media es independiente de las amplitudes de los intervalos.


3. La media es muy sensible a las puntuaciones extremas. Si tenemos una distribucin con los siguientes
pesos:
65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.
La media es igual a 74 kg, que es una medida de centralizacin poco representativa de la distribucin.

4. La media no se puede calcular si hay un intervalo con una amplitud indeterminada.

xi

fi

[60, 63)

61.5

[63, 66)

64.5

18

[66, 69)

67.5

42

[69, 72)

70.5

27

[72, )

100

En este caso no es posible hallar la media porque no podemos calcular la marca de clase de ltimo intervalo.
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro
partes iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.
23

Q2 coincide con la mediana.


Clculo de los cuartiles

1. Ordenamos los datos de menor a mayor.

2. Buscamos el lugar que ocupa cada cuartil mediante la expresin

Nmero impar de datos

2, 5, 3, 6, 7, 4, 9

Nmero par de datos

2, 5, 3, 4, 6, 7, 1, 9

Clculo de los cuartiles para datos agrupados

En primer lugar buscamos la clase donde se encuentra


acumuladas.

Li es el lmite inferior de la clase donde se encuentra el cuartil.


N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase del cuartil.
24

, en la tabla de las frecuencias

ai es la amplitud de la clase.
Ejercicio de cuartiles

Calcular los cuartiles de la distribucin de la tabla:

fi

Fi

[50, 60)

[60, 70)

10

18

[70, 80)

16

34

[80, 90)

14

48

[90, 100)

10

58

[100, 110)

63

[110, 120)

65

65

Clculo del primer cuartil

25

Clculo del segundo cuartil

Clculo del tercer cuartil

Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
D5 coincide con la mediana.
Clculo de los deciles

En primer lugar buscamos la clase donde se encuentra


acumuladas.

Li es el lmite inferior de la clase donde se encuentra el decil.


N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase el decil..
ai es la amplitud de la clase.
Ejercicio de deciles

Calcular los deciles de la distribucin de la tabla:


26

, en la tabla de las frecuencias

fi

Fi

[50, 60)

[60, 70)

10

18

[70, 80)

16

34

[80, 90)

14

48

[90, 100)

10

58

[100, 110)

63

[110, 120)

65

65

Clculo del primer decil

Clculo del segundo decil

27

Clculo del tercer decil

Clculo del cuarto decil

Clculo del quinto decil

Clculo del sexto decil

Clculo del sptimo decil

Clculo del octavo decil

28

Clculo del noveno decil

Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
P50 coincide con la mediana.
P50 coincide con D5.
Clculo de los percentiles

En primer lugar buscamos la clase donde se encuentra


acumuladas.

, en la tabla de las frecuencias

Li es el lmite inferior de la clase donde se encuentra el percentil.


N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase del percentil.
ai es la amplitud de la clase.
Ejercicio de percentiles

Calcular el percentil 35 y 60 de la distribucin de la tabla:

fi
29

Fi

[50, 60)

[60, 70)

10

18

[70, 80)

16

34

[80, 90)

14

48

[90, 100)

10

58

[100, 110)

63

[110, 120)

65

65

Percentil 35

Percentil 60

30

Desviacin respecto a la media

La desviacin respecto a la media es la diferencia en valor absoluto entre cada valor de la variable
estadstica y lamedia aritmtica.
Di = |x - x|
Desviacin media

La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la
media.

La desviacin media se representa por

Ejemplo:

Calcular la desviacin media de la distribucin:


9, 3, 8, 8, 9, 8, 9, 18

Desviacin media para datos agrupados

31

Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la desviacin media es:

Ejemplo:

Calcular la desviacin media de la distribucin:

xi

fi

xi fi

|x -x|

|x - x| fi

[10, 15)

12.5

37.5

9.286

27.858

[15, 20)

17.5

87.5

4.286

21.43

[20, 25)

22.5

157.5

0.714

4.998

[25, 30)

27.5

110

5.714

22.856

[30, 35)

32.5

65

10.714

21.428

21

457.5

32

98.57

La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una
distribucin estadstica.
La varianza se representa por

Varianza para datos agrupados

Para simplificar el clculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a
las anteriores.

Ejercicios de varianza

Ejercicio 1:

Calcular la varianza de la distribucin:

33

9, 3, 8, 8, 9, 8, 9, 18

Ejercicio 2:

Calcular la varianza de la distribucin de la tabla:

xi

fi

xi2 fi

xi fi

[10, 20)

15

15

225

[20, 30)

25

200

5000

[30,40)

35

10

350

12 250

[40, 50)

45

405

18 225

[50, 60

55

440

24 200

[60,70)

65

260

16 900

[70, 80)

75

150

11 250

42

1 820

88 050

34

Propiedades de la varianza

1 La varianza ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
2 Si a todos los valores de la variable se les suma un nmero la varianza no vara.
3 Si todos los valores de la variable se multiplican por un nmero la varianza queda multiplicada por
el cuadrado de dicho nmero.

4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede
calcular lavarianza total.
Si todas las muestras tienen el mismo tamao:

Si las muestras tienen distinto tamao:

Observaciones sobre la varianza

1 La varianza, al igual que la media, es un ndice muy sensible a las puntuaciones extremas.
2 En los casos que no se pueda hallar la media tampoco ser posible hallar la varianza.

35

3 La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones estn
elevadas al cuadrado.
La desviacin tpica es la raz cuadrada de la varianza.
Es decir, la raz cuadrada de la media de los cuadrados de las puntuaciones de desviacin.
La desviacin tpica se representa por .

Desviacin tpica para datos agrupados

Para simplificar el clculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Ejercicios de desviacin tpica

Ejercicio 1:
36

Calcular la desviacin tpica de la distribucin:


9, 3, 8, 8, 9, 8, 9, 18

Ejercicio 2:

Calcular la desviacin tpica de la distribucin de la tabla:

xi

fi

xi2 fi

xi fi

[10, 20)

15

15

225

[20, 30)

25

200

5000

[30,40)

35

10

350

12 250

[40, 50)

45

405

18 225

[50, 60)

55

440

24 200

[60,70)

65

260

16 900

[70, 80)

75

150

11 250

42

1 820

88 050

37

Propiedades de la desviacin tpica

1 La desviacin tpica ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
2 Si a todos los valores de la variable se les suma un nmero la desviacin tpica no vara.
3 Si todos los valores de la variable se multiplican por un nmero la desviacin
tpica queda multiplicada por dichonmero.

4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones tpicas se
puede calcular la desviacin tpica total.
Si todas las muestras tienen el mismo tamao:

Si las muestras tienen distinto tamao:

Observaciones sobre la desviacin tpica

38

1 La desviacin tpica, al igual que la media y la varianza, es un ndice muy sensible a las puntuaciones
extremas.

2 En los casos que no se pueda hallar la media tampoco ser posible hallar la desviacin tpica.
3 Cuanta ms pequea sea la desviacin tpica mayor ser la concentracin de datos alrededor de la media.

Coeficiente de variacin

El coeficiente de variacin es la relacin entre la desviacin tpica de una muestra y su media.

El coeficiente de variacin se suele expresar en porcentajes:

El coeficiente de variacin permite comparar las dispersiones de dos distribuciones distintas, siempre que
sus mediassean positivas.
Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre s.
La mayor dispersin corresponder al valor del coeficiente de variacin mayor.
Ejercicio:

Una distribucin tiene x = 140 y = 28.28 y otra x = 150 y = 24. Cul de las dos presenta mayor
dispersin?

La primera distribucin presenta mayor dispersin.


Puntuaciones tpicas

39

Puntuaciones diferenciales

Las puntuaciones diferenciales resultan de restarles a las puntuaciones directas la media aritmtica.
xi = Xi X
Puntuaciones tpicas

Las puntuaciones tpicas son el resultado de dividir las puntuaciones diferenciales entre la desviacin
tpica. Este proceso se llama tipificacin.
Las puntuaciones tpicas se representan por z.

Observaciones sobre puntuaciones tpicas

La media aritmtica de las puntuaciones tpicas es 0.


La desviacin tpica de las puntuaciones tpicas es 1.
Las puntuaciones tpicas son adimensionales, es decir, son independientes de las unidades utilizadas.
Las puntuaciones tpicas se utilizan para comparar las puntuaciones obtenidas en distintas distribuciones.
Ejercicio

En una clase hay 15 alumnos y 20 alumnas. El peso medio de los alumnos es 58.2 kg y el de las alumnas y 52.4
kg. Las desviaciones tpicas de los dos grupos son, respectivamente, 3.1 kg y 5.1 kg. El peso de Jos es de 70
kg y el de Ana es 65 kg. Cul de ellos puede, dentro del grupo de alumnos de su sexo, considerarse ms
grueso?

Jos es ms grueso respecto de su grupo que Ana respecto al suyo.

40

Vous aimerez peut-être aussi