Vous êtes sur la page 1sur 7

Explicacin del Diagrama de Cajas

Usamos el diagrama de cajas (Boxplot) porque es la forma grfica que


simplifica la interpretacin de la variabilidad de un conjunto de datos. La caja,
ubicada en el centro, muestra cmo se distribuye el 50% de datos, desde el
primer cuartil (Q1) hasta el tercer cuartil (Q3). La diferencia entre el tercer
cuartil y el primer cuartil es denominado rango intercuartlico (RI). El bigote
superior considera los valores hasta Q3 +1.5*(RI) y el bigote inferior hasta
Q1-1.5*(RI).
Cualquier
valor
que
exceda
a
estos
bigotes
serconsideradoatpico.
Expliqumoslo con un ejemplo: En la siguiente tabla se encuentra un
fertilizante a y sus respectivos porcentajes de contenido de nitrgeno:
Fertiliza
nte
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a

Porcent
aje
34
60
35
32
35
34
35
19
17
31
37
39
21
26
18
16
15
13
11
11
12
19
25
28
12
23

21

1. Se deben de ordenar los datos en forma ascendente.


Fertiliza
nte
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a

Porcent
aje
11
11
12
12
13
15
16
17
18
19
19
21
21
23
25
26
28
31
32
34
34
35
35
35
37
39
54

2. Luego, obtener el primer, segundo (mediana) y tercer cuartil.


Nmero de datos= 27
Primer Cuartil= Considera los nmeros comprendidos dentro del 25%
de los datos (P25)
Segundo Cuartil= Considera los nmeros comprendidos hasta el 50%
de los datos (P50)

Tercer Cuartil= Considera los nmeros comprendidos hasta el 75% de


los datos (P75)
Rango Intercuartlico (Q3-Q1)= Considera el 50% de los datos ubicados
en el centro de la distribucin del conjunto de datos.

P q= X

( n100+1 )q

q
( n+1
100 )

Entero (E), entonces Pq=X(E)

q
( n+1
100 )

Decimal (E.d), entonces Pq=X(E)

, si

+0.d*(X(E+1)-X(E))

Calculando los percentiles:

P25=X

25
( 27+1
100 )

El resultado sera P25= X(7)


El nmero ubicado en la posicin 7 es 16, ese es el valor de Q1

P50=X

50
( 27+1
100 )

El resultado sera P50=X(14)


El nmero ubicado en la posicin 14 es 23, ese es el valor de Q2.

P75=X

75
( 27+1
100 )

El resultado sera P75=X(21)

El nmero ubicado en la posicin 21 es 34, ese es el valor de Q3.


3. A partir de estos datos calculamos el rango intercuartlico y el alcance
de los bigotes:
RI= Q3-Q1=P75-P25=34-16=18
El alcance de los bigotes:
Intervalo de Seguridad Inferior=Q1-1.5*RI=16-1.5*(18)= -11
Intervalo de Seguridad Superior=Q3+1.5*RI=34+1.5*(18)= 61

El valor del alcance del bigote considerara el dato aproximadamente


menor o igual al ISS para el bigote superior y el dato aproximadamente
mayor o igual ISI para el bigote inferior.
Para nuestro caso:
ISI= -11, pero nuestro dato mayor o igual a ese lmite es 11.
ISS= 61, pero nuestro dato menor o igual a ese lmite es 54.
OJO: Cualquier dato que sea menor a 11 (Bigote Inferior) o mayor a 54
(Bigote Superior), ser considerado atpico.
4. La forma de construccin del Diagrama de Cajas debera ser as:

5. Construyendo nuestro Diagrama de Cajas con los datos, quedara de la


siguiente forma:

La interpretacin del diagrama de cajas es el siguiente:


-

A mayor tamao de la caja en longitud, mayor variabilidad. A menor


tamao de la caja en longitud, menor variabilidad.
Los bigotes pueden estar presentes o no. Cuando no est presente un
bigote, o ambos en algunos casos, quiere decir que los datos se
encuentran dentro de la caja. Esto sucede, por ejemplo, cuando se
tienen varios datos con el mismo valor.

Fertiliza
nte
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a

Porcent
aje
20
20
20
20
20
20
20
21
21
22
22
23
23
24
25
26
27
28
28
29
29
29
29
29
29
29
29

En el diagrama de cajas podemos observar que el conjunto de datos es muy


variable, debido a que la caja es extensa en longitud.
La lnea que se encuentra en la mitad de la caja es la Mediana y representa al
dato que se encuentra en la posicin central del conjunto de datos ordenados.
Mientras ms pequea sea la caja, los lmites de la caja (Q3 y Q1) se ubicaran
ms cerca de la mediana, y ello podra significar una menor variabilidad en los
datos, es decir, datos con valores muy cercanos unos de otros.

Vous aimerez peut-être aussi