Vous êtes sur la page 1sur 11

Tallos y hojas

Es una alternativa para agrupar los datos de la muestra. Podemos construir un diagrama de
tallos y hojas dividiendo el numero en dos partes.

a) El tallo (dígito primario), consiste en uno o más de los primeros dígitos.


b) La hoja (dígito derivado), consiste en el número o números restantes.

Por ejemplo:

Si el dato es el número 17.5, entonces el tallo es el número diecisiete y la hoja es el 5.

El número de hoja nos da la frecuencia correspondiente. En este diagrama no se pierden los


datos originales. Es recomendable no elegir menos de 5 ni más de 20 tallos. Una vez electo el
número de tallos, se listan éstos en forma de columnas en el margen izquierdo, a continuación
y siguiendo a los tallos, se anotan las hojas correspondientes a cada tallo en orden
ascendente. El diagrama es similar al histograma y puede verse de inmediato en donde se
están agrupando la mayoría de los datos.

El diagrama puede elaborarse de dos maneras: Con los tallos sencillos y con tallos
codificados.
Ejemplo de Tallos sencillos
14.2 15.4 16.0 16.6 17.9 15.8 17.0 16.9 16.9 16.8
15.7 16.4 15.2 15.8 15.9 16.1 15.6 15.9 15.6 16.0
16.4 15.8 17.7 16.2 15.6 14.9 16.3 16.3 16.0 17.3
15.0 16.3 14.6 16.8 16.5 15.3 16.1 15.4 15.8 16.2
16.9 14.0 15.2 15.3 16.7 16.8 15.1 16.2 15.6 15.8

Tallos (dígitos
Hojas ( dígitos derivados) frecuencia
Primarios)
14. 2,9,6,0 4

15. 4,8,7,2,8,9,6,9,6,8,6,0,3,4,8,2,3,1,6,8. 20

16. 0,6,8,9,8,4,1,0,4,2,3,3,0,3,8,5,1,2,9,7,8,2 22

17. 9,0,7,3. 4
Total = 50 Datos. 50
Ejemplo de Tallos codificados
El diagrama de tallos y hojas anterior contiene solo cuatro troncos y, en consecuencia, no
proporciona una imagen adecuada de la distribución. Para evitar ese problema, se necesita
Note que cada uno de los tallos se
incrementar el número de troncos en la tabla; el número adecuado de intervalos debe ser de 5
a 20 intervalos. dividió en dos partes.

Tallos (dígitos Primarios) Hojas (dígitos derivados) frecuencia El primero para los dígitos
14. 2,0. 2 unitarios inferiores ( 0,1,2,3,4)
14. * 9,6. 2
15. 4,2,0,3,4,2,3,1. 8 El segundo para los dígitos
15. * 8,7,8,9,6,9,6,8,6,8,6,8. 12 unitarios superiores (5,6,7,8,9)
16. 0,4,1,0,4,2,3,3,0,3,1,2,2. 13 representado por un *.
16. * 6,8,9,8,8,5,9,7,8. 9
17. 0,3, 2
17. * 9,7. 2
Total = 50 Datos 50 Datos
Dado que los datos anteriores son proporcionados en bruto (es decir, en el orden en que
aparecen), hace falta ordenarlos de manera ascendente:

Tallos ( dígitos Primarios) Hojas (dígitos derivados)


14. 0,2.
14. * 6,9.
15. 0,1,2,2,3,3,4,4.
15. * 6,6,6,6,7,8,8,8,8,8,9,9.
16. 0,0,0,0,1,1,2,2,2,3,3,3,4,4.
16. * 5,6,7,8,8,8,8,9,9.
17. 0,3.
17. * 7,9.
Total = 50 Datos
Sturges
El Método de Sturges para determinar el número de clases es el siguiente:

1. Obtener el rango modificado "Rm".

Rm = dato mayor – dato menor + 1 cifra significativa

2. Determinar el número de clases "k" mediante el número de Sturges.

k = 1 + 3.322 log (n)

el valor de k se redondea al entero superior más próximo.

3. Obtener la amplitud de clase (amplitud del intervalo) "A":

A = Rm / k
Ejercicio:

Agrupar los datos de la muestra utilizando el método de tallos y hojas

68 84 75 82 68 90 62 88 76 93 73 79 88 73 60 93 71 59 85 75 61 65 75 87 74 62
95 78 63 72 66 78 82 75 94 77 69 74 68 60 96 78 89 61 75 95 60 79 83 71 79 62
67 97 78 85 76 65 71 75 65 80 73 57 88 78 62 76 53 74 86 67 73 81 72 63 76 75
85 77
Medidas de tendencia central
Un promedio es un valor típico o representativo de un conjunto de datos. Como estos valores
típicos tienden a encontrarse en el centro de los conjuntos de datos, ordenados de acuerdo
con su magnitud, a los promedios se les conoce también como medidas de tendencia central.

Se pueden definir varios tipos de promedios; los más usados son la media aritmética, la
mediana, la moda y la media. Cada una de ellas tiene ventajas y desventajas de acuerdo con
el tipo de datos y el propósito de su uso.
Medidas de tendencia central
Mediana:

Una medida de centralización importante es la mediana Me. Se define ésta


como una medida central tal que, con los datos ordenados de menor a
mayor, el 50 % de los datos son inferiores a su valor y el 50 % de los datos
tienen valores superiores.

Supongamos en primer lugar que los diferentes valores de la variable no


aparecen, en general, repetidos. En este caso, y suponiendo que tenemos
los datos ordenados, la mediana será el valor central, si N es impar, o la
media aritmética de los dos valores centrales, si N es par. Por ejemplo, si x
= 1, 4, 6, 7, 9, la mediana sería 6. Por otro lado, si x = 1, 4, 6, 7 la mediana
es Me = (4 + 6)/2 = 5.
Moda
Se define la moda Mo de una muestra como aquel valor de la variable que
tiene una frecuencia máxima. En otras palabras, es el valor que más se
repite. Hay que indicar que puede suceder que la moda no sea única, es
decir que aparezcan varios máximos en la distribución de frecuencias. En
ese caso diremos que tenemos una distribución bimodal, trimodal, etc.
Evidentemente, en el caso de una variable discreta que no toma valores
repetidos, la moda no tiene sentido. Cuando sí existen valores repetidos su
cálculo es directo ya que puede leerse directamente.
Bimodal o multimodal.

1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9

No hay moda.

2, 2, 3, 3, 6, 6, 9, 9

Si dos puntuaciones adyacentes tienen la frecuencia máxima,


la moda es el promedio de las dos puntuaciones adyacentes.

0, 1, 3, 3, 5, 5, 7, 8 Mo = 4

Vous aimerez peut-être aussi