Vous êtes sur la page 1sur 40

ÍNDICE 1.

ESTADÍSTICA DESCRIPTIVA

1. ESTADÍSTICA DESCRIPTIVA
CONCEPTOS PRELIMINARES

? La Estadística es la rama de las matemáticas que se ocupa de los métodos y procedi-


mientos para recoger, clasificar, representar y resumir datos (Estadística descriptiva), así
como de obtener consecuencias científicas a partir de estos datos (Inferencia Estadística).

? Una definición que describe la estadística de manera utilitaria es la que dice que es:
“un conjunto de técnicas para describir grupos de datos y para tomar decisiones en
ausencia de una información completa”.

La estadística, está dividida en dos grandes ramas:

? Estadística descriptiva. Describe, analiza y representa un grupo de datos utilizando


métodos numéricos y gráficos que resumen y presentan la información contenida en
ellos.

? Estadística Inferencial. Apoyándose en el cálculo de probabilidades y a partir de datos


de muestras, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre
un conjunto mayor de datos.

Observación En el estudio de la estadística es importante estar familiarizado con algunos


conceptos o elementos que son de uso cotidiano, tales como

? POBLACIÓN. Conjunto de individuos o elementos observados al realizar un experimento


que poseen alguna característica o propiedades comunes. El estudio de toda la población
constituye un CENSO.

Por ejemplo: animales, árboles, carros, altura de una planta, tiempo de vida, etc.

? Una población puede ser finita o infinita.

En relación al tamaño de la población, ésta puede ser:

? Finita, como es el caso del número de personas que llegan al servicio de urgencia de un
hospital en un día; y se conoce el tamaño N de la población.

? Infinita, si por ejemplo estudiamos el mecanismo aleatorio que describe la secuencia de


caras y sellos obtenida en el lanzamiento repetido de una moneda normal al aire.

guata26.03@gmail.com 1 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

En algunos casos, también se considera infinita, cuando siendo pequeña no se puede saber con
exactitud el tamaño de la población.

? Individuo. Un individuo o unidad estadística es cada uno de los elementos que componen
la población.

? Muestra. Una muestra es un subconjunto representativo de la población de referencia, el


número de individuos de una muestra es menor que el de la población.

? Tamaño muestral. Es el número de observaciones en la muestra.

? Valor. Un valor es cada uno de los distintos resultados que se pueden obtener en un
estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara
y sello.

? Dato. Un dato es cada uno de los valores que se ha obtenido al realizar un estudio
estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos que pueden ser:
cara, cara, sello, cara, sello.

? Variable. Característica que estamos midiendo

1.1. Variable estadística


Definición de variable Una variable estadística es cada una de las características o cuali-
dades que poseen los individuos de una población.

1.1.1. Tipos de variables


Según el tipo de valores que toman las variables, distinguimos diferentes tipos de variables.
El tipo de variable es importante: afecta a lo que podemos hacer con ella, al tipo de análisis
que podemos hacer; los métodos estadísticos que usamos dependen del tipo de variable

? Variable cualitativa

Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas
con números, es decir:

1. La escala de valores es nominal

2. Los valores son “categorías”

guata26.03@gmail.com 2 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

3. Las categorías son valores diferentes por una cualidad, no por una cantidad

4. Ningún “valor” se puede decir que sea mayor o menor que otro

Ejemplos: partido político al que votó; región en que vive; sexo; estado civil; marca de coche
que conduce... 3.
Podemos distinguir dos tipos:

1.1.2. Variable cuantitativa


Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar
operaciones aritméticas con ella. (OJO: hay “números” que son “etiquetas”; por ejemplo: el código
postal; el número de teléfono; el código de una asignatura ).

1. Cada valor posible es menor o mayor que otro valor; por tanto se pueden realizar
operaciones aritméticas con ella.

2. El conjunto de valores forman una escala de intervalo

3. “Intervalo”: distancia entre valores

4. En las variables cuantitativas podemos calcular la distancia o intervalo entre cualquier


par de valores de la variable

Podemos distinguir dos tipos de variables: discretas y continuas.

? Las variables discretas son aquellas que admiten solamente valores enteros, es decir, no
tienen valores intermedios. Ejemplo: el numero de hijos por familia sera discreta, ya que
no se podrá decir que una familia tiene dos hijos y medio; el numero de estudiantes por
curso en una I.E, etc.

? Las variables continuas son aquellas que admiten valores fraccionarios, pudiéndose
establecer intervalos. Ejemplo: la estatura de una persona que mide un metro con setenta
centímetros; que pesa sesenta kilos, una libra y cuatro onza, etc.

1.2. Distribución de Frecuencias


La distribución de frecuencias, es un método para organizar y resumir información. Bajo este
método, los datos recolectados se ordenan y clasifican, indicándonos la frecuencia o sea el
número de veces que se repiten.

guata26.03@gmail.com 3 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

Se podrá decir también, que nos permite manejar grandes cantidades de información en espacios
reducidos, en formas de cuadros o tablas, complementadas con gráficas.

? Frecuencia absoluta La frecuencia absoluta es el número de veces que aparece un deter-


minado valor xi , en un estudio estadístico. Se representa por fi .

? La suma de las frecuencias absolutas es igual al número total de datos, que se representa
por N, es decir, f1 + f2 + f3 + . . . fn = N. Para indicar resumidamente estas sumas se
utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.
n
f1 + f2 + f3 + . . . fn = ∑ fi =N
i=1

? Frecuencia relativa La frecuencia relativa es el cociente entre la frecuencia absoluta de un


determinado valor y el número total de datos. Se puede expresar en tantos por ciento y
se representa por ni , es decir, ni = Nfi

• La suma de las frecuencias relativas es igual a uno.

? Frecuencia acumulada La frecuencia acumulada es la suma de las frecuencias absolutas


de todos los valores inferiores o iguales al valor considerado. Se representa por Fi .

? Frecuencia relativa acumulada La frecuencia relativa acumulada es el cociente entre la


frecuencia acumulada de un determinado valor y el número total de datos. Se puede
expresar en tantos por ciento, y se representa por Ni , es decir, Ni = FNi

? Frecuencia porcentual La frecuencia porcentual es la frecuencia relativa (ni ) expresada en


forma porcentual. En otras palabras, es la frecuencia relativa (ni ) multiplicada por 100,
se representa por pi = ni × 100 % .

? Frecuencia porcentual acumulada La frecuencia porcentual acumulada está dada por


Pi = Ni × 100 % .

Observación. Otras notaciones de interés son las siguientes:

1. n, tamaño de la muestra

2. N, tamaño de la población

3. xi , valor observado

guata26.03@gmail.com 4 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

1.2.1. Tabla o distribución de frecuencias de una variable


1. Una distribución de frecuencias o tabla de frecuencias es una ordenación en forma de
tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.

2. Una distribución de frecuencias corresponde a la agrupación de una sola variable a través


de categorías o intervalos, de tal forma que se presentan las frecuencias o repeticiones en
cada una de ellas. En el caso de una variable discreta, los datos se agrupan en categorías,
mientras que para una variable continua se agrupan en intervalos.

? Las distribuciones o tablas de frecuencias permiten resumir los datos en una tabla que
recoge entre otros:

• valores de la variable o modalidades del atributo,

• frecuencia absoluta o número de veces que aparece cada valor en la muestra,


• porcentaje de veces que aparece cada valor de la variable sobre el total de observaciones,

1.3. Reglas generales para distribuciones de frecuencia


? Caso Discreto

Para generar la distribución de frecuencias en una variable discreta se deben seguir los pasos
que se describen a continuación, los cuales permiten organizar la distribución de los datos en
una tabla de cinco columnas básicamente:
Paso 1: Identificar los valores diferentes que toma la variable y escribirlos en la primera columna
de la tabla, en orden ascendente. Se denotará por k el número de valores diferentes que se
encuentran en el conjunto de datos y se denotarán por x1 , x2 x3 , . . . , xk . En esta columna no
deben haber valores repetidos.
Paso 2: La segunda columna consiste en calcular la frecuencia absoluta, fi que es el número de
veces que se repite el valor xi en el conjunto de datos. La suma de los fi es igual al número
total de datos en análisis. Por ejemplo, el valor de f3 es el número de veces que se repite la
observación x3 en el conjunto de datos.
Paso 3: El cálculo de la frecuencia absoluta acumulada, Fi consiste en diligenciar la tercera
columna y es equivalente a sumar los valores menores o iguales de las frecuencias absolutas, fi
de cada valor xi .

guata26.03@gmail.com 5 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

Paso 4: La cuarta columna consiste en calcular la frecuencia relativa, ni , la cual es el valor


relativo o porcentual, que representa el valor de cada xi .
Paso 5: La quinta columna se refiere a la frecuencia porcentual, que no es más que la frecuencia
relativa multiplicada por 100 %, se representa con pi .
A continuación se desarrolla un ejercicio para tener mayor claridad al respecto.

Ejemplo 1.1.

Se le pidió a un grupo de personas que indiquen su color favorito, y se obtuvo los siguientes
resultados:
negro, azul, amarillo, rojo, azul, azul, rojo, negro, amarillo, rojo, rojo, amarillo, amarillo, azul,
rojo, negro, azul, rojo, negro, amarillo.

1. Con los resultados obtenidos, elaborar una tabla de frecuencias.

Solución:

En la primera columna, colocamos los valo- Tabla de frecuencias


res de nuestra variable (color), en la segun- Color fi Fi ni Ni
da la frecuencia absoluta, luego la frecuencia Negro 4 4 0,20 0,20
acumulada, seguida por la frecuencia relati- Azul 5 9 0,25 0,45
va, y finalmente la frecuencia relativa acu- Amarillo 5 14 0,25 0,70
mulada. Ro jo 6 20 0,3 1
∗. Por ser el primer problema, no haremos Total 20 1
uso de las frecuencias porcentuales.

Ejemplo 1.2.

Un sondeo realizado en una Institución Educativa sobre 30 estudiantes de grado 11, pretende
mostrar que edad es la más representativa del grupo.
Las edades de los estudiantes fueron:
17 17 15 15 16 17 18 17 15 17 16 15 15 16 16 18 18 16 17 15 16 15 18 17 15 19 19 16 17 19
Elabore una tabla de frecuencia que resuma los resultados.
Solución:
En la primera columna, colocamos los valores de nuestra variable xi , en la segunda la frecuencia
absoluta fi , luego la frecuencia acumulada Fi , seguida por la frecuencia relativa ni , y finalmente

guata26.03@gmail.com 6 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

la frecuencia relativa acumulada Ni . Ahora vamos a agregar la columna de frecuencia porcentual,


y frecuencia porcentual acumulada.
Tabla de frecuencias
xi fi Fi ni Ni pi Pi
15 8 8 0,26 0,26 26 % 26 %
16 7 15 0,23 0,5 23 % 50 %
17 8 23 0,26 0,76 26 % 76 %
18 4 27 0,13 0,9 13 % 90 %
19 3 30 0,1 1 10 % 100 %
Total 30 1 100 %

Ejemplo 1.3.

Los siguientes datos corresponden al número de hermanos en una clase de 20 alumnos:


3, 1, 1, 2, 3, 4, 3, 2, 5, 2, 2, 3, 4, 2, 1, 4, 2, 3, 1, 2

1. Con los resultados obtenidos, elaborar una tabla de frecuencias.

Solución:

En la primera columna, colocamos los va- Tabla de frecuencias


lores de nuestra variable xi , en la segunda xi fi Fi ni Ni pi Pi
la frecuencia absoluta fi , luego la frecuencia 1 4 4 0,2 0,2 20 % 20 %
acumulada Fi , seguida por la frecuencia re- 2 7 11 0,35 0,55 35 % 55 %
lativa ni , y finalmente la frecuencia relativa 3 5 16 0,25 0,8 25 % 80 %
acumulada Ni . Ahora vamos a agregar la co- 4 3 19 0,15 0,95 15 % 95 %
lumna de frecuencia porcentual, y frecuencia 5 1 20 0,05 1 5% 100 %
porcentual acumulada. Total 20 1 100 %

Ejemplo 1.4.

En una tienda de autos, se registra la cantidad de autos Toyota vendidos en cada día del mes
de Diciembre.
0; 1; 2; 1; 2; 0; 3; 2; 4; 0; 4; 2; 1; 0; 3; 0; 0; 3; 4; 2; 0; 1; 1; 3; 0; 1; 2; 1; 2; 3.

guata26.03@gmail.com 7 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

1. Con los datos obtenidos, elabora una tabla de frecuencias.

Solución:

En la primera columna, colocamos los valores Tabla de frecuencias


de nuestra variable xi , en la segunda la fre- xi fi Fi ni Ni pi Pi
cuencia absoluta fi , luego la frecuencia acumu- 0 8 8 0,267 0,267 26,7 % 26,7 %
lada Fi , seguida por la frecuencia relativa ni , y 1 7 15 0,233 0,500 23,3 % 50 %
finalmente la frecuencia relativa acumulada Ni . 2 7 22 0,233 0,733 23,3 % 73,3 %
Ahora vamos a agregar la columna de frecuencia 3 5 27 0,167 0,900 16,7 % 90 %
porcentual, y frecuencia porcentual acumulada. 4 3 30 0,100 1 10 % 100 %
Total 30 1 100 %

Ejercicios 1.1.

En cada de los siguientes ejercicios, realiza una tabla de distribución de frecuencias, con su
respectivo diagrama de barras y el diagrama circular.

1. Un dado cuyas caras están numeradas del 1 al 6 se ha lanzado un número determinado


de veces, obteniendo los siguientes resultados: 6, 1, 6, 3, 1, 4, 5, 2, 5, 6, 1, 5, 3, 4, 1, 4, 6, 1,
2, 1, 3, 1, 4, 6, 2, 5, 4, 3, 1, 5, 2, 2, 3, 6, 3, 5, 2, 4, 1, 6, 6, 2, 4, 5, 3, 6, 4, 6, 3, 6, 6, 4, 4, 2, 2,
5, 1, 6, 3, 1, 6, 2, 4, 5, 3, 6, 4, 6, 3, 6, 6, 4, 4, 2, 2, 5, 1, 6, 3, 1, 2, 5, 3, 1, 1, 4, 3, 5, 1, 5, 3, 3, 1,
6, 5, 2, 6, 1, 4, 5, 5, 1, 4, 6, 3, 2, 5, 6, 5, 2, 2, 4, 1, 3, 3, 4, 6, 4, 3 y 2.

2. En un grupo de personas hemos preguntado por el número de días que practican deporte
a la semana. Las respuestas han sido las siguientes: 4, 2, 3, 1, 3, 7, 1, 0, 3, 2, 6, 2, 3, 3, 4,
6, 3, 4, 3, 6.

3. Las notas obtenidas en un examen de matemáticas realizado en una clase de grado 7°


han sido las siguientes: 4, 5, 7, 5, 8, 3, 9, 6, 4, 5, 7, 5, 8, 4, 3, 10, 6, 6, 3, 3.

4. En una clase de 10° hemos preguntado a las alumnas y a los alumnos por las horas de
estudio que dedican a la semana. Estas han sido las respuestas: 16, 11, 10, 12, 10, 15, 10, 10,
14, 15, 10, 10, 13, 10, 12, 15, 12, 16, 16, 16, 16, 10, 13, 13.

5. Al preguntar a 20 familias sobre el número de días a la semana que van al mercado, las
respuestas han sido las siguientes: 1, 2, 2, 4, 6, 1, 6, 1, 2, 3, 5, 2, 6, 3, 1, 4, 1, 6, 1, 2.

guata26.03@gmail.com 8 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

6. Las notas de los alumnos de una clase de Matemáticas de grado 6° son las siguientes: 5,
3, 4, 1, 2, 3, 4, 5, 3 3, 5, 4, 1, 2, 2, 1 2, 5, 3, 1, 2, 3, 4, 3, 2, 3, 4, 2, 3, 4.

7. Las calificaciones de 50 alumnos en Matemáticas han sido las siguientes: 5, 2, 4, 9, 7, 4,


5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6,
1, 4, 6, 3, 5, 5, 6, 7.

1.4. Gráficos estadísticos.


Los gráficos estadísticos nos permiten presentar la información que dan los datos de manera
resumida y fácil de entender, es decir, las representaciones gráficas tienen que estar hechas para
que el simple impacto visual nos dé información de la distribución; los gráficos dependen del
número de variables involucradas.
En distribuciones cuantitativas si los datos no están agrupados, se emplea el diagrama de
barras, si están agrupados el histograma., si la distribución es cualitativa se suele emplear el
diagrama de sectores.

1.4.1. Diagrama de barras


El diagrama de barras (o gráfico de barras) es un gráfico que se utiliza para representar datos de
variables cualitativas o discretas. Está formado por barras rectangulares (separadas) cuya altura
es proporcional a la frecuencia de cada uno de los valores de la variable.

1.4.2. Histograma
Es un tipo especial de gráfica de barras, en la cual una barra va pegada a la otra, es decir
no hay espacio entre las barras. Cada barra representa un subconjunto de los datos.
Un histograma es una gráfica adecuada para representar variables cuantitativas continuas, aun-
que también se puede usar para variables discretas. Es decir, mediante un histograma se puede
mostrar gráficamente la distribución de una variable cuantitativa o numérica.
Para construirlo se representa sobre el eje de abscisas los límites de la clase. Sobre el mismo
eje se construyen unos rectángulos que tienen por base la amplitud de la clase y por altura las
frecuencias absolutas respectivas.

guata26.03@gmail.com 9 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

1.4.3. Diagrama circular


El diagrama circular (también llamado diagrama de sectores o diagrama de pastel) sirve
para representar variables cualitativas o discretas. Se utiliza para representar la proporción de
elementos de cada uno de los valores de la variable.
Consiste en partir el círculo en porciones proporcionales a la frecuencia relativa. Entiéndase
como porción la parte del círculo que representa a cada valor que toma la variable.
Cálculo de los sectores: Un círculo completo son 360◦ (o 2π radianes). El ángulo de cada
porción debe ser proporcional a la frecuencia de cada valor. Por ejemplo, si un valor representa
un 50 % del total de elementos, su sector del círculo tendrá un ángulo de 180◦ (o π radianes).
Sea (x1 , x2 , . . . , xn ) un conjunto de elementos. La fórmula para calcular el ángulo de cada sector
es la siguiente:

360◦
α = · fi = 360◦ · ni
N

siendo N el total de elementos, fi el número de sujetos iguales y ni la frecuencia relativa.


El ángulo de cada sector se calcula como 360◦ dividido por el total de sujetos (N) y multiplicado
por la frecuencia absoluta ( fi ), o bien el producto de la frecuencia relativa por 360◦ . También
podemos calcular el ángulo en radianes:


α = · fi = 2π · ni
N

guata26.03@gmail.com 10 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

Ejemplo 1.5.

Realizamos el diagrama de barras correspondiente a la tabla de frecuencias del ejemplo 1.1

Tabla de frecuencias
Color fi Fi ni Ni
Negro 4 4 0,20 0,20
Azul 5 9 0,25 0,45
Amarillo 5 14 0,25 0,70
Ro jo 6 20 0,3 1
Total 20 1

Ejemplo 1.6.

Con base a la tabla de frecuencias del ejemplo 1.2 realizamos los diagramas de barras y
circular respectivamente
Tabla de frecuencias
xi fi Fi ni Ni pi Pi
15 8 8 0,26 0,26 26 % 26 %
16 7 15 0,23 0,5 23 % 50 %
17 8 23 0,26 0,76 26 % 76 %
18 4 27 0,13 0,9 13 % 90 %
19 3 30 0,1 1 10 % 100 %
Total 30 1 100 %

guata26.03@gmail.com 11 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

Ejemplo 1.7.

Los diagramas de barras y circular para el ejemplo 1.3 son como sigue...

Tabla de frecuencias
xi fi Fi ni Ni pi Pi
1 4 4 0,2 0,2 20 % 20 %
2 7 11 0,35 0,55 35 % 55 %
3 5 16 0,25 0,8 25 % 80 %
4 3 19 0,15 0,95 15 % 95 %
5 1 20 0,05 1 5% 100 %
Total 20 1 100 %

guata26.03@gmail.com 12 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

1.4.4. Tablas de frecuencia para variables Continuas


Cuando los valores de la variable son muchos, conviene agrupar los datos en intervalos o
clases para así realizar un mejor análisis e interpretación de ellos.

? Para construir una tabla de frecuencias con datos agrupados, conociendo los intervalos,
se debe determinar la frecuencia absoluta ( fi ) correspondiente a cada intervalo, contando
la cantidad de datos cuyo valor está entre los extremos del intervalo. Luego se calculan
las frecuencias relativas y acumuladas, si es pertinente...

•La suma de los extremos del intervalo entre dos nos da la marca de clase (punto medio del
intervalo).
• Si no se conocen los intervalos, se pueden determinar de la siguiente manera:

? La diferencia entre el valor máximo de la variable y el valor mínimo nos da el rango (R).

? Se divide el rango en la cantidad de intervalos que se desea tener, obteniéndose así la


amplitud o tamaño (ai ) de cada intervalo.

• Comenzando por el mínimo valor mínimo de la variable, que será el extremo inferior del
primer intervalo, se suma a este valor la amplitud para obtener el extremo superior y así
sucesivamente. Veamos como se resuelve el siguiente ejercicio.

Ejemplo 1.8.

Los datos que se muestran a continuación representan el costo de la energía eléctrica durante
el mes de Julio del 2018 para una muestra aleatoria de 50 viviendas con tres habitaciones en
montería.

? Costo de energía eléctrica en pesos.

96 171 202 178 147 102 153 197 127 82 157 185 90 116 172 111 148 213 130 165 141 149 206 175 123
128 144 168 109 167 95 163 206 175 130 143 187 166 139 149 108 119 150 154 114 135 191 137 129 158

a. Realice una tabla de distribución de frecuencias con 7 intervalos.

b. Represente la distribución mediante un diagrama de barras.

Solución:

a) Tabla de frecuencias

guata26.03@gmail.com 13 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

K Intervalos: [Li − Ls ] Marca de clase fi Fi hi Hi

1 [81 − 100] 90,5 4 4 0,08 0,08


2 [101 − 120] 110,5 8 12 0,32 0,32
3 [121 − 140] 130,5 12 24 0,8 0,8
4 [141 − 160] 150,5 8 32 1,44 1,44
5 [161 − 180] 170,5 10 42 2,28 2,28
6 [181 − 200] 190,5 4 46 3,2 3,2
7 [201 − 200] 210,5 4 50 4,2 4,2
∑ f = 50

b) Histograma

Ejemplo 1.9.

En una maternidad se han tomado los pesos (en kilogramos) de 50 recién nacidos:
2,8 3,2 3,8 2,5 2,7 3,7 1,9 2,6 3,5 2,3 3,0 2,6 1,8 3,3 2,9 2,1 3,4 2,8 3,1 3,9 2,9 3,5 3,0 3,1 2,2 3,4 2,5
1,9 3,0 2,9 2,4 3,4 2,0 2,6 3,1 2,3 3,5 2,9 3,0 2,7 2,9 2,8 2,7 3,1 3,0 3,1 2,8 2,6 2,9 3,3

a. ¿Cuál es la variable y de qué tipo es?

b. Construye una tabla con los datos agrupados en 6 intervalos de 1, 65 a 4, 05.

c. Representa gráficamente esta distribución.

Solución:

a. Variable: peso de los recién nacidos. Tipo: cuantitativa continua.

b. Tabla de frecuencias:

guata26.03@gmail.com 14 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

INTERVALOS MARCA DE CLASE (Xi ) fi


1, 65 − 2, 05 1, 85 4
2, 05 − 2, 45 2, 25 5
2, 45 − 2, 85 2, 65 13
2, 85 − 3, 25 3, 05 17
3, 25 − 3, 65 3, 45 8
3, 65 − 4, 05 3, 85 3
50

? Li = 1, 8 y Ls = 3, 9, entonces Rango: 3, 9 − 1, 8 = 2, 1 = xi .
2,1
? Amplitud del intervalo: 6 = 0,35 se aproxima a 0,4, es decir, cada intervalo tendrá una
amplitud de 0,4

c. Histograma

Ejemplo 1.10.

Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el


número de empleados que hay en cada una de ellas para un estudio posterior. Las observaciones
obtenidas han sido:
12, 10, 9, 11, 15, 16, 9, 10, 10, 11, 12, 13, 14, 15, 11, 11, 12, 16, 17, 17, 16, 16, 15, 14, 12, 11, 11, 11, 12, 12, 12,
15, 13, 14, 16, 15, 18, 19, 18, 10, 11, 12, 12, 11, 13, 13, 15, 13, 11, 12.

a. Calcular la distribución de frecuencias de la variable obteniendo las frecuencias absolutas,


relativas y sus correspondientes acumuladas.

b. ¿Qué proporción de sucursales tiene más de 15 empleados?

guata26.03@gmail.com 15 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

c. Diagrama de barras y diagrama acumulativo de frecuencias correspondientes.

d. Agrupar en intervalos de amplitud 3 los valores de la variable, calcular su distribución de


frecuencias y representar el histograma.

Solución:

a. Tabla de frecuencias
fi Fi
Xi fi Fi ni = N Ni = N
9 2 2 0, 04 0, 04
10 4 6 0, 08 0, 12
11 10 16 0, 20 0, 32
12 10 26 0, 20 0, 52
13 5 31 0, 10 0, 62
14 3 34 0, 06 0, 68
15 6 40 0, 12 0, 8
16 5 45 0, 1 0, 9
17 2 47 0, 04 0, 94
18 2 49 0, 04 0, 98
19 1 50 0, 02 1
50 1

b. Las sucursales con más de 15 empleados: f8 + f9 + f10 + f11 = 5 + 2 + 2 + 1 = 10

? % sucursales con más de 15 empleados = 10


50  100 = 20 %

c. Diagrama de barras para frecuencias absolutas y frecuencias acumuladas respectivamente.

d. Los datos agrupados en intervalos amplitud 3:

guata26.03@gmail.com 16 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

ni Ni ni
[Li − Li+1 ) Xi ni Ni fi = N Fi = N ci di = ci
8 − 11 9, 5 6 6 0, 12 0, 12 3 2
11 − 14 12, 5 25 31 0, 50 0, 62 3 8, 33
14 − 17 15, 5 14 45 0, 3 0, 90 3 4, 67
17 − 20 18, 5 5 50 0, 10 1 3 1, 67
50 1 12

? Diagrama de barras para datos agrupados

Ejercicios 1.2.

1. Los datos siguientes corresponden a los tiempos de reacción de una muestra de 33 sujetos,
medidos en centésimas de segundo:

55, 51, 60, 56, 64, 56, 63, 63, 61, 57, 63, 50, 49, 70, 72, 54, 48, 53, 58, 66, 68, 45, 74, 65, 58, 61, 62,
59, 64, 57, 63, 52, 67

a) Con los datos anteriores construya una distribución de frecuencia, con amplitud (a = 5).

b) Construya el histograma correspondiente.

2. Los siguientes datos representan la presión sanguínea tomada a 30 personas, las cuales se
sometieron a un examen de laboratorio.

108, 113, 136, 122, 130, 114, 115, 132, 123, 110, 126, 109, 125, 122, 119, 118, 119, 106, 115, 124, 118, 111, 124,
113, 124, 109, 121, 121, 108, 119

a) Construya una tabla de frecuencia con intervalos de amplitud (a = 10).

b) Construya el histograma correspondiente.

3. Los datos que se dan a continuación corresponden a los pesos en Kg. de ochenta personas:

guata26.03@gmail.com 17 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

60; 66; 77; 70; 66; 68; 57; 70; 66; 52; 75; 65; 69; 71; 58; 66; 67; 74; 61; 63; 69; 80; 59; 66; 70; 67;
78; 75; 64; 71; 81; 62; 64; 69; 68; 72; 83; 56; 65; 74; 67; 54; 65; 65; 69; 61; 67; 73; 57; 62; 67; 68;
63; 67; 71; 68; 76;
a) Realiza la tabla de frecuencias con intervalos de amplitud (a = 5), siendo el primer intervalo
[50; 55], y responda la pregunta “b”

b) ¿Cuántas personas tienen peso mayor o igual que 70 Kg? pero menor que 85?

c) Calcule el porcentaje de personas de peso menor que 65 Kg

c) Construya el histograma correspondiente.

4. Los siguientes datos se refieren al número de horas de parqueo de algunos autos :

4, 4 ,2, 4 ,5 ,3, 6, 3 ,5 ,3, 2, 1, 3 ,7 ,3 ,1 5 ,1, 7 ,2 ,5, 2, 4 ,7 ,3 ,6 ,2 ,2 ,4 ,1 ,6 ,4 ,3 ,3 ,4, 5

a) Construya una tabla de frecuencia con intervalos de amplitud 1.

b) Construya el histograma correspondiente.

5. Los 40 alumnos de una clase han obtenido las siguientes notas, sobre 50, en un examen X.

3, 35, 30, 37, 27, 31, 41, 20, 16, 26, 45, 37, 9, 41, 28, 21, 31, 35, 10, 26, 11, 34, 36, 12, 22, 17, 33, 43,
19, 48, 38, 25, 36, 32, 38, 28, 30, 36, 39, 40.

a) Construir la tabla de frecuencias.

b) Construya el histograma correspondiente.

6. En una maternidad se han tomado los pesos (en kg) de 50 recién nacidos:

2,8; 3,2; 3,8; 2,5; 2,7; 3,7; 1,9; 2,6; 3,5; 2,3; 3,0; 2,6; 1,8; 3,3; 2,9; 2,1; 3,4; 2,8; 3,1; 3,9; 2,9; 3,5; 3,0; 3,1;
2,2; 3,4; 2,5; 1,9; 3,0; 2,9; 2,4; 3,4; 2,0; 2,6; 3,1; 2,3; 3,5; 2,9; 3,0; 2,7; 2,9; 2,8; 2,7; 3,1; 3,0; 3,1; 2,8;
2,6; 2,9; 3,3

a) Construye una tabla con los datos agrupados en 6 intervalos de amplitud 0,4 kg.

b) Representa gráficamente esta distribución

7. Los goles que se han marcado en la última jornada de liga han sido en los siguientes minutos
de juego:

guata26.03@gmail.com 18 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

20, 11, 89, 3, 20, 4, 2, 35, 50, 29, 59, 30, 90, 33, 78, 54, 21, 19, 60, 34, 56, 63, 45, 31, 26, 32, 5, 78,
88, 85, 34.

a) Realiza la tabla de frecuencias absolutas y relativas agrupándolos en clase por cuarto de


hora.

b) Representa gráficamente esta distribución

guata26.03@gmail.com 19 Amaury J. Camargo Benítez


2. MEDIDAS DE TENDENCIA CENTRAL ÍNDICE

2. MEDIDAS DE TENDENCIA CENTRAL


En el capítulo anterior, se dijo que la estadística cumplía una función descriptiva haciéndolo
mediante cuadros y gráficas, ahora lo complementamos con la aplicación de una serie de
medidas de posición y de dispersión, que nos permiten la descripción de un hecho o de un
conjunto de observaciones.
Las medidas de posición o de tendencia central, denominadas también como promedios,
nos permiten determinar la posición de un valor respecto a un conjunto de datos, el cual lo
consideramos como representativo o típico, para el total de las observaciones.
Estas medidas aplicadas a las características de las unidades en una muestra, se les denominad
estimadores o estadígrafos. En cambio, aplicadas a las características de los elementos de una
población, se les conoce como parámetros o valores estadísticos de la población.
Si con el resultado obtenido, en una encuesta aplicada en una zona o barrio de la ciudad,
afirmamos que el consumo promedio de leche por familia es de dos litros por semana, estamos
representando una gama o variedad de consumos, que van desde familias que no consumen,
hasta un consumo superior a dos litros. Con esta información hacemos referencia al compor-
tamiento del consumo de leche en una zona de la ciudad; también, el resultado puede ser
comparado con los consumos promedios de otros barrios, o el consumo promedio por persona,
o establecer la relación que puede haber entre el consumo y los niveles de ingresos.
Dependiendo de la naturaleza de los datos, la misma necesidad que se tiene y/o las caracte-
rísticas que ellos representan, requieren de la aplicación de un promedio especial dentro de
los diferentes tipos que se expondrán a continuación, pero para ello deberán tenerse en cuenta
algunas reglas que serán básicas en la selección de estas herramientas de descripción.

Características, uso, ventajas y desventajas de las medidas de tendencia central y de


posición Un promedio es un valor en la escala de las X correspondiente a una distribución
de frecuencias, cuyo valor se calcula para representarla en calidad de medida típica del grupo.
Algunas condiciones esenciales para que este valor pueda cumplir su cometido:

? Debe estar representada por una sola cifra.

? Debe ser objetiva y definida por una fórmula algebraica, de tal manera que cualquiera
que sea la persona que trabaje con la distribución, se obtenga siempre el mismo valor.

? Debe ser descriptiva de los datos, de manera que su significado sea fácil de entender.

guata26.03@gmail.com 20 Amaury J. Camargo Benítez


ÍNDICE 2. MEDIDAS DE TENDENCIA CENTRAL

? No debe ser una abstracción matemática, que únicamente pueda ser entendida por per-
sonas muy versadas en esta ciencia, ya que una de las condiciones de la estadística, es
simplificar los datos y no hacerlos más complejos.

? Debe ser fácil de calcular, pero esta condición no debe preferirse en prejuicio de otras
ventajas.

? Debe depender de cada uno de los elementos del grupo, de tal manera que si se altera
alguno de éstos, consecuentemente se altera el valor del promedio ya que por definición,
ésta es representante típica de todos los miembros del grupo y no solamente del alguno
de ellos.

? A pesar de que cada uno de los valores de los elementos del grupo debe tener influencia
en el valor de la medida, ésta debe ser de tal calidad que no se deje afectar demasiado
por alguno o algunos pocos valores.

? Debe tener lo que los estadísticos llaman estabilidad en el muestreo.

? Debe ser de uso fácil para cálculos matemáticos posteriores.

2.1. Media aritmética


El promedio es un término muy utilizado por todos, aunque indeterminado. Se dice general-
mente que un valor promedio, intenta representar o resumir las características de un conjunto
de valores. La expresión corriente de promedio, suele en la mayoría a referirse a la media
aritmética X = µ.
Es la medida de posición o promedio más conocida, la más utilizada y entendida por todos,
por su gran estabilidad es la preferida en el muestreo, sus fórmulas admiten tratamiento alge-
braico. Su desventaja principal, es ser muy sensible a cambios en sus valores u observaciones,
también, cuando alguno de sus valores extremos es demasiado grande o pequeño.

Ventajas.

? El promedio aritmético es, en sí, la medida más entendida y la más utilizada. Es un


valor tal. que si se calculara para un grupo en el cual todos los elementos fueran iguales,
cada uno de ellos sería a su promedio aritmético, por lo cual podemos deducir que el
promedio de n elementos, es un nuevo elemento formado, correspondientemente a una
parte igual n1 de cada uno de los elementos originales.

guata26.03@gmail.com 21 Amaury J. Camargo Benítez


2. MEDIDAS DE TENDENCIA CENTRAL ÍNDICE

? Esta medida se define mediante una ecuación matemática muy fácil de entender y al-
gunas veces se puede obtener cuando no es posible calcular otros tipos de medidas de
tendencia central o de posición y, aún en el casos de no conocerse los valores indivi-
duales de la serie, por ejemplo: si 10 familias consumen 20 litros de leche, el promedio
aritmético será de 2 litros por familia.

? El promedio aritmético es extraordinariamente estable en el muestreo.

? Es altamente sensible a cualquier cambio en los datos de la distribución.

? Como ventaja final, se podrá anotar que es excepcionalmente adaptable cuando se trata
de hacer cálculos matemáticos posteriores con él.

Desventajas.

? Es muy sensible a valores muy pequeños o grandes, especialmente cuando estos últimos
se encuentren incluidos en la distribución que se está estudiando, puede resultar en un
promedio que no represente lo típico para el total del grupo.

? Cuando la distribución es marcadamente asimétrica, de tal forma que el promedio arit-


mético, la mediana y el modo difieran en forma apreciable, debe considerarse siempre
la posibilidad de que el promedio aritmético pueda no ser el valor único representativo
de la serie.

? Otro inconveniente o desventaja, es cuando la distribución tiene la forma de U, es decir,


parabólica; éste corresponde a los valores menos comunes en la serie y por tanto, puede
darnos una idea irreal de la distribución.

Esta medida, por lo general, se representa mediante una equis con una raya o trazo colocado
en su parte superior, sin embargo se utilizan otros símbolos como se pueden observar a
continuación: a, ay , ax , M[x] , M[y] , x, y, M[x] , µ.

2.1.1. Media aritmética simple


Suponga que las observaciones en una muestra son x1 , x2 , ..., xn . La media de la muestra, que
se denota con x, y se define como:
n
xi x1 + x2 + x3 . . . . . . xn
x=∑ =
i=1 n n

guata26.03@gmail.com 22 Amaury J. Camargo Benítez


ÍNDICE 2. MEDIDAS DE TENDENCIA CENTRAL

Ejemplo 2.1.

Calcular la media aritmética de los números 10, 12, 36, 25, y 58


Solución.
x = 10+12+36+25+58
5 = 121
5 = 24, 2

Ejemplo 2.2.

Durante los últimos 32 días el valor de las compras en periódicos fue:


5.2 10.2 7.0 7.1 10.2 8.3 9.4 9.2 6.5 7.1 6.6 7.8 6.8 7.2 8.4 9.6 8.5 5.7 6.4 10.1 8.2 9.0 7.8 8.2 5.3 6.2
9.1 8.6 7.0 7.7 8.3 7.5
El promedio aritmético del valor de las compras de periódicos es:
n
xi 250,2
x=∑ = = 7,82
i=1 n 32

2.1.2. Media aritmética ponderada


Se aplica en datos agrupados, es decir, aquellos que se encuentran organizados en una tabla
de frecuencias, siendo las frecuencias absolutas sus ponderaciones...

Ejemplo 2.3.

Supongamos que dispone de información para 10 observaciones: 8, 2, 8, 6, 2, 2, 8, 2, 4. La


media aritmética será:
x = 8+2+8+......+4
10 = 48
10 = 4, 8
Ahora, si calculamos la media aritmética de las mismas 10 observaciones, pero además organi-
zamos los datos, el resultado obtenido será el mismo.
x = 2+2+2+2+4+6+6+8+8+8
10 = 4810 = 4, 8 ; resultado que sería exactamente igual a:
2(4)+4(1)+6(2)+8(3) 8+4+12+24
x= 10 = 10 = 4, 8
¿Qué se ha hecho? Simplemente se han organizado los datos en una tabla de frecuencias.
yi ni yi ni
2 4 8
∑ yi ni Xi fi
4 1 4 y= n oX= N
6 2 12
y1 n1 +y2 n2 +...... 2(4)+4(1) 48
8 3 24 y= n1 +n2 +...... = 10 = 10 = 4, 8
∑ 10 48
Xi fi Xi fi

guata26.03@gmail.com 23 Amaury J. Camargo Benítez


2. MEDIDAS DE TENDENCIA CENTRAL ÍNDICE

2.2. Mediana
La mediana, es considerada también, al igual que la Media, como una medida de tendencia
central. Su importancia es menor, sus fórmulas son rígidas ya que no admiten tratamiento
algebraico, es por eso que tendremos que aplicar seis procedimientos de cálculo diferente, que
lo hace un poco dispendioso y poco atractivo, como veremos más adelante;
Se define como «aquel valor de la variable que supera a no más de la mitad de las obser-
vaciones, al mismo tiempo, es superado por no más de la mitad de las observaciones»
en otras palabras, se puede definir como el «valor central». Se simboliza por Me , y su fórmula
de aplicación es:

2.2.1. Mediana para datos no agrupados


La mediana de un conjunto finito de valores es aquel valor que divide al conjunto en dos
partes iguales, de forma que el número de valores mayor o igual a la mediana es igual al
número de valores menores o igual a estos. Su aplicación se ve limitada ya que solo considera
el orden jerárquico de los datos y no alguna propiedad propia de los datos, como en el caso de
la media.

Ventajas.

? Esta medida tiene una definición bastante rígida y el concepto de ella es tan claro, que
cualquier persona lo entiende, aún sin ser familiar su término.

? Los datos deben estar ordenados, pero los valores extremos no tienen ninguna incidencia
en su cálculo.

? Tiene menor estabilidad en el muestreo que el promedio aritmético, pero mayor estabi-
lidad que otras medidas.

? Hay situaciones en que la única medida de tendencia central que puede utilizarse es
la mediana, especialmente cuando los valores extremos de una distribución de variable
continua no están definidos.

Desventajas.

? No es tan conocida como la media aritmética.

? Se hace necesario ordenar los datos para poderla calcular.

guata26.03@gmail.com 24 Amaury J. Camargo Benítez


ÍNDICE 2. MEDIDAS DE TENDENCIA CENTRAL

? Esta medida no se adapta a cálculos posteriores aritméticos, por cuanto que si obtenemos
las medianas de diferentes grupos, no se podrá calcular una mediana para el conjunto.

? Tampoco es sensible a cambios en los valores de los elementos, manteniéndose el valor


central y los valores ordenados.

t A continuación se muestran los criterios para construir la mediana. Se puede construir los
siguientes criterios:
Cálculo en datos sin agrupar u originales

a. Número impar de observaciones. Cuando esta medida la aplicamos en los datos originales
o sin agrupar, lo primero que se debe hacer, es ordenarlos de menor a mayor o de mayor
a menor.

Ejemplo 2.4.

Supongamos se tienen los siguientes datos: y x1 = 2 x2 = 18 x3 = 4 x4 = 12. Observamos que


la serie es impar, ya que n = 5 por lo tanto ordenamos los datos, por ejemplo, de menor a
mayor: 2 4 6 12 8 La mediana será igual al valor central Me = 6.

b. Número par de observaciones. Ahora calcularemos la mediana, cuando se tenga un número


par de observaciones. En estos casos, encontramos dos valores en el centro de la serie,
por tal razón la mediana deberá ser el promedio de ellos.

Ejemplo 2.5.

Supongamos que en vez de 5 datos se tengan 8 datos así: x1 = 8 x2 = 16 x3 = 4 x4 = 2


x5 = 20 x6 = 3 x7 = 12 x8 = 20.
x j−1 +x j
Ordenamos los datos de menor a mayor o viceversa; 2 3 4 8 12 16 20 20 ⇒ Me = 2 =
8+12
2 = 10.
En los dos casos anteriores, correspondiente al cálculo de la mediana para datos sin agrupar,
la localización de ella, luego de ser ordenados, se facilita aplicando el siguiente procedimiento:
2 = 2 = 3ª posición, la mediana en el primer caso o ejemplo 1, será Me = x j = 6 y
n+1 5+1

en el ejemplo 2 será: n+1 2 = 2 = 4, 5ª posición, es decir, se encuentra entre la 4ª y la 5ª


8+1

observación y la mediana será igual a Me = x j = 10, el valor promedio de los dos valores
centrales.

guata26.03@gmail.com 25 Amaury J. Camargo Benítez


2. MEDIDAS DE TENDENCIA CENTRAL ÍNDICE

2.2.2. Mediana para datos agrupados


Cuando los datos se encuentran agrupados en una distribución de frecuencia, no conocemos
los datos originales. Por lo tanto es necesario estimar la mediana mediante los siguientes pasos:

1. Calcular el valor n
2

2. Localizar el intervalo de clase donde se encuentra la mediana (intervalo mediano). Esto se


hace encontrando el primer intervalo de clase donde la frecuencia acumulada es igual o
mayor que 2n .

3. Aplicando la siguiente fórmula con los valores del intervalo mediano:


!
N
2 − Fi−1
Me = Li + ai
fi

Donde:

? Me = Mediana

? Li = Límite inferior del intervalo que contiene a la mediana

? fi = Frecuencia absoluta del intervalo de la clase mediana

? N = Total de datos o frecuencias

? Fi−1 = Frecuencia acumulada anterior a la clase mediana

? ai = Amplitud del intervalo de la clase mediana

Ejemplo 2.6.

2.3. Moda
Se define como «el valor de la variable que más se repite» o «aquel valor que presenta
la máxima frecuencia». Puede suceder que una distribución tengas dos Modas, en este caso
se dice que la distribución es Binomial, en el caso que haya más de dos modas, se dice que
es plurimodal o multimodal. Es la única medida de posición que puede ser utilizada en
atributos, es decir, cuando la característica es cualitativa. Modo, Moda o valor Modal, medida

guata26.03@gmail.com 26 Amaury J. Camargo Benítez


ÍNDICE 2. MEDIDAS DE TENDENCIA CENTRAL

originalmente concebida, como aquel valor de la variable, que presenta el mayor número de
observaciones, es decir, el valor de la variable que más veces se repite. Se empleó formalmente
en 1,984 por Karl Pearson, ya que no era utilizado anteriormente.

Desventajas.

? El hecho que la moda nos indique el punto de mayor concentración, lo hacer tal vez,
la mejor medida de tendencia central. Cuando una distribución es muy asimétrica,
claramente se ve que la moda es el más representativo del grupo, y en algunos casos, si
la moda y el promedio aritmético son significativamente diferentes al valor, es preferible
usar la moda.

? En series plurimodales, la moda permite dividir la distribución con fines de estratifica-


ción.

? Se considera de uso riguroso en variables continuas, aunque puede extenderse a casos


discontinuos.

Ventajas.

? Se le considera con cierto grado de dificultad de cálculo en datos agrupados, siendo su


resultado de poca confianza, especialmente cuando la amplitud no es constante, en este
caso, si se hace necesario se debe seguir un determinado proceso.

? Es muy inestable en el muestreo.

? No puede ser utilizado en procesos algebraicos posteriores.

? No es sensible, especialmente cuando hay cambios en los valores de la variable, salvo que
no afecten a su propio valor.

2.3.1. Moda para datos sin agrupar u originales

Ejemplo 2.7.

Consideremos los siguientes datos: 5, 10, 8, 5, 10, 18, 5, 12, 5, 12 calculemos la media, la
mediada y la moda. n = 10.
Media → x = ∑nxi = 9010 = 9
Mediana →Ordenamos los datos de mayor a menor o de menor a mayor

guata26.03@gmail.com 27 Amaury J. Camargo Benítez


2. MEDIDAS DE TENDENCIA CENTRAL ÍNDICE

5 5 5 5 8 10 10 12 12 18
Me
Posición: n+1
2 2 = 5, 5ª La mediana se encuentra entre la 5ª y la 6ª observación
= 10+1
x j−1 +x j
Siendo: Me = 8+10
2 =9 Me = 2
Moda →Corresponderá a 5, siendo el valor de la variable que más se repite → Md = x j = 5
Al forjarnos una imagen mental de la distribución de frecuencias de un conjunto de mediciones,
una de las primeras apreciaciones descriptivas de interés es una medida de tendencia central,
es decir, una que localiza el centro de la distribución. Una de las medidas de tendencia central
más común y útil es la media común o “media aritmética”, pero también son de importancia,
según las circunstancias y el tipo de variables la “moda” y la “mediana”.

Ejemplo 2.8.

2.3.2. Moda para datos agrupados


En tablas de frecuencias con datos agrupados, hablaremos de intervalo modal.
La moda se representa por Mo.
 
fi − fi−1
Mo = Li + ai
( fi − fi−1 ) + ( fi + fi−1 )

Donde:

? Mo = Moda

? Li = Límite inferior del intervalo modal (intervalo que tiene mayor frecuencia absoluta).

? fi = Frecuencia absoluta del intervalo modal.

? fi−1 = Frecuencia absoluta del intervalo anterior al modal.

? fi+1 = Frecuencia absoluta del intervalo posterior al modal.

? ai = Amplitud del intervalo.

Ejemplo 2.9.

guata26.03@gmail.com 28 Amaury J. Camargo Benítez


ÍNDICE 2. MEDIDAS DE TENDENCIA CENTRAL

2.3.3. Otras medidas de tendencia central.


? La Media Geométrica.

? La Media Cuadrática.

2.3.4. Cuartiles, deciles y percentiles.


Cuartiles: si a un conjunto de datos se ordena de mayor a menor, el valor central es la
mediana, este valor divide el grupo, en dos subgrupos cada uno con el 50 % de los datos. Si
a cada subgrupo ordenado se le marca el valor central, tenemos así tres valores seleccionados
que llamaremos Cuartiles,Q1 , Q2 y Q3 . Estos valores dividen al conjunto de datos en cuatro
grupos con igual número de términos, cada cuartil contiene el 25 % de los datos. La mediana
es el cuartil dos, Q2 . Con los Cuartiles se construye un gráfico especial, “el diagrama de caja”,
este permite visualizar la variabilidad de los datos por Cuartil.
Deciles, si el conjunto de valores, ordenados de de mayor a menor, se dividen en diez partes
iguales, los valores que dividen los datos se llaman deciles y son nueve, D1 , D2 ,...,Dk .
Percentiles, si se tiene un conjunto de datos muy numerosos y a este se lo divide en 100 partes
iguales, cada valor que divide los datos se llama percentil, P1 , P2 , P3. . . P99 .

Ejemplo 2.10.

Consideremos los datos que muestra la siguiente tabla, resultado de gastos diarios en periódicos
de una determinada empresa.
[Li − Li+1 ) Xi fi hi Fi Hi
5,2 − 6,1 5,65 3 0,094 3 0,094
6,1 − 7,0 6,55 5 0,156 8 0,250
7,0 − 7,9 7,45 9 0,281 17 0,531
7,9 − 8,8 8,35 7 0,219 24 0,750
8,8 − 9,7 9,25 3 0,156 29 0,906
9,7 − 10,6 10,15 2 0,094 32 1,000
T OTAL 32 1,000
....................................................................................
Hallemos el 80º percentil:
Son 99 valores que dividen a un conjunto de datos en 100 partes iguales, los percentiles se
calculan con la fórmula:

guata26.03@gmail.com 29 Amaury J. Camargo Benítez


2. MEDIDAS DE TENDENCIA CENTRAL ÍNDICE

kn

c 100 − Fi−1
Pk = Li +
fi

donde;
Li =límite inferior del intervalo que contiene al percentil
Fi−1 =frecuencia acumulada en la clase anterior k-ésima
fi =frecuencia en la clase que contiene al percentiles
c =tamaño del intervalo de clase
k =1º, 2º, 3º,...,99º percentiles
De este modo, el percentil 80º de acuerdo a la tabla, estará en el intervalo 5, es decir,
c( 80n −F )
P80º = Li + 100 fi i−1 = 8,8 + 0,9(25,6−24)
5 = 9,088
El 80 % de los datos serán menores a 9,088 y el 20 % restante serán mayores.
....................................................................................
Hallemos el 3er cuartil.
El cuartil 3 (percentil 75º) se ubicara en el cuarto intervalo, así:
c( 75n −F )
P75º = Li + 100 fi i−1 = 7,9 + 0,9(24−17)
7 = 8,8
El 75 % de los datos serán menores a 8,8 y el 25 % restante serán mayores.
....................................................................................
Hallemos ahora el 7º decil.
El decil 7 (percentil 70º) se ubicara en el cuarto intervalo, así:
c( 70n −F )
P70º = Li + 100 fi i−1 = 7,9 + 0,9(22,4−17)
7 = 8,594
El 70 % de los datos serán menores a 8,594 y el 30 % restante serán mayores a 8,594.

2.4. Medidas de dispersión o de variabilidad


Hasta el momento hemos estudiado los valores centrales de la distribución, pero también es
importante conocer si los valores en general están cerca o alejados de estos valores centrales,
es por lo que surge la necesidad de estudiar medidas de dispersión.
Las medidas de dispersión muestran la variabilidad de una distribución, indicando por medio
de un número si las diferentes puntuaciones de una variable están muy alejadas de la media.
Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será
a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos; dicho de
otro modo, las medidas de dispersión, son herramientas estadísticas para determinar que tan
compactos son una serie de datos, o si se quiere, que tan homogéneos son.

guata26.03@gmail.com 30 Amaury J. Camargo Benítez


ÍNDICE 2. MEDIDAS DE TENDENCIA CENTRAL

Los tipos de medidas de dispersión más comunes son: “el rango” “la desviación Estándar o
típica” y la “Varianza” y el coeficiente de variación.

2.4.1. Rango
Se define como la diferencia que existe entre el valor mayor y el valor menor de una distribución,
Se indica como R. Se calcula de la siguiente forma: R= Valor Mayor – Valor Menor

2.4.2. Varianza
Es una medida cuya importancia radica especialmente en que da origen a otra medida de
dispersión más significativa, denominada desviación estándar o desviación típica. Es la media
de los cuadrados de las desviaciones, y la denotaremos por Sx2 o también por σ 2 . Las fórmulas
para la varianza poblacional y la varianza muestral son un poco diferente:
? Varianza muestral:

n 2
∑i=1 xi − X
Sx2 = para datos no agrupados
n−1

n 2
∑i=1 fi xi − X
Sx2 = para datos agrupados
n−1

? Varianza poblacional:

n 2
∑i=1 xi − X
σx2 = para datos no agrupados
N

n 2
∑i=1 fi xi − X
σx2 = para datos agrupados
N

donde:
? S = designa la desviación estándar o desviación típica.

? xi = para datos no agrupados es el valor de las observaciones en la muestra o de la


población. Para datos agrupados, representa el punto media de una clase o marca de
clase.

guata26.03@gmail.com 31 Amaury J. Camargo Benítez


2. MEDIDAS DE TENDENCIA CENTRAL ÍNDICE

? X = media aritmética.

? fi = es la frecuencia absoluta de los intervalos de clase.

? N = es el número de observaciones en la población.

? n = es el número de observaciones en la muestra.

Ejemplo 2.11.

Con los siguientes datos 5, 3, 1, 6, 10 calcule la varianza.


∑ xi 5+3+1+6+10
x= n = 5 =5
22
(5−5) +(5−3)2 +(5−1)2 +(5−6)2 +(5−10)2
2
s2 = ∑(xi −x)
n = 5 = 9, 2
Datos agrupados: al trabajar con datos agrupados utilizamos:

2
∑ (xi − x) ni
s2 = para la muestra y,
n
2
∑ Xi − X ni
σ2 = para la población.
N

2.4.3. Desviación típica


La desviación típica es la raíz cuadrada de la varianza, considerada siempre positiva.

s = s2 para la muestra y,

σ = σ 2 para la población.

La desviación típica, es la medida de dispersión más utilizada y de mayor utilidad, dado que
las unidades son expresadas en la misma variable; mientras que, la varianza se expresan en las
mismas unidades pero al cuadrado.

2.4.4. Coeficiente de variación de Pearson: (CV )


Mide la variación de los datos respecto a la media, sin tener en cuenta las unidades en la que
están.

Sx
CV = , x 6= 0
|x|

guata26.03@gmail.com 32 Amaury J. Camargo Benítez


ÍNDICE 2. MEDIDAS DE TENDENCIA CENTRAL

donde Sx es la desviación típica y x es la media del conjunto de observaciones.


El coeficiente de variación toma valores entre 0 y 1. Si el coeficiente es próximo al 0, significa
que existe poca variabilidad en los datos y es una muestra muy compacta. En cambio, si tienden
a 1 es una muestra muy dispersa.
Para interpretar fácilmente el coeficiente, podemos multiplicarlo por cien para tenerlo en tanto
por cien.

Ejemplo 2.12.

Para la media y la varianza de un conjunto se han hallado, respectivamente los valores 4 y 25


¿qué opinión merece la media aritmética?

s 5
CV = × 100 = × 100 = 125 %
x 4

Esta media aritmética no lo es suficientemente representativa de la distribución, debido a


variabilidad tan alta.

guata26.03@gmail.com 33 Amaury J. Camargo Benítez


3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS ÍNDICE

3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS

3.1. Análisis Combinatorio


Cuando estamos en presencia de un conjunto ordenado de una determinada manera, nos
pueden venir las preguntas, ¿porque está ordenado de esa forma?, ¿existen más posibilidades
para ordenar éste conjunto?, ¿cuántas?, etc. . . , el estudio de las permutaciones, de los arreglos
y de las combinaciones nos permitirá responder a éstas y otras preguntas.

3.1.1. Permutaciones
Las permutaciones consisten en cambiar el orden de un conjunto, y poder determinar cuántas
posibilidades de ver de distinta forma ordenado el conjunto existen, por ejemplo; sea M =
m1 , m2 , m3 , m4 , ..., mn un conjunto de n elementos, entonces las posibilidades que tengo para
poner en cada casillero será: en la primera posición puedo colocar cualquiera de los n elementos,
en la segunda puedo colocar cualquiera de los que me quedan, que son (n − 1), en la tercera
posición puedo colocar solo (n − 2) elementos y así voy quedándome con un elemento menos
a medida que avanzo en los casilleros, hasta que me quedo solo con un elemento en la última
posición, es decir:
M = | {z } , | {z } , | {z } , | {z } , ..., |{z} , |{z} , |{z}
n opciones n−1 opciones n−2 opciones n−3 opciones 3 opciones 2 opciones 1 opción

De manera que cuando tengo un conjunto de n elementos la cantidad de permutaciones que


puedo hacer sobre éste será:
Pn elementos = n · (n − 1) · (n − 2) · (n − 3) · ... · 2 · 1

A éste número lo conocemos como factorial de n, lo simbolizamos como n!, por lo tanto las
permutaciones que puedo hacer sobre un conjunto de n elementos será:
Pn elementos = n!

Ejemplo 3.1.

Determinemos la cantidad de ordenamientos distintos del conjunto de las vocales V = a, e, i, o, u:


SOLUCIÓN:
P5 vocales = 5! = 5 · 4 · 3 · 2 · 1 = 120 posibilidades distintas.

guata26.03@gmail.com 34 Amaury J. Camargo Benítez


ÍNDICE 3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS

3.1.2. Arreglos (variaciones)


Los arreglos son todas las posibles ordenaciones de n elementos sacados de un grupo más
grande de m elementos (m > n), importando el orden de los conjuntos resultantes, de manera
que α, β , γ 6= γ, β , α. El número de arreglos de a n elementos que puedo hacer en un grupo
de m elementos será:
m!
Amn =
(m−n)!

Ejemplo 3.2.

Determinemos la cantidad de arreglos de 2 vocales que podemos hacer en el conjunto de las


vocales V = a, e, i, o, u:
Solución: m será la cantidad de vocales, y n la cantidad que habrá en los arreglos:

m!
Am
n =
(m−n)!
5!
A52 =
(5 − 2)!
5 · 4 · 3!
A52 =
3!
A52 = 20 Arreglos distintos

Ejemplo 3.3.

¿De cuántas maneras pueden sentarse 10 personas en un banco si hay 4 sitios disponibles?
Respuesta:
Nótese que importa el orden en que se sientan las personas, ya que los cuatro sitios son
diferentes, y que una persona no puede ocupar más de un sitio a la vez. Por lo tanto, hay

m!
Am
n =
(m−n)!
10!
A10
4 =
(10 − 4)!
10!
A10
4 =
6!
10 · 9 · 8 · 7 · 6!
A10
4 = = 10,9,8,7 = 5040 maneras
6!

guata26.03@gmail.com 35 Amaury J. Camargo Benítez


3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS ÍNDICE

Ejemplo 3.4.

En una clase de 10 alumnos van a distribuirse 3 premios. Averiguar de cuántos modos puede
hacerse si:

a. Los premios son diferentes.

b. Los premios son iguales.

Hay dos supuestos posibles: Si una misma persona no puede recibir más de un premio:

? Suponemos que NO puede recibir más de un premio, luego los alumnos NO se pueden
repetir:

Caso 1. Los premios son diferentes (no es lo mismo ganar el primer premio que el segundo)
importa el orden, hay:

m!
Am
n =
(m−n)!
10!
A10
3 =
(10 − 3)!
10!
A10
3 =
7! · 3!
10 · 9 · 8 · 7!
A10
3 = = 10,9,8 = 720 manera de distribuir los premios si estos son diferentes;
7!

3.1.3. Combinaciones
Las combinaciones son muy parecidas a los arreglos, con la diferencia en que en los con-
juntos que se forman no importa el orden de manera que α, β , γ = γ, β , α. El número de
combinaciones de a n elementos que puedo hacer de un total de m elementos será:
m!
Cnm =
n!·(m−n)!

Ejemplo 3.5.

Javier, Gonzalo, Manuel, Pamela y Paola se han postulado a la directiva de su curso, pero solo 3
de ellos pueden quedar, ¿cuántas directivas posibles hay?.
Respuesta :
En éste caso se trata de formar combinaciones entre los postulantes, pues si por ejemplo se elije
a Javier, Gonzalo y Paola es lo mismo que se elija a Paola, Gonzalo y a Javier, lo que corresponde
a una combinación de 3 elementos de un total de 5, por lo tanto:

guata26.03@gmail.com 36 Amaury J. Camargo Benítez


ÍNDICE 3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS

m!
Cnm =
n!·(m−n)!
5!
C35 =
3!. (5 − 3)!
5,4,3!
C35 =
3!,2!
20
C35 = = 10 posibles directivas distintas
2

Ejemplo 3.6. (Se refiere a la parte b) del último ejemplo de los arreglos)

son iguales, no importa el orden, son indistinguibles, pueden distribuirse de;

m!
Cnm =
n! · (m−n)!
10!
C310 =
(10 − 3)! · 3!
10!
C310 =
7! · 3!
10 · 9 · 8
C310 = = 120 maneras de distribuir los premios si estos son iguales.
3·2·1

3.2. Probabilidad
Las Probabilidades pertenecen a la rama de la matemática que estudia ciertos experimentos
llamados aleatorios; o sea, regidos por el azar, en que se conocen todos los resultados posibles,
pero no es posible tener certeza de cuál será en particular el resultado del experimento.
Ejemplo, experimentos aleatorios cotidianos son el lanzamiento de una moneda, el lanzamiento
de un dado, extracción de una carta de un mazo de naipes. Más adelante se verá que debemos
distinguir entre los conceptos de probabilidades matemáticas o clásicas de las probabilidades
experimentales o estadísticas.
LA PROBABILIDAD es el estudio de los fenómenos de los que no estamos seguros de su
ocurrencia.
FENÓMENO: un fenómeno es la ocurrencia de un hecho o suceso. Los que nos interesan son
aquellos fenómenos los cuales podemos observar.
Ejemplos de experimentos; Lanzamiento de un dado, lanzamiento de una moneda, un mazo de
cartas, esferas en una urna, etcétera.
EXPERIMENTO: es un fenómeno observable perfectamente definido.

guata26.03@gmail.com 37 Amaury J. Camargo Benítez


3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS ÍNDICE

3.2.1. Experimentos y espacios muestrales


La teoría de la probabilidad ha sido motivada por diversas situaciones de la vida real en las
que se realiza un experimento y el investigador observa un resultado. Además, el resultado no
puede predecirse con certeza. A estos experimentos se les llama experimentos aleatorios. El
concepto de un experimento aleatorio se considera desde el punto de vista matemático como
una noción primitiva y por ello no se define de otra manera; sin embargo, podemos notar que
los experimentos aleatorios tienen algunas características comunes. Primero, en tanto que no
podemos predecir un resultado con certeza, sí es posible describir el conjunto de resultados
posibles. Segundo, desde un punto de vista conceptual, el experimento es tal que podría
repetirse en condiciones que permanezcan invariables, ocurriendo los resultados de una manera
fortuita; no obstante, a medida que el número de repeticiones aumenta, surgen ciertos patrones
en la frecuencia de ocurrencia de los resultados.
A menudo consideraremos experimentos idealizados. Por ejemplo, cuando se arroja una moneda,
podemos descartar la posibilidad de que caiga de canto. Esto es más por conveniencia que por
necesidad. El conjunto de resultados posibles se llama espacio muestral y estos resultados
definen al experimento idealizado en particular. Los símbolos E y S se utilizan para representar
el experimento aleatorio y el espacio muestral asociado.
De acuerdo con la terminología empleada en el repaso de conjuntos y sus operaciones, clasi-
ficaremos espacios muestrales (y con ello a los experimentos aleatorios). Un espacio muestral
discreto es aquel en el que hay un número finito de resultados o un número finito contable
(numerable) de resultados. Del mismo modo, un espacio muestral continuo tienen resultados
incontables. Éstos podrían ser números reales en un intervalo o pares reales contenidos en
el producto de intervalos, donde las mediciones se realizan respecto a dos variables en un
experimento.
Para ilustrar experimentos aleatorios con un espacio muestral asociado consideremos los ejem-
plos siguientes:

Ejemplo 3.7.

E1 : Lanzar una moneda genuina y observar el lado que cae hacia arriba.
S1 : {C, S}

Ejemplo 3.8.

E2 : Lanzar tres veces una moneda genuina y observar la secuencia «caras» y «sellos».
S2 : {CCC,CCS,CSC,CSS, SCC, SCS, SSC, SSS}

guata26.03@gmail.com 38 Amaury J. Camargo Benítez


ÍNDICE 3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS

Ejemplo 3.9.

E3 : Lanzar tres veces una moneda genuina y observar el número total de «caras».
S3 : {0, 1, 2, 3}

Ejemplo 3.10.

E4 : Lanzar un dado y observar el número que resulta en la cara superior.


S4 : {1, 2, 3, 4, 5, 6}

Ejemplo 3.11.

Lanzar un par de dados y observar los números


E5 :   que resultan.


 (1, 1) , (1, 2) , (1, 3) , (1, 4) , (1, 5) , (1, 6) , 


 



 (2, 1) , (2, 2) , (2, 3) , (2, 4) , (2, 5) , (2, 6) , 



 (3, 1) , (3, 2) , (3, 3) , (3, 4) , (3, 5) , (3, 6) , 
 
S5 :
 (4, 1) , (4, 2) , (4, 3) , (4, 4) , (4, 5) , (4, 6) , 

 

 



 (5, 1) , (5, 2) , (5, 3) , (5, 4) , (5, 5) , (5, 6) , 




 (6, 1) , (6, 2) , (6, 3) , (6, 4) , (6, 5) , (6, 6) . 

guata26.03@gmail.com 39 Amaury J. Camargo Benítez


REFERENCIAS REFERENCIAS

Referencias
[1]

[200] Matemà ticas discretas.

[Cir12] Martinez Bencardino Ciro. EstadÃstica y Muestreo. 2012.

[Lea01] Leandra. La yuca y plátanos. 2001.

[Lea03] Leandra. el platano. 2003.

[Wal12] Myers Walpole, Myers. Probabilidad y EstadÃstica para IngenierÃa y Ciencias. 9º Ed.
2012.

guata26.03@gmail.com 40 Amaury J. Camargo Benítez

Vous aimerez peut-être aussi