Vous êtes sur la page 1sur 13

UNIVERSIDAD NACIONAL

PEDRO RUIZ GALLO


FACULTAD DE CIENCIAS FSICAS
Y MATEMTICAS
ESCUELA PROFESIONAL DE INGENIERA ELECTRNICA

CURSO :

ESTADSTICA Y PROBABILIDADES

DOCENTE :

Nuez Rodriguez Jos

TEMA :

Tablas de distribucin de frencuencias,


Medidas de tendencia central y medidas de
dispersin

ALUMNO :

VAZQUEZ MEDINA, Cristhian Erick


MONJA IMN, Juan Alexis

Lambayeque, mayo del 2017


Estadstica y Probabilidades

Tablas de Distribucin de Frecuencias

Cmo construir una tabla de frecuencias?


Cuando los valores de la variable son muchos, conviene agrupar los datos
en intervalos o clases para as realizar un mejor anlisis e interpretacin de
ellos.

Para construir una tabla de frecuencias con datos agrupados, conociendo los
intervalos, se debe determinar la frecuencia absoluta (fi) correspondiente a
cada intervalo, contando la cantidad de datos cuyo valor est entre los extremos
del intervalo. Luego se calculan las frecuencias relativas y acumuladas, si es
pertinente.

Cmo determinar los intervalos?


Si no se conocen los intervalos, se pueden determinar de la siguiente manera:
(recuerda que los intervalos de clase se emplean si las variables toman un
nmero grande de valores o la variable es continua).
- Se busca el valor mximo de la variable y el valor mnimo. Con estos
datos se determina el rango.
- Se divide el rango en la cantidad de intervalos que se desea tener, (por
lo general se determinan 5 intervalos de lo contrario es ideal que sea un
numero impar por ejemplo 5, 7, 9) obtenindose as la amplitud o tamao
de cada intervalo.
- Comenzando por el mnimo valor de la variable, que ser el extremo
inferior del primer intervalo, se suma a este valor la amplitud para obtener
el extremo superior y as sucesivamente.
Otra forma de calcular la cantidad de intervalos es aplicando los siguientes
metodos:

MTODO STURGES:

= + , ()

Donde:
k= nmero de clases
n= tamao muestral

Debemos tener en cuenta 2 cosas. Primero que el nmero de intervalos me tiene que
dar impar, segundo que el resultado se redondea generalmente a la baja. Si al
redondear a la baja nos da como resultado un nmero par debemos redondear al alza.
Este es el mtodo que tiene mayor precisin.

1
Estadstica y Probabilidades

MTODO EMPRICO
Este mtodo depende del criterio del evaluador de los datos, por lo tanto es arbitrario.
Dice lo siguiente.

5 k 20

Ejercicio:
En un centro comercial, se consult la edad a todas las personas que entraban
entre las 12:00 h y 12:30 h. Los resultados obtenidos fueron los siguientes:

Construye una tabla de frecuencias cuyos datos estn agrupados en datos de 8


intrvalos.

1er Paso
Para poder construir la tabla de frecuencias lo primero que debemos hacer es
calcular el rango.

Rango:
El rango da la idea de proximidad de los datos a la media. Se calcula restando
el dato menor al dato mayor.
El dato mayor y el menor lo hemos destacado con color rojo:

dato mayor - dato menor = 73 - 1 = 72

Por lo tanto; Rango = 72

2do Paso
En el problema nos dicen que debemos agruparlo en 8 intervalos o clases, con
este dato podemos calcular la amplitud o tamao de cada intervalo, dividiendo el

2
Estadstica y Probabilidades

valor del rango por la cantidad de intervalos que se desean obtener (en este caso
son 8).

Amplitud:
La amplitud de un intervalo es la diferencia entre el lmite superior y el lmite
inferior.
La amplitud(A) de los intervalos puede calcularse mediante la expresin:

Por lo tanto:
72
= =9
8

La amplitud de cada intervalo ser 9


Amplitud = 9

3er Paso
Hay distintas formas de construir los intervalos dependiendo del tipo de variable
que estemos trabajando.

Tipos de Variable:
1. Variables cuantitativas:
Una variable cuantitativa es la que se expresa mediante un nmero, por
tanto se pueden realizar operaciones aritmticas con ella. Podemos
distinguir dos tipos:
a. Variables cuantitativas discretas:
Una variable discreta es aquella que solo puede tomar un nmero finito
de valores entre dos valores cualesquiera de una caraterstica.
El nmero de hermanos de 5 amigos: 2, 1, 0, 1, 3.

b. Variables cuantitativas continuas:

Una variable continua es aquella que puede tomar un nmero infinito


de valores entre dos valores cualesquiera de una caraterstica.

La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.

3
Estadstica y Probabilidades

2. Variables Cualitativas:
Las variables cualitativas se refieren a caractersticas o cualidades que
no pueden ser medidas con nmeros. Podemos distinguir dos tipos:

a. Variable cualitativa nominal

Una variable cualitativa nominal presenta modalidades no


numricas que no admiten un criterio de orden. Por ejemplo:

El estado civil, con las siguientes modalidades: soltero,


casado, separado, divorciado y viudo.

b. Variable cualitativa ordinal o variable cuasicuantitativa

Una variable cualitativa ordinal presenta modalidades no


nmericas, en las que existe un orden. Por ejemplo:

La nota en un examen: suspenso, aprobado, notable,


sobresaliente.
Puesto conseguido en una prueba deportiva: 1, 2, 3,...
Medallas de una prueba deportiva: oro, plata, bronce.

Registro discreto de variables continuas:


Cuando la variable considerada es continua pero ocurre que la precisin del
instrumento de medida se limita a un nmero finito de datos, existe la opcin de
construir los intervalos de tal forma que ambos extremos estn incluidos en l.
Ej 50 a 52, 53 a 55, 56 a 58, 59 al 61 y 62 al 64
Estos seran los lmites aparentes de los intervalos.
Con esta informacin construiremos la tabla de frecuencias:

4
Estadstica y Probabilidades

Marca clase o centro de clase:


Es la semisuma de los lmites de cada clase. Representa a todos los datos que
estn contenidos en una clase.

Definiendo trminos:
Frecuencia Absoluta (fi):
Corresponde a la cantidad de veces que se repite un dato. Denotamos
este valor por fi.
Por ejemplo:

Del total de personas encuestadas, cuntas personas tienen entre 31 y


40 aos?
Respuesta: Observamos los datos obtenidos en la tabla y tenemos que:

El dato lo obtenemos de la columna de la frecuencia absoluta.

Por lo tanto la respuesta es 6 personas.

Frecuencia Absoluta acumulada (Fi):

Es la suma de las frecuencias absolutas observadas hasta el intervalo i.


Por ejemplo:
Del total de personas encuestadas, cuntas personas tienen 60 o
menos aos?
Respuesta: Observamos los datos obtenidos en la tabla y tenemos que:

El dato lo obtenemos de la columna de frecuencia absoluta acumulada.


En este caso es el intervalo 6. Por lo tanto la respuesta es 36 personas
tienen 60 o menos aos.

Frecuencia relativa (hi):


Corresponde a la probabilidad de pertenecer a cierta categora. Se
puede expresar en tantos por ciento.

Por ejemplo:

Cul es la probabilidad de, que al elegir al azar a un persona


consultada, esta tenga entre 11 y 20 aos?

Respuesta: Observamos los datos obtenidos en la tabla y tenemos que:

5
Estadstica y Probabilidades

El dato lo obtenemos de la columna de frecuencia relativa.

En este caso es el intervalo 2, ya que es ah donde se encuentran las


edades entre 11 y 20 aos.

Entonces la respuesta es: La probabilidad es 14%.

Frecuencia relativa acumulada (Hi):


Es la probabilidad de observar un valor menor o igual al valor que toma la
variable en estudio en ese intervalo.

Se calcula dividiendo Fi por el nmero total de datos. Tambin puedes


calcularlo Sumando la frecuencia relativa de cada grupo con la frecuencia
relativa acumulada del grupo anterior.

Si haces correctamente estos clculos, el ltimo grupo tendr una


frecuencia acumulada de 1, o muy cerca de 1, permitiendo redondear el
error.

Por ejemplo:

Si le preguntas a una persona cualquiera Cul es la probabilidad de


que tenga 50 aos o menos?

Respuesta: La probabilidad es de un 76%

6
Estadstica y Probabilidades

Medidas de Tendencia Central


Las caractersticas globales de un conjunto de datos estadsticos pueden
resumirse mediante una serie de cantidades numricas representativas llamadas
parmetros estadsticos. Entre ellas, las medidas de tendencia central, como la
media aritmtica, la moda o la mediana, ayudan a conocer de forma aproximada
el comportamiento de una distribucin estadstica.

Medidas de Centralizacin:
Se llama medidas de posicin, tendencia central o centralizacin a unos valores
numricos en torno a los cuales se agrupan, en mayor o menor medida, los
valores de una variable estadstica. Estas medidas se conocen tambin
como promedios.

Para que un valor pueda ser considerado promedio, debe cumplirse que est
situado entre el menor y el mayor de la serie y que su clculo y utilizacin resulten
sencillos en trminos matemticos.

Se distinguen dos clases principales de valores promedio:


Las medidas de posicin centrales: medias (aritmtica, geomtrica,
cuadrtica, ponderada), mediana y moda.
Las medidas de posicin no centrales: entre las que destacan
especialmente los cuartiles.

Las medidas de centralizacin son parmetros representativos de distribuciones de


frecuencia como las que ilustra la imagen.

1. Media aritmtica:
Se define media aritmtica de una serie de valores como el resultado producido
al sumar todos ellos y dividir la suma por el nmero total de valores. La media
aritmtica se expresada como .
Dada una variable x que toma los valores x1, x2,..., xn, con frecuencias absolutas
simbolizadas por f1, f2,..., fn, la media aritmtica de todos estos valores vendr
dada por:

7
Estadstica y Probabilidades

Ejemplo 1:
En matemticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3
n = 6 (nmero total de datos)

2. Media ponderada:
En algunas series estadsticas, no todos los valores tienen la misma importancia.
Entonces, para calcular la media se ponderan dichos valores segn su peso, con
lo que se obtiene una media ponderada.
Si se tiene una variable con valores x1, x2,..., xn, a los que se asigna un peso
mediante valores numricos p1, p2,..., pn, la media ponderada se calcular como
sigue:

3. Mediana:
La media aritmtica no siempre es representativa de una serie estadstica. Para
complementarla, se utiliza un valor numrico conocido como mediana o valor
central.
Dado un conjunto de valores ordenados, su mediana se define como un valor
numrico tal que se encuentra en el centro de la serie, con igual nmero de
valores superiores a l que inferiores. Normalmente, la mediana se expresa
como Me.
La mediana es nica para cada grupo de valores. Cuando el nmero de valores
ordenados (de mayor a menor, o de menor a mayor) de la serie es impar, la
mediana corresponder al valor que ocupe la posicin (n + 1)/2 de la serie. Si el
nmero de valores es par, ninguno de ellos ocupar la posicin central.
Entonces, se tomar como mediana la media aritmtica entre los dos valores
centrales.

Determinacin de la mediana de una serie de valores.

8
Estadstica y Probabilidades

Ejemplo 1:
Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2
Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene: 1, 2, 4, 5,
8, 9, 10
El 5 corresponde a la Mediana, porque es el valor central en este conjunto de
datos impares.
Ejemplo 2:
El siguiente conjunto de datos est ordenado en forma decreciente, de mayor a
menor, y corresponde a un conjunto de valores pares, por lo tanto, la Med ser
el promedio de los valores centrales.
21, 19, 18, 15, 13, 11, 10, 9, 5, 3

4. Moda:
En una serie de valores a los que se asocia una frecuencia, se define moda como
el valor de la variable que posee una frecuencia mayor que los restantes. La
moda se simboliza normalmente por Mo.
Un grupo de valores puede tener varias modas. Una serie de valores con slo
una moda se denomina unimodal; si tiene dos modas, es bimodal, y as
sucesivamente.
Ejemplo 1:
Determinar la moda en el siguiente conjunto de datos que corresponden a las
edades de nias de un Jardn Infantil.
5, 7, 3, 3 , 7, 8, 3 , 5, 9, 5, 3 , 4, 3
La edad que ms se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)
Ejemplo 2:
20, 12, 14, 23, 78, 56, 96
En este conjunto de datos no existe ningn valor que se repita, por lo tanto, este
conjunto de valores no tiene moda.

Medidas de Posicin Relativa


Son medidas descriptivas que localizan la posicin de una medicin en relacin
a otras mediciones. Una medida que expresa esta posicin en trminos de un
porcentaje es llamado porcentil.
El porcentil de orden (P) es el valor de la variable por debajo del cual se
encuentra una frecuencia acumulada .

9
Estadstica y Probabilidades

El porcetil 25 o primer cuartil Q1 = - 0.675 deja a su izquierda el 25% de las


observaciones.

El porcetil 70, es decir, P70 = 0.525 deja a su izquierda el 70% de las


observaciones

Medidas De Dispersin
Las medidas de tendencia central ofrecen una idea aproximada del
comportamiento de una serie estadstica. No obstante, no resultan suficientes
para expresar sus caractersticas: una misma media puede provenir de valores
cercanos a la misma o resultar de la confluencia de datos estadsticos
enormemente dispares. Para conocer en que grado las medidas de tendencia
central son representativas de la serie, se han de complementar con medidas de
dispersin como la varianza o la desviacin tpica.

10
Estadstica y Probabilidades

1. Concentracin y dispersin:
Las medidas de centralizacin ayudan a determinar el centro de gravedad de
una distribucin estadstica. Para describir el comportamiento general de la serie
se necesita, sin embargo, una informacin complementaria para saber si los
datos estn dispersos o agrupados.
As, las medidas de dispersin pueden definirse como los valores numricos
cuyo objeto es analizar el grado de separacin de los valores de una serie
estadstica con respecto a las medidas de tendencia central consideradas.
Las medidas de dispersin son de dos tipos:
Medidas de dispersin absoluta: como recorrido, desviacin media,
varianza y desviacin tpica, que se usan en los anlisis estadsticos
generales.
Medidas de dispersin relativa: que determinan la dispersin de la
distribucin estadstica independientemente de las unidades en que se
exprese la variable. Se trata de parmetros ms tcnicos y utilizados en
estudios especficos, y entre ellas se encuentran los coeficientes de
apertura, el recorrido relativo, el coeficiente de variacin (ndice de
dispersin de Pearson) y el ndice de dispersin mediana.

La distribucin normal, o campana de Gauss, es una funcin simtrica (con la


media aritmtica en el centro de la serie) con un grado de dispersin bajo (la
mayora de los valores estn comprendidos dentro del valor de la desviacin
tpica).

2. Recorrido:
La medida de dispersin ms inmediata es el recorrido de la distribucin
estadstica, tambin llamado rango o amplitud. Dada una serie de valores x1,
x2,..., xn, su recorrido es la diferencia aritmtica entre el mximo y el mnimo de
estos valores:

11
Estadstica y Probabilidades

3. Desviacin media:
Como medida de dispersin ms frecuentemente utilizada, la desviacin media
se define como la media aritmtica de los valores absolutos de la desviacin de
cada valor de la variable con respecto a la media. Su formulacin matemtica es
la siguiente:

4. Varianza y desviacin tpica:


La desviacin media no siempre suministra una idea clara del grado de
separacin entre los valores de una variable estadstica. Para estudios
cientficos, se prefiere utilizar una pareja de parmetros relacionados que se
conocen como varianza y desviacin tpica.
La varianza se define como el cociente entre la suma de los cuadrados de las
desviaciones de los valores de la variable y el nmero de datos del estudio.
Matemticamente, se expresa como:

Por su parte, la desviacin tpica, simbolizada por s, se define sencillamente


como la raz cuadrada de la varianza:

Por lo tanto, se tiene que:

La varianza y la desviacin tpica, cada una con su respectivo valor, se usan


indistintamente en los estudios estadsticos.

5. Coeficiente de Variacin:
Es una medida de variacin relativa y expresa la desviacin estndar como un
porcentaje de la media aritmtica. Se obtiene como:

Por su falta de dimensiones es muy til para comparar variacin entre diferentes
poblaciones, que a simple vista seran difciles de comparar.

12