Vous êtes sur la page 1sur 28

ESTADISTICA COMERCIAL

Profa. Luisa Montenegro

NOMBRE: Carlos Alexander González Pineda

Clave: 19

6to “D”

Lunes 16 de mayo de 2011

1
Introducción…………………………………………………….3

Distribuciones de frecuencia………………………………...4

Medias de tendencia central………………………………..11

Media Armónica………………………………………………14

Media Geométrica……………………………………………15

Mediana……………………………………………………….19

Moda…………………………………………………………..24

Conclusiones…………………………………………………27

Egrafia…………………………………………………………28

2
En el siguiente trabajo se le presentan los distintos tipos de frecuencias y
maneras de distribuir datos estadísticos desde la distribución de frecuencias hasta
la moda estadística.

Donde las frecuencias son el método que se emplea cuando se desea presentar
un gran número de datos para determinar el número de individuos pertenecientes
a cada clase la cual contiene también intervalos, límites y puntos medios.

Las medidas de tendencia central son las medidas que sirven para medir los
valores a concentrarse en el centro de la distribución entre ellos tenemos:

 Media aritmética.
 Media ponderada.
 Media geométrica.
 Media armónica.
 Mediana.
 Moda.

3
Distribuciones de frecuencia
Cuando se dispone de gran número de datos, es útil el distribuirlos en clases o
categorías y determinar el número de individuos pertenecientes a cada clase, que
es la frecuencia de clase. Una ordenación tabular de los datos en clases, reunidas
las clases y con as frecuencias correspondientes a cada una, se conoce como una
distribución de frecuencias o tabla de frecuencias. La Tabla 1 es una distribución
de frecuencias de alturas (registradas con aproximación de pulgada) de 100
estudiantes de la Universidad XYZ.

La primera clase o categoría, por ejemplo, comprende las alturas de 60 a 62


pulgadas y viene indicada por el símbolo 60 - 62. Puesto que 5 estudiantes tienen
una altura perteneciente a esta clase, la correspondiente frecuencia de clase es 5.

Los datos ordenados y resumidos como en la distribución de frecuencia anterior,


se suelen llamar datos agrupados. Aunque con el proceso de agrupamiento
generalmente se pierde parte del detalle original de los datos, tiene la importante
ventaja de presentarlos «todos» en un sencillo cuadro que facilita el hallazgo de
las relaciones que pueda haber entre ellos, puestas así de manifiesto.

Intervalos de clase y límites de clase

Un símbolo que define una clase, tal como 60 - 62 de la tabla anterior, se conoce
como intervalo de clase. Los números extremos, 60 y 62, son los límites de clase;
el número menor 60 es el límite inferior de la clase y el mayor 62 es el límite
superior. Los términos clase e intervalo de clase se utilizan a menudo
indistintamente, aunque el intervalo de clase es realmente un símbolo para la
clase.

Un intervalo de clase que, al menos teóricamente, no tiene límite superior o


inferior, se conoce como intervalo de clase abierto. Por ejemplo, al referirse a la

4
edad de grupos de individuos el intervalo de clase, «mayores de 65 años» es un
intervalo de clase abierto.

Límites reales de clases

Si las alturas se registran con aproximación de pulgada, el intervalo de clase 60 -


62 teóricamente incluye todas las medidas desde 59,5000... a 62,5000 …
pulgadas. Estos números, representados brevemente por los números exactos
59,5 y 62,5, se conocen como límites reales de clase o límites verdaderos de
clase; el menor de ellos, 59,5, es el límite real inferior y el mayor de ellos, 62,5, es
el límite real superior.

Prácticamente, los límites reales de clase se obtienen sumando al límite superior


de un intervalo de clase el límite inferior del intervalo de clase contiguo superior y
dividiendo por 2.

A veces, los límites reales de clase se utilizan para simbolizar las clases. Por
ejemplo, las diferentes clases de la primera columna de la Tabla 1 podrían
indicarse por 59,5 - 62,5, 62,5 - 65,5, etc. Sin embargo, con tal notación aparece
una ambigüedad, pues los límites reales de clase no coincidirían con las
observaciones reales. Así si una observación fuese 62,5 no sería posible discernir
si pertenece al intervalo de clase 59,5 - 62,5 o al 62,5 - 65,5.

TAMAÑO O ANCHURA DE UN INTERVALO DE CLASE

El tamaño o anchura de un intervalo de clase es la diferencia entre los límites


reales de clase que lo forman y se conoce como anchura de clase, tamaño de
clase o longitud de clase. Si todos los intervalos de clase de una distribución de
frecuencias tienen igual anchura, esta anchura común se representa por c. En tal
caso, c es igual a la diferencia entre dos sucesivos límites de clase inferiores o
superiores. Para los datos de la Tabla 1, por ejemplo, el intervalo de clase es c =
62,5 - 59,5 = 65,5 - 62,5 = 3.

Marca de clase

La marca de clase es el punto medio del intervalo de clase y se obtiene sumando


los límites inferior y superior de la clase y dividiendo por 2. Así, la marca de clase
del intervalo 60 - 62 es (60 + 62)/2 = 61. La marca de clase se llama también
punto medio de la clase.

Para análisis matemáticos posteriores, todas las observaciones pertenecientes a


un intervalo de clase dado se suponen coincidentes con la marca de clase. Así,
todas las alturas en el intervalo de clase 60 - 62 pulgadas se considerarán como
de 61 pulgadas.

Reglas generales para formar las distribuciones de frecuencia

5
l. Determinar el mayor y el menor entre los datos registrados y así encontrar el
rango (diferencia entre el mayor y el menor de los datos).

2. Dividir el rango en un número conveniente de intervalos de clase del mismo


tamaño. Si esto no es posible, utilizar intervalos de clase de diferente tamaño o
intervalos de clase abiertos. El número de intervalos de clase se toma
generalmente entre 5 y 20 dependiendo de los datos. Los intervalos de clase se
eligen también de forma que las marcas de clase o puntos medios coincidan con
datos realmente observados. Esto tiende a aminorar el llamado error de
agrupamiento, en los análisis matemáticos posteriores. Sin embargo, los límites
reales de clase no coincidirán con los datos observados.

3. Determinar el número de observaciones que caen dentro de cada intervalo de


clase, es decir, encontrar las frecuencias de clase. Lo mejor para esto es utilizar
una hoja de conteo.

HISTOGRAMAS Y POLIGONOS DE FRECUENCIA son dos representaciones


gráficas de las distribuciones de frecuencia.

1. Un histograma o histograma de frecuencias consiste en una serie de


rectángulos que tienen

(a) Sus bases sobre un eje horizontal (el eje X) con centros en las marcas de clase
y longitud igual al tamaño de los intervalos de clase.

(b) Superficies proporcionales a las frecuencias de clase.

Si los intervalos de clase tienen todos igual tamaño, las alturas de los rectángulos
son proporcionales a las frecuencias de clase y se acostumbra en tal caso a tomar
las alturas numéricamente iguales a las frecuencias de clase. Si los intervalos de
clase no son de igual tamaño, estas alturas deberán ser calculadas.

2. Un polígono de frecuencias es un gráfico de línea trazado sobre las marcas de


clase. Puede obtenerse uniendo los puntos medios de los techos de los
rectángulos en el histograma.

El histograma y el polígono de frecuencias correspondiente a la distribución de


frecuencias de las alturas de los estudiantes se muestran en el mismo sistema de
ejes en la Fig.1. Se acostumbra a prolongar el polígono con PQ y RS hasta las
marcas de clase inferior y superior inmediatas, que corresponderían a la clase de
frecuencia cero. En tal caso, la suma de las áreas de los rectángulos del
histograma es igual al e área total limitada por el polígono de frecuencias y el eje
X.

6
Distribuciones de frecuencia relativa

La frecuencia relativa de una clase es la frecuencia de la clase dividida por el total


de frecuencias de todas las clases y se expresa generalmente como porcentaje.
Por ejemplo, la frecuencia relativa de la clase 66 - 68 de la Tabla 1 es 42/100 = 42
%. La suma de las frecuencias relativas de todas las clases es evidentemente 1 ó
100 %.

Si las frecuencias en la anterior tabla de frecuencias se sustituyen por las


correspondientes frecuencias relativas, la tabla resultante se llama distribución de
frecuencias relativas, distribución porcentual o tabla de frecuencias relativas.

Las representaciones gráficas de distribuciones de frecuencia relativa pueden


obtenerse del histograma o del polígono de frecuencias, sin más que cambiar la
escala vertical de frecuencia a frecuencia relativa, conservándose exactamente el
mismo diagrama. Los gráficos que resultan se llaman histogramas de frecuencias
relativas o histogramas porcentuales y polígonos de frecuencias relativas o
polígonos porcentuales, respectivamente.

7
Distribuciones de frecuencia acumulada. Ojivas

La frecuencia total de todos los valores menores que el límite real superior de
clase de un intervalo de clase dado se conoce como frecuencia acumulada hasta
ese intervalo de clase inclusive. Por ejemplo, la frecuencia acumulada hasta el
intervalo de clase 66 - 68 inclusive en la Tabla 1, es 5 + 18 + 42 = 65, significando
que 65 estudiantes tienen alturas menores que 68,5 pulgadas.

Una tabla que represente las frecuencias acumuladas se llama distribución de


frecuencias acumuladas, tabla de frecuencias acumuladas o brevemente
distribución acumulada, y se muestra en la Tabla 2, para la distribución de la altura
de los estudiantes.

Un gráfico que muestre las frecuencias acumuladas menores que cualquier límite
real superior de clase trazado sobre los límites reales superiores de clase se llama

8
polígono de frecuencias acumuladas u ojiva y se muestra en la Fig. 2-2 para la
distribución de la altura de los estudiantes.

En algunos casos es preferible considerar una distribución de frecuencias


acumuladas de todos los valores mayores o iguales al límite real inferior de clase
de cada intervalo de clase. En este caso consideramos las alturas de 59,5
pulgadas o más, 62,5 pulgadas o más, etc., ésta se llama a veces distribución
acumulada «o más», mientras que la considerada anteriormente es la distribución
acumulada «menor que». De la una se obtiene fácilmente la otra. Las
correspondientes ojivas se llaman «o más» y «menor que». Siempre que nos
refiramos a distribuciones acumuladas u ojivas sin especificar, se entenderá que
son del tipo «menor que».

DISTRIBUCIONES DE FRECUENCIAS RELATIVAS ACUMULADAS. OJIVAS


PORCENTUALES

La frecuencia relativa acumulada o frecuencia porcentual acumulada es la


frecuencia acumulada dividida por la frecuencia total. Por ejemplo, la frecuencia
relativa acumulada de alturas menores que 68,5 pulgadas es 65/100 = 65 %,
queriendo con ello decir que el 65 % de los estudiantes tienen alturas menores de
68,5 pulgadas.

Si se utilizan en la Tabla 2, y Fig. 2, las frecuencias relativas acumuladas en lugar


de las frecuencias acumuladas, los resultados se llaman distribuciones de
frecuencias relativas acumuladas o distribuciones porcentuales acumuladas y
polígonos de frecuencias relativas acumuladas u ojivas porcentuales,
respectivamente.

CURVAS DE FRECUENCIAS. OJIVAS SUAVIZADAS

El conjunto de datos puede considerarse normalmente como perteneciente a una


muestra extraída de una población grande. A causa de las muchas observaciones
que podemos realizar en la población es posible teóricamente (para datos
continuos) elegir los intervalos de clase muy pequeños y todavía tener un número
adecuado de observaciones dentro de cada clase. Así se tiene que el polígono de
frecuencias o el de frecuencias relativas para una población grande puede estar
formado por muchos pequeños segmentos rectos que aproximan el conjunto a una
curva, las curvas de este tipo pueden llamarse curvas de frecuencias o curvas de
frecuencias relativas, respectivamente.

Es razonable esperar que tales curvas teóricas provengan de la suavización de los


polígonos de frecuencias o de los polígonos de frecuencias relativas de la
muestra, la aproximación es tanto más exacta conforme aumenta el tamaño de la
muestra. Por esta razón una curva de frecuencias se conoce como un polígono de
frecuencias suavizado.

9
De una forma análoga las ojivas suavizadas provienen de la suavización de los
polígonos de frecuencias acumuladas u ojivas. Normalmente es más sencillo
suavizar una ojiva que un polígono de frecuencias.

Tipos de curvas de frecuencia

Las curvas de frecuencia presentan determinadas formas características que les


distinguen como se indica en la Figura 3.

(a) Las curvas de frecuencia simétricas o bien formadas se caracterizan por el


hecho de que las observaciones que equidistan del máximo central tienen la
misma frecuencia. Un ejemplo importante es la curva normal.

(b) En las curvas de frecuencia moderadamente asimétricas o sesgadas la cola de


la curva a un lado del máximo central es mayor que al otro lado. Si la cola mayor
se presenta a la derecha de la curva se dice que ésta está sesgada a la derecha o
que tiene sesgo positivo, mientras que si ocurre lo contrario se dice que la curva
está sesgada a la izquierda o que tiene un sesgo negativo.

(c) En las curvas en forma de J o de J invertida, el máximo se presenta en un


extremo.

(d) Las curvas de frecuencias en forma de U tienen el máximo en ambos


extremos.

10
(e) Una curva de frecuencias bimodal tiene dos máximos.

(f) Una curva de frecuencias multimodal tiene más de dos máximos.

Medidas de tendencia central


Al describir grupos de observaciones, con frecuencia es conveniente resumir la
información con un solo número. Este número que, para tal fin, suele situarse
hacia el centro de la distribución de datos se denomina medida o parámetro de
tendencia central o de centralización. Cuando se hace referencia únicamente a la
posición de estos parámetros dentro de la distribución, independientemente de
que ésta esté más o menos centrada, se habla de estas medidas como medidas
de posición.1 En este caso se incluyen también los cuantiles entre estas medidas.

Entre las medidas de tendencia central tenemos:

 Media aritmética.
 Media ponderada.
 Media geométrica.
 Media armónica.
 Mediana.
 Moda.

La media aritmética (o simplemente media)

La media aritmética es el valor obtenido por la suma de todos sus valores dividida
entre el número de sumandos.

Por ejemplo, las notas de 5 alumnos en una prueba:

Alumno Nota
1 6,0 ·Primero, se suman las notas:
2 5,4 6,0+5,4+3,1+7,0+6,1 = 27,6
3 3,1 ·Luego el total se divide entre la cantidad de alumnos:
4 7,0 27,6/5=5,52
5 6,1 ·La media aritmética en este ejemplo es 5,52

La media aritmética es, probablemente, uno de los parámetros estadísticos más


extendidos.2 Se le llama también promedio o, simplemente, media.

11
Definición formal

Dado un conjunto numérico de datos, x1, x2, ..., xn, se define su media aritmética
como

Esta definición varía, aunque no sustancialmente, cuando se trata de variables


continuas, esto es, también puede calcularse para variables agrupadas en
intervalos.

Propiedades

Las principales propiedades de la media aritmética son:3

 Su cálculo es muy sencillo y en él intervienen todos los datos.

 Su valor es único para una serie de datos dada.

 Se usa con frecuencia para comparar poblaciones, aunque es más


apropiado acompañarla de una medida de dispersión.

 Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto


de datos, ya que tiene la propiedad de equilibrar las desviaciones de los
datos respecto de su propio valor:

 Minimiza las desviaciones cuadráticas de los datos respecto de cualquier

valor prefijado, esto es, el valor de es mínimo cuando


. Este resultado se conoce como Teorema de König. Esta propiedad
permite interpretar uno de los parámetros de dispersión más importantes: la
varianza.

 Se ve afectada por transformaciones afines (cambios de origen y escala),


esto es, si

xi' = axi + b entonces , donde es la media aritmética de los


xi', para i = 1, ..., n y a y b números reales.

12
 Es poco sensible a fluctuaciones muestrales, por lo que es un parámetro
muy útil en inferencia estadística.

Inconvenientes de su uso

Este parámetro, aún teniendo múltiples propiedades que aconsejan su uso en


situaciones muy diversas, tiene también algunos inconvenientes, como son:

 Para datos agrupados en intervalos (variables continuas) su valor oscila en


función de la cantidad y amplitud de los intervalos que se consideren.

La estatura media como resumen de una población homogénea (abajo) o


heterogénea (arriba).

 Es una medida a cuyo significado afecta sobremanera la dispersión, de


modo que cuanto menos homogéneos sean los datos, menos información
proporciona. Dicho de otro modo, poblaciones muy distintas en su
composición pueden tener la misma media.4 Por ejemplo, un equipo de
baloncesto con cinco jugadores de igual estatura, 1,95 m, evidentemente,
tendría una estatura media de 1,95 m, valor que representa fielmente a esta
población homogénea. Sin embargo, un equipo de jugadores de estaturas
más heterogéneas, 2,20 m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo,
tendría también, como puede comprobarse, una estatura media de 1,95 m,
valor que no representa a casi ninguno de sus componentes.

 En el cálculo de la media no todos los valores contribuyen de la misma


manera. Los valores altos tienen más peso que los valores cercanos a cero.
Por ejemplo, en el cálculo del salario medio de un empresa, el salario de un

13
alto directivo que gane 1.000.000 de € tiene tanto peso como el de diez
empleados "normales" que ganen 1.000 €. En otras palabras, se ve muy
afectada por valores extremos.

 No se puede determinar si en una distribución de frecuencias hay intervalos


de clase abiertos.

Media aritmética ponderada

A veces puede ser útil otorgar pesos o valores a los datos dependiendo de su
relevancia para determinado estudio. En esos casos se puede utilizar una media
ponderada.

Si x1,x2,...,xn son nuestros datos y w1,w2,...,wn son sus "pesos" respectivos, la


media ponderada se define de la siguiente forma:

Media muestral

Esencialmente, la media muestral es el mismo parámetro que el anterior, aunque


el adjetivo "muestral" se aplica a aquellas situaciones en las que la media
aritmética se calcula para un subconjunto de la población objeto de estudio.

La media muestral es un parámetro de extrema importancia en la inferencia


estadística, siendo de gran utilidad para la estimación de la media poblacional,
entre otros usos.

Media armónica
La media armónica , denominada H, de una cantidad finita de números es igual al
recíproco, o inverso, de la media aritmética de los recíprocos de dichos valores

Así, dados los números a1,a2, ... , an, la media armónica será igual a:

La media armónica resulta poco influida por la existencia de determinados valores


mucho más grandes que el conjunto de los otros, siendo en cambio sensible a
valores mucho más pequeños que el conjunto.

14
La media armónica no está definida en el caso de la existencia en el conjunto de
valores nulos.

Propiedades

1. La inversa de la media armónica es la media aritmética de los inversos de


los valores de la variable.
2. Siempre se puede pasar de una media armónica a una media aritmética
transformando adecuadamente los datos.

Ventaja

 Considera todos los valores de la distribución y en ciertos casos, es más


representativa que la media aritmética.

Desventajas

 La influencia de los valores pequeños y


 El hecho que no se puede determinar en las distribuciones con algunos
valores iguales a cero; por eso no es aconsejable su empleo en
distribuciones donde existan valores muy pequeños.

Se suele utilizar para promediar velocidades, tiempos, rendimientos, etc.

Media geométrica

Construcción geométrica para hallar las medias aritmética, geométrica y armónica


de dos números a y b.

15
En matemáticas y estadística, la media geométrica de una cantidad arbitraria de
números (digamos n números) es la raíz n-ésima del producto de todos los
números.

Por ejemplo, la media geométrica de 2 y 18 es

Otro ejemplo, la media de 1, 3 y 9 sería

Propiedades

El logaritmo de la media geométrica es igual a la media aritmética de los


logaritmos de los valores de la variable.

Ventajas:

 considera todos los valores de la distribución y


 es menos sensible que la media aritmética a los valores extremos.

Desventajas:

 es de significado estadístico menos intuitivo que la media aritmética,


 su cálculo es más difícil y
 en ocasiones no queda determinada; por ejemplo, si un valor
entonces la media geométrica se anula.

Solo es relevante la media geométrica si todos los números son positivos. Como
hemos visto, si uno de ellos es 0, entonces el resultado es 0. Si hubiera un número
negativo (o una cantidad impar de ellos) entonces la media geométrica sería o
bien negativa, o bien inexistente en los números reales.

16
En muchas ocasiones se utiliza su trasformación en el manejo estadístico de
variables con distribución no normal.

La media geométrica es relevante cuando varias cantidades son multiplicadas


para producir un total.

[editar] Media geométrica ponderada

Al igual que en una media aritmética pueden introducirse pesos como valores
multiplicativos para cada uno de los valores con el fin de ponderar o hacer pesar
más en el resultado final ciertos valores, en la media geométrica pueden
introducirse pesos como exponentes:

Donde las son los «pesos».

En matemáticas, la media cuadrática, valor cuadrático medio o RMS (del inglés


root mean square) es una medida estadística de la magnitud de una cantidad
variable. Puede calcularse para una serie de valores discretos o para una función
de variable continua. El nombre deriva del hecho de que es la raíz cuadrada de la
media aritmética de los cuadrados de los valores.

A veces la variable toma valores positivos y negativos, como ocurre, por ejemplo,
en los errores de medida. En tal caso se puede estar interesado en obtener un
promedio que no recoja los efectos del signo. Este problema se resuelve,
mediante la denominada media cuadrática. Consiste en elevar al cuadrado todas
las observaciones (así los signos negativos desaparecen), en obtener después su
media aritmética y en extraer, finalmente, la raíz cuadrada de dicha media para
volver a la unidad de medida original.

Otras medias estadísticas son la media aritmética, la media ponderada, la media


generalizada, media armónica.

Definición

La media cuadrática para una colección de N valores {x1, x2, ... , xN} viene dada
por la fórmula (1):

17
Vef=2·Vmax/pi

Para una función de variable continua f(t) definida sobre el intervalo T1 ≤ t ≤ T2


viene dada por la expresión:

Aplicaciones

Valor eficaz de una corriente variable


Artículo principal: Valor eficaz

Generalmente, el valor eficaz es usado en física e ingeniería, aunque tiene otros


usos.

Media cuadrática de la velocidad de un gas


Artículo principal: Raíz de la velocidad cuadrática media

En física, la media cuadrática de la velocidad de un gas se define como la raíz


cuadrada de la media de la velocidad al cuadrado de las moléculas de un gas. La
velocidad RMS de un gas ideal es calculada usando la siguiente ecuación:

donde k representa la constante de Boltzmann (en este caso, 1.3806503*10-


23J/K)), T es la temperatura del gas en kelvins, y M es la masa del gas, medida en

kilogramos.

18
Mediana (estadística)
En el ámbito de la estadística, la mediana es el valor de la variable que deja el
mismo número de datos antes y después que él, una vez ordenados estos. De
acuerdo con esta definición el conjunto de datos menores o iguales que la
mediana representarán el 50% de los datos, y los que sean mayores que la
mediana representarán el otro 50% del total de datos de la muestra. La mediana
coincide con el percentil 50, con el segundo cuartil y con el quinto decil.

Contenido

 1 Cálculo
o 1.1 Datos sin agrupar
o 1.2 Datos agrupados
 2 Ejemplos para datos sin agrupar
o 2.1 Ejemplo 1: Cantidad (N) impar de datos
o 2.2 Ejemplo 2 : Cantidad (N) par de datos
 3 Ejemplo para datos agrupados
 4 Método de cálculo general
 5 Método proyectivo
 6 Véase también

Cálculo

Existen dos estrategias para calcular la mediana: considerando los datos en forma
individual, sin agruparlos, o bien utilizando los datos agrupados en intervalos de
clase. Veamos cada una de ellas.

Datos sin agrupar

Sean los datos de una muestra ordenada en orden creciente y


designando la mediana como Me, distinguimos dos casos:

a) Si n es impar, la mediana es el valor que ocupa la posición (n + 1) / 2 una vez


que los datos han sido ordenados (en orden creciente o decreciente), porque éste
es el valor central. Es decir: Me = x(n + 1) / 2.

Por ejemplo, si tenemos 5 datos, que ordenados son: x1 = 3, x2 = 6, x3 = 7, x4 = 8,


x5 = 9 => El valor central es el tercero: x(5 + 1) / 2 = x3 = 7. Este valor, que es la
mediana de ese conjunto de datos, deja dos datos por debajo (x1, x2) y otros dos
por encima de él (x4, x5).

19
b) Si n es par, la mediana es la media aritmética de las dos observaciones
centrales. Cuando n es par, los dos datos que están en el centro de la muestra
ocupan las posiciones n / 2 y n / 2 + 1. Es decir: Me = (xn / 2 + (xn / 2 + 1)) / 2.

Por ejemplo, si tenemos 6 datos, que ordenados son: x1 = 3, x2 = 6, x3 = 7, x4 = 8,


x5 = 9, x6 = 10 => Hay dos valores que están por debajo del y otros
dos que quedan por encima del siguiente dato . Por tanto, la
mediana de este grupo de datos es la media aritmética de estos dos datos:

Datos agrupados

Al tratar con datos agrupados, si coincide con el valor de una frecuencia


acumulada, el valor de la mediana coincidirá con la abscisa correspondiente. Si no
coincide con el valor de ninguna abcisa, se calcula a través de semejanza de
triángulos en el histograma o polígono de frecuencias acumuladas, utilizando la
siguiente equivalencia:

Dónde Ni y Ni − 1 son las frecuencias absolutas acumuladas tales que

, ai − 1 y ai son los extremos, inferior y superior, del intervalo


donde se alcanza la mediana y Me = ai − 1 es la abscisa a calcular, la moda. Se
observa que ai − ai − 1 es la amplitud de los intervalos seleccionados para el
diagrama.

Ejemplos para datos sin agrupar

Ejemplo 1: Cantidad (N) impar de datos xi fi Ni

1 2 2

2 2 4

20
Las calificaciones en la asignatura de Matemáticas de 39 alumnos 3 4 8
de una clase viene dada por la siguiente tabla:
4 5 13
Calificaciones 1 2 3 4 5 6 7 8 9
5 8 21 > 19.5
Número de alumnos 2 2 4 5 8 9 3 4 2
6 9 30
Primero se hallan las frecuencias absolutas acumuladas Ni. Así,
aplicando la formula asociada a la mediana para n impar, se 7 3 33
obtiene X(39 + 1) / 2 = X20.
8 4 37
 Ni-1< n/2 < Ni = N19 < 19.5 < N20
9 2 39
Por tanto la mediana será el valor de la variable que ocupe el
vigésimo lugar.En este ejemplo, 21 (frecuencia absoluta
acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos, la mitad de la clase ha
obtenido un 5 o menos, y la otra mitad un 5 o más.

[editar] Ejemplo 2 : Cantidad (N) par de datos

Las calificaciones en la asignatura de Matemáticas de 38 alumnos de una clase


viene dada por la siguiente tabla (debajo):

Calificaciones 1 2 3 4 5 6 7 8 9

Número de alumnos 2 2 4 5 6 9 4 4 2

xi fi Ni+w

1 2 2

2 2 4

3 4 8

4 5 13

5 6 19 = 19

6 9 28

21
Primero se hallan las frecuencias absolutas acumuladas Ni. Ni. Así, 7 4 32
aplicando la fórmula asociada a la mediana para n par, se obtiene
X(38 / 2) = X19.
8 4 36
 Ni-1< n/2 < Ni = N18 < 19 < N19
9 2 38
Con lo cual la mediana será la media aritmética de los valores de la
variable que ocupen el decimonoveno y el vigésimo lugar. En el
ejemplo el lugar decimonoveno lo ocupa el 5 y el vigésimo el 6 con lo que Me =
(5+6)/2 = 5,5 puntos, la mitad de la clase ha obtenido un 5,5 o menos y la otra
mitad un 5,5 o más.

Ejemplo para datos agrupados

Entre 1.70 y 1.80 hay 3 estudiantes.


Entre 1.60 y 1.70 hay 5 estudiantes.
Entre 1.50 y 1.60 hay 2 estudiantes.

Método de cálculo general

xi fi Ni

[x11-x12] f1 N1

. . .

. . .

. . N(i-2)

[x(i-1)1-x(i-1)2] f(i-1) f(i-1)-N(i-2)=N(i-1)

[xi1-xi2] fi fi-Ni-1=Ni

[x(i+1)1-x(i+1)2] f(i+1) f(i+1)-Ni=N(i+1)

. . .

. . .

22
. . .

[xM1-xM2] fM fM-N(M-1)=NM

Consideramos:

- x11 valor mínimo< Entonces:

Método proyectivo

Con base en el método proyectivo, se puede obtener la mediana para datos


agrupados de la siguiente forma:

1. Tomar el número total de frecuencias y dividirlo entre dos.


2. Restar a ese número el total de frecuencias de las clases anteriores a la clase
mediana.
3. Usar el número obtenido para hacer un cambio del doble superior de escala
entre las frecuencias de la clase mediana y sus rangos para obtener la distancia
parcial
4. Sumamos la distancia parcial obtenida a el límite inferior de la clase.

Usando el ejemplo anterior:

1. El número total de frecuencias es de; (3+5+2)/2 = 10/2 = 5


2. El total de frecuencias anteriores es 2; (5 - 2) = 3
3. Hacemos el cambio de escalas:

Resolviendo:

23
la mediana es la suma de todos los datos dividido
entre el número de datos

4. Se suma la distancia parcial al límite inferior:

Moda (estadística)
Para otros usos de este término, véase Moda (desambiguación).

En estadística, la moda es el valor con una mayor frecuencia en una distribución

de datos.

Hablaremos de una distribución bimodal de los datos cuando encontremos dos


modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Una
distribución trimodal de los datos es en la que encontramos tres modas. Si todas
las variables tienen la misma frecuencia diremos que no hay moda.

El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con


datos agrupados antes de definir la moda, se ha de definir el intervalo modal.

La moda, cuando los datos están agrupados, es un punto que divide al intervalo
modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que

verifiquen que:

Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los

intervalos anterior y posterior, respectivamente, al intervalo modal.

24
Moda de datos agrupados

Para obtener la moda en datos agrupados se usa la siguiente fórmula:

Donde:

Li − 1 = Límite inferior de la clase modal.


D1 = Frecuencia absoluta modal sobre la clase contigua inferior.
D2 = Frecuencia absoluta modal sobre la clase contigua superior.
i = intervalo.

Ejemplo

Encontrar la estatura modal de un grupo que se encuentra distribuido de la


siguiente forma:
Entre 1.70 y 1.80 hay 8 estudiantes.
Entre 1.60 y 1.70 hay 10 estudiantes.
Entre 1.50 y 1.60 hay 4 estudiantes.
Entre 1.45 y 1.55 hay 3 estudiantes.
Entre 1.30 y 1.35 hay 2,3 estudiantes.
Entre 1.20 y 1.25 hay 2 estudiantes
Entre 1.10 y 1.15 hay 1,5 estudiantes
Entre 1 y 1.10 hay 1 estudiante

Método proyectivo

Con base en el Método Proyectivo se obtiene la moda de la siguiente manera


usando el ejemplo anterior:
1.- Se Identifica la clase modal, que es la clase que tiene más frecuencias.
2.- Se identifica las diferencias con las clases vecinas.
3.- Se hace un cambio de escala

En el Ejemplo anterior:

25
1.- Clase con más frecuencias: 1.60 a 1.70 (con 10 frecuencias)
2.- Diferencias con las clases vecinas: 2 (clase superior) y 6 (clase inferior) que se
obtiene de restar (10-8) y (10-4)
3.-Cambio de escala:
Distancia parcial en la escala uno es a la distancia total de la misma escala como
el valor buscado es a la distancia total de la escala dos.

Resolviendo:

Se suma 0.075 (la distancia parcial) a 1.60 (el límite inferior), obteniéndose la
moda.

Propiedades

Sus principales propiedades son:

 Cálculo sencillo.
 Interpretación muy clara.
 Al depender sólo de las frecuencias, puede calcularse para variables
cualitativas. Es por ello el parámetro más utilizado cuando al resumir una
población no es posible realizar otros cálculos, por ejemplo, cuando se
enumeran en medios periodísticos las características más frecuentes de
determinado sector social. Esto se conoce informalmente como "retrato
robot".1

Inconvenientes
 Su valor es independiente de la mayor parte de los datos, lo que la hace
muy sensible a variaciones muestrales. Por otra parte, en variables
agrupadas en intervalos, su valor depende excesivamente del número de
intervalos y de su amplitud.
 Usa muy pocas observaciones, de tal modo que grandes variaciones en los
datos fuera de la moda, no afectan en modo alguno a su valor.
 No siempre se sitúa hacia el centro de la distribución.
 Puede haber más de una moda en el caso en que dos o más valores de la
variable presenten la misma frecuencia (distribuciones bimodales o
multimodales).

26
1. La frecuencias sirven para clasificar los datos de una manera más
ordenada.

2. Los intervalos son los limites que hay entre cada número.

3. Las medias de tendencia central son las medidas que se usan para
concentrarse los valores del centro.

4. La media armónica es el inverso de cada uno de los datos simples y


se representa por medio de la x barra.

5. La media geométrica se utiliza cuando se desea que resultado tengo


menos influencia con los extremos se representa por medio de x
barra g.

6. La mediana es el valor que se encuentra en el centro de los datos.

7. La moda es ek valor variable que más se repite o sea que tiene


mayor frecuencia.

27
WWW.WIKIPEDIA.COM.ORG

Contenido de la segunda fase de la Cátedra Estadística Comercial.

28

Vous aimerez peut-être aussi