Vous êtes sur la page 1sur 6

DISTRIBUCION DE FRECUENCIAS DE UNA MUESTRA

REPRESENTACION TABULAR Y GRAFICA DE LAS MUESTRAS En hidrologa se trabaja con informaciones hidrometeorolgicos; estas informaciones pueden consistir de datos de precipitacin, caudales, temperatura, evaporacin, etc. Por lo general, se cuenta solo con una muestra de datos de esa poblacin, es decir, nunca se puede disponer de la totalidad de los datos. Pero cuando estos datos se organizan en forma compacta y fcil de utilizar, los hidrlogos pueden disponer de una herramienta de gran utilidad, para las decisiones a tomar. Existen muchas formas de clasificar los datos, de una manera til, es dividirlo en categoras similares o clases, y luego contar el nmero de observaciones que caen en cada categora, lo que constituye una tabla de frecuencias o una distribucin de frecuencias. Para una muestra dada se escoge un rango R, que contenga a todos los valores de la misma. Se subdivide en R en subintervalos que se llaman intervalos de clase. Se dice que los valores de la muestra en cada uno de los intervalos forma una clase (figura 2.1) al numero de valores en una clase se llama frecuencia de la clase; su divisin entre el tamao N de la muestra es la frecuencia relativa de la clase. Esta frecuencia considerada como funcin de las marcas de clase, se denomina funcin de frecuencias de la muestra, y se denota como f(x). La funcin de frecuencias acumuladas de la muestra, se denota como F(x) y se define como:

PROCEDIMIENTO DE CLCULO A continuacin se indica un procedimiento practico, para el calculo de las frecuencias y frecuencias acumuladas, la misma que se usara mas adelante para el calculo de la distribucin de probabilidades empricas de datos agrupados en intervalos de clase: Procedimiento: 1. Ordenar la muestra en forma creciente o decreciente: Para agilizar los clculos resulta conveniente contar con una aplicacin que permita el ordenamiento de los datos. Por ejemplo, sise ordenan los datos en forma creciente, se tiene:

x m in , x 2 , x3 ,..., x m ax

(1)

Donde:

x m in x1 Es el valor mnimo de los datos


x m ax x N Es el valor mximo de los datos
2. Calcular el rango R de la muestra:

R x m ax x m in
3. Seleccionar el nmero de intervalos de clase NC:

(2)

NC depende del tamao de la muestra N. En aplicaciones de hidrologa el nmero de intervalo de clase puede estar entre 6 y 25. Yevjevich sugiere para seleccionar NC, las siguientes relaciones empricas. (a) (b) NC=1.33 1nN +1 si N<30 Si 30 < N <75 Si N > 75 Donde: (3)

NC < 5 8 NC 10 10 < NC 30

N = tamao de la muestra 1nN = logaritmo natural o neperiano del tamao muestral.

4. calcular la amplitud de cada intervalo de clase x, segn la ecuacin:

x=

x m ax x m in R NC 1 NC 1

(4)

Al dividir el rango entre NC 1, lo que en realidad se hace es incrementar el rango en x, incluyendo un intervalo mas, el mismo que resulta, de agregar medio intervalo (x/2), en cada extremo de la serie ordenada, a fin de que Xmin y X max sean respectivamente, las marcas de clase de la primera y ultima clase. 5. Calcular los lmites de clase de cada uno de los intervalos: Como se manifest en el punto 4, con el artificio de dividir entre NC-1, se logra que Xmin y X max queden centrados y representan las marcas de clase inferior y superior del primer intervalo de clase, son:

LCI1 xmin

X 2

(5)

LCS1 xmin

X LCI1 X 2

.(6)

Los otros lmites de clase, se obtienen sumando la amplitud x, al lmite de clase anterior. 6. Calcular las marcas de clase de cada uno de los intervalos: Las marcas de clase se obtienen del promedio de los lmites de clase. As la marca de clase del primes intervalo es: (7) Con el artificio realizado anteriormente la marca de clase del primer intervalo es igual al valor mnimo, de igual forma la marca de clase del ltimo intervalo es igual al valor mximo es decir: MC1= MCn =

X m in

X m ax

Las otras marcas de clase, se obtienen sumando la amplitud x, a las marcas de clase anteriores. 7. Calcular la frecuencia absoluta: esta es igual al numero de observaciones, que caen dentro de cada intervalo definido por sus limites de clases respectivos, la misma que se obtiene por conteo, as se obtiene:

fabi ni
Donde: f abi =frecuencia absoluta del intervalo i

(8)

n i =numero de observaciones en el intervalo i


8. Calcular la frecuencia respectiva Fri, de cada intervalo: Esta es igual a la frecuencia absoluta del mismo, dividido entre el nmero total de observaciones, es decir:

fabi ni fri N N

(9)

Donde:

fri =frecuencia relativa del intervalo i


n i = numero de observaciones en el intervalo i
N=numero total de observaciones

9. Calcular la frecuencia relativa acumulada Fri, usando la formula: Donde: = (10)

fri =frecuencia relativa del intervalo i


j =1,2,,i acumulacin de los intervalos hasta i

n i = numero de observaciones en el intervalo i


N=numero total de observaciones

10. Calcular la funcin densidad emprica Fi, para cada intervalo: Esta funcin segn Yevjevich, se calcula usando la formula: (11) Donde: funcin densidad emprica para el intervalo i

n i = numero de observaciones en el intervalo i


N=numero total de observaciones x = amplitud del intervalo de clase 11. Calcular la funcin de distribucin acumulada emprica usando la formula: Donde: (12)

= funcin densidad emprica para el intervalo j Funcin densidad emprica para el intervalo i x = amplitud del intervalo de clase

Los valores de Fri y Fi obtenidos con las ecuaciones (10) y (12) resultan similares.

REPRESENTACION GRAFICA Existen varias formas de representar las muestras en forma grafica, dentro de las cuales se pueden mencionar: HISTOGRAMA Un histograma es la representacin grafica de la frecuencia, en forma de rectngulos, siendo la base de cada rectngulo el intervalo de clase y la altura la frecuencia absoluta, fab la frecuencia relativa Fri. E n la figura (1) se muestra el histograma
0.45 0.4 0.35 frecuencia relativa 0.3 0.25 0.2 0.15 0.1 0.05 0 6 18 30 42 54 66 78 marca de clase

Figura 1 Histograma o distribucin de frecuencias relativas de los caudales

POLGONO DE FRECUENCIA Un polgono de frecuencia es la representacin grafica de las frecuencias, se obtiene uniendo con lneas rectas, los puntos formados por las marcas de clase vs. La frecuencia absoluta o relativa. Para que el polgono alcance al eje horizontal, a ambos lados de la distribucin, se le agrega un intervalo de clase con frecuencia igual a cero. En forma practica, un polgono de frecuencia se obtiene, uniendo con lneas rectas los puntos medios de todas las barras de un histograma.

FUNCION DENCIDAD EMPIRICA El histograma o el polgono de frecuencia, son dependientes del tamao del intervalo de clase y la posicin del lmite de clase. Para evitar esta dependencia el histograma o el polgono de frecuencia puede transformarse en una funcin densidad emprica, usando la ecuacin (11) propuesta por Yevjevich. En esta ecuacin el intervalo de clase tiende a cero, con lo que el nmero de intervalos tiende a infinito. El grafico es parecido al polgono de frecuencia, pero con la variante en la vertical, que se hace pequea y la unin de los puntos se hace mediante lneas curvas.

Este grafico de la funcin densidad, es muy til para comparar los resultados empricos, con la funcin densidad de probabilidad de distribuciones conocidas, como la normal, log-normal y otras. FUNCION DE DISTRIBUCION ACUMULADA O EMPIRICA Permite ver el porcentaje de las observaciones que quedan por encima o por debajo de ciertos valores, con respecto al total. El grafico se obtiene uniendo los puntos obtenido por las marcas de clase vs. La funcin acumulada

Vous aimerez peut-être aussi