Académique Documents
Professionnel Documents
Culture Documents
73
La planeación y el diseño de proyectos relacionados con el agua necesitan
información de diferentes eventos hidrológicos que no son gobernados por
leyes físicas y químicas conocidas, sino por las leyes de azar. Por ejemplo, el
caudal de un río varía día a día y año tras año, y no puede predecirse
exactamente cual será su valor en un período de tiempo cualquiera. En el
caso del diseño de un puente, el estudio hidrológico determinaría la creciente
asociada con una probabilidad crítica(se busca determinar el caso crítico), la
cual se supone representa el riesgo para el puente. Esto solo puede
determinarse a través del análisis probabilístico y estadístico basado en los
registros hidrológicos del pasado.
Se dice que una variable aleatoria es discreta si ella sólo puede tomar valores
específicos. Por ejemplo, si N denota el número de días lluviosos en el mes
de diciembre, entonces N es una variable aleatoria discreta. En este caso, la
ley de probabilidades asocia medidas de probabilidad a cada posible
ocurrencia de la variable aleatoria.
74
puede asumir cualquier valor y es entonces una variable aleatoria continua
En este caso la ley de probabilidades asigna medidas de probabilidad a
rangos de ocurrencia de la variable aleatoria.
Por ejemplo supóngase que se tienen registros del caudal del río Magdalena
durante un período de 50 años. Son factibles dos tipos de análisis:
descriptivo y de inferencia. El primero se realiza sin ninguna referencia a su
población, de la cual se tiene una muestra de 50 años. Consiste, básicamente,
en calcular propiedades estadísticas, como media, varianza y otras. En el
segundo, la muestra se analiza para inferir las propiedades de su población,
lo cual ayudará a derivar las características probabilísticas del caudal. El
primero es una aplicación de los métodos estadísticos que requieren poca
75
decisión y poco riesgo. El segundo involucra riesgos y requiere una total
comprensión de los métodos empleados y el peligro involucrado en la
predicción y estimación de las variables.
m
P( X = x ) = (5.1)
n
76
1) La probabilidad de ocurrencia de un evento, Pi, siempre tiene un
valor entre 0 y 1, así:
0 ≤ Pi ≤ 1 (5.2)
.
La probabilidad de un evento cierto es 1:
∑P
i =1
i =1 (5.3)
P( X 1 ∪ X 2 ) = P ( X 1 ) + P( X 2 ) (5.4)
P( X 1 ∪ X 2 ) = P( X 1 ) + P ( X 2 ) − P( X 1 ∩ X 2 ) (5.5)
77
La probabilidad de que dos eventos independientes ocurran de manera
simultánea es el producto de las probabilidades individuales así:
P( X 1 ∩ X 2 ) = P( X 1 ) × P( X 2 ) (5.6)
X1 ∩ X 2
P( X 1 ) = P( ) (5.7)
X2 P( X 2 )
Ejemplo 5.1
Supóngase que el río Cauca alcanza cada invierno un nivel de creciente con
una frecuencia relativa de 0.2. En el Cauca hay un puente cuya probabilidad
de falla en los estribos es 0,3 y la experiencia muestra que cuando hay
creciente, las probabilidades de esta falla suben a 0,5. Las probabilidades
son:
P(creciente) = P(C) = 0,2
P(no creciente) = P(C) = 0,8
P(falla) = P(F) = 0,3
P(no falla) = P(F) = 0,7
P (falla dada creciente) = P(F/C)= 0,5
Se desea conocer la probabilidad de falla del puente.
Solución:
El puente falla (queda inutilizado) cuando falla en los estribos o cuando hay
creciente; esto se puede denotar así:
78
P( C ∪ F ) = P ( C ) + P ( F ) − P( C ∩ F )
P( C ∩ F ) = P ( C ) × P( F )
C
Reemplazando valores, se obtiene:
P( C ∩ F ) = 0. 2 × .0.5 = 0.1
Al reemplazar este valor en la expresión de unión de probabilidades, se
concluye finalmente que P(C∪F)=0.4
79
una situación de riesgo, pues la obra se diseña para soportar cierta avenida
máxima , y crecientes mayores le podrían hacer daño o incluso destruirla. El
riego R puede entonces escribirse como:
1
R = 1 - (1 - )n (5.9)
Tr
La confiabilidad se define como el complemento del riesgo (Confiabilidad =
1-R). Se quiere que la obra tenga un riesgo pequeño de dañarse o, lo que es
lo mismo, una alta confiabilidad.
Ejemplo 5.2
1 25
R = 0.1 = 1 - (1 - )
Tr
Reemplazando los valores de Tr y n se obtiene:
TR = 238 años
Ejemplo 5.3
Una presa por gravedad puede fallar por deslizamiento (A), por crecientes
(B), o por ambas. Asumir que :
1) La probabilidad de falla por deslizamiento es dos veces la probabilidad
de falla por creciente: P(A)=2 P(B)
80
2) La probabilidad de falla por deslizamiento, dado que ha habido creciente,
es 0.8
-3
3) La probabilidad de falla de la presa es de 1*10
Solución:
La presa queda inutilizada cuando se presenta una falla por deslizamiento o
cuando hay una creciente, lo que puede expresarse como:
P( A ∪ B ) = 0.001 = P( A ) + P( B ) − P( A ∩ B ) (1)
Se sabe que:
A A∩B
P( ) = 0.8 = P( ) (4)
B P( B )
81
Ejemplo 5.4
P(Pb ∩ F)
P( Pb / F ) =
P(F)
82
y P(Pb) = 5/1000. Reemplazando, se obtiene que:
P(PBI/F) = 2/17
c)Se pregunta en este numeral el valor de P(C); este valor establece la
probabilidad de que un circuito esté contaminado con plomo o con materias
fecales. Como hay 15 circuitos contaminados con materias fecales y 5
contaminados con plomo, se tiene entonces que:
P(C) = 20/1000= 0.002
d) La probabilidad de contaminación C se puede expresar como:
P( C) = P( F ∪ Pb ) − P( F ) + P( B ) − P( F ∩ Pb ) (1)
y se conoce el valor de la probabilidad condicional:
P( Pb / F ) = 2 / 17 = P( Pb ∩ F ) (2)
P( F )
Resolviendo la (1) y la (2) simultáneamente se halla que:
P(F) = 0.00567
83
X esté en el intervalo [a, b] .Si se conoce la probabilidad P(a<X<b) para
todos los posibles valores de a y b, se dice que se conoce la distribución de
probabilidades de la variable X.
Supóngase que se tiene una variable continua y el ancho ∆x del intervalo que
se usa para el histograma se escoge tan pequeño como sea posible;
supóngase igualmente que se tiene el suficiente número de observaciones en
cada intervalo, para que el histograma de frecuencia muestre variaciones
suaves en todo el rango de valores.
Si el número de observaciones ni en el intervalo i que cubre el rango [xi-∆x,
xi] se divide por el número total de observaciones, N, el resultado se
denomina función de frecuencia relativa fs (x):
84
ni
f s ( xi ) = (5.10)
n
la cual es un estimado de P( xi -∆x<X<xi), la probabilidad de que la variable
aleatoria X caiga en el intervalo [xi -∆x, xi]. El subíndice s indica que la
función es calculada de los datos muestrales.
FS ( xi ) = ∑ f S ( x j) (5.11)
j= 1
una muestra. Las funciones correspondientes a la población se obtienen en el
límite cuando n→ y ∆x →0. En el límite, la función de frecuencia relativa
dividida por el intervalo ∆x, se convierte en la función de densidad de
probabilidades fX(x)
(x)
f X (x) = lim f S (5.12)
n →∞
û[ → 0
û[
La función de frecuencia acumulada se convierte en la función acumulada de
distribución de probabilidades FX(x)
85
cuya derivada es la función de densidad de probabilidad:
dFX (x)
f X (x) = (5.14)
dx
P(X ≤ x) = FX (x) =
−∞
∫f X (u)du (5.15)
FX (xA ) = P (X ≤ x A ) (5.16)
Una forma bastante usada en hidrología para escribir el valor de una variable
hidrológica asociada a cierto período de retorno es la de utilizar lo que se
conoce como factor de frecuencia, K. En este caso, el valor de la variable se
puede escribir como:
X A = µ + Kσ (5.17)
86
Donde µ representa la media y K
es la desviación típica de la variable
hidrológica. XT es el valor de la variable aleatoria asociada a un ‘período de
retorno T. Como se sabe:
FX (XT ) = P (X ≤ XT )
= 1 - P (X > XT )
P(X XT ) representa la probabilidad de excedencia, la cual está relacionada
con el período de retorno como:
1
P( X ≥ X T ) = (5.18)
T
1
0.9
0.8
0.7
0.6
) [
0.5
;
0.4
0.3
0.2
0.1
0
1 2 3 4 5 6 7 8 9 10
x
De donde:
1
FX ( X T ) = 1 −
T
87
O:
1
FX ( µ + σK ) = 1 −
T
Y se obtiene finalmente:
1 −1 1
K= FX 1 − −
1 T
-1
FX ( ) representa el inverso de la distribución acumulada de probabilidades.
-1
Por ejemplo, para obtener FX (1 - 1/T), se entra al gráfico 5.2 con el valor
de 1-1/T al eje de probabilidades, y se lee en el otro eje el valor del inverso
de la distribución acumulada de probabilidades. Lo que significa que el factor
de frecuencia es función de la distribución de probabilidades y del período de
retorno que se escoja.
La función de densidad de probabilidades tiene las siguientes características
cuando la variable aleatoria es continua:
1)
∞
∫f X (x)dx = 1 (5.19)
-∞
2)
b
P(a ≤ X ≤ b) = ∫ f X (x)dx (5.20)
a
3)
b (5.21)
∫ f X (x)dx = 0
b
88
1)
(5.22)
∑ f ( xi ) = 1
i
2)
xi ≤b
P( a ≤ X ≤ b ) = ∑ f (x )
xi ≥a
i (5.23)
3)
i= j
P( X ≤ x j ) = ∑ f ( x i ) (5.24)
i =1
Lo que implica que las probabilidades se definen solo como áreas bajo la
función de densidad de probabilidades, FDP, entre límites finitos.
Ejemplo 5.5
Hallar la función de distribución acumulada para una variable aleatoria que se
define como el número de veces que se lanza una moneda, hasta que aparece
cara.
Solución:
La probabilidad de que caiga cara en cualquier ensayo es ½ y es
independiente de la probabilidad de que caiga sello.
Si A es el evento de que caiga sello en el primer ensayo y B (es el evento) de
que caiga sello en el segundo ensayo, la probabilidad que suceda A y B es:
89
2
P(AB) = P(A) + P(B) = (1/2)
1 ½ ½
2 ¼ ¾
3 1/8 7/8
90
o en el caso discreto:
n
µr′ = ∑ xri f X (x i ) (5.26)
i =1
µr = ∫ (x - µ ) f X (x)dx
r
(5.27)
-∞
n
µ r = ∑ f X ( x i )( x − µ )r (5.28)
i =1
Rara vez se necesita calcular más de tres momentos. Estos son usados para
estimar los parámetros y describir las características de la distribución.
91
En general, las características estadísticas básicas se calculan como el valor
esperado E de alguna función de una variable aleatoria. El valor esperado de
una función g(X) de una variable aleatoria X se define como:
E(X) = µ = ∫ xf
-∞
X (x)dx (5.30)
1 N
ˆ x = ∑ xi
N i =1
(5.31)
92
∞
E[(X - µ ) ] = σ 2 = ∫ (x - µ ) f X (x)dx
2 2
(5.32)
-∞
E[(X - µ ) ] = ∫ (x - µ ) f X (x)dx
3 3
(5.35)
-∞
93
FIGURA 5.3 Distribución de probabilidades con diferente desviación
estándar.
K ?
La asimetría se hace adimensional dividiendo la anterior ecuación por
3
y se obtiene así, el coeficiente de asimetría :
1
γ = E[(x - µ )3 ] (5.36)
σ
3
?
?
Como se muestra en la Figura 5..4, para >0, asimetría positiva, los datos
se concentran a la derecha y para <0, asimetría negativa, los datos se
concentran a la izquierda.
94
γ<0 γ>0
fX ( x )
x
µ
Ejemplo 5.6
Frecuencia
Intervalo en mm Absoluta
100-110 10
110-112 16
120-130 9
130-140 10
140-150 20
150-160 15
160-170 20
Solución:
En total se tiene 100 valores, para cada intervalo se halla el valor medio o
marca de clase y se le asigna una frecuencia relativa, la cual es la frecuencia
95
absoluta sobre el número total de valores (100). El valor medio de cada
intervalo es xi y la frecuencia relativa es fx(xi).
Σ=100 Σ=138.90
96
probabilidad permanece constante de ensayo a ensayo. Un ejemplo en
hidrología sería la probabilidad de que un día sea lluvioso o seco. La
distribuciones de este tipo más usadas en hidrología son la distribución
binomial y la geométrica.
n!
P( X = x ) = p x (1 − p )n − x (5.38)
x! (n − x )!
97
Ejemplo 5.7
98
5.5.2 Distribución Geométrica.
P = (1 − p)n−1 p (5.40)
1
µ=
P
(1 − P ) (5.41)
σ2 =
P2
Ejemplo 5.9
99
F(H)
5 6 7
H(m)
Solución:
66
a) El área bajo la función de densidad es 1, que equivale a P(5 H 7) =1.
Para un caudal con un Tr de 20 años se cumple que:
P( H ≥ H Tr=20 ) = 1 / 20 = 0.05
100
b) Se puede escribir la siguiente ecuación:
P(HTr=20 sea excedida al menos una vez) =1 - P(HTr=20 no sea excedida)
Aplicando la ecuación 5.38 (binomial ) se puede escribir entonces:
20
P(HTr=20 sea excedida al menos una vez) = 1 − (0.05) 0 (0.95) 20 = 0.642
0
O sea que P(HTr=20 sea excedida al menos una vez) = 0.642
5
P( H Tr = 20 = 1) = (0.05)1 (0.95) 0.4 = 0.024
1
Ejemplo 5.9
101
Solución:
102
4
P(no inundación en 4 años) =(0.821) =0.454
Ejemplo 5.10
103
central establece que para varias condiciones muy generales, la distribución
de la suma de un gran número de variables aleatorias puede aproximarse a la
Normal, sin importar a qué distribución pertenezcan ellas mismas. Muchos
procesos físicos pueden conceptualizarse como la suma de procesos
individuales. Por otra parte, muchos procesos de inferencia estadística se
basan en suposiciones de que la variable aleatoria se distribuye normalmente.
Es por ello que la Normal encuentre tantas aplicaciones en hidrología: en
pruebas de hipótesis, intervalos de confianza, etc.
( x −µ x )2
1 −
f X ( x) = e 2σ 2x
(5.42)
σ x 2π
E
K
Los parámetros de la distribución son dos: la media, x, y la desviación
estándar x. La asimetría de la distribución es cero. Esta distribución tiene
una forma de campana simétrica, como se muestra en la Figura 5.5, por lo
tanto la media, la moda y la mediana son iguales.
µ = (x − µ x ) / σ x
se obtiene como FDP y como función acumulada de la variable : E
1 -u2
fu (u) = e 2
2π
∞ (5.43)
1 2
Fu (u) =
2π ∫e
-∞
-w
2 dµ
104
FIGURA 5.5 Distribución normal.
105
106
5.6.1.1 Estimación de parámetros
1 N
µˆ = ∑ xi
N i =1
(5.44)
N
1
σˆ = = ∑ ( x i − µˆ )1 / 2 (5.45)
N
x - µ̂
K= (5.46)
σ
107
1
2. Usando el valor calculado de 1 − en la tabla 5.1, se lee el valor
T
de x en la primera columna, que corresponde a K o F E (1- 1/T)
-1
X T = µˆ + Kσˆ
Ejemplo 5.11
Se tiene una estación con 30 años de datos de caudales medios anuales con
3 3
media de 117 m /s y desviación estándar de 94 m /s. ¿Si los datos se ajustan
a una distribución Normal, cuál es el caudal correspondiente a un período de
retorno, Tr, de 100 años?.
Solución:
108
media, y si es pequeña, habrá, por el contrario, mucha confianza en ese valor
estimado. Con ese fin se utilizan los llamados intervalos de confianza.
E
E
Supóngase, por ejemplo, que se desea estimar la media de la población, .
E E E E E E E
Asúmase que 1 y 2 son dos estadísticos (funciones de la muestra aleatoria) tales
que: 1 < 2 y P( 1< < 2) = . Entonces [ 1 , 2] es llamado el intervalo
de confianza para la media µ.,
E E
es llamado el nivel de confianza (nivel de
probabilidad) y 1 y 2 son llamados los límites de confianza inferior y superior,
respectivamente. Esta definición puede extenderse al intervalo de estimación de
un parámetro cualquiera o a una función del parámetro.
Se debe tener en cuenta que los intervalos de confianza y los límites de confianza
son realmente variables aleatorias, ya que son funciones del tamaño de la
muestra y de estimadores a su vez, función de muestras aleatorias. Como los
tamaños de la muestra varían, los intervalos de confianza cambian de una
muestra a otra. Mientras más estrecho es el intervalo de confianza, mejor es el
procedimiento de estimación.
XT ± u1-α ST (5.47)
109
Cada distribución tiene expresiones para hallar el error estándar, por ejemplo, el
de la distribución Normal es:
σˆ x
(1 + K / 2 )2
1
2
ST = (5.48)
N
Ejemplo 5.12
3
Los caudales medios anuales de un río con media 1.5 m /s y desviación
3
estandar de 0.6 m /s se distribuyen normalmente. ¿Cuál es la probabilidad de
3
que se produzca un caudal medio igual o menor a 1 m /s, en cualquier año?.
Solución:
1 − µˆ
P( X ≤ 1) = P(µ ≤ )
σˆ
1 − 1.5
P(µ ≤ ) = P(µ ≤ −0.83)
0.6
110
FIGURA 5.6 Simetría de la distribución normal.
Ejemplo 5.13
Solución:
280 − 356
P ≤ 280) = P(µ ≤ ) = P(µ ≤ −0.997)
76.2
y:
111
contribuyente, pérdidas, coeficiente de evaporación, etc. En general, cuando
la variable aleatoria X es el producto de un gran número de otras variables
aleatorias, la distribución de los logaritmos de X puede aproximarse a la
Normal, ya que los logaritmos de X son la suma de los logaritmos de los
factores contribuyentes. Si se tiene una variable aleatoria X y ln X = Y se
ajusta a una distribución Normal, se dice que la variable aleatoria X es
lognormalmente distribuida.
f X (x) =
1
exp -
(
1 y - µy )
2
(5.49)
σ y x 2π 2 σ y
2
112
Se ha demostrado que la distribución lognormal puede aplicarse en un amplio
número de eventos hidrológicos, especialmente a aquellos casos en los cuales
la variable tiene un límite inferior, la distribución empírica no es simétrica y
los factores que causan los eventos son independientes y multiplicativos.
1
exp -
[
1 ln (X - xo ) - µ y ]
2
f X (x) = (5.50)
2π (X - xo )σ y 2 σy
E K
donde los parámetros y, y y xo son llamados los parámetros de escala,
forma y localización respectivamente.
1 N
µˆ Y = ∑ log a ( X i )
N i =1
(5.51)
12
1 N 2
σˆ Y = ∑ [log a ( X i ) − µˆ Y ] (5.52)
N i =1
113
K K E E
positivo. En este método, el segundo momento de Z = X - xo no depende de
x0, esto es, ²z = ²x y z = x - x0, entonces el límite inferior xo se puede
expresar como:
Cv x
x0 = µx 1 - (5.53)
Cv z
Donde:
σx
Cv x =
µx
(5.54)
σ
Cv z = z
µz
Donde:
(1- w ) 2/3
Cv z = 1/3
w
[ ) ];
(5.55)
1
(
w = - γˆ x + γˆ 2x + 4
2
1/2
γx > 0
1
σ 2
2
σ Y = log a 1 + X 2 (5.57)
µ X
114
En este caso, se estiman µX y σX con los datos originales, y con las
ecuaciones anteriores se estiman µY y σY los parámetros de la distribución
lognormal.
Ejemplo 5.14
E K
modelados con las siguientes distribuciones:
3 3
E K
a) Normal con parámetros = 256.7 m /s y = 191 m /s
b) Lognormal con parámetros y = 5.228 y y = 0.84
3
Calcular la probabilidad de que el caudal medio esté entre 300 y 400 m /s
Solución:
P(3006Q6400)= FX(400)-FX(300)
E
Si se usa la variable estandarizada , se tiene entonces que:
400 - x 300 − x
P(300UQU400)= F E − Fu
1x 1x
= Fu (u400) - Fu (u300)
donde:
115
P(300UQU400)=0.7734 - 0.5871=0.1863
P(300UQU400)=FY(ln(400))-FY(ln(300))
ln(400 ) − µ Y ln (300) − µ Y
= Fu − Fu
σY σY
y:
ln(300) = 5.704
ln(400) = 5.99
E yK E
K con las ecuaciones 5.56 y 5.57.
Este ejemplo se puede resolver también calculando Y Y a partir de x y
x
ln (XT ) = µ y + K σ y (5.58)
en donde K = Fu −1 1 −
1
T
116
Si se quiere trabajar con la variable no transformada al campo logarítmico se
tiene que:
1/2 ln (1 + Cv )
exp K T (ln (1 + Cv 2 )) -
2
- 1
2 (5.59)
K=
Cv
donde:
-1 1
K T = Fu 1 - (5.60)
Tr
−1 1
Fu 1 − es el inverso de la función de distribución Normal estandarizada
T
acumulada y Cv es el coeficiente de variación
en donde:
σY
ST = δ (5.62)
N
y
1/2
2
δ = 1 + K T (5.63)
2
117
Ejemplo 5.15
período de retorno de 30 años de registro, cuáles son los límites de confianza
para un de 10%?.
Solución:
1 1
Fu (K T ) = 1 - = 1- = 0.99
TI 100
De la tabla 5.1:
K T = Fµ−1 (0.99) = 2.33
1/2 ln (1 + 0. 33 )
exp 2.33 (ln (1 + 0. 332 )) -
2
- 1
2
K=
0.333
K= 3.028
El valor asociado a un período de retorno de 100 años será:
3
XT = 15 + 5 x 3.028 = 30.14 m /s
118
Los límites de confianza se hallan así en el campo transformado:
ln (XT ) ± u1-α 2 ST
Se calcula primero δ con la ecuación (5.63) y luego ST con la ecuación
(5.60), el resultado es:
1/2
2
δ = 1 + 2.33 = 1.93
2
0.3246
ST = 1.93 * = 0.11
30
Por lo tanto:
ln (30.28) ± 1.64 * 0.11
= 3.41 ± 0.1875
= [3.2225, 3.5975]
3.2225 3.5975
= [e ,e ] = [25.091, 36.5]
119
1 x -β x - β
f X (x) = exp - - exp - (5.64)
α α α
6
αˆ = σˆ (5.65)
π
βˆ = µ - 0.5772αˆ (5.66)
K=-
6
{0.577 + ln[lnTr - ln(Tr - 1)]} (5.67)
π
Los límites de confianza por el método de momentos para un nivel de
probabilidad son:
X T ± u 1- α 2 S T (5.68)
120
FIGURA 5.8 Distribución Gumbel
σ
ST = δ (5.69)
N
δ = [1 + 1.1396K + 1.1 K 2 ]
1/2
(5.70)
121
La distribución Gamma de dos parámetros tiene una función de densidad de
probabilidades de la forma:
β -1
1 x - αx
f X (x) = e (5.71)
| α | Γ (β ) α
Donde:
β -1
1 x - xo x - xo
f X (x) = exp - (5.73)
| α | Γ (β ) α α
U >0
Donde:
U <0
xo x < para
- < x xo para
122
La Figura 5.9 muestra formas de la función de densidad de probabilidades
Gamma para > 0.
µ = αβ (5.74)
σ 2 = α 2β (5.75)
123
µ , σ y C v son la media, desviación estándar y coeficiente de variación
calculados con la muestra, respectivamente.
Para la distribución Gamma con tres parámetros o Pearson tipo III, los
parámetros, por el método de momentos, pueden estimarse por:
2
2
βˆ = (5.77)
γˆ
γˆ
αˆ = σˆ (5.78)
2
X̂0 = µˆ − αˆ β
ˆ (5.79)
γ es el coeficiente de asimetría calculado usando la muestra.
Si se define:
1
K T = Fu 1 - (5.80)
Tr
el factor de frecuencia K tiene la siguiente forma:
2 3 4
γˆ 1 γˆ γˆ γˆ
K ≈ K T + (K t − 1) + (K T 3 − 6K T ) − (K T − 1) + K T
2 2
124
Para la distribución Pearson tipo III o Gamma de 3 parámetros, existen
tablas, como la 5.2, que dan el factor de frecuencia en función del coeficiente
de asimetría calculado con la muestra.
Si se tiene que:
X T ± u 1− α 2 S T
σ
ST = δ (5.82)
N
β -1
1 ln(x) - y o - ln (x)- y o
f x (x) = (5.83)
x α Γ (β ) α e α
125
TABLA 5.2. VALORES DE KT PARA LA DISTRIBUCIÓN
PEARSON III (ASIMETRÍA POSITIVA)
126
FIGURA 5.10 Distribución Log-Pearson Tipo III. (Salas, 1992).
127
YT = ln XT = µˆ y + K σˆ y (5.85)
128
σˆ y
ST = δ (5.86)
N
Los límite de confianza se pueden expresar como:
ln X T ± µ 1− α / 2S T (5.87)
California:
m
P= (5.88)
n
129
Weibull:
m
P= (5.89)
n +1
Hazen:
2m -1
P= (5.90)
2n
Ven te Chow propuso que toda muestra se puede ajustar a una expresión
como la siguiente:
X = µˆ + K σˆ (5.91)
130
131
132
5.8 BONDAD DE AJUSTE DE UNA DISTRIBUCION DE
PROBABILIDADES
Por ejemplo, las distribuciones Pearson tipo III y Log-Pearson tipo III
requieren la estimación del coeficiente de asimetría de datos muestrales. Esto
puede ser una razón suficiente para preferir cualquier otra distribución, ya
que este parámetro tiene un comportamiento muy sesgado, por lo cual se
necesitaría una gran cantidad de registros para tener un estimado más o
menos confiable, y dichos registros no se consiguen fácilmente en nuestro
medio. Por otra parte, las distribuciones de dos parámetros tienen un valor
fijo o ignoran la asimetría de la población, lo cual tampoco es conveniente.
133
5.8.1 Prueba Smirnov - Kolmogorov
Supongase que en una muestra se tengan una serie de posibles eventos E1,
E2, ....Ek que ocurren con frecuencias observadas de O1, O2, .....Ok. Si se
tiene una distribución teórica de probabilidades se espera que esos eventos
ocurran con frecuencias e1, e2,....ek
134
TABLA 5.4 VALORES DE Dn
50 0.15 0.17 0.19 0.23
N 50 1.07 1.22 1.36 1.63
N N N N
P
probabilidades). Una medida de la discrepancia entre frecuencias observadas
2
y calculadas está dada por el estadístico así:
k
(O − e ) 2
χ2 = ∑ i i (5.93)
i =1 ei
donde:
∑ Oi = ∑ ei
P 2
P
Si =0, significa que las distribucion teórica y empírica ajustan
2
P
exactamente, mientras que si 0, ellas difieren. La distribución de la
2
variable se puede asimilar a una distribución Chi-cuadrado con (k-n-1)
P
grados de libertad, donde k es el número de intervalos y n es el número de
2
parámetros de la distribución teórica. La función está tabulada en muchos
textos de estadística.Supóngase que la hipótesis Ho es aceptar que una
distribución empírica se ajusta a una distribución Normal. Si el valor
135
P 2
P 2
calculado de por la ecuación 5.89 es mayor que algún valor crítico de
,con niveles de significancia de 0.05 o 0.01 ( el nivel de confianza se define
como 1- , siendo frecuentemente utilizados niveles de confianza del 95%),
se puede decir que las frecuencias observadas difieren significativamente de
las frecuencias esperadas y entonces la hipótesis Ho se rechaza (para esos
niveles de significancia). Si ocurre lo contrario, entonces se acepta. Este
procedimiento es llamado la prueba de hipótesis Chi- cuadrado.
Ejemplo 5.16
Solución:
136
TABLA 5.5 Temperaturas en F
137
TABLA 5.6 Distribuciones de probabilidades empírica y
Normal para la temperatura.
Ejemplo 5.17
138
3
Año Q m /s
1978 3239.0
1979 3431.7
1980 4577.9
1981 3612.0
1982 4151.8
1983 1949.0
1984 2342.9
1985 1345.0
1986 1862.2
1987 1652.8
1988 4220.0
1989 4958.4
1990 2664.9
1991 1392.7
Solución
Distribución Gumbel
σˆ = 1234 .58 m /s
3
139
Aplicando la ecuación 5.68 y 5.69 para hallar el error estandar, ST se obtiene
que:
3
ST=1111.458 m /s
Para =0.05 se obtiene de la tabla 5.1 que T0.95=1.645 y aplicando la
ecuación 5.70 para los intervalos de confianza se obtiene finalmente que:
(4329.37 UQTr=50=6158U7986.07)
Distribución Log-Normal
ln QTr=50=8.8286
y sacando el antilogaritmo :
3
QTr=50=6827 m /s
(4814.4UQTr=50=6827U9679.84)
140
Se tiene que:
µˆ = 2957.2
σˆ = 1234.6
γˆ = 0.1702
K=2.144
Con la ecuación 5.82 y con la tabla 5.3 se obtiene un error estandar
ST=809.05 y los intervalos de confianza para =0.05 son entonces:
(4273UQTr=50=5604U6934.9)
141