Vous êtes sur la page 1sur 40

PRUEBAS DE BONDAD DE

AJUSTE
DOCENTE: Ing. Tepe Gastulo Carlos Manuel.

INTEGRANTES :
TORRES PEDRAZA HEGGEL SCOTTY
SECLEN PREZ JUAN
ZEA SEMPERTEGUI WALTER
ZAMORA TERNERO RONAL
ALARCON ORTIZ RUBEN
FUENTE QUEVEDO EDUARDO
RENATO MARTINEZ SARRIN
PRUEBAS DE BONDAD DE
AJUSTE.
DEFINICION

Son pruebas de hiptesis que se usan para evaluar si un conjunto de datos


es una muestra independiente de la distribucin elegida.

Consiste en comprobar grfica y estadsticamente, si la frecuencia


emprica de la serie analizada, se ajusta a una determinada funcin de
probabilidades terica seleccionada a priori, con los parmetros
estimados con base en los valores mustrales.
OBJETIVOS

Medir la certidumbre que se obtiene al hacer una hiptesis estadstica


sobre una poblacin.
Calificar el hecho de suponer que una variable aleatoria, se distribuya
segn una cierta funcin de probabilidades.
Ajuste grafico
TIPOS

Chi cuadrado( 2 )
Ajuste
Estadstico Smirnov
Kolmogorov
AJUSTE GRAFICO:

Puede realizar de las siguientes formas:


Comparar grficamente el histograma o funcin densidad emprica de la serie de
datos, con la funcin densidad terica y decidir visualmente, si hay o no ajuste de
acuerdo a la similitud o diferencia de ambos (figura 1)

Figura 1: Ajuste grfico con la funcin densidad


o Comparar grficamente la funcin acumulada de la serie de datos, con la
funcin acumulada terica seleccionada, dibujada en papel milimtrico
(figura 2), y decidir visualmente si hay o no ajuste.

Figura 2: Ajuste grfico con la funcin acumulada en


papel milimtrico.
o Se puede tambin comparar grficamente la funcin acumulada de la serie
de datos, con la funcin acumulada terica, ploteada en un papel
probabilstico adecuado (figura 3), donde la distribucin terica
seleccionada, se pueda representar como una lnea recta (Por lo general,
solo se puede representar por una lnea recta las distribuciones de 2
parmetros).

Figura 3: Ajuste grfico con la funcin acumulada en


papel especial.
CHI - CUADRADO.

Se basa en el clculo de frecuencias, tanto de valores observados, como


valores esperados, para un nmero determinado de intervalos. Esta prueba es
comnmente usada, para verificar la bondad de ajuste de la distribucin
emprica a una distribucin terica conocida, fue propuesta por Karl Pearson
en 1900.

La expresin general de la prueba Chi-cuadrado est dada por:


2
2 =

=1
Donde:

= =
=1 =1

2 = Valor calculado de Chi-cuadrado, a partir de los datos.


= Nmero de valores observados en el intervalo de clase i
= Numero de valores esperados en el intervalo de clase i
= Numero de intervalos de clase.
Asignando probabilidades a la ecuacin (1) es decir, asignando igual probabilidad de
ocurrencia a cada intervalo de clase, se tiene:


2
2 =

=1

Donde:
= Numero de observaciones que caen dentro de los lmites de clases
ajustadas del intervalo i.
= Tamao muestral.
= Probabilidad igual para todos los intervalos de clases.
1
= =
Simplificando la ecuacin (2), se obtiene la formula computacional
desarrollada por Markovic (1965).



2
= 2

=1

El valor de 2 obtenido por la ecuacin (4) se compara con el 2 de la tabla


A.8 del apndice cuyo valor se determina con:

Nivel de significacin : = 0.05 = 0.01


Grados de Libertad : . . = 1
CRITERIO DE DECISIN:

El criterio de decisin se fundamenta en la comparacin del valor calculado de Chi-


cuadrado con el valor tabular encontrado, esto es:

Si el Chi-cuadrado calculado es menor o igual que el valor tabular, es decir:


2 2
Entonces, se acepta la hiptesis que el ajuste es bueno al nivel de
significacin seleccionado.

Si el Chi-cuadrado calculado es mayor que el valor tabulado, es decir:


2 > 2
Entonces, el ajuste es malo y se rechaza la hiptesis, siendo necesario probar
con otra distribucin terica.
VENTAJAS Y LIMITACIONES:

1. Es aplicable solo para ajustes a la distribucin normal, puesto que ha sido


desarrollado con base en los datos normales e independientes.
2. Se realiza en la funcin densidad de datos agrupados en intervalos de
clases.
3. Requiere un conocimiento a priori, de la funcin de distribucin terica
utilizada en el ajuste.
4. En la prctica se usa para cualquier modelo de ajuste pero estrictamente
es vlido solo para la normal.
5. Es de fcil aplicacin.
EJERCICIO 1
Dada la serie histrica de caudales medios anuales en m3/s que corresponde a un registro de 38
aos:

121.3 26.7 110.1 63.4 122.4 64.2 59.6

144.9 92.8 95.6 76.3 162.1 110.2 40.3

142.4 58.8 48.8 52.3 97.2 144.7 112.2

205.8 57.4 148.3 36.3 52.5 109.2 137.1

114.5 79 67.5 88 165.6 48.5 32.9

72.5 76.9 70

Realizar la prueba de bondad de ajuste de Chi-Cuadrado para ver si se ajustan a una distribucion
normal.
Solucion:
1. La hipotesis ser:
Ho : frecuencia observada = frecuencia esperada
Ha : frecuencia observada frecuencia esperada

2. Ordenando los datos de menor a mayor, se tiene:

26.7 32.9 36.3 40.3 48.5 48.8 52.3


52.5 57.4 58.8 59.6 63.4 64.2 67.5
70 72.5 76.3 76.9 79 88 92.8
95.6 97.2 109.2 110.1 110.2 112.2 114.5
121.3 122.4 137.1 142.4 144.7 144.9 148.3
162.1 165.5 205.8
3. Calculo de la frecuencia
3.1. Calculo del numero de intervalos de clase, segn Yevjevich:
NC = 1+1.33ln(N)
NC = 1+1.33ln(38)
NC = 5.84 6

3.2. Calculo de la amplitud de cada intervalo:

35.82 36

18
3.3. Calculo de los intervalos de clase, marca de clase, frecuencia absoluta observada, frecuencia
relativa, los resultados se muestran en la tabla 1

Frecuenci
Marcas Frecuencia Frecuencia a
Intervalos de clase
de Clase absoluta Relativa Acumulad
a
(1) (2) (3) (4) (5)
8.7 44.7 26.7 4 0.1053 0.1053
44.7 80.7 62.7 15 0.3947 0.5
80.7 116.7 98.7 9 0.2368 0.7368
116.7 152.7 134.7 7 0.1842 0.9211
152.7 188.7 170.7 2 0.0526 0.9737
188.7 224.7 206.7 1 0.0263 1
3.4. Calculo de la media y desviacin estndar para datos agrupados, utilizando las columnas (2) y (3)

90.17

43.03
4. Calculo de la frecuencia esperada, utilizando la distribucin terica normal, los resultados se
muestran en la tabla 2

rea bajo
Frecuenci
Limite de la curva Frecuenci Frecuencia
Intervalo de Clase a
Clase normal de a Relativa Absoluta
Observada
0aZ
(1) (2) (3) (4) (5) (6) (7)
8.7 -1.89 0.4706 -
8.7 44.7 44.7 -1.057 0.3554 0.1152 4.38 5 4
44.7 80.7 80.7 -0.22 0.0871 0.2687 10.21 10 15
80.7 116.7 116.7 0.617 0.2324 0.3195 12.14 12 9
116.7 152.7 152.7 1.453 0.4265 0.1931 7.34 7 7
152.7 188.7 188.7 2.29 0.489 0.0625 2.38 3 2
188.7 224.7 224.7 3.126 0.4991 0.0101 0.38 1 1
5. Calculo de

Sustituyendo valores de las columnas (6) y (7) de la tabla 2, se tiene:

6. Calculo de
Grados de libertad:

Nivel de significacin

De la tabla A.8 del apndice, para y , se tiene


7. Criterio de Decision

Se acepta la hiptesis nula Ho

Los datos se ajustan a la distribucin normal, con un nivel de significacin del 5% 95% de
probabilidad.
PRUEBA DE SMIRNOV-KOLMOGOROV.

Mtodo por el cual se comprueba la bondad de ajuste de las distribuciones,


asimismo permite elegir la ms representativa, es decir la de mejor ajuste.
La prueba de ajuste de Smirnov-Kolmogorov, consiste en comparar las diferencias
existentes, entre la probabilidad emprica de los datos de la muestra y la
probabilidad terica, tomando el valor mximo del valor absoluto, de la diferencia
entre el valor observado y el valor de la recta terica del modelo, es decir:

= max

= Estadstico de Smirnov-Kolmogorov,
= Probabilidad de la distribucin terica.
() = Probabilidad experimental o emprica de los datos, denominada
tambin frecuencia acumulada.
El procedimiento para efectuar el ajuste, mediante el estadstico de Smirnov-
Kolmogorov, es el siguiente:

1 Calcular la probabilidad emprica o experimental de los datos, para esto


usar la frmula de Weibull.


=
+1

Donde:
= Probabilidad emprica o experimental
= Nmero de datos
= Nmero de datos
2 Calcular la probabilidad terica :
o Para el caso de utilizar el procedimiento de los modelos tericos, usar la
ecuacin de la funcin acumulada , o tablas elaboradas para tal fin.
o Si se quiere aplicar el procedimiento grfico, se utiliza un papel probabilstico
especial donde , puede representarse como una lnea recta, por lo cual, se
puede trazar con solo 2 puntos, pero si se quiere chequear que es una recta, se
puede plotear 3 puntos, por ejemplo para el caso de una distribucin normal, los
puntos:

Valor Probabilidad %

X 50
X+S 80.13
X-S 15.87

Representados en un papel de probabilidad normal, forman una recta.


3 Calcular las diferencias , para todos los valores de x.

4 Seleccionar la mxima diferencia:

= max

5 Calcular el valor crtico del estadstico , es decir 0 , para un = 0.05 y N


igual al nmero de datos. Los valores de 0 , se muestran en la tabla 3

6 Comparar el valor del estadstico , con el valor critico 0 de la tabla 3, con


los siguientes criterios de decisin deducidos de la ecuacin (6).

o Si < 0 El ajuste es bueno, al nivel de significacin seleccionado.


o < 0 El ajuste no es bueno, al nivel de significacin seleccionado,
siendo necesario probar con otra distribucin.
Nivel de Significacin
Tamao muestral N
0.20 0.15 0.10 0.05 0.01
1 0.900 0.925 0.950 0.975 0.995
2 0.684 0.726 0.776 0.842 0.292
3 0.565 0.597 0.642 0.708 0.282
4 0.494 0.525 0.564 0.624 0.733
5 0.446 0.474 0.510 0.565 0.669
6 0.410 0.436 0.470 0.521 0.618
7 0.381 0.405 0.438 0.486 0.577
8 0.358 0.381 0.411 0.457 0.543
9 0.339 0.360 0.388 0.432 0.514
10 0.322 0.342 0.366 0.410 0.490 Tabla 3 Valores crticos de 0 del
11 0.307 0.326 0.352 0.391 0.468 estadstico Smirnov-Kolmogorov , para
12 0.295 0.313 0.338 0.375 0.450 varios valores de N y niveles de
13 0.284 0.302 0.325 0.361 0.433 significacin .
14 0.274 0.292 0.314 0.349 0.418
15 0.266 0.283 0.304 0.338 0.404
16 0.258 0.274 0.295 0.328 0.392
17 0.250 0.266 0.286 0.318 0.381
18 0.244 0.259 0.278 0.309 0.371
19 0.237 0.252 0.272 0.301 0.363
20 0.231 0.246 0.264 0.294 0.356
25 0.210 0.220 0.240 0.270 0.320
30 0.190 0.20 0.220 0.240 0.290
35 0.180 0.19 0.210 0.230 0.270
1.07 1.14 1.22 1.36 1.63
N > 35

VENTAJAS Y LIMITACIONES:

1. No requiere un conocimiento a priori de la funcin de distribucin terica.


2. Es aplicable a distribuciones de datos no agrupados, es decir, no se requiere
hacer intervalos de clase.
3. Es aplicable a cualquier distribucin terica.
4. Se aplica en la funcin de distribucin acumulada y no en la funcin
densidad.
5. Comparndola con la prueba de Chi-cuadrado, no se requiere que la
frecuencia absoluta de cada clase, sea igual o mayor que 5.
6. No es una prueba exacta, sino una prueba aproximada.
EJERCICIO 2
Para los mismos datos del 1, realizar la prueba de bondad de ajuste Smirnov-Kolmogorov,
para si se ajustan a una distribucin normal, usando:

121.3 26.7 110.1 63.4 122.4 64.2 59.6


144.9 92.8 95.6 76.3 162.1 110.2 40.3
142.4 58.8 48.8 52.3 97.2 144.7 112.2
205.8 57.4 148.3 36.3 52.5 109.2 137.1
114.5 79 67.5 88 165.6 48.5 32.9
72.5 76.9 70

El clculo de los valores de F(x) para todos los valores de x (donde x representa el caudal).
Usando el procedimiento grfico.
Solucion
1. Calculo de P(x)
Ordenando los datos de caudales en forma creciente y calculando la probabilidad emprica P(x),
usando la frmula de Weibull:

2. Calculo de X y S, de los datos no agrupados.


Q=X P(X)
M 3 F(Z)
m /s m/n+1
(1) (2) (3) (4) (5) (6)
1 26.7 0.0256 -1.53 0.063 0.0374
2 32.9 0.0513 -1.39 0.0823 0.031
3 36.3 0.0769 -1.31 0.0951 0.0182
4 40.3 0.1026 -1.22 0.1112 0.0086
5 48.5 0.1282 -1.02 0.1539 0.0257
6 48.8 0.1538 -1.02 0.1539 0.0001
7 52.3 0.1795 -0.94 0.1736 0.0059
8 52.5 0.2051 -0.93 0.1762 0.0289
9 57.4 0.2308 -0.82 0.2061 0.0247
10 58.8 0.2564 -0.78 0.2177 0.0387
11 59.6 0.2821 -0.76 0.2236 0.0585
12 63.4 0.3077 -0.68 0.2483 0.0594
13 64.2 0.3333 -0.66 0.2546 0.0787
14 67.5 0.359 -0.58 0.281 0.078
15 70 0.3846 -0.52 0.3015 0.0831
16 72.5 0.4103 -0.46 0.3228 0.0875
17 76.3 0.4359 -0.37 0.3557 0.0802
18 76.9 0.4615 -0.36 0.3594 0.1021
19 79 0.4872 -0.31 0.3783 0.1089
20 88 0.5128 -0.1 0.4602 0.0526
21 92.8 0.5385 0.01 0.504 0.0345
22 95.6 0.5641 0.08 0.5319 0.0322
23 97.2 0.5897 0.11 0.5438 0.0459
24 109.2 0.6154 0.39 0.6517 0.0363
25 110.1 0.641 0.42 0.6628 0.0218
26 110.2 0.6667 0.42 0.6628 0.0039
27 112.2 0.6923 0.46 0.6772 0.0151
28 114.5 0.7179 0.52 0.6985 0.0194
29 121.3 0.7436 0.68 0.7517 0.0081
30 122.4 0.7692 0.7 0.758 0.0112
31 137.1 0.7949 1.05 0.8531 0.0582
32 142.4 0.8205 1.17 0.879 0.0585
33 144.7 0.8462 1.22 0.8888 0.0426
34 144.9 0.8718 1.23 0.8907 0.0189
35 148.3 0.8974 1.31 0.9049 0.0075
36 162.1 0.9231 1.63 0.9484 0.0253
37 165.5 0.9487 1.71 0.9564 0.0077
38 205.8 0.9744 2.65 0.996 0.0216
3. calculo de critico

4. Criterio de decisin

Se concluye que los datos de caudales se ajustan a la distribucin normal, con un nivel
de significacin del 5% o una probabilidad del 95%.
PROCEDIMIENTO GRAFICO

1. Grfico de P (x) y F (z) en papel de probabilidad normal.


1.1. Grfico de distribucin emprica P(x):
Plotear en un papel de probabilidad normal los valores de las columnas (2) y (3) de la tabla 4.
1.2. Grfico de la distribucin terica F(Z) = F(X):

Valor de caudal Probabilidad


(m3/s) % 92.32 50
= 92.32 50 135.12 84.13
= 135.12 84.13 49.52 15.87
= 49.52 15.87
Tabla A.1 rea de la distribucin normal
entre 0 y Z
Tabla A.2 Distribucin normal acumulada
Tabla A.8 Valores de x2 en funcin de la
proporcin del rea que queda a la
derecha de la ordenada levantada por
ellos.
GRACIAS