Vous êtes sur la page 1sur 3

Pruebas de bondad de ajuste

Las pruebas de bondad de ajuste tienen por objetivo determinar si los datos se ajustan a una determinada distribuci n, esta distribuci n puede estar completamente especificada (hiptesis simple) o o o o perteneciente a una clase param trica (hiptesis compuesta). e o

Test 2 Est n disenados para variables aleatorias discretas con un numero finito de valores, si a
esto no ocurriese los valores de la variable se agrupan en un numero finito de clases. 1. Hiptesis nula simple H0 : X F0 o Dada una muestra aleatoria simple de una variable aleatoria X que toma valores en las clases C1 , . . . , Ck ,sea Oi = no de individuos de la muestra en la clase Ci y sea pi = P (X Ci ). Con esta formulaci n lo que se contrasta es o H0 : pi = PF0 (X Ci ) = pi0 i

y se puede hacer por dos procedimientos: mediante el estad stico de la raz n de verosimio litudes o mediante el estad stico de Pearson. Ambos procedimientos se basan en la comparaci n de la frecuencia observada en cada clase o Oi con la frecuencia esperada bajo la hiptesis nula Ei = np0 = no de individuos esperados o i en la clase Ci , bajo H0 ; si esta fuese cierta no deber presentarse grandes discrepancias. an El test de la razn de verosimilitudes se basa en la verosimilitud de los datos agrupados o Q b es L(O1 , . . . , Ok , ) = h k pOi que alcanza su m ximo cuando pi = Oi /n y si la hiptesis p a o i=1 i ) = h Qk (p0 )Oi de nula fuese cierta la verosimilitud de los datos ser L(O1 , . . . , Ok , po a i=1 i Oi Qk p0 i donde el estad stico de la raz n de verosimilitudes es (O1, . . . , Ok ) = i=1 o ,y Oi /n se obtiene el siguiente estad stico G = 2 ln = 2
k X i=1

Oi ln

Oi Ei

que como se observa se basa en la comparaci n por cociente de las frecuencias observadas o y esperadas de cada clase. En base a este estad stico se define la regi n cr o tica RC = {G > c} y para determinar c se utiliza la distribuci n asint tica de G = 2 ln que es 2 1 , los grados de libertad o o k corresponden al numero de pi que es necesario estimar. La aplicaci n de este procedimiento requiere muestras de tamano grande para poder utilizar o la aproximaci n asint tica, es reconocido el criterio de que Ei 5 en al menos un 80% de o o las clases admitindose que en lo sumo un 20% de las clase se tenga 1.5 Ei 5. e El test de Pearson se basa en la comparaci n por diferencia e las frecuencias observadas o y esperadas de cada clase a partir del estad stico D=
k X (Oi Ei )2 Ei i=1

En base a este estad stico se define la regi n cr o tica RC = {D > c} y para determinar c se utiliza la distribuci n asint tica de D que es 2 1, al igual que en el caso anterior. o o k

Puede comprobarse que los dos estad sticos utilizados son asint ticamente equivalentes y o ambos utilizan el mismo criterio para la aproximaci n asint tica. o o 2. Hiptesis nula compuesta H0 : X F , Rq o En este caso para aplicar cualquiera de los dos procedimientos anteriores necesito la esb timaci n m ximo veros o a mil del par metro con los datos agrupados para luego calcular a bi = nPi ( ), se construyen entonces los estad b E sticos : G = 2 ln = 2
k X

Oi ln
i=1

Oi b Ei

D=

k X (Oi Ei )2 b b Ei i=1

cuya distribuci n asint tica, bajo condiciones de regularidad y si es cierto la hiptesis nula, o o o 2 es k1q . Como la estimaci n del par metro con los datos agrupados suele ser bastante complicado, o a puede utilizarse la estimaci n con los datos de la variable pero en este caso la distribuci n o o de los estad sticos anteriores se encuentra entre la de una 2 1q y una 2 1 . k k Para la aplicaci n de estos test se requieren las mismas condiciones asint ticas expuestas o o anteriormente.

Test de Kolmogorov -Smirnov


Se basa en el concepto de la funci n de distribuci n emp o o rica y sus propiedades como aproximaci n de la funci n de distribuci n te rica. Dada una muestra a.s. de una variable aleatoria contio o o o nua (X1 , . . . Xn ) y una hiptesis simple sobre el comportamiento de esa variable H0 : X F0 o considera el estad stico Dn = supxR | Fn (x) F0 (x) | y rechaza la hiptesis nula cuando el valor de este estad o stico es alto. Para estudiar el comportamiento de Dn , que claramente toma valores en el intervalo (0,1) y que a medida que el tamano de muestra aumenta tiende a tomar valores ms pr ximos a cero (Teorema de Glivenko-Canteli),se a o utilizan los estad sticos
+ Dn = supxR (Fn (x) F0 (x))

Dn = supxR (F0 (x) Fn (x))


i n

que me permiten comprobar que Dn = max(

F0 (x(i) ),

F0 (x(i) ) i1 n

i = 1, . . . , n)

La distribuci n de Dn es independiente de la distribuci n formulada en la hiptesis nula, ya o o o que la transformaci n de los estad o sticos ordenados de una variable continua por su funci n de o distribuci n da lugar a los estad o sticos ordenados de una U(0,1). En consecuencia Dn est tabulado para muestras de tamano pequeno y para muestras de tamano a grande se utiliza la aproximaci n asint tica o o X z 2 2 (1) i1 exp2i z Dn limn P r n = 1 i=1 La distribuci n de Dn sirve para buscar bandas de confianza para la funci n de distribuci n o o o te rica de una variable. o

Pruebas de normalidad
Comprueban la hiptesis compuesta H0 : o X N ormal

1. pruebas grficas basadas en los P-P plots y Q-Q plots a 2. Lillefors: Dn = supxR | Fn (x) F x,s (x) | es una modificaci n del test de Kolmogorov o Smirnov, como busca los par metros de la normal a partir de la muestra ya se est ajustando a a a la muestra por tanto este estad stico toma valores en general menores que el de K-S y posee unas tablas propias para este caso. Existen tablas especiales para el caso exponencial. 3. Shapiro-Wilks: W = R2 (X(i) , E(i) ) i = 1, . . . n con E(i) =Esperanza del estad stico ordenado de orden i de una m.a.s de tamano n de N(0,1). otras expresiones para este estad stico son: P 2 P 2 [n/2] (n) (n) n i=1 ani+1 (x(ni+1) x(i) ) i=1 ai (x(i) x) W = = ns2 ns2 donde los coeficientes a i = a ni+1 dependen del tamano de muestra y se buscan en las tablas de Shapiro-Wilks . la regi n cr o tica de este test es RC = {W < c}, donde el valor c se obtiene buscando el comportamiento de W en el caso de que la distribuci n de partida sea normal. o
(n) (n)

4. Agostino:se basa en el estad stico Pn D=


i=1

i(x(i) x)

Pn =

i=1 (i

n+1 )x(i) 2

P [n/2] =
i=1

( n+1 i)(x(ni+1) x(i) ) 2 n2 s

se suele utilizar para n > 50 y tiene como regi n cr o tica RC = {D < c1 o D > c2 }, donde los l mites de la regi n cr o tica se encuentran tabulados bajo la hiptesis de normalidad.Para o tamanos de muestra muy grandes mayores de 250 se utiliza una aproximaci n asint tica o o del estad stico D a una normal.

Vous aimerez peut-être aussi