Académique Documents
Professionnel Documents
Culture Documents
Las pruebas de bondad de ajuste tienen por objetivo determinar si los datos se ajustan a una determinada distribuci n, esta distribuci n puede estar completamente especificada (hiptesis simple) o o o o perteneciente a una clase param trica (hiptesis compuesta). e o
Test 2 Est n disenados para variables aleatorias discretas con un numero finito de valores, si a
esto no ocurriese los valores de la variable se agrupan en un numero finito de clases. 1. Hiptesis nula simple H0 : X F0 o Dada una muestra aleatoria simple de una variable aleatoria X que toma valores en las clases C1 , . . . , Ck ,sea Oi = no de individuos de la muestra en la clase Ci y sea pi = P (X Ci ). Con esta formulaci n lo que se contrasta es o H0 : pi = PF0 (X Ci ) = pi0 i
y se puede hacer por dos procedimientos: mediante el estad stico de la raz n de verosimio litudes o mediante el estad stico de Pearson. Ambos procedimientos se basan en la comparaci n de la frecuencia observada en cada clase o Oi con la frecuencia esperada bajo la hiptesis nula Ei = np0 = no de individuos esperados o i en la clase Ci , bajo H0 ; si esta fuese cierta no deber presentarse grandes discrepancias. an El test de la razn de verosimilitudes se basa en la verosimilitud de los datos agrupados o Q b es L(O1 , . . . , Ok , ) = h k pOi que alcanza su m ximo cuando pi = Oi /n y si la hiptesis p a o i=1 i ) = h Qk (p0 )Oi de nula fuese cierta la verosimilitud de los datos ser L(O1 , . . . , Ok , po a i=1 i Oi Qk p0 i donde el estad stico de la raz n de verosimilitudes es (O1, . . . , Ok ) = i=1 o ,y Oi /n se obtiene el siguiente estad stico G = 2 ln = 2
k X i=1
Oi ln
Oi Ei
que como se observa se basa en la comparaci n por cociente de las frecuencias observadas o y esperadas de cada clase. En base a este estad stico se define la regi n cr o tica RC = {G > c} y para determinar c se utiliza la distribuci n asint tica de G = 2 ln que es 2 1 , los grados de libertad o o k corresponden al numero de pi que es necesario estimar. La aplicaci n de este procedimiento requiere muestras de tamano grande para poder utilizar o la aproximaci n asint tica, es reconocido el criterio de que Ei 5 en al menos un 80% de o o las clases admitindose que en lo sumo un 20% de las clase se tenga 1.5 Ei 5. e El test de Pearson se basa en la comparaci n por diferencia e las frecuencias observadas o y esperadas de cada clase a partir del estad stico D=
k X (Oi Ei )2 Ei i=1
En base a este estad stico se define la regi n cr o tica RC = {D > c} y para determinar c se utiliza la distribuci n asint tica de D que es 2 1, al igual que en el caso anterior. o o k
Puede comprobarse que los dos estad sticos utilizados son asint ticamente equivalentes y o ambos utilizan el mismo criterio para la aproximaci n asint tica. o o 2. Hiptesis nula compuesta H0 : X F , Rq o En este caso para aplicar cualquiera de los dos procedimientos anteriores necesito la esb timaci n m ximo veros o a mil del par metro con los datos agrupados para luego calcular a bi = nPi ( ), se construyen entonces los estad b E sticos : G = 2 ln = 2
k X
Oi ln
i=1
Oi b Ei
D=
k X (Oi Ei )2 b b Ei i=1
cuya distribuci n asint tica, bajo condiciones de regularidad y si es cierto la hiptesis nula, o o o 2 es k1q . Como la estimaci n del par metro con los datos agrupados suele ser bastante complicado, o a puede utilizarse la estimaci n con los datos de la variable pero en este caso la distribuci n o o de los estad sticos anteriores se encuentra entre la de una 2 1q y una 2 1 . k k Para la aplicaci n de estos test se requieren las mismas condiciones asint ticas expuestas o o anteriormente.
F0 (x(i) ),
F0 (x(i) ) i1 n
i = 1, . . . , n)
La distribuci n de Dn es independiente de la distribuci n formulada en la hiptesis nula, ya o o o que la transformaci n de los estad o sticos ordenados de una variable continua por su funci n de o distribuci n da lugar a los estad o sticos ordenados de una U(0,1). En consecuencia Dn est tabulado para muestras de tamano pequeno y para muestras de tamano a grande se utiliza la aproximaci n asint tica o o X z 2 2 (1) i1 exp2i z Dn limn P r n = 1 i=1 La distribuci n de Dn sirve para buscar bandas de confianza para la funci n de distribuci n o o o te rica de una variable. o
Pruebas de normalidad
Comprueban la hiptesis compuesta H0 : o X N ormal
1. pruebas grficas basadas en los P-P plots y Q-Q plots a 2. Lillefors: Dn = supxR | Fn (x) F x,s (x) | es una modificaci n del test de Kolmogorov o Smirnov, como busca los par metros de la normal a partir de la muestra ya se est ajustando a a a la muestra por tanto este estad stico toma valores en general menores que el de K-S y posee unas tablas propias para este caso. Existen tablas especiales para el caso exponencial. 3. Shapiro-Wilks: W = R2 (X(i) , E(i) ) i = 1, . . . n con E(i) =Esperanza del estad stico ordenado de orden i de una m.a.s de tamano n de N(0,1). otras expresiones para este estad stico son: P 2 P 2 [n/2] (n) (n) n i=1 ani+1 (x(ni+1) x(i) ) i=1 ai (x(i) x) W = = ns2 ns2 donde los coeficientes a i = a ni+1 dependen del tamano de muestra y se buscan en las tablas de Shapiro-Wilks . la regi n cr o tica de este test es RC = {W < c}, donde el valor c se obtiene buscando el comportamiento de W en el caso de que la distribuci n de partida sea normal. o
(n) (n)
i(x(i) x)
Pn =
i=1 (i
n+1 )x(i) 2
P [n/2] =
i=1
se suele utilizar para n > 50 y tiene como regi n cr o tica RC = {D < c1 o D > c2 }, donde los l mites de la regi n cr o tica se encuentran tabulados bajo la hiptesis de normalidad.Para o tamanos de muestra muy grandes mayores de 250 se utiliza una aproximaci n asint tica o o del estad stico D a una normal.