Académique Documents
Professionnel Documents
Culture Documents
Valor P bastante correcto incluso si la poblacin no es gaussiana Casi tanta Potencia como un test paramtrico para muestras grandes. Si la poblacin es Gaussiana, el valor P sera casi idntico al que se obtendra con un test paramtrico
Muestras pequeas
Tests Parametricos
No robustos. Si la poblacin no es Gaussiana el valor P puede ser errneo No son potentes para muestras pequeas Si la poblacin es Gaussiana el valor P ser mayor que el obtenido con un mtodo paramtrico. Con muestras muy pequeas puede obtenerse un resultado significativo independientemente de lo que difieran los valores No muy tiles. Poca potencia para discriminar entre poblaciones gaussianas y no gaussianas Las muestras pequeas simplemente no contienen suficiente informacin para hacer inferencia acerca de la forma de la poblacin
Tests No parametricos
Tests de Normalidad
tiles para determinar si los datos se han extrado de una poblacin gaussiana
Se dice que una prueba estadstica es robusta si se pueden violar sus supuestos sin que ello repercuta substancialmente en las conclusiones. La robustez es la habilidad de una prueba estadstica especfica para suministrar una estimacin exacta de la probabilidad de los errores tipo I y II, aun cuando sus suposiciones sean violadas. Algunas pruebas de hiptesis son ms robustas a desviaciones de ciertos supuestos subyacentes que otras. El tipo y magnitud de la desviacin de los datos de las condiciones requeridas por un test es a menudo importante en la seleccin apropiada del test estadstico que hay que aplicar. Las pruebas de hiptesis son usadas en muchas situaciones en las que las condiciones subyacentes son violadas. Por lo tanto la robustez es una propiedad deseable. Las hiptesis con las que se trabaja en los tests no paramtricos son menos detalladas y menos numerosas que en los tests paramtricos y los tests no paramtricos son menos sensibles a su violacin. Por eso los tests no paramtricos son ms robustos que los paramtricos. Adems estas violaciones son ms fciles de ver en los tests no paramtricos.. Para tamaos muestrales menores de 10, las violaciones en las hiptesis de los tests paramtricos son ms graves, por lo que los tests no paramtricos son los ms apropiados.
Contrastes no paramtricos
Contrastes de ajuste de una distribucin muestral a una distribucin terica. En particular, contrastes de Normalidad
Contrasta la posible independencia de distintas caractersticas observadas en la muestra, con independencia del tipo de distribucin que siga cada una de ellas
Idea bsica: Consiste en comparar las frecuencias observadas en la muestra para cada suceso relevante, con las que debera haberse obtenido en una poblacin que perteneciese a una distribucin de probabilidad especfica. Puede aplicarse tanto a distribuciones discretas como continuas. No obstante, previamente, debe establecerse una particin del espacio muestral en k sucesos mutuamente excluyentes
La prueba de K-S de una muestra es una prueba de bondad de ajuste. Se utiliza para contrastar si una variable se distribuye con una ley determinada (normal, exponencial)
Este contraste, que es vlido para variables continuas, compara la funcin de distribucin (probabilidad acumulada) terica con la observada. Es adecuado cuando los datos no estn agrupados y adems el tamao muestral es pequeo.
3. Calcular la discrepancia mxima entre las funciones de distribucin observada (o emprica) y terica con el estadstico:
h es n/2 si n es par y (n-1)/2 si n es impar aj,n estn tabulados x(j) es el valor ordenado en la muestra que ocupa el lugar j
1. Contrastes de aleatoriedad. Test de rachas 2. Contrastes de localizacin 2.1 Contraste del signo 2.1.1 Localizacin de una poblacin (mediana) 2.1.2 Diferencia de medianas para parejas de datos relacionados 2.2 Contraste del rango signado (Wilcoxon) 2.2.1 Localizacin de una poblacin (mediana) 2.2.2 Diferencia de medianas para parejas de datos relacionados 2.3 Contraste de Mann-Whitney (dos muestras independientes). 2.4 Contraste de Kruskal-Wallis (ms de dos muestras independientes)
Hay cinco rachas, de longitudes 2, 2, 1, 2 y 1, respectivamente. Tres son de signo negativo y dos de signo positivo.
El ms utilizado para contrastar hiptesis sobre la mediana (localizacin). Se puede adaptar para parejas de datos relacionados (igualdad de medianas). Supondremos que X es continua. La hiptesis a contrastar es: H0 : M = M0 Si esta hiptesis es cierta y xi es una observacin de la muestra (tamao n):
Si H0 es cierta, el valor de U (S Wi), debiera ser prximo a n/2. Discrepancias grandes, llevaran a rechazar dicha hiptesis nula.
para n 10. Por aproximacin de discreta a continua, suele utilizarse U+1/2, para RC izquierda, y U-1/2, para RC derecha.
Extensin del test del signo, para variables de escala superior a la ordinal. Adems del signo de (xi M0), considera la amplitud de la diferencia Puede aplicarse, tanto a una muestra como a datos apareados La poblacin se supone continua y simtrica
2. Se asigna un rango a cada observacin, aplicando el criterio que ya se vio para el test de Wilcoxon si hay valores repetidos. 3. Se calcula para cada muestra la suma de los rangos, que llamaremos R.j 4. Para muestras no muy pequeas (nj > 5) el estadstico muestral: