Vous êtes sur la page 1sur 8

/

Pruebas de hiptesis no paramtricas de Kolmogorov-Smirnov para una y dos muestras.


1. 2. . !. Introduccin Dcima de una muestra de Kolmogorov-Smirnov. Dcima de Kolmogorov-Smirnov para dos muestras independientes. "ibliogra#$a

I%&'(D)**I+% El uso de la Estadstica es de gran importancia en la investigacin cientfica. Casi todas las investigaciones aplicadas requieren algn tipo de anlisis estadstico para que sea posible evaluar sus resultados. En algunos casos, para resolver un problema de carcter emprico, es preciso llevar a cabo un anlisis bastante complejo; otras veces, basta con efectuar un anlisis muy simple y directo. a eleccin de uno u otro tipo de anlisis estadstico depende del problema que se plantee en el estudio as como de la naturale!a de los datos. "esde este punto de vista, la Estadstica constituye un instrumento de investigacin y no un producto #inal de esta ltima. El trabajo co#erente, las acciones integradas, la no e$trapolacin de elementos de un lugar a otro, el verdadero diagnstico de la realidad #an de ser prcticas permanentes en el accionar del investigador y el estadstico aplicado. "entro de la estadstica se aplican en la investigacin los tests o dcimas param%tricos y no param%tricos, el presente trabajo esta dedicado al estudio de dos pruebas no param%tricas que por su importancia merecen ser tratadas de forma independiente, ellas son las pruebas de &olmogorov'(mirnov para una y dos muestras. Entre los tests no param%tricos que comnmente se utili!an para verificar si una distribucin se ajusta o no a una distribucin esperada, en particular a la distribucin normal se encuentran el test de &olmogorov'(mirnov. El test de &olmogorov'(mirnov es bastante potente con muestras grandes. El nivel de medicin de la variable y su distribucin son elementos que intervienen en la seleccin del test que se utili!ar en el procesamiento posterior. "e #ec#o, si la variable es continua con distribucin normal, se podrn aplicar t%cnicas param%tricas. (i es una variable discreta o continua no normal, solo son aplicables t%cnicas no param%tricas pues aplicar las primeras arrojara resultados de dudosa valide!. Desarrollo D+*I,- D. )%- ,).S&'- D. K(/,(0('(1-S,I'%(1. Premisas a nica premisa que se necesita es que las mediciones se encuentren al menos en una escala de intervalo. (e necesita que la medicin considerada sea bsicamente continua. )dems dic#a prueba es aplicable cualquiera sea el tama*o de la muestra. Potencia-.#iciencia a prueba de una muestra de &'( puede en todos los casos en que se aplique ser ms poderosa que su prueba alternativa, la prueba de + , ji'cuadrado. *aracter$sticas de la dcima a prueba de &'( de una muestra es una dcima de bondad de ajuste. Esto es, se interesa en el grado de acuerdo entre la distribucin de un conjunto de valores de la muestra y alguna distribucin terica especfica. "etermina si ra!onablemente puede pensarse que las mediciones mu%strales provengan de una poblacin que tenga esa distribucin terica. En la prueba se compara la distribucin de frecuencia acumulativa de la distribucin terica con la distribucin de frecuencia acumulativa observada. (e determina el punto en el que estas dos distribuciones muestran la mayor divergencia. -iptesis -o. a distribucin observada se ajusta a la distribucin terica.

0,$1 2 0t,$1 para todo $. -/. a distribucin observada no se ajusta a la distribucin terica. 3ambi%n. 0,$1 0t,$1 para algn $ 0,$1. es funcin desconocida 0t,$1. es la funcin terica. Esta puede ser por ejemplo la funcin normal con cierta media y varian!as conocidas. .stad$gra#o y distribucin muestral D 2 m34ima Ft ( x ) S n ( x ) (n,$1. es la funcin de distribucin emprica. .5emplo El entrenador de salto de un grupo de atletas, desea conocer con vistas al procesamiento de los datos por el obtenidos sobre salto de una muestra aleatoria de atletas de esa especialidad en un C4", si las mediciones reali!adas por %l estn distribuidas normalmente. os datos son los siguientes. (alto5 argo / + 9 : 8 6 ; < = /7 // /+ /9 /: /.67 /.68 / .88 /.6+ /.6: /.;7 /.;/ /.6< /.66 /.6; /.68 /.6< /.6= /.;7 -o. os datos estn distribuidos normalmente - /. os datos no estn distribuidos normalmente.

Salidas de la dcima

*onclusiones. >o se rec#a!a a -o, por tanto la distribucin de los datos es normal.

9
3%cnicas adicionales a la dcima 3abla de frecuencias -istograma. .stad$gra#os 6ue deben acompa7ar a los estad$gra#os de la dcima /'3abla de frecuencias. &cnicas au4iliares para respaldar los resultados obtenidos en la conclusin. /'8istogramas.

:
Dcima de Kolmogorov-Smirnov para dos muestras independientes. .structura de la base de datos >ormalmente la estructura que tiene la base de datos es la de utili!ar una variable para entrar los resultados de la medicin y la otra donde se particione a estos resultados en los dos grupos. Premisas a nica premisa que se necesita es que las mediciones se encuentren al menos en una escala ordinal. )dicionalmente se necesita que la medicin considerada sea bsicamente continua. Potencia-.#iciencia Comparada ante la alternativa param%trica de la t de student para dos muestras independientes ,o el modelo de )nlisis de 4arian!a clasificacin simple para dos muestras1, cuando las premisas param%tricas se cumplen, tiene una potencia eficiencia de cerca del =6?, que tiende a decrecer ligeramente a medida que se aumentan los tama*os de muestra. E$isten autores que plantean/ @que la dcima de &olmogorov'(mirnov, para muestras muy peque*as es ms potente que la dcima de la A de Bann'C#itney, pero que para muestras de tama*o grande ocurre lo contrario. *aracter$sticas de la dcima a dcima de &olmogorov'(mirnov est construida, teniendo como base detectar las discrepancias e$istentes entre las frecuencias relativas acumuladas de las dos muestras objeto de estudio. o anterior propicia que esta dcima pueda advertir diferencias no tan solo entre los promedios, sino que %stas sean debidas a la dispersin, o la simetra o la oblicuidad. Esta caracterstica la #ace distintiva de aquellas en que solamente se ocupan de anali!ar las diferencias entre los promedios. a dcima admite que los tama*os de las muestras no sean iguales. 8iptesis as #iptesis de esta dcima, e$presadas en palabras son. -o. as distribuciones poblacionales son iguales. -/. as distribuciones poblacionales son distintas. )#ora bien se recomienda en general #acer el enunciado de las #iptesis de forma tal que indique en un mayor grado la caracterstica que va a ser docimada. .stad$gra#o y distribucin muestral. "esignemos por 3/ y por 3+ las tablas de distribucin de frecuencias relativas acumuladas, particionadas en D categoras. "onde el primer subndice corresponde al nmero de la muestra y el segundo al orden de la clase. &-"/-1 *lase 0recuencia relativa acumulada &-"/-2 0recuencia acumulada DI9.'.%*I-S relativa "iferencia de las 0recuencias 1 2 ... I ... p// p/+ ... p/i ... p+/ p++ ... p+i ... p//'p+/ p/+'p+/ ... p/i'p+i ...

(iegel (igmund. "ise*o e$perimental no param%trico falta..p. /68

8
: p/D p+D p/D'p+D

(e anali!a entonces en la columna de las diferencias de las frecuencias, en qu% clases se obtiene el valor m$imo. (e tendr entonces en smbolos.
D = max p1i p2i con i =1,2,.., k El estadgrafo de esta dcima se designa por E + y para tama*os de muestra suficientemente grandes, est distribuido segn c#i'cuadrado con dos grados los de libertad. En smbolos.

2 =

4 D 2 ( n1n2 ) n1 + n2

Foodman , #a demostrado que si los tama*os de muestra son peque*os la dcima se comporta conservadoramente. Salidas de la dcima as salidas usuales de la dcima son tres. B$ima diferencia negativa. "onde se muestra cul es la mayor diferencia negativa alcan!ada. B$ima diferencia positiva. "onde se muestra la mayor diferencia positiva alcan!ada. 4alor de la probabilidad para dos colas. Es necesario se*alar que las dos primeras opciones suministran informacin en los casos en que sea conveniente reali!ar una dcima unilateral, adems de reflejar informacin acerca de lo que est ocurriendo en la dcima. &cnicas adicionales a la dcima E$iste un grupo de t%cnicas adicionales a la dcima, las que #emos dividido en los siguientes grupos. .stad$gra#os 6ue deben acompa7ar a los estad$gra#os de la dcima . Entre ellos se encuentran. 3ama*os en cada una de las muestras ,casos vlidos en el anlisis1 Bedia aritm%tica de cada una de las muestras. "esviacin estndar de cada una de las muestras. 3%cnicas au$iliares para respaldar los resultados obtenidos en la conclusin "iagrama de caja y bigotes de cada una de las muestras. -istograma de cada una de las muestras. .5emplo (e muestran las p%rdidas en peso ,medidos en Dilogramos1, de dos grupos de personas que #an sido sometidas a dos tipos diferentes de medicamentos, designado por Frupo/ y Frupo+. os resultados obtenidos se muestran en la siguiente tabla. FGAHI/ ,n/2/71 FGAHI+ ,n+2/+ 8.:= 9.7< :./9 8.79 ; 6.79 9.;6 :.++ :./; 8.79 :.<8 +.7=

6
:.:8 8./9 :.+6 :.6+ :.:8 9.8< 9.<6 :./9 :.: +.</ Salida de la dcima a salida bsica de la dcima muestra los valores m$imos positivos, m$imos negativos y el valor de probabilidad, los que se muestran a continuacin. valor de probabilidad medicin perdida de peso m34ima negativa 7 di#erenciam34ima positiva 7.:66666; di#erencia

p J ./7

(egn podemos observar, no e$isten diferencias significativas entre los resultados de la medicin reali!ada a los dos grupos. .stad$gra#os 6ue deben acompa7ar a los estad$gra#os de la dcima. Gesulta conveniente incluir tambi%n, adems de los mencionados en la tabla anterior, el tama*o en cada una de las muestras, as como la media aritm%tica de cada una de ellas y su desviacin estndar. as que se muestran en la siguiente tabla. 3ama*os de muestra FGAHI / FGAHI + /7 /+ Bedia aritm%tica :.;9=77 9.=:8<9: "esviacin. Estndar .<+9866/ .<+9866/

&cnicas au4iliares para respaldar los resultados obtenidos en la conclusin as t%cnicas que #a continuacin se mencionan es conveniente su utili!acin. Diagramas de *a5a y "igotes. El siguiente diagrama muestra los resultados obtenidos tomando como promedio la mediana, el rango intercuartlico para la caja y el m$imo'mnimo para los bigotes.

;
"iagrama de Caja y Kigotes Herdida de Heso 6.8

8.8

Herdida de peso

:.8

9.8

+.8 Bin'Ba$ +8?';8? Bediana

/.8

/ FGAHI

En este diagrama observamos que.aunque en la segunda muestra #a e$istido una disminucin en el valor mediano, las diferencias no son significativas. Ibs%rvese que en la segunda muestra se #a producido una disminucin en la dispersin y los m$imos y mnimos #an sido reducidos. 8istogramas ) continuacin se muestran los #istogramas de las dos muestras. os que pueden proporcionar una mayor idea del proceso ocurrido.
-istogramas de las dos muestras Herdida de peso
6

>o de obs

/.8

+.7

+.8

9.7

9.8

:.7 FGAHI. /

:.8

8.7

8.8

6.7

6.8

/.8

+.7

+.8

9.7

9.8

:.7 FGAHI. +

:.8

8.7

8.8

6.7

6.8

"I"/I(0'-9;)lvare! de Layas, Carlos. ,/==81. Betodologa de la investigacin cientfica. (antiago de Cuba. Centro de Estudio (uperior @Banuel 0. FrauM.

<
Cerda Futierre!, -ugo. ,/==91. os elementos de la investigacin. NCmo reconocerlos, cmo dise*arlos y construirlosO. Puito. Edit. El Ku#o. Cols Kravo, Bara del Hilar. ,/==+1. Qnvestigacin educativa. (evilla. ibrera Canaima. Cu% Bu*i!, Ruan. ,/=<;1. Estadstica. Ciudad de la -abana. Empresa >acional de Hroduccin del Binisterio de Educacin (uperior. 0riedric#, Calter. ,/=6<1. B%todos de la investigacin social. a -abana. Editorial Ciencias (ociales. Farca, B.. ,/==9./6'/<1. 3est para la evaluacin de #abilidades visuales en deportistas. Koletn de Qnformacin y "ocumentacin A>Q(HIG3 ,)ndaluca1 +/,/1. Frau )valos, Gicardo. ,/==:1. Estadstica aplicada utili!ando paquetes de softSare. Centro de "ocumentacin e Qnvestigacin, 0acultad de Batemtica, 0sica y Computacin. Aniversidad Central de as 4illas. 4illa Clara, Cuba. Fuerra Kustillo, Caridad C.. ,/=<;1. Estadstica. Ciudad de y Educacin. a -abana. Editorial Hueblo

&arpman, A. ..,/=<<1. as pruebas en medicina deportiva. Bosc. Editorial 0is. Besa )noceto, Bagda. ,/==<1. "eterminacin de la valide! predictiva de los tests en el deporte. En Bemorias del QQ (imposio Qnternacional de Educacin 0sica y "eporte Escolar. Cienfuegos, Cuba. >orat (oto, 3eresa.,/==/.</'<61. Estadstica aplicada al deporte. las pruebas de comparacin mltiple. En revista cubana de Bedicina del "eporte y la Cultura 0sica. +,+1. abril',junio.. (iegel, (idney. ,/=<61. Estadstica no param%trica aplicada a las Ciencias de la Conducta. B%$ico, ".0., Editorial 3rillas.