Vous êtes sur la page 1sur 15

UNIVERSIDAD CENTRAL DEL ECUADOR

Facultad De Ingeniera ciencias Fsicas Y Matemtica


Carrera Ingeniera Informtica

Investigacin Aplicada y diseo De experimentos

Pruebas no-paramtricas

Integrantes:
Angel Calero
Jorge Flores
Lenin Villagrn

Pruebas no-paramtricas
La estadstica no paramtrica es una rama de la estadstica que
estudia las pruebas y modelos estadsticos cuya distribucin
subyacente no se ajusta a los llamados criterios paramtricos. Su
distribucin no puede ser definida a priori, pues son los datos
observados los que la determinan. La utilizacin de estos mtodos se
hace recomendable cuando no se puede asumir que los datos se
ajusten
a
una
distribucin
conocida,
cuando
el
nivel
de medida empleado no sea, como mnimo, de intervalo.
Una Muestra
Nominal
Nombre

Prueba
ChiCuadrad
o para
una
muestra

Ordinal
Nombre
Prueba de
Kolmogoro
v-Smirnov
para una
muestra

Descripcin
Analizar en el nmero de sujetos,
objetos o respuestas que se
clasifican en diferentes
categoras. (Se clasifican segn
las respuestas que de cada
sujeto).
Esta prueba nos indica si existe
o no relacin entre las variables,
pero no indica el grado o el tipo
de relacin: es decir, no indica el
porcentaje de influencia de una
variable sobre la otra o la
variable que causa la influencia.

Descripcin
Esta prueba de bondad de ajuste
contrasta si las observaciones
podran razonablemente
proceder de la distribucin
especificada.

Coman
do R

Chisq.tes
t()

Ejempl
o

Anexo1
:
Ejempl
o1

Comand
oR

Ejemp
lo

ks.test()

Anexo1
:
Ejempl
o2

Dos muestras
Relacionadas
Nominal
Nombre

Descripcin

La prueba de McNemar se utiliza


para decidir si puede o no
Prueba
aceptarse que determinado
de
''tratamiento'' induce un cambio
McNemar en la respuesta dicotmica o
para
dicotomizada de los elementos
cambios sometidos al mismo, y es
significan aplicable a los diseos del tipo
tes
''antes-despus'' en los que cada
elemento acta como su propio
control.

Interva
lo
Nombr
e

Prueba
de
Walsh

Descripcin
Utilidad: estimar si el tamao de la
diferencia entre pares de
puntuaciones es significativa. Es til
cuando se tienen menos de 15
puntuaciones. Con ms de 15 se
puede aplicar una prueba t
(paramtrica). Se usa si es posible
presuponer que los puntajes
diferentes de dos muestras
relacionadas provienen de
poblaciones simtricas. No se
requiere sin embargo, que vengan
de poblaciones normales ni de la
misma poblacin.

Coman
do R

Ejempl
o

mcnemar.te
st()

Anexo1
:
Ejempl
o3

Comando Ejemp
R
lo

Anexo1
:
Ejempl
o4

Independientes
Nomina
l
Nombr
e

Test
exacto
de
Fisher

prueba
chicuadra
do para
muestr
as
indepe
ndiente
s

Ordinal
Nombr
e
Prueba
de la
median
a

Descripcin

Coman
do R

Ejempl
o

El test exacto de Fisher aunque se


denomina test es ms bien un
mtodo de clculo de las
probabilidades de la 2 cuando el
tamao maestral es pequeo.
Hiptesis nula de que las variables no
estn relacionadas.

fisher.te
st()

Anexo1:
Ejemplo
5

Determinar la diferencia entre dos


muestras. Es una prueba sensible a
cualquier diferencia. Es til cuando se
tienen bastantes puntuaciones y las
observaciones estn representadas
en una tabla 2 x n. Las puntuaciones
son frecuencias en una tabla 2 x n (p.
ej., 2x3)

Chisq.te
st()

Anexo1:
Ejemplo
6

Descripcin
Mediante esta prueba se contrasta
la hiptesis nula de que k muestras
independientes de tamaos n1,
n2 ... nk proceden de la misma
poblacin o de poblaciones con
medianas iguales. Para este
contraste se requiere que la
variable sea medible por lo menos
en una escala ordinal y es
particularmente til cuando por
alguna razn (como, por ejemplo,
por haberse establecido puntos de

Comando
R

Ejemp
lo
Anexo
1:
Ejempl
o7

corte durante el proceso de


obtencin de los datos) se sabe
que las muestras no pueden
contener observaciones extremas.

La hiptesis nula del contraste es


que las dos muestras, de tamao
n1 y n2, respectivamente,
proceden de poblaciones continuas

Prueba
U de
MannWhitne
y

Prueba
de
Kolmog
orovSmirno
v para
dos
muestr
as

idnticas:
. La
hiptesis alternativa puede ser
unilateral o bilateral y nicamente
supone que la tendencia central de
una poblacin difiere de la otra,
pero no una diferencia de forma o
de dispersin. Por esta razn esta
prueba es el equivalente no
paramtrico de la prueba t para la
diferencia de dos medias cuando
las muestras son independientes
pero no puede suponerse la
normalidad de las poblaciones de
origen.
Esta prueba se utiliza para
contrastar la hiptesis nula de que
dos muestras independientes de
tamaos n1 y n2 proceden de la
misma poblacin. El contraste se
basa en las diferencias entre las
frecuencias relativas acumuladas
hasta los mismos puntos de corte
correspondientes a las dos
muestras. Si H0 es cierta es de
esperar que dichas diferencias
sean pequeas. Cuando la
hiptesis alternativa no es
direccional el contraste es sensible
a cualquier diferencia existente
entre las dos poblaciones, no slo

mcnemar.t
est()

Ks.test()

Anexo
1:
Ejempl
o8

Anexo
1:
Ejempl
o9

en cuanto a tendencia central, sino


tambin en cuanto a forma,
asimetra, etc.

K muestras
Relacionadas
Nomin
al
Nombr
e

Q de
Cochr
an

Ordinal
Nombr
e
Anlisi
s de
varianz
a de
Friedm
an de
dos
vas

Descripcin
Cuando sobre n elementos se
observa la serie de respuestas de
cada uno de ellos a k ''tratamientos''
esta prueba permite contrastar la
hiptesis nula de que no existe
diferencia significativa entre los k
''tratamientos''. Tambin es posible
utilizarla si cada tratamiento se
aplica a uno de los elementos de n
grupos de k elementos elegidos de
forma que los elementos de cada
grupo se asemejen lo ms posible
entre ellos.

Descripcin
La prueba de
Friedman (tambin conocida
como ANOVA de Friedman) es
la alternativa no paramtrica al
modelo ANOVA de un va con
medidas repetidas para
comparar ms de dos grupos
dependientes. Igual que en la
prueba de Kruskal-Wallis para

Comando
R

Ejem
plo

cochran.qte
st()

Anexo
1:
Ejemp
lo10

Comando
R
friedman.te
st()

Ejempl
o
Anexo1:
Ejemplo
11

saber qu grupos difieren (en el


caso de resultados significativos
del test) tambin se utilizan
pruebas post-hoc.

Independientes
Nominal
Nombre
Chicuadrado
para k
muestras
independi
entes

Ordinal
Nombr
e

Descripcin
La prueba 2 (pronunciada jicuadrado y a veces como chicuadrado) nos permite contrastar
si existe relacin entre dos
variables categricas mediante la
tabla de contingencia cuando
tenemos datos no pareados.

Descripcin

Este contraste permite decidir si


puede aceptarse la hiptesis de
Anlisi que k muestras independientes
s de
proceden de la misma poblacin o
varianz de poblaciones idnticas con la
a de
misma mediana. El nico supuesto
una va necesario es que las distribuciones
de
subyacentes de las variables sean
Kruskal continuas y que stas hayan sido
-Wallis medidas por lo menos en una
escala ordinal.

Coman
do R

Ejempl
o

chisq.te
st()

Anexo1:
Ejemplo
12

Comando
R

Ejempl
o

kruskal.te
st()

Anexo1:
Ejemplo
13

Comand
oR

Ejempl
o

Correlacin no paramtrica
Ordinal
Nombre

Descripcin

Correlac
in
de
rangos
de
Spearm
an

El coeficiente de correlacin de
Spearman permite identificar si
dos variables se relacionan en una
funcin
montona
(es
decir,
cuando un nmero aumenta, el
otro tambin o viceversa).

cor()

Anexo1:
Ejemplo
14

Anexo 1:
Ejemplos:
Ejemplo 1:
Suponemos que los compradores en los shoppings pertenecen a las
clases altas de la sociedad. Para eso tomamos una muestra de 50
casos, de manera aleatoria, a quienes indagamos sobre su
pertenencia social (para ello debemos tener un instrumento que nos
permita inferir a qu clase social pertenecen). Los resultados nos
arrojan lo siguiente:
Clase

Baja

MediaMedia
MediaAlta
Baja
Alta
Fo
8
9
10
11
12
http://www.geocities.ws/nievas_ies/psicoestadistica2/chi_cuadrado.pdf

Ejemplo 2:
El entrenador de salto de un grupo de atletas, desea conocer con
vistas al procesamiento de los datos por el obtenidos sobre salto de
una muestra aleatoria de atletas de esa especialidad en un CVD, si las
mediciones realizadas por l estn distribuidas normalmente. Los
datos son los siguientes:
Salto Largo
1 1.60
2 1.65
3 1 .55
4 1.62
5 1.64
6 1.70
7 1.71
8 1.68
9 1.66
10 1.67
11 1.65
12 1.68
13 1.69

14 1.70
Ho: Los datos estn distribuidos normalmente
H1: Los datos no estn distribuidos normalmente.
http://www.monografias.com/trabajos11/docima/docima.shtml#DOS
Ejemplo 3:
Un investigador en medicina preventiva observa que los empleados
en una fbrica padecen frecuentemente un cuadro diarreico, motivo
de gran ausencia. Todos los empleados comen en el comedor de la
fbrica como goce de una prestacin laboral. El investigador supone
que el comn denominador de la causa de la diarrea es el sitio de
ingestin de alimentos, es decir, existe una higiene inadecuada en la
preparacin de la comida; sin embargo, la higiene personal de los
empleados no es suficiente para atribuir toda la culpa al personal de
la cocina. Por lo tanto, elige una muestra al azar de 50 individuos, de
los cuales resulta que 34 de ellos presentan un cuadro diarreico
frecuente y 16 no lo padecen. As, sugiere que, bajo vigilancia, se
apliquen medidas de higiene personal, consistentes en exhaustivo
lavado de manos antes de ingerir alimentos, en un perodo de dos
semanas.
Al finalizar el tratamiento, obtiene los resultados siguientes: de los 34
sujetos con un cuadro diarreico frecuente, despus del tratamiento de
lavado de manos, 16 lograron hacer desaparecer el proceso intestinal
y 18 persistieron con evacuaciones diarreicas; a su vez, el grupo de
16 personas asintomticas, cuatro de ellas presentaron diarrea a
pesar del lavado de manos y 12 se mantuvieron en las mismas
condiciones.
Eleccin de la prueba estadstica. El modelo experimental tiene dos
muestras dependientes
Planteamiento de la hiptesis.

Hiptesis alterna (Ha). El lavado de manos, como medida


preventiva y factor de higiene personal, presenta cambios
significativos de enfermedad diarreica en los empleados que asisten
al comedor de la fbrica en estudio.

Hiptesis nula (Ho). Las diferencias que se observan en las


frecuencias de cambio por el lavado de manos se deben al azar.

Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha
y se rechaza Ho.

Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se
rechaza Ha.
Resultado de la contingencia 2 X 2.

Ejemplo 4:
Estimar si el tamao de la diferencia entre pares de puntuaciones es
significativa. Es til cuando se tienen menos de 15 puntuaciones. Con
ms de 15 se puede aplicar una prueba t (paramtrica)
Ejemplo 5:
Consideramos un ejemplo clasico de Fisher. Un colega suyo armaba
que era capaz de distinguir en una taza de te con leche, que se habia
echado primero, si la leche o el te. Para comprobarlo diseo un
experimento donde se probaban 8 tazas de te. De ellas, en 4 se habia
echado primero la leche, y en las otras 4, primero el te. Se trataba de
adivinar en que orden se habia echado la leche y el te. Las tazas se
resentaron de manera aleatoria, y se obtuvo:
Primer Servicio
Leche
te
Total

Leche
3
1
4

Prediccin
Te
1
3
4

Total
4
4

Ejemplo 6:
Suponemos que la ideologa poltica influye en la eleccin de los
medios de prensa que se leen. En razn de ello, suponemos que la
gente de derecha escoge La Prensa, que los de centro derecha leen
La Nacin, lo de centro leen Clarn, los de centro izquierda leen
Pgina/12 y los de izquierda Le Monde Diplomatique. Para ello
construimos un instrumento que nos permite establecer la ideologa,
y tomamos una muestra al azar, obteniendo el siguiente resultado.

http://www.geocities.ws/nievas_ies/psicoestadistica2/chi_cuadrado.pdf

Ejemplo 8:
La Tabla muestra el nmero de horas semanales que los estudiantes
afirman que dedican a estudiar las asignaturas de introduccin a la
economa financiera y a la contabilidad. Los datos proceden de
muestras aleatorias de 10 estudiantes de economa financiera y 12 de
contabilidad. Indican los datos la existencia de una diferencia en el
numero mediano de horas semanales que dedican los estudiantes a
estudiar las asignaturas de introduccin a la economa financiera y a
la contabilidad?
Economa
financiera
Contabilidad

1 6 8 1 1 13 1 9 5 11
0
0 2
1
1 1 1 1 1 9
1 1 1 8 9 7
3 7 4 2 0
5 6 1
Solucin: Nuestra hiptesis nula es que las posiciones centrales
(medianas) de las dos distribuciones poblacionales son idnticas. Ho:
Mediana (1) = Mediana (2) Los estudiantes dedican la misma cantidad
de tiempo a estudiar las asignaturas de economa financiera y de
contabilidad.
Ejemplo 9:
Supongamos que disponemos de dos muestras, ambas sobre el
intervalo [0,1]:
Muestra 1:
0,65
0,31
0,42
0,81
0,12
0,91

Muestra 2:
0,15
0,94
0,81
0,72
0,21
0,35

0,72
0,41
0,94
0,61
0,52
0,21
0,16
0,74
0,65
0,83
0,44
0,42
0,56
0,73

0,18
0,74
0,73
0,62
0,85
0,91
0,18
0,23
0,65

a partir de las cuales obtenemos las siguientes distribuciones


empricas sobre intervalos de longitud 0,20:

La mxima diferencia entre ambas funciones de distribucin se


produce en el segundo intervalo, y es de: 0, 20 - 0,40 = -0,20. El valor
crtico de las tablas del estadstico de Kolmogorov-Smirnov para estos
tamaos mustrales es de 13/30 = 0,433, por lo que no rechazamos
la hiptesis nula de igualdad de distribuciones de probabilidad.
https://www.ucm.es/data/cont/docs/518-2013-11-13-noparam.pdf
Ejemplo 10:
Imaginemos que deseamos averiguar si 4 preguntas de una prueba de
rendimiento poseen o no la misma dificultad.para ello, hacemos que una
muestra aleatoria de 10 sujetos responda a las 4 preguntas y registramos
las respuestas dadas. 1= ACIERTO,2=ERROR.
Resultados obtenidos
Sujetos
10

Pregunta 1
1.11000000

Pregunta 2
1.001000

Pregunta 3
1.0110000

Pregunta 4
1.0000000

Si consideramos la proporcin de aciertos de cada pregunta como un


iondicador de su grado de dificultad, podemos afirmar q las preguntas
difieren en dificultad, puesto que los diez sujetos responden las 4 preguntas.

1) Seleccionar las variables correspondientes a la pregunta 1,2,3,4 y


trasladarles a la lista de variables.
Tabla de frecuencias.

Prueba de cochran

N= Numero de casos validos


Q de Cochran= El estadstico de Cochran
Gl= Grados de libertad
Sig.asintot= Su nivel critico asinttico.
critico(0.09) es menor que (0.05)

Puesto

que

el

nivel

http://pendientedemigracion.ucm.es/info/socivmyt/paginas/D_departamento
/materiales/analisis_datosyMultivariable/19nparam_SPSS.pdf

Ejemplo 11:
Un psiclogo est interesado en comprobar si las puntuaciones en una
prueba de razonamiento
abstracto se modifican o se mantienen constantes entre los 7, 8 y 9 aos de
edad. Con este fin,
selecciona una muestra aleatoria de 10 nios y mide su razonamiento
abstracto cuando tienen
7 aos y vuelve a realizar el registro con estos nios cuando tienen 8 y 9
aos. Las puntuaciones obtenidas han sido las siguientes:

De acuerdo con estos


datos, qu se puede
concluir a un nivel de
significacin del 0,05?
http://www4.ujaen.es/~arortega/descargar/noparametricasSalumnos.pdf

Ejemplo 12:
En un estudio para determinar la preferencia por determinados
sabores de helados en diferentes regiones del pas, se recopilaron los
siguientes datos.

Determine si la preferencia por cierto sabor es independiente de la


regin (es la misma en cada regin), utilizando el nivel de
significacin 0,05.
http://www.monografias.com/trabajos97/prueba-hipotesis-chicuadrado-empleando-excel-y-winstats/prueba-hipotesis-chi-cuadradoempleando-excel-y-winstats.shtml
Ejemplo 13

Se tienen los siguientes datos experimentales, correspondientes a 22


individuos de los que se ha recogido informacin de dos variables:
una variable explicativa Exp nominal y otra variable respuesta Rta
cuantitativa. Los datos se presentan de forma que en las filas hay
varios individuos para facilitar la lectura:

Calcular la prueba de Kruskal-Wallis de comparacin de medianas


para los datos anteriores.
http://www.uclm.es/profesorado/mdsalvador/58109/teoria/anova_un_f
actor-lectura.pdf
Ejemplo 14
Un estudio de mercadeo televisivo se program la realizacin de un
determinado nmero de repeticiones de un spot referido al consumo y
las bondades de un tipo de bebida energizante. Luego de este perodo

de 30 das, se les pregunt a un grupo de televidentes que dijeran


cuntas veces vieron el spot y cuntas bebidas de ese tipo haban
consumido. Los datos de la misma se encuentran en la hoja
CxRSpearman01 del archivo Estad. No paramtrica. A un nivel de
significacin del 5% se puede afirmar que el spot televisivo no
influy en el consumo de la bebida?
N
1
2
3
4
5
6
7
8

Frec Spot
4
9
3
0
1
6
2
5

Nro bebidas
12
14
7
6
3
5
6
10

http://www.aulaclic.es/estadistica-excel/t_9_11.htm