Vous êtes sur la page 1sur 87

Lic.

Luz Mara Supo Zapata


Las pruebas de hiptesis realizadas en los captulos
anteriores respecto a los parmetros poblacionales
de medias, proporciones o varianzas son hechas
bajo supuestos a las poblaciones, tales como
supuestos de normalidad.
Lamentablemente no todas las poblaciones cumplen
con este supuesto, pero existen tcnicas
estadsticas tiles que no necesitan de supuestos de
las poblaciones conocidas como Pruebas No
Paramtricas o pruebas de distribucin libre.
1. Prueba de signos
2. Prueba Chi cuadrado
2.1 Prueba de Bondad de ajuste
2.2 Prueba de Independencia y homogeneidad
3. Prueba de Kruskal Wallis
4. Correlacin de Rangos de Spearman
5. Prueba de rachas
1. No requiere que hagamos la suposicin de
que las poblaciones distribuidas
normalmente.
2. Se aplican a datos categricos
3. Implican clculos ms sencillos, por lo tanto
son ms fciles de entender y aplicar
1. Desperdician informacin, ya que los
datos originales se reducen a una forma
cualitativa
2. A menudo no son tan eficientes como
las prueba paramtricas por lo tanto se
necesita evidencias ms fuertes
Se le llama prueba del signo porque la
informacin contenida en la muestra
seleccionada se puede transformar en un
conjunto de signos ms y menos, y cuando
se hace la prueba no se hace uso de la
magnitud de los valores de la muestra, sino
solamente se consideran los signos.
Se pueden probar estas aseveraciones:
1. Aseveraciones que incluyen datos apareados
de datos muestrales.
2. Aseveraciones que incluyen datos nominales.
3. Aseveraciones acerca de la mediana de una
sola poblacin.
1. Los datos muestrales se seleccionan
aleatoriamente
2. No existe el requisito de que los datos
muestrales provengan de una poblacin con
una distribucin particular, como la
distribucin normal
1. Para n25
x : el nmero de veces que ocurre el signo
menos frecuente
n: el nmero total, de signos positivos y
negativos combinados
Los valores crticos x se encuentran en la
Tabla A-7
1. Para n>25


x : el nmero de veces que ocurre el signo menos
frecuente
n: el nmero total, de signos positivos y negativos
combinados
Los valores crticos x se encuentran en la Tabla A-2
2
2
) 5 . 0 (
n
n
x
z
|
.
|

\
|
+
=
Procedimiento:
1. Restamos cada valor de la segunda variable del valor
correspondiente de la primera variable
2. Registramos slo el signo de la diferencia que se
encontr en el paso 1. Excluimos los empates
Si dos conjuntos de datos tienen medianas iguales, el
nmero de signos positivos debe ser
aproximadamente igual al nmero de signos
negativos
Los siguientes datos corresponden a temperaturas
mximas reales y el pronstico de temperaturas mximas
de tres das. Parece existir una diferencia?
Real Mxima 80 77 81 85 73 73 80 72 83 81 75 78 80 71 73 78 75 63
Pronstico 3
das mxima
79 86 79 83 80 76 80 79 76 79 78 75 74 73 73 76 76 73
Real Mxima 63 70 77 82 81 76 77 76 74 66 66 62 71 68 66 71 58
Pronstico 3
das mxima
75 68 77 83 78 75 77 72 74 74 68 72 72 73 66 68 62
Datos nominales: incluyen nombres, etiquetas o
categoras
Se aplican los signos ms o menos en forma arbitraria a
las categoras.
A continuacin se listan los pesos (en gramos) de
monedas de 25 centavos, acuadas despus de 1964,
seleccionadas al azar. Se supone que el peso de las
monedas tiene una mediana de 5.670 g. Utilice un nivel
de significancia de 0.05 para probar la aseveracin de
que la mediana es igual a 5.670 g. Al parecer, las
monedas estn acuadas segn las especificaciones?
5.7027 5.7495 5.7050 5.5941 5.7247 5.6114
5.6160 5.5999 5.7790 5.6841
Los signos positivos y negativos se basan en el valor que
se asevera para la mediana.
Las temperaturas corporales medidas a 106 adultos. para
probar. con la prueba de signos, la aseveracin de que la
mediana es menor que 98.6F. El conjunto de datos tiene
106 sujetos: 68 sujetos con temperaturas por debajo de
98.6F, 23 sujetos con temperaturas por encima de 98.6F
y 15 sujetos con temperaturas iguales a 98.6F
PARA DATOS APAREADOS
Utiliza rangos ordenados de datos muestrales
consistentes en datos apareados
Se usa para probar las diferencias en las
distribuciones poblacionales y para probar la
aseveracin de que una muestra proviene de una
poblacin con una mediana especfica.

H0: Los datos apareados .tienen diferencias que
provienen de una poblacin con una mediana
igual a cero
H1: Los datos apareados .tienen diferencias que
provienen de una poblacin con una mediana
diferente a cero.
1. Calcule d (restando el segundo valor menos
el primero), descarte d=0
2. Ignore los signos de las diferencias y ordene
las diferencias de la ms baja a la ms alta y
reemplace por el valor del rango
correspondiente.
3. Adjunte a cada rango el signo de la
diferencia de la que provino.
4. Calcule la suma de los valores absolutos de
los rangos negativos. Tambin de los rangos
positivos.
5. Utilice T que sea la ms pequea de las dos
sumas que se calcularon en el paso 4
6. Utilice n que sea el nmero de pares de datos
para los que la diferencia d no es cero
7. Determine el estadstico de prueba y los
valores crticos
8. Tome su decisin y conclusin apropiada
Si n30 el Estadstico de prueba es T
Donde T es el ms pequeo de las
siguientes sumas:
1. La suma de los valores absolutos de los
rangos negativos de las diferencias d que
no sean ceros.
2. La suma de los rangos positivos de las
diferencias d que no sean ceros

El valor crtico de T se encuentra en la tabla
A-8

Si n>30 usar el siguiente estadstico de
prueba


24
) 1 2 )( 1 (
4
) 1 (
+ +
+

=
n n n
n n
T
z
Los valores crticos de z se encuentran en la
tabla A-2


Remtase a los datos muestrales apareados
indicados y utilice la prueba de rangos con
signo de Wilcoxon para probar la aseveracin
de que los datos apareados tienen
diferencias que provienen de una poblacin
con una mediana igual a cero. Utilice un
nivel de significancia de 0.05.

EJ EMPLO 4 (CONTI NUACI N)
PARA DOS MUESTRAS INDEPENDIENTES
Utiliza rangos de datos muestrales consistentes
en muestras independientes
Se usa para probar la hiptesis nula de que las
dos muestras independientes provienen de
poblaciones con medianas iguales.
Es equivalente a la prueba de U de Mann-
Whitney

H
0
: Las dos muestras provienen de
poblaciones con medianas iguales

H
1
: Las dos muestras provienen de
poblaciones con medianas diferentes
1. Combine temporalmente las dos muestras
en una muestra grande y a cada valor
muestral reemplace su rango.
2. Calcule la suma de los rangos de las dos
muestras
3. Calcule el valor del estadstico de prueba z.
R
R
R
z
o

=
2
) 1 (
2 1 1
+ +
=
n n n
R

12
) 1 (
2 1 2 1
+ +
=
n n n n
R
o
Valores Crticos
Los valores crticos se encuentran en la tabla A-2
Prueba de hiptesis de la diferencia de la
antigedad de automviles y taxis. Cuando
el autor visit Dubln en Irlanda, registr la
antigedad de automviles y taxis
seleccionados al azar. A continuacin se
listan las antigedades (en aos). Utilice un
nivel de significancia de 0.05 para probar la
aseveracin de que existe una diferencia
entre la mediana de la antigedad de un
automvil de Dubln y la mediana de la
antigedad de un taxi de Dubln.
Podramos esperar que los taxis fueran ms
nuevos, pero, qu sugieren los resultados?
12
1 (
2
2 1 2 1
2 1
+ +

=
n n n n
n n
U
z
R
n n
n n U
+
+ =
2
) 1 (
1 1
2 1
Es equivalente a la prueba de la suma de rangos de
Wilcoxon para muestras independientes
Donde:
PRUEBA DE BONDAD DE AJUSTE
La prueba de bondad de ajuste se
utiliza para determinar si la distribucin
de los valores en la poblacin se ajusta
a una forma particular planteada como
hiptesis.
Por ejemplo una distribucin uniforme
H
0
: La poblacin sigue la distribucin ...

H
1
: La poblacin no sigue la distribucin ...

=
c
i
i
i i
E
E O
1
2
2
) (
_
En donde:
O
i
es la frecuencia de los eventos observados en los
datos muestrales
E
i
es la frecuencia de los eventos esperados si la
hiptesis nula es correcta.
x es el nmero de categoras o clases.
i i
np E =
El estadstico de prueba
se compara con el
valor crtico de la tabla _
2
con c 1 grados de
libertad con o grados de
significacin.
Si el valor de _
2
es mayor
que el valor crtico,
entonces rechazar la
hiptesis nula H
0

gl=k-1
X
2

F(x
2
)
RA
1-o

1-o
RR
o
Cuando c > 2, si ms del 20% de las E
i
son menores que 5, habr que combinar
las categoras adyacentes cuando sea
razonable hacerlo, reduciendo de este
modo el valor de c e incrementando los
valores de algunas de las E
i

El neumtico desinflado y la clase perdida.
Un cuento clsico se refiere a cuatro
estudiantes que van juntos en un automvil y
no llegan a un examen; como excusa. Dijeron
al profesor que un neumtico se desinfl en
el camino.
En el examen de recuperacin, el profesor
pidi a los estudiantes que identificaran el
neumtico en particular que se desinfl. Si
en realidad no tuvieron un neumtico
desinflado, seran capaces de identificar el
mismo neumtico?
El autor pidi a otros 41 estudiantes que
identificaran el neumtico que ellos
seleccionaran. Los resultados estn listados
en la siguiente tabla (excepto el de un
estudiante que seleccion el neumtico de
refaccin). Utilice un nivel de significancia
de 0.05
Utilice un nivel de significancia de 0.05 para
probar la aseveracin del autor de que los
resultados se ajustan a una distribucin
uniforme. Qu sugiere el resultado acerca
de la capacidad de los cuatro estudiantes de
seleccionar el mismo neumtico cuando en
realidad su excusa fue una mentira?
Neumtico
Frontal
izquierdo
Frontal
derecho
Trasero
izquierdo
Trasero
derecho
Nmero
seleccionado
11 15 8 6
Muertes por choques de automviles.
Se seleccionaron al azar muertes por
choques de automviles y los resultados
se incluyen en la siguiente tabla.
Utilice un nivel de significancia de 0.05
para probar la aseveracin de que las
muertes por choques de automviles
ocurren con la misma frecuencia en los
diferentes das de la semana

. Cmo se explicaran los resultados? Por
qu parece haber un nmero
excepcionalmente grande de muertes por
choques de automviles los sbados?
INDEPENDENCIA Y HOMOGENEIDAD
La Prueba Chi-cuadrado de independencia
tambin permite la comparacin de dos atributos
para determinar si existe una asociacin entre
ellos.
Cundo se utiliza?
Se utiliza cuando se quiere determinar si las
variables son independientes o dependientes
respectivamente una de la otra.
H
0
: Las variables (fila y columna) son
independientes.

H
1
: Las variables (fila y columna) son
dependientes.

=
i
i i
E
E O
2
2
) (
_
Donde:
O
i
: Frecuencia Observada de la i-sima fila con la
j-sima columna
E
i
: Frecuencia Esperada de la i-sima fila con la
j-sima columna
n
i
: frecuencia de la i-sima fila
nj : frecuencia de la j-sima columna
n : tamao de la muestra
n
n n
E
j i
i
=
El estadstico de
prueba se compara con
el valor crtico de la
tabla _
2
con (f - 1)(c - 1)
grados de libertad con
o grados de
significacin.
Si el valor de _2 es
mayor que el valor
crtico,
entonces rechazar la
hiptesis nula H
0

gl=(f-1)*(c-1)
X
2

F(x
2
)
RA
1-o

1-o
RR
o
Riesgos de trabajo. Utilice los datos en la tabla para
probar la aseveracin de que la ocupacin es
independiente de que la causa de muerte sea homicidio.
La tabla est basada en datos del Departamento del
Trabajo de Estados Unidos, Bureau of Labor Statistics.
Al parecer, una ocupacin en particular es ms
proclive a los homicidios? De ser as, cul es?
Se prueba la aseveracin de que las
poblaciones tienen las mismas
proporciones de algunos caractersticas.
H
0
: Las proporciones de las poblaciones
son iguales

H
1
: Las proporciones de las poblaciones
no son iguales

La exactitud del escner es la misma para
las ofertas? En un estudio de sistemas de
cobro por escner en almacenes, se
utilizaron muestras de compras para
comparar las lecturas por escner de los
precios con los precios etiquetados. La tabla
adjunta resume resultados de una muestra de
819 artculos.
Cuando los almacenes utilizan escner para
cobrar los artculos, las tasas de error son
las mismas para los artculos con precio
normal que para los artculos en oferta?
Cmo podra cambiar la conducta de los
consumidores si creen que ocurren
desproporcionadamente ms cobros
excesivos en los artculos en oferta?


Artculos con
precio normal
Artculos en
oferta
Cobros de menos 20 7
Cobros de ms 15 29
Precio correcto 384 364
PRUEBA H
Se utiliza para probar que muestras (tres
o ms poblaciones) independientes
provienen de poblaciones con medianas
iguales.
H
0
:Las muestras provienen de
poblaciones con medianas
iguales
H
1
: Las muestras provienen de
poblaciones con medianas que
no son iguales

+
+
= ) 1 ( 3
) 1 (
12
2
n
n
R
n n
H
i
i
Donde: H = valor estadstico de la prueba de
Kruskal-Wallis.
n = tamao total de la muestra.
R
i
2
= sumatoria de los rangos elevados al cuadrado.
n
i
= tamao de la muestra de cada grupo.
El estadstico de prueba
(H) se compara con el
valor crtico de la tabla _
2
con c-1 grados de
libertad con o grados de
significacin.
Si el valor de H es mayor
que el valor crtico,
entonces rechazar la
hiptesis nula H
0


gl=k-1
X
2

F(x
2
)
RA
1-o

1-o
RR
o
Debe aplicarse siempre que existan muchos empates:
divida H entre
N N
T

3
1
Para cada grupo de observaciones empatadas en el
conjunto combinado de datos mustrales, calcule
T = t
3
- t,
donde t es el nmero de observaciones que estn
empatadas en el grupo individual.
N es el nmero de observaciones en todas las muestras
combinadas
Calcule t para cada grupo de valores empatados, luego
calcule el valor de T para cada grupo, y despus sume
los valores T para obtener T. El nmero total de
observaciones en todas las muestras combinadas es N.
Utilice este procedimiento para calcular el valor
corregido de H para el ejercicio 1.
Afecta el peso de un automvil las
heridas en la cabeza producidas en un
choque? Se obtuvieron datos de
experimentos de choques realizados por
la National Transportation Safety
Administration. Se compraron
automviles nuevos, se impactaron
contra una barrera fija a 35 mi/h y se
registraron las mediciones en un
maniqu en el asiento del conductor.
Utilice los datos mustrales listados abajo
para probar las diferencias en las
mediciones de heridas en la cabeza (de
acuerdo con el Head Injury Criterion,
HIC) en cuatro categoras de peso. Existe
evidencia suficiente para concluir que las
mediciones de heridas en la cabeza para
las cuatro categoras de peso de
automviles no son las mismas?
Sugieren los datos que los automviles ms
pesados son ms seguros en un choque?

Subcompacto: 681 428 917 898 420
Compacto: 643 655 442 514 525
Mediano: 469 727 525 454 259
Grande: 384 656 602 687 360
Se utiliza para probar una asociacin
entre dos variables con datos apareados.
H
0
: = 0 ; No existe correlacin entre las dos
variables

H
1
: = 0 ; Si existe correlacin entre las dos
variables
) 1 (
6
1
2
2

=

n n
d
r
i
s
Donde :
d
i
: es la diferencia entre los puntajes de cada
observacin
n : Tamao de la muestra
Adems se debe cumplir que -1 sr
s
s 1
Sin empates
Empates
( ) ( )
2
2
2
2


=
y y n x x n
y x xy n
r
s
Para muestras pequas (n30), se hace uso de la
tabla A-9.
Si r
s
se encuentra en el intervalo de los valores
crticos de la tabla A-9 entonces se acepta H
0

Para muestras grandes (n>30) la distribucin
de r
s
se aproxima a la normal, donde el
estadstico de prueba es:
1 = n r z
s
Si el valor del estadstico de prueba es mayor
que el valor crtico de z al nivel de o/2
rechazar H
0

-z
z
RA
RR RR
Grillos y temperatura. Se estudi la
relacin entre la temperatura y el
nmero de veces que un grillo chirra
en un minuto. Abajo se listan los
nmeros de chirridos por minuto y las
temperaturas correspondientes en
grados Fahrenheit (segn datos de The
Song of Insects, de George W. Pierce,
Harvard University Press).
Existe evidencia suficiente para concluir
que existe una relacin entre el nmero de
chirridos por minuto y la temperatura?

Chirridos en un
minuto 882 1188 1104 864 1200 1032 960 900
Temperatura (en
o
F) 69,7 93,3 84,3 76,3 88,6 82,6 71,6 79,6
Utilizada para comprobar la
aleatoriedad de las muestras.
RACHA (G) : Una serie continua de uno
o ms smbolos
Ho : Existe aleatoriedad en la muestra.

H
1
: No existe aleatoriedad en la muestra.
Cuando n
1
como n
2
son menores o iguales
a 20
Usar la Tabla A-10
Si el valor de G no se encuentra entre los
valores crticos de las tablas entonces se
rechaza H
0

Cuando n
1
como n
2
son mayores que 20
La distribucin de la muestra se aproxima a la
normalidad. Entonces se puede decir que tiene:
1
2
2 1
2 1
+
+
=
n n
n n
G

( ) ) 1 (
) 2 ( 2
2 1
2
2 1
2 1 2 1 2 1
+ +

=
n n n n
n n n n n n
G
o
Media
Desviacin estndar
G
G
G
Z
o

=
Sigue una Distribucin Normal estandarizada
Si el valor de estadstico cae fuera de la
regin de aceptacin, H
0
se rechaza
Gneros de osos. Realice una prueba de
rachas para detectar aleatoriedad
utilizando los gneros de 20 osos. A
continuacin se listan los gneros.
M M M M H H M M H H M M H M H M M H M M

Vous aimerez peut-être aussi