Académique Documents
Professionnel Documents
Culture Documents
Usa el estadístico U de Mann-Whitney para poner a prueba la por 25 cigarrillos de la marca A y 25 cigarrillos de la marca B.
hipótesis de que la producción promedio es diferente para los La suma de rangos para la marca A es igual a 688 y la suma
dos estados. Usa a = 0.05. de rangos para la marca B es igual a 587. Usa el estadístico
U de Mann-Whitney para poner a prueba la hipótesis nula de
14.33 [EX Ì 4-33] Los resultados del examen de Rendimien
que el contenido promedio de nicotina es el mismo para las
to del Estado de Ohio para Toledo, Ohio, para estudiantes de
dos marcas, frente a la alternativa de que difiere el contenido
cuarto grado, fueron los más altos registrados desde el inicio
promedio de nicotina. Usa a = 0.01.
de la valoración del rendimiento en todo el estado. Aunque los
resultados fueron una mejoría en todo el distrito, en algunas 14.35 [EX 14-35] Como parte de un estudio para determinar
materias no hubo tanta mejoría como para otras. Los resulta si la siembra de nubes aumenta la lluvia, se sembraron al azar
dos que siguen muestran la cantidad de cambio para lectura nubes con nitrato de plata y otras no se sembraron. Las canti
y escritura. Los cambios en las calificaciones se indican con dades de lluvia que siguieron se mencionan aquí.
positivo para mejoría, negativo para calificaciones más bajas y
cero para no cambio. Sin sembrar 4.9 41,1 21.7 372.4 26.3 17.3 36.6 26.1
47.3 95.0 '147.8 321.2 11.5 68.5 29.0 24.4
1202.6 87.0 28.6 830.1 81.2 4.9 163.0 345.5
Escritura 2 0 3 30 10 25 7 17 2 244.3
6 15 -9 -2 ó 13 _c -5 10
24 ó 29 -4 27 16 1 -4 -8 Sembrada 129.6 334.1 274.7 198.6 4 3 0.0 274.7 31.4 1 15.3
-6 13 8 5 -2 3 3 14 -1 7 1656.0 1 18.3 489.1 302.8 255.0 32.7 119.0 17.5
ló -1 2 10 42 -2 4 8 38 24 242.5 2745.6 7.7 40 .6 97 8.0 200.7 703.4 92.4
1697.8
Lectura ' 23 25 2 ó 40 3 3 32 -2
8 28 -1 8 5 34 -ó 7 6
34 6 19 27 23 6 46 23 35 ¿Estos datos muestran que el sembrado de nubes aumenta sig
-4 10 11 31 -1 3 10 20 10 -1 0 nificativamente la cantidad promedio de lluvia? Usa a = 0.05.
-5 17 22 20 19 11 13 3 21
14.36 [EX 14-36] ¿Se emplean más horas para ver eventos
Con la siguiente salida Excel, pon a prueba la afirmación de deportivos en televisión o reality shows? Un estudiante de
que hay igual mejoría en resultados de escritura en cuarto gra universidad comunitaria supone hipotéticamente que es más
do como en lectura. Usa a = 0.05. (Nota: la prueba de suma probable que los hombres vean deportes mientras las mujeres
de rangos de Wilcoxon es equivalente a la prueba U de Mann- ven los reality shows. Con esta premisa, recopila datos al azar
Whitney.) de 30 hombres y 30 mujeres en esta universidad comunitaria
acerca de las horas de televisión que se miran en una semana.
Prueba de suma de rangos de Wilcoxon
Suma de rangos Observaciones Hombres que miran deportes (hrs)
Escritura 1798.5 45 4 10 15 26 10 20 13 4 5 3 1 20 60 35 3
Lectura 2296.5 45 6 10 26 3 0 15 5 8 8 ó 14 15 3 2 4
z Stat -2 .0 0 9 4
Mujeres que miran reality TV (hrs)
P[Z < z) dos colas 0.0 444
z Crítico dos colas 1.96 2.0 10.0 5.0 8.0 10.0 3.0 4.0 3.0 3.0 2.0 3.0
3.0 1.0 14.0 2.0 4.0 5.0 32.5 6.0 5.0 20.0 LO
3.0 10.0 6.0 7.0 15.0 2.0 20.0 12.0
14.34 El sitio web de noticias de la Oregon Health & Science
University (http://www.ohsu.edu) ofrece información acerca
a. ¿Estos datos muestran que los hombres pasan más tiempo
de un estudio que descubrió que algunas marcas de cigarrillos
mirando eventos deportivos que el que pasan las mujeres
comerciales contienen de 10 a 20 veces porcentajes más eleva
viendo reality shows en una semana? Usa un nivel de
dos de nicotina en la forma ‘libre de base”, esto es, la manera
significancia de 0.05.
que se considera más adictiva. Considera otro estudio diseña
do para comparar el contenido de nicotina de dos diferentes b. Comenta acerca del significado de la relación de a y el
marcas de cigarrillos. El contenido de nicotina se determinó valor p .
E J E M P L O 1 4 . 9
EJEMPLO 14.10 •
PRUEBA DE HIPÓTESIS PARA ALEATORIEDAD
Considera la siguiente muestra y determina si los puntos de datos forman
una secuencia aleatoria respecto aestar arriba o abajo del valor mediana.
2~ 5 T~ 8 rT 5 ~~9 T 1 H 7 1 7 3~ -• '
6 4 1 95 2 5 ■$ 2 4 3 4 ■§; 4 ,, ■L
■ Solución Ó' :-
Paso 1 a. Parámetro de interés: aleatoriedad de los valores arriba o abajo
de la mediana
688 Capítulo 14 Elementos de estadística no paramétrica
Enunciado de hipótesis:
Ho: los números en la muestra forman una secuencia aleatoria
con respecto a las dos propiedades "arriba'7 y "abajo" del
valor mediana.
Ha : la secuencia
■
no es aleatoria.
,
Suposiciones: cada valor de datos muestra! puede clasificarse
como "arriba" o como "abajo" de la mediana.
Estadístico de prueba: V, el número de rachas en los datos mués
trales.
Nivel de significancia: a = 0.05.
Información muestral: los datos muéstrales se mencionan al co
mienzo del ejemplo.
Estadístico de prueba: primero debes ordenar los datos y encon
trar la mediana. Los datos ordenados son
Valor/?: ^ Clásico;
Dado que la preocupación es por valores relacionados Dado que la preocupación es por valores relacionados
con “no aleatorio”, la prueba es de dos colas. El valor con “no aleatorio” , la prueba es de dos colas. Usada
p se encuentra al hallar la probabilidad de la cola de tabla 14 para dos colas a = 0.05. Los valores críticos
recha y duplicar: están en la intersección de la columna nl = 15 y la fila
P = 2 X P(V > 24 para na = 15 y nb = 15) n2 = 15: 10 y 22. La región crítica es V < 10 o V > 22.
Para encontrar el valor /?, tienes dos opciones: V* está en la región crítica, como se muestra en la
1. Usa la tabla 14 (apéndice B) para colocar cotas sobre figura. :
el valorp: P <0.05.
2, Usa una computadora o calculadora para encontrar el
valor/?: P = 0.003.
instrucciones específicas siguen a este ejemplo,
b. El valor p es menor que a.
Paso 5 a. Decisión: rechazar Ho.
b. Conclusión: es posible rechazar la hipótesis de aleatoriedad en
el nivel de significancia 0.05 y concluir que la secuencia no es
aleatoria respecto a arriba y abajo de la mediana.
Sección 14.4 La prueba de rachas 689
Aproximación normal
Para completar la prueba de hipótesis acerca de aleatoriedad cuando n{ y n2 son mayores
que 20 o cuando a es distinta de 0.05, se usará z, la variable aleatoria normal estándar. V
tiene distribución aproximadamente normal con una media de fxy y una desviación están
dar de <rv. A continuación se presentan las fórmulas para la media y la desviación estándar
del estadístico V y el estadístico de prueba zir:
2n x• n2
P'V — + 1 (14.8)
nA + n2
EJEMPLO 14. 11
PRUEBA DE HIPÓTESIS DE DOS CO LA S PARA ALEATORIEDAD
Pon a prueba la hipótesis nula de que la secuencia de datos muéstrales en la
tabla 14.7 es una secuencia aleatoria 0 respecto a que cada valor de datos
sea impar o par. Usa a = 0.10. (Los datos están en secuencia, a través
de las filas.)
TABLA 1 4 .7
Datos muéstrales para el ejemplo 14.1 1 [TAI4-07];
4 ■ 2- ; 3 0 2 4 3 4 ’ 8 41
2 . 1. ' 2 4 3 9 6 2. : 4 ■41
5 ó 3 3 2 2 1 - • 2: 4 2
3 ó 4' 3 5- "A 7 3 .. 2 -; 0 ‘ ■ 'b
4 ' 4 ■ .2 - 7 7 2 1 7 5' ■ 3
Solución
Pasa 1 a. Parámetro de interés: aleatoriedad de números nones y pares,
b. Enunciado de hipótesis:
Ho: la secuencia de números nones y pares es aleatoria.
Ha : la secuencia no es aleatoria.
Paso 2 a. Suposiciones: cada valor de muestra puede clasificarse, como
non o como par.
690 Capítulo 14 Elementos de estadística no paramétrica
o
Paso 4 La distribución de probabilidad:'
Valor/;: Clásico:
a. Se usa una prueba de dos colas: Se usa una prueba de dos colas. Los valores críticos se
P = 2 X P(z > 0.87) obtienen a partir de la tabla 4A:
-z(0.05) = -1.65 y z(0.05) = 1.65
, % valor p
0 0.87 z
Para encontrar el valorp 9tienes tres opciones:
1. Usa la tabla 3 (apéndice B) para calcular el valor /?:
En la página 393 se proporcionan instrucciones específi
P = 2(1,0000 - 0.8079) = 03842.
cas para encontrar valores críticos,
2. Usa la tabla 5 (apéndice B) para colocar cotas sobre
b. z * no está en la región crítica, como se muestra en
el valor p: 03682 < P < 03954.
azul oscuro en la figura,
3. Usa una computadora o calculadora para encontrar el
valor/?: P = 03843,
Para instrucciones específicas, consulta la página 376,
b. El valor/? no es menor que a.
Paso 5 a. Decisión: rechazar por falla Hq.
b. Conclusión: en el nivel de significancia 0.10, es posible rechazar
la hipótesis de aleatoriedad y concluir que dichos datos son una
secuencia aleatoria.
Sección 14.4 La prueba de rachas 691
I N S T R U C C I O N E S DE T E C N O L O G Í A :
P R U E B A DE R A C H A S PARA P O N E R
PRU EBA ALEATO RIED AD ARRIBA Y ABAJO
DE LA MEDIANA
Los siguientes comandos calculan diferencias entre los valores de datos y la mediana. Cuenta el
Excel numero de rachas creadas por la secuencia de signos + y - para completar la prueba de rachas.
Escribe ios datos en la columna A; selecciona B1 y continúa con:
EJEMPLO A P L IC A D O 14.12
JpgJ
REGLAS DE JU EG O S DE C A SIN O
Muchos juegos de casino se apoyan en números aleatorios generados elec
trónicamente para un juego "justo". He aquí una muestra de las reglas que
gobiernan dichos juegos de casino.
R E Q U IS IT O S E N R E L A C IO N C O N LO S D IS P O SIT IV O S
E L E C T R Ó N IC O S D E J U E G O E N C A S IN O S
IN T E R N A C IO N A L E S
© E JE R C IC IO S SECCIÓN 14.4
14.37 Enuncia la hipótesis nula, Ho y la hipótesis alternativa, H\ los precios de casas no ocunieron en orden aleatorio;
Ha, que usarías para poner a prueba los siguientes enunciados: con z - 1.31.
a. Los datos no ocurrieron en un orden aleatorio en torno 14.39 Determina los valores críticos que usarías para comple
a la mediana. tar las siguientes pruebas de rachas usando el enfoque clásico:
b. La secuencia de nones y pares no es aleatoria. a. Ho: los resultados recolectados ocurrieron en orden alea-
torio arriba y abajo de la mediana;
c. El género de los clientes que entran a una tienda se regis
H: los resultados no fueron aleatorios; con n(A) = 14,
tró; la entrada no tiene un orden aleatorio.
n(B) = 15 y a = 0.05.
14.38 Determina el valor p que usarías para completar las
b. / / : las dos propiedades alternaron aleatoriamente;
siguientes pruebas de rachas:
Ha: las dos propiedades no ocurrieron en forma
a. H : la secuencia de género de los clientes que entran al aleatoria;
gimnasio es aleatoria; con n(I) = 78, /z(II) = 45 y a = 0.05.
H \ la secuencia no fue aleatoria; con n(A) = 10, n(B) =12
y V = 5. 14.40 Jessica no cree haber jugado un juego con un dado sin
cargar. Ella cree que, si el dado no estuviera cargado, el lanza
b. H \ los precios de casas recolectados ocurrió en orden miento de éste terminaría en un orden aleatorio de resultados
aleatorio arriba y abajo de la mediana; pares y nones. Ella realizó su experimento 14 veces.
Sección 14.4 La prueba de rachas 693
Después de cada lanzamiento, Jessica registraba el resultado. b. Usa la prueba de rachas para poner a prueba estos datos
Se reportaron los siguientes datos (E = 2 ,4 ,6 ; 0 = 1,3,5). para aleatoriedad en torno a la mediana. Usa a = 0.05.
Q E O O Q O E E O O O E E O 14.46 [EX 1 4 4 6 ] El 24 de junio de 2009 la Oficina de Es
tadísticas Laborales presentó la Encuesta 2008 de Uso de
Usa la prueba de rachas en un nivel de significancia de 5% Tiempo Estadounidense. Entre los muchos estadísticos pro
para poner a prueba la afirmación de que los resultados repor porcionados, había información acerca de actividades de tipo
tados son aleatorios. recreativo y la cantidad promedio de tiempo empleada en va
14.41 Una empresa fabricante contrata tanto hombres como rias categorías. Para las personas de 15 a 19 años de edad, el
mujeres. La siguiente muestra el género de los últimos 20 in tiempo promedio que se pasa ejecutando juegos y usando la
dividuos contratados (M = hombre, F = mujer). computadora para recreación fue de 42 minutos al día. Supon
que 20 personas de 15 a 19 años de edad se seleccionan al azar,
Q [EXOO-OOO] identifica el nombre de archivo de una base de datos en línea de un ejercicio; disponible a través de cengagebrain.com
M M F M F F M M M M M M F M M F M M M M se monitorean por un día y se registra el número de minutos
En el nivel de significancia a = 0.05, ¿es correcto concluir que que pasan en tales actividades recreativas. La secuencia resul
esta secuencia no es aleatoria? tante de tiempos se proporciona como:
para poner a prueba la hipótesis nula de que los ingresos en b. ¿Qué aspecto de aleatoriedad se pondrá a prueba usando
la muestra forman una secuencia aleatoria respecto a las dos la prueba de rachas mencionada en el inciso (ii) de la
propiedades amba y abajo del valor de la mediana frente a la regla (c>? Describe cómo se usará.
alternativa, que la secuencia no es aleatoria en a = 0.05.
c. ¿Qué aspecto de aleatoriedad se pondrá a prueba usando
14.49 [EX 14-49] El número de ausencias registradas de una el análisis de correlación mencionado en el inciso (iii) de
ciase que se impartió a las 8 a.m. lunes y jueves el semestre la regla (c)? Describe cómo se usará.
pasado fueron (en orden de ocurrencia)
d. Estas reglas de juego se escriben usando la frase “nivel de
n(ausencias) 5 16 6 9 18 11 16 21 14 17 12 14 10 confianza de 99 %” en lugar de “nivel de significancia
6 81 2 1 3 4 5 5 6 1 7 18 26 6 de 0.01” como generalmente usan las pruebas de hipótesis.
Explica por qué esto parece adecuado.
¿Estos datos muestran una aleatoriedad en torno al valor me
14.52 Research Randomizer es un servicio gratuito ofrecido
diana en a = 0.05? Completa esta prueba usando: a) valores
a estudiantes e investigadores interesados en realizar asigna
críticos de la tabla 14 en el apéndice B y b) la distribución
ción aleatoria y muestreo aleatorio. Aunque se hacen todos los
normal estándar.
esfuerzos para desarrollar un medio útil de generación de nú
14.50 [EX 14-50] A los estudiantes en una clase de estadística meros aleatorios, Research Randomizer y su personal no ga
se les preguntó si podían ser buenos generadores de números rantizan la calidad o aleatoriedad de los números que generan.
aleatorios. A cada estudiante se le pidió escribir un solo dígito Cualquier uso al que se apliquen dichos números sigue siendo
de 0 a 9. Los datos se recolectaron desde el frente izquierdo de responsabilidad exclusiva del usuario que los generó.
la clase, avanzando fila por fila, hasta la parte trasera derecha
a. ingresa al sitio http://www.randomizer.org/about.htm y ge
de la clase. La secuencia de dígitos fue la siguiente:
nera un conjunto de 20 números aleatorios del 1 a 9, donde
7 4 3 6 9 5 4 4 4 3 6 3 3 7 7 7 6 3 6 7 6 9 6 7 3 7 7 3 4 6 cada número pueda repetirse (selecciona “No” para que
cada número sea único). (Usa tu computadora, calculadora
¿Estos datos muestran una aleatoriedad en torno al valor de la o la tabla 1 de los forros, si no tienes conexión a la web.)
mediana de 4.5 en a = 0.05? Completa esta prueba usando
b. Pon a prueba tu conjunto para aleatoriedad arriba y abajo
a) valores críticos de la tabla 14 en el apéndice B y b) la distri
del valor mediana de 5. Usa a = 0.05.
bución normal estándar.
c. Realiza la prueba nuevamente con los mismos parámetros.
14.51 La aleatoriedad incorpora muchos conceptos diferen
tes. En referencia al ejemplo aplicado 14.12: d. Pon a prueba tu nuevo conjunto para aleatoriedad. Usa
a = 0.05. ¿Obtuviste los mismos resultados?
a. ¿Qué aspecto de aleatoriedad se pondrá a prueba usando
la prueba ji cuadrada mencionada en el inciso (i) de la e. Resuelve el inciso d usando la distribución normal estándar.
regla (c)? Describe cómo se usará. ¿Llegaste a la misma conclusión?
_ i _ 6? M 2 (14.11)
** nín2 - 11
PTI El subíndice s
se usa en honor
donde d. es la diferencia en los rangos apareados y n es el número de pares de datos. El
de Spearman, el
origin ad or.
valor de r variará de -1 a +1 y se usará en gran forma como se usó el coeficiente de corre
lación lineal de Pearson, r.
""P /#/7VC* K u CvryVX/T/^
TABLA 14
Valores críticos del número total de rachas (V)
Las entradas en esta tabla son los valores críticos para una prueba de dos colas usando a = 0.05. Para una prueba de una
cola en a = 0.025, usa sólo uno de los valores críticos: el menor valor crítico para una región crítica izquierda, el mayor
para una región crítica derecha.
El mayor de n^ y n2
El menor de n1 y n2
Tomado de C. Eisenhart y F. Sweed, "Tables for testing randomness of grouping in a sequence of alternatives", Annals of Statistics,
vol. 14 (1943): 66-87. Reimpreso con permiso.
Para detalles específicos acerca del uso de esta tabla para encontrar valores p, consulta las páginas 688-689; valores críticos, página 688.