Vous êtes sur la page 1sur 10

686 Capítulo 14 Elementos de estomática no para métrica

Usa el estadístico U de Mann-Whitney para poner a prueba la por 25 cigarrillos de la marca A y 25 cigarrillos de la marca B.
hipótesis de que la producción promedio es diferente para los La suma de rangos para la marca A es igual a 688 y la suma
dos estados. Usa a = 0.05. de rangos para la marca B es igual a 587. Usa el estadístico
U de Mann-Whitney para poner a prueba la hipótesis nula de
14.33 [EX Ì 4-33] Los resultados del examen de Rendimien­
que el contenido promedio de nicotina es el mismo para las
to del Estado de Ohio para Toledo, Ohio, para estudiantes de
dos marcas, frente a la alternativa de que difiere el contenido
cuarto grado, fueron los más altos registrados desde el inicio
promedio de nicotina. Usa a = 0.01.
de la valoración del rendimiento en todo el estado. Aunque los
resultados fueron una mejoría en todo el distrito, en algunas 14.35 [EX 14-35] Como parte de un estudio para determinar
materias no hubo tanta mejoría como para otras. Los resulta­ si la siembra de nubes aumenta la lluvia, se sembraron al azar
dos que siguen muestran la cantidad de cambio para lectura nubes con nitrato de plata y otras no se sembraron. Las canti­
y escritura. Los cambios en las calificaciones se indican con dades de lluvia que siguieron se mencionan aquí.
positivo para mejoría, negativo para calificaciones más bajas y
cero para no cambio. Sin sembrar 4.9 41,1 21.7 372.4 26.3 17.3 36.6 26.1
47.3 95.0 '147.8 321.2 11.5 68.5 29.0 24.4
1202.6 87.0 28.6 830.1 81.2 4.9 163.0 345.5
Escritura 2 0 3 30 10 25 7 17 2 244.3
6 15 -9 -2 ó 13 _c -5 10
24 ó 29 -4 27 16 1 -4 -8 Sembrada 129.6 334.1 274.7 198.6 4 3 0.0 274.7 31.4 1 15.3
-6 13 8 5 -2 3 3 14 -1 7 1656.0 1 18.3 489.1 302.8 255.0 32.7 119.0 17.5
ló -1 2 10 42 -2 4 8 38 24 242.5 2745.6 7.7 40 .6 97 8.0 200.7 703.4 92.4
1697.8
Lectura ' 23 25 2 ó 40 3 3 32 -2
8 28 -1 8 5 34 -ó 7 6
34 6 19 27 23 6 46 23 35 ¿Estos datos muestran que el sembrado de nubes aumenta sig­
-4 10 11 31 -1 3 10 20 10 -1 0 nificativamente la cantidad promedio de lluvia? Usa a = 0.05.
-5 17 22 20 19 11 13 3 21
14.36 [EX 14-36] ¿Se emplean más horas para ver eventos
Con la siguiente salida Excel, pon a prueba la afirmación de deportivos en televisión o reality shows? Un estudiante de
que hay igual mejoría en resultados de escritura en cuarto gra­ universidad comunitaria supone hipotéticamente que es más
do como en lectura. Usa a = 0.05. (Nota: la prueba de suma probable que los hombres vean deportes mientras las mujeres
de rangos de Wilcoxon es equivalente a la prueba U de Mann- ven los reality shows. Con esta premisa, recopila datos al azar
Whitney.) de 30 hombres y 30 mujeres en esta universidad comunitaria
acerca de las horas de televisión que se miran en una semana.
Prueba de suma de rangos de Wilcoxon
Suma de rangos Observaciones Hombres que miran deportes (hrs)

Escritura 1798.5 45 4 10 15 26 10 20 13 4 5 3 1 20 60 35 3
Lectura 2296.5 45 6 10 26 3 0 15 5 8 8 ó 14 15 3 2 4
z Stat -2 .0 0 9 4
Mujeres que miran reality TV (hrs)
P[Z < z) dos colas 0.0 444
z Crítico dos colas 1.96 2.0 10.0 5.0 8.0 10.0 3.0 4.0 3.0 3.0 2.0 3.0
3.0 1.0 14.0 2.0 4.0 5.0 32.5 6.0 5.0 20.0 LO
3.0 10.0 6.0 7.0 15.0 2.0 20.0 12.0
14.34 El sitio web de noticias de la Oregon Health & Science
University (http://www.ohsu.edu) ofrece información acerca
a. ¿Estos datos muestran que los hombres pasan más tiempo
de un estudio que descubrió que algunas marcas de cigarrillos
mirando eventos deportivos que el que pasan las mujeres
comerciales contienen de 10 a 20 veces porcentajes más eleva­
viendo reality shows en una semana? Usa un nivel de
dos de nicotina en la forma ‘libre de base”, esto es, la manera
significancia de 0.05.
que se considera más adictiva. Considera otro estudio diseña­
do para comparar el contenido de nicotina de dos diferentes b. Comenta acerca del significado de la relación de a y el
marcas de cigarrillos. El contenido de nicotina se determinó valor p .

114.4 La prueba de rachas


La prueba de rachas se usa con más frecuencia para poner a prueba la aleatoriedad
(o falta de aleatoriedad) de ios datos. Una racha es una secuencia de datos que posee una
propiedad común. Una racha termina y otra comienza cuando una observación no muestra
la propiedad en común. El estadístico de prueba en esta prueba es V, el número de rachas
observadas:
El siguiente ejemplo ilustra qué constituye una racha y cómo contar el número de
rachas.
Sección 14.4 La prueba de rachas 687

E J E M P L O 1 4 . 9

DETERM INACIÓN DEL NÚMERO DE RACHAS


Para ilustrar la idea de rachas extrae una muestra de 10 números de un solo
dígito del directorio telefónico, en la que menciones el penúltimo dígito de
cada uno de los números telefónicos seleccionados:
Muestra: 2 3 1 1 4 2 6 6 6 7
Considera la propiedad "non" (o) o "par" (e). La muestra, como se extrajo,
se convierte en e, o, o, o, e, e, e, e, o, que presenta cuatro rachas:
e ooo eeeee o
Por tanto, V★ = 4.

En el ejemplo 14.9, si la muestra no contuviera aleatoriedad, sólo habría dos rachas:


todos pares, luego todos nones o a la inversa. Tampoco se esperaría verlos alternados: non,
par, non, par. El número máximo de posibles rachas sería n{ + n2 o menos (siempre que n{
y no sean iguales), donde n y n2 son los números de datos que tienen cada una de las
dos propiedades a identificar.

Suposición para inferencias en torno a aleatoriedad usando la prueba de


rachas Cada valor de datos muestral puede clasificarse en una de dos
categorías.

Por lo general, la prueba de rachas es un examen de dos colas. La hipótesis se rechazará


cuando existan menos rachas porque esto indica que los datos están “separados” de acuer­
do con las dos propiedades. También se rechazará la hipótesis cuando existan demasiadas
rachas, porque ello indica que los datos se alternan entre las dos propiedades con mucha
frecuencia para ser aleatorios. Por ejemplo, si los datos se alternan todo el tiempo, puedes
sospechar que los datos se alteraron. Existen muchos aspectos en el concepto de aleatorie­
dad. La ocurrencia de non y par, como se estudió en el ejemplo 14.9, es un aspecto. Otro
aspecto de aleatoriedad que acaso quieras comprobar es el ordenamiento de las fluctuacio­
nes de los datos arriba o abajo de la media o mediana de la muestra.

EJEMPLO 14.10 •
PRUEBA DE HIPÓTESIS PARA ALEATORIEDAD
Considera la siguiente muestra y determina si los puntos de datos forman
una secuencia aleatoria respecto aestar arriba o abajo del valor mediana.

2~ 5 T~ 8 rT 5 ~~9 T 1 H 7 1 7 3~ -• '
6 4 1 95 2 5 ■$ 2 4 3 4 ■§; 4 ,, ■L

Pon a prueba la hipótesis nula de que esta secuencia es aleatoria. Usa.


a = 0.05.

■ Solución Ó' :-
Paso 1 a. Parámetro de interés: aleatoriedad de los valores arriba o abajo
de la mediana
688 Capítulo 14 Elementos de estadística no paramétrica

Enunciado de hipótesis:
Ho: los números en la muestra forman una secuencia aleatoria
con respecto a las dos propiedades "arriba'7 y "abajo" del
valor mediana.
Ha : la secuencia

no es aleatoria.
,
Suposiciones: cada valor de datos muestra! puede clasificarse
como "arriba" o como "abajo" de la mediana.
Estadístico de prueba: V, el número de rachas en los datos mués­
trales.
Nivel de significancia: a = 0.05.
Información muestral: los datos muéstrales se mencionan al co­
mienzo del ejemplo.
Estadístico de prueba: primero debes ordenar los datos y encon­
trar la mediana. Los datos ordenados son

Dado que hay 30 valores de datos, la profundidad de la mediana está en


la posición d(xJ = 15.5. Por tanto x = = 3.5. Al comparar cada núme­
ro en la muestra original con el valor de la mediana, se obtiene la siguiente
secuencia de a (arriba) y b (abajo):
babaababbbababbababaabaahababa
Se observa na = 15, nb = 15 y 24 rachas. De modo que V * = 24.
Si n1 y n2 son ambos menores que o iguales a 20 y se desea una prueba
de dos colas en a = 0.05, entonces se usa la tabla 14 del apéndice B para
completar la prueba de hipótesis.
Paso 4 La distribución de probabilidad: , / ' ; ; •

Valor/?: ^ Clásico;
Dado que la preocupación es por valores relacionados Dado que la preocupación es por valores relacionados
con “no aleatorio”, la prueba es de dos colas. El valor con “no aleatorio” , la prueba es de dos colas. Usada
p se encuentra al hallar la probabilidad de la cola de­ tabla 14 para dos colas a = 0.05. Los valores críticos
recha y duplicar: están en la intersección de la columna nl = 15 y la fila
P = 2 X P(V > 24 para na = 15 y nb = 15) n2 = 15: 10 y 22. La región crítica es V < 10 o V > 22.

Jó valor p Rechazar Ha Rechazar por falla H0 Rechazar H0


* *
23 24 10 11 21 ' 22' • ' j ;
Y número de rachas
V, número de rachas

Para encontrar el valor /?, tienes dos opciones: V* está en la región crítica, como se muestra en la
1. Usa la tabla 14 (apéndice B) para colocar cotas sobre figura. :
el valorp: P <0.05.
2, Usa una computadora o calculadora para encontrar el
valor/?: P = 0.003.
instrucciones específicas siguen a este ejemplo,
b. El valor p es menor que a.
Paso 5 a. Decisión: rechazar Ho.
b. Conclusión: es posible rechazar la hipótesis de aleatoriedad en
el nivel de significancia 0.05 y concluir que la secuencia no es
aleatoria respecto a arriba y abajo de la mediana.
Sección 14.4 La prueba de rachas 689

C álculo del valor p cuando se usa la prueba de rachas


Método /. Usa la tabla 14 del apéndice B para colocar cotas sobre el valor p. Al inspec­
cionar la tabla 14 en la intersección de la columna n{ = 15 y la fila n2 = 15, puedes deter­
minar que el valor p es menor que 0.05; el valor observado de V+ = 24 es mayor que al
mayor valor crítico mencionado.
Método 2. Si haces la prueba de hipótesis con la ayuda de una computadora o calcu­
ladora graficadora, muy probablemente ella calculará el valor/? por ti. En la página 691 se
proporcionan instrucciones específicas.

Aproximación normal
Para completar la prueba de hipótesis acerca de aleatoriedad cuando n{ y n2 son mayores
que 20 o cuando a es distinta de 0.05, se usará z, la variable aleatoria normal estándar. V
tiene distribución aproximadamente normal con una media de fxy y una desviación están­
dar de <rv. A continuación se presentan las fórmulas para la media y la desviación estándar
del estadístico V y el estadístico de prueba zir:

2n x• n2
P'V — + 1 (14.8)
nA + n2

/(2»i • n2) • (2k x • n2 ~ «i ~ n2)


(14.9)
<JV v («i + «2)2(« i + «2 “ 1)
V + - piV
z+ (14.10)
(JV

EJEMPLO 14. 11
PRUEBA DE HIPÓTESIS DE DOS CO LA S PARA ALEATORIEDAD
Pon a prueba la hipótesis nula de que la secuencia de datos muéstrales en la
tabla 14.7 es una secuencia aleatoria 0 respecto a que cada valor de datos
sea impar o par. Usa a = 0.10. (Los datos están en secuencia, a través
de las filas.)

TABLA 1 4 .7
Datos muéstrales para el ejemplo 14.1 1 [TAI4-07];
4 ■ 2- ; 3 0 2 4 3 4 ’ 8 41
2 . 1. ' 2 4 3 9 6 2. : 4 ■41
5 ó 3 3 2 2 1 - • 2: 4 2
3 ó 4' 3 5- "A 7 3 .. 2 -; 0 ‘ ■ 'b
4 ' 4 ■ .2 - 7 7 2 1 7 5' ■ 3

Solución
Pasa 1 a. Parámetro de interés: aleatoriedad de números nones y pares,
b. Enunciado de hipótesis:
Ho: la secuencia de números nones y pares es aleatoria.
Ha : la secuencia no es aleatoria.
Paso 2 a. Suposiciones: cada valor de muestra puede clasificarse, como
non o como par.
690 Capítulo 14 Elementos de estadística no paramétrica

b. Estadístico de prueba: V, el número de rachas en los datos mués­


trales
c. Nivel de significancia: a = 0,10
Paso 3 a. Información muestral: los datos se proporcionan al comienzo del
ejemplo.
b. Estadístico de prueba: los datos muéstrales, cuando se convierten
a V para non y "e" para par, se convierten en
o e ’o e e e o e e o e.o e e o_o e e e o ó. e o o e
eo ee eo e o o o o o o eoeeoeo'eo o o o

y revelan: no = 2ó, ne = 24 y 29 rachas, de modo que V★ = 29.


Ahora usa las fórmulas (14.8), (14.9) y (14.10) para determinar
el estadístico z:
2/i] • n2
/i] 4- n2 + h ' ‘ ■= W 2 T + 1-2^96*1-25.96
/ (2ni -n 2)- ( 2 n 1 • n2 - ny— n2)
Cv
V (n, + n2)2(n, + n2 - 1)
/(2 • 26 • 24) • (2 • 26 • 24 - 2ó - 24)
m
A (26 + 24)2(26 + 24 - 1}
/(I 248)(1 198) --------------- -,
V
= J - -------, -------- - = V i 2.20493 = 3.49
¡50)2 • (49)
V *-u ,v 2 9 - 25.96 3.04
zrk z* 0.87
0*V 3.49 3.49

o
Paso 4 La distribución de probabilidad:'

Valor/;: Clásico:
a. Se usa una prueba de dos colas: Se usa una prueba de dos colas. Los valores críticos se
P = 2 X P(z > 0.87) obtienen a partir de la tabla 4A:
-z(0.05) = -1.65 y z(0.05) = 1.65
, % valor p

0 0.87 z
Para encontrar el valorp 9tienes tres opciones:
1. Usa la tabla 3 (apéndice B) para calcular el valor /?:
En la página 393 se proporcionan instrucciones específi­
P = 2(1,0000 - 0.8079) = 03842.
cas para encontrar valores críticos,
2. Usa la tabla 5 (apéndice B) para colocar cotas sobre
b. z * no está en la región crítica, como se muestra en
el valor p: 03682 < P < 03954.
azul oscuro en la figura,
3. Usa una computadora o calculadora para encontrar el
valor/?: P = 03843,
Para instrucciones específicas, consulta la página 376,
b. El valor/? no es menor que a.
Paso 5 a. Decisión: rechazar por falla Hq.
b. Conclusión: en el nivel de significancia 0.10, es posible rechazar
la hipótesis de aleatoriedad y concluir que dichos datos son una
secuencia aleatoria.
Sección 14.4 La prueba de rachas 691

I N S T R U C C I O N E S DE T E C N O L O G Í A :
P R U E B A DE R A C H A S PARA P O N E R
PRU EBA ALEATO RIED AD ARRIBA Y ABAJO
DE LA MEDIANA

Escribe el conjunto de datos en C 1 ; luego continúa con:


MINITAB
Elige: Stat > Nonparametrics > Runs Test
Escribe: Variable: C1
Selecciona: Above and below mean > OK
o
Above and below:
Escribe: Median value > OK

Los siguientes comandos calculan diferencias entre los valores de datos y la mediana. Cuenta el
Excel numero de rachas creadas por la secuencia de signos + y - para completar la prueba de rachas.
Escribe ios datos en la columna A; selecciona B1 y continúa con:

Escribe: = median(Al:A20 o selecciona celdas) > Enter


Selecciona la celda Cl, luego continúa con:
Escribe: = Al - ‘actual B1 median valué' (ex. Al - 5.5) > Enter
Arrastra: Esquina inferior derecha de la celda Cl hacia abajo para obtener
otras diferencias

Escribe los datos en L1; luego continúa con:


TI-83/84 Plus
Resalta: L2
Escribe: L1 - median*(Ll) 2nd LIST > MATH > 4:medián( )
Elige: PRGM > EXEC > RUNSTEST
Escribe: n i = # de observaciones con característica particular
(ej. abajo mediana)
n2 = # de observaciones con otra característica
(ej. arriba mediana)
V = #ofruns
*EI programa RUNSTEST es uno de muchos programas que están disponibles para descargar de www.
cengagebrain.com. Consulta la página 35 para instrucciones específicas.

EJEMPLO A P L IC A D O 14.12
JpgJ
REGLAS DE JU EG O S DE C A SIN O
Muchos juegos de casino se apoyan en números aleatorios generados elec­
trónicamente para un juego "justo". He aquí una muestra de las reglas que
gobiernan dichos juegos de casino.

R E Q U IS IT O S E N R E L A C IO N C O N LO S D IS P O SIT IV O S
E L E C T R Ó N IC O S D E J U E G O E N C A S IN O S
IN T E R N A C IO N A L E S

Estas condiciones se bosquejan en en relación con los casinos y los fabrican­


cumplimiento con la Ley de Casinos tes de juegos, principalmente en cuanto
(Fi 1999:355). El propósito de las condi­ al engaño mediante la manipulación de
ciones es garantizar al jugador seguridad los dispositivos de juego. Los dispositivos
692 Capítulo 14 Elementos de estadística no paramétrica

electrónicos de juego utilizados en un ca­ nos de un nivel de confianza


sino deben cumplir las especificaciones de 99% usando pruebas ji
impuestas en esta regla. cuadradas.
Las siguientes condiciones aplican a ii) El generador de números
eventos aleatorios y pruebas aleatorias: aleatorios no produce un es­ i
a) Un evento aleatorio tiene un tadístico respecto a produ­
conjunto dado de posibles resul­ cir patrones de ocurrencias.
tados que tienen una probabili­
y.
Cada posición de carrete se piil
dad de ocurrencia dada. considera aleatoria si satis­ H
b) Dos eventos se llaman indepen­ face no menos del nivel de
dientes si existen ambas de las confianza de 99% respecto
siguientes condiciones: a la prueba de rachas o cual­
i) El resultado de un evento no quier patrón similar de esta­
tiene una influencia sobre el dístico de prueba.
resultado del otro evento. iii) El generador de números
ii) El resultado de un evento aleatorios produce núme­
no afecta la probabilidad de ros que se eligen de manera
ocurrencia del otro evento. independiente sin considera­
c) Un dispositivo electrónico de ción a cualquier otro símbo­
juego debe estar equipado con lo producido durante dicho
un generador de números alea­ juego. Esta prueba es la de
torios para hacer el proceso de correlación. Cada par de ca­
selección. Un proceso de selec­ rretes se considera aleatorio
ción se considera aleatorio si se si el par de carretes satisface
cumplen todas las especificacio­ no menos del nivel de con­
nes siguientes: fianza de 99% usando análi­
i) El generador de números sis de correlación estándar.
aleatorios satisface no me­
Fuente: http://www.kemaqu al ity.com/

© E JE R C IC IO S SECCIÓN 14.4
14.37 Enuncia la hipótesis nula, Ho y la hipótesis alternativa, H\ los precios de casas no ocunieron en orden aleatorio;
Ha, que usarías para poner a prueba los siguientes enunciados: con z - 1.31.

a. Los datos no ocurrieron en un orden aleatorio en torno 14.39 Determina los valores críticos que usarías para comple­
a la mediana. tar las siguientes pruebas de rachas usando el enfoque clásico:

b. La secuencia de nones y pares no es aleatoria. a. Ho: los resultados recolectados ocurrieron en orden alea-
torio arriba y abajo de la mediana;
c. El género de los clientes que entran a una tienda se regis­
H: los resultados no fueron aleatorios; con n(A) = 14,
tró; la entrada no tiene un orden aleatorio.
n(B) = 15 y a = 0.05.
14.38 Determina el valor p que usarías para completar las
b. / / : las dos propiedades alternaron aleatoriamente;
siguientes pruebas de rachas:
Ha: las dos propiedades no ocurrieron en forma
a. H : la secuencia de género de los clientes que entran al aleatoria;
gimnasio es aleatoria; con n(I) = 78, /z(II) = 45 y a = 0.05.
H \ la secuencia no fue aleatoria; con n(A) = 10, n(B) =12
y V = 5. 14.40 Jessica no cree haber jugado un juego con un dado sin
cargar. Ella cree que, si el dado no estuviera cargado, el lanza­
b. H \ los precios de casas recolectados ocurrió en orden miento de éste terminaría en un orden aleatorio de resultados
aleatorio arriba y abajo de la mediana; pares y nones. Ella realizó su experimento 14 veces.
Sección 14.4 La prueba de rachas 693

Después de cada lanzamiento, Jessica registraba el resultado. b. Usa la prueba de rachas para poner a prueba estos datos
Se reportaron los siguientes datos (E = 2 ,4 ,6 ; 0 = 1,3,5). para aleatoriedad en torno a la mediana. Usa a = 0.05.
Q E O O Q O E E O O O E E O 14.46 [EX 1 4 4 6 ] El 24 de junio de 2009 la Oficina de Es­
tadísticas Laborales presentó la Encuesta 2008 de Uso de
Usa la prueba de rachas en un nivel de significancia de 5% Tiempo Estadounidense. Entre los muchos estadísticos pro­
para poner a prueba la afirmación de que los resultados repor­ porcionados, había información acerca de actividades de tipo
tados son aleatorios. recreativo y la cantidad promedio de tiempo empleada en va­
14.41 Una empresa fabricante contrata tanto hombres como rias categorías. Para las personas de 15 a 19 años de edad, el
mujeres. La siguiente muestra el género de los últimos 20 in­ tiempo promedio que se pasa ejecutando juegos y usando la
dividuos contratados (M = hombre, F = mujer). computadora para recreación fue de 42 minutos al día. Supon
que 20 personas de 15 a 19 años de edad se seleccionan al azar,

Q [EXOO-OOO] identifica el nombre de archivo de una base de datos en línea de un ejercicio; disponible a través de cengagebrain.com
M M F M F F M M M M M M F M M F M M M M se monitorean por un día y se registra el número de minutos
En el nivel de significancia a = 0.05, ¿es correcto concluir que que pasan en tales actividades recreativas. La secuencia resul­
esta secuencia no es aleatoria? tante de tiempos se proporciona como:

14.42 Con la intención de responder la pregunta ¿quién hace Minutos 50 45 59 50 16 51 34 89 43 63

las transacciones bancadas de la familia: el marido (h) o la 47 42 46 23 27 39 43 43 12 28

esposa (w)?, los resultados de una muestra de 28 clientes casa­


dos que hacen las transacciones bancadas familiares muestran a. Determina la mediana y el número de rachas aniba y
la siguiente secuencia de llegadas al banco. abajo de la mediana.

w w w w h w h h h h w w w w w h h w w w h h h h w h h w b. Usa la prueba de rachas para poner a prueba estos datos


por aleatoriedad en torno a la mediana.
¿Estos datos muestran falta de aleatoriedad respecto a si el ma­
c. Enuncia tu conclusión.
rido o la esposa hacen las transacciones bancadas familiares?
Usa a = 0.05. 14.47 [EX14 4 ] Los siguientes son 24 tiempos muertos con­
secutivos (en minutos) de una máquina particular.
14.43 A un estudiante se le pidió realizar un experimento que
involucra lanzar una moneda 25 veces. Después de cada lanza­ Tiempo 20 33 33 35 36 36 22 22 25 27 30 30
miento el estudiante registró los resultados. Se reportaron los muerto 30 31 31 32 32 36 4 0 4 0 5 0 45 45 40
siguientes datos (H = cara, T = cruz).
La hipótesis nula de aleatoriedad se pondrá a prueba contra la
H T H T H T H T H H T T H H T T H T H T H T H T H
alternativa de que existe una tendencia. A continuación se pre­
Usa la prueba de rachas en el nivel de significancia de 5% para senta un análisis MINITAB del número de rachas arriba y
poner a prueba la afirmación del estudiante de que los resulta­ abajo de la mediana.
dos reportados son aleatorios. Prueba rachas: Tiempo muerto
Prueba de rachas para tiempo muerto
14.44 [EX 14-44] Los siguientes datos se recolectaron con la
Rachas arriba y abajo K = 32.5
intención de demostrar que el número de minutos que llega Número observado de rachas = 4
tarde el autobús de la ciudad consistentemente se hace más Número esperado de rachas = 13.0000
grande. Los datos están en orden de ocurrencia. 12 observaciones arriba K 12 abajo
Prueba significativa en 0.0002
Minutos 6 1 3 9 1 0 1 0 2 5 5 6 1 2 3 7 8 9 4 5 8 11 14

a. Confirma los valores reportados para la mediana y el nú­


En a = 0.05, ¿estos datos muestran suficiente falta de aleato­
mero de rachas al calcularlas personalmente.
riedad para apoyar la afirmación?
b. Calcula el valor de zir y el valor p.
14.45 [EX 1 4 4 5 ] De acuerdo con una nueva encuesta del si­
tio web Boston Indicator.org, las escuelas de la ciudad de Bos­ c. ¿Rechazarías la hipótesis de aleatoriedad? Explica.
ton tienen un promedio de 3.6 estudiantes por computadora
d. Construye una gráfica que muestre los datos muéstrales
para el año escolar 2007-2008. El promedio fue el mismo para
y apoye visualmente tu respuesta al inciso c.
todo el estado de Massachusetts, pero más alto que el prome­
dio para cualquiera de los distritos urbanos. Una muestra de 14.48 De acuerdo con una nota de prensa del 26 de agosto de
escuelas de la ciudad de Boston reportó su número promedio 2008, del U.S. Census Bureau News, la mediana del ingreso
de estudiantes por computadora en la secuencia que sigue: doméstico en 2007 fue 50 023 dólares. Una muestra aleatoria
de 250 ingresos tiene una valor mediano diferente del de cual­
3. 5 2. 6 3. 8 5. 7 2. 6 3. 4 2. 7 4. 6 3, 4 3. 6 4. 2 3. 7 4. 6 2. 9
quiera de los 250 ingresos en la muestra. Los datos contienen
a. Determina la mediana y el número de rachas arriba y 105 rachas arriba y abajo de la mediana. Usa esta información
abajo de la mediana. (continúa en la página 694)
694 Capítulo 14 Elementos de estadística no paramétrica

para poner a prueba la hipótesis nula de que los ingresos en b. ¿Qué aspecto de aleatoriedad se pondrá a prueba usando
la muestra forman una secuencia aleatoria respecto a las dos la prueba de rachas mencionada en el inciso (ii) de la
propiedades amba y abajo del valor de la mediana frente a la regla (c>? Describe cómo se usará.
alternativa, que la secuencia no es aleatoria en a = 0.05.
c. ¿Qué aspecto de aleatoriedad se pondrá a prueba usando
14.49 [EX 14-49] El número de ausencias registradas de una el análisis de correlación mencionado en el inciso (iii) de
ciase que se impartió a las 8 a.m. lunes y jueves el semestre la regla (c)? Describe cómo se usará.
pasado fueron (en orden de ocurrencia)
d. Estas reglas de juego se escriben usando la frase “nivel de
n(ausencias) 5 16 6 9 18 11 16 21 14 17 12 14 10 confianza de 99 %” en lugar de “nivel de significancia
6 81 2 1 3 4 5 5 6 1 7 18 26 6 de 0.01” como generalmente usan las pruebas de hipótesis.
Explica por qué esto parece adecuado.
¿Estos datos muestran una aleatoriedad en torno al valor me­
14.52 Research Randomizer es un servicio gratuito ofrecido
diana en a = 0.05? Completa esta prueba usando: a) valores
a estudiantes e investigadores interesados en realizar asigna­
críticos de la tabla 14 en el apéndice B y b) la distribución
ción aleatoria y muestreo aleatorio. Aunque se hacen todos los
normal estándar.
esfuerzos para desarrollar un medio útil de generación de nú­
14.50 [EX 14-50] A los estudiantes en una clase de estadística meros aleatorios, Research Randomizer y su personal no ga­
se les preguntó si podían ser buenos generadores de números rantizan la calidad o aleatoriedad de los números que generan.
aleatorios. A cada estudiante se le pidió escribir un solo dígito Cualquier uso al que se apliquen dichos números sigue siendo
de 0 a 9. Los datos se recolectaron desde el frente izquierdo de responsabilidad exclusiva del usuario que los generó.
la clase, avanzando fila por fila, hasta la parte trasera derecha
a. ingresa al sitio http://www.randomizer.org/about.htm y ge­
de la clase. La secuencia de dígitos fue la siguiente:
nera un conjunto de 20 números aleatorios del 1 a 9, donde
7 4 3 6 9 5 4 4 4 3 6 3 3 7 7 7 6 3 6 7 6 9 6 7 3 7 7 3 4 6 cada número pueda repetirse (selecciona “No” para que
cada número sea único). (Usa tu computadora, calculadora
¿Estos datos muestran una aleatoriedad en torno al valor de la o la tabla 1 de los forros, si no tienes conexión a la web.)
mediana de 4.5 en a = 0.05? Completa esta prueba usando
b. Pon a prueba tu conjunto para aleatoriedad arriba y abajo
a) valores críticos de la tabla 14 en el apéndice B y b) la distri­
del valor mediana de 5. Usa a = 0.05.
bución normal estándar.
c. Realiza la prueba nuevamente con los mismos parámetros.
14.51 La aleatoriedad incorpora muchos conceptos diferen­
tes. En referencia al ejemplo aplicado 14.12: d. Pon a prueba tu nuevo conjunto para aleatoriedad. Usa
a = 0.05. ¿Obtuviste los mismos resultados?
a. ¿Qué aspecto de aleatoriedad se pondrá a prueba usando
la prueba ji cuadrada mencionada en el inciso (i) de la e. Resuelve el inciso d usando la distribución normal estándar.
regla (c)? Describe cómo se usará. ¿Llegaste a la misma conclusión?

114.5 Correlación por rangos


Charles Spearman desarrolló el coeficiente de correlación por rango a principio de 1900.
Se trata una alternativa no paramétrica al coeficiente de correlación lineal (momento pro­
ducto de Pearson, r) que se estudió en los capítulos 3 y 13.
El coeficiente de correlación por rangos de Spearman, r , se encuentra al usar esta
fórmula:

Coeficiente de correlación por rangos de Spearman

_ i _ 6? M 2 (14.11)
** nín2 - 11
PTI El subíndice s
se usa en honor
donde d. es la diferencia en los rangos apareados y n es el número de pares de datos. El
de Spearman, el
origin ad or.
valor de r variará de -1 a +1 y se usará en gran forma como se usó el coeficiente de corre­
lación lineal de Pearson, r.
""P /#/7VC* K u CvryVX/T/^

732 Apéndice B Tablas

TABLA 14
Valores críticos del número total de rachas (V)
Las entradas en esta tabla son los valores críticos para una prueba de dos colas usando a = 0.05. Para una prueba de una
cola en a = 0.025, usa sólo uno de los valores críticos: el menor valor crítico para una región crítica izquierda, el mayor
para una región crítica derecha.

El mayor de n^ y n2
El menor de n1 y n2

Tomado de C. Eisenhart y F. Sweed, "Tables for testing randomness of grouping in a sequence of alternatives", Annals of Statistics,
vol. 14 (1943): 66-87. Reimpreso con permiso.
Para detalles específicos acerca del uso de esta tabla para encontrar valores p, consulta las páginas 688-689; valores críticos, página 688.

Vous aimerez peut-être aussi