Vous êtes sur la page 1sur 23

UNIDAD III

INFERENCIA ESTADSTICA
INTRODUCCION AL MUESTREO
QUE ES MUESTREO?
3.1

EL MUESTREO ES UNA FORMA DE DETERMINAR ALGO ACERCA DE UNA


POBLACION A PARTIR DE UNA PARTE DE ELLA
POR QUE ES NECESARIO?

Por la naturaleza destructiva de ciertas pruebas


Por la imposibilidad fsica de revisar todos los integrantes de la poblacin
El costo de estudiar a todos los integrantes de una poblacin puede ser prohibitivo
En ocasiones se necesita mucho tiempo para entrevista a toda la poblacin
Por lo adecuado de los resultados de la muestra

HAY DOS TIPOS DE MUESTRAS

ProbabilsticoNo Probabilstico
TIPOS DEMETODOS DE MUESTREO PROBABILISTICO

Muestreo Aleatorio Simple


Muestreo Aleatorio Sistemtico
Muestreo Aleatorio Estratificado
Muestreo por Conglomerados

Muestreo Aleatorio Simple: Muestra seleccionada de manera que cada integrante de


la poblacin tenga la misma probabilidad de quedar incluido
Muestreo Aleatorio Sistemtico: Los integrantes de la poblacin se ordena en alguna
forma. Se selecciona al azar un punto de partida y despus se elige para la muestra
cada k-simo elemento de la poblacin
Muestreo Aleatorio Estratificado: Una poblacin se subdivide en subgrupos,
denominados estratos y se selecciona una muestra de cada uno
Muestreo por Conglomerados: Se emplea frecuentemente para reducir el costo de
muestrear una poblacin dispersa en un rea geogrfica grande

El estadstico muestral no necesariamente coincide exactamente con el parmetro


poblacional

Estimacin puntual: El valor, calculado a partir de la informacin de muestreo, que


se emplea para estimar el parmetro de la poblacin.

Intervalo de confianza: Una gama de valores obtenidos a partir de datos de


muestreo, de modo que el parmetro ocurre dentro de esa variedad a una
probabilidad especfica a la cual se le denomina nivel de confianza

Intervalo de confianza depende:

Del nivel de confianza deseado

De la variabilidad en la poblacin estimada a partir de S

Del tamao de la muestra n


x Z

N n

N 1

Factor de
correccin
por finitud
Si n/N > 5%

Para P = 95%
Para P = 99%
Para P = 90%
3.2 ESTIMACION DE MEDIA POBLACIONAL.
Cuando nosotros sacamos una muestra de tamao n de la poblacin de tamao N, solo tenemos
el valor de la media muestral x (estadgrafo), pero nuestro inters es por el parmetro (media
poblacional ). Nunca conoceremos el verdadero valor de (al menos que realizamos un
censo, investigamos toda la poblacin), entonces necesitamos estimarla. Existen dos tipos de
estimaciones: Estimacin puntual y Estimacin por intervalo de confianza.
Estimacin por intervalos de confianza: Los estimadores por intervalo se denominan
comnmente intervalos de confianza. Los extremos superior e inferior de un intervalo de
confianza se llaman lmites de confianza superior e inferior respectivamente. La probabilidad de
que un intervalo de confianza contenga el parmetro se conoce como coeficiente de confianza
( o nivel de confianza) se denota 1- . Donde es el nivel de significacin.
Si en base de la muestra se desea estimar la media poblacional se usarn las siguientes formulas
segn el caso.
2

Si n 30


x z

n
2


Si n < 30 x t ,( n1) g .l .

n
2

n
100 5% (la muestra forma una
N

Si se conoce el tamao de la poblacin (N) y la razn

parte apreciable de poblacin), entonces la formula de intervalo de confianza para la media


tendr un factor de correccin por poblacin finita (FCF).
Si n 30
Si n < 30

N n
x z

n N 1
2

N n
xt

( ,( n1) g .l )
2

N 1

Estimacin puntual: Se realiza cuando la media poblacional toma valor de la media muestral.
=x

. En este caso se indica el Error Mximo de estimacin.


Error Mximo es z

2 n
Si se conoce el tamao de la poblacin (N) y la razn

Error Mximo es z
2 n

n
100 5% , se utiliza el F.C.P.
N

N n

N 1

Ejemplo 1: Demos una estimacin por intervalo de confianza del 95% para la longitud media
de los lpices de cierta marca, si una muestra de 64 lpices arrojo una longitud promedio de 191
mm., siendo la distribucin de la longitud de tales lpices normal con varianza de 400.
SOLUCION: Primero hay que determinar los datos. 95% es el nivel de confianza: 1- = 0.95,
por lo tanto = 1- 0.95 = 0.05(es el nivel de significacin).
= 0.05, Media muestral x = 191mm, Tamao de muestra n = 64, Varianza que nos dan no es
de la muestra sino de la poblacin, porque hablan de la distribucin de los lpices, entonces
denotaremos 2 = 400, sacando la raz cuadrada obtenemos la desviacin estndar =20. Nos
piden un intervalo de confianza para la media, adems n 30, no conocemos el tamao de la
poblacin, por eso no usaremos el FCF usamos la formula

x z

0.05
1
1 0.025 0.975 , despus
2
2
z
z 0.975 1.96
buscamos en la tabla de la Normal, 1
. Sustituimos en la

Calculamos primero 1

20

formula los datos 191 1.96


;
64

191 4.9 ,

186.1,195.9 . La longitud promedio de los lpices en la poblacin es

de 186 a 195 milmetros, con un nivel de confianza de 95%.


Ejemplo 2: Una muestra aleatoria de cinco ejemplares de cierto tipo de helado tiene un
contenido de grasa medio de 11.3% y una desviacin estndar de 0.38%. Construya un intervalo
de confianza del 95% para el contenido promedio de la grasa en el helado.
x = 11.3, la desviacin estndar que se da es de la muestra S=0.38,
SOLUCION: Los datos:
= 1- 0.95 = 0.05, n = 5<30, por lo tanto usaremos la formula

0.05
x t
0.975 , despus usamos la tabla de la
, calculamos 1 1
,( n 1) g .l .
2
2
n
2

distribucin t ( de Student) con (n-1= 5-1 = 4) grados de libertad. El uso de la tabla es muy
simple en la fila superior buscamos t0.975 y en la columna g.l. buscamos 4. El valor de la
0.38

interseccin es 2.7764. Sustituyendo en la frmula obtenemos: 11.3 2.7764


5

11.3 0.47 ,

10.83,11 .77 . El promedio de la grasa en el helado es de 10.8% a

11.8%.
Ejemplo 3: Un estudio muestral conducido en una ciudad de 400 familias de las cuales
tomaron 50 los que tenan un ingreso anual promedio de $27 565 con una desviacin estndar de
$5000. Construya un intervalo de confianza del 90% en relacin con el ingreso anual promedio
real de todas las familias de esta ciudad.
SOLUCION:
calculamos si

Los datos: x = 27565, S = 5000, = 1- 0.90 = 0.1, N = 400. N = 50,


n
50
100
12.5 5% , y n >30 por lo tanto usaremos la formula
N
400

N n
z
z 0.95 1.645
x z
,calculamos 1 2
n N 1
2

sustituyendo

5000 400 50
27565 1.645
, 27565 1089.43 , 26475.57,28654.43 . El
400 1
50

ingreso anual promedio de las familias de una ciudad est entre $26475.57 y $28654.43.

3.3 ESTIMACION DE PROPORCIONES.


Sea x es el nmero de veces que ha ocurrido un evento en n ensayos, entonces

x
es la
n

proporcin muestral, si p es la proporcin poblacional entonces el intervalo para la proporcin


poblacional es

x
x
1
n
n

x
z
n
2

Donde

Ejemplo 4: El anlisis de 500 ventas seleccionadas al azar de un comerciante indic que 465
de ellas se hicieron a crdito. Construya un intervalo de confianza del 95% para la proporcin
real de estas ventas que se hacen a crdito.
SOLUCION: Los datos: n = 500, los 465 de 500 son las ventas que se hicieron a crdito por lo
tanto x = 465, = 1- 0.95 = 0.05, calculando

dada obtenemos p 0.93 1.96

z 0.975 1.96

y sustituyendo en la formula

0.931 0.93
, p 0.93 0.022 , p 0.908,0.952 .
500

Podemos decir que las ventas que se hacen a crdito en la poblacin es de 90.8 % a 95.2%
3.4 CALCULO DEL TAMAO DE LA MUESTRA
Para el clculo del tamao de la muestra adecuado, si en base de esta muestra queremos estimar
el promedio usaremos la formula siguiente:
n

donde E es el error mximo que se desea tener al estimacin y es la desviacin


estndar poblacional, si no se conoce se toma una
muestra pequea (piloto) y se calcula desviacin muestral que puede ser usada para la
formula.

Si la poblacin es finita de tamao N, el tamao de la poblacin es: n


z

n0

n0 N
, donde
n0 ( N 1)

Para el clculo del tamao de la muestra adecuado, si en base de esta muestra queremos
estimar la proporcin usaremos la formula siguiente:
5

n p
(1 p
) 2
E

Si se tiene idea de la proporcin poblacional:

n 1 2
4 E

Si no se conoce la proporcin poblacional:

Si la poblacin es finita de tamao N, el tamao de la poblacin es:


Np (1 p )
n
( N 1)n0 p (1 p )

donde

E
n0

z

2

E es el error mximo, p es la

proporcin que se crea que tiene el valor de inters de la variable de estimar, se determina en una
(0.25) N
muestra piloto, en el caso que no se conoce usamos la formula n
( N 1) n0 0.25

Autoaprendizaje No. 5

Inferencia Estadstica
1. La asociacin de ex alumnos de una universidad quiere estimar los salarios anuales
promedios de los graduados en 1996. Una muestra aleatoria de 100 personas revel un salario
promedio de $850 con una desviacin estndar de $145. Establezca e interprete una
estimacin por intervalo con una confiabilidad de 95%, del salario promedio mensual de los
graduados en 1996.
2. Los ingresos del impuesto sobre venta en una comunidad particular se recaudan cada
trimestre. Los siguientes datos representan los ingresos (en miles de dlares) cobrados
durante el primer trimestre de una muestra de nueve establecimientos de menudeo de la
comunidad: 15, 18, 11, 17, 13, 10, 22, 15, 16.
a) Establezca e interprete una estimacin por intervalo con un 99% de confianza, de los ingresos
trimestrales del impuesto sobre ventas en los establecimientos de menudeo.
b) Si hay un total de 300 establecimientos de menudeo en esa comunidad, estime e interprete un
intervalo con un 95% de confianza de los ingresos trimestrales del impuesto sobre venta en
los establecimientos de menudeo.

3 Al examinar los registros de facturacin mensual de una empresa editora con ventas por
correo, el auditor toma una muestra de 10 de las facturas no pagadas. Las sumas que se
adeudan a la compaa son: $4, $18, $11, $7, $10, $5, $33, $9, $12, $15.
a) Determine e interprete una estimacin por intervalo con un 90% de confianza de la cantidad
promedio de facturas no pagadas.
b) Si hubiera un total de 250 facturas no pagadas. Determine e interprete una estimacin por
intervalo del 99% de confianza de la cantidad promedio de facturas no pagadas.
4. El gerente de control de calidad de una fbrica de lmparas elctricas desea estimar la
duracin promedio de un embarque de lmparas (focos). Los resultados indican que la
desviacin estndar del proceso es de 100 horas y el gerente desea estimar la duracin
promedio con aproximacin de 20 horas del promedio real con una confiabilidad del 95%.
Qu tamao de muestra se necesita?
5. Se va a vender un nuevo cereal para desayuno y se pone a prueba de mercado durante un mes
en las tiendas de una cadena de autoservicio, se desea estimar la suma promedio de venta con
aproximacin de $100 con un 95% de confianza y se supone que la desviacin estndar es de
$200. Qu tamao de muestra se necesita?
6. Un grupo de estudio quera estimar fa facturacin mensual promedio por luz elctrica en el
mes de Julio en casas unifamiliares en una ciudad. Con base en estudios efectuados en otras
ciudades, se supone que la desviacin estndar es de $20. El grupo quiere estimar a facturacin
promedio de julio con aproximacin de $5 del promedio real con un 95% de confianza, Qu
tamao de muestra se necesita?
7.
El gerente de una sucursal bancaria en una ciudad quiere determinar la proporcin de sus
cuenta habientes a los cuales se les paga el sueldo por semana, por experiencia previa en otras
reas se sabe que slo el 30% prefieren este sistema, si el gerente quiere tener 95% de confianza
de que esta en lo correcto con aproximacin de Q.05 de la proporcin do sus clientes a quienes
se les paga por semana. Qu tamao de muestra se necesita?
8
Los resultados de un estudio realizado en una universidad mostraron que una muestra
tomada al azar de 25 alumnos utiliza las instalaciones del centro de estudiantes en promedio 6.8
veces por semana, con desviacin estndar de 2.4. Construya un intervalo de confianza del 99%
en relacin con el nmero promedio de veces que un alumno de la universidad utiliza las
instalaciones del centro de estudiantes a la semana.
9
Una tienda de quesos para conocedores lleva un registro de las compras hechas por sus
clientes. Una muestra tomada al azar de 15 de estos registros arroja compras de 28.3 onzas de
queso en promedio con desviacin estndar de 2.7 onzas. Construya un intervalo de confianza
de 95% de la media de la poblacin que se muestrea.
10
Para estimar el nmero promedio de millas que los estudiantes de una universidad
suburbana recorren para asistir a clase, un funcionario de la universidad seleccion una muestra
al azar de 75 estudiantes que hacen el recorrido y obtuvo una media de 18.2 millas con una
7

desviacin estndar de 2.30 millas. Con el 99% de confianza qu se puede decir acerca del
error mximo en la estimacin del recorrido promedio real como 18.2 millas?
11
En un estudio de costos anuales de renta de apartamientos de una ciudad del Este, una
muestra de 25 apartamientos tiene un costo de renta medio de $11 535 y una desviacin estndar
de $875.
a) Construya un intervalo de confianza del 99% del costo anual promedio real de renta de los
apartamientos.
b) Qu se puede decir con el 95% de confianza acerca del error mximo si la media de la
muestra de %11 535 se utiliza como estimacin del costo anual promedio de renta de los
apartamientos?
12
Una muestra tomada al azar de 50 de los 500 estudiantes de preparatoria de un distrito
escolar que realizaron las pruebas de rendimiento escolar en el otoo tuvieron una calificacin
promedio de lenguaje de 475 con una desviacin estndar de 125. Construya un intervalo de
confianza del 95% de la calificacin media de todos los 500 estudiantes de la preparatoria que
realizaron la prueba.
13
Diez estudiantes seleccionados al azar de una gran muestra de alumnos, tardaron 60, 50,
45, 60, 75, 35, 42, 53, 49 y 65 minutos en terminar un examen de ingls. Si la media de esta
muestra se utiliza para estimar el tiempo promedio real que tardan en terminar el examen, qu
podemos decir con el 95% de confianza acerca del error mximo?
14
En un estudio de muestras aleatorias, 120 de 365 personas entrevistadas en una ciudad
grande, dijeron que se oponen a autorizar la construccin de otras unidades habitacionales.
Construya un intervalo de confianza del 99% para la proporcin de la poblacin correspondiente.
15
En un estudio de muestras aleatorias, a 200 estudiantes con promedios acumulativos de
calificaciones superiores a 3.00, se les pregunt dnde, con mayor probabilidad, realizaran la
mayor parte de sus tareas o estudios. Si 72 de los alumnos optaron por la biblioteca, construya
un intervalo de confianza del 90% para la proporcin real de los estudiantes de este grupo que
prefieren la biblioteca para estudiar.
16
En una muestra aleatoria de 575 capitanes de puerto, 360 pensaban que el gobierno
debera de exigir a los propietarios de botes recreativos que presentarn un examen para obtener
la licencia. Si se utiliza

360
=0.63 como estimacin de la proporcin real correspondiente de la
575

poblacin que se muestrea, qu se puede afirmar con el 98% de confianza acerca del error
mximo?
17
El gerente de control de calidad de una fbrica de lmparas elctricas desea estimar la
duracin promedio de un embarque de lmparas. Los resultados indican que la desviacin
estndar del proceso es de 100 horas y el gerente desea estimar la duracin promedio con un
8

error mximo de 20 horas con una confiabilidad del 95%. Que tamao de la muestra se
necesita?
18
Se va a vender un nuevo cereal para desayuno y se pone a prueba de mercado durante un
mes en las tiendas de una cadena de autoservicio. Se desea estimar la suma promedio de venta
con aproximacin(error mximo) de mas o menos $100 con un 95% de confianza y se supone
que la desviacin estndar es de $200. Qu tamao de muestra se necesita?
19
El gerente de una sucursal bancaria en una ciudad quiere determinar la proporcin de sus
cuenta habientes a los cuales se les paga el sueldo por semana, por experiencia previa en otras
reas se sabe que slo el 30% prefieren este sistema, si el gerente quiere tener 95% de confianza
de que esta en lo correcto con aproximacin de mas o menos 0.05 de la proporcin de sus
clientes a quienes se les paga por semana. Que tamao de muestra se necesita?

3.5 PRUEBAS DE HIPTESIS

HIPOTESIS: Enunciado acerca de una poblacin elaborado con el propsito de poner a


prueba.

PRUEBA DE HIPOTESIS: Procedimiento basado en la evidencia muestral y en la teora


de probabilidad que se emplea para determinar si la hiptesis es un enunciado razonable.

PROCEDIMIENTO DE SEIS PASOS PARA PROBAR UNA HIPOTESIS


1

6to paso: CALCULAR EL


VALOR DE P
Si p < se rechaza la Ho. Si la
prueba es bilateral 2p < se
rechaza la Ho.

Hiptesis nula: Afirmacin acerca del valor de un parmetro. (Siempre lleva la igualdad).
10

Hiptesis alternativa: Afirmacin que se aceptar si los datos muestrales proporcionan


amplia evidencia de que la hiptesis nula es falsa. Se define siempre lo contrario de la
hiptesis nula.
Nivel de Significancia: Probabilidad de rechazar la hiptesis nula cuando es verdadera
Valor crtico: Nmero que es el punto divisorio entre la regin de aceptacin y la regin de
rechazo, de la hiptesis nula
Valor estadstico de prueba: Valor obtenido a partir de la informacin muestral, que se
utiliza para determinar si se rechaza la hiptesis nula.
3.5.1 PRUEBA DE HIPTESIS PARA LA MEDIA POBLACIONAL
1) Pantear las hiptesis.
LA PRUEBA DE HIPOTESIS PARA LA MEDIA DE UNA POBLACION PUEDE
PLANTEARSE EN CUALQUIERA DE LOS TRES FORMATOS
Formato 1

Formato 2

Formato 3

Prueba de una cola Prueba de dos Prueba de una cola


(Unilateral
colas (Bilateral) (Unilateral
Izquierda)
derecha)
Ho: = o

Ho: = o

Ho: = o

H1: < o

H1: o

H1: > o

2) Establecer el nivel de significacin :


Los errores que podran cometerse al realizar una prueba de Hiptesis son dos error tipo I y
error tipo II . Analizar la siguiente tabla.
Realidad
Decisin
H0 se rechaza
H0 se acepta

Cierta la H0
Error Tipo I
Decisin
Correcta

Falsa H0
Decisin Correcta
Error Tipo II

La probabilidad de cometer el Error tipo I, P(Error I) = . ( es rechazar la Ho cuando


debera ser aceptada)
La probabilidad de cometer el Error tipo II, P(Error II) = ( es aceptar la Ho. cuando
debera ser rechazada)
Interesa medir las magnitudes de estos Errores y tratar de que esas magnitudes sean las
menores posibles. Resulta imposible reducir ambas probabilidades de cometer el error tanto
11

como se quiera, puesto que una disminucin en una de ellas provoca, en general, un aumento de
otra. Una solucin es fijar el valor de una de ellas. En esto caso se fija el valor de , por lo
general se dan valores de 0.01, 0.05, 0.1 (se trabajar con error tipo I)
Si
Nivel de confianza
(1-)

99%=0.99

95%=0.95 90%= 0.90

Nivel de
significacin ()

1%= 0.01

5%=0.05

10%= 0.10

2.58

1.96

1.645

2.33

1.645

1.28

Si si

utilizar la tabla t-student con gl = n-1

3) Estadstica de Prueba
Si

x
n

si

x
s n

4) Regla de decisin:
Si la prueba es bilateral: /Zc/ > Z se rechaza la Ho.
Si la prueba es unilateral: Zc > Z se rechaza la Ho. bien Zc < -Z se rechaza la Ho.
5) Conclusin
6) Valor de p
EJEMPLO 1:El tiempo promedio dedicado al estudio individual por los estudiantes de segundo
ao de administracin en los cursos anteriores fue de 18.75 horas semanales. Una muestra simple
aleatoria de 16 estudiantes del curso actual arrojo que dedicaban al estudio individual un
promedio de 19.23 horas semanales con varianza de 0.25. Podemos afirmar con un nivel de
significacin de 0.01 que los estudiantes de este curso estudian ms? Consideremos la
distribucin del tiempo de estudio semanal en la poblacin Normal.
SOLUCION: Primero en que debemos fijarnos es que si la distribucin es Normal. En este caso
si. Por lo tanto despus nos fijamos en la varianza o desviacin estndar, si es de poblacin
usamos Z, si es de muestra entonces la t-dtudent. En este caso es la t-student, por lo que la
varianza que nos dan es de la muestra. Determinamos los datos.
Datos: n =16,
S2 = 0.25, por lo tanto S =0.5, x = 19.23, = 0.01, el valor con el que
vamos a comparar la media se denota 0 = 18.75, es el promedio anterior.
12

Paso I.
Hiptesis: (Como se quiere saber que los estudiantes estudian ms y esto nos confirma la
muestra, por lo tanto la hiptesis alternativa es H1:

0 , la nula es lo contrario.)

Ho: 18.75
H1:

18.75

Paso II.
Regin Critica: como la muestra es menor de 30 se usar la tabla t- student y = 0.01
Calculamos el valor de t ,( n1) g .l . = t 0.01,15 g .l . = 2.6025

t ( 0.01,15) 2.6025

Paso III.

tc
Estadstica de la Prueba: calculamos:

x o 19.23 18.75
S
0.5
16
n =
= 3.84

Paso IV.
Decisin: Como la estadstica de la prueba 3.84 es mayor de 2.6 cae en la regin de rechazo, por
lo tanto Rechazamos la Hiptesis nula. tc > t se rechaza la Ho.
Paso V.
Conclusin: Al rechazar la hiptesis nula, decimos: Podemos afirmar que el tiempo promedio de
estudio de los estudiantes de estudiantes de este curso es mayor que de los cursos anteriores, con
un nivel de significacin de 0.01.
Paso VI
El valor de p < se rechaza la Ho.
Con lo gl = 15 y tc = 3.84 se busca en la tabla t-student el valor ms cercano a 3.84 esto es 2.9467
y este valor est por debajo de la probabilidad de p= 0.005 < 0.01 por tanto se rechaza la Ho.
EJEMPLO 2: El consumo diario de arroz en un comedor estudiantil ha sido histricamente de 63
Kg. con una varianza de 49. Se observa en una muestra simple aleatoria de 81 das que el
consumo promedio de arroz es de 61Kg. Podemos afirmar basndonos en este resultado que el
consumo diario de arroz ha disminuido, con un nivel de significacin de 0.05?
Datos: x = 61,

n = 81,

2 = 49, =7,

0 = 63,

= 0.05

Como no nos dicen que la distribucin es Normal veamos, nos fijarnos solamente en el tamao
de muestra, como es mayor de 30 usamos la Z normal
1) Hiptesis:
Como queremos saber si ha disminuido el consumo de arroz, por lo tanto
hiptesis es: Ho: 63
13

H1:

63

2) Regin Crtica: Como la prueba es unilateral izquierda y = 0.05 el valor de Z=


1.645

z1 =1.645

tc
3) Estadstica de la prueba:

x o
61 63
S
n = 7
81 = -2.57

4) Decisin: Como -2.57 es menor de -1.645 rechazamos la hiptesis nula.


5) Conclusin: Podemos afirmar con un nivel de significacin de 0.05 que el consumo
diario de arroz ha disminuido.
6) Valor de p
Si p < se rechaza la Ho.
Se busca en la tabal normal el valor de Zc= -2.57, equivale a 0.0051 entonces p= 0.0051<
0.05 es verdadero por tanto se rechaza la Ho.
I Prueba de hiptesis para la media de una poblacin con distribucin Normal y de la
poblacin conocida.
HIPOTESIS

ESTADIGRAFO COMUN

Ho: o
H1: 0

Ho: o
H1:

REGION CRITICA

x o

Ho: o
H1:

14

II Prueba de hiptesis para la media de una poblacin con distribucin normal y varianza de
la poblacin desconocida.
HIPOTESIS

ESTADIGRAFO COMUN

REGION CRITICA

Ho: o
H1: 0
t
2

t
2

Ho: o
H1:

, ( n 1) g .l .

, ( n 1) g .l .

x o
S
n

t ,( n 1) g .l .

Ho: o
H1:

t ,( n 1) g .l .

III Prueba de hiptesis para la media de una poblacin no normal.

Si n 30, usar tabla II.


Si n 30, usar tabla I
3.5.2 PRUEBA DE HIPOTESIS PARA LA PROPORCIN
Para la prueba de hiptesis para la proporcin usaremos el siguiente formulario.
IV Prueba de hiptesis para la proporcin de una poblacin
HIPOTESIS
Ho: p p o
H1: p p 0

ESTADIGRAFO COMUN

REGION CRITICA

15

Ho: p po
H1:

p po

x np o
np o (1 p 0 )
z

Ho: p po
H1:

p p0

EJEMPLO: Un constructor afirma que se instalan bombas de calor en 70% de todas las casas
que se constituyen hoy en da en la ciudad de Richmond. Estara de acuerdo con esta
afirmacin si una de casas nuevas en esta ciudad muestra que 8 de 15 tienen instaladas bombas
de calor? Utilice un nivel de significancia de 0.1.
Datos: n = 15,x = 8, el valor con el que vamos a comparar la proporcin denotaremos
p0 = 0.7,
= 0.1,
si calculamos x/n =8/15 = 0.53.
1) Hiptesis:
Como no nos piden probar de que la proporcin es menor o mayor de 70%
(0.7), por lo tanto es una prueba bilateral.
Ho: p p o La afirmacin del constructor es correcta
H1: p p 0 La afirmacin del constructor es equivocada.
2) Regin critica:

3).

= -1.645

Copiamos de la tabla, segn nuestra hiptesis.

=1.645

Calculamos

Estadstica de la prueba: z

x np o

np o (1 p 0 )

0 .1
2

= z 0.95 = 1.645

8 (15)(0.7)
(15)(0.7)(1 0.7)

Zc= -1.41
4). Decisin: Aceptamos la hiptesis nula. Porque el valor -1.41 esta en la regin de aceptacin,
entre -1.645 y 1.645.
5).Conclusin: No hay razn suficiente para dudar de la afirmacin de constructor.
6) Valor de p
Como la prueba es bilateral la regla de decisin: 2p< se rechaza la Ho.
Zc = -1.41 se busca en la tabla normal 0.0793 = p entonces 2( 0.0793) = 0.1586 < 0.10 es falso
por lo tanto No se rechaza la Ho.
Autoaprendizaje No.6
16

1 Una cadena de restaurantes planea construir un nuevo expendio, si cuando menos 200 autos
pasan por el lugar propuesto cada hora, durante determinadas horas. Para 20 horas
muestreadas al azar, se encuentra que el # promedio de autos que pasan por ese lugar es 208.5,
con s = 30. Los administradores piensan que el volumen de trfico satisface sus
requerimientos. Realice una prueba de hiptesis respecto a este problema con igual a 5%?
2 Suponga que los resultados mustrales del problema anterior se basan en una muestra de n =
50 horas. Puede rechazarse la hiptesis nula con = 5%?
3 Se encuentra que el nmero promedio de empleados para una
muestra de 50 empresas de
una industria es de 420.4, con una desviacin estndar de 55.7. Antes de recolectar los datos
se plante la hiptesis de que el nmero promedio de empleados por empresa en esa industria
no era superior a 408. Pruebe esa hiptesis con = 5%
4 En un departamento de reparacin de maquinaria se recibe en embarque de 100 mquinas
defectuosas. Se encuentra que, para una muestra de 10 de ellas, el tiempo promedio de
reparacin que se requiere es 85 minutos con s = 15 minutos. Pruebe la hiptesis Ho: =100
minutos con = 10%
5 Una empresa industrial supone que la vida de su prensa rotativa ms grande es cuando menos
14500 horas con =2100 horas. De una muestra de 25 prensas la compaa obtiene una
media muestral de 13000 horas. Con = 1%, debe la compaa concluir que la vida media
de las prensas es menor que las 14500 supuestas?
6 Antes del embargo petrolero de 1973 y de los incrementos posteriores en los precios del
petrleo crudo, el consumo de gasolina en E.E.U.U. haba crecido a una tasa mensual de 57%
con una desviacin estndar de 10% al mes. En 15 meses escogidos aleatoriamente, el
consumo de gasolina aument a un porcentaje promedio de apenas 33% por mes. Con un
nivel de significacin de 0.01, puede afirmar usted que el crecimiento en el consumo de
gasolina disminuy a raz del embargo y sus consecuencias?
7 El gerente de una compaa financiera se queja de que el 7% de los pagos parciales de
prstamos hechos a consumidores no se cubre a tiempo. Pruebe esta afirmacin, con el nivel
de significacin de 0.05, contra la hiptesis alternativa de que esta cifra es demasiado alta, si
80 de 1500 pagos de prstamos no se hacen a tiempo.
8 El propietario de un parque de diversiones hizo un estudio con 400 visitantes y descubri que
220 de ellos se haban enterado de la existencia del parque a travs de la publicidad por la
radio. Utilice el nivel de significacin de 0.05 para determinar si esto fundamenta la
afirmacin de que el 60% de los visitantes se entero de la existencia del parque a travs de
esta forma de publicidad.
9. Gerente, de produccin de una Compaa manufacturera estima que la edad media de sus
empleados es 22.8 aos. El tesorero de la firma necesita una cifra de la edad meda de los
empleados ms exacta, a fin de estimar el costo de una prestacin por antigedad que se
considera para los empleados. El tesorero toma una muestra aleatoria de 70 trabajadores y
17

observa que la edad media de los empleados muestreados es de 26.2 aos con una desviacin
estndar de 4.6 aos. Con un nivel de significacin del 1%. Qu puede concluir acerca de la
exactitud de la estimacin del Gerente de produccin?
10. La produccin diaria de una planta industrial qumica registrada durante 50 das, tiene una
media muestral de 871 toneladas y una desviacin estndar de 21 toneladas. Pruebe la hiptesis
de que el promedio de la produccin diaria del producto qumico es de 880 toneladas por da,
contra la alternativa de que es mayor o menor que 880 toneladas por da, usando una
significacin del 5%,
11.
Una muestra aleatoria de 6 observaciones de una poblacin normal, gener los
siguientes datos: 3.7 6.4 8.1 8.8 4.9 5.0 Proporcionan los datos suficiente evidencia que
seale que < 7, a un nivel del 5%.
12.
Se dise un nuevo sistema para el control del inventarlo de un pequeo fabricante, con
el propsito de reducir el mismo para un motor elctrico en particular, a menos de 3000 motores
por da. Se llev a cabo un muestreo del Inventarlo en reserva al final de cada uno de los ocho
das, seleccionados aleatoriamente; los resultados se muestran a continuacin. Con los datos hay
evidencia suficiente que sealen que el promedio del nmero diario de motores en el Inventarlo
es menor de 3000. Use un nivel da significacin del 1%.
Nmero de Motores
2905
2725
2835
3065
2605
2835
3005
2895
13.
Se sabe que en el pasado, la captura promedio de langostas en cada trampa colocada en
una zona particular de! Caribe ha sido de 30.31 lbs. Una muestra aleatoria de 20 trampas
colocadas recientemente dio los siguientes resultados (en Ibs.)
43.2 19.6 27.5 22,1 24.4
12.2 23.8 34.4 41,7 25.5
37.2 39.6 21.1 39.6 43.4
17.4 33.7 24.1 29.3 18.9
Presentan estos datos suficiente evidencia a favor de la afirmacin, de que la captura promedio
por trampa de langosta ha disminuido, use un nivel de significacin del 5%.
14.
Suponga que el promedio de clientes que entrar a una tienda por da es de 175. Se hace
una campaa publicitaria durante 7 semanas. Durante la campaa, el promedio de clientes
aument a 181 por da. con una varianza muestra! de 441. Aument en forma significativa e!
18

nmero de clientes que entran B la tienda gracias a la campaa publicitaria a un nivel del 1% y a
un nivel del 5%.
15.
De 1980 a 1985, fa tasa promedio de precios/utilidades (p/u) de los aproximadamente
1800 valores inscritos en la Bolsa de Valores de Nueva York fue de 14.35 con una desviacin
estndar de 9.73. En una muestra de 32 valores de la Bolsa, aleatoriamente escogidos, la tasa p/u
promedio en 1986 fue de 11,37, Esta muestra presenta evidencia suficiente para concluir al
nivel de significacin del 5% que en 1986 la tasa p/u promedio para los valores de la Bolsa se
habra modificado de su anterior valor?
16.
American Theaters sabe que una pelcula de xito se exhibi un promedio de 34 das en
cada ciudad, y la desviacin estndar correspondiente fue de 10 das. El administrador del
distrito sudorienta! estaba Interesado en comprar la popularidad de la pelcula en su regln con la
de los dems cines de la American. Eligi aleatoriamente 75 cines de su regln y encontr que
proyectaron la pelcula un promedio de 81.5 das.
Establezca las hiptesis apropiadas para probar si hubo una diferencia significativa en la
duracin de la exhibicin de la pelcula entre los cines del distrito sudorienta! y los dems de la
American. A un nivel de significacin del 1% pruebe esta hiptesis.
17. Tina Dennis es la Jefa de contabilidad de Meck Industries (M). Ella cree que los
problemas de flujo de efectivo en MI se deben a fa cobranza lenta de cuentas pendientes. Estima
que ms de 60% de las cuentas estn en atraso ms de tres meses. Una muestra de 200 cuentas
seal que 140 tenan ms de tres meses de antigedad. Al nivel de significacin de 0.01. se
puede concluir que ms do 60% de las cuentas estn en atraso por mas de tres meses?
18.
Experiencias en la Wills Travel Agency Indica que 44% de las personas
desean que esa agencia planee unas vacaciones para viajar a Europa. Durante la temporada ms
reciente, una muestra de 1000 fue seleccionada al azar de los archivos y se encontr que 480
queran Ir a Europa de vacaciones. Ha sido un cambio significativo hacia arriba en el porcentaje
de personas que desean ir a Europa? Pruebe a un nivel del 5%,
3.5.3 PRUEBA DE INDEPENDENCIA.
Antes de explicar la prueba de independencia aprendemos a construir una tabla de contingencia.
DEFINICION: Una tabla de contingencia es una disposicin de datos en una clasificacin de
dobla entrada. Los datos se ordenan en celdas y se reporta el nmero de datos en cada una. En
una tabla de contingencia (o cruces de variables) estn implicadas dos variables.
Veamos un ejemplo donde podemos observar como hacer una tabla de cruces de variables.
EJEMPLO: Supongamos que tenamos una muestra de 15 personas a las cuales se les pregunt
su sexo y si tiene trabajo o no.
SEXO:
TRABAJA:

masculino - codificado con valor 1;


si - 1; no 2.

Femenino- 2

19

SEXO
1
TRABAJA 1

2
1

2
1

1
2

2
2

1
1

2
1

1
2

1
2

2
2

1
1

2
1

1
1

2
2

1
1

Ahora realizamos la tabla de contingencia:


SEXO
TRABAJA
SI 1
NO 2
TOTALES

MASCULINO
1
5
3
8

FEMENINO
2
4
3
7

TOTALES
9
6
15

Observen que en la celda donde tenemos valor 5 corresponde a nmero de personas que son de
sexo masculino y tienen trabajo (1,1) y as sucesivamente. Despus se calculan los totales de las
columnas y de las filas y el total general que debe corresponder a los totales de los datos de la
muestra.
Si nosotros queremos saber si hay relacin entre el sexo y trabaja persona o no (si el hecho de
que la persona trabaja o no depende de sexo) debemos realizar una prueba de independencia.
En base de un ejemplo explicar como se realiza la prueba de independencia (o de chi-cuadrada
(2) porque se utiliza el estadgrafo chi- cuadrada)
EJEMPLO: A los 300 alumnos de una escuela se les pregunto cual es su rea favorita y el sexo.
Los datos estn dados en una tabla de contingencia. Determine si la preferencia por el rea
depende de sexo del alumno o no con un nivel de significacin de 0.05.
Sexo
Masculino
Femenino
TOTALES

Matemticas
37
35
72

rea favorita
Ciencias
Sociales
41
72
113

Humanidades

TOTALES

44
71
115

122
178
300

Paso I: Plantear la hiptesis. Siempre la hiptesis nula tiene que decir que las variables son
independientes.
H0: La preferencia por el rea no depende de sexo del alumno.
H1: La preferencia por el rea depende de sexo del alumno.
Paso II: Regin crtica.

2(g.l.,)
5.991
Para calcular los grados de libertad de la distribucin chi-cuadrada usaremos la frmula:
g.l. = (f-1)(c-1), donde f- nmero de filas, c-nmero de columnas, sin tomar en cuenta totales.
g.l.=(2-1)(3-1)=2.
20

Usando la tabla de la gua calculamos el valor de la chi-cuadrada (uso de la tabla es similar de T


de Student) 2(gl.,)=
2(2g.l. ,0.05)= 5.991
Paso III: Estadstica de la prueba.
Antes de calcular la estadstica de la prueba hay que calcular los valores esperados para cada
celda de la tabla. Los valores que aparecen en la tabla son valores observados. Para calcular los
valores esperados se multiplica los subtotales de la fila y columna correspondiente al valor
observado y se divide entre total general.
(122)(72)
29.28
300
(178)(72)

42.72
300

(122)(113)
45.95
300
(178)(113)

67.05
300

(122)(115)
46.77
300
(178)(115)

68.23
300

E11

E12

E13

E 21

E 22

E 23

Ahora estos valores se ubicarn en la tabla entre parntesis en la celda correspondiente.


Sexo
Masculino
Femenino
TOTALES

Matemticas
37 (29.28)
35 (42.72)
72

rea favorita
Ciencias
Sociales
41 (45.95)
72 (67.05)
113

Humanidades

TOTALES

44 (46.77)
71 (68.23)
115

122
178
300

Usamos ahora la frmula para calcular la estadstica de la prueba.


2

(O E ) 2
, donde O- valor observado de la celda, E- valor esperado de la celda.
E

2=
(37 29.28) 2 (41 45.95) 2 ( 44 46.7) 2 (35 42.72) 2 (72 67.05) 2 (71 68.23) 2

29.28
45.95
46.77
42.72
67.05
68.23

=2.035+0.533+0.164+1.395+0.365+0.112 = 4.604
Paso IV: Decisin.
Estadstica de la prueba nos dio 4.604, si colocamos este valor en la grfica veamos que se
encuentra en la regin de aceptacin.
H0 se acepta.
Paso V: Conclusin. Al nivel de significacin de 0.05 no podemos afirmar que la preferencia
por rea preferida depende de sexo de alumno.
Paso VI: Valor de p
p< se rechaza la Ho.
Se busca el valor de 2c = 4.604 con gl=2 el valor que est ms cercano a ste = 4.605 y le
corresponde el valor de p= 0.10 < 0.05 esto es falso por lo tanto la Ho. No se rechaza, se acepta.
NOTA: No debe utilizarse la prueba de chi-cuadrada si n<30 o si hay mas de 20% de celdas
con la frecuencias esperadas menores de 5.
21

Autoaprendizaje No.6
1
A un grupo de 350 adultos, que participaron en una encuesta de salud, se les pregunto si
llevan o no una dieta. Las respuestas por sexo fueron los siguientes.
Dieta
Sexo
Masculino
Femenino
Totales
A dieta
14
25
Sin dieta
159
152
Totales
Sugieren estos datos que el estar a dieta depende de sexo? Use nivel de significacin de 0.01.
2

Cuatrocientos individuos fueron clasificados como polticamente FSLN, PLC o ALN.


Adems cada uno se clasifica por edad, como se indica en la siguiente tabla. Podemos
decir que la preferencia poltica depende de edad de la persona, con nivel de significacin
de 0.05?
Preferencia
Poltica
FSLN
PLC
ALN
Totales

Grupos de Edad
36-50
Mayor de
50
40
20
85
45
25
45

20-35
20
80
40

Totales

Se realiza un anlisis de datos sobre accidentes, para determinar la distribucin del


nmero de accidentes automovilsticos mortales segn el tamao del auto. Loa datos para
346 accidentes son siguientes.

Tamao del auto


Mortal
No Mortal

Pequeo
67
128

Mediano
26
63

Grande
16
46

Indican estos datos que la frecuencia de accidentes mortales depende del tamao de los
automviles con nivel de significacin de 0.05?
4

Se entrevisto a un grupo de 306 personas para determinar su opinin respecto a un tema especifico
de poltica exterior. Al mismo tiempo, se .registro su afiliacin poltica. Los datos son los siguientes:

Partido
gobierno

del

De acuerdo con la
poltica

En desacuerdo con
la poltica

No opinaron

114

53

17

22

Oposicin

87

27

81

Presentan los datos suficiente evidencia que indique que hay relacin entre la afiliacin poltica y la
opinin expresada. Use un nivel de 0,05.

23

Vous aimerez peut-être aussi