Vous êtes sur la page 1sur 52

UNIVERSIDAD NACIONAL DEL ALTIPLANO

FACULTAD DE INGENIERIA ECONMICA

Estadstica para
economistas II

PARTE IV: Estimacin Estadstica

M.Sc. Sabino Edgar Mamani Choque

1
Estimacin Estadstica

LA INFERENCIA ESTADSTICA Es la generali-


zacin de los resultados a partir de la medicin de una
muestra.
Procedimientos o mtodos de:
1.Inferir de una muestra a una poblacin se llama
estimacin de un parmetro.
2.Prueba de una hiptesis acerca de un parmetro.
1) Estimacin Puntual.
2) Estimacin intervlica o por intervalos.

2
Qu es un estimador?

1. Es aquel valor de una muestra muy


semejante al parmetro de la poblacin.
2. Ejemplo, se puede decir que X est muy
prximo al verdadero valor de . Para ello
X tiene que cumplir una serie de requisitos.
(Taro Yamane, Pg. 108)

3
Cules son los requisitos de un buen
estimador?

1. Es insesgado o sin vicio.


2. Consistente
3. Eficiente
4. Suficiente

4
Estimador Insesgado. Cuando el valor
esperado de un estadstico empleado como
estimador es igual al parmetro: E() = .
Estimador Consistente. Cuando un
estimador se aproxima al parmetro de la
poblacin que se va estimar aumentando el
tamao de la muestra.

5
Estimador Eficiente. Se dice que un
estimador 1 es ms eficiente que otro
estimador 2 para si el primero tiene una
menor varianza que el segundo.
Estimador Suficiente. Es un estimador que
utiliza toda la informacin que posee una
muestra sobre el parmetro que se estima.

6
Estimacin Intervlica

Es la estimacin de un parmetro por un intervalo,


llamado Intervalo de Confianza, cuyos puntos finales
L y U (L U), son funciones de las variables
aleatorias observadas tales que la probabilidad de que
quede satisfecha la desigualdad L U, se expresa
en trminos de un nmero determinado: 1 - .

7
Sea X una poblacin distribuida N(,2)
Para encontrar dos estadsticos 1 y 2 tal que P(1 < < 2) = , con
conocido si sigue los siguientes pasos:
1. Elegir el nivel de confianza = 1 -
2. Sea X1, X2, Xn una muestra aleatoria de tamao n de X, y X
media muestral
3. Siendo X un buen estimador de , se puede usar la distribucin
muestral de X para establecer un intervalo de confianza para .
4. Para n suficientemente grande (n>30), por el teorema del lmite
central se tiene que:

2
x N ,
n

8
Si X es una poblacin normal, entonces la media muestral es normal
para todo n, y se obtiene que:

Z
x n
~(0,1)

5. Z depende del parmetro ; eligiendo = 1 se puede determinar


dos valores: Z1 y Z2 tal que:

Z Z1 Z Z2 1

6. Hay muchas formas de escoger Z1 y Z2 que cumplan tal condicin.


La forma mas sencilla es escoger Z2 = -Z1 = Z0

P Z0 Z Z0 1

9
7. Por simetra de la curva normal, se tiene:
P Z0 Z Z0 2PZ Z0 1

Es decir:

2P Z Z0 1
RA
P Z Z 0 1
1 1-
2 RC /2 RC /2

P Z Z0 1
- Z/2 0 Z/2
2 Intervalo de

8. Del paso anterior se encuentra el valor de Z0 y, sustituyendo el valor


de Z se encuentra que:

x
P Z0 Z Z0 P Z0 n Z0
10
Z Z
P 0 x 0
n n

Z Z
P x 0 x 0
n n

Z Z
P x 0 x 0
n n

Entonces el intervalo de confianza es:

Z 0 Z 0
x n ; x n

Z 0
x
n 11
1. Intervalo de confianza para con 2 conocida

Si X es la media de una muestra de tamao n (n 30)


tomada de una distribucin con media (descocida) y
2 conocida, entonces:
Z 0 Z 0
x ; x
n n

Es aproximadamente un intervalo del 100 % de confianza


para la media , donde Z0 es tal que P(ZZ0)=1- /2
Si se desconoce y n30, se puede usar la desviacin estndar muestral S para aproximar
Si la v.a. X se distribuye normalmnete con media y 2 conocida, el teorema anterior se
cumple tambien para n< 30
12
Si el muestreo es sin reemplazo en poblaciones finitas, se usa el factor de
correccin (N-n)/(N-1).
Para poblacin finta de N elementos, conocida, muestreo sin reemplazo y n30,
el intervalo del 100 % de confianza para es:

Z 0 N n Z 0 N n
x ;x
n N 1 n N 1

Si es desconocida, el intervalo de confianza ser:

Z0S N n Z0S N n
x ;x
n N 1 n N 1

El IC es funcin creciente del nivel de confianza.


El tamao de muestra aparece en el denominador de Z0, por tanto para muestras
13
grandes el IC ser mas corto (informacin mas precisa)
Construir un IC del 95% de confianza para la media de la poblacin, a partir de
una muestra de tamao 64, extrada de una poblacin con =10. La media
muestral fue de 48.5

=0.95, entonces (1+0.95)/2 = 0.975


De la tabla Z, Z0=1.96
1= 46.05
2= 50.95

0.90 0.95 0.955 0.98 0.99


Z0 1.645 1.96 2.00 2.33 2.576

14
Es posible estimar un IC para la cantidad total de una poblacin en casos
apropiados.

Z0 S Z0S
NX ; NX
n n
1. Si se obtienen todas las posibles muestras de tamao 25 en una distribucin
normal, con media 20 y D.E. 4, dentro de que lmite se encuentra el 90% central
de las medias muestrales?
2. En una muestra de 60 observaciones, la media es de 35 y la D.E. 4.2. Determine
los lmites entre los cuales debe encontrarse la media poblacional, con una
probabilidad del 95%.
3. Como prueba de mercado de un artculo, se evala durante un mes las ventas en
las tiendas de una cadena de autoservicio. Los resultados de una muestra de 36
tiendas indicaron ventas promedio de S/1200 con una D.E. S/180. Si la cadena
tiene 200 tiendas, establezca un IC con 99% de confianza de las ventas totales.

15
2. Intervalo de Confianza para la diferencia de
dos distribuciones con varianzas 21 y 22
conocidas y muestras grandes (n 30).

Si X1 y X2 , son las medias de dos muestras aleatorias independientes


de tamaos n1 y n2 seleccionadas respectivamente de dos poblaciones
con medias 1 y 2 y variancias 21 y 22, supuestas conocidas. El
estadstico es:

P Z 0 Z Z 0

x y ( )
P Z 0 x y
Z
x y
2 2 0


n m
16

x y ( )
P Z 0 x y
Z
x2 y
2 0


n m

x2 y
2
x2 y
2

P ( x y ) Z 0 ( x y ) ( x y ) Z0
n m n m

x
2
2
x2
2

P ( x y ) Z 0 y
; ( x y) Z0 y
n m n m

2
2

( x y) Z0 x
y

n m 17
1. La media y D.E. de las cargas mximas soportada por 100 cables producidos por
una compaa A son 20 toneladas y 1.1 toneladas. La media y D.E. de 60 cables
producidos por otra compaa B es de 16 toneladas y 0.8 toneladas,
respectivamente. Determine un IC del 95% para la diferencia de cargas mximas
medias.

18
3. Intervalo de Confianza para una proporcin,
muestras grandes (n 30).

p=X/n es un estimador puntual de P


Si P es desconocido se puede establecer un IC para P, (P1 P P2)
considerando la distribucin muestral de p.
Para una muestra aleatoria de tamao n suficientemente grande (n30),
la v.a. p tiene una distribucin aproximadamente normal con media y
varianza:
p E ( p) P p2
pq
n

La v.a. p P tiene una distribucin normal para n grande


Z
pq
n
19
Una vez elegido , se puede encontrar Z0 como:

P Z0 Z Z0


pP
P Z 0 Z0
pq
n

pq pq
P p Z0 P p Z0
n n

20
Para muestreo sin reemplazo

pq N n pq N n
P p Z0 P p Z0
n N 1 n N 1

1. Una investigacin efectuada a 400 familias de clase media revel que en la


realizacin de fiestas familiares, el 62% prefera el pisco a cualquier otra calse de
licor. Determine los LC del 99%.
2. El gerente de una agencia bancaria que tiene 1000 cuenta habitantes desea
determinar la proporcin la proporcin de sus cuentahabitantes a los cuales les
paga el sueldo por semana. Se selecciona una muestra de 100 cuentahabitantes,
de los cuales 30 indican que se les pag por semana. Determine el intervalo del
90% de confianza de la proporcin real de cuentahabitantes a quienes se les
pag por semana.

21
4. Intervalo de Confianza para la diferencia de
proporciones

Un IC para P1 P2 puede establecerse considerando la distribucin muestral de


p1p2. Para n suficientemente grande (n30), p1p2 se distribuye
aproximadamente normal con media p1p2 y varianza:

p1q1 p2 q2
2
p1 p 2
n1 n2

Entonces:

( p1 p2 ) ( P1 P2 )
Z
P1Q1 P2Q2

n1 n2

tiene aproximadamente una distribucin N(0,1) 22


Elegido un podemos encontrar Z0 tal que:

P Z0 Z Z0



( p p ) ( P P )
P Z 0 1 2 1 2
Z0
P1Q1 P2Q2

n1 n 2

P1Q1 P2Q2 P1Q1 P2Q2


P ( p1 p2 ) Z 0 ( P1 P2 ) ( P1 P2 ) Z 0
n1 n2 n1 n2

P1Q1 P2Q2 P1Q1 P2Q2


( p1 p2 ) Z 0 ; ( P1 P2 ) Z 0
n1 n2 n1 n2

P1Q1 P2Q2
( p1 p2 ) Z 0
n1 n2 23
1. Se ha encontrado que 25 de 250 cinescopios de
televisin producidos por el proceso A son
defectuosos y que 14 de 180 producidos por un
proceso B son defectuosos. Asumiendo que el
muestreo es aleatorio, determine un intervalo del
99% de confianza para la diferencia verdadera en la
proporcin de defectuosas, de los dos procesos.

24
5. Intervalo de Confianza para la media con varianza
desconocida, muestra pequea.

Sea X una v.a. con distribucin aproximadamente normal con media y varianza 2
(desconocida), en cuyo caso el estimador puntual es S2.
La media muestra es adecuada para estimar , pero como no se conoce 2, se usa la
distribucin muestral de la v.a.
x n
T
S

que tiene una distribucin t con n-1 gl

Entonces, elegido =1-, puede determinarse dos valores t1 y t2 tal que:

Pt1 T t2 1
25
Hay muchas formas de escoger t1 y t2 que cumplen tal condicin, la mas simple es
tomar t2=t1=t0

- t0 t0

Luego P t0 T t0 1

x
P t0 n t0
S
26
t0 S t0 S
P x x
n n

t0 S t0 S
x ; x
n n

t0 S
x
n
27
Para muestreo sin reemplazo en poblaciones finitas

t0 S N n t0 S N n
P x x
n N 1 n N 1

t0 S N n t0 S N n
x ;x
n N 1 n N 1

t0 S N n
x
n N 1 28
1. El dimetro final de un cable elctrico blindado es distribuido normalmente. Una
muestra de tamao 20 produce una media de 0.79 y una D.E. muestral de 0.01.
Determine un intervalo de confianza del 95% para .

2. A un laboratorio de ensayo de materiales se lleva una muestra de 10 cables para


obtener sus cargas de rotura a la traccin. Los resultados obtenidos (kg/cm2)
fueron: 280, 295, 308, 320, 265, 350, 300, 310, 285, 310. Considerando que estas
cargas poseen distribucin de probabilidad normal, determine el IC de 90% para
la media de la poblacin.

3. Los ingresos del ingreso sobre ventas en una ciudad que tiene un total de 300
establecimientos comerciales se recogen cada trimestre. Los siguientes datos
representan los ingresos (en miles) cobrados durante el primer trimestre en una
muestra de nueve establecimientos comerciales: 16, 18, 11, 17, 13, 10, 22, 15, 16.
a) Determine un intervalo con 95% de confianza de los ingresos trimestrales del
impuesto sobre ventas en los establecimientos comerciales, b) Determine una
estimacin del intervalo con 95% de confianza de los ingresos totales por
impuesto sobre ventas que recogern este trimestre. 29
x

6. Intervalo de Confianza para diferencia de medias


con varianzas desconocidas pero iguales, muestras
pequeas.
Sea X una v.a. distribuida normalmente con media x y varianza 2 desconocida.
Sea Y una v.a. independiente distribuida normalmente con media y y varianza 2
desconocida.
Sea x la media muestral de una muestra aleatoria de n (n<30) observaciones de X y,
sea y la media muestral de una muestra aleatoria de m (m<30( observaciones de Y.

( x y ) ( x y )
Luego T
1 1 (n 1) S x (m 1) S y
2 2


n m nm2
tiene una distribucin t con n+m-2 grados de libertad. Dado que T no
depende de x-y; y elegido se puede encontrar t0, tal que:

P t0 T t0 30
Si Sc = desviacin estndar combinada

(n 1) S x2 (m 1) S y2
Sc
nm2

( x y ) ( x y )
Entonces T
1 1
( Sc )
n m


( x y ) ( x y )
P t0 t0
1 1
( S )
n m
c

1 1 1 1
P ( x y ) t0 (Sc ) x y ( x y ) t0 (Sc )
n m n m 31
Restituyendo Sc
1 1 (n 1) S x (m 1) S y
2 2
1 1 (n 1) S x (m 1) S y
2 2

( x y ) t0 ; ( x y ) t0
n m nm2 n m nm2

1 1 (n 1) S x2 (m 1) S y2
( x y ) t0
n m nm2

1. Las siguientes son 16 determinaciones independientes del punto de fusin de un


compuesto, ocho hechas por un analista A y ocho por un analista B. Los
resultados fueron (C).
Analista A (X) 164.4 169.7 169.2 169.5 161.8 168.7 169.5 163.9
Analista B (Y) 163.5 162.8 163.0 163.2 160.7 161.5 160.9 162.1

Hallar un IC del 90% para la diferencia media entre analistas, suponiendo


varianzas iguales pero desconocidas.
32
7. Intervalo de Confianza para la varianza

Sea X una v.a. distribuida normalmente con media y varianza 2 desconocidos.


Sea x la media muestral y S2 la varianza muestral de X, de tamao n

Se conoce que:
(n 1) S 2 i
( X X ) 2

X2 i 1
2 2

tiene una distribucin chi-cuadrado con n-1 grados de libertad; depende de 2,


pero su distribucin no, por tanto, elegido se puede encontrar a y b, tal que:

P(a X 2 b)

P( X 2 b) P( X 2 a)
33
Una forma de escoger a y b es: P( X 2 a ) 2

P( X 2 b) 1 2

Donde =1-. Entonces: a X 2 2 b X 12 2


/2 /2

X 2 2 X 12 2
34
P(a X 2 b) P( X 2 b) P( X 2 a)

De: P(a X 2 b) P( X 2 b) P( X 2 a)

Se obtiene
P X 2 2 X 2 X12 2

1 1
2 2

Donde X 2 2 y X 12 2 son valores de chi-cuadrado con n-1 grados de libertad tales


que:

P( X 2 X 2 2 ) 2 y P( X 2 X12 2 ) 1 2
35
(n 1) S 2
Luego, reemplazando X2 por:
2

2 (n 1) S 2
se obtiene P X 2 X 1 2
2

1 2 1
P 2 2
X 1 2 (n 1) S
2
X 2

(n 1) S 2 (n 1) S 2
P 2

2
2 1
X 1 2 X 2

(n 1) S 2 (n 1) S 2
2
; 2
X 1 2 X 2

36
La estimacin del intervalo de 100 % de confianza para la desviacin estndar es:

n 1 n 1
P S 2
S 2
1
X 1 2 X 2

n 1 n 1
S 2
;S 2
X 1 2 X 2

1. A un laboratorio de ensayo de materiales se lleva una muestra de 10 cables


para obtener sus cargas de rotura a la traccin. Los resultados obtenidos
(kg/cm2) fueron: 280, 295, 308, 320, 265, 350, 300, 310, 285, 310.
Considerando que estas cargas poseen distribucin de probabilidad normal,
determine el IC de 90% para la desviacin estndar de la poblacin.

37
8. Intervalo de Confianza para la razn de dos
varianzas
Sea X una v.a. distribuida normalmente con media x y varianza x2 , y sea Y una v.a.
independiente (de X) distribuida normalmente con media y y varianza y2
Sea Sx2 la varianza muestral basada en una muestra aleatoria de tamao n de X, y sea
Sy2 la varianza muestral basada en una muestra aleatoria de tamao m de Y.

S x2 x2 S x2 y
2
Entonces F 2 2 2 2
Sy y Sy x

tiene una distribucin F con n-1 y m-1 grados de libertad. Su distribucin no depende
de x2 y2; elegido , se puede hallar c y d, tal que:

P(c F d )

P( F d ) P( F c)
38
Eligiendo c y d de modo que: P( F c) 2 P( F d ) 1 2

donde = 1- = 1 -

Es decir c f 2, n 1, m 1 d f1 2, n 1, m 1

Luego P(c F d ) P f 2, n 1, m 1 F f1 2, n 1, m 1 1

donde f/2 y f1-/2 son valores de la distribucin F con n-1 y m-1 grados de libertad,
dejando reas bajo la curva de /2 y 1-/2, respectivamente a la izquierda.

39
Entonces P f 2, n 1, m 1 F f1 2, n 1, m 1

2
S 2

P f 2 , n 1, m 1
x y
f1 2, n 1, m 1
2
S x2
y

1 S 2
2
1
P 2 2
y x
f S f
1 2,n 1,m1 x y 2, n 1, m 1

S x2 1 2
S 2
1
P 2 2 2
x x
S f S f
y 1 2, n 1, m 1 y y 2 , n 1, m 1

S x2 1 S 2
1
; x
S2 f S 2
f
y 1 2, n 1, m 1 y 2, n 1, m 1 40

/2 /2

f 2 f1 2

Intervalo de confianza para la razn

S 1 Sx 1
x ;
Sy f1 2 , n 1, m 1 S y f
2 , n 1, m 1
41
1. Se preparan dos diferentes tandas de cemento, y de cada una se
fbrica gran nmero de tabiques. Se toma una muestra de seis
tabiques de cada tanda, y la fuerza de tensin en lb/pulg2, se
mide para cada tabique de las dos muestras. Suponiendo que la
fuerza de tensin est normalmente distribuido con varianza i2,
i=1, 2. Hallar un IC de 95% para la razn de las dos desviaciones
estndar 1/2

Tanda 1 536 492 528 572 582 506


Tanda 2 555 567 550 550 535 540

42
Ejercicio 04. La media y la desviacin estndar
de las cargas mxima soportada por 100 cables
producidos por la compaa Duramas son 20
toneladas y 1.1 tonelada. La media y la
desviacin estndar de 60 cables preoducidos
por la Compaa Cableco son 16 toneladas y
0.8 toneladas, respectivamente. Determinar un
intervalo de confianza del 95 % para la
diferencia de cargas mximas medias. (Rpta.
P(3.7,4.3)=0.95. (R. Moya, Pag. 660).
.n1 = 100; X1 = 20; S1 = 1.1; Z = 1.96
.n2 = 60; X2 = 16; S2 = 0.8.
43
Ejercicio 05a. Una compaa exportadora de
caf quiere escoger la mejor calidad de caf de
exportacin entre dos variedades de caf en
grano: A (Chanchamayo) y B (Quillabamba).
Elegir la variedad de caf que contenga el
menor porcentaje de impurezas por saco de un
quintal. Se sabe que los porcentajes de
impurezas de saco de cada variedad de caf
tienen distribucin normal y con la misma
varianza. (Crdova Manuel, Pg. 76)

44
Dos muestras aleatorias independientes una de 10 sacos
de A y la otra de 12 sacos de B, revelaron los siguientes
porcentajes de impurezas por saco de caf:
A: 4, 3, 6, 6, 5, 6, 7, 4, 7, 6
B: 7, 6, 10, 8, 9, 8, 7, 6, 7, 9, 5, 8
Estime mediante un intervalo de confianza del 95% la
diferencia entre los dos promedios de porcentajes de
impurezas por saco de toda la produccin de las dos
variedades de caf. qu variedad de caf debera elegir
para la exportacin?. Rpta. P(-3.354, -0.846)=0.95.

45
Ejercicio 05b. El jefe de personal de una empresa de
confecciones quiere comparar las medias de los
tiempos en minutos que operarios hombres y mujeres
utilizan para confeccionar una camisa. Se supone que
las dos poblaciones de tiempos tienen distribucin
normal con varianza homognea. Dos muestras
aleatorias de tamao 16 revelaron las siguientes
estadsticas: X1 = 38, S1 = 6 y X2 = 35, S2 = 4 .
Utilizando un intervalo de confianza del 95%, se
puede concluir que en promedio los hombres y las
mujeres utilizan el mismo tiempo?, suponiendo
varianzas iguales pero desconocidas. (Crdova Manuel. Pg. 100).

46
Problema 05c. Se lleva a cabo un estudio para
comparar el sueldo en Lima de los ingenieros
(B1) y de los administradores (B2) egresados de
la PUCP. Las experiencias anteriores indican que
la distribucin de los sueldos tanto de B1 como
en B2 es normal y con varianzas diferentes. Dos
muestras aleatorias, una de 9 sueldos de B1 y
otra de 8 de B2 dieron los siguientes ingresos en
miles de dlares:
B1: 1.2, 2.8, 1.0, 2.5, 2.4, 1.9, 2.2, 2.3, 1.7
B2: 1.6, 2.0, 1.6, 2.0, 1.6, 1.7, 1.5, 2.1
47
Ejercicio 06. El gerente de operaciones de una
empresa de confecciones debe tomar la decisin
entre dos procesos de manufactura A y B para la
fabricacin de una prenda. Eligi 10 operaciones
eficientes y cada uno de ellos utiliz los dos procesos
de manufactura para fabricar la prenda, resultando los
siguientes tiempos en minutos para los procesos de
manufactura A y B. (Crdova Manuel. Pg. 80)

d i d 2
n ( d ) 2

d i 1 Sd
n n 1

48
Ejercicio 07. Durante cierta semana, una tienda de
departamentos observo y registr que 5,750 de las
12500 personas que entraron en la tienda hicieron por
lo menos una compra. Tratando esto como una muestra
al azar de todos los clientes potenciales, hallar el
intervalo de confianza del 99 % para la proporcin real
de personas que entran en la tienda y que harn por lo
menos una compra.
(Rpta: p(0.45,0.47)=0.99. (R. Moya. Pag. 662).
Cul ser el tamao de la muestra n al 99% central
con un error estadstico aceptado: e = 0.015?.

49
Ejercicio 08. El gerente cree que el 40 % de 2000
comerciantes demandan lavadoras a una compaa.
Establecer un intervalo de confianza del 95 %. Para ello
se toma se toma una muestra al azar de 400
comerciantes, para la proporcin real de comerciantes
que demandarn lavadoras a la compaa.
Cul ser el tamao de la muestra n al 95% central
con un error estadstico aceptado: e = 0.05?. (Taro Yamane, Pg.
134).

50
Ejercicio 09. Se ha encontrado que 25 de 250
cinescopios de televisin producidos por el
proceso A son defectuosos y que 14 de 180
producidos por un proceso B son defectuosos.
Suponiendo que el muestreo es aleatorio,
determinar el intervalo de confianza del 99 % de
confianza para la diferencia verdadera es la
proporcin de defectuosos, de los dos procesos.
(Rpta, p(-0.049, 0.093). (R. Moya, Pag. 669).

51
Ejercicio 10. Los siguientes son los pesos, en
decagramos, de 10 paquetes de semillas de pasto
distribuidos por determinada compaa: 46.4,
46.1, 45.8, 47, 46.1, 45.9, 45.8, 46.9, 45.2, 46.
Encuntrese un intervalo de confianza de 95 %
para la variancia de todos los paquetes de
semillas de pasto que distribuy por esta
compaa, suponiendo una poblacin normal.
Rpta, p(0.135, 0.953). (Walpole-Myers, Pg.. 274).

52

Vous aimerez peut-être aussi