Académique Documents
Professionnel Documents
Culture Documents
La estadstica inferencial toma como base las relaciones existentes entre las muestras y la
poblacin, para inferir sobre un parmetro de la poblacin a partir de las muestras. Cualquier
inferencia que se haga sobre la poblacin tendr que basarse necesariamente en estadsticos
muestrales, es decir, en funciones de la informacin muestral. El verdadero parmetro ser
desconocido, y un objetivo ser estimar su valor.
ESTIMACIN PUNTUAL
E( ) =
Sesgo ( ) = E( ) -
V (2 )
Eficiencia relativa =
V ( )
1
X2 1,57 X2
V (M e )
2 n n
V (M e )
Eficiencia relativa = 1,57
V (X )
La varianza de la mediana muestral es un 57% mayor que la media muestral. Para obtener una
mediana con la misma varianza que la media, debe tomarse una muestra con un 57% ms de
observaciones.
2
Una realizacin particular de A y B es notada por a y b, entonces al intervalo (a,b) se le
denomina como un intervalo de confianza al 100(1-)% para . A se le conoce como el
nivel de significancia y a 1- como el nivel de confianza o confiabilidad
n X X
N(0,1) ,entonces,
X
n X X
P z / 2 z / 2 1
X
P z / 2 X X X z / 2 X 1
n n
P X z / 2 X X X z / 2 X 1
n n
P X z / 2 X X X z / 2 X 1
n n
Dada una muestra particular con media x , entonces un intervalo de confianza al 100(1- )%
para con 2 conocido, viene dado por:
X
x z / 2 X x z / 2 X
n n
IC ( )100 (1 )% x z / 2 , x t
n n
IC ( )100 (1 )% x z / 2
n
3
Si las muestras son grandes, el intervalo sirve an si la poblacin no es normal. Asumir que en
un estudio se conoce la varianza poblacional, es en la mayora de los casos un supuesto irreal,
por esto, es necesario contar con la alternativa de intervalos que no tenga este supuesto tan
fuerte.
n X X
t(n-1)
SX
n X X
P t ( n 1, / 2 ) t ( n 1, / 2) 1
SX
S S
P t ( n 1, / 2) X X X t ( n 1, / 2 ) X 1
n n
S S
P X t ( n 1, / 2) X X X t ( n 1, / 2) X 1
n n
S S
P X t ( n 1, / 2 ) X X X t ( n 1, / 2 ) X 1
n n
Dada una muestra particular con media x y varianza s2, entonces un intervalo de confianza al
100(1-)% para con 2 desconocido, viene dado por:
s s
x t ( n 1, / 2 ) x t ( n 1, / 2 )
n n
El valor t(n -1, /2) es un valor de la distribucin t de Student con n-1 grados de libertad, tal que
P(t(n) > t(n-1 , )) = . Otras notaciones apropiadas para el intervalo son:
s s
IC ( )100 (1 )% x t ( n 1, / 2) , x t ( n 1, / 2 )
n n
s
IC ( )100(1 )% x t ( n 1, / 2)
n
4
Si la muestra es superior a las 60 unidades, la distribucin t es muy aproximada a la normal
estndar, por tanto el intervalo se puede construir usando la tabla de la normal estndar, an
cuando los datos muestrales no sean normales. As pues:
s
IC ( )100(1 )% x z / 2
n
s s
IC ( ) 95% x t (19,0,025 ) ; x t (19,0,025 )
n n
0,8 0,8
2,2 2,0930 ; 2,2 2,0930
20 20
(2,2 0,3744 ; 2,2 0,3744)
(1,8 ; 2,6)
Se concluye con una confiabilidad del 95% que el verdadero contenido de nicotina estar entre
1,8 y 2,6 mg. Con esa confianza se afirma que la afirmacin del gerente no es cierta, pues no
encierra el valor de su afirmacin, que es 1,7 mg.
Ejemplo: El gerente de un hospital afirma que el tiempo de espera de atencin a los pacientes
en urgencias es de 21 minutos. El director del departamento de control de calidad de una
organizacin de salubridad desea evaluar esta afirmacin y para ello toma una muestra
aleatoria de 25 pacientes de un libro de citas y encontr que el tiempo promedio era de 25,5
minutos con una desviacin tpica de 7 minutos. El clculo de un intervalo de confianza al
95% es:
s s
IC ( ) 95% x t ( 24, 0, 025) , x t ( 24, 0, 025)
n n
7 7
25,5 2,0639 , 25,5 2,0639
25 25
(25,5 2,8895 , 25,5 2,8895)
(22,61 , 28,39)
El resultado tambin se puede ilustrar como IC()95% = 25,5 2,8895. Se concluye con una
confiabilidad del 95% que el verdadero tiempo de espera est entre 22,61 y 28,39 minutos.
Con esa confianza se afirma que la afirmacin del gerente no es cierta.
Si la confiabilidad fuera del 99% y del 90% los intervalos tomaran el siguiente valor
respectivo:
5
IC ( ) 90% (23,1 , 27,9) 25,5 2,4
b. Entre mayor confianza se requiera para que el intervalo contenga a , el intervalo ser ms
amplio.
P
P z / 2 z / 2 1
(1 )
n
(1 ) (1 )
P P z / 2 P z / 2 1
n n
(1 ) (1 )
P P z / 2 P z / 2 1
n n
El intervalo quedara en funcin del parmetro desconocido , pero al reemplazar este por el
estimador P, la aproximacin normal del estadstico base sigue siendo vlida, luego:
PQ PQ
P P z / 2 P z / 2 1
n n
6
Si p es una realizacin particular de P, entonces un intervalo de confianza al 100(1-)% de
viene dada por:
p (1 p ) p (1 p )
p z / 2 p z / 2
n n
p (1 p ) p (1 p )
IC ( p )100 (1 )% p z / 2 , p z / 2
n n
p (1 p )
IC ( p )100 (1 )% p z / 2
n
Ejemplo: En una encuesta donde se pregunt a 400 personas sobre la preferencia por un
candidato, se encontr que el 28% votara por l en las siguientes elecciones. Un intervalo de
confianza del 95% para estimar la proporcin verdadera viene dado por:
Se concluye con una confiabilidad del 95% que la verdadera proporcin de personas que
votar por el candidato en las prximas elecciones est entre el 23,6% y el 32,4%.
0,28(1 0,28)
El valor se( ) 0,0224 , es el error estndar estimado de P.
400
(n 1) S 2
P (2n 1,1 / 2 ) (2n 1, / 2 ) 1
2
7
(2n 1,1 / 2) 1 (2n 1, / 2 )
P 2 1
(n 1) S 2 (n 1) S 2
(n 1) S 2 (n 1) S 2
P 2
1
2 (2n 1,1 / 2 )
( n 1, / 2 )
( n 1) s 2 ( n 1) s 2
IC ( 2 )100(1 %) ;
2
( n 1, / 2 ) ( n 1,1 / 2 )
2
8
DOS POBLACIONES
INTERVALO DE CONFIANZA PARA EL COCIENTE DE VARIANZAS
Tenemos dos muestras aleatorias independientes X1, X2, , XnX y Y1, Y2, , YnY,
provenientes de poblaciones normales, entonces:
P f ( nX 1 , nY 1 , 1 / 2 ) F ( n X 1; nY 1) f ( nX 1 , nY 1 , / 2 ) 1
S 2 / 2
P f ( nX 1, nY 1,1 / 2) X2 X2 f ( nX 1, nY 1, / 2) 1
SY / Y
S X2 S Y2 X2 S X2 S Y2
P 2 1
f ( nX 1 , nY 1 , / 2 ) Y f ( nX 1 , nY 1,1 / 2 )
X2 s X2 sY2 s X2 sY2
IC ;
f f ( nX 1 , nY 1 ,1 / 2 )
Y
2
100 (1 )% ( nX 1, nY 1 , / 2 )
X2 Y2
X Y n X Y ;
n X nY
P z / 2 Z z / 2 1
9
X Y X Y
P z / 2 z / 2 1
2
2
X Y
nX nY
X2 Y2 X2 Y2
P X Y z / 2 X Y X Y z / 2 1
n X nY n X nY
X2 Y2
IC X Y 100(1 )% ( x y ) z / 2
n X nY
(n X 1) S X2 (nY 1) S Y2
S2
n X nY 2
X Y X Y
P t ( nX nY 2, / 2 ) t ( nX nY 2, / 2 ) 1
S2 S2
nX nY
S2 S2 S 2 S 2
P X Y t ( nX nY 2, / 2) X Y X Y t ( nX nY 2, / 2 ) 1
n n n n
X Y X Y
IC X
Y 100(1 )%
(x y) t
(nX nY 2, / 2)
n
s2
s2
n
X Y
Si no se puede suponer que las varianzas poblacionales sean iguales, entonces para la
deduccin del intervalo en cuestin se toma como base el estadstico:
10
X Y X Y
S X2 S Y2 t(v)
n X nY
con v
s 2
X n X sY2 nY 2
s 2
X nX 2
(n X 1) sY2 nY 2
(nY 1)
s X2 sY2
IC X Y 100 (1 )% ( x y ) t ( v , / 2)
n X nY
si las muestras son grandes el valor t(v, /2) puede aproximarse por la normal estndar, as:
s X2 sY2
IC X Y 100 (1 )% ( x y ) z / 2
n X nY
x 19,4 s X 3,1
y 18,9 sY 2,1
X2 s X2 sY2 s X2 sY2 2 2 2 2
IC 2 ; 3,1 2,1 ; 3,1 2,1 (0,519 ;10,5 )
f ( nX 1, nY 1 , 0, 025) 4,197
Y 95% f ( nX 1 , nY 1 ,1 0, 025) 0,207
Como el intervalo incluye el uno, se dice que las diferencias en las varianzas no son
significativas y se puede asumir como iguales las varianzas poblacionales. Por tanto:
11
s2 s2
IC X Y 100(1 )% ( x y ) t ( nx nY 2 ; 0 , 025 )
nX nY
n X nY 2 8 10 2
6,685 6,685
IC X Y 100 (1 )% (19,4 18,9) 2,12
8 10
0,475 2,6
( 2,125 ; 3,075)
El intervalo incluye el cero, lo cual sugiere que existe evidencia en las muestras como para
afirmar que las medias poblacionales no son diferentes.
sd
IC X Y 100 (1 )% d t ( n 1, / 2 )
n
Ejemplo 10: Se tomaron las diferencias del crecimiento de la carga transportada en toneladas
de 17 empresas de carga que se haban fusionado con otras que no se fusionaron. Las
diferencias se tomaron en empresas con locaciones y tamaos similares, la media y desviacin
tpica fueron d 0,105 y sd = 0,44. Un intervalo de confianza del 95% para X - Y es:
0,44
IC X Y 100 (1 )% 0,015 2,12 0,015 0,226 ( 0,121 ; 0,331)
17
Como el intervalo incluye el cero, se concluye que los datos no contradicen seriamente la
conclusin de que no existe diferencia significativa en las medias de crecimiento de la
carga entre empresas fusionadas y no fusionadas.
12
estndar, entonces se puede deducir que un intervalo de confianza al 100(1- )% para la
diferencia de proporciones poblacionales viene dado por:
p X q X p Y qY
IC X Y 100(1 )% ( p X p Y ) z / 2
nX nY
Ejemplo: De una muestra aleatoria de 100 personas de la regin A, el 29% afirma que votar
por el candidato conservador y en una muestra aleatoria independiente de 200 personas de la
regin B el 15%. Un intervalo de confianza al 95% para la diferencia de proporciones es:
0,29(0,71) 0,15(0,85)
IC p X pY 100 (1 )% (0,29 0,15) 1,96
100 200
0,14 0,102
(0,038 ; 0,242)
Como la diferencia no cobija el cero entonces se dice con una confianza del 95% que la
preferencia entre electores de la regin A y B es significativamente diferente.
p q
L z / 2
n
z2 / 2 p q
despejando n
L2
z2 / 2 0,25
n
L2
1,96 2 (0,25)
n 1.067,1 1.068
0,03 2
13
La confianza para obtener un error del 3% en la estimacin del parmetro es del 95%. Se
afirma que n es suficiente para que la estimacin p est alejada de la verdadera
proporcin poblacional p en 0,03 con una probabilidad del 95%. Abreviadamente se afirma
en los medios que la proporcin tendr un margen de error del 3%.
14