Vous êtes sur la page 1sur 14

ESTIMACIN

La estadstica inferencial toma como base las relaciones existentes entre las muestras y la
poblacin, para inferir sobre un parmetro de la poblacin a partir de las muestras. Cualquier
inferencia que se haga sobre la poblacin tendr que basarse necesariamente en estadsticos
muestrales, es decir, en funciones de la informacin muestral. El verdadero parmetro ser
desconocido, y un objetivo ser estimar su valor.

Un estimador de un parmetro poblacional es una variable aleatoria que depende de la


informacin muestral y cuyas realizaciones proporcionan aproximaciones al valor
desconocido del parmetro. Se llama estimacin a una realizacin especfica de esta variable
aleatoria.

ESTIMACIN PUNTUAL

Un estimador puntual de un parmetro poblacional es una funcin de la muestra que da como


resultado un nico valor. La correspondiente realizacin se llama estimacin puntual del
parmetro. La notacin para parmetros, estimadores puntuales y estimaciones ms comunes
es:
Medida Parmetro Estimador Estimacin
Media X x
Varianza 2
S 2
s2
Desviacin tpica S s
Proporcin P
p

PROPIEDADES DE LOS ESTIMADORES: No hay un nico criterio para seleccionar el


mejor estimador puntual para todas las circunstancias. Slo se dispone de un conjunto de
criterios bajo los cuales pueden evaluarse distintos estimadores. En casi todos los casos, la
media, la varianza, la desviacin tpica y la proporcin muestrales son estimadores
satisfactorios para los correspondientes valores poblacionales. Sin embargo, existen problemas
para los cuales la eleccin apropiada de un estimador puntual no resulta tan evidente.

Estimador Insesgado: Se dice que es un estimador insesgado del parmetro si:

E( ) =

La media y la proporcin muestral son estimadores insesgados de los correspondientes


parmetros poblacionales. La varianza muestral tambin es insesgada si la poblacin es
grande, y la desviacin tpica muestral no es un estimador insesgado de la desviacin tpica
poblacional. El sesgo de se define como la diferencia entre su esperanza y , es decir,

Sesgo ( ) = E( ) -

De aqu se deduce que el sesgo de un estimador insesgado es 0.


Estimador Eficiente: Sean 1 y 2 dos estimadores insesgados de , obtenidos en muestras
del mismo tamao, entonces se dice que 1 es ms eficiente que 2 si: V( 1) < V( 2). La
eficiencia relativa de un estimador con respecto al otro es el cociente de sus varianzas, es
decir:

V (2 )
Eficiencia relativa =
V ( )
1

Puede demostrarse que la mediana tambin es un estimador insesgado para la media de la


poblacin y que su varianza es:

X2 1,57 X2
V (M e )
2 n n

El resultado indica que la media muestral es ms eficiente que la mediana. La eficiencia


relativa de la media con respecto a la mediana es:

V (M e )
Eficiencia relativa = 1,57
V (X )

La varianza de la mediana muestral es un 57% mayor que la media muestral. Para obtener una
mediana con la misma varianza que la media, debe tomarse una muestra con un 57% ms de
observaciones.

Si es un estimador insesgado de , y no hay ningn otro estimador insesgado que tenga


menor varianza, entonces se dice que es el estimador insesgado ms eficiente o de
mnima varianza de .

Estimador Consistente: Si para cualquier positivo, no importando lo pequeo que sea, si


P[ n- <] tiende a uno cuando n tiende a infinito, se dice que el estimador es consistente.
De manera informal, lo que esto significa es que si se utiliza un estimador consistente con una
muestra infinita, se obtendr el resultado correcto.

ESTIMACIN POR INTERVALOS

Un estimador por intervalos de un parmetro poblacional es una variable aleatoria basada en


informacin muestral para determinar un rango, o un intervalo, en el cual posiblemente se
encuentre dicho parmetro. La estimacin correspondiente se denomina estimacin por
intervalos. Basados en la informacin muestral, se pueden encontrar variables aleatorias A y B
tales que:
P(A< < B) = 1-

2
Una realizacin particular de A y B es notada por a y b, entonces al intervalo (a,b) se le
denomina como un intervalo de confianza al 100(1-)% para . A se le conoce como el
nivel de significancia y a 1- como el nivel de confianza o confiabilidad

INTERVALO DE CONFIANZA PARA LA MEDIA

a. Varianza poblacional conocida: Se cuenta con una muestra aleatoria de n observaciones


con media muestral X procedente de una poblacin normal con varianza conocida 2. La
deduccin del intervalo parte del principio que P(-z / 2 < Z < z / 2 ) = 1- , y sabiendo que el
estadstico:

n X X
N(0,1) ,entonces,
X

n X X
P z / 2 z / 2 1
X


P z / 2 X X X z / 2 X 1
n n


P X z / 2 X X X z / 2 X 1
n n


P X z / 2 X X X z / 2 X 1
n n

Dada una muestra particular con media x , entonces un intervalo de confianza al 100(1- )%
para con 2 conocido, viene dado por:

X
x z / 2 X x z / 2 X
n n

El intervalo tambin se puede notar como:


IC ( )100 (1 )% x z / 2 , x t
n n


IC ( )100 (1 )% x z / 2
n

3
Si las muestras son grandes, el intervalo sirve an si la poblacin no es normal. Asumir que en
un estudio se conoce la varianza poblacional, es en la mayora de los casos un supuesto irreal,
por esto, es necesario contar con la alternativa de intervalos que no tenga este supuesto tan
fuerte.

b. Varianza poblacional desconocida: Se cuenta con una muestra aleatoria de n


observaciones procedentes de una distribucin normal, con media y desviacin tpica
muestrales X y S2 respectivamente. Dado que no se conoce la varianza, se hace una
estimacin de ella a partir de S2, y para deducir el intervalo se parte del estadstico:

n X X
t(n-1)
SX

Por procedimiento similar al anterior:

n X X
P t ( n 1, / 2 ) t ( n 1, / 2) 1
SX

S S
P t ( n 1, / 2) X X X t ( n 1, / 2 ) X 1
n n

S S
P X t ( n 1, / 2) X X X t ( n 1, / 2) X 1
n n

S S
P X t ( n 1, / 2 ) X X X t ( n 1, / 2 ) X 1
n n

Dada una muestra particular con media x y varianza s2, entonces un intervalo de confianza al
100(1-)% para con 2 desconocido, viene dado por:
s s
x t ( n 1, / 2 ) x t ( n 1, / 2 )
n n

El valor t(n -1, /2) es un valor de la distribucin t de Student con n-1 grados de libertad, tal que
P(t(n) > t(n-1 , )) = . Otras notaciones apropiadas para el intervalo son:

s s
IC ( )100 (1 )% x t ( n 1, / 2) , x t ( n 1, / 2 )
n n
s
IC ( )100(1 )% x t ( n 1, / 2)
n

4
Si la muestra es superior a las 60 unidades, la distribucin t es muy aproximada a la normal
estndar, por tanto el intervalo se puede construir usando la tabla de la normal estndar, an
cuando los datos muestrales no sean normales. As pues:
s
IC ( )100(1 )% x z / 2
n

Ejemplo: Un fabricante de cigarrillos afirma que el contenido de nicotina en sus cigarrillos es


de 1,7 mg. Se toma una muestra de 20 cigarrillos y se encontr que el contenido medio era 2,2
con una desviacin estndar de 0,8 mg. Evaluar la afirmacin del fabricante con base en un
intervalo de confianza del 95%.

s s
IC ( ) 95% x t (19,0,025 ) ; x t (19,0,025 )
n n
0,8 0,8
2,2 2,0930 ; 2,2 2,0930
20 20
(2,2 0,3744 ; 2,2 0,3744)
(1,8 ; 2,6)

Se concluye con una confiabilidad del 95% que el verdadero contenido de nicotina estar entre
1,8 y 2,6 mg. Con esa confianza se afirma que la afirmacin del gerente no es cierta, pues no
encierra el valor de su afirmacin, que es 1,7 mg.

Ejemplo: El gerente de un hospital afirma que el tiempo de espera de atencin a los pacientes
en urgencias es de 21 minutos. El director del departamento de control de calidad de una
organizacin de salubridad desea evaluar esta afirmacin y para ello toma una muestra
aleatoria de 25 pacientes de un libro de citas y encontr que el tiempo promedio era de 25,5
minutos con una desviacin tpica de 7 minutos. El clculo de un intervalo de confianza al
95% es:

s s
IC ( ) 95% x t ( 24, 0, 025) , x t ( 24, 0, 025)
n n
7 7
25,5 2,0639 , 25,5 2,0639
25 25
(25,5 2,8895 , 25,5 2,8895)
(22,61 , 28,39)

El resultado tambin se puede ilustrar como IC()95% = 25,5 2,8895. Se concluye con una
confiabilidad del 95% que el verdadero tiempo de espera est entre 22,61 y 28,39 minutos.
Con esa confianza se afirma que la afirmacin del gerente no es cierta.
Si la confiabilidad fuera del 99% y del 90% los intervalos tomaran el siguiente valor
respectivo:

IC ( ) 99% ( 21,58 , 29,42) 25,5 3,92

5
IC ( ) 90% (23,1 , 27,9) 25,5 2,4

Claramente se ve que si se quiere tener ms confiabilidad de cobijar el parmetro desconocido


con el intervalo, este se ampla. Sobre el tamao que han de tomar los intervalos se puede
concluir lo siguiente:

a. Los intervalos de estn centrados con respecto a la media muestral.

b. Entre mayor confianza se requiera para que el intervalo contenga a , el intervalo ser ms
amplio.

c. Entre ms variable sea la muestra, el intervalo ser ms amplio.

d. Si el tamao de muestra es grande, ms angostos sern los intervalos, aunque ello no


asegura consistentemente que los intervalos sean angostos, pues si la poblacin es muy
variable la varianza ser grande y por tanto tambin los intervalos.

INTERVALO DE CONFIANZA PARA LA PROPORCIN POBLACIONAL

Sea P la proporcin muestral de xitos en una muestra aleatoria de n observaciones


procedentes de una poblacin con una proporcin de xitos. Entonces si n es grande (n40),
un intervalo de confianza del 100(1-)% para la proporcin poblacional se deduce como:



P
P z / 2 z / 2 1
(1 )

n

(1 ) (1 )
P P z / 2 P z / 2 1
n n

(1 ) (1 )
P P z / 2 P z / 2 1
n n

El intervalo quedara en funcin del parmetro desconocido , pero al reemplazar este por el
estimador P, la aproximacin normal del estadstico base sigue siendo vlida, luego:

PQ PQ
P P z / 2 P z / 2 1
n n

6
Si p es una realizacin particular de P, entonces un intervalo de confianza al 100(1-)% de
viene dada por:

p (1 p ) p (1 p )
p z / 2 p z / 2
n n

Otras notaciones apropiadas para el intervalo son:

p (1 p ) p (1 p )
IC ( p )100 (1 )% p z / 2 , p z / 2
n n

p (1 p )
IC ( p )100 (1 )% p z / 2
n

Ejemplo: En una encuesta donde se pregunt a 400 personas sobre la preferencia por un
candidato, se encontr que el 28% votara por l en las siguientes elecciones. Un intervalo de
confianza del 95% para estimar la proporcin verdadera viene dado por:

0,28(1 0,28) 0,28(1 0,28)


IC ( p ) 0,28 1,96 , 0,28 1,96

95% 400 400

0,28 1,96 * 0,0224 , 0,28 1,96 * 0,0224
(0,28 0,044 ; 0,28 0,044)
(0,236 , 0,324) 0.28 0.044

Se concluye con una confiabilidad del 95% que la verdadera proporcin de personas que
votar por el candidato en las prximas elecciones est entre el 23,6% y el 32,4%.

0,28(1 0,28)
El valor se( ) 0,0224 , es el error estndar estimado de P.
400

INTERVALO DE CONFIANZA PARA LA VARIANZA POBLACIONAL

Sea S 2 la varianza muestral de una muestra aleatoria de n observaciones procedentes de una


poblacin normal. Entonces un intervalo de confianza del 100(1-)% para la varianza
poblacional se deduce como:

(n 1) S 2
P (2n 1,1 / 2 ) (2n 1, / 2 ) 1
2

7
(2n 1,1 / 2) 1 (2n 1, / 2 )
P 2 1
(n 1) S 2 (n 1) S 2

(n 1) S 2 (n 1) S 2
P 2
1
2 (2n 1,1 / 2 )
( n 1, / 2 )

Si s2 es una realizacin particular de S2, entonces un intervalo de confianza del 100(1-)%


para 2 es:

( n 1) s 2 ( n 1) s 2
IC ( 2 )100(1 %) ;
2
( n 1, / 2 ) ( n 1,1 / 2 )
2

8
DOS POBLACIONES
INTERVALO DE CONFIANZA PARA EL COCIENTE DE VARIANZAS

Tenemos dos muestras aleatorias independientes X1, X2, , XnX y Y1, Y2, , YnY,
provenientes de poblaciones normales, entonces:

P f ( nX 1 , nY 1 , 1 / 2 ) F ( n X 1; nY 1) f ( nX 1 , nY 1 , / 2 ) 1

S 2 / 2
P f ( nX 1, nY 1,1 / 2) X2 X2 f ( nX 1, nY 1, / 2) 1
SY / Y

Despejando el cociente de varianzas poblacionales:

S X2 S Y2 X2 S X2 S Y2
P 2 1
f ( nX 1 , nY 1 , / 2 ) Y f ( nX 1 , nY 1,1 / 2 )

Si s X2 y sY2 son realizaciones particulares de S X2 y S Y2 respectivamente, entonces un


intervalo de confianza al 100(1-)% para el cociente de varianzas poblacionales es:

X2 s X2 sY2 s X2 sY2
IC ;
f f ( nX 1 , nY 1 ,1 / 2 )
Y
2
100 (1 )% ( nX 1, nY 1 , / 2 )

INTERVALO DE CONFIANZA PARA LA DIEFERNCIA DE MEDIAS

MUESTRAS INDEPENDIENTES: Sean dos muestras aleatorias independientes de


tamaos nX y nY, procedentes de poblaciones normales con medias X y Y y varianzas X2
y Y2 respectivamente.

a. Varianzas poblacionales conocidas: El intervalo se deduce sabiendo que:

X2 Y2

X Y n X Y ;
n X nY

P z / 2 Z z / 2 1

9


X Y X Y
P z / 2 z / 2 1
2
2


X Y

nX nY

despejando la diferencia de medias poblacionales:

X2 Y2 X2 Y2

P X Y z / 2 X Y X Y z / 2 1
n X nY n X nY

Si x y y son observaciones particulares de X y Y respectivamente, entonces un


intervalo de confianza al 100(1-)% para la diferencia de medias poblacionales es:

X2 Y2
IC X Y 100(1 )% ( x y ) z / 2
n X nY

b. Varianzas poblacionales desconocidas: Si las varianzas no son conocidas, entonces se


suponen que las poblaciones tienen una varianza comn, la cual se estima por medio de una
varianza muestral S2 donde:

(n X 1) S X2 (nY 1) S Y2
S2
n X nY 2


X Y X Y
P t ( nX nY 2, / 2 ) t ( nX nY 2, / 2 ) 1
S2 S2

nX nY

S2 S2 S 2 S 2
P X Y t ( nX nY 2, / 2) X Y X Y t ( nX nY 2, / 2 ) 1
n n n n
X Y X Y

Si x y y son observaciones particulares de X y Y respectivamente y s es una


observacin particular de S, entonces un intervalo de confianza al 100(1-)% para la
diferencia de medias poblacionales es:

IC X

Y 100(1 )%
(x y) t
(nX nY 2, / 2)

n
s2

s2
n
X Y

Si no se puede suponer que las varianzas poblacionales sean iguales, entonces para la
deduccin del intervalo en cuestin se toma como base el estadstico:

10
X Y X Y
S X2 S Y2 t(v)

n X nY

con v
s 2
X n X sY2 nY 2

s 2
X nX 2
(n X 1) sY2 nY 2
(nY 1)

Si x y y son observaciones particulares de X y Y y s X2 y sY2 realizaciones


particulares de S X2 y S Y2 respectivamente, entonces un intervalo de confianza al 100(1-)
% para la diferencia de medias poblacionales es:

s X2 sY2
IC X Y 100 (1 )% ( x y ) t ( v , / 2)
n X nY

si las muestras son grandes el valor t(v, /2) puede aproximarse por la normal estndar, as:

s X2 sY2
IC X Y 100 (1 )% ( x y ) z / 2
n X nY

Ejemplo: Se estn ensayando dos procedimientos distintos de fabricacin de cables de acero.


Dadas dos muestras, una para cada procedimiento, construir un intervalo de confianza al 95%
para la diferencia de medias poblacionales. Asumir normalidad en los datos.

xi = {26, 17, 18, 19, 20, 16, 18, 21}


yi = {17, 21, 19, 18, 16, 21, 20, 22, 16, 19}

x 19,4 s X 3,1
y 18,9 sY 2,1

Primero se analiza si es razonable creer si las varianzas poblacionales son o no iguales:

X2 s X2 sY2 s X2 sY2 2 2 2 2

IC 2 ; 3,1 2,1 ; 3,1 2,1 (0,519 ;10,5 )
f ( nX 1, nY 1 , 0, 025) 4,197
Y 95% f ( nX 1 , nY 1 ,1 0, 025) 0,207

Como el intervalo incluye el uno, se dice que las diferencias en las varianzas no son
significativas y se puede asumir como iguales las varianzas poblacionales. Por tanto:

11
s2 s2
IC X Y 100(1 )% ( x y ) t ( nx nY 2 ; 0 , 025 )
nX nY

(n X 1) S X2 (nY 1) S Y2 (8 1) 3,12 (10 1) 2,12


Pero s 6,685
2

n X nY 2 8 10 2

6,685 6,685
IC X Y 100 (1 )% (19,4 18,9) 2,12
8 10
0,475 2,6
( 2,125 ; 3,075)

El intervalo incluye el cero, lo cual sugiere que existe evidencia en las muestras como para
afirmar que las medias poblacionales no son diferentes.

MUESTRAS PAREADAS: Se cuenta con una muestra aleatoria de n pares de


observaciones (X1,Y1), (X2,Y2), ..., (Xn,Yn) procedentes de poblaciones con medias X y Y
respectivamente. Si las diferencias de cada par di= Xi -Yi se distribuyen normalmente,
entonces, un intervalo de confianza al 100(1-)% para la diferencia de medias
poblacionales viene dado por:

sd
IC X Y 100 (1 )% d t ( n 1, / 2 )
n

Ejemplo 10: Se tomaron las diferencias del crecimiento de la carga transportada en toneladas
de 17 empresas de carga que se haban fusionado con otras que no se fusionaron. Las
diferencias se tomaron en empresas con locaciones y tamaos similares, la media y desviacin
tpica fueron d 0,105 y sd = 0,44. Un intervalo de confianza del 95% para X - Y es:

0,44
IC X Y 100 (1 )% 0,015 2,12 0,015 0,226 ( 0,121 ; 0,331)
17

Como el intervalo incluye el cero, se concluye que los datos no contradicen seriamente la
conclusin de que no existe diferencia significativa en las medias de crecimiento de la
carga entre empresas fusionadas y no fusionadas.

INTERVALO DE CONFIANZA PARA LA DIEFERNCIA DE PROPORCIONES

Se cuenta con dos muestras aleatorias grandes, independientes, provenientes de poblaciones


con parmetros desconocidos X y Y y con proporciones muestrales PX y PY
respectivamente. Dado que la diferencia de proporciones tiene distribucin normal

12
estndar, entonces se puede deducir que un intervalo de confianza al 100(1- )% para la
diferencia de proporciones poblacionales viene dado por:

p X q X p Y qY
IC X Y 100(1 )% ( p X p Y ) z / 2
nX nY

Ejemplo: De una muestra aleatoria de 100 personas de la regin A, el 29% afirma que votar
por el candidato conservador y en una muestra aleatoria independiente de 200 personas de la
regin B el 15%. Un intervalo de confianza al 95% para la diferencia de proporciones es:

0,29(0,71) 0,15(0,85)
IC p X pY 100 (1 )% (0,29 0,15) 1,96
100 200
0,14 0,102
(0,038 ; 0,242)

Como la diferencia no cobija el cero entonces se dice con una confianza del 95% que la
preferencia entre electores de la regin A y B es significativamente diferente.

TAMAO DE MUESTRA PARA ESTIMAR UNA PROPORCIN

El tamao de muestra de una investigacin se determina eligiendo el mximo tamao de


muestra necesario para estimar cada uno de los parmetros de incertidumbre del estudio. El
tamao de muestra necesario para estimar una proporcin se calcula poniendo una
condicin sobre la magnitud que determina la longitud del intervalo de confianza:

p q
L z / 2
n

z2 / 2 p q
despejando n
L2

el valor p q es mximo cuando p 0,5 as n ser mximo si:

z2 / 2 0,25
n
L2

Ejemplo: Para averiguar por la preferencia de votacin de un candidato, se desea que la


distancia del intervalo sea del 3% con una confianza del 95%.

1,96 2 (0,25)
n 1.067,1 1.068
0,03 2

13
La confianza para obtener un error del 3% en la estimacin del parmetro es del 95%. Se
afirma que n es suficiente para que la estimacin p est alejada de la verdadera
proporcin poblacional p en 0,03 con una probabilidad del 95%. Abreviadamente se afirma
en los medios que la proporcin tendr un margen de error del 3%.

14

Vous aimerez peut-être aussi