Vous êtes sur la page 1sur 11

ESTIMACIÓN: una población

Estadística II

Euncet
Febrero 2016
ESTADÍSTICA II

Estimadores puntuales
Cualquier inferencia extraída de la población se basa en estadísticos muestrales. La elección
de los estadísticos adecuados dependerá de cuál sea el parámetro poblacional que interese. El
valor de ese parámetro será desconocido y uno de los objetivos del muestreo es estimar su
valor. Debe hacerse una distinción entre los términos estimador y estimación.
Estimador y estimación
Un estimador de un parámetro poblacional es una variable aleatoria que depende de la
información de la muestra; su valor proporciona aproximaciones a este parámetro
desconocido. Un valor específico de esa variable aleatoria se llama estimación.

Propiedades de los estimadores


Evaluaremos los estimadores basándonos en tres importantes propiedades: ausencia de sesgo,
consistencia y eficiencia.

Estimador insesgado
Se dice que un estimador puntual es un estimador insesgado de un parámetro poblacional si
su valor esperado es igual a ese parámetro; es decir, si
(̂)
entonces ̂ es un estimador insesgado de .
La media muestral, la varianza muestral y la proporción muestral son estimadores insesgados
de sus correspondientes parámetros poblacionales:
1. La media muestral es un estimador insesgado de  ].
2. La varianza muestral es un estimador insesgado de 2, [E(s2)=2].
3. )=P].
Un estimador que no es insesgado es sesgado. El grado de sesgo es la diferencia entre la media
del estimador y el verdadero parámetro.

Estimador consistente
Se dice que un estimador puntual ̂ es un estimador consistente del parámetro  si la
diferencia entre el valor esperado del estimador y el parámetro disminuye a medida que
aumenta el tamaño de la muestra. Es lo mismo que decir que el sesgo disminuye conforme
aumenta el tamaño de la muestra.

2
ESTADÍSTICA II

Estimador eficiente
Si hay varios estimadores insesgados de un parámetro, el estimador insesgado que tiene la
menor varianza es el estimador más eficiente o el estimador insesgado de varianza mínima.
Sean ̂ 1 y ̂ 2 dos estimadores insesgados de, basados en el mismo número de observaciones
muestrales. En ese caso.
1. Se dice que ̂ 1 es más eficiente que ̂ 2 si Var ( ̂ 1) < Var ( ̂ 2).
2. La eficiencia relativa de ̂ 1 con respecto a ̂ 2 es el cociente entre sus varianzas; es
decir,
̂
̂

Ejemplo
Sea x1, x2, ..., xn una muestra aleatoria extraída de una población que sigue una distribución
normal de media  y varianza 2. ¿Debe utilizarse la media muestral o la mediana muestral
para estimar la media poblacional?
Solución
Suponiendo que la población sigue una distribución normal y es de gran tamaño en
c , es un estimador insesgado de
la media poblacional y tiene una varianza:

También podría utilizarse como estimador la mediana de las observaciones muestrales. Puede
demostrarse que este estimador también es insesgado con respecto a  y que, cuando n es
grande, su varianza es:

La media muestral es más eficiente que la mediana; la eficiencia relativa de la media con
respecto a la mediana es:

La varianza de la mediana muestral es un 57 por ciento mayor que la de la media muestral.


Para que la mediana muestral tuviera una varianza tan pequeña como la media muestral,
tendría que basarse en un 57 por ciento más de observaciones. Una de las ventajas de la
mediana frente a la media es que da menos peso a las observaciones extremas.
Un posible inconveniente de la utilización de la mediana muestral como medida de la
tendencia central se encuentra en su eficiencia relativa.
Subrayamos la importancia de la utilización de un gráfico de probabilidad normal para

3
ESTADÍSTICA II

averiguar si hay alguna evidencia de ausencia de normalidad. Si la población no sigue una


distribución normal, la media muestral puede no ser el estimador más eficiente de la media
poblacional. En concreto, si los casos atípicos afectan mucho a la distribución poblacional, la
media muestral es menos eficiente que otros estimadores

Propiedades de algunos estimadores puntuales


Parámetro Estimador
poblacional puntual Propiedades
Media,  Insesgado, consistente, de máxima eficiencia (suponiendo
la existencia de normalidad)
Media,  Mediana Insesgado (suponiendo la existencia de normalidad), pero
no de máxima eficiencia
Proporción, P Insesgado, consistente, de máxima eficiencia (suponiendo
la existencia de normalidad)
Varianza, 2 s2 Insesgado, consistente, de máxima eficiencia (suponiendo
la existencia de normalidad)

Intervalo de confianza y nivel de confianza

Sea  un parámetro desconocido. Supongamos que, basándose en la información muestral, se


hallan variables aleatorias A y B tales que P(A <  < B)=1-α, donde α es cualquier número
comprendido entre 0 y 1. Si los valores muestrales específicos de A y B son a y b, entonces el
intervalo de a a b se llama intervalo de confianza de  al 100(1-α)%. La cantidad 100(1-α)% se
llama nivel de confianza del intervalo.
Si se extraen repetidamente muestras aleatorias de la población, el verdadero valor del
parámetro  se encontrará en el 100(1-α)% de los intervalos calculados de esta forma. El
intervalo de confianza calculado de esta forma se expresa de la manera siguiente:
a <  < b a un nivel de confianza del 100(1-α)%.

Intervalos de confianza de la media de una población que sigue una


distribución normal: varianza poblacional conocida
Consideremos una muestra aleatoria de n observaciones extraídas de una población que sigue
una distribución normal de media  y varianza 2 , entonces el
intervalo de confianza al 100 (1-α)% de la media poblacional, cuando la varianza es conocida,
viene dado por:

4
ESTADÍSTICA II

o, lo que es lo mismo,
± ME
donde ME, el margen de error (también llamado error de muestreo), es

La amplitud, w, es igual al doble del margen de error:


W=2(ME)
El límite superior de confianza, LSC, es

El límite inferior de confianza, LIC, es

Algunos niveles de confianza y los valores de Zα/2 correspondientes:

Ejemplo
Supongamos que el tiempo que permanecen los clientes en una tienda local de alimentación
sigue una distribución normal. Una muestra aleatoria de 16 clientes tenía un tiempo medio de
25 minutos. Supongamos que =6 minutos. Halle el error típico, el margen de error y el
intervalo de confianza de la media poblacional, , al 95 por ciento.

5
ESTADÍSTICA II

Solución
El error típico y el margen de error son:

el intervalo de confianza al 95 por ciento es 22,06 <  < 27,94.

La siguiente figura muestra la distribución en el muestreo de la media muestral de n


observaciones procedentes de una población que sigue una distribución normal de media  y
desviación típica . Esta distribución en el muestreo sigue una distribución normal de media 
y desviación típica . El intervalo de confianza de la media poblacional se basará en el valor

observado de la media muestral, es decir, en una observación extraída de nuestra distribución
en el muestreo.

Ejemplo
Un proceso produce bolsas de azúcar refinado. El peso del contenido de estas bolsas sigue una
distribución normal que tiene una desviación típica de 12 gramos. El contenido de una muestra
aleatoria de 25 bolsas tiene un peso medio de 198 gramos. Halle el límite superior de
confianza y el inferior del intervalo de confianza al 99 por ciento del verdadero peso medio de
todas las bolsas de azúcar producidas por el proceso.
Solución
En el caso del intervalo de confianza al 99 por ciento, el factor de fiabilidad es:
z0,005=2,58
y con una media muestral de 198, n=25, y una desviación típica de 12, los límites de confianza
son:

6
ESTADÍSTICA II

Ejercicios
1- Un director de personal ha observado que históricamente las puntuaciones de los tests de
aptitud realizados a los solicitantes de empleo en los niveles de entrada siguen una
distribución normal con una desviación típica de 32,4 puntos. Una muestra aleatoria de nueve
puntuaciones del grupo actual de solicitantes tenía una puntuación media de 187,9 puntos.
a) Halle el intervalo de confianza al 80 por ciento de la media poblacional de las
puntuaciones del grupo actual de solicitantes.
b) Basándose en estos resultados muestrales, un estadístico ha hallado para la media
poblacional un intervalo de confianza que va de 165,8 a 210,0 puntos. Halle el nivel de
confianza de este intervalo

2- Se sabe que la desviación típica de los volúmenes de las botellas de 710 ml de agua mineral
embotellada por una empresa es de 6 ml. Se ha tomado una muestra aleatoria de 90 botellas y
se han medido.
a) Halle el factor de fiabilidad de un intervalo de confianza al 92 por ciento de la media
poblacional de los volúmenes.
b) Calcule el error típico de la media.
c) Calcule la amplitud de un intervalo de confianza al 92 por ciento de la media
poblacional de los volúmenes.

3- Se sabe que el peso de los ladrillos que produce una fábrica sigue una distribución normal
con una desviación típica de 0,12 kilos. Una muestra aleatoria de 16 ladrillos de la producción
de hoy tenía un peso medio de 4,07 kilos.
a) Halle el intervalo de confianza al 99 por ciento del peso medio de todos los ladrillos
producidos hoy.
b) Explique sin realizar los cálculos si el intervalo de confianza al 95 de la media poblacional
tendría más amplitud, menos o igual que la obtenida en el apartado (a).
c) Se decide que mañana se tomará una muestra de 20 ladrillos. Explique sin realizar los
cálculos si el intervalo de confianza al 99 por ciento del peso medio de la producción de
mañana calculado correctamente tendría más amplitud, menos o igual que la obtenida en el
apartado (a).
d) Suponga que la desviación típica poblacional de la producción de hoy es de 0,15 kilos (no
0,12 kilos). Explique sin realizar los cálculos si el intervalo de confianza al 99 por ciento del
peso medio de la producción de hoy calculado correctamente tendría más amplitud, menos o
igual que la obtenida en el apartado (a)

7
ESTADÍSTICA II

Intervalos de confianza de la media de una población normal: varianza


poblacional desconocida
Supongamos que tenemos una muestra aleatoria de n observaciones extraídas de una
distribución normal de media  y varianza desconocida. Si la media y la desviación típica
muestrales son, respectivamente, y S, entonces los grados de libertad v=n-1 y el intervalo de
confianza al 100(1-α)% de la media poblacional, cuando la varianza es desconocida, viene
dado por:

o, lo que es lo mismo,

donde ME, el margen de error, es

Distribución t de Student
Dada una muestra aleatoria de n observaciones, de media y desviación típica S, extraída de
una población que sigue una distribución normal de media , la variable aleatoria t sigue la
distribución t de Student con (n-1) grados de libertad y viene dada por:

8
ESTADÍSTICA II

Ejemplo
Supongamos que se ha realizado recientemente un estudio con camioneros que tenían más o
menos el mismo número de años de experiencia para comprobar el comportamiento de 24
camiones de un determinado modelo en la misma autopista. Estime la media poblacional del
consumo de combustible de este modelo de camión con una confianza del 90 por ciento
suponiendo que el consumo de combustible, en millas por galón, de estos 24 camiones es
15,5 21,0 18,5 19,3 19,7 16,9 20,2 14,5
16,5 19,2 18,7 18,2 18,0 17,5 18,5 20,5
18,6 19,1 19,8 18,0 19,8 18,2 20,3 21,8
Solución:
Calculando la media y la desviación típica, tenemos que:

El intervalo de confianza al 90 por ciento es:

El intervalo de confianza es, pues, 18,1<  < 19,3

Ejercicios
4- Una tienda de ropa tiene interés en saber cuánto gastan los estudiantes universitarios en
ropa durante el primer mes del año escolar. El gasto medio de una muestra aleatoria de nueve
estudiantes es de 157,82 $ y la desviación típica muestral es de 38,89 $. Suponiendo que la
población sigue una distribución normal, halle el margen de error del intervalo de confianza al
95 por ciento de la media poblacional.

5- Preocupa la velocidad a la que se conduce en un determinado tramo de una autopista. El


radar indica la siguiente velocidad de una muestra aleatoria de siete automóviles en
kilómetros por hora:
79 73 68 77 86 71 69
Suponiendo que la población sigue una distribución normal, halle el margen de error del
intervalo de confianza al 95 por ciento de la velocidad media de todos los automóviles que
circulan por este tramo de la autopista.

9
ESTADÍSTICA II

6- Una clínica ofrece un programa de adelgazamiento. Según sus historiales, una muestra
aleatoria de 10 pacientes había experimentado las siguientes pérdidas de peso en kilos al
término del programa:
18 25 6 11 15 20 16 19 12 17
a) Halle el intervalo de confianza de la media poblacional al 99 por ciento.
b) Explique sin realizar los cálculos si el intervalo de confianza de la media poblacional al
90 por ciento sería mayor, menor o igual que el obtenido en el apartado (a).

Intervalos de confianza de la proporción de la población (grandes muestras)


la proporción observada de «éxitos» en una muestra aleatoria de n observaciones
procedentes de una población que tiene una proporción de éxitos P. En ese caso, si n es lo
suficientemente grande para que n·P·(1-P) > 9, el intervalo de confianza al 100(1-α)% de la
proporción de la población viene dado por:

o, lo que es lo mismo,

donde ME, el margen de error, es

Ejemplo
La dirección quiere una estimación de la proporción de los empleados de la empresa que es
partidaria de un plan de pluses modificado. Se ha observado que en una muestra aleatoria de
344 empleados, 261 están a favor de este plan. Halle una estimación del intervalo de confianza
al 90 por ciento de la verdadera proporción de la población que es partidaria de este plan
modificado.

Solución
Si P representa la verdadera proporción de la p la proporción muestral, los
intervalos de confianza de la proporción de la población se obtienen por medio de la siguiente
ecuación:

10
ESTADÍSTICA II

donde, en el caso de un intervalo de confianza 90 α 0,10, por lo que a partir de


la distribución normal estándar,
α/2 0 05 Zα/2 = Z0,05 = 1,645
Se deduce que:
n=344
2 / 0,759
Por lo tanto, el intervalo de confianza de la proporción de la población al 90 por ciento es

o sea, 0,721< P < 0,797.


Podríamos decir que a largo plazo alrededor del 76 por ciento (con un margen de error del 4
por ciento al nivel de confianza del 90 por ciento) de la población de todos los empleados de
esta empresa es partidario del plan modificado.

Ejercicios

7- En una muestra aleatoria de 95 empresas manufactureras, 67 han indicado que su empresa


ha obtenido la certificación ISO en los dos últimos años. Halle el intervalo de confianza al 99
por ciento de la proporción poblacional de empresas que han recibido la certificación en los
dos últimos años.
8- En un año de elecciones presidenciales, los candidatos quieren saber qué votarán los
votantes de diferentes partes del país. Suponga que se pregunta a 420 posibles votantes del
noreste si votarían a un determinado candidato si las elecciones fueran hoy. En esta muestra,
223 indicaron que votarían a favor de este candidato. ¿Cuál es el margen de error? Halle la
estimación del intervalo de confianza al 95 por ciento del apoyo con que cuenta este candidato
en el noreste.
9- Es importante que las compañías aéreas respeten las horas programadas de salida de los
vuelos. Suponga que una compañía ha examinado recientemente las horas de salida de una
muestra aleatoria de 246 vuelos y ha observado que 10 vuelos se retrasaron debido al mal
tiempo, 4 por razones de mantenimiento y el resto salió a su hora.
a) Estime el porcentaje de vuelos que salieron a su hora utilizando un nivel de confianza
del 98 por ciento.
b) Estime el porcentaje de vuelos que se retrasaron debido al mal tiempo utilizando un
nivel de confianza del 98 por ciento.

11

Vous aimerez peut-être aussi