Vous êtes sur la page 1sur 8

1

ESTIMACIÓN DE PARAMETROS

Introducción

Las poblaciones infinitas son demasiado grandes para estudiarlas en su totalidad. Su tamaño exige que tomemos
muestras, de las cuales podremos hacer inferencias sobre las poblaciones. Por ejemplo si la directora de una tienda
al menudeo quisiera saber cuál ha sido el gasto medio de sus clientes durante el último año, le sería difícil calcular
la media de centenares o quizá millares de clientes que compraron en su tienda. Mucho más fácil le resultaría
calcular la media de una muestra representativa y a partir de ella hacer una estimación de la media poblacional.

Podemos hacer dos tipos de estimación concernientes a una población:

Estimación puntual se vale de un estadístico para estimar el parámetro en un solo valor o punto. La directora de la
tienda puede elegir, por ejemplo, u na muestra de n = 500 clientes y hallar x = 37.10 dólares. Este valor sería la
estimación puntual de la media poblacional. Lo que significa que la µ = 37.10.

Estimación de intervalo es la que define un intervalo dentro del cual puede estar el parámetro desconocido. La
directora del ejemplo puede pensar que la media poblacional se encuentra en algún punto entre 35 y 38 dólares. El
intervalo puede ir acompañado de una afirmación sobre el nivel de confianza que se puede asignar a su precisión.
Por ello se llama intervalo de confianza.

Son tres los niveles de confianza que por lo común se asocian a los intervalos de confianza: 99, 95, 90%. Estos tres
niveles de confianza, se denominan coeficientes de confianza. Por ejemplo, la directora antes mencionada podría
confiar al 95% en que la media poblacional estuviera entre 35 y 38 dólares.

Las estimaciones de intervalo poseen ciertas ventajas sobre las estimaciones puntuales. A causa del error muestral
( x - µ) es posible que la x no sea igual a la µ. Pero carecemos de medios para saber a cuánto asciende el error
muestral. Con los intervalos se elude en parte esta discrepancia desconocida.

El principio del intervalo de confianza

Un intervalo de confianza tiene un límite inferior de confianza (LIC) y un límite superior de confianza (LSC). Para
hallar estos dos límites se calcula la media muestral, x , que se utiliza como estimación puntual. Después se le
suma una cantidad para hallar el límite superior de confianza y se le resta la misma cantidad para hallar el límite
inferior de confianza.

¿Cómo podemos construir un intervalo y afirmar que confiamos al 95% en que contiene µ si ni siquiera sabemos
cuál es la media poblacional?. Recordemos que el 95.5% de todas las medias muestrales se encuentran dentro de
dos errores estándar a uno y otro lado de la media poblacional. De aquí se deduce que la media poblacional se
encuentra dentro de dos errores típicos del 95.5% de todas las medias muestrales. Por consiguiente, si a partir de
cualquier media muestral nos desplazamos dos errores típicos por encima y otros dos por debajo de esa media,
podemos tener una confianza del 95.5% en que el intervalo resultante contiene la media poblacional desconocida.

Interpretación de los intervalos de confianza

Un intervalo de confianza se puede interpretar de dos maneras diferentes. Consideremos, por ejemplo, el intervalo
de 35 a 38 dólares mencionado por la directora de la tienda en relación con los gastos promedios de sus clientes en
el último año. Ella concedía una significación del 95% a ese intervalo. La primera interpretación que puede hacer
de ese intervalo:

Interpretación 1 Confía al 95% en que la media poblacional se encuentra entre 35 y 38 dólares.

Esto no significa que haya una probabilidad del 95% de que la µ se encuentre entre 35 y 38 dólares. Ésta es una
interpretación muy generalizada y totalmente equivocada del intervalo de confianza. En sentido apriorístico (es
decir, antes de formar el intervalo de confianza) hay una probabilidad del 95% de construir un intervalo que
comprenda la µ .
Pero una vez fijado el intervalo, la media poblacional: 1) está o 2) no está comprendida en él. Es decir, la
probabilidad de que el valor de µ se encuentre entre 35 y 38 dólares es 1 o 0. En ningún caso es del 95%. El 95%
de probabilidad se asigna a nuestro grado de confianza de que la µ se encuentra en el intervalo, no a la
probabilidad de que esté en él.

Interpretación 2 Parte de la constatación de que a partir de cualquier población se pueden tomar muchas muestras

diferentes de tamaño n. En concreto, podemos tomar N Cn muestras de la población, donde N es el tamaño de la


2
población y n el tamaño de la muestra. Cada muestra dará resultados diferentes. Supongamos que elegimos una
muestra de tamaño n de una población y obtenemos una x = 50. Si eligiéramos una segunda muestra del mismo
tamaño de la población, ¿obtendríamos la misma media muestral de 50? Lo más probable es que no. A causa de la
variación del error muestral, cada muestra dará una media diferente. De la misma forma, cada vez que
construyamos un intervalo de confianza obtendremos resultados algo diferentes.

PROPIEDADES DE LOS BUENOS ESTIMADORES

Conviene hacer una distinción entre estimador y estimación. Un estimador es la regla o procedimiento, expresado
en general por medio de una fórmula, que se utiliza para deducir la estimación. Por ejemplo,

X =
∑x i

n
es el estimador de la media poblacional.

Para que sea fiable, el estimador tiene que ser:

Estimador insesgado

Ésta es una propiedad deseable para un buen estimador. El término insesgado se refiere al hecho de que una media
de muestra es un estimador no sesgado de una media de población porque la distribución de muestreo de las
medias de muestra tomadas de la misma población es igual a la media de la población misma.

Estimador eficiente

La eficiencia se refiere al tamaño del error estándar de la estadística. Si comparamos dos estadísticas de una
muestra del mismo tamaño y tratamos de decidir cuál de ellas es un estimador más eficiente, escogeríamos la
estadística que tuviera el menor error estándar de la distribución de muestreo. Supongamos se escogemos una
muestra de un tamaño determinado y debemos de decidir si utilizamos o no la media de la muestra para estimar la
media de la población. Si calculamos el error estándar de la media de la muestra y nos da un valor de 1.05 y luego
calculamos el error estándar de la mediana de la muestra y tenemos que es de 1.4, diríamos que la media de la
muestra es un estimador más eficiente de la media de la población ya que su error estándar es menor que el de la
mediana.

Estimador consistente

Una estimador es consistente si, al aumentar el tamaño de la muestra, se tiene casi la certeza de que el valor del
estimador se aproxima bastante al valor del parámetro de la población.

Estimador Suficiente

Un estimador es suficiente si extrae de la muestra toda la información de interés en relación con el parámetro.

PASOS PARA LA CONSTRUCCIÓN DE UN INTERVALO DE CONFIANZA

1. Encontrar estimador puntual insesgado

2. Determinar la variable aleatoria función del estimador y del parámetro cuya distribución este definida.

Z, t, χ2 , F

3. Determinar los valores de la variable aleatoria definida en el paso (2) de acuerdo a la probabilidad establecida.

El coeficiente de confianza (1-α)100% = 0.95 es el nivel de confianza que tenemos en que el intervalo contiene el
valor desconocido del parámetro.
3
α =0.025. Es la probabilidad de que el estimador se desvíe en más
Z1 − α por σ x en valor absoluto al parámetro
poblacional.

4. Establecer la desigualdad con los valores de la variable aleatoria definidos en el paso (3) y la expresión definida
en el paso (2).

x−µ x −µ
Zα ≤ ≤Z tα ≤ ≤t α
2
σ 1−
α
2 2
s 1−
2
n n

σ σ s s
x −Ζα ≤ µ ≤ x + Ζα 2 x −τ α ≤ µ ≤ x +τ α 2
2 n n 2 n n

5. Encontrar los límites inferiores y superiores dentro de los cuales se encuentra el parámetro

6. Conclusión

INTERVALO DE CONFIANZA PARA µ CON VARIANZA POBLACIONAL CONOCIDA

Mostraremos cómo usar la distribución muestral de X para determinar un estimado de intervalo de una media de
población:

Se conoce la varianza poblacional σ² ó la muestra es grande (n>30)

Variable a utilizar= Z
x−µ
z=
σ
n

σ σ
P ( X − Zα < µ < X + Zα ) = 1− α
2 n 2 n
Error Muestral

Siempre que se usa una media de muestra para proporcionar un estimado de punto de una media poblacional,
alguien puede preguntar: ¿ qué tan bueno es el estimado? La pregunta "¿qué tan bueno?" , es una forma de indagar
el errror incurrido cuando se usa el valor de x como un estimado puntual de µ . En general el valor absoluto de la
diferencia entre un estimador puntual insesgado y el parámetro de población que estima se llama error muestral.

Error muestral =
x−µ
En la práctica no se puede determinar el valor del error muestral, porque no se conoce la media poblacional µ . Sin
embargo, se puede usar la distribución muestral de x para establecer márgenes de probabilidad respecto al tamaño
del error muestral.

Con una muestra de tamaño n = 100 y una desviación estándar de población σ = 20, el teorema del límite nos
permite llegar a la conclusión de que la distribución muestral de x se puede aproximar mediante una distribución
σ 20
µ y desviaciónestándarσ x = = =2
normal de probabilidades con media n 100 . Como la
distribución muestral de x indica cómo se distribuyen sus valores en torno a µ , proporciona información acerca
de las diferencias posibles entre x y µ . Podemos usar esa información para establecer aseveraciones
probabilísticas acerca del error muestral.
4
Si usamos la tabla de áreas de la distribución normal estándar de probabilidades, veremos que el 95% de los
valores de cualquier variable aleatoria con distribución normal quedan dentro de una distribución igual ± 1.96
desviaciones estándar de la media. Por consiguiente, para la distribución muestral del ejemplo anterior, el 95% de
todos los valores de x debe estar a ± 1.96 desviaciones estándar o menos de µ . Como 1.96
σ x =1.96 (2) = 3.92 , el 95% de las medias de muestra deben estar a ± 3.92 o menos de la media de la
población.

Suponga una variable aleatoria X para designar el peso de un pasajero de avión, que se interesa en conocer el peso
promedio de todos los pasajeros. Como hay limitaciones de tiempo y dinero para pesarlos a todos, se toma una
muestra de 36 pasajeros de la cual se obtiene una media muestral X = 160 libras. Suponga además que la
distribución de los pasajeros tenga una distribución normal con desviación estándar σ = 30. Halle un intervalo de
confianza del 95 % para la µ .

Solución

Datos
n =36
X = 160 libras
σ = 30
1 - α = .95

1. Encontrar estimador puntual insesgado

X = 160 libras (estimador puntual insesgado de la µ )

2. Determinar la variable aleatoria función del estimador y del parámetro cuya distribución este definida.

X−µ
σ
Z= n

3. Determinar los valores de la variable aleatoria definida en el paso (2) de acuerdo a la probabilidad
establecida.

P ( -1.96 ≤ Z ≤ 1.96 ) = 0.95

4. Establecer la desigualdad con los valores de la variable aleatoria definidos en el paso (3) y la expresión definida
en el paso (2).
σ σ
P ( X − Zα < µ < X + Zα ) = 0.95
2 n 2 n

5. Encontrar los límites inferiores y superiores dentro de los cuales se encuentra el parámetro
 30 
µ = 160 +1.96  
Límite superior de confianza  36  = 169.8

 30 
µ = 160 − 1.96  
Límite inferior de confianza  36  = 150.2
5
6. Conclusión
Así podemos afirmar: que el peso promedio de todos los pasajeros corresponde al intervalo de 150.2 y
169.8, con una confianza del 95%.

PROBLEMAS PROPUESTOS DE ESTIMACIÓN PARA LA MEDIA CON VARIANZA


POBLACIONAL CONOCIDA

1. Un fabricante produce anillos para los pistones de un motor de automóvil. Se sabe que el diámetro del anillo
esta distribuido aproximadamente de manera normal, y que tiene una desviación estándar = 0.001 mm. Una
muestra aleatoria de 15 anillos tiene un diámetro promedio de x = 74.036 mm.
a. Construya un intervalo de confianza bilateral del 99% para el diámetro promedio del anillo.
b. Construya un limite inferior de confianza del 95% para el diámetro promedio del anillo.

2. Se sabe que la duración, en horas, de un foco de 75 watts tiene una distribución aproximadamente
normal, con una desviación estándar de = 25 horas. Se toma una muestra aleatoria de 20 focos, la
cual resulta tener una duración promedio de x = 1014 horas. Construya un intervalo de confianza
bilateral del 95% para la duración promedio.

3. Un ingeniero civil analiza la resistencia a la comprensión del concreto. La resistencia esta distribuida
aproximadamente de manera normal, con una varianza = 1000(psi)2. Al tomar una muestra aleatoria de 12
especimenes, se tiene que x = 3250 psi.
a. Construya un intervalo de confianza bilateral del 95% para la resistencia a la compresión promedio.
b. Construya un intervalo de confianza bilateral del 99% para la resistencia a la compresión promedio.
Compare el ancho de este intervalo de confianza con el ancho encontrado en el inciso a).

4. En un estudio hecho para determinar el tiempo medio necesario para el montaje de cierta pieza de una
maquina, 40 trabajadores hicieron un promedio de 42.5 minutos con una desviación típica de 3.8 minutos:
Usar los datos para construir un intervalo de confianza de 98% de tiempo promedio verdadero necesario
para montar la maquina.

5. En el ejercicio 2, supóngase que se desea que el ancho total del intervalo de confianza bilateral sea de seis
horas, con una confianza del 95%. ¿Que tamaño de muestra debe emplearse para este fin?

6. Se encuentra que la concentración promedio de zinc que se saca del agua a partir de un muestra de
mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por mililitro. Encuentre los intervalos de
confianza de 95% y 99% para la concentración media de zinc en el río. Suponga que la desviación estándar de
la población es 0.3.

7. En un experimento de laboratorio 50 estudiantes de ingeniería midieron por separado el calor especifico del
aluminio, obteniendo una medio de 0.2210 calarías por grados centígrado y por gramo y una desviación
normal de .0240 ¿Qué podemos asegurar, con una probabilidad de 0.95, con respecto a la posible magnitud de
error, si la media de la muestra se utiliza para estimar el verdadero valor especifico del aluminio?

8. Una muestra aleatoria simple de 50 artículos originó una media de muestra de 32 y una desviación estándar
muestral de 6. Determine un intervalo de confianza de 90% para la media de la población.

9. Para tratar de estimar la media de consumo por cliente, en un gran restaurante, se reunieron datos de una
muestra de 49 clientes durante un periodo de tres semanas. Si la media de la muestra es de $ 22.60 dólares, ¿
Cuál es el intervalo de confianza de 95% para la media de la población?

10. Una muestra aleatoria de 100 propietarios de automóvil en la ciudad de Bogotá indica que los automóviles
recorren anualmente en promedio 25 000 kilómetros con una desviación estándar de 4000 kilómetros. Calcule
e interprete un intervalo de confianza del 95% para el verdadero recorrido promedio anual.
6
INTERVALO DE CONFIANZA DE LA µ
Se desconoce la varianza poblacional σ ² y la muestra es pequeña (n<30)

Variable a utilizar= t

x−µ
t=
s
n

En el caso de muestra pequeña ( n < 30), la distribución de x depende de la distribución de probabilidades de la


población. Si la población tiene una distribución normal de probabilidades, la distribución de x será normal,
independientemente del tamaño de la muestra. Si se desconoce la desviación estándar de la población, σ , se usa la
desviación estándar (s) de la muestra para estimar σ , y el intervalo de confianza correspondiente se basa en la
distribución de probabilidades que se llama distribución t.
La distribución t es una familia de distribuciones parecidas de probabilidades; una distribución t específica depende
de un parámetro llamado grados de libertad. Esto es, hay una distribución t única con un grados de libertad, otra
con dos grados de libertad, otra con tres grados de libertad y así sucesivamente. A medida que aumentan los grados
de libertad, la diferencia entre la distribución t y la distribución normal estándar de probabilidades se hace más y
más pequeña.
s s
x − tα < µ < x + tα
2 n 2 n

Una empresa de construcción fue culpada de inflar los comprobantes que registra para los contratos de
construcción con el gobierno federal. El contrato estableció que un cierto tipo de trabajo debería promediar US $
1,150. Por motivos de tiempo, los directivos de sólo 12 agencias del gobierno fueron llamados a dar testimonio ante
la corte respecto a los comprobantes de la empresa. Si se descubrió a partir del testimonio de una media US $
1,275 y una desviación estándar de US $ 235, ¿ un intervalo de confianza del 95% apoyaría el caso legal de la
empresa? Se asume que los montos de los comprobantes son normales.

Solución

Datos
n =12
X = $1275
s= $ 235
1 - α = .95

1. Encontrar estimador puntual insesgado

X = $1275 (estimador puntual insesgado de la µ )

2. Determinar la variable aleatoria función del estimador y del parámetro cuya distribución este definida.

X−µ
s
t= n

3. Determinar los valores de la variable aleatoria definida en el paso (2) de acuerdo a la probabilidad establecida.

g.l = 11

P ( -2.201 ≤ t ≤ 2.201 ) = 0.95


7

4. Establecer la desigualdad con los valores de la variable aleatoria definidos en el paso (3) y la expresión definida
en el paso (2).

s s
x − tα < µ < x + tα
2 n 2 n
5. Encontrar los límites inferiores y superiores dentro de los cuales se encuentra el parámetro

 235 
µ = 1275 + 2.201  
Límite superior de confianza  12  = 1,424.31

 235 
µ = 1275 − 2.201  
Límite inferior de confianza  12  = 1,125.69

US $ 1,125.69 ≤ µ ≤ US $1,424.31

6. Conclusión
La corte puede tener un 95% de confianza en que el promedio de todos los comprobantes esta entre US $
1,125.69 y US $ 1,424.31. Este intervalo contiene los US $ 1,150 acordados, fortaleciendo la defensa de la
empresa.

PROBLEMAS PROPUESTOS PARA LA MEDIA CON σ2 DESCONOCIDA

1. Una máquina produce piezas metálicas de forma cilíndrica. Se toma una muestra de piezas cuyos
diámetros son 1.01, 0.97, 1.03, 1.04, 0.99, 0.98, 0.99, 1.01, 1.03 centímetros, Encuentre un intervalo de
confianza del 99% para el diámetro promedio de piezas de esta máquina, si supone una distribución
aproximadamente normal.

2. Una muestra aleatoria de 8 cigarrillos de una marca determinada tiene un contenido promedio de nicotina
de 2.6 miligramos y una desviación estándar de 0.9 miligramos. Determine un intervalo de confianza del
99% para el contenido promedio real de nicotina de esta marca de cigarros en particular, asumiendo que la
distribución de los contenidos de nicotina son aproximadamente normal.

3. Se toma una muestra aleatoria de 12 agujas de tejer en un estudio de la dureza Rockwell de la cabeza de
las agujas. Se realizan las mediciones de la dureza para cada una de las 12 piezas, de lo que se obtiene un
valor promedio 48.50 con una desviación estándar de 1.5. Suponiendo que las mediciones están
normalmente distribuidas, determine un intervalo de confianza del 90% para la dureza Rockwell
promedio.

4. Una muestra aleatoria de 12 alumnas graduadas de una escuela secretarial mecanografió un promedio de
79.3 palabras por minuto con una desviación estándar de 7.8 palabras por minuto. Suponiendo que las
palabras están normalmente distribuidas, determine un intervalo de confianza del 95% para el número
promedio de palabras mecanografiadas por todas las graduadas de esa escuela,

5. Los datos que a continuación se le dan son los pesos en gramos del contenido de 16 cajas de cereal que se
seleccionaron de un proceso de llenado con el propósito de verificar el peso promedio:

506, 508, 499, 503, 504, 510, 497, 512,


514, 505, 493, 496, 506, 502, 509, 496

Si el peso de cada caja es una variable aleatoria normal, obtenga un intervalo de confianza de 90% para la
verdadera media de llenado de este proceso.

6. Para determinar el rendimiento anual de ciertos valores, un grupo de inversionistas tomó una muestra
de n =10 de esta clase de valores. La media y desviación estándar resultaron: X = 8.71% y S = 2.1%.
Estime el verdadero rendimiento anual promedio para esta clase de valores usando un intervalo de
confianza del 95%.
8

7. Un muestreo aleatorio de n =24 artículos en un supermercado presenta una diferencia entre el valor
marcado del artículo y el valor real de éste. La media y la desviación estándar de las diferencias entre el
precio marcado y el real en los 24 artículos son 37.14$ y 6.42$ respectivamente. Encuentre un intervalo
de confianza del 95% para la diferencia media entre el valor marcado y el real por artículo en ese
supermercado.

8. Un contratista ha construido un gran número de casas aproximadamente del mismo tamaño y del mismo
precio. El contratista afirma que el valor promedio de estas casas no excede de $35,000 dólares. Un
corredor de bienes raíces selecciona aleatoria mente 5 de las casas construidas recientemente por el
contratista y averigua los precios que resultan ser: $34,500, $37,000, $36,000, $35,000 y $35,500.
¿Contradicen estas cinco observaciones la afirmación del contratista acerca del valor promedio de sus
casas?. Use α =0.05

9. Los siguientes datos corresponden a los pesos en Kg de 15 hombres escogidos al azar: 72, 68, 63, 75, 84,
91, 66, 75, 86, 90, 62, 87, 77, 70, 69. Obtenga e interprete un intervalo de confianza del 95% para el
verdadero peso promedio,

10. Se obtiene una muestra de 16 estudiantes con una X = 68 y una varianza de S2 = 9 en un examen de
estadística . Suponga que las calificaciones tienen una distribución normal determine un intervalo de
confianza del 98% para la media poblacional.

DETERMINACIÓN DEL TAMAÑO DE MUESTRA

El tamaño de la muestra juega un papel importante para determinar la probabilidad de error así como en la
precisión de la estimación. Una vez que se ha seleccionado el nivel de confianza, dos factores importantes influyen
en el tamaño muestral:

La varianza de la población σ
2
1.
2. El tamaño del error tolerable que el investigador está dispuesto a aceptar.

Mientras que el primer factor está más allá del control del investigador ( no hay nada que se pueda hacer sobre la
varianza de la población), sí es posible limitar el tamaño del error.

El tamaño del error que un investigador puede tolerar depende de qué tan crítico es el trabajo. Algunas tareas
extremadamente delicadas requieren resultados exactos: los procedimientos médicos vitales de los cuales dependen
vidas humanas, o la producción de piezas de una máquina que debe cumplir medidas precisas, pueden tolerar sólo
un pequeño error. En otros casos, los errores más grandes pueden tener consecuencias menos graves.

Vous aimerez peut-être aussi