Vous êtes sur la page 1sur 6

Estimacin puntual y estimacin por intervalos

La estimacin puntual presenta un gran inconveniente: an utilizando el mejor estimador de una


caracterstica poblacional o parmetro, no slo no acertaremos en la estimacin (la posibilidad de acertar
es remota), sino que desconoceremos el grado de precisin y fiabilidad de la misma. As, cuando
estimamos que el nmero medio de horas diarias ante el televisor es 2.3 a partir de la informacin que
proporcionan 1000 individuos elegidos al azar, no medimos ni la discrepancia con el verdadero valor del
parmetro (precisin), ni la probabilidad de equivocarse en menos de una cierta cantidad (fiabilidad). La
nica garanta que podemos tener acerca de la bondad de la estimacin proviene del hecho de que se ha
realizado con el estimador ms adecuado (en ese caso, la media muestral). Para evitar esta insuficiencia
de la estimacin puntual se introducen los intervalos de confianza.
Tamao muestral, precisin y fiabilidad
Sea una variable aleatoria X cuya distribucin depende de un parmetro

; para obtener informacin

sobre este parmetro tomamos una muestra aleatoria simple de dicha variable,
. Un
intervalo de confianza aleatorio a un nivel de 1- es un conjunto de posibles valores del parmetro
dentro del cual se encuentra el verdadero valor del mismo con una probabilidad de 1- . Este conjunto
est delimitado por dos estadsticos: el primero de ellos, el extremo inferior del intervalo, es un
estimador por defecto del parmetro, mientras que el segundo, el extremo superior del intervalo, es un
estimador por exceso del mismo. Cuando la muestra se concreta, el intervalo pasa de ser aleatorio a
ser un intervalo en la recta real en el que confiamos que est el verdadero valor del parmetro.
De manera ms formal, dada una muestra aleatoria simple
estadsticos,
,
nivel 1-

y dos

, tal que
es un intervalo de confianza aleatorio para el parmetro

si

Para una realizacin de la muestra,

, obtenemos el intervalo de confianza numrico:

El nivel de confianza, 1- , mide la fiabilidad del intervalo de probabilidad, esto es, la probabilidad de
acertar. Habitualmente se toman valores como 0.90, 0.95 o 0.99, correspondientes a valores de
de
0.10, 0.05 y 0.01, probabilidad de equivocarse.
Mientras consideremos la muestra como aleatoria interpretaremos el intervalo en trminos de
probabilidad. Una vez concretados los valores de la muestra y, por tanto, del intervalo, interpretaremos
ste en trminos de confianza: si pudisemos repetir la toma de datos de forma reiterada,
el
de los intervalos contendra el verdadero valor del parmetro. La hoja adjunta ilustra
este hecho a partir de 150 intervalos de confianza sobre la media poblacional obtenidos simulando una
misma distribucin normal.

La longitud del intervalo,


, mide
la precisin de la estimacin: intervalos largos proporcionan estimaciones imprecisas, mientras que
intervalos cortos proporcionan estimaciones precisas. Habitualmente la precisin se expresa como el
radio del intervalo,
, el margen de error de la estimacin.
Un intervalo de confianza puede utilizarse para tomar decisiones sobre el verdadero valor del parmetro.
As, planteada una hiptesis sobre
del intervalo.

, se acepta (no se rechaza) si

es uno de los valores

Un ejemplo nos ayudar a construir un intervalo y a entender los principales conceptos. Queremos saber
acerca del nmero de horas diarias de estudio de los bachilleres espaoles, para lo cual tomamos una
muestra de tamao 1000 que arroja los resultados que se incluyen en la tabla:
Horas de
estudio

2.4 1.6 2.9 ... 3.1 3.2 3

siendo 2.7 el nmero medio de horas diarias que dedican al estudio los 1000 bachilleres seleccionados.
La figura muestra el histograma de frecuencias de estos datos.
Vamos a construir el intervalo de confianza para la media de horas diarias de estudio de los
bachilleres, , a un nivel de confianza de 0.95, esto es, con una probabilidad de equivocarnos de 0.05.
Para abordar el problema suponemos que X, nmero de horas de estudio diarias de un bachiller, sigue
una distribucin normal de media , desconocida, y de varianza 0.81. La suposicin de normalidad est
plenamente justificada dada la naturaleza de la variable, que se ve influida por mltiples factores; esta
suposicin se ve corroborada por la forma que presenta el histograma anterior, que no es muy diferente a
la funcin de densidad de una normal. Por otro lado, la suposicin de varianza conocida carece de
fundamento (si la media es desconocida, con ms motivo lo ser tambin la varianza), pero esta
suposicin sirve para introducir el problema sin excesivas complicaciones formales. Por tanto,

La media muestral,
, el mejor estimador de
confianza sobre
a nivel de confianza de 1conocer la distribucin del estadstico
tamao n de una variable normal,
varianza

, es de nuevo la clave para encontrar un intervalo de


. Para construir el intervalo de confianza, necesitamos

. La media muestral de una muestra aleatoria simple de


, tiene una distribucin normal de media

y de

Este resultado permite construir un intervalo de confianza sobre

cuando suponemos conocida

Para ello, tipifiquemos previamente el estimador


, restndole la media y dividiendo por su desviacin,
trasformacin sta que no afecta a su normalidad:

A partir de este resultado, que proporciona el estadstico pivote, buscamos dos valores
y
tales
que dejen entre s una probabilidad de 1- en una distribucin normal tipificada. De esta forma,

En esta doble desigualdad operamos para dejar slo y en el centro de la misma el parmetro
de nuestra inferencia. As se obtiene un intervalo de confianza para a nivel 1- :

, objetivo

Notemos que existen muchas parejas


que dejan entre ellas una probabilidad de 1- pero,
evidentemente, es deseable que la estimacin sea lo ms precisa posible, esto es, que el intervalo tenga
longitud mnima. En este caso, la longitud del intervalo es

longitud que se hace mnima cuando


simtricos. Entonces, a
(el ms corto) es

estn lo ms cerca posible, situacin que se da cuando son

los denotaremos como

. De esta forma, el intervalo ptimo

En concreto, para construir un intervalo de confianza al 95% sobre el nmero medio de horas de
estudio, , con una muestra de tamao 1000, sustituyendo se obtiene:

donde 1.96 y +1.96 son los dos puntos que en la distribucin normal estndar dejan 0.025 de
probabilidad en cada cola. Simplificando resulta

lo que permite decir que el verdadero valor del parmetro


est entre
y
, con
una probabilidad de 0.95, o lo que es lo mismo, que el verdadero valor de difiere de la media muestral en,

a lo sumo, 0.056 con una probabilidad de 0.95. Como se ve, estos dos estadsticos son estimadores por
defecto y por exceso, respectivamente, de .
Finalmente, dado que el nmero medio de horas de estudio entre los bachilleres de la muestra era 2.7, se
sustituye en la anterior expresin dando lugar al intervalo real

pudindose afirmar con una confianza del 95% que el nmero medio de horas diarias dedicadas al
estudio de los bachilleres espaoles est entre 2.64 y 2.75.
Obsrvese que este intervalo no puede interpretarse en trminos de probabilidad, sino en trminos de
confianza. Si hemos acertado, est entre dichos valores, y si hemos fallado, no est entre los mismos,
pero nunca sabremos en cul de las dos situaciones nos encontramos. Si este problema se plantea
repetidas veces tomando cada vez una muestra distinta, obtendramos intervalos de confianza no
aleatorios y distintos en cada caso, pudindose afirmar que en el 95% de esos intervalos hemos
acertado, y que en el 5% restante hemos fallado (nunca podremos identificar cules son aqullos en los
que hemos acertado y aqullos en los que hemos fallado).
Advirtase que en la construccin del intervalo de confianza podemos controlar tres factores:

El tamao de la muestra n que nos cuantifica el nmero de observaciones y, por tanto, la


cantidad de informacin de que dispondremos.

La fiabilidad del intervalo, 1-

, esto es, la probabilidad de que el parmetro se encuentre

dentro del intervalo aleatorio; o lo que es lo mismo, la probabilidad de equivocarse,

La precisin de la estimacin o longitud del intervalo, L.

As, en el intervalo construido, contbamos con una muestra de tamao 1000 y para una fiabilidad de
0.95 hemos obtenido un intervalo de longitud 0.12, o en notacin ms habitual, con una precisin de +/0.06.
Fijado uno de los tres factores anteriores podemos ver cmo se relacionan los otros dos entre s.
Desarrollemos estos resultados en el supuesto del ejemplo planteado, si bien todas las conclusiones son
generalizables a cualquier otra situacin.
I.- Fijado el tamao de la muestra, n, una mayor fiabilidad (es decir, menor ) implica una menor
precisin (un intervalo ms largo); esto es, si queremos incrementar la probabilidad de acierto lo haremos
a expensas de perder precisin en la estimacin.
La longitud del intervalo de confianza ptimo para la media poblacional de una variable normal con
desviacin conocida vale:

Entonces, fijado el tamao n, al crecer (menor fiabilidad),


decrece, para dejar a su derecha una
cola ms grande, y Ltambin decrece (mayor precisin). Por tanto, la longitud del intervalo es funcin
decreciente de . Comprubese este hecho en la hoja adjunta obteniendo un intervalo con una mayor
fiabilidad, en concreto, al 99%.
Todo esto nos confirma la imposibilidad de encontrar un intervalo ideal, muy fiable y muy preciso,
teniendo que llegar a situaciones de compromiso en las que no se sacrifique la precisin para conseguir
una fiabilidad ptima y viceversa.
II.- Para una fiabilidad concreta, un aumento en el tamao de la muestra, produce una mejora en la
precisin de la estimacin. Esto es, si
es fijo, al aumentar el tamao muestral n, la longitud L del
intervalo decrece, hecho que se deduce a partir de la expresin de la longitud del intervalo:

III.- Para una precisin fijada, un aumento en el tamao muestral, produce una mayor fiabilidad.
De la expresin de la longitud del intervalo deducimos que

Entonces, si L permanece fijo, un aumento de n produce un aumento de


, o lo que es lo mismo, una
disminucin en la probabilidad . Por tanto, si pretendemos que el intervalo tenga una longitud
determinada y podemos aumentar el tamao de la muestra, este aumento provoca una mayor fiabilidad
en la estimacin ( disminuye).
Estas dos ltimas observaciones evidencian un resultado totalmente esperable: la posibilidad de contar
con una muestra ms grande mejora la estimacin, bien sea aumentando la fiabilidad (disminuyendo ),
bien sea aumentando la precisin (disminuyendo L).
Ahora bien, este deseable aumento de informacin no siempre es posible. Pensemos que una muestra
ms grande supone un mayor coste econmico, una mayor demora en la obtencin de resultados e,
incluso, una prdida en la calidad de la informacin. En la prctica, el cliente que encarga una encuesta a
un estadstico le pide que los resultados obtenidos tengan una cierta fiabilidad (un determinado 1- ) y
una cierta precisin (un determinado L); el estadstico determinar una muestra lo ms pequea posible
(esto es, lo ms barata, rpida y buena posible) para conseguir dichos objetivos (con todo esta situacin
no deja de ser ideal pues en la mayor parte de las situaciones el cliente dispondr de un techo
presupuestario lo que limitar el nmero de observaciones a realizar). En esta situacin, despejando n en
la expresin de la longitud del intervalo, se obtiene:

de donde podremos obtener el valor de n que nos proporcione un intervalo de confianza de una fiabilidad
y una precisin determinada.
Por ltimo, la varianza juega tambin un papel importante en la estimacin por intervalos. En concreto,
las variables menos dispersas (menos variables), es decir, las que tienen varianza pequea, admiten una
mejor estimacin, en el sentido de una estimacin ms fiable y precisa.
Estimacin por intervalos
Con la estimacin puntual se estima el valor del parmetro poblacional desconocido, a partir de una
muestra. Para cada muestra se tendr un valor que estima el parmetro. Esta estimacin no es muy til
si desconocemos el grado de aproximacin de la estimacin al parmetro. Es deseable conocer un
mtodo que nos permita saber donde se encuentra el parmetro con un cierto grado de certeza. Este
mtodo va a ser la determinacin de un intervalo donde estar el parmetro con un nivel de confianza.
El intervalo se construye a partir de una muestra, entonces, para cada muestra se tendr un intervalo
distinto. Llamaremos a al error que se permite al dar el intervalo y el nivel de confianza ser 1- . Un
intervalo tiene un nivel de confianza 1- cuando el 100(1- )% de los intervalos que se construyen para el
parmetro lo contienen.
Es deseable para un intervalo de confianza que tenga la menor amplitud posible, esta amplitud
depender de:

El tamao de la muestra, mientras mayor sea el tamao mejor ser la estimacin, aunque se
incurre en un aumento de costes

Nivel de confianza, si se pide mayor nivel de confianza, el intervalo ser mayor.

A veces es conveniente obtener unos lmites entre los cuales se encuentre el parmetro con un cierto
nivel de confianza, en este caso hablamos de estimacin por intervalos.
El nivel de confianza, C, indica, en porcentaje, con qu proporcin el intervalo de confianza contiene el
parmetro estimado. El coeficiente de confianza, c, es la misma proporcin en tanto por uno, c = C/100.
En otras palabras, c es la probabilidad de que el intervalo de confianza contenga el parmetro estimado.
Si = 1 - c, y (a,b) es el intervalo de confianza se cumplir:
Dado un nivel de confianza, C, calculamos el coeficiente de confianza, c = C/100.
Seguidamente calculamos = 1 - c y /2.
Si Z ~ N(0,1), el punto crtico, z/2, es el que cumple p(Z < z/2) = 1 - /2.
Por ltimo buscamos en la tabla de la funcin de distribucin de la distribucin N(0,1) el valor de z cuya
probabilidad es 1 - /2.
Para comprobar el valor obtenido podemos usar la siguiente escena:

Vous aimerez peut-être aussi