Académique Documents
Professionnel Documents
Culture Documents
sobre este parmetro tomamos una muestra aleatoria simple de dicha variable,
. Un
intervalo de confianza aleatorio a un nivel de 1- es un conjunto de posibles valores del parmetro
dentro del cual se encuentra el verdadero valor del mismo con una probabilidad de 1- . Este conjunto
est delimitado por dos estadsticos: el primero de ellos, el extremo inferior del intervalo, es un
estimador por defecto del parmetro, mientras que el segundo, el extremo superior del intervalo, es un
estimador por exceso del mismo. Cuando la muestra se concreta, el intervalo pasa de ser aleatorio a
ser un intervalo en la recta real en el que confiamos que est el verdadero valor del parmetro.
De manera ms formal, dada una muestra aleatoria simple
estadsticos,
,
nivel 1-
y dos
, tal que
es un intervalo de confianza aleatorio para el parmetro
si
El nivel de confianza, 1- , mide la fiabilidad del intervalo de probabilidad, esto es, la probabilidad de
acertar. Habitualmente se toman valores como 0.90, 0.95 o 0.99, correspondientes a valores de
de
0.10, 0.05 y 0.01, probabilidad de equivocarse.
Mientras consideremos la muestra como aleatoria interpretaremos el intervalo en trminos de
probabilidad. Una vez concretados los valores de la muestra y, por tanto, del intervalo, interpretaremos
ste en trminos de confianza: si pudisemos repetir la toma de datos de forma reiterada,
el
de los intervalos contendra el verdadero valor del parmetro. La hoja adjunta ilustra
este hecho a partir de 150 intervalos de confianza sobre la media poblacional obtenidos simulando una
misma distribucin normal.
Un ejemplo nos ayudar a construir un intervalo y a entender los principales conceptos. Queremos saber
acerca del nmero de horas diarias de estudio de los bachilleres espaoles, para lo cual tomamos una
muestra de tamao 1000 que arroja los resultados que se incluyen en la tabla:
Horas de
estudio
siendo 2.7 el nmero medio de horas diarias que dedican al estudio los 1000 bachilleres seleccionados.
La figura muestra el histograma de frecuencias de estos datos.
Vamos a construir el intervalo de confianza para la media de horas diarias de estudio de los
bachilleres, , a un nivel de confianza de 0.95, esto es, con una probabilidad de equivocarnos de 0.05.
Para abordar el problema suponemos que X, nmero de horas de estudio diarias de un bachiller, sigue
una distribucin normal de media , desconocida, y de varianza 0.81. La suposicin de normalidad est
plenamente justificada dada la naturaleza de la variable, que se ve influida por mltiples factores; esta
suposicin se ve corroborada por la forma que presenta el histograma anterior, que no es muy diferente a
la funcin de densidad de una normal. Por otro lado, la suposicin de varianza conocida carece de
fundamento (si la media es desconocida, con ms motivo lo ser tambin la varianza), pero esta
suposicin sirve para introducir el problema sin excesivas complicaciones formales. Por tanto,
La media muestral,
, el mejor estimador de
confianza sobre
a nivel de confianza de 1conocer la distribucin del estadstico
tamao n de una variable normal,
varianza
y de
A partir de este resultado, que proporciona el estadstico pivote, buscamos dos valores
y
tales
que dejen entre s una probabilidad de 1- en una distribucin normal tipificada. De esta forma,
En esta doble desigualdad operamos para dejar slo y en el centro de la misma el parmetro
de nuestra inferencia. As se obtiene un intervalo de confianza para a nivel 1- :
, objetivo
En concreto, para construir un intervalo de confianza al 95% sobre el nmero medio de horas de
estudio, , con una muestra de tamao 1000, sustituyendo se obtiene:
donde 1.96 y +1.96 son los dos puntos que en la distribucin normal estndar dejan 0.025 de
probabilidad en cada cola. Simplificando resulta
a lo sumo, 0.056 con una probabilidad de 0.95. Como se ve, estos dos estadsticos son estimadores por
defecto y por exceso, respectivamente, de .
Finalmente, dado que el nmero medio de horas de estudio entre los bachilleres de la muestra era 2.7, se
sustituye en la anterior expresin dando lugar al intervalo real
pudindose afirmar con una confianza del 95% que el nmero medio de horas diarias dedicadas al
estudio de los bachilleres espaoles est entre 2.64 y 2.75.
Obsrvese que este intervalo no puede interpretarse en trminos de probabilidad, sino en trminos de
confianza. Si hemos acertado, est entre dichos valores, y si hemos fallado, no est entre los mismos,
pero nunca sabremos en cul de las dos situaciones nos encontramos. Si este problema se plantea
repetidas veces tomando cada vez una muestra distinta, obtendramos intervalos de confianza no
aleatorios y distintos en cada caso, pudindose afirmar que en el 95% de esos intervalos hemos
acertado, y que en el 5% restante hemos fallado (nunca podremos identificar cules son aqullos en los
que hemos acertado y aqullos en los que hemos fallado).
Advirtase que en la construccin del intervalo de confianza podemos controlar tres factores:
As, en el intervalo construido, contbamos con una muestra de tamao 1000 y para una fiabilidad de
0.95 hemos obtenido un intervalo de longitud 0.12, o en notacin ms habitual, con una precisin de +/0.06.
Fijado uno de los tres factores anteriores podemos ver cmo se relacionan los otros dos entre s.
Desarrollemos estos resultados en el supuesto del ejemplo planteado, si bien todas las conclusiones son
generalizables a cualquier otra situacin.
I.- Fijado el tamao de la muestra, n, una mayor fiabilidad (es decir, menor ) implica una menor
precisin (un intervalo ms largo); esto es, si queremos incrementar la probabilidad de acierto lo haremos
a expensas de perder precisin en la estimacin.
La longitud del intervalo de confianza ptimo para la media poblacional de una variable normal con
desviacin conocida vale:
III.- Para una precisin fijada, un aumento en el tamao muestral, produce una mayor fiabilidad.
De la expresin de la longitud del intervalo deducimos que
de donde podremos obtener el valor de n que nos proporcione un intervalo de confianza de una fiabilidad
y una precisin determinada.
Por ltimo, la varianza juega tambin un papel importante en la estimacin por intervalos. En concreto,
las variables menos dispersas (menos variables), es decir, las que tienen varianza pequea, admiten una
mejor estimacin, en el sentido de una estimacin ms fiable y precisa.
Estimacin por intervalos
Con la estimacin puntual se estima el valor del parmetro poblacional desconocido, a partir de una
muestra. Para cada muestra se tendr un valor que estima el parmetro. Esta estimacin no es muy til
si desconocemos el grado de aproximacin de la estimacin al parmetro. Es deseable conocer un
mtodo que nos permita saber donde se encuentra el parmetro con un cierto grado de certeza. Este
mtodo va a ser la determinacin de un intervalo donde estar el parmetro con un nivel de confianza.
El intervalo se construye a partir de una muestra, entonces, para cada muestra se tendr un intervalo
distinto. Llamaremos a al error que se permite al dar el intervalo y el nivel de confianza ser 1- . Un
intervalo tiene un nivel de confianza 1- cuando el 100(1- )% de los intervalos que se construyen para el
parmetro lo contienen.
Es deseable para un intervalo de confianza que tenga la menor amplitud posible, esta amplitud
depender de:
El tamao de la muestra, mientras mayor sea el tamao mejor ser la estimacin, aunque se
incurre en un aumento de costes
A veces es conveniente obtener unos lmites entre los cuales se encuentre el parmetro con un cierto
nivel de confianza, en este caso hablamos de estimacin por intervalos.
El nivel de confianza, C, indica, en porcentaje, con qu proporcin el intervalo de confianza contiene el
parmetro estimado. El coeficiente de confianza, c, es la misma proporcin en tanto por uno, c = C/100.
En otras palabras, c es la probabilidad de que el intervalo de confianza contenga el parmetro estimado.
Si = 1 - c, y (a,b) es el intervalo de confianza se cumplir:
Dado un nivel de confianza, C, calculamos el coeficiente de confianza, c = C/100.
Seguidamente calculamos = 1 - c y /2.
Si Z ~ N(0,1), el punto crtico, z/2, es el que cumple p(Z < z/2) = 1 - /2.
Por ltimo buscamos en la tabla de la funcin de distribucin de la distribucin N(0,1) el valor de z cuya
probabilidad es 1 - /2.
Para comprobar el valor obtenido podemos usar la siguiente escena: