Vous êtes sur la page 1sur 7

E ED D 8 80 00 0

E Es st ta ad d s st ti ic ca as s

D Dr r. . E Ed dg ga ar rd do o J J. . A Av vi il l s s

E Es st ti im ma ad do os s y y
T Ta am ma a o os s d de e
M Mu ue es st tr ra as s

En la estadstica inferencial usamos datos de la muestra para hacer inferencias (o
generalizaciones) acerca de la poblacin. Las dos mayores aplicaciones de la estadstica
inferencial involucran el uso de datos de la muestra para (1) estimar el valor del
parmetro de la poblacin, y (2) probar algunos reclamos (o hiptesis) acerca de la
poblacin.

Estimando la Media de la Poblacin: Muestras Grandes

El objetivo principal de esta seccin es: Dada una coleccin de ms de 30 valores en una
muestra, desarrollar un estimado del valor de la media de la poblacin .

SUPOSICIONES
1. n > 30 (La muestra tiene ms de 30 valores.
2. La muestra es una muestra simple aleatoria. (Todas las muestras del mismo
tamao tienen la misma oportunidad de ser seleccionadas).

PUNTO IMPORTANTE
Los datos recogidos negligentemente pueden ser absolutamente sin valor, incluso si la
muestra es absolutamente grande.

DEFINICIONES IMPORTANTES
Un estimador es una frmula o proceso usando datos de la muestra para estimar un
parmetro de la poblacin.

Un estimado es un valor especfico o rango de valores usados para aproximar un
parmetro de la poblacin.

Un punto estimado es un valor simple (o punto) usado para aproximar un parmetro de
la poblacin.

La media de la muestra x es el mejor punto estimado de la media de la poblacin .

Aunque se pueden usar otros estadsticos tales como la mediana de la muestra, el rango
medio, o la moda como un estimado de la media poblacional , estudios han demostrado
que la media muestral x usualmente provee el mejor estimado, por dos razones.

1. Para muchas poblaciones, la distribucin de medias de la muestra x tiende a ser
ms consistente (con menos variacin) que las distribuciones de otros estadsticos
2
de la muestra. (Esto es, si se usan medias muestrales para estimar la media de la
poblacin , esas medias muestrales tendrn una desviacin estndar pequea,
que otros estadsticos de la muestra, como la mediana o la moda. Las diferencias
entre x y por lo tanto, tienden a ser menores que las diferencias obtenidas por
otros estadsticos, como la mediana).

2. Para todas las poblaciones, la media muestral x es un estimador imparcial de la
media poblacional , significando que la distribucin de medias de la muestra
tienden a centrar alrededor del valor de la media poblacional . (Esto es, medias
muestrales no tienden sistemticamente a sobreestimar el valor de , ni tampoco
tiende sistemticamente a subestimar . En vez, tienden a apuntar el valor mismo
de .

DEFINICIN DE INTERVALOS DE CONFIANZA
Un intervalo de confianza (o intervalo de estimado) es un rango (o intervalo) de
valores usados para estimar el valor verdadero del parmetro de la poblacin.

Un intervalo de confianza es asociado con unos grados de confianza, como 0.95 (o 95%).
El grado de confianza nos dice el porciento de veces que el intervalo de confianza
actualmente contiene el parmetro de la poblacin, presumiendo que el proceso de
estimacin es repetido un nmero grande de veces.

DEFINICIN DE GRADOS DE CONFIANZA
Los grados de confianza es la probabilidad 1 (frecuentemente expresada como el
valor del porciento equivalente) que es la frecuencia relativa de veces que el intervalo de
confianza actualmente contiene el parmetro de la poblacin, presumiendo que el proceso
de estimacin es repetido un nmero grande de veces. (El grado de confianza es tambin
llamado el nivel de confianza o el coeficiente de confianza.)

Los ms comunes selecciones para el nivel de confianza son 90% (con = 0.10), 95%
(con = 0.05) y 99% (con = 0.01). La alternativa ms usada es la de 95% porque
provee un buen balance entre precisin (segn reflejado en el ancho del intervalo de
confianza) y confiabilidad (segn expresado en el grado de confianza).

INTERPRETANDO UN INTERVALO DE CONFIANZA
Debemos tener cuidado en interpretar intervalos de confianza correctamente. Hay una
interpretacin correcta y una incorrecta acerca del siguiente intervalo de confianza:
98.08
o
F < < 98.32
o
F.

Interpretacin correcta:
Estamos 95% confiados de que el intervalo de 98.08 hasta 98.32 actualmente
contiene el valor verdadero de . Esto significa que si tuviramos que seleccionar
muchas muestras diferentes de tamao 106 y construir el intervalo de confianza,
95% de ellas realmente contienen el valor de la media poblacional . (Ntese que
3
en esta interpretacin correcta, el nivel de 95% se refiere al proceso siendo usado
para estimar la media, y no se refiere a la media poblacional en s.

Interpretacin incorrecta:

Hay un 95% de oportunidad de que el verdadero valor de est entre 98.08 y
98.32.

Valores Crticos:

Construyendo un intervalo de confianza requiere que se encuentre un valor estndar z que
pueda ser usado para distinguir estadsticos de muestras que son probables para ocurrir de
aqullos que son no probables. Tal valor z es llamado un valor crtico (definido abajo) y
est basado en las siguientes observaciones:

1. Sabemos por el teorema del lmite central que las medias de la muestra tienden a
ser normalmente distribuidas.
2. Las medias de la muestra tienen una oportunidad pequea relativa (con
probabilidad denotada por de caer en uno de los colas extremas.
3. Denotando cada rea de la cola sombreada como /2, vemos que hay una
probabilidad total de que una media muestral est en cualesquiera de las dos
colas.
4. Por la regla de los complementos, hay una probabilidad de 1 de que una media
muestral est en la regin no crtica.
5. La puntuacin z separando la cola derecha de la curva es comnmente denotada
por
2
z y es referido como el valor crtico porque est en la lnea borde
separando medias muestrales que son probables de que ocurran de aqullas que no
lo son.

DEFINICIN DE VALOR CRTICO
Un valor crtico es el nmero en la lnea borde separando estadsticos de muestra que
son probables que ocurran de aquellos que no son probables que ocurran. El nmero
2
z
es un valor crtico que es una puntuacin z con la propiedad que separa un rea de
/2 en la cola derecha de la distribucin normal estndar.

Estos son los valores crticos ms usados, y han sido listados con otros dos valores
comunes en la tabla que sigue:

Grado de confianza Valor crtico,
2
z
90% 0.10 1.645
95% 0.05 1.96
99% 0.01 2.575

4
Margen de error:

Definicin:
Cuando la data de una variable aleatoria simple es usada para estimar la media de una
poblacin , el margen de error, denotado por E es la mxima diferencia posible (con
probabilidad 1 ) entre la media muestral observada x y el verdadero valor de la media
poblacional . El margen de error E es tambin llamado el mximo error del estimado, y
puede ser calculado multiplicando el valor crtico y la desviacin estndar de las medias
muestrales.

n
Z E

2
=


Calculando E cuando es desconocida:

Si n > 30, se puede reemplazar en la frmula anterior por la desviacin estndar de la
muestra s.

Si n 30, la poblacin debe tener una distribucin normal y se tiene que saber el valor de
para usar la frmula anterior.

Intervalo de confianza (o intervalo de estimacin) para la media poblacional
(Basado en muestras grandes: n > 30)

E x E x + < <


o bien,
E x =


o bien,
( ) E x E x + ,


Definicin:

Los dos valores E x y E x + son llamados los lmites del intervalo de confianza.

Procedimiento para construir un intervalo de confianza para (Basados en
muestras grandes: n > 30)

5
1. Encontrar el valor crtico
2

Z que corresponde al grado de confianza deseado.


(Por ejemplo, si el grado de confianza es 95%, el valor crtico
2

Z = 1.96).
2. Evaluar el margen de error E. Si la desviacin estndar de la poblacin es
desconocida, usar el valor de la desviacin estndar de la muestra s, provisto que
n > 30.
3. Usando el valor calculado del margen de error E y el valor de la media muestral
x , encontrar los valores de E x y E x + . Sustituir esos valores en el intervalo
de confianza, presentado arriba.

Estimando la media poblacional: Muestras Pequeas

Suposiciones:

n 30
La muestra es una muestra simple aleatoria.
La muestra es de una poblacin normalmente distribuida.

En el desarrollo de intervalos de confianza para estimaciones de , hay dos casos: (1)
cuando la desviacin estndar de la poblacin es conocida; y (2) cuando es
desconocida.

Caso 1 ( es conocida): Este primer caso es grandemente irreal, porque si no se conoce
el valor de la media poblacional y se est tratando de estimar ese valor, se puede
apostar seguramente que no se sabr el valor de la desviacin estndar de la poblacin .

Caso 2 ( es desconocida): El segundo caso, donde es desconocida es ms realista y
prctico. Ahora, en vez de usar la distribucin normal, se usar la distribucin t
(Student t distribution) desarrollada por Gosset (1876-1937).

Distribucin t

Si la distribucin de una poblacin es esencialmente normal (aproximadamente en forma
de campana), entonces la distribucin de

n
s
x
t

=

es esencialmente una distribucin t para todas las muestras de tamao n. La
distribucin t es usada para encontrar valores crticos denotados por:
2

t

6
DEFINICIN DE GRADOS DE LIBERTAD
El nmero de grados de libertad para un conjunto de data simple es el nmero de valores
muestrales que pueden variar despus de que ciertas restricciones hayan sido impuestas a
todos los valores de la data.

grados de libertad = n 1

Margen de error E para una estimacin de :
[Basados en una desconocida y una muestra aleatoria pequea simple (n 30) de
una poblacin normalmente distribuida]

n
s
t E
2

=


donde t
/2
tiene n 1 grados de libertad.

Intervalo de confianza para la estimacin de :
[Basados en una desconocida y una muestra aleatoria pequea simple (n 30) de
una poblacin normalmente distribuida]

E x E x + < <


donde

n
s
t E
2

=


Propiedades importantes de la Distribucin t:

1. La distribucin t (su grfica) es diferente para tamaos de muestras diferentes.
2. La distribucin t tiene la misma simetra general de campana como la distribucin
normal estndar, pero esta refleja la variabilidad mayor que es esperado con
muestras pequeas.
3. La distribucin t tiene una media de t = 0 (como la distribucin normal estndar
que tiene una media de z = 0).
4. La desviacin estndar de la distribucin t vara con el tamao de la muestra, pero
es mayor que 1, poco semejante a la distribucin normal estndar que tiene = 1.
5. Segn el tamao de la muestra n aumenta, la distribucin t se acerca a la
distribucin normal estndar. Para valores de (n > 30), las diferencias son muy
pequeas, que se puede usar los valores crticos z en vez de desarrollar una tabla
mucho ms grande de valores crticos t.

7
Condiciones para usar la Distribucin t:

1. La muestra es pequea (n 30); y
2. la desviacin estndar es desconocida; y
3. la poblacin principal tiene una distribucin que es esencialmente normal.






Tomado de:

Triola, M. F. (2001). Elementary Statistics. Boston, MA: Addison-Wesley


.