Vous êtes sur la page 1sur 24

2.

1 Conceptos Bsicos Inferencia Estadstica

POBLACIN: Conjunto de elementos sobre los que se observa un


carcter comn. Se representa con la letra N.

MUESTRA: Conjunto de unidades de una poblacin. Cuanto ms


significativa sea, mejor ser la muestra. Se representa con la letra n.

UNIDAD DE MUESTREO: Est formada por uno o ms elementos de la


poblacin. El total de unidades de muestreo constituyen la poblacin.
Estas unidades son disjuntas entre s y cada elemento de la poblacin
pertenece a una unidad de muestreo.

PARMETRO: Es un resumen numrico de alguna variable observada


de la poblacin. Los parmetros normales que se estudian son:

- La media poblacional: x
- Total poblacional: X
- Proporcin: P
*
ESTIMADOR: Un de un parmetro , es un estadstico que se
estimador emplea para
conocer el parmetro
desconocido.

ESTADSTICO: Es una funcin de los valores de la muestra. Es una


variable aleatoria, cuyos valores dependen de la muestra seleccionada.
Su distribucin de probabilidad, se conoce como Distribucin muestral
del estadstico.

ESTIMACIN: Este trmino indica que a partir de lo observado en una


muestra (un resumen estadstico con las medidas que conocemos de
Descriptiva) se extrapola o generaliza dicho resultado muestral a la
poblacin total, de modo que lo estimado es el valor generalizado a la
poblacin. Consiste en la bsqueda del valor de los parmetros
poblacionales objeto de estudio. Puede ser puntual o por intervalo de
confianza:

Puntual: cuando buscamos un valor concreto.


Intervalo de confianza: cuando determinamos un intervalo,
dentro del cual se supone que va a estar el valor del parmetro
que se busca con una cierta probabilidad.
CONTRATE DE HIPTESIS: Consiste en determinar si es aceptable,
partiendo de datos mustrales, que la caracterstica o el parmetro
poblacional estudiado tome un determinado valor o est dentro de unos
determinados valores.

NIVEL DE CONFIANZA: Indica la proporcin de veces que


acertaramos al afirmar que el
parmetro est dentro del intervalo al seleccionar
muchas muestras.

2.2 Distribuciones de
muestreo.

La inferencia estadstica es el proceso que permite hacer inferencias


(predicciones, suposiciones, ) acerca de los parmetros de la
poblacin a partir de los estimadores obtenidos con una muestra. Utiliza
como base el muestreo aleatorio simple.
La distribucin muestral de un estimador es la distribucin de la
probabilidad de la variable que recoge los distintos valores del
estimador obtenidos al analizar diferentes muestras.

Una poblacin con cualquier distribucin de frecuencias, que tiene una


y concretas, tiene una distribucin muestral de la x (las medias de
infinitas muestras obtenidas de dicha poblacin):

Con una media igual a la media de la poblacin

Una desviacin estndar, denominada error tpico o estndar, igual a


, desviacin estndar de la poblacin, dividida entre la raz
cuadrada del tamao de la muestra, n:

y sigue una distribucin normal (si n es suficientemente grande).

Ejempl
o:

Poblacin:

Distribucin muestral x:
Histograma de x en 1000
muestras de 11 elementos.
2.3 Estimacin
puntual.

Con la estimacin puntual se estima el valor del parmetro poblacional


desconocido, a partir de una muestra. Para cada muestra se tendr un
valor que estima el parmetro. Esta estimacin no es muy til si
desconocemos el grado de aproximacin de la estimacin al parmetro.

Un estimador de un parmetro poblacional es una funcin de los datos


mustrales. En pocas palabras, es una frmula que depende de los
valores obtenidos de una muestra, para realizar estimaciones. Lo que
se pretende obtener es el valor exacto de un parmetro. Por
ejemplo, si se pretende estimar la talla media de un determinado
grupo de individuos, puede extraerse una muestra y ofrecer como
estimacin puntual la talla media de los individuos de la muestra.

La media de la muestra puede ser un estimador de la media de la


poblacin, la cuasivarianza muestral es un buen estimador de la
varianza poblacional y el total muestral es un buen estimador del total
poblacional.

Por tanto, una definicin ms matemtica de un estimador y las


propiedades que debe de cumplir un estimador para ser bueno.

Sea X1......Xn, una m.a.s. de tamao n, decimos que es un estimador *


de un parmetro si el estadstico que se emplea para conocer dicho
parmetro desconocido es este.

Propiedades deseables de
un estimador

Las propiedades o criterios para seleccionar un buen estimador son los


siguientes:

A) Insesgadez: Diremos que un estimador * de un parmetro es


insesgado si su
esperanza coincide con el verdadero valor del parmetro.

En el caso de que no coincidan, diremos que el estimador es sesgado.

B) Eficiencia: Dados dos estimadores 1* y 2* para un mismo


parmetro , se dice que 1* es ms eficiente que 2* si:
C) Suficiencia: Se dice que un estimador de un parmetro es suficiente
cuando para su clculo utiliza toda la informacin de la muestra.

D) Consistencia: Decimos que un estimador * de un parmetro


es consistente si la distribucin del estimador tiende a concentrarse en
un cierto punto cuando el tamao de la muestra tiende a infinito.

Mtodos para obtener


estimadores

El demostrar que un cierto estimador cumple estas propiedades puede


ser complicado en determinadas ocasiones. Existen varios mtodos
que nos van a permitir obtener los
estimadores puntuales. Los ms importantes son:

MTODO DE LOS MOMENTOS: se basa en que los momentos


poblacionales y se estiman mediante los momentos mustrales.
Suelen dar estimadores consistentes.
MTODO DE MNIMOS CUADRADOS: consiste en obtener un
estimador que hace mnima una determinada funcin.
MTODO DE MXIMA VEROSIMILITUD: consiste en tomar
como parmetro
poblacional el valor de la muestra que sea ms probable, es
decir, que tenga mayor probabilidad. Se suelen obtener
estimadores consistentes y eficientes. Es el ms utilizado.

La probabilidad de que la media muestral sea igual a la media


poblacional es cero,
, es decir, que ser bastante complicado obtener un
estimador puntual, por ello se utiliza ms el Intervalo de Confianza y el
Contraste de Hiptesis.

2.4 Estimacin de intervalo.

Es deseable conocer un mtodo que nos permita saber donde se


encuentra el parmetro con un cierto grado de certeza. Este mtodo
va a ser la determinacin de un intervalo
donde estar el parmetro con un nivel de confianza.
Estimacin de intervalo expresa la amplitud dentro de la cual
probablemente se encuentra
un parmetro poblacional.
El intervalo se construye a partir de una muestra, entonces, para cada
muestra se tendr un intervalo distinto. Llamaremos al error que se
permite al dar el intervalo y el nivel de confianza ser 1- . Un intervalo
tiene un nivel de confianza 1- cuando el 100(1- )% de
los intervalos que se construyen para el parmetro
lo contienen.

Es deseable para un intervalo de confianza que tenga la menor amplitud


posible, esta
amplitud depender de:

El tamao de la muestra, mientras mayor sea el tamao mejor


ser la estimacin, aunque se incurre en un aumento de costes
Nivel de confianza, si se pide mayor nivel de confianza, el
intervalo ser mayor.

2.5 Intervalos de confianza para medias.

En los captulos anteriores se estudio el estadstico

Como estimador de la media poblacional , y si se considera una


muestra grande , extraida de una poblacin con
conocida, entonces del teorema del limite central
y en consecuencia donde

Por lo que

De donde el intervalo de confianza de dos lados para la media con un


nivel de confianza de , cuando la muestra es grande es:
Y los lmites son:

El valor se obtiene de tablas de distribucin normal estndar


de forma que

Al denotar a z como es una notacin comn en


estadstica, pero no esta completamente generalizada.

Cuando la muestra es pequea (n < 30) y la poblacin tiene una


distribucin normal con variancia conocida, entonces puede emplearse.

2.6 Intervalos de confianza para diferencia entre medias.

Para construir intervalos de confianza para la diferencia de medias


poblacionales se hace uso de la distribucin en el muestreo de la
diferencia de medias mustrales.

Se sabe que si son variables


aleatorias independientes, entonces:

Y por tanto, si las distribuciones de la variables son normales,


cualesquiera que sean los
tamaos mustrales, se verificara que
Tambin se sabe que para muestras independientes se puede asegurar
que la distribucin de la diferencia de medias mustrales es
si las distribuciones de las variables son normales.

Si se conocen l as varianzas
poblacionales

Y a partir del intervalo de probabilidad con para la diferencia de


medias mustrales se construye el intervalo de confianza con
coeficiente de confianza (1- ) para la diferencia de medias
poblacionales:

Si no se conocen las varianzas poblacionales pero se


pueden suponer iguales

Siempre que y las muestras sean


independientes la distribucin
de la diferencia de medias mustrales es

Si las varianzas poblacionales se pueden suponer iguales se estima la


varianza comn por y en este caso la distribucin
del estadstico no

es normal sino y por ello, el intervalo de confianza, con


coeficiente de confianza
1- ser en este caso

Si no se conocen las varianzas poblaciones y no se pueden


suponer iguales
Si las varianzas poblacionales no se pueden suponer iguales, se
estiman por las cuasivarianzas de las muestras
correspondientes, y es este caso el estadstico
sigue una distribucin t de Student con g grados de libertad,
siendo el

numero natural mas prximo a

El intervalo de confianza ser:

2.7 Intervalos de confianza para


proporciones.

Si se toma una muestra de tamao n de una poblacin muy grande


(o infinita), y X observaciones pertenecen a la clase de inters,
entonces es un estimador puntual de la proporcin de la
poblacin que pertenece a la clase en cuestin, y la distribucin de
muestreo
es

Donde

Y p y n son los parmetros de la distribucin binomial.

Utilizando el estimador y aproximando la cantidad p(1-

p) mediante su estimador puntual se obtiene el intervalo

de confianza de dos lados con un


coeficiente para la proporcin p es

..(3.7)

Ejemplo
En una muestra al azar de 60 secciones de tubo en una planta qumica,
8 de ellos mostraron seales de corrosin seria. Construir un intervalo
de confianza del 95 % para la proporcin de los tramos de tubo con
corrosin seria.
Resoluc
in
Utilizando la formula (3.7), con de tablas, y
recordando que , se
tien
e:

Finalmen
te:

2.8 Intervalos de confianza para diferencias


entre proporciones.

Si dos muestras independientes de tamao se extraen de


poblaciones infinitas con distribuciones binomiales, X representa el
numero de observaciones de la primera muestra que corresponden a la
clase en cuestin, entonces la distribucin de muestreo para la
diferencia de proporciones esta dada por

Donde

De la definicin se obtiene el intervalo de confianza de dos lados para


la diferencia de proporciones, con un nivel de confianza de (
, el cual es

(3.8)

Ejem
plo

Dos grupos de 80 pacientes tomaron parte en un experimento en el cual


un grupo recibi pldoras que contenan un antialrgico, mientras que al
otro grupo se le administro un placebo, es decir, una pldora sin droga
alguna. En el grupo que recibi el medicamento 23 exhibieron sntomas
alrgicos, mientras que en el otro grupo 41 los exhibieron. Obtener un
intervalo de confianza del 99% para la diferencia entre las proporciones.
Tpicos
especiales:
Intervalo de confianza para la diferencia de
medias, casos especiales.

Existen algunos casos especiales para los intervalos de confianza de


diferencia de medias. El primero de ellos es cuando se tienen datos
apareados, o en pares, es decir, las muestras aleatorias no son
independientes y tienen el mismo tamao. El segundo de ellos, que
queda un poco ms all del objetivo del presente curso, se tiene cuando
las muestras son pequeas, independientes, con distribuciones
aproximadamente normales con varianzas desconocidas y diferentes.

Datos en
pares

Cuando se observan datos en pares y se espera que exista una fuerte


correlacin entre cada pareja de datos, se debe generar una nueva
variable aleatoria para construir el intervalo de confianza.
Sea la variable aleatoria , donde i =1, 2, , n,
entonces:
Y el intervalo se puede generar
mediante:

Variancias diferentes
muestras pequeas

Cuando el problema consiste en encontrar una estimacin por


intervalos para diferencia de medias , las muestras son
pequeas, las poblaciones son aproximadamente normales y las
varianzas desconocidas no pueden considerarse iguales, entonces no
existe un estadstico exacto para el problema; sin embargo, algunos
autores han encontrado muy buenas aproximaciones utilizando el
estadstico:

el cual tiene una distribucin aproximadamente t, con v grados de


libertad, los cuales se aproximan mediante:

O bien
mediante
Puesto que v difcilmente es entero se aproxima al entero
ms cercano.
El intervalo de confianza de dos lados queda entonces:

2.9 Intervalos de confianza


para varianzas.
Si X es una v.a. con distribucin normal y desconocidas,
con media el estadstico empleado es varianza entonces
Donde

Utilizando el estadstico se obtiene el intervalo de confianza


de dos lados con un coeficiente de confianza de para
, el cual es

Ejemplo:

Considerese los siguientes datos:

8. 8.2 8.24
2
8.2 8
8.2 8.25
3
8.2 1
8.2 8.24
4
8.2 3
8. 8.26
5
8.1 2
8.2 8.26
9 3
Obtener:
a) Un intervalo de confianza de dos lados del .
b) 95% para
inferior del
c) Un intervalo de confianza superior de 95%
95%
para
Resolucin
De los datos de la tabla se obtiene

a) Sustituyendo en

De tablas

Por lo que

b) Para un intervalo inferior

De tablas
Entonces

c) Para un intervalo superior

De tablas
Entonces

2.10 Intervalos de confianza para razones de dos


varianzas.

Si X y Y son vv.aa. independientes con distribuciones normales con


medidas desconocidas y variancias desconocidas,
respectivamente, entonces el estadstico empleado es
Donde

Utilizando el estadstico se obtiene el intervalo de confianza

de dos lados con un coeficiente de confianza de para la

relacin de las variancias , el cual es

Vous aimerez peut-être aussi