Vous êtes sur la page 1sur 51

MBA Virtual

2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

PRESENTACION CENTRUM ORGANIZADA Y ORDENADA

MBA Virtual
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Muestreo y Estimacin de parmetros

Inferencia Estadstica
La inferencia estadstica se refiere a los mtodos y procesos para obtener conclusiones acerca de la poblacin, basados en informacin muestral.
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

MBA Virtual

El muestreo
El objetivo del muestreo es seleccionar una muestra que sea representativa de la poblacin. representativa y permita hacer inferencia
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Para

que

la

muestra

sea

considerada

estadstica se requiere que el proceso de seleccin sea aleatorio.

MBA Virtual

MBA Virtual
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

I. Distribuciones Muestrales y Teorema del Limite Central

I.1.Media muestral: variable aleatoria


Si tomamos una muestra aleatoria de tamao n de una poblacin podemos calcular la media de la muestra:

Si tomamos otra muestra obtendremos un valor diferente de la media. En general, es posible calcular la media para cada muestra de tamao n que seleccionemos de la poblacin. La variable aleatoria cuyos valores posibles son todas estas medias se llama media muestral de tamao n, y se denota X .
MBA Virtual

2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

x2+ x2+ ... + xn x= n

Se cumple que si se toma una muestra aleatoria de tamao n de una poblacin infinita (muy grande), con media y varianza 2, se cumple que:

E ( X ) = X =

(estimador insesgado) (error estndar de la media muestral)

__

Si n 2 2

2 X ~ N , aprox n

Este resultado tambin vale si la muestra se extrae con reposicin de una poblacin finita
MBA Virtual

2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

DE ( X ) = = X n

I.2. Proporcin Muestral


En la poblacin, la probabilidad de observar la caracterstica de inters es p. Al valor p se le denomina proporcin poblacional.
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Se toma una muestra aleatoria de tamao n y en cada elemento muestreado se observa si tiene o no la caracterstica de inters. Se define la proporcin muestral como:
N de elementos de la muesra con la caracterstica de inters P= Tamao de la muestra
__
MBA Virtual

Distribucin de la proporcin muestral


Si

P representa la proporcin muestral se cumple que:

E ( P ) = P = p
p (2 p ) P ~ N p, n
aprox
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

p (2 p ) V ( P ) = = n
2 P

Si n 2 : 2

La aproximacin es buena si:

np 2
MBA Virtual

n(2 p ) 2

I.3. Teorema Central del Lmite


Conforme se incrementa el tamao de la muestra La distribucin de la media muestral se aproxima a la normal.

X
MBA Virtual

2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Teorema Central del Lmite


A medida que el tamao de la muestra se muestral X se aproxima a una distribucin
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

incrementa,

la

distribucin

de

la

media

normal, independientemente de la distribucin de la poblacin de la cual se obtuvo la muestra.


MBA Virtual

MBA Virtual

II. Estimacin
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Proceso de Estimacin
: desconocida : desconocida estimado= estimado= s

Muestra Poblacin
Estimador

Estimacin
MBA Virtual

2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Poblacin

Estimacin de parmetros
Definimos la poblacin que nos interesa. No conocemos sus parmetros. De la poblacin se obtiene una muestra aleatoria. A partir de la muestra, obtenemos informacin acerca los parmetros desconocidos.
MBA Virtual
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Mtodos de estimacin de parmetros


Estimacin puntual El 24% de los limeos tiene temor a sufrir un atraco o asalto con armas, segn sondeo PUCP de agosto 2009. Estimacin por intervalos
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Parmetro = Nmero

Parmetro est en el intervalo [a, b]


MBA Virtual

El peso medio de la caja pequea de

MBA Virtual
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

II.1. Estimacin Puntual

Estimacin Puntual
El estadstico muestral usado para aproximar un parmetro desconocido de la poblacin se llama estimador puntual. El estimador puntual es una variable aleatoria y por lo tanto tiene una distribucin de probabilidades Con los datos observados en la muestra se evala el estimador puntual y se obtiene un nmero que es la estimacin puntual del parmetro de inters.
MBA Virtual
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Ejemplos de estimadores puntuales


2 La media muestral X es estimador puntual de . la media poblaciona l . la probabilid ad de xito en la poblacin (proporci n poblaciona l) p. 2 La varianza muestral S 2es estimador puntual de . la varianza poblaciona l 2 .
S 2=
MBA Virtual
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

2 La proporcin muestral P es estimador puntual de .

(X i X ) 2
i =2

n 2

MBA Virtual
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

II.2. Estimacin por Intervalos de Confianza

Estimacin por intervalos de confianza


El objetivo de la estimacin por intervalo es encuentra la estimacin puntual - calculada con los datos de la muestra - del verdadero valor del parmetro de inters.
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

dar informacin acerca de qu tan cerca se

MBA Virtual

Intervalo de confianza
La forma general de una estimacin por intervalo es: Estimacin puntual margen de error Describe un intervalo de valores dentro del cual es posible que est el parmetro de inters. Un intervalo de confianza al nivel (1-)*100% para el parmetro , es un intervalo que contiene a este parmetro con una probabilidad (1-).
MBA Virtual
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Interpretacin del nivel de confianza


Ejemplo: Nivel de confianza = 95%
Si se seleccionan repetidamente 1000 muestras de ellas, podremos construir 1000 intervalos de confianza para estimar la media poblacional . Se espera o confa que aproximadamente 950 de ellos contengan el parmetro y los restantes no lo contengan.
MBA Virtual
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

de tamao n, y calculamos la media de cada una

Estimacin por intervalo para la media a un nivel de confianza del 95%

Intervalos a 95% de confianza para , generados con once muestras de tamao n


MBA Virtual

Figura: http://www.fisicanet.com.ar/matematica/estadisticas/ap1/estadistica06.gif

2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Factores que afectan el margen de error del intervalo de confianza


El margen de error determina qu tan
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

precisa es la estimacin realizada, y este valor depende de los siguientes factores:


Tamao de la muestra: n

Nivel de confianza: (1-) Variabilidad de la poblacin:

MBA Virtual

Estimacin por intervalos


Poblacin Muestra aleatoria simple
La media, , es desconocida

Intervalo de confianza

Media muestral
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Media X = 50

La media de la poblacin est entre 44 y 56 con una confianza del 95%

Muestra

MBA Virtual

MBA Virtual

2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

II.2.1. Intervalos de confianza para la media de una poblacin

Procedimiento general para hallar el IC para la media poblacional


Tomar una muestra de tamao n
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Calcular la media muestral Con la media muestral como centro, formar el IC El margen de error es el producto:
( z / 2)(error estndar de la media muestral ) = z / 2 x z / 2representa un valor de la Dist. Normal estndar que depende del nivel de confianza usado en la estimacin

MBA Virtual

Intervalos de confianza para la media


Caso 2 La varianza de la poblacin es conocida : Si la poblacin es normal o el tamao de muestra es grande (n2 ) el intervalo para estimar la media a 2, un nivel de confianza del (2 2 2 es: ) 2 %
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

x z

x + z n

Notacin : Si Z ~ N (2 ) P ( Z z / 2 = ,2 )
MBA Virtual

Intervalos para niveles de confianza usuales

x z
2

IC (2%) = x 2 2 x 2 .22

IC (2%) = x 2 2 x 2 .2

IC (2%) = x 2 2 x 2 .2
MBA Virtual

2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

x + z n 2 n

Ejemplo
Para estimar el precio medio de las guas tursticas para visitar el Cusco se elige una muestra aleatoria formada por 34 guas y se determina que la media muestral es de S/.34.90 Por estudios realizados anteriormente se sabe que la desviacin estndar de los precios de estas guas es de S/.4.50 Construya un intervalo de confianza para el precio medio de las guas tursticas para visitar el Cusco, al nivel del 95 %. Interprete

MBA Virtual

30

2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Solucin:
El intervalo de confianza al 95% est dado por:
x 2 2 .2

x +2 2 .2

n
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Reemplazando los datos tenemos:

2 .2 2 .2 2.2 2 2 2 .2 2.2 2 2 2 + .2 2 2 2 2 2.3 2.2 23 22


El precio medio de las guas de turismo para visitar el Cusco, est entre S/.33.39 y S/.36.41, con una confianza del 95%
MBA Virtual

31

Intervalos de confianza para la media


Caso 2 La varianza de la poblacin es desconocida : Si la poblacin es normal o el tamao de muestra es grande (n2 ) el intervalo para estimar la media a 2, un nivel de confianza del (2 2 2 es: ) 2 %
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

x t (

2 2 ,n )

s x + t ( n

2 2 ,n )

s n

Notacin
MBA Virtual

: Si T ~ t ( n 2 P (T t ( / 2n 2) = ) , )

Distribucin t student
Normal estndar
t ( gl = 13) t ( gl = 5)
t
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

0
MBA Virtual

Grados de libertad (gl)


Nmero de observaciones que son libres de

La media de 3 nmeros es 25
Grados de libertad =n-1 =3-1 =2

X1 = 24 o cualquier otro nmero X2 = 28 o cualquier otro nmero X3 = 23 y no puede variar.

MBA Virtual

2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

variar para mantener el valor de la media muestral constante Ejemplo

Ejemplo Se desea estimar la longitud media de cierto tipo de cable. En una muestra de 100 de estos cables se encuentra que la longitud media es de 80m y la desviacin estndar de 1.5m. Hallar un intervalo con una confianza del 99%, para la media de las longitudes de los cables.

Respuesta: La longitud media de los cables se estima entre 79,61 m y 80,39 m con una confianza del 99%
MBA Virtual

2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Ejemplo El nmero de libros vendidos diariamente en cierta librera se modela con una distribucin normal. Se observ cuntos libros se vendieron diariamente en una muestra de diez das: 42, 35, 28, 39, 47, 40, 31, 44, 37, 51. Estime el nmero medio de libros vendidos diariamente en la librera usando un intervalo de confianza del 95%.

MBA Virtual

2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Solucin:
A partir de los datos calculamos la media y desviacin estndar muestrales:

Luego, usamos la hoja de excel:


Microsoft Excel Worksheet

Con una confianza del 95%, se estima que el nmero medio de libros vendidos diariamente en la librera est entre 34.36 y 44.44
MBA Virtual

2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

x = 2. 2 2 libros; s = 2 2 .2 libros

MBA Virtual
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

II.2.2. Intervalo de confianza para la proporcin

Intervalo de confianza para la Proporcin

Se usa para obtener estimaciones de la probabilidad p de ocurrencia de un evento de inters en la poblacin


2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Se debe verificar que la muestra sea grande (n 30). La estimacin por intervalo para p, a un nivel de

confianza del (1- )x100%, est dada por:

I ( p ) = [ p z P ]
2

con P =

p (2 p ) n

donde p es la proporcin muestral calculada con los datos de la muestra


MBA Virtual

Ejemplo En una muestra aleatoria de 100 clientes de una empresa de telefona celular, se encontr que 28 de ellos presentaron quejas por fallas en el servicio durante el mes de abril. Hallar un intervalo con una confianza del 90%, para la proporcin de clientes de esta empresa que presentaron quejas por fallas en el servicio, durante el mes de abril.

MBA Virtual

2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Solucin:

La proporcin de clientes que presentaron quejas por fallas en el servicio, durante el mes de abril, se estima entre 0.206 y 0.354, con una confianza del 90%
MBA Virtual

2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

N .C. = 2 2 2 = 2 2 z22 = 2 2 .2 = .2 . 2 .22 2 2 2 n = 22 : p = 2 =22 .2 22 2 (2 2 2 2 .2)( .2) __ __ = =22 .22 P P 22 2 I ( p ) = [2 2 2 2 2 3] = [2 2 2 2] .2 .22 .33 .2 .22

MBA Virtual
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

III. Tamao de Muestra

III.1. Tamao de muestra para estimar la media


Dados el margen de error mximo admisible, e, y el nivel de confianza requerido; el tamao de muestra, n, necesario para estimar la media poblacional cumpliendo estos requisitos es:

z z 2 n = = 22 e e
2
MBA Virtual

2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Ejemplo
Se necesita estimar el gasto medio diario en alimentacin, por persona, de los alumnos de cierta universidad. Con base en un estudio anterior se ha determinado que la desviacin estndar del gasto diario en alimentacin es S/.10 Determinar el tamao de muestra necesario si se quiere que el margen de error de la estimacin no sea mayor a S/.2, usando un nivel de confianza del 95%.
MBA Virtual
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Solucin

2 2 2 .2 2 n= = 3 .2 32 2 2 Basta usar una muestra de n = 2 alumnos 2


MBA Virtual

2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

N .C. = 2% (2 ) = 2 2 2 .2 = 2 3 .33 2 z( 222 = 2 2 = 2; e = 2 .2; 2 . 2)

III.2. Tamao de muestra para estimar la proporcin


Dados el error de estimacin mximo admisible, e, y el nivel de confianza requerido; el tamao de muestra, n, necesario para estimar la proporcin poblacional es:
2 z p2(2 p2) z p2(2 p2) n= 2 = 2 e e2 2
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

donde p0 representa una estimacin previa del parmetro p. En el caso de no tener estimaciones previas de p, se usa p0 =0.5 que produce el mayor tamao de muestra posible
MBA Virtual

Ejemplo
Un agente de turismo quiere estimar el porcentaje de turistas extranjeros que visitan Machu Picchu.
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Determinar el tamao de muestra necesario si se quiere que el margen de error de la estimacin no sea mayor a 0.03 (tres puntos porcentuales), usando un nivel de confianza del 90%. Con base en un estudio anterior, se estima inicialmente en 70% el porcentaje de turistas extranjeros que visitan Machu Picchu.
MBA Virtual

Solucin

p = proporcin de turistas extranjero s que visitan Machu Picchu


2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

N .C. = 2% (2 ) = 2 2 2 .2 = 2 2 .2 2 z( 23) = 2 2; p2 = 2 ; e = 2 2 .22 .2 .2 . 3


2 3 2 2 2 2 2 .33 .2 .2 n= = 22 2 2.2 22 .2 2 Basta usar una muestra de n = 22 2 turistas
MBA Virtual

sigue ejemplo
Cul sera el tamao de muestra necesario en el ejemplo anterior si no se tuviera ninguna informacin visitan Machu Pucchu?
2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

previa acerca del porcentaje de turistas extranjeros que

MBA Virtual

Solucin
p = proporcin de turistas extranjero s que visitan Machu Picchu N .C. = 2% (2 ) = 2 2 2 .2 = 2 2 .2 2 z( 22) = 2 2; e = 2 2 .22 .2; . 2 po = desconocido usamos po = 2 2 .2 2 2 2 2 2 2 2 .22 .2 .2 n= = 33 3 3 .3 2 22 .2 En este caso deberamos usar una muestra de n = 22 2 turistas
MBA Virtual

2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per

Recomendaciones
El intervalo de confianza (refleja el error de estimacin) debera ser siempre reportado con la estimacin puntual del parmetro El nivel de confianza y el tamao de muestra siempre deben ser reportados El proceso de colecta de datos debe ser descrito.

MBA Virtual

2009 CENTRUM Catlica - Pontificia Universidad Catlica del Per