Vous êtes sur la page 1sur 58

CLASE 12

TEORA DEL MUESTREO

Ing. William Len Velsquez wjleonv@yahoo.com

Hasta ahora: conocidos los parmetros de la poblacin, se ha calculado la probabilidad de que en una muestra se obtenga cierto resultado (media o proporcin) Lo ms usual: conocidos los resultados de una muestra, queremos obtener algn conocimiento sobre los parmetros de la poblacin. Eso es la ESTIMACIN.
ING. WILLIAM LEON V. 2

Estimacin
Parmetro: es un valor numrico que describe una caracterstica de la poblacin. Estadstico: es un valor numrico que describe una caracterstica de la muestra. Estimador puntual: es el estadstico que se toma en una muestra determinada y que se usa para estimar un parmetro poblacional.

Estimacin puntual

En general, se verifica que, cualquier parmetro poblacional que se quiere estimar (, 2, p, .... etc.) tiene siempre en la muestra un ^2, p, ^ ..., ING. WILLIAM LEON V. estadstico paralelo ( x, s etc.) 3

Estimacin: puntual y por intervalos


A partir de los estadsticos que se ha obtenido en las muestras se quiere obtener una idea de los valores de los parmetros en la poblacin. Se trata de emplear los estadsticos para estimar los parmetros. Existen DOS tipos de estimadores: 1) Estimacin puntual. Aqu se obtendr un punto, un valor, como estimacin del parmetro. 2) Estimacin por intervalos. Aqu se obtendr un intervalo dentro del cual estimamos (bajo cierta probabilidad) estar el parmetro.
ING. WILLIAM LEON V. 4

Estimacin puntual de parmetros


Un estimador puntual es simplemente un estadstico (media aritmtica, varianza, etc.) que se emplea para estimar parmetros (media poblacional, varianza poblacional, etc.). Es decir, cuando se obtiene una media aritmtica a partir de una muestra, tal valor puede ser empleado como un estimador para el valor de la media poblacional. (Algunos autores comparan los estimadores con los lanzamientos en una diana; el crculo central sera el valor real del parmetro.)
ING. WILLIAM LEON V. 5

Estimacin puntual de parmetros


Cuatro tiradores han efectuado 10 disparos sobre una diana. Si traducimos cada disparo en una estimacin, efectuada por un determinado estimador, sobre una muestra, podemos interpretar las propiedades de los estimadores de la siguiente forma:

Propiedades de los estimadores


una comparacin

Estimador insesgado y no eficiente

Estimador sesgado y no eficiente

Estimador sesgado y eficiente

Estimador insesgado y eficiente

ING. WILLIAM LEON V. 6

Propiedades deseables en los estimadores


Existen CUATRO propiedades:

1. Ausencia de sesgo 2. Consistencia 3. Eficiencia 4. Suficiencia

ING. WILLIAM LEON V. 7

Estimador insesgado: es
aquel estimador para el que se cumple que su media coincide con el valor del parmetro que se va a estimar. Ejemplos: la media muestral y la proporcin muestral.

ING. WILLIAM LEON V. 8

Consistencia .- Una estadstica es un estimador consistente o coherente de un parmetro de poblacin, si al aumentar el tamao de la muestra se tiene casi la certeza de que el valor del estadstico se aproxima bastante al valor del parmetro de la poblacin. Si un estimador es consistente se vuelve mas confiable si tenemos tamaos de muestras mas grandes.
ING. WILLIAM LEON V. 9

Estimador eficiente: es aquel


estimador para el que su varianza es mnima. Ejemplos: tanto la media muestral como la proporcin muestral son ms eficientes cuanto mayor es el tamao de la muestra. En ambos casos, si aumenta n disminuye 2 .

ING. WILLIAM LEON V. 10

Suficiencia.Un estimador es suficiente si utiliza una cantidad de la informacin contenida de la muestra que ningn otro estimador podra extraer informacin adicional de la muestra sobre el parmetro de la poblacin que se esta estimando. Es decir se pretende que al extraer la muestra el estadstico calculado contenga toda la informacin de esa muestra. Por ejemplo, cuando se calcula la media de la muestra, se necesitan todos los datos.
ING. WILLIAM LEON V. 11

ING. WILLIAM LEON V. 12

En la estimacin puntual se obtiene un valor concreto como estimacin del parmetro poblacional; pero ese mtodo no permite tener una medida de la confianza que puede depositarse en el resultado de dicha inferencia. Para resolver ese problema se utiliza la estimacin por intervalos, que consiste en: Obtener un intervalo (intervalo de confianza) tal que haya una determinada probabilidad conocida (nivel de confianza) de que contenga al verdadero valor del parmetro poblacional. Si se refiere a la media , se trata de encontrar un intervalo (a , b) tal que: P ( a < < b) = 1 -
ING. WILLIAM LEON V. 13

Ejemplo.- Si se pide que estime la media poblacional con un nivel de confianza del 95%, Se realizar, a partir de una muestra, y encontrar un intervalo (a , b) en el cual se pueda asegurar que est contenida con una probabilidad de 0.95. En tal caso, la probabilidad de que no pertenezca a dicho intervalo ser de 0.05; se ser por lo tanto el riesgo asumido con esa estimacin (nivel de significacin).
ING. WILLIAM LEON V. 14

Intervalo de confianza: Es un intervalo (a , b) tal que hay una determinada probabilidad conocida de que contenga al verdadero valor del parmetro poblacional.

ING. WILLIAM LEON V. 15

Nivel de confianza: es la probabilidad de que el parmetro poblacional pertenezca al intervalo de confianza. Generalmente se representa por 1 . Es decir: P ( a < < b) = 1 -
ING. WILLIAM LEON V. 16

Nivel de significacin o de riesgo: es la probabilidad de que el parmetro poblacional no pertenezca al intervalo de confianza; es decir, 1 (1 ) = .

ING. WILLIAM LEON V. 17

Valor crtico: es el valor de la abscisa que deja a su derecha un rea igual a /2, siendo 1 el coeficiente de confianza. Se representa por z /2 .

ING. WILLIAM LEON V. 18

Margen de error: es la diferencia entre el extremo superior y el extremo inferior del intervalo de confianza: b a.

ING. WILLIAM LEON V. 19

Error mximo admisible: es la semiamplitud del intervalo de confianza; es decir, la mitad del margen de error. Se denomina E = (b a) / 2

ING. WILLIAM LEON V. 20

z/2 < Z z/2 = 1 Pr

1 - 0,8 0,2 /2 0,1 z/2 1,28

0,9 0,1 0,05 1,64

0,95 0,99 0,05 0,01 0,025 0,005 1,96 2,58

ING. WILLIAM LEON V.

21

Sea una poblacin de partida N(, ). Pretendemos estimar . Tomamos una muestra aleatoria de tamao n. Calculamos la media muestral x.
X La variable aleatoria X sigue una N(, ) Por tanto se aproxima a una N(0, 1) n n

X Entonces: Pr z /2 < z /2 = 1 . Y de aqu se obtiene n


ING. WILLIAM LEON V. 22

Intervalo de confianza para la media poblacional


El intervalo de confianza para el parmetro de una poblacin N( , ) al nivel de confianza 1 viene dado por IC = x z /2 n

Intervalo de confianza para la media poblacional


Si es desconocida y n es grande (n 30), el intervalo de confianza viene dado ^ s por IC = x z /2 n

^ donde s2 es la cuasivarianza muestral

ING. WILLIAM LEON V. 23

En una poblacin de tamao 64 se estudia una caracterstica X medida sobre sus individuos de la que se sabe que su media es 1012 y su desviacin tpica es 25. Hallar intervalos de confianza para el valor medio de la caracterstica X con coeficientes de confianza del 90% y 95%.
ING. WILL IAM LEO N V.

24

SOLUCIN: Estamos ante un caso de clculo de intervalo de confianza para la media de una poblacin normal con varianza conocida. En esta situacin sabemos que:

25

ING. WILL IAM LEO N V.

lo que nos lleva al intervalo de confianza para la media siguiente:

Para un coeficiente de confianza del 90% se tiene que:

26

ING. WILL IAM LEO N V.

El intervalo de confianza ser entonces:

Podemos concluir entonces que hay una probabilidad del 90% de que el valor medio de la caracterstica est entre 1006,86 y 1017,14. Para un coeficiente de confianza del 95% se tiene que:

27

ING. WILL IAM LEO N V.

El intervalo de confianza ser entonces:

Podemos concluir entonces que hay una probabilidad del 95% de que el valor medio de la caracterstica est entre 1005,875 y 1018,125. Se observa que al aumentar el coeficiente de confianza aumenta la amplitud del intervalo de confianza.

28

ING. WILL IAM LEO N V.

Se analizan 9 zumos de fruta y se ha obtenido un contenido medio de fruta de 22 mg por 100 cc de zumo. La varianza poblacional es desconocida, por lo que se ha calculado la cuasidesviacin tpica de la muestra que ha resultado ser 6,3 mg de fruta por cada 100 cc de zumo. Suponiendo que el contenido de fruta del zumo es normal, estimar el contenido medio de fruta de los zumos tanto puntualmente como por intervalos al 95% de confianza.
29 ING. WILL IAM LEO N V.

SOLUCIN: Para la estimacin puntual sabemos que en poblaciones normales un estimador lineal insesgado para la media poblacional es la media muestral, luego se puede estimar el contenido medio en fruta de los zumos en 22 mg por cada 100 cc de zumo

30

ING. WILL IAM LEO N V.

Para la estimacin por intervalos estamos ante un caso de clculo de intervalo de confianza para la media de una poblacin normal con varianza desconocida. En esta situacin sabemos que:

lo que nos lleva al intervalo de confianza para la media siguiente:

31

ING. WILL IAM LEO N V.

Para un coeficiente de confianza del 95% se tiene que:

El intervalo de confianza ser entonces:

Podemos concluir entonces que hay una probabilidad del 95% de que el valor medio del contenido en fruta del zumo est entre 17,15 y 26,84 mg por cada 100 cc de zumo.
32 ING. WILL IAM LEO N V.

^ Entonces p se distribuye en el muestreo segn una Np,

p(1 p) n

En consecuencia

^p p se aproxima a una N(0, 1) para n muy grande p(1 p) n

Entonces: Pr z/2 <

^p p z/2 = 1 p(1 p) n
ING. WILLIAM LEON V. 33

^ Por tanto: Prp z/2

p(1 p) < p ^ p + z/2 n

p(1 p) =1 n

^ Como p es desconocido podemos tomar p como valor estimado prximo a p:


^z Prp /2

^ (1 p) ^ p ^+z < p p /2 n

^ p (1 ^ p) =1 n

^z Luego IC = p /2

^ (1 p) ^ p n
ING. WILLIAM LEON V. 34

Si n es muy grande, lo que equivale a decir np > 5 y n(1 p) > 5, el intervalo de confianza para el parmetro p de una B(n, p) viene dado por ^ (1 p) ^ p ^z IC = p /2 n

x ^ donde z /2 es el valor crtico para el nivel de confianza y p = n

ING. WILLIAM LEON V. 35

Una forma de aumentar la confianza es ampliando el tamao del intervalo, pero esto tiene el inconveniente de que aumenta el margen de error. Otra forma es aumentar el tamao de la muestra, ya que el ancho del intervalo depende de n. Hasta dnde debe aumentar n para tener una confianza predeterminada?

ING. WILLIAM LEON V. 36

Una firma comercial encuesta a 100 individuos para conocer sus opiniones sobre la eleccin de dos productos alternativos A y B recientemente fabricados. El resultado de la encuesta arroja que el producto A lo han elegido 55 individuos y el producto B 45. Hallar un intervalo de confianza al 95% para la proporcin de individuos que eligen cada producto.

37

ING. WILL IAM LEO N V.

SOLUCIN:

Estamos ante el caso del clculo de intervalos de confianza para proporciones, ya que este problema es ajustable al caso en que p^= x / n es la proporcin estimada del nmero de veces que aparece un suceso de Bernoulli (los encuestados eligen A o B exclusivamente) de entre n repeticiones de un experimento (x designa el nmero de veces que aparece el suceso, es decir el nmero de veces que los encuestados eligen A o B)..

38

ING. WILL IAM LEO N V.

En este caso el intervalo de confianza para la proporcin se basa en el siguiente estadstico:

lo que nos lleva al intervalo de confianza para p definido por:

39

ING. WILL IAM LEO N V.

En nuestro caso, para el producto A tenemos el intervalo:

Para el producto B tenemos el intervalo:

40

ING. WILL IAM LEO N V.

Como conclusin podemos decir que hay una probabilidad del 95% entre 0,45 y 0,65 de que el producto elegido sea el A, y hay una probabilidad entre 0,35 y 0,55 de que el producto elegido sea el B.

41

ING. WILL IAM LEO N V.

Se estableci antes que una forma de disminuir el error de estimacin es aumentar el tamao de la muestra, si ste incluye el total de la poblacin, entonces |x - |sera igual a cero. Con esto en mente, parece razonable que para un nivel de confianza fijo, sea posible determinar un tamao de la muestra tal que el error de estimacin sea tan pequeo como queramos, para ser mas preciso, dado un nivel de confianza y un error fijo de estimacin , se puede escoger un tamao de muestra n tal que P( |x | <) = Nivel de confianza. Con el propsito de determinar n. El error mximo de estimacin esta dado por:
42 ING. WILL IAM LEO N V.

Si se eleva al cuadrado ambos lados de esta ecuacin y se despeja n de la ecuacin resultante, obtenemos:

Como n debe de ser un nmero entero, redondeamos hacia arriba todos los resultados fraccionarios.

43

ING. WILL IAM LEO N V.

En el caso de que se tenga una poblacin finita y un muestreo sin reemplazo, el error de estimacin se convierte en:

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

44

ING. WILL IAM LEO N V.

Ejemplos: 1. Un bilogo quiere estimar el peso promedio de los ciervos cazados en un determinado estado Un estudio anterior de diez ciervos cazados mostr que la desviacin estndar de sus pesos es de 12.2 libras. Qu tan grande debe ser una muestra para que el bilogo tenga el 95% de confianza de que el error de estimacin es a lo ms de 4 libras?
45

ING. WILL IAM LEO N V.

Solucin:

En consecuencia, si el tamao de la muestra es 36, se puede tener un 95% de confianza en que difiere en menos de 4 libras de X .

46

ING. WILL IAM LEO N V.

2. Una empresa elctrica fabrica focos que tienen una duracin aproximadamente normal con una desviacin estndar de 40 horas. De qu tamao se necesita una muestra si se desea tener 96% de confianza que la media real est dentro de 10 horas de la media real?

47

ING. WILL IAM LEO N V.

Se necesita una muestra de 68 focos para estimar la media de la poblacin y tener un error mximo de 10 horas.

48

ING. WILL IAM LEO N V.

Qu pasara si en lugar de tener un error de estimacin de 10 horas slo se requiere un error de 5 horas?

Se puede observar como el tamao de la muestra aumenta, pero esto tiene como beneficio una estimacin ms exacta.
49 ING. WILL IAM LEO N V.

3. Suponga que en el ejercicio anterior se tiene una poblacin de 300 focos, y se desea saber de que tamao debe de ser la muestra. El muestreo se realizar Solucin: Como se tiene una poblacin finita y un muestreo sin reemplazo es necesario utilizar la formula con el factor de correccin sin reemplazo.

Si se tiene una poblacin finita de 300 focos slo se tiene que extraer de la poblacin una muestra sin reemplazo de 56 focos para poder estimar la duracin media de los focos restantes con ING. un error mximo de 10 horas. WILL 50
IAM LEO N V.

Se desea saber que tan grande se requiere que sea una muestra para asegurar que el error al estimar P sea menor que una cantidad especfica

Elevando al cuadrado la ecuacin anterior se despeja n y nos queda:

51

ING. WILL IAM LEO N V.

La frmula est algo engaosa, pues debemos utilizar p para determinar el tamao de la muestra, pero p se calcula a partir de la muestra. Existen ocasiones en las cuales se tiene una idea del comportamiento de la proporcin de la poblacin y ese valor se puede sustituir en la frmula, pero si no se sabe nada referente a esa proporcin entonces se tienen dos opciones: Tomar una muestra preliminar mayor o igual a 30 para proporcionar una estimacin de P. Despus con el uso de la frmula se podra determinar de forma aproximada cuntas observaciones se necesitan para proporcionar el grado de precisin que se desea. Tomar el valor de p como 0.5 ya que sustituyendo este en la frmula se obtiene el tamao de muestra mayor posible.

52

ING. WILL IAM LEO N V.

En el caso de que se tenga una poblacin finita y un muestreo sin reemplazo, el error de estimacin se convierte en:

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

53

ING. WILL IAM LEO N V.

Ejemplos: 1. En una muestra aleatoria de 500 familias que tienen televisores en una gran ciudad, se encuentra que 340 estn suscritas a HBO. Qu tan grande se requiere que sea una muestra si se quiere tener 95% de confianza de que la estimacin de P est dentro de 0.02?:

54

ING. WILL IAM LEO N V.

Solucin: Se tratarn a las 500 familias como una muestra preliminar que proporciona una estimacin de p=340/500=0.68.

Por lo tanto si basamos nuestra estimacin de P sobre una muestra aleatoria de tamao 2090, se puede tener una confianza de 95% de que nuestra proporcin muestral no diferir de la proporcin real por ms de 0.02.
55 ING. WILL IAM LEO N V.

2. Una legisladora estatal desea encuestar a los residentes de su distrito para conocer qu proporcin del electorado conoce la opinin de ella, respecto al uso de fondos estatales para pagar abortos. Qu tamao de muestra se necesita si se requiere un confianza del 95% y un error mximo de estimacin de 0.10?

56

ING. WILL IAM LEO N V.

Solucin: En este problema, se desconoce totalmente la proporcin de residentes que conoce la opinin de la legisladora, por lo que se utilizar un valor de 0.5 para p.

Se requiere un tamao de muestra de 97 residentes para que con una confianza del 95% la estimacin tenga un error mximo de 0.10.

57

ING. WILL IAM LEO N V.

wjleonv@yahoo.com

Vous aimerez peut-être aussi