Académique Documents
Professionnel Documents
Culture Documents
Hasta ahora: conocidos los parmetros de la poblacin, se ha calculado la probabilidad de que en una muestra se obtenga cierto resultado (media o proporcin) Lo ms usual: conocidos los resultados de una muestra, queremos obtener algn conocimiento sobre los parmetros de la poblacin. Eso es la ESTIMACIN.
ING. WILLIAM LEON V. 2
Estimacin
Parmetro: es un valor numrico que describe una caracterstica de la poblacin. Estadstico: es un valor numrico que describe una caracterstica de la muestra. Estimador puntual: es el estadstico que se toma en una muestra determinada y que se usa para estimar un parmetro poblacional.
Estimacin puntual
En general, se verifica que, cualquier parmetro poblacional que se quiere estimar (, 2, p, .... etc.) tiene siempre en la muestra un ^2, p, ^ ..., ING. WILLIAM LEON V. estadstico paralelo ( x, s etc.) 3
Estimador insesgado: es
aquel estimador para el que se cumple que su media coincide con el valor del parmetro que se va a estimar. Ejemplos: la media muestral y la proporcin muestral.
Consistencia .- Una estadstica es un estimador consistente o coherente de un parmetro de poblacin, si al aumentar el tamao de la muestra se tiene casi la certeza de que el valor del estadstico se aproxima bastante al valor del parmetro de la poblacin. Si un estimador es consistente se vuelve mas confiable si tenemos tamaos de muestras mas grandes.
ING. WILLIAM LEON V. 9
Suficiencia.Un estimador es suficiente si utiliza una cantidad de la informacin contenida de la muestra que ningn otro estimador podra extraer informacin adicional de la muestra sobre el parmetro de la poblacin que se esta estimando. Es decir se pretende que al extraer la muestra el estadstico calculado contenga toda la informacin de esa muestra. Por ejemplo, cuando se calcula la media de la muestra, se necesitan todos los datos.
ING. WILLIAM LEON V. 11
En la estimacin puntual se obtiene un valor concreto como estimacin del parmetro poblacional; pero ese mtodo no permite tener una medida de la confianza que puede depositarse en el resultado de dicha inferencia. Para resolver ese problema se utiliza la estimacin por intervalos, que consiste en: Obtener un intervalo (intervalo de confianza) tal que haya una determinada probabilidad conocida (nivel de confianza) de que contenga al verdadero valor del parmetro poblacional. Si se refiere a la media , se trata de encontrar un intervalo (a , b) tal que: P ( a < < b) = 1 -
ING. WILLIAM LEON V. 13
Ejemplo.- Si se pide que estime la media poblacional con un nivel de confianza del 95%, Se realizar, a partir de una muestra, y encontrar un intervalo (a , b) en el cual se pueda asegurar que est contenida con una probabilidad de 0.95. En tal caso, la probabilidad de que no pertenezca a dicho intervalo ser de 0.05; se ser por lo tanto el riesgo asumido con esa estimacin (nivel de significacin).
ING. WILLIAM LEON V. 14
Intervalo de confianza: Es un intervalo (a , b) tal que hay una determinada probabilidad conocida de que contenga al verdadero valor del parmetro poblacional.
Nivel de confianza: es la probabilidad de que el parmetro poblacional pertenezca al intervalo de confianza. Generalmente se representa por 1 . Es decir: P ( a < < b) = 1 -
ING. WILLIAM LEON V. 16
Nivel de significacin o de riesgo: es la probabilidad de que el parmetro poblacional no pertenezca al intervalo de confianza; es decir, 1 (1 ) = .
Valor crtico: es el valor de la abscisa que deja a su derecha un rea igual a /2, siendo 1 el coeficiente de confianza. Se representa por z /2 .
Margen de error: es la diferencia entre el extremo superior y el extremo inferior del intervalo de confianza: b a.
Error mximo admisible: es la semiamplitud del intervalo de confianza; es decir, la mitad del margen de error. Se denomina E = (b a) / 2
21
Sea una poblacin de partida N(, ). Pretendemos estimar . Tomamos una muestra aleatoria de tamao n. Calculamos la media muestral x.
X La variable aleatoria X sigue una N(, ) Por tanto se aproxima a una N(0, 1) n n
En una poblacin de tamao 64 se estudia una caracterstica X medida sobre sus individuos de la que se sabe que su media es 1012 y su desviacin tpica es 25. Hallar intervalos de confianza para el valor medio de la caracterstica X con coeficientes de confianza del 90% y 95%.
ING. WILL IAM LEO N V.
24
SOLUCIN: Estamos ante un caso de clculo de intervalo de confianza para la media de una poblacin normal con varianza conocida. En esta situacin sabemos que:
25
26
Podemos concluir entonces que hay una probabilidad del 90% de que el valor medio de la caracterstica est entre 1006,86 y 1017,14. Para un coeficiente de confianza del 95% se tiene que:
27
Podemos concluir entonces que hay una probabilidad del 95% de que el valor medio de la caracterstica est entre 1005,875 y 1018,125. Se observa que al aumentar el coeficiente de confianza aumenta la amplitud del intervalo de confianza.
28
Se analizan 9 zumos de fruta y se ha obtenido un contenido medio de fruta de 22 mg por 100 cc de zumo. La varianza poblacional es desconocida, por lo que se ha calculado la cuasidesviacin tpica de la muestra que ha resultado ser 6,3 mg de fruta por cada 100 cc de zumo. Suponiendo que el contenido de fruta del zumo es normal, estimar el contenido medio de fruta de los zumos tanto puntualmente como por intervalos al 95% de confianza.
29 ING. WILL IAM LEO N V.
SOLUCIN: Para la estimacin puntual sabemos que en poblaciones normales un estimador lineal insesgado para la media poblacional es la media muestral, luego se puede estimar el contenido medio en fruta de los zumos en 22 mg por cada 100 cc de zumo
30
Para la estimacin por intervalos estamos ante un caso de clculo de intervalo de confianza para la media de una poblacin normal con varianza desconocida. En esta situacin sabemos que:
31
Podemos concluir entonces que hay una probabilidad del 95% de que el valor medio del contenido en fruta del zumo est entre 17,15 y 26,84 mg por cada 100 cc de zumo.
32 ING. WILL IAM LEO N V.
p(1 p) n
En consecuencia
^p p z/2 = 1 p(1 p) n
ING. WILLIAM LEON V. 33
p(1 p) =1 n
^ (1 p) ^ p ^+z < p p /2 n
^ p (1 ^ p) =1 n
^z Luego IC = p /2
^ (1 p) ^ p n
ING. WILLIAM LEON V. 34
Si n es muy grande, lo que equivale a decir np > 5 y n(1 p) > 5, el intervalo de confianza para el parmetro p de una B(n, p) viene dado por ^ (1 p) ^ p ^z IC = p /2 n
Una forma de aumentar la confianza es ampliando el tamao del intervalo, pero esto tiene el inconveniente de que aumenta el margen de error. Otra forma es aumentar el tamao de la muestra, ya que el ancho del intervalo depende de n. Hasta dnde debe aumentar n para tener una confianza predeterminada?
Una firma comercial encuesta a 100 individuos para conocer sus opiniones sobre la eleccin de dos productos alternativos A y B recientemente fabricados. El resultado de la encuesta arroja que el producto A lo han elegido 55 individuos y el producto B 45. Hallar un intervalo de confianza al 95% para la proporcin de individuos que eligen cada producto.
37
SOLUCIN:
Estamos ante el caso del clculo de intervalos de confianza para proporciones, ya que este problema es ajustable al caso en que p^= x / n es la proporcin estimada del nmero de veces que aparece un suceso de Bernoulli (los encuestados eligen A o B exclusivamente) de entre n repeticiones de un experimento (x designa el nmero de veces que aparece el suceso, es decir el nmero de veces que los encuestados eligen A o B)..
38
39
40
Como conclusin podemos decir que hay una probabilidad del 95% entre 0,45 y 0,65 de que el producto elegido sea el A, y hay una probabilidad entre 0,35 y 0,55 de que el producto elegido sea el B.
41
Se estableci antes que una forma de disminuir el error de estimacin es aumentar el tamao de la muestra, si ste incluye el total de la poblacin, entonces |x - |sera igual a cero. Con esto en mente, parece razonable que para un nivel de confianza fijo, sea posible determinar un tamao de la muestra tal que el error de estimacin sea tan pequeo como queramos, para ser mas preciso, dado un nivel de confianza y un error fijo de estimacin , se puede escoger un tamao de muestra n tal que P( |x | <) = Nivel de confianza. Con el propsito de determinar n. El error mximo de estimacin esta dado por:
42 ING. WILL IAM LEO N V.
Si se eleva al cuadrado ambos lados de esta ecuacin y se despeja n de la ecuacin resultante, obtenemos:
Como n debe de ser un nmero entero, redondeamos hacia arriba todos los resultados fraccionarios.
43
En el caso de que se tenga una poblacin finita y un muestreo sin reemplazo, el error de estimacin se convierte en:
44
Ejemplos: 1. Un bilogo quiere estimar el peso promedio de los ciervos cazados en un determinado estado Un estudio anterior de diez ciervos cazados mostr que la desviacin estndar de sus pesos es de 12.2 libras. Qu tan grande debe ser una muestra para que el bilogo tenga el 95% de confianza de que el error de estimacin es a lo ms de 4 libras?
45
Solucin:
En consecuencia, si el tamao de la muestra es 36, se puede tener un 95% de confianza en que difiere en menos de 4 libras de X .
46
2. Una empresa elctrica fabrica focos que tienen una duracin aproximadamente normal con una desviacin estndar de 40 horas. De qu tamao se necesita una muestra si se desea tener 96% de confianza que la media real est dentro de 10 horas de la media real?
47
Se necesita una muestra de 68 focos para estimar la media de la poblacin y tener un error mximo de 10 horas.
48
Qu pasara si en lugar de tener un error de estimacin de 10 horas slo se requiere un error de 5 horas?
Se puede observar como el tamao de la muestra aumenta, pero esto tiene como beneficio una estimacin ms exacta.
49 ING. WILL IAM LEO N V.
3. Suponga que en el ejercicio anterior se tiene una poblacin de 300 focos, y se desea saber de que tamao debe de ser la muestra. El muestreo se realizar Solucin: Como se tiene una poblacin finita y un muestreo sin reemplazo es necesario utilizar la formula con el factor de correccin sin reemplazo.
Si se tiene una poblacin finita de 300 focos slo se tiene que extraer de la poblacin una muestra sin reemplazo de 56 focos para poder estimar la duracin media de los focos restantes con ING. un error mximo de 10 horas. WILL 50
IAM LEO N V.
Se desea saber que tan grande se requiere que sea una muestra para asegurar que el error al estimar P sea menor que una cantidad especfica
51
La frmula est algo engaosa, pues debemos utilizar p para determinar el tamao de la muestra, pero p se calcula a partir de la muestra. Existen ocasiones en las cuales se tiene una idea del comportamiento de la proporcin de la poblacin y ese valor se puede sustituir en la frmula, pero si no se sabe nada referente a esa proporcin entonces se tienen dos opciones: Tomar una muestra preliminar mayor o igual a 30 para proporcionar una estimacin de P. Despus con el uso de la frmula se podra determinar de forma aproximada cuntas observaciones se necesitan para proporcionar el grado de precisin que se desea. Tomar el valor de p como 0.5 ya que sustituyendo este en la frmula se obtiene el tamao de muestra mayor posible.
52
En el caso de que se tenga una poblacin finita y un muestreo sin reemplazo, el error de estimacin se convierte en:
53
Ejemplos: 1. En una muestra aleatoria de 500 familias que tienen televisores en una gran ciudad, se encuentra que 340 estn suscritas a HBO. Qu tan grande se requiere que sea una muestra si se quiere tener 95% de confianza de que la estimacin de P est dentro de 0.02?:
54
Solucin: Se tratarn a las 500 familias como una muestra preliminar que proporciona una estimacin de p=340/500=0.68.
Por lo tanto si basamos nuestra estimacin de P sobre una muestra aleatoria de tamao 2090, se puede tener una confianza de 95% de que nuestra proporcin muestral no diferir de la proporcin real por ms de 0.02.
55 ING. WILL IAM LEO N V.
2. Una legisladora estatal desea encuestar a los residentes de su distrito para conocer qu proporcin del electorado conoce la opinin de ella, respecto al uso de fondos estatales para pagar abortos. Qu tamao de muestra se necesita si se requiere un confianza del 95% y un error mximo de estimacin de 0.10?
56
Solucin: En este problema, se desconoce totalmente la proporcin de residentes que conoce la opinin de la legisladora, por lo que se utilizar un valor de 0.5 para p.
Se requiere un tamao de muestra de 97 residentes para que con una confianza del 95% la estimacin tenga un error mximo de 0.10.
57
wjleonv@yahoo.com