Vous êtes sur la page 1sur 20

INFERENCIA ESTADISTICA

ACT 6 TRABAJO COLABORATIVO

INTEGRANTES LENNYS ANDRES VARGAS VALDERRAMA COD 80224395 LUIS FERNANDO MURIEL DELGADO COD 80227496 HENRY CALDERON ENCISO COD 80281498

GRUPO: 100403-42

PROFESOR DANYS BRITO TUTOR VIRTUAL

UNIVERSIDAD NACIONAL ABIERTA Y ADISTANCIA UNAD ESCUELA DE CIENCIAS BASICAS TECNOLOGIA E INGENIERIA

12 DE OCTUBRE DE 2011

INTRODUCCIN

Dentro de la inferencia estadstica, el proceso de muestreo permite que a partir de los resultados obtenidos al analizar una muestra, se pueda obtener conclusiones en cuanto a una o varias de las caractersticas o parmetros de una poblacin. Esta rea de la Estadstica, ayuda a determinar la confiabilidad de la inferencia de que los fenmenos observados en la muestra ocurrirn tambin en la poblacin de donde se selecciona la muestra. Es decir, sirve para estimar la eficacia del razonamiento inductivo con el cual se infiere que lo observado en una parte ser equivalente a lo observado en la poblacin. Los estadsticos usan la palabra poblacin para referirse no slo a personas sino a todos los elementos que han sido elegidos para un estudio, y emplean la palabra muestra para describir una porcin elegida de la poblacin. En el presente trabajo se hace una revisin de la primera unidad con todas sus lecciones relacionadas, el cual se investiga y conceptualiza los diferentes aspectos que abarca el tema de muestreo, Distribuciones Mustrales e Intervalos de confianza. A continuacin relacionamos los diez (10) puntos planteados en la gua de la Unidad I el cual se dieron solucin entre cada uno de los integrantes del grupo colaborativo.

OBJETIVOS

Comprender la diferencia de los conceptos de Muestreo por conglomerado, muestreo estratificado, Error muestral, error No muestral, Muestreo simple, muestreo sistemtico, Muestra aleatoria, muestra No aleatoria. Identificar el margen de error que se presentan en diferentes situaciones o problemas estadsticos planteados. Determinar un tamao de muestra representativo tanto para medias como para proporciones. Comprender los conceptos de poblacin y muestra. Identificar el tipo de muestreo de acuerdo a los objetivos del estudio. Identificar los diferentes diseos de muestreo y su utilidad en diferentes campos del saber.

1. Explique la diferencia entre cada par de trminos: Muestreo por conglomerado y muestreo estratificado Muestreo Por Conglomerado Muestreo contrario al estratificado. Los elementos de la poblacin estn divididos en forma natural. Se seleccionan subgrupos a los que llamamos conglomerados Es eficiente cuando la poblacin es grande y dispersa. No es pertinente tener un listado de toda la poblacin. Reduce costos. El error estndar es mayor. Error muestral y error No muestral Error Muestral Error No Muestral Muestreo Estratificado. Muestreo contrario al conglomerado. Los elementos de la poblacin los divide el investigador Los subgrupos hechos por el investigador se llaman estratos. Se obtienen estimaciones ms precisas

La muestra representa correctamente a la poblacin en una variable especifica Es pertinente identificar la poblacin de estudio. Los anlisis son ms complejos.

El error muestral hace referencia a la variacin natural entre muestras de la misma poblacin.

Los errores que se obtienen al tomar las muestras se denominan errores no mustrales.

Cualquier medida tiende a esperar algn error.

Son los errores que se pueden presentar en el proceso de la investigacin. El error no muestral no se pueden medir fcilmente. Por ejemplo cuando se define mal un problema. Pueden aumentar a medida que aumenta el tamao de la muestra.

El error muestral se puede medir (cuantificable).

Es de mucha utilidad para el investigador. Es la diferencia del valor de la muestra y el valor real de la poblacin.

Muestreo simple y muestreo sistemtico Muestreo Simple Muestreo Sistemtico

La muestra se pude tomar de una poblacin infinita o Es fcilmente aplicable. finita. Con las muestras pequeas puede que no se represente bien a la poblacin. Cada elemento tiene la misma probabilidad de ser elegido. El muestreo se hace con o sin remplazamiento. Se basa en la teora estadstica. Es la forma ms sencilla de muestreo probabilstico. Sencillo y de fcil comprensin. La unidad de muestreo es igual a la unidad de observacin. Necesita un listado de toda la poblacin. Muestra aleatoria y muestra No aleatoria Muestra Aleatoria Muestras probabilsticas. Muestra de azar o probabilidad. Muestra No Aleatoria Muestras no probabilsticas. Muestra realizada por el criterio del investigador. El anlisis es similar al muestreo simple. Se toman los elementos de la muestra uno a uno ordenadamente. Se utiliza por contadores para realizar procesos matemticos. Se pueden producir estimaciones sesgadas. Es un mtodo directo y econmico. Tamao de la poblacin / Tamao de la muestra Ms til cuando la poblacin sesta ordenada siguiendo un patrn conocido. No es necesario tener una lista de la poblacin.

Los elementos de la poblacin tienen la misma Los elementos de la poblacin no tienen la misma probabilidad de ser seleccionados. oportunidad de ser seleccionados. Muestras no sesgadas. Muestreo aleatorio simple. Muestreo aleatorio sistemtico. Muestreo aleatorio estratificado Muestreo aleatorio por conglomerados. Los errores en el muestreo son menores. Muestras sesgadas. Muestreo por cuotas: Muestreo opintico o intencional. Muestreo casual o incidental. Bola de nieve. Los errores en el muestreo son mayores.

2. La estimacin requiere el conocimiento del tipo de distribucin terica de probabilidad de la poblacin objeto de estudio. Cul es la utilidad del teorema del Lmite Central en este propsito? Con el Teorema del Limite central no se hace necesario conocer la distribucin terica de la poblacin objeto de estudio, Ya que si la poblacin est o no distribuida normalmente y la muestra es suficientemente grande (Para algunos estadgrafos n>30) la distribucin muestral de las medias tiende a ser ms o menos normal y la media de las medias mustrales se aproximar a la media poblacional, en conclusin, si una muestra es lo bastante grande sea cual sea la distribucin de la media muestral, seguir aproximadamente una distribucin normal.

3. A qu se refiere el margen de error en un intervalo de confianza. Tenemos que el intervalo de confianza es un conjunto de valores formado a partir de una muestra de datos en donde existe una probabilidad especfica de que el parmetro buscado se encuentre en dicho conjunto. Por lo tanto el margen de error constituye la mxima o mnima probabilidad que se tiene o que se est dispuesto a asumir (segn el estadgrafo) de cometer un error o como la probabilidad de tomar la decisin de rechazar una hiptesis nula cuando sta es verdadera. (Nivel de significacin). * Error tipo I: es el error que se comete cuando el investigador rechaza la hiptesis nula siendo sta verdadera en la poblacin. Falso positivo. Error tipo II, se comete cuando el investigador no rechaza la hiptesis nula siendo sta falsa en la poblacin. Falso negativo:

4. Explique cules son los criterios que debe cumplir una muestra seleccionada de poblacin para considerarla representativa de dicha poblacin. Para que una muestra sea representativa y por lo tanto til debe de reflejar las similitudes y diferencias encontradas en la poblacin, debe ejemplificar las caractersticas de la misma. Cuando se dice que una muestra es representativa implica que rene aproximadamente las caractersticas de la poblacin que son importantes para la investigacin. Hay cuestiones que se deben especificar a la hora de elegir una muestra representativa: 1. El mtodo de seleccin de los individuos de la poblacin (tipo de muestreo que se va a utilizar). 2. El tamao de la muestra. 3. El grado de fiabilidad de las conclusiones que vamos a presentar, es decir, una estimacin del error que vamos a cometer. Para que una muestra sea representativa hay que utilizar el tipo de muestreo probabilstico que es aquel en el que cada muestra tiene la misma probabilidad de ser elegida. Dentro del muestreo probabilstico podemos distinguir entre los siguientes tipos de muestreo: Muestreo aleatorio con y sin reemplazo. Muestreo estratificado. Muestreo por conglomerados. Muestreo sistemtico. Otros tipos de muestreo.

Muestreo aleatorio con y sin reemplazo: Para que una muestra sea representativa de la poblacin, debemos realizar un muestreo aleatorio. Un muestreo es aleatorio cuando, el proceso de seleccin de la muestra garantice que todas las muestras posibles que se pueden obtener de la poblacin tienen la misma probabilidad de ser elegidas, es decir, todos los elementos de la poblacin tienen la misma posibilidad de ser seleccionados para formar parte de la muestra. Cuando un elemento es seleccionado y hemos medido las variables necesarias para el estudio y puede volver a ser seleccionado, se dice que hacemos muestreo aleatorio con reemplazamiento o reposicin. Generalmente recibe el nombre de muestreo aleatorio simple. En caso de que el elemento un vuelva a formar parte de la poblacin de manera que un puede volver a ser seleccionado se dice que se ha obtenido la muestra mediante un muestreo aleatorio sin reposicin o reemplazamiento. Este mtodo tambin recibe el nombre de muestreo irrestrictamente aleatorio. Aunque los dos mtodos son diferentes, cuando el tamao de la poblacin es infinito, o tan grande que puede considerarse infinito, ambos mtodos nos llevarn a las mismas conclusiones. Sin embargo, si la fraccin de muestreo n/N es mayor que 0,1 (muestreamos ms del 10% de la poblacin) la diferencia entre las conclusiones que se obtienen pueden ser importantes. Muestreo estratificado: Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se suponen homogneos respecto a la caracterstica a estudiar. A cada uno de estos estratos se le asignara una cuota que determinara el nmero de miembros del mismo que compondrn la muestra. Segn la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos, existen dos tcnicas de muestreo estratificado: Asignacin proporcional: El tamao de cada estrato en la muestra es proporcional a su tamao en la poblacin. Asignacin ptima: La muestra recoger ms individuos de aquellos estratos que tengan ms variabilidad. Para ello es necesario un conocimiento previo de la poblacin. Para una descripcin general del muestreo estratificado y los mtodos de inferencia asociados con este procedimiento, suponemos que la poblacin est dividida en h subpoblaciones o estratos de tamaos conocidos N1, N2,Nh tal que las unidades en cada estrato sean homogneas respecto a la caracterstica en cuestin. La media y la varianza desconocidas para el i-esimo estrato son denotadas por mi y s12, respectivamente. El muestreo estratificado tiene las siguientes ventajas: Podemos tener informacin con ms precisin dentro de las subpoblaciones sobre la caracterstica objeto del estudio. Podemos aumentar la precisin de los estimadores de las caractersticas de toda la poblacin. El muestreo estratificado tiene las siguientes desventajas: La eleccin del tamao de las muestras dentro de cada estrato para que el total sean n. La divisin en estratos en algunas poblaciones puede no ser sencilla.

Muestreo por conglomerados: En el muestreo por conglomerados, la poblacin se divide en unidades o grupos, llamados conglomerados (generalmente son unidades o tareas en los que se ha dividido la poblacin), que deben se lo ms representativas posible de la poblacin, es decir, deben representar la heterogeneidad de la poblacin objeto del estudio y ser entre s homogneos. El motivo para realizar este muestreo es que a veces resultara demasiado costoso realizar una lista completa de todos los individuos de la poblacin objeto del estudio, o que cuando se terminase de realizar la lista no tendra sentido la realizacin del estudio. El principal inconveniente que tiene es que si los conglomerados no son homogneos entre s, la muestra final puede no ser representativa de la poblacin. Suponiendo que los conglomerados sean tan heterogneos como la poblacin, en relacin a las variables estudiadas, y que entre s sean homogneos, para obtener una muestra bastar con seleccionar algunos conglomerados. En este caso se habla de muestreo por conglomerados de una etapa. El muestreo por conglomerados tiene la ventaja de simplificar la recogida de las informaciones mustrales. Muestreo Sistemtico: En este muestreo se parte de una poblacin de N unidades enumeradas en algn orden. Para seleccionar una muestra de n unidades (siendo N = nk) tomamos al azar una unidad entre las primeras k unidades, y de ah en adelante tomamos cada k-sima unidad. k recibe el nombre de intervalo de seleccin. Este tipo de muestreo presenta ventajas aparentes sobre el muestreo aleatorio simple, como son: Es ms fcil y rpido de obtener la muestra. Ninguna sucesin grande de elementos de la lista queda sin representacin, a causa del muestreo sistemtico puede ser ms representativo que el muestreo aleatorio simple. En la prctica es ms sencillo llevarlo a cabo y por lo tanto est menos expuesto a los errores de seleccin que cometen los investigadores de campo. Se puede poner en prctica sin conocer de antemano el tamao de la poblacin.

El proceso para la seleccin de una muestra mediante este mtodo empieza con la determinacin del valor k. Esta decisin es importante, ya que si tomamos un valor muy grande, la muestra ser muy pequea y si tomamos un valor muy pequeo la muestra ser muy grande. En la prctica se debe seguir el siguiente procedimiento para seleccionar el intervalo de seleccin: Si N es conocido, se determina el tamao de la muestra n aproximado para la encuesta y luego se selecciona k como la parte entera de N/n. Si el tamao poblacional N es desconocido no se puede seleccionar exactamente el valor de k.

Otros tipos de muestreo: El muestreo bietpico es un caso particular de muestreo por conglomerados en el que en la segunda etapa no se seleccionan todos los elementos del conglomerado, sino que se seleccionan un nmero de elementos de cada conglomerado de manera aleatoria. Los conglomerados de primera etapa se denominan unidades primarias, los de la segunda etapa, secundarias. El muestreo polietpico es una generalizacin del anterior, de manera que cada conglomerado puede estar formado a su vez por otros conglomerados y as sucesivamente en varias etapas.

En general, para realizar estudios complejos con muestras representativas de la poblacin, se utilizan los conceptos de estratificacin, conglomerados y muestreo aleatorio. Por ejemplo, la poblacin de un pas se podra dividir en conglomerados (ciudades, municipios, barrios) que pueden ser bastante heterogneos entre s. Luego es necesario clasificar estas unidades en estratos homogneos (unidades primarias, por ejemplo los barrios). Cada una de estas unidades primarias se divide en nuevas unidades (bloques de casas) llamadas secundarias, que se dividen en las casas concretas. La muestra se tomara: 1. Seleccionando una muestra estratificada, de cada estrato (barrios), se toma al menos uno. 2. Se eligen al azar varios bloques de casas dentro de cada barrio seleccionado. 3. Se toman aleatoriamente una o varias casas dentro de los bloques seleccionados.

5. Explique el tipo de relacin directa o inversamente proporcional de cada uno de los factores involucrados en el clculo del tamao de la muestra de una poblacin finita, para estimar la media de la poblacin. Si deseamos estimar una media es necesario saber: El nivel de confianza o seguridad. (1-). El nivel de confianza prefijado da lugar a un coeficiente (Z). Para una seguridad del 95% = 1.96; para una seguridad del 99% = 2.58. La precisin con que se desea estimar el parmetro (2 * B es la amplitud del intervalo de confianza). Una idea de la varianza 2 de la distribucin de la variable cuantitativa que se supone existe en la poblacin. Para esto tenemos las siguientes formulas:

Donde:

En las anteriores formulas podemos entender la proporcionalidad de los factores involucrados para el clculo del tamao de la muestra de una poblacin finita, para estimar la media de la poblacin. Primero debemos observar y realizar la estimacin de parmetros, este es el procedimiento utilizado para conocer las caractersticas de un parmetro poblacional, a partir del conocimiento de la muestra. No existe un tamao ideal de la muestra, se considera una muestra grande cuando n > 30. Una muestra debe ser lo suficientemente grande como para ser representativa, tambin se considera una muestra infinita cuando n> 100.000 pero el nmero de elementos necesarios para lograr la representatividad vara de una investigacin a otra. Con una muestra aleatoria, de tamao n, podemos efectuar una estimacin de un valor de un parmetro de la poblacin; pero tambin necesitamos precisar en.

Intervalo de confianza Nivel de confianza Error de estimacin admisible n = nmero de elementos que debe poseer la muestra. = Riesgo o nivel de significacin - confianza. Z = Puntuacin correspondiente al riesgo que se haya elegido. N = Tamao total de la poblacin. = Varianza Poblacional. B= Error de estimacin. Con esto podemos concluir que: Cuanto mayor sea el tamao de la muestra, n, menor es el error. /PROPORCIONALIDAD INVERSA Cuanto mayor sea el nivel de confianza, 1-, mayor es el error. /PROPORCIONALIDAD DIRECTA Si aumentamos el nivel de confianza, aumenta el tamao de la muestra. /PROPORCIONALIDAD DIRECTA Si disminuimos el error, tenemos que aumentar el tamao de la muestra. /PROPORCIONALIDAD INVERSA

6. Una de las dos formas de realizar inferencia estadstica, es por medio de estimacin de parmetros de una poblacin. Explique las ventajas y desventajas de este mtodo para inferir las caractersticas de una poblacin. Tenemos dos formas bsicas para realizar una inferencia estadstica, estas son la estimacin de parmetros y el contraste de hiptesis, prueba de hiptesis. Podramos decir una hiptesis estadstica es una afirmacin con respecto a una distribucin de probabilidad. Para el caso de la estimacin de parmetros consideramos que es un conjunto de tcnicas que permiten dar un valor aproximado de un parmetro de una poblacin a partir de los datos proporcionados por una muestra. La estimacin de un parmetro la realizamos mediante: a. Estimacin puntual. Es cuando obtenemos valores aproximados del parmetro desconocido y una medida de error asociado; por Intervalos cuando obtenemos un rango de valores, que contiene el verdadero valor del parmetro con una probabilidad o confiabilidad prefijada. Debemos tener en cuenta que aleatorio a al azar no significa de cualquier forma, para que el procedimiento de muestreo sea vlido es necesario utilizar correctamente el proceso de generacin de nmeros aleatorios. Algunas ventajas de la estimacin esta la compensacin de valores altos y bajos con lo que a la muestra tiene una composicin similar a la de la poblacin, es adems es un procedimiento sencillo y produce estimadores de los parmetros desconocidos prximos a los valores reales de los mismos. Un inconveniente importante de este tipo de muestreo es que necesita un marco adecuado y muy amplio que no siempre es fcil de conseguir y que no contiene Informacin inicial sobre la poblacin que podra ser til para describirla claramente. Tambin permite ahorrar mucho esfuerzo y dinero, y generalmente proporciona informacin muy precisa sobre las principales propiedades de la poblacin. En la estimacin por intervalos se obtienen intervalos estrechos con alta confiabilidad. Se debe de usar tcnicas que permitan garantizar que se cumplan las propiedades de homogeneidad, independencia y representatividad. La tcnica de muestreo utilizada depende de los objetivos del

estudio, de las caractersticas de la poblacin y de las disponibilidades de materiales. Todos y cada uno de los datos cuestan dinero b. Estimacin mediante intervalos de confianza. Es la estimacin por intervalos en la que calculamos dos valores entre los que se encontrar el parmetro, con un nivel de confianza fijado de antemano. Para cualquiera de estas dos situaciones empleamos el estadstico que, como ya se ha mencionado, es una variable aleatoria. Una estimacin puntual a menudo resulta insuficiente, debido a que slo tiene dos opciones: es correcta o est equivocada. Una estimacin puntual es mucho ms til si viene acompaada por una estimacin del error que podra estar implicado. Un estimador es una variable aleatoria, y por lo tanto es posible asociarle probabilidades, lo que resulta de suma utilidad como herramienta auxiliar para la toma de decisiones bajo condiciones de incertidumbre. Una estimacin, en cambio, es un valor particular del estimador, calculado en base a una muestra dada. Por tanto, constituye un valor fijo (no aleatorio) que caracteriza a esa muestra en particular, pero que se usa para inferir el valor de un parmetro desconocido. Entre un estimador puntual y uno por intervalos, es preferible usar este ltimo porque tiene asociado una probabilidad que contempla el error que se puede cometer en la aproximacin.

Entre las ventajas de este procedimiento esta la compensacin de valores altos y bajos con lo que la muestra tiene una composicin similar a la de la poblacin, es adems un procedimiento sencillo y produce estimadores de los parmetros desconocidos prximos a los valores reales de los mismos. Una poblacin queda caracterizada a travs de ciertos valores denominados parmetros, que describen las principales propiedades del conjunto. Un parmetro es un valor fijo (no aleatorio) que caracteriza a una poblacin en particular. En general, una parmetro es una cantidad desconocida y rara vez se puede determinar exactamente su valor, por la dificultad prctica de observar todas las unidades de una poblacin. Por este motivo, tratamos de estimar el valor de los parmetros desconocidos a travs del empleo de muestras. Las cantidades usadas para describir una muestra se denominan estimadores o estadsticos mustrales. Ahora bien, es razonable pensar que si tomamos diferentes muestras de la misma poblacin y calculamos los diferentes estadsticos de cada una, esos valores van a diferir de muestra a muestra. Por lo tanto, un estadstico no es un valor fijo, sino que presenta las siguientes caractersticas: Puede tener varios resultados posibles. No se puede predecir de antemano su valor. Estas son las condiciones que definen a una variable aleatoria. Un estadstico, entonces, es una variable aleatoria, funcin de las observaciones mustrales. A los estadsticos mustrales se los designa con las letras latinas (x, s2), ^2). ^, O letras griegas "con sombrero" (Si un estadstico es una variable aleatoria, entonces es posible determinar su distribucin de probabilidades y calcular sus principales propiedades).

7. El margen de error de una estimacin es controlado por tres factores: Nivel de confianza, tamao de la muestra y desviacin estndar. Explique los criterios que tiene un investigador para su determinacin en una investigacin estadstica. NIVEL DE CONFIANZA:

El nivel de confianza es la probabilidad a priori de que el intervalo de confianza a calcular contenga al verdadero valor del parmetro. Se indica por 1- y habitualmente se da en porcentaje (1-)%. Hablamos de nivel de confianza y no de probabilidad ya que una vez extrada la muestra, el intervalo de confianza contendr al verdadero valor del parmetro o no, lo que sabemos es que si repitisemos el proceso con muchas muestras podramos afirmar que el (1-)% de los intervalos as construidos contendra al verdadero valor del parmetro. Los valores que se suelen utilizar para el nivel de confianza son el 95%, 99% y 99,9 %. TAMAO DE LA MUESTRA: A la hora de determinar el tamao que debe alcanzar una muestra hay que tomar en cuenta varios factores: el tipo de muestreo, el parmetro a estimar, el error muestral admisible, la varianza poblacional y el nivel de confianza. Por ello antes de presentar algunos casos sencillos de clculo del tamao muestral delimitemos estos factores. Parmetro. Son las medidas o datos que se obtienen sobre la poblacin. Estadstico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimacin de los parmetros. Error Muestral, de estimacin o estndar: Es la diferencia entre un estadstico y su parmetro correspondiente. Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al valor de la poblacin, nos da una nocin clara de hasta dnde y con qu probabilidad una estimacin basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo. Siempre se comete un error, pero la naturaleza de la investigacin nos indicar hasta qu medida podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que varan muestra a muestra). Vara segn se calcule al principio o al final. Un estadstico ser ms preciso en cuanto y tanto su error es ms pequeo. Podramos decir que es la desviacin de la distribucin muestral de un estadstico y su fiabilidad. Nivel de Confianza. Probabilidad de que la estimacin efectuada se ajuste a la realidad. Cualquier informacin que queremos recoger est distribuida segn una ley de probabilidad, as llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un estadstico capte el verdadero valor del parmetro. Varianza Poblacional. Cuando una poblacin es ms homognea la varianza es menor y el nmero de entrevistas necesarias para construir un modelo reducido del universo, o de la poblacin, ser ms pequeo. Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios previos.

DESVIACIN ESTNDAR: Una propiedad importante de un estimador es su varianza (o su raz cuadrada, la desviacin estndar). La importancia de la desviacin estndar es que nos permite darle un sentido numrico a la cercana del valor del estimador a su valor esperado. Entre menor sea la desviacin estndar (o la varianza) de un estimador, ser ms probable que su valor en una muestra especfica se encuentre ms cerca del valor esperado. Cuando un estimador tiene una varianza menor que otro decimos que el estimador es ms eficiente.

8. Cul es el criterio a seguir si queremos determinar un tamao de muestra y no conocemos las varianza poblacional. Explique cmo se resuelve el problema, cuando la funcin de la muestra es estimar la media de la poblacin y para estimar la proporcin de una poblacin.

Para determinar el tamao de muestra necesario para estimar con un error mximo permisible d prefijado y conocida la varianza poblacional 2 podemos utilizar la formula siguiente:
2

Cuando la varianza poblacional es desconocida es aconsejable utilizar el siguiente procedimiento: Primero se toma una pequea muestra, que se llama muestra piloto, con ella se estima la varianza poblacional 2 y con este valor se evala, sustituyendo 2 por su estimacin 2 . El valor de n obtenido ser aproximadamente el valor necesario, nuevamente con ese valor de n se extrae una muestra de este tamao de la poblacin, se le determina la varianza a esa muestra, como una segunda estimacin de 2 y se aplica la formula que vimos arriba, tomando la muestra con el n obtenido como muestra piloto para la siguiente iteracin, se llegara a cumplir con las restricciones prefijadas. Se puede plantear esta afirmacin ya que la 2 de 2 tiende a estabilizarse a medida que aumenta n alrededor de la 2 por lo que llegara el momento en que se encuentre el tamao de la muestra conveniente, sin embargo en la prctica es mucho ms sencillo ya que por mucho a la tercera iteracin se obtiene el tamao de muestra deseado. Calculo del tamao de la muestra para estimar la proporcin de una poblacin: El intervalo de confianza para estimar una proporcin est determinado por la estimacin puntual y por la amplitud o anchura de dicho intervalo, denominada precisin (d). = .

Despejando n, se obtiene la frmula para calcular el nmero de observaciones o individuos necesarios para estimar una proporcin: =
2 . . 2

Por tanto, es evidente que las dos cosas ms importantes que determinan el intervalo de confianza son las que se han de tener en cuenta para calcular el tamao de la muestra: la anchura del intervalo o precisin (d=1/2 de la amplitud del IC) y la confianza o seguridad establecida (1-). Ambas han de ser determinadas a priori por el investigador, al igual que el valor de p que se pretende estimar, a partir de la bibliografa o con los resultados de la prueba piloto. Ejemplo: Cuntas mujeres ser necesario estudiar para estimar la prevalencia de dolor lumbar en una poblacin de embarazadas? Con un nivel de confianza del 95% = 0.05; = 1,96), un error mximo admitido del 8% (la amplitud del IC ser 16) y un valor de prevalencia conocido por la bibliografa del 20%, el tamao de la muestra necesario ser de 96 mujeres: = 1,962 . 0,20 . 0,80 0,614656 = = 96 2 0,08 0,0016

El tamao de la muestra depender de los valores que se introduzcan en la frmula, de modo que , para una mayor precisin (IC ms estrecho), se necesitar un mayor tamao de la muestra, al igual que si se desea trabajar con un nivel de confianza mayor.
Calculo del tamao de la muestra para estimar la media de la poblacin: Siguiendo el mismo razonamiento que para la estimacin de proporciones, a partir de la frmula del IC de la media se obtiene la frmula para calcular el tamao de la muestra necesario para estimar una media: 95% = =

Donde la precisin es:

Por tanto, la frmula resultante para el clculo del tamao ser:


2 . 2 = 2

Ejemplo: Cuntas mujeres ser necesario estudiar para estimar la media de glucemia de las embarazadas que han acudido a las salas de parto de un determinado hospital? Estableciendo un nivel de confianza del 95% y una precisin de 5 (la diferencia entre la media de glucemia de la poblacin y de la muestra, ser 5mg); faltara por conocer la DE. Se supone que se ha obtenido a partir de la prueba piloto y que es de 20. Por lo que el nmero mnimo de mujeres que ha de estudiarse ser de 62.

2 . 2

1,962 . 20 2 52

= 62

Adems, cuando se pretenda determinar el tamao que debe tener una muestra, hay que tener en consideracin el tipo de muestreo. Casi todas las frmulas que se utilizan asumen que el muestreo es aleatorio, es decir, que todos los sujetos tienen la misma probabilidad de entrar a formar parte del estudio.

9. Explique cmo se define la confiabilidad y cul es su interpretacin en la construccin de un intervalo de confianza. Presente un ejemplo. Un intervalo de confianza o estimado de intervalo es una gama de valores que probablemente contiene el valor verdadero del parmetro de poblacin. Un intervalo de confianza se asocia a un grado de confianza, que es una medida de la certeza que tenemos de que nuestro intervalo contenga el parmetro de poblacin. Que obviamente en la prctica se desconoce. Cmo se puede construir un intervalo y luego argumentar que se puede tener un 95% de confianza en que contiene a , si no se sabe cul es la media poblacional? De acuerdo al teorema del lmite central y la distribucin de la media muestral, sta tiene un comportamiento aproximadamente

normal y de aqu se obtiene que la media poblacional est mximo a 1.96 errores estndar del 95% de todas las medias muestrales. Por lo tanto, al obtener una media muestral, si se pasa de 1.96 errores estndar por encima o por debajo de dicha medida, se puede tener un 95% de confianza en que el intervalo resultante contenga la media poblacional desconocida. El grado de confianza es la probabilidad 1 de que el intervalo de confianza contiene el verdadero valor del parmetro de poblacin. Los valores del grado de confianza que suelen usarse son el 90% (con = 0.10), 95% (con = 0.05), 99% (con = 0.01). Suele utilizarse el 95% porque ofrece un buen balance entre la precisin reflejada en la anchura del intervalo de confianza y la confiabilidad expresada por el grado de confianza.

Ejemplo: Un cardilogo desea hallar un intervalo de confianza del 95% para el nivel de colesterol promedio de todos los pacientes que presentan problemas cardacos, asume que la distribucin de los niveles de colesterol es normal con una desviacin estndar = 0.47 y utiliza la siguiente muestra al azar de niveles de colesterol en mmol/L de 20 pacientes con problemas cardiacos. 4,7 5,0 4,2 5,3 Primer paso: Estimar el valor de 1 + 2 + + = 4.78 4,8 4,4 5,2 4,3 4,6 5,1 4,2 6,0 4,9 4,3 5,2 4,7 4,5 5,2 4,2 4,8

Segundo paso: Determinar el Coeficiente de Confianza Z 1 = 0.95 1 = 1,96


2

95%

Tercer paso: Determinar el intervalo de confianza , 4.99 = 4.78 1.96 . 4.78 + 0.21 0.47 20 = 4.78 0.21

0.975 . 4.78 0.21 4.57 ,

Cuarto paso: Interpretar el resultado

Con un nivel de confiabilidad del 95% podemos afirmar que el nivel de colesterol de todos los pacientes con problemas cardacos se encuentra entre 4.57 y 4.99 mmol/litro.

4.57 mmol / litro Intervalo de Confianza Nivel de confiabilidad del 95%

4.99 mmol / litro

10. Consulte los registros sobre las tarifas de un servicio pblico (agua, telfono, Luz, gas, etc.), de por los menos 300 usuarios de estrato 3, de un barrio de en su ciudad de origen, en una empresa de servicios pblicos: Determine la varianza de Muestreo, con una muestra de 15 tarifas seleccionadas al azar, utilcela para calcular el tamao de muestra necesario para estimar la media y el total de la poblacin, con un error de $500 y una confianza de 99%. Obtenga con base en esta muestra (Seleccionada con el muestreo aleatorio simple y sistemtico), los intervalos de confianza para estos dos parmetros. Vuelva a calcular los valores de los dos parmetros (media y el total) con todos los datos de la poblacin de tarifas consultadas. Compare los valores estimados con los valores reales y concluya: qu tan buenas son las estimaciones realizadas por usted?, estn las estimaciones calculadas de acuerdo con los valores reales?

LUZ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 32,600 13,700 13,910 13,230 13,460 13,960 12,330 14,490 15,840 16,510 13,780 14,930 12,620 13,150 13,170 12,850 14,000 14,680 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62

ESTRATO 3 13,620 32,500 13,860 13,680 12,750 11,920 12,430 21,880 11,110 14,280 13,400 12,030 14,630 13,700 10,010 11,240 11,530 14,090

LOCALIDAD ENGATIVA 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 12,140 13,370 13,310 16,360 13,020 12,570 10,760 10,410 10,920 12,240 13,470 11,770 13,250 11,090 14,840 11,770 13,350 12,230 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 12,220 14,430 14,270 14,480 11,910 14,500 16,240 12,540 14,380 12,120 17,060 11,620 13,300 11,930 14,530 13,600 9,910 11,140 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194

BOGOT 13,830 13,170 14,010 10,360 12,910 15,960 12,620 12,170 10,360 10,010 10,520 11,840 13,070 11,370 12,850 10,690 14,440 11,370 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218

CODENSA 10,000 11,220 11,370 12,280 14,210 13,000 14,530 10,260 14,660 12,800 16,440 11,720 13,170 12,390 12,820 13,720 12,020 13,930 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 15,590 11,890 13,730 11,470 16,410 10,970 13,170 12,390 14,990 13,370 10,350 13,350 16,790 15,440 12,370 14,650 17,210 13,750 289 290 291 292 293 294 295 296 297 298 299 300 13,100 11,730 14,330 13,400 9,710 10,940 11,230 13,790 15,140 13,260 21,280 14,030

19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44

13,120 12,720 12,020 10,310 11,240 9,750 10,910 12,530 11,540 12,050 10,970 10,560 21,980 11,830 11,420 11,120 11,070 11,210 14,390 13,630 12,030 12,390 14,380 15,740 13,470 13,960

63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88

15,440 14,410 14,990 13,120 15,180 11,740 12,550 11,920 14,130 13,970 13,580 16,190 13,500 13,470 10,100 11,320 11,470 12,380 14,310 13,210 16,260 12,920 12,470 10,660 10,310 10,820

107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132

12,320 13,220 13,680 16,290 13,600 13,570 10,200 11,420 11,570 12,480 14,410 13,200 14,730 10,460 14,860 13,000 16,640 11,920 13,370 12,590 14,710 15,290 13,420 15,480 12,040 12,850

151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176

11,430 13,990 15,340 13,460 21,480 14,230 13,690 14,780 13,570 9,700 12,810 9,910 32,300 13,660 13,480 12,550 11,720 12,230 21,680 10,910 14,080 32,200 12,130 11,730 11,230 12,820

195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220

12,950 11,830 11,920 12,820 10,210 11,220 12,800 15,740 11,020 9,910 12,820 14,930 13,720 11,990 12,750 10,590 20,930 9,150 12,930 10,360 10,680 9,810 13,480 16,090 13,400 13,370

219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244

11,670 14,980 12,170 13,670 14,680 16,490 11,870 10,160 13,710 13,820 13,910 21,930 11,980 14,260 14,060 14,640 12,770 14,830 11,390 12,200 11,570 13,780 13,620 13,830 11,260 13,850

263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288

15,490 14,930 32,450 12,380 12,280 13,320 13,100 11,730 14,330 13,400 9,710 10,940 11,230 13,790 15,140 13,260 21,280 14,030 17,210 13,750 15,490 14,930 32,450 12,380 12,280 13,320

Muestreo Sistemtico

300 = 20 15
REG_AZAR 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 REGISTRO 4 24 44 64 84 104 124 144 164 184 204 224 244 264 284 $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ TARIFA 13,230 9,750 13,960 14,410 12,920 11,770 11,920 11,620 13,660 12,170 9,910 12,280 16,490 13,850 14,930 192,870 VARIANZA $ $ $ $ $ $ $ $ $ $ $ $ 138,384 9,659,664 1,214,404 2,408,704 3,844 1,183,744 879,844 1,532,644 643,204 473,344 8,690,704 334,084

$ 13,191,424 $ $ 984,064 4,293,184

$ 45,631,240

Se sabe por los conocimientos de estadstica descriptiva que: MEDIA


1

=1

= 20 = 12,858 = 12,858 =

VARIANZA 1 2 = DESVIACION ESTANDAR 1 =


2


=1

= $3,042,083


=1

= $3,042,083

2 =

$3,042,083 = $1,744

ERROR DE ESTIMACION

= 299250000 +1051781829504 =

427000000 3042083

328544964000000 1051856579504

= 312,3

Por consiguiente para estimar el promedio de las tarifas de la poblacin objeto de estudio, con un nivel de confianza del 99% y el error de estimacin de $500, se debe tomar una muestra de 1 personas. Media del total de la poblacin 13.465 La estimacin de la media por muestreo aleatorio simple y sistemtico fue un valor menor que la media total de la poblacin.

CONCLUSIONES

El muestreo aleatorio puede realizarse de distintas maneras, las ms frecuentes son el muestreo simple, el sistemtico, el estratificado y el muestreo por conglomerados. El muestreo estratificado tiene inters cuando la caracterstica en cuestin puede estar relacionada con la variable que queremos estudiar. Si una muestra aleatoria se hace correctamente, contiene no tendencia sistemtica y es por lo tanto relativamente representante de la poblacin. Por supuesto, en un estudio de muestreo, nunca podemos estar seguros al 100% de que los resultados medidos a partir de la muestra sean tambin ciertos en la poblacin. El propsito principal del muestreo es reducir la necesidad de las operaciones empricas que exigen el trabajo y el coste.

BIBLIOGRAFIA RONDON D. Jorge Eliecer; ROSADO. Danis Brito. Mdulo Inferencia Estadstica. UNAD. 2008 Teorema Central del Limite Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales - 2004.

WEBSITE DE CONSULTA

http://minnie.uab.es/~veteri/21216/TiposMuestreo1.pdf http://www.uiah.fi/projekti/metodi/252.htm http://www.monografias.com/trabajos12/puntu/puntu.shtml#cal http://e-stadistica.bio.ucm.es/glosario2/def_nivel_signif.html http://elestadistico.blogspot.com/2008/07/error-estadstico-tipo-i-y-ii.html http://www.eumed.net/libros/2006a/cag2/19.htm http://optimierung.mathematik.unikl.de/mamaeusch/veroeffentlichungen/ver_texte/sampling_es.pdf http://optimierung.mathematik.unikl.de/mamaeusch/veroeffentlichungen/ver_texte/sampling_es.pdf http://www.slideshare.net/AGENCIAS2/tecnicas-de-muestreo http://www.peru-v.com/ingenieria/estadistica_muestreo/muestreo_estratificado.htm http://todoestadistica.blogspot.com/2009/06/muestreo-sistematico.html http://www.monografias.com/trabajos12/muestam/muestam.shtml

Vous aimerez peut-être aussi