Vous êtes sur la page 1sur 9

Socioestadstica III - Carrera de Sociologa - Vespertino - 2013 Profesor: Patricio Alcano Martnez

Gua de trabajo personal N4


Introduccin a la Inferencia en las proporciones

Intervalo de confianza para la proporcin, con muestra grande

Inferencia en las proporciones I: Intervalos de confianza para la proporcin


Los dioses nos dan muchas sorpresas: lo esperado no se cumple y para lo inesperado un dios abre la puerta. Eurpides

1. Distribucin muestral de las proporciones 1.1. El experimento Se tiene una poblacin binomial en la cual hay una probabilidad p de que ocurra un suceso y una probabilidad q = 1 p de que no ocurra. Se extraen de esta poblacin, muestras aleatorias de tamaos n1 , n 2 , n 3 , etc. En cada una de las muestras se calcula la proporcin muestral: P1 , P2 , P3 , etc. Entonces, se da que la proporcin muestral Pi es una variable. La variable Pi es aleatoria y, por lo tanto, tiene un valor esperado y una varianza. 1.2. El teorema central del lmite: El teorema central del lmite establece que: La distribucin de proporciones muestrales se distribuye normalmente; La media o valor esperado de esta distribucin es p ; y: La varianza de esta distribucin es
p q . n

La desviacin estndar de esta distribucin es el error estndar de la proporcin y est dado por:
p q (1) n 2. Clculo del intervalo de confianza para la proporcin p =

Socioestadstica III-2013. Gua N4

Para calcular un intervalo de confianza (1 - ) para la media se aplica lo siguiente:


p = P e

Siendo: p = proporcin poblacional. P = proporcin muestral. e = error (de investigacin) El error e, es igual a: e = Z1 / 2 p

% Confianza

p
Fig 1: Intervalo de confianza para la proporcin

Por lo tanto, el intervalo de confianza (1 - ) de la proporcin poblacional es igual a:


p = P Z1 / 2 p

(2)

En donde: P= muestra.
Z1 / 2 = Percentil de la distribucin Z, dado por el nivel de confianza elegido.
p = Es el error estndar muestral de la proporcin.

x , es la proporcin muestral, siendo x los casos favorables y n el tamao de la n

Para calcular un IC para la proporcin poblacional se requiere, por lo tanto:


1 : El nivel de confianza que se da el investigador.

P : La proporcin muestral, que se calcula con los datos de la muestra. Z 1 / 2 : Es el percentil de la distribucin Z, que depende de la confianza elegida.
p : Es el error estndar o muestral, que se calcula con los valores de la muestra.

Valores de Z para intervalos de confianza usuales: Confianza 99% 95% 90% Percentil
Z0,995 Z0,975 Z0,95

Valor de Z 2,58 1,96 1,645

Ejemplo:

Socioestadstica III-2013. Gua N4

Se investiga una muestra aleatoria de 247 microempresas, encontrando que 57 de ellas han incorporado las TICs a su gestin. Con estos datos: 1. Calcule el error muestral de la proporcin. 2. Calcule un intervalo de confianza del 90% para la proporcin poblacional de microempresas que han incorporado las TICs a su gestin. Solucin: 1. Error muestral: n = 247 ; x = 57 . Entonces: P =
57 = 0,231 ; siendo q = 1 0,231 = 0,769 247
p q n

El error estndar es igual a: p =


p =

0,231 0,769 = 0,0268 247

R: El error muestral es 0,0268, que equivale a un 2,68%. 2. Intervalo de confianza: 1 = 90% P = 0,231 Z 0,95 = 1,645
p = 0,0268

Por lo tanto:
p = 0,231 1,645 0,0268 p = 0,231 0,044 , con un 90% de confianza.

Sumando y restando el error, queda: 0,187 p 0,275, con un 90% de probabilidades. R: De acuerdo a los datos entre el 18,7% y el 27,5% de las microempresas han incorporado las TICs a su gestin, con un 90% de probabilidades.

5% 18,7

90 % Confianza
23,1 27,5

5%

Fig 2: Intervalo de confianza para la proporcin

3. Consideraciones generales

Socioestadstica III-2013. Gua N4

La muestra es independiente, y proviene de una poblacin binomial. El modelo funciona muy bien para tamaos de muestra con n > 100. Para muestras de tamao entre 30 y 100 el modelo funciona, pero con un error mayor. Poca precisin. El modelo no es aplicable para muestra chica (n < 30). El modelo funciona muy bien para p cercano a 0,5. El modelo no es aplicable para p menor que 0,1 o mayor que 0,9.

PROBLEMAS RESUELTOS 1. Discriminacin de gnero En una muestra de 865 mujeres trabajadoras, 179 declararon haber sido vctimas de discriminacin de gnero en su lugar de trabajo en el curso de los ltimos 6 meses. 1.1. Calcular un intervalo de confianza del 95% para la proporcin poblacional de mujeres que habra sufrido tal discriminacin. 1.2. Calcular la probabilidad de que la proporcin poblacional de mujeres discriminadas en su lugar de trabajo sea mayor al 23%. Solucin: 1.1. Intervalo de confianza Clculo de p muestral: 179 = 0,207 p= 865 Clculo del error muestral:
p = 0,207 0,793 = 0,0138 865

Clculo del intervalo de confianza del 95%: El valor de z para un IC del 95% es 1,96. Ver en tabla Z el valor de z 0,975 . Entonces el intervalo para p es igual a:
p = 0,207 1,96 0,0138 p = 0,207 0,027 , con un 95% de confianza.

Sumando y restando el error y transformando a %, este intervalo se expresa como:


18,0% p 23,4% , con un 95% de confianza.

O bien:

p = [18,0; 23,4]% , con un 95% de confianza.

Esto significa que en la poblacin hay un 95% de probabilidades de que la proporcin de mujeres que sufren discriminacin de gnero est entre el 18% y el 23,4%. Esto es que, en 95 de cada 100 muestras

Socioestadstica III-2013. Gua N4

de esta poblacin, la proporcin de mujeres que sufren discriminacin de gnero se ubicar entre el 18,0% y el 23,4%. Comentario: por lo general se usa una sola muestra para determinar la proporcin por intervalo. Debe dejarse de manifiesto que existe una cierta probabilidad de que la proporcin sea otra. En el ejemplo, tenemos un 95% de probabilidades de que la proporcin de mujeres que sufren discriminacin de gnero est en el intervalo sealado, pero tambin tenemos un 5% de probabilidades de que no sea as.

1.2. Probabilidad de que la proporcin poblacional de mujeres discriminadas en su lugar de trabajo sea mayor al 23%. Por el clculo anterior, se tiene: y, adems: p = 0,0138 p = 0,207; El 23% se expresa como probabilidad p i = 0,23 Estandarizando:
Z= 0,23 0,207 = 1,67 0,0138

Segn la tabla Z, la probabilidad P(Z >1,67) = 0,0475 R: La probabilidad de que la proporcin poblacional de mujeres discriminadas en su lugar de trabajo supere el 23% es igual a 0,0475. 2. Victimizacin en Mendoza Un estudio de realizado en Argentina declar la siguiente ficha tcnica de investigacin:
TIPO DE INVESTIGACIN: Encuesta por Muestreo. UNIVERSO: Poblacin general residente en la Ciudad de Mendoza y Gran Mendoza, mayor de 15 aos. DISEO DE LA MUESTRA: Probabilstica, con seleccin de la unidad final de acuerdo a cuotas de sexo y edad. CUESTIONARIO: Semi-estructurado y pre-codificado. Realizacin adems de preguntas abiertas para cuestiones de inters cualitativo y de anlisis de contenido. Aplicacin domiciliaria. TAMAO DISTRIBUCIN DE LA MUESTRA: 799 casos. Distrito Cantidad de casos Error de investigacin Mendoza Capital 141 +/-8,4% Godoy Cruz 223 +/-6,7% Guaymalln 255 +/-6,3% Las Heras 180 +/-7,5% Total 799 +/-3,5%

Respecto de los errores de investigacin: 2.1. Si esta ficha tcnica no declar el nivel de confianza, con los datos dados, es posible estimarla?

Socioestadstica III-2013. Gua N4

Solucin: S, es posible estimar el nivel de confianza, aplicando la definicin de error e . Por definicin:
e = Z p

En esta igualdad se conoce el error del total de la investigacin: e = 0,035 Se puede determinar, adems, p , ya que p =
p q n

Como no se conoce p , se toma el mximo p = 0,5. Entonces:


p = 0,5 0,5 = 0,0177 799

Entonces, como: Reemplazando: Despejando Z:


Z=

e = Z p 0,035 = Z 0,0177
0,035 = 1,98 0,0177

Este Z es cercano a 1,96, que es el Z usado para un 95% de confianza. R: Considerando las aproximaciones de la ficha tcnica, el nivel de confianza utilizado por el estudio en cuestin es del 95%. En ciertos estudios se emplea para el 95% de confianza el valor Z = 2, que es un modo de simplificar los clculos, que asegura un 95% de confianza. Tal es este caso, en que lo ms probable es que el error 3,5% haya sido calculado con Z = 2.
0,5 0,5 = 0,035 799

En efecto, si se calcula el valor del error: e = 2

3. Proporciones 3.1. Qu es una poblacin binomial? 3.2. Cul es la diferencia entre incidencia y prevalencia? 3.3. Cul es la diferencia entre un estadstico y un parmetro? Solucin: 3.1: Una poblacin binomial es una poblacin en la cual se define un suceso que tiene solo dos resultados posibles, mutuamente excluyentes. 3.2: Se conoce como prevalencia a la proporcin de sujetos de una poblacin, que en un momento dado, presenta cierta caracterstica en estudio. Por ejemplo el % de trabajadores que en este momento trabajan por cuenta propia.

Socioestadstica III-2013. Gua N4

La incidencia, por su parte, es la proporcin de sujetos que, en el curso de un perodo de tiempo, presenta cierta caracterstica en estudio. Por ejemplo, el % de trabajadores que durante el ao 2009 optaron por trabajar por cuenta propia. La diferencia es, por lo tanto, el tiempo. La prevalencia se da en el presente, mientras que la incidencia son los nuevos casos que se producen en un perodo. 3.3: Un estadstico es un valor muestral de una caracterstica en estudio, mientras que el parmetro es el valor poblacional. La diferencia es, entonces, que el estadstico es muestral y el parmetro es poblacional.

PROBLEMAS PROPUESTOS Caso 1: Impacto de la crisis econmica en la empresa Se realiza un estudio con 285 empresarios para determinar el nivel de impacto de la recesin econmica en su empresa. Los resultados se muestran en la tabla siguiente: Cul ha sido el nivel de impacto de la crisis econmica en su empresa? Nivel de impacto N casos Muy afectada 83 Medianamente afectada 110 Poco afectada 53 Nada afectada 39 TOTAL 285 1.1. La variable en estudio est medida en una escala de tipo: A) Continua B) Discreta C) Ordinal D) Multinomial

E) Dicotmica

1.2. La probabilidad de que en la muestra un empresario se sienta Poco afectado o Nada afectado por la crisis econmica es: A) 0,137 B) 0,186 C) 0,291 D) 0,323 E) 0,677 1.3. El error estndar de la proporcin poblacional de empresarios que se sienten Muy afectado por la recesin econmica es igual a: A) 0,0245 B) 0,0269 C) 0,0288 D) 0,0527 E) 0,0532 1.4. Un intervalo de confianza del 90% para la proporcin de empresas que se siente Medianamente o Muy afectada por la recesin econmica es: A) 58,5%68,2% B) 59,1%70,3% C) 60,7%70,7% D) 61,3%71,3% E) 63,1%-72,3%

2. Caso ELECCIONES

Socioestadstica III-2013. Gua N4

A causa de cierto proceso eleccionario presidencial que se acerca, se realiza una encuesta para conocer la intencin de voto en una muestra de 750 votantes, respecto de los dos nicos candidatos, construyndose la siguiente tabla de resultados. VOTARA: Por candidato A Por candidato B Nulo o en blanco TOTAL Sobre la base de estos datos: 2.1. Haga una estimacin por intervalo del % poblacional de votacin Nulo o en blanco, con una confianza del 95%. A) Entre el 8,1 y el 12,4% B) Entre el 8,6 y el 13,0% C) Entre el 9,4 y el 13,8% D) Entre el 9,6 y el 14,3% E) Entre el 11,2 y el 14,7% Sexo Hombres Mujeres 148 194 168 14 330 159 67 420 TOTAL 342 327 81 750

2.2. Construya un intervalo de confianza del 90% para la proporcin poblacional de mujeres que votara por el candidato A. A) Entre 42,2 y el 50,2% B) Entre 43,1 y el 51,3% C) Entre 44,3 y el 50,4% D) Entre 45,2 y el 52,5% E) Entre 46,2 y el 56,2%

2.3. En la poblacin de votantes del candidato B, calcule un intervalo de confianza del 95% para la proporcin de hombres. A) Entre el 44,0 y el 54,0% B) Entre el 45,3 y el 56,3% C) Entre el 46,0 y el 56,8% D) Entre el 47,1 y el 55,7% E) Entre el 48,0 y el 56,0%

3. Satisfaccin con el lugar de trabajo La empresa Alka-SA, que se dedica a hacer investigacin en el mbito de la economa en el trabajo, est interesada en determinar qu % de trabajadoras y trabajadores chilenos se encuentra satisfecho o muy satisfecho en su lugar de trabajo. Con una muestra de tamao 400, estim, con un 95% de confianza, que la proporcin poblacional en esta situacin fluctuaba entre el 59,3 y 68,7%. Con estos datos, determine:

Socioestadstica III-2013. Gua N4

3.1. La proporcin muestral de trabajadoras y trabajadores chilenos que se encuentra satisfecho o muy satisfecho con su lugar de trabajo es igual a: A) 5% B) 9,4% C) 59,3% D) 64,0% E) 68,7% 3.2. El error muestral en esta investigacin, en %, alcanza al: A) 9,4% B) 6,2% C) 4,8% D) 4,7% 3.3. El error de investigacin lleg al: A) 4,7% B) 5,0% C) 2,4% SOLUCIONES 1.1. C 1.2. D 2.1. B 2.2. A 3.1. D 3.2. E

E) 2,4%

D) 9,4%

E) 6,4%

1.3. B 2.3. C 3.3. A

1.4. E

1. Teora y problemas de estimacin http://www.bioestadistica.freeservers.com/temas.html Tema 11. Teora de la inferencia estadstica: Introduccin. Estimas por puntos y por intervalos. Intervalos de medias, de proporciones, del desvo estndar y de la varianza. Propiedades de un estimador. Intervalos para dos muestras. Intervalos para el cociente de dos proporciones. Ejemplos. 2. Teora y problemas de estimacin http://ftp.medprev.uma.es/libro/html.htm 8. Estimacin confidencial 3. Intervalos de confianza para la proporcin http://ftp.medprev.uma.es/libro/html.htm 8.6 Intervalos de confianza para variables dicotmicas

Vous aimerez peut-être aussi