Académique Documents
Professionnel Documents
Culture Documents
1. CONCEPTOS PREVIOS
POBLACIN.
Conjunto de elementos que gozan de algunas caractersticas o propiedades comunes,
las que permiten identificarlos y definir su comportamiento.
Usando
la
teora
de
conjuntos,
una
poblacin
se
representa
por
el
conjunto .................
Al hablar de los Nmeros Naturales, de los Nmeros Reales; vemos que cada uno de
ellos tiene su conjunto .................... A este conjunto le podramos llamar Poblacin
de nmeros naturales, enteros o poblacin de nmeros reales.
2.
3.
4.
El nmero de horas de estudio adicionales que tiene cada uno de los alumnos de
la Universidad de Lima.
5.
6.
7.
8.
9.
El nmero de viajes semanales que realiza una persona por la Avenida Tupac
Amaru.
etc.
CENSO
Es el estudio realizado sobre TODOS los elementos de la poblacin. Dependiendo de la
naturaleza del censo, esta se podr realizar sobre la poblacin terica o la poblacin
sujeta a estudio. Si de preferencia electoral se trata, el censo realizado sobre la
poblacin terica arrojar resultados no tan realistas ni significativos, lo que s se
obtendra, si se realiza un censo sobre el consumo de alimentos o necesidades de
vivienda. Toda la poblacin no puede elegir, pero toda ella s consume.
ENCUESTA
Es la consulta que se puede realizar a travs de un censo. Una encuesta est formada por
un conjunto de preguntas cuidadosamente diseadas, seleccionadas y distribuidas; a las
cuales se somete a los elementos de la poblacin. Muchas veces el resultado de un censo
depende fundamentalmente de la encuesta y de la forma cmo est diseada. Una
encuesta es tambin una consulta realizada a una parte representativa de la poblacin.
Entre las modalidades de llevar a cabo una encuesta se tiene las entrevistas por telfono,
personales, por correo, etc. El trabajo que significa encuestar a la poblacin o a una
parte de ella se conoce como trabajo de campo.
MUESTRA
Es una parte de la poblacin sujeta a estudio. Cuando no es posible, o no conviene
realizar un estudio sobre la poblacin, se realiza sobre una parte de ella, sobre una
muestra. La realizacin de un censo no siempre es posible. El censo poblacional se
realiza cada 10 o ms aos, de ser posible.
Podramos realizar un censo mensual sobre el dinero que lleva en sus bolsillos los
alumnos de la Escuela de Negocios de la Universidad de Lima; pero tal vez sea
suficiente realizar el estudio a una parte de los alumnos de dicha escuela; es decir,
sobre una muestra.
La muestra, que es parte de la poblacin, debe ser, ante todo, representativa. Ella
debe reflejar el sentir de la poblacin de la cual se ha extrado, debe recoger sus
caractersticas, debe ser capaz de transmitir y reflejar el comportamiento de la
poblacin.
Es importante la forma cmo se escoge, selecciona o se elige los elementos de la
poblacin que van a conformar la muestra.
El estudio sobre la preferencia del ltimo modelo de Ferrari realizado en Comas no slo
sera sesgado, sino generara resultados no esperados (?).
Si slo se encuesta por sus ingresos medios a los congresistas, personal de confianza y
directivos de todas las dependencias estatales podemos tener resultados errneos,
respecto a los ingresos promedios de todos los trabajadores del sector estatal.
Veamos esto con un ejemplo.
Ejemplo:
C2
Altos puestos
17154.1
16706.1
22436.7
20911.9
12876.4
C3
Congresistas
51593.5
51061.1
51866.5
51252.9
51345.9
C4
Todos
Con la ayuda del comando <Data>, apile (Stack) las columnas C1, C2 y C3 en la
columna C4 (Todos). Luego construya un grfico de puntos (DotPlot). Para ello use la
siguiente secuencia:
Para apilar las columnas:
<Data> - <Stack> - <Columns>. Seleccione las tres columnas y haga clic en <Select>.
Active <Column of current WorkSheet>. Digite C4 y clic en <Ok>
Para el grfico:
<Graph> - <DotPlot>. En <One Y> haga clic en <Simple> - <Ok>. A continuacin, en
Dotplot of Todos
7000
14000
21000
28000
Todos
35000
42000
49000
2. CONCEPTO DE MUESTREO
La seleccin de los elementos de la poblacin para conformar una muestra, genera el
concepto definido como marco o espacio muestral.
Y puesto que el proceso de seleccionar constituye un experimento, ensayo o
fenmeno, entonces es lgico que los resultados de dicho proceso generen el espacio
muestral.
As lo dijimos al inicio.
Queda claro entonces que, cuando hemos dicho Sea X1, X2, ..., Xn, un conjunto de
n variables ... , implica que dichos elementos han sido extrados de una poblacin
para formar la muestra de tamao n.
Abra el archivo ExtraerMuestra.ppt y realice la presentacin.
Este procedimiento de extraer elementos de una poblacin, siguiendo algn mtodo,
regla o algoritmo determinado, se conoce como Muestreo.
Haga clic aqu para ver otro ejemplo y si no es posible, abra el archivo Pob01.xls.
En consecuencia, muestrear una poblacin, significa extraer una parte de ella para
conformar una muestra, cuyo tamao, ser n, mientras que el tamao poblacional
ser definido como N.
Ejemplos:
1.
3.
4.
Ejercicio
1.
2.
ERROR DE MUESTREO
Antes de presentar la definicin de Error de muestreo, veamos el siguiente caso:
) as como la media (
) de la
poblacin.
Para calcular la media de la muestra2: En G36: =Promedio(Muestra2)
Tambin lo puede copiar de la celda de la izquierda.
Para calcular la varianza de la muestra2: En G37: =Var(Muestra2)
Para calcular la media de la poblacional (aunque ya esta calculada): =Promedio(Ingreso)
Hay alguna diferencia? ...................................................................................................
Podra sospechar a qu se debe? ....................................................................................
3. TAMAO DE MUESTRA
Se recomienda que lo lea, ms tarde volveremos al mismo tema.
TIPOS DE MUESTREO
En la introduccin de sobre muestreo hemos precisado claramente que no se puede
elegir los elementos de la muestra de la misma forma para todo trabajo de estudio.
Entre los tipos de muestreo ms conocidos, tenemos
3.1.
3.2.
3.3.
3.4.
aleatorios
en
MS
Excel6989422792764774186914318336920
218580287197139736114973942458763723
182889280858631975702424359997880489
972162181875532835401702051073109483
791772804986003955532218475214076243
551495598386493611980262507272256491
610671794484728887619136346959285225
22786156787338903080248193
5. MUESTREO ESTRATIFICADO
El muestreo estratificado consiste en particionar a la poblacin, en un conjunto de
Estrato A
Poblacin estratificada
Estrato C
partes, cada una de las cuales recibe el nombre de Estrato, de tal manera que los
elementos que la conforman posean ciertas propiedades que las define, las que por
supuesto no las poseen los otros estratos.
Entonces, para seleccionar una muestra basado en este tipo de muestreo se debe
dividir a la poblacin en estratos, de tamao Nh, cada uno. Al interior de cada uno de
los estratos, se elige una sub muestra de tamao n h. Para elegir estos elementos s se
puede usar el muestreo simple al azar.
biblioteca.
b)
Comercio)
c)
presidencial
d)
b)
c)
d)
suave, y las hijas una del mismo tipo, pero fuerte; definitivamente la preferencia de
los varones no puede ser mezclada con el de las mujeres en la familia.
En el caso del ejemplo iv), teniendo en cada oficina diversos profesionales, se
supone que la capacitacin se da de acuerdo a la profesin que tengan; mal
podramos hacer si solo se registra datos por oficina. Aqu tambin interesa la
opinin de los miembros de la oficina y la opinin de la oficina como unidad.
Por estas razones el tipo de muestreo que se acostumbra a elegir en estos casos
constituye un muestreo por conglomerados.
7. MUESTREO SISTEMATICO
El Muestreo Sistemtico consiste en listar a la poblacin de 1 a N. Si desea obtener
una muestra de tamao n, determinar k = N/n; elegir aleatoriamente un nmero r
llamado arranque aleatorio, de tal forma que 1 r k. Este ser el primer
elemento de la poblacin que se seleccione para conformar la muestra.
Es este el nico que caso en el que se selecciona aleatoriamente.
EJERCICIOS
1.
2.
3.
http://www.geocities.com/inforice.
DISTRIBUCIONES MUESTRALES
8. ESTADSTICO DE UNA MUESTRA
DEFINICIN
Sea X1, X2, ..., Xn una muestra aleatoria de tamao n, extrada de una poblacin en
donde se define la variable aleatoria X. Sean x 1, x2, ..., xn los valores que toman
dichas variables en la muestra. Diremos que Y = H(X1, X2, ..., Xn ) es un estadstico
de la muestra, que toma el valor y = H(x1, x2, ..., xn ).
Poblacin
H
muestra
(x1 , x2, ..., xn )
y = X(x1 , x2, ..., xn )
Figura 93
Comentarios:
1. El estadstico de una muestra se conoce tambin como estadgrafo de la muestra.
2. El valor de un estadstico de una muestra es un nmero real, como se explica en
el siguiente esquema.
3. Dada una muestra aleatoria X1, X2, ..., Xn de tamao n, podemos definir ciertos
estadsticos en ella a los cuales se les conoce como Estadsticos de la muestra.
4. Un estadstico muestral se calcula con los datos pertenecientes a la muestra.
5. Un determinado parmetro poblacional, como la media X no se calcula en una
muestra de la poblacin, tampoco se calcula la varianza poblacional, .
6. El valor de un parmetro poblacional puede ser estimado a partir del estadstico
que le haga referencia. Por ejemplo el estadstico para
es la media
aritmtica X .
7. Por la forma cmo se define a un estadstico podemos decir que un
estadstico o estadgrafo es una variable aleatoria. Siendo as, podemos tratar
de encontrar su distribucin de probabilidad. Podemos buscar su esperanza y
su varianza.
8. Conociendo su distribucin de probabilidad, y conociendo su valor esperado y
desviacin estndar del estadstico, podemos identificar el comportamiento de
los miembros de la muestra y a partir de ella, tener una aproximacin, sujeto a
los errores y niveles de confianza supuestos, del comportamiento de la
poblacin, de la cual fue extrada la muestra. Recuerde esta afirmacin para la
siguiente seccin, que nos ser de gran utilidad.
9. Tomando en cuenta el numeral 3 de este comentario y el anterior (8), debemos
suponer que dichos estadsticos muestrales deben tener una distribucin
conocida o por conocer, que ser oportuno conocer. Pero antes de pasar a
estudiar esto en la prxima seccin aclaremos lo que queremos decir en este
numeral: En los diferentes tipos de muestreo hablamos de dos tipos de variable
S: Aquella que representa la suma de todos ellos, es decir, S X i y aquella
que representa el promedio
S X
En conclusin, podemos decir que en el estudio de una muestra contamos con los
siguientes estadsticos muestrales:
La ..............................................
La .............................................
La .............................................
La .............................................
estos
se
llaman
tambin
media
muestral,
varianza
.....................
y ...........................
Se dijo tambin que a la desviacin estndar constituye un desvo o error estndar
respecto a un estadstico. Y como hay varios estadsticos, entonces podemos hablar de
Error estndar de la media
Error estndar de la ....................................
.....................................................................
...................................................................
Ms adelante veremos otros tipos de errores estndares.
LA PREGUNTA DEL AO
Si el comportamiento de una poblacin se conoce a travs de sus parmetros, el
comportamiento de una muestra se debe conocer determinando sus estadsticos.
En el caso de una poblacin binomial, exponencial, normal, etc., podemos saber su
comportamiento conociendo la distribucin de probabilidad de la variable poblacional.
Y cmo conocer el comportamiento de una muestra? Conociendo la distribucin de
probabilidad de la variable o del estadstico. Lo mismo ocurre en poblaciones en las
cuales no se conoce su distribucin de probabilidad.
Cmo entonces podemos plantearnos preguntas probabilsticas o calcular su esperanza o
varianza? Cmo podemos cumplir con lo que se dijo en el curso de Estadstica
Descriptiva en el sentido de estudiar la muestra para estimar comportamientos
poblacionales?
Oiga amigo:
Abra el archivo Musetreo MAS.xls y vaya a la hoja Distr Conocida y responda a las
siguientes preguntas:
Con los datos que se encuentran en dicha hoja, complete la siguiente tabla:
N=
n=
p=
Parmetros poblacionales
m=
Binomial
Hipergeomtrica
Poisson
Exponencial
Normal
Estadsticos de la muestra
Binomial
Hipergeomtrica
Poisson
Exponencial
Normal
Observacin:
Como puede Ud. apreciar, en las columnas ocultas se encuentran las probabilidades de
ocurrencia de cada valor de la variable. De suerte que podramos calcular E(X), E(Y),
etc., as como V(Z), V(U), etc. Del mismo modo podemos preguntarnos as: Cul es la
probabilidad de que el ingreso semanal de un trabajador del Sector Y sea mayor que
200?. La respuesta la daramos encontrando P(Y > 200) = 1 P(Y 200). Y esto por
Minitab mediante el uso de la distribucin Hipergeomtrica, H(N = 3370, m = 840, n =
800).
Completando la pregunta del Ao:
Y cmo vamos a resolver este tipo de cuestiones en el caso de que no se conozca la
distribucin de los ingresos semanales de los trabajadores de estos sectores, que es lo
ms comn que ocurra en la vida real?
El siguiente teorema, importante por eso, nos dar la respuesta y mucho ms.
X
i 1
S
Zn
i 1
n
,
2
i 1i
Gn ( z ) ( z ) donde Gn
tendr una distribucin normal N(0, 1), para el cual nLim
p = 0.1
0.25
0.2
0.15
0.1
0.05
0
0
10
20
30
40
50
60
(n = 50, p = 0.1)
0.2
0.15
0.1
0.05
0
0
10
20
30
40
50
60
En ellos se puede apreciar que, para n > 20, las probabilidades son
insignificantes
3. Ahora abra el archivo CompDistrib01.xls
Observe la grfica de las tres distribuciones que se toma en cuenta.
Ahora vaya a la hoja Comparar.
Aumente el valor de n haciendo clic en el botn para n y observe la grfica.
Disminuya el valor de p usando el botn correspondiente y observe la grfica.
Pase a la hoja Incluyendo la Normal y modifique los valores de n.
Finalmente vaya a la hoja TLC para observar la grfica de una variable con
distribucin desconocida, pero en donde el tamao de muestra es
suficientemente grande (n 30).
4. La importancia de ese teorema radica en que podemos utilizar la distribucin
Normal para resolver todo tipo de problema, con la nica condicin de que n sea
mayor o igual a 30.
5. No se requiere trabajar con todos los elementos de la poblacin; es suficiente
disponer de informacin de un subconjunto de ella, llamada muestra, cuyo
tamao sea por lo menos de 30, para aplicar la distribucin normal.
6. Es mas, gracias a este teorema podemos utilizar los resultados obtenidos en una
muestra de tamao n, e inferir resultados sobre el comportamiento de la
poblacin.
Por esta razn las diversas firmas encuestadoras, con un mnimo gasto, un
tamao adecuado de muestra y con una pareja de supuestos, puede pronosticar el
vencedor de una contienda electoral si maana fueran las elecciones
presidenciales.
7. No se requiere conocer el tipo de distribucin de los elementos que conforman la
muestra, repetimos lo dicho en el numeral 1.
En el siguiente teorema todas las Xi provienen de la misma poblacin y por tanto
tienen el mismo comportamiento, por ello es que las medias y varianzas
poblacionales son iguales para todas ellas. En el teorema anterior, cada Xi tiene su
media y varianza particulares (o pueden tenerla).
TEOREMA
Sea X1, X2, ..., Xn ... un conjunto de variables aleatorias independientes que tienen la
misma distribucin; es decir E[Xi] = y V[Xi] = para i = 1, 2, ..., n, ....
Definamos tambin a S como S = X1+ X2 +...+ Xn Luego, para un n suficientemente
grande, la variable Zn definida por
Zn
S n
n
Gn ( z ) ( z ) donde Gn
tendr una distribucin normal N(0, 1), para el cual nLim
2.
Ejemplo 1
En navidad, el gasto que realizan las familias en la compra de regalos es
significativo e importante para los comerciantes. En un distrito limeo, se ha
X = .........................
X N(............., ..........)
a) Se pide encontrar P(X ................) . Evaluando por Minitab: P(X ........)
= .............
b) Definimos a T como el tiempo total empleado por las 9 personas.
Segn esto, se nos pide que encontremos P(T < 1340)
Para usar Minitab se necesita T y V[T] = Tv
Aquesigual T=........
ValordeV[T] = Tv=......
AhorayapuedeusarMinitabparaencontrarP(T<1340)=.......
c) Ahorasetratade500personas.Encuntaspersonasseesperardemorarmenos
de2minutos(120segundos)
Como se pide un nmero esperado de personas de un total de 500, slo
necesitamosencontrarlaprobabilidaddequeunapersonasedemoremenosde120
segundos.
Luegoelnmerodepersonasser500P(X<120)
EncuentreP(X<120)yluegomultipliquepor500paradarrespuestaalapregunta
Ejemplo 3
Un conjunto de artculos cuyo peso promedio es de 10 gramos y una desviacin
estndar de 2 gramos, son empacados en cajas de 50 unidades. Se sabe que las cajas
vacas pesan en promedio 500 gramos, con una desviacin de 25 gramos.
Suponiendo que el peso del producto y el de las cajas son independientes, calcular la
probabilidad de que una caja llena pese ms de 1050 gramos.
Solucin
Defina a Xi : .................. tal que = i = ..... y = i = .......
Sea W el peso de una caja vaca con = ........ y = ..............
Defina a T como El peso de una caja llena.
Entonces, de acuerdo al problema T = ..............................1
De donde, reemplazando valores tenemos
50
X
i 1
1050 1000
1 (1.74) 1 0.9591 0.0409
P (T 1050) P Z
825
Usando Minitab pero con una Normal con = 0 y = 1 y en <Input constant> 1.74
Ejemplo 4
Al inspeccionar la calidad de un producto se han determinado dos tareas claves, las
cuales se realizan una despus de otra. El tiempo que se emplea para la primera tarea
es una variable normal con = 10 minutos y =1.5minutos.Paralasegundatarea,
seempleauntiemponormalcon = 15 minutos y =2minutos.
a) Culeslaprobabilidaddequeenlainspeccinseempleemsdehora?
b) Enqutiempomximoseconcluirlainspeccinconunaprobabilidadde0.995
Solucin
Sea X: Tiempo (en minutos) que se emplea en una tarea clave..
Primera tarea: X1 N(10, 1.5)
Segunda tarea: X2 N(15, 4)
a) Como las dos tareas se realiza una despus de la otra, la probabilidad de que se
emplee ms de hora en la inspeccin (tomando en cuenta las dos tareas) que
debemos definir otra variable tal como T / T: Tiempo total empleado en las dos
tareas.
Esto significa que debemos encontrar P(T > 30) y para ello necesitamos T y
V[T] = Tv Segn el problema, T = X1 + X2: Por ello
T = E(X1 + X2 ) = E(X1) + E(X2) = X1 + X2 = 10 + 15 y
V[T] = T= V(X1 + X2) = V(X1) + V(X2) = X1 + X2 = 1.5 + 2 = 6.25 de
donde T = 2.5
Luego P(T > 30) lo resolvemos por Minitab
i 1
1500 40 9486.83
K 60000
K 60000
0.95 De esto obtenemos
1.645
P (V K ) P Z
1500 40
1500 40
= i = 50 y = i = 5.
P (T 1000) P Z
) 0.10 .
1 P(Z
5 n
5 n
De donde P( Z
1000 50n
) 0.90
5 n
Lo que debemos resolver usando Minitab: <Calc> - <Probability Distributions> <Normal>. Activamos <Inverse...>, ingresamos 0 en <Mean>; 1 en <Standard Desv.>;
Activamos <Input constant> y luego <Ok>. As obtenemos 1.2816 lo que igualamos a
1000 50 n
y resolvemos la ecuacin.
5 n
De esto obtenemos 1000 50n = 6.41n0.5 . De donde n = 20.589; es decir n 21.
OBSERVACION
Abra al archivo Muestra MAS.xls.
Ha calculado la media aritmtica de cada una de las cinco muestras? .............. Si no lo
tuviera, por favor proceda a calcularlas (en la fila 36).
Escriba el valor de dichas medias aqu: .............................................................................
Ellas de por s, podran formar otra variable? ...........
Por qu? ...................................................................................................
Estas medias reciben el nombre de medias muestrales.
Este conjunto de medias muestrales pueden ser variables aleatorias? ..........................
Podran formar una nueva distribucin? ............
Qu nombre le dara a esta nueva distribucin?
...................................................................
Por lo que sabemos y hemos dicho antes, podemos conocer su esperanza y su varianza.
Si definimos a esta nueva variable como X , entonces podemos hallar su media
E (X ) y su varianza
2
X
V (X )