Académique Documents
Professionnel Documents
Culture Documents
Asignatura:
Estadística II
Unidad I:
Muestreo y distribuciones muestrales
El propósito de este curso es que los participantes desarrollen capacidades de investigación y análisis de problemas en el
ámbito socioeconómico, a través del manejo adecuado de herramientas y técnicas estadísticas asociando el uso de Tecnologías
de la Información y la Comunicación.
a) Que el estudiante conozca características generales de los diversos métodos para seleccionar una muestra.
b) Adquirir conocimientos teóricos y prácticos para el diseño de un Muestreo Aleatorio Simple (M.A.S.)
c) Explicar el concepto de distribuciones muestrales
d) Destacar la importancia del Teorema Central del Límite para apoyar procedimientos de inferencia
1
Índice
2
1.1 Conceptos Básicos
A continuación, se desarrollan algunos conceptos básicos que constituyen el lenguaje técnico del estudio de la estadística.
Muestra: Es una parte de la población escogida aleatoriamente, para estudiar sus características y cuyos resultados, medidas
resumen, se generalizan hacia a la población. Una condición necesaria de la muestra, es que debe ser representativa de la
población, para garantizar que los resultados se validen como conclusiones de haber estudiado a la población completa.
Muestreo: Es la metodología que se usa para seleccionar de los elementos poblacionales, aquellos que conformarán la muestra
representativa. Existen dos tipos de muestreos: Probabilístico y no probabilístico.
En el muestreo probabilístico, cada unidad del espacio muestral tiene alguna posibilidad de pertenecer a la muestra. Entre los
métodos probabilísticos se tienen:
1. Muestreo Aleatorio Simple.
2. Muestreo Sistemático.
3. Muestreo Aleatorio Estratificado.
4. Muestreo Aleatorio por Conglomerados.
Algunos métodos no probabilísticos se denominan así:
1. Muestreo por conveniencia
2. Muestreo por cuotas
3. Muestreo de bola de nieve
Parámetro: Es la medida resumen de una variable cuantitativa o cualitativa, resultado de haber estudiado la población. Por
ejemplo, luego de procesar los resultados de un censo que tenía por objetivo estudiar las condiciones sociales, podrían aparecer
los parámetros: promedio de ingresos por remesa (μ= $250), porción de la población que tiene parientes en EUA (P = 0.10, o
P = 10%). Son medidas estadística provenientes de haber estudiado la población.
El parámetro, en pocas ocasiones se obtiene mediante el censo. El parámetro, ordinariamente se obtiene, mediante el
estadístico, siempre que la muestra sea representativa, el estadístico estima al parámetro en forma eficiente.
3
1.1.7 Inferencia
Inferencia: Es la acción de inferir (deducir). En la terminología estadística inferencia es concluir acerca de la población,
basándose en los resultados de una muestra.
El muestreo aleatorio simple selecciona muestras mediante métodos que permiten que cada posible muestra tenga una igual
probabilidad de ser seleccionada y que cada elemento de la población total tenga una oportunidad igual de ser incluido en la
muestra.i
Es un método de selección de muestra donde cada elemento del marco muestral tienen la misma oportunidad (y por tanto, la
misma probabilidad) de pertenecer a la muestra representativa. Existen varios instrumentos que se pueden utilizar para la
selección de la muestra aleatoria simple:
Equivale a sortear de entre los elementos del marco muestral, mediante una rifa simple o mediante una tómbola, los elementos
que pertenecerán a la muestra.
La tabla de números aleatorios es una lista de números dispuestos en columnas y filas, que se utilizan para seleccionar en
forma aleatoria muestras de una población. (Tabla en Anexo 1)
Ejemplo 1.1:
Se dispone de un marco muestral de viviendas, ordenado desde la número 001, hasta 535 y se debe seleccionar una muestra
de tamaño 15.
Desarrollo:
1. Se busca un inicio aleatorio en tabla (Anexo 1), puede ser fila 3, columna 5 (puede ser cualquier otro). Ahí está el
bloque de dígitos 1533.
2. Luego decide una dirección de búsqueda (izquierda, derecha, arriba o abajo) con tres dígitos. En este ejemplo la
búsqueda es hacia abajo, aparecerán los siguientes números del marco muestral: 153, 848, 445, … (deben ser los
menores o iguales a N=535).
3. Luego de la búsqueda, los números sorteados de viviendas para pertenecer a la muestra son:
n1 =153 n2 = 445 n3 =645 n4 =503 n5=419 n6=220
n7=054 n8 =218 n9 =128 n10 =289 n11=266 n12 =389
n13 =215 n14 =325 n15 =275.
Ejemplo 1.2:
Se dispone de un marco muestral de personas, ordenado desde la número 001, hasta 57,500 y se debe seleccionar una muestra
de tamaño 150. Anote la selección de las primeras 20 personas seleccionadas.
Desarrollo:
4
1. Se busca un inicio aleatorio en tabla (Anexo 1), puede ser fila 4, columna 2 (puede ser cualquier otro). Ahí está el
bloque de dígitos 3828. En esta ocasión necesitará prestar un dígito más del siguiente bloque, ya que N = 57,500, se
compone de 5 cifras.
2. Luego decide una dirección de búsqueda (izquierda, derecha, arriba o abajo) con tres dígitos. En este ejemplo la
búsqueda es hacia abajo, aparecerán los siguientes números del marco muestral: 38287, 33827, 52894, … (deben
ser los menores o iguales a N=57,500).
3. Luego de la búsqueda, los números sorteados de personas que pertenecerán a la muestra son:
n1 = 38287 n2 = 33827 n3 = 52894 n4 = 21607 n5 =16290
n6 = 33657 n7 = 22766 n8 = 14352 n9 =28549 n10 = 20865
n11 =55,652 n12 =39738 n13 = 39003 n14 = 1004 n15 = 9720
n16 = 47304 n17 = 20939 n18 = 746 n19 = 47514 n20 = 50464
Otra de las formas que se puede adoptar para seleccionar muestras por el método aleatorio es mediante el programa Excel,
usando la fórmula siguiente:
5
En el caso que aparezca repetidos, se omite y se sustituye por el siguiente número aleatorio.
El muestreo sistemático es un método probabilístico que produce resultados eficientes y es apropiado su uso cuando los
elementos del marco muestral están ordenados. El procedimiento de selección se presenta a continuación.
Ejemplo 1.3:
Se dispone de un marco muestral de viviendas, ordenado desde la número 001, hasta 535 y se debe seleccionar una muestra
sistemática de tamaño 15.
Desarrollo:
I. Se ordenan los elementos desde el número 1, hasta el elemento 535
II. Se determina el tamaño de muestra. En este caso n = 15
535
III. Se obtiene el valor de k, 𝑘 = = 35.66
15
IV. Se elige el primer elemento de la muestra en forma aleatoria, entre los primeros 35 elementos ordenados.
Si buscamos al azar en fila 6, columna 7, los dígitos son: 7577 (punto de partida de la búsqueda)
Buscando hacia abajo con los primeros dos dígitos, encontramos los dígitos 08, siendo que la muestra # 1, es la n1 = 08.
V. A partir de ese primer elemento de la muestra, los demás se obtienen mediante un salto a cada 35 posiciones.
Ejemplo 1.4:
Se dispone de un marco muestral de personas, ordenado desde la número 001, hasta 57,500 y se debe seleccionar una muestra
sistemática de tamaño 150. Anote la selección de las primeras 10 personas seleccionadas y las últimas 3.
Desarrollo:
I. Se ordenan los elementos desde el número 1, hasta el elemento 57,500
II. Se determina el tamaño de muestra. En este caso n = 150
57500
III. Se obtiene el valor de k, 𝑘 = = 383
150
IV. Se elige el primer elemento de la muestra en forma aleatoria, entre los primeros 383 elementos ordenados.
Si buscamos al azar, a partir de la fila 12, columna 3, los dígitos son: 6307 (punto de partida de la búsqueda)
V. Buscando hacia abajo con los primeros tres dígitos (menores o iguales a 383), encontramos los dígitos 219, siendo
que la muestra # 1, es la n1 = 219.
A partir de ese primer elemento de la muestra, los demás se obtienen mediante un salto a cada 383 posiciones.
6
n1 = 219 n2 = 602 n3 = 985 n4 = 1368 n5 =1751 n6 =2134
n7 = 2517 n8 = 2900 n9 =3283 n10 = 3666 .... n149 = 56903 n150 = 57286
Por ejemplo, si se desea estimar el porcentaje de preferencias de la marca de refresco “Horchata”, en una colonia del municipio
de Soyapango se tendrá que utilizar en el mejor de los casos un mapa como marco muestral y ahí, establecer una división
geográfica que permita ubicar pasajes o bloques de viviendas para extraer de uno o más de los conglomerados la muestra
representativa.
Este método cuenta con la ventaja de minimizar el costo de transporte, al focalizar un solo sector para seleccionar la muestra.
Definición del teorema del límite central según, Anderson Sweenwy Williams: “Cuando se seleccionan muestras aleatorias
simples de tamaño n de una población, la distribución de muestreo de la media muestral 𝑥̅ puede aproximarse mediante una
distribución normal a medida que el tamaño de la muestra se hace grande”.iii
Ejemplo gráfico.
Si n = 10 Si n= 20 Si n ≥ 30
7
Se concluye que la forma de la distribución muestral, se adapta a una forma normal o de campana, a medida el tamaño de
muestra aumenta.
El Teorema anterior, es la base teórica de la inferencia estadística, mediante la cual se puede confiar en usar un estadístico de
muestra y generalizar los resultados hacia la población.
donde m, es la cantidad de muestras diferentes que son posibles a partir de una población.
N, tamaño de la población
n, tamaño de muestra
La distribución de muestreo se refiere a la forma o comportamiento probabilístico que adoptan las variables aleatorias
(medidas resumen de la muestra) que se sintetizan en “promedios o medias”, en el caso de variables cuantitativas y
“proporciones”, en el caso de variables cualitativas
Si el tamaño de muestra es
grande, la distribución de las 𝑥̅
será normal.
𝜎
Si n ≥ 30 VA𝑥̅ ~ N( μ , 𝜎𝑥̅ = )
√𝑛
(Si tamaño de muestra es de 30 o más, la variable aleatoria 𝑥̅ se distribuye normalmente con μ y 𝜎𝑥̅ )
8
𝑥̅ − 𝜇 𝑥̅ − 𝜇
̅aZ: 𝑧=𝜎
Cambio de variable de 𝒙 = ̅ : 𝑥̅ = 𝑧. 𝜎𝑥̅ + 𝜇
Cambio de variable de Z a 𝒙
⁄ 𝑛 𝜎𝑥̅
√
Notación:
Ejemplo 1.5
E 8 9
F 6 25
G 5 36
H 12 1
I 16 25
J 19 64
Suma 66 160
9
Muestra Todas las muestras posibles con n=3 medias Desviación
# Empresas de las muestras Datos de la muestra muestrales estándar
1 E F G 8 6 5 6.3333 1.2472 21.7778
2 E F H 8 6 12 8.6667 2.4944 5.4444
3 E F I 8 6 16 10.0000 4.3205 1.0000
4 E F J 8 6 19 11.0000 5.7155 0.0000
5 E G H 8 5 12 8.3333 2.8674 7.1111
6 E G I 8 5 16 9.6667 4.6428 1.7778
7 E G J 8 5 19 10.6667 6.0185 0.1111
8 E H I 8 12 16 12.0000 3.2660 1.0000
9 E H J 8 12 19 13.0000 4.5461 4.0000
10 E I J 8 16 19 14.3333 4.6428 11.1111
11 F G H 6 5 12 7.6667 3.0912 11.1111
12 F G I 6 5 16 9.0000 4.9666 4.0000
13 F G J 6 5 19 10.0000 6.3770 1.0000
14 F H I 6 12 16 11.3333 4.1096 0.1111
15 F H J 6 12 19 12.3333 5.3125 1.7778
16 F I J 6 16 19 13.6667 5.5578 7.1111
17 G H I 5 12 16 11.0000 4.5461 0.0000
18 G H J 5 12 19 12.0000 5.7155 1.0000
19 G I J 5 16 19 13.3333 6.0185 5.4444
20 H I J 12 16 19 15.6667 2.8674 21.7778
Suma 220.0000 106.6667
(𝑁−𝑛)
Antes de aplicarla es necesario determinar si aplica o no el Factor de Corrección para Población Finita (fcpf), √ , en el
(𝑁−1)
caso de que la porción de muestreo, respecto de la población sea mayor al 5%.
𝑛 3
𝐹𝑟𝑎𝑐𝑐𝑐𝑖ó𝑛 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑒𝑜 = ∗ 100 = ∗ 100 = 50%, 𝑐𝑙𝑎𝑟𝑎𝑚𝑒𝑛𝑡𝑒, 𝑒𝑠 𝑚𝑎𝑦𝑜𝑟 𝑎𝑙 5%. 𝑆𝑖 𝑎ñ𝑎𝑑𝑒 𝑒𝑙 𝑓𝑐𝑝𝑓.
𝑁 6
𝛴𝑥̅ 220
Media de medias muestrales: 𝜇𝑥̅ = = = 11
𝑚 20
Se verifica que 𝜇𝑥̅ = 𝜇. demostrando la propiedad de insesgadez de los estimadores (cada media de muestra, 𝑥̅ es un
estimador de 𝜇 ).
10
1. Elabore una tabla resumen que muestre la distribución de medias muestrales. Es decir, las medias muestrales posibles y
sus probabilidades (frecuencias relativas).
Probabilidad
Medias Frecuencia
(frecuencia relativa)
muestrales s absolutas
6.3333 1 0.0500
7.6667 1 0.0500
8.3333 1 0.0500
8.6667 1 0.0500
9.0000 1 0.0500
9.6667 1 0.0500
10.0000 2 0.1000
10.6667 1 0.0500
11.0000 2 0.1000
11.3333 1 0.0500
12.0000 2 0.1000
12.3333 1 0.0500
13.0000 1 0.0500
13.3333 1 0.0500
13.6667 1 0.0500
14.3333 1 0.0500
15.6667 1 0.0500
Suma 20 1.0000
En la gráfica se observa la forma simétrica o de campana que podría adoptar las medias muestrales a medida el tamaño de
muestra aumente.
11
la distribución de las “p”
será normal.
𝑃𝑄
Si n ≥ 30 VA𝑝 ~ N( μ = P , 𝜎𝑝 = √ )
𝑛
(Si tamaño de muestra es de 30 o más, la variable aleatoria 𝑝 se distribuye normalmente con μ=P y 𝜎𝑝 )
𝑝−𝑃 𝑝−𝑃
Cambio de variable de 𝑝 a Z : 𝑧 = =
𝜎𝑝
√𝑃.𝑄⁄𝑛
Cambio de variable de Z a 𝑝 : 𝑝 = 𝑧. 𝜎𝑝 + 𝑃
Notación:
El tiempo empleado para formar a un trabajador en la realización de una tarea específica es de 5 horas y la desviación estándar
es 150 minutos. Se toma una muestra aleatoria de 35 trabajadores.
𝜎 2.5
VA𝑥̅ : Tiempo promedio de formación laboral ~ N( μ = 5 hs, 𝜎𝑥̅ = = = 0.4226)
√𝑛 √35
12
Procedimiento Usando el programa GeoGebra
Datos:
𝑥̅ = 6 hs.
μ = 5 hs,
σ = 2.5 hs (150 minutos)
n = 35
𝜎 2.5
𝜎𝑥̅ = = = 0.4226
√𝑛 √35
Planteando
P (𝑥̅ > 6)
Estandarizando de 𝑥̅ a Z:
6−5
P( 𝑍 > 2.5 )
⁄
√35
P( 𝑍 > 2.37 ) Nota:
1. En el programa GeoGebra μ = 5 y σ =𝜎𝑥̅ = 0.4226
El resultado en tabla de probabilidad 2. Podría existir una diferencia poco significativa entre resultado de
normal: GeoGebra y tabla de probabilidad normal ocasionado por las aproximaciones.
P( 𝑍 > 2.37 ) = 0.0089
Interpretación: 0.0089, es la probabilidad de que el tiempo promedio de
formación laboral en la muestra de 35, sea superior a las seis horas.
Datos:
𝑥̅ = 5.5 hs.
μ = 5 hs.
σ = 2.5 hs. (150 minutos)
n = 35
𝜎 2.5
𝜎𝑥̅ = = = 0.4226
√𝑛 √35
Planteando
P (𝑥̅ < 5.5)
Estandarizando de 𝑥̅ a Z:
5.5−5
P( 𝑍 < 2.5 )
⁄ Nota:
√35
P( 𝑍 < 1.18 ) 1. En el programa GeoGebra μ = 5 y σ =𝜎𝑥̅ = 0.4226
2. Podría existir una diferencia poco significativa entre resultado de
El resultado en tabla de probabilidad GeoGebra y tabla de probabilidad normal ocasionado por las
normal: aproximaciones.
P( 𝑍 < 1.18 ) = 0.8810
Se sabe, por estudios anteriores, que las preferencias de la marca de detergente “FullExtraction” es del 10%. Obtenga la
probabilidad de que en una muestra aleatoria simple de 500, las preferencias de la marca sean mayores al 12%.
13
𝑃𝑄 (0.10)(0.90)
VAP: Porcentaje de preferencias ~ N( P = 0.10, 𝜎𝑝 = √ = √ = 0.0134)
𝑛 500
Datos:
p = 0.12 (proporción de la muestra)
P = 0.10 (proporción de la
población)
(0.10)(0.90)
𝜎𝑝 = √ = 0.0134
500
Planteando
P (p > 0.12)
Estandarizando de p a Z:
0.12−0.10
P( 𝑍 > (0.10)(0.90) )
√
500
P( 𝑍 > 1.49 ) = 0.0681
Se sabe que el 90% de los pedidos de comida rápida llegan dentro de los 30 minutos a partir del momento del pedido.
Cuánto es la probabilidad de que en una muestra de 80 pedidos, el porcentaje de pedidos que llegan dentro de los treinta
minutos esté entre el 92% a 96%?
VAP: Porcentaje de pedidos que se entregan en los treinta minutos, luego de haberlo efectuado.
𝑃𝑄 (0.90)(0.10)
VAP ~ N( P= 0.90, 𝜎𝑝 = √ = √ = 0.0335)
𝑛 80
14
Datos:
0.92 < p <0.96
(proporción de la muestra)
P = 0.90 (proporción de la población)
(0.90)(0.10)
𝜎𝑝 = √ = 0.0335
80
Planteando
P (0.92 < p <0.96)
Estandarizando de p a Z:
0.92−0.90 0.96−0.90
P( < 𝑍 < )
0.0335 0.0335
15
Anexos
Anexo 1: Tabla de números aleatorios.
16
Anexo 2: Tabla de probabilidad normal
Universidad de El Salvador - Facultad de Ciencias Económicas
Departamento de Matemática y Estadística
Tabla de probabilidad normal estándar
Las tablas representan la probabilidad de que
Estas tablas fueron fórmuladas por primera la V.A.Z., tome valores en tre cero y u n valor esp ecí f ico
vez en 1799 por Chétien Kramp, matemático de Z, Z0: Por ejemplo en Z=2.12, representa el
y físico francés. También inventó el número factorial, n!. área A (0.00 < Z < 2.12) = 0.4830.
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993
3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995
3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997
3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998
3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998
3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.7 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.9 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000
Z, representa el número de desviaciones estándar en que un valor particular de Elaboración: Lic. Noé Cortez
la variable aleatoria "X" se distacia del promedio.
17
Lista de referencias
Levin Richard I. (2004). Capítulo 6: Muestreo y distribuciones de muestreo. En Estadística para administración y
economí(237). México: Pearson Educación de México, S.A. de C.V..
Levin Richard I. (2004). Capítulo 6: Muestreo y distribuciones de muestreo. En Estadística para administración y
economí(241). México: Pearson Educación de México, S.A. de C.V..
Anderson Sweeney Williams. (2012). Capítulo 7: Muestreo y distribuciones de muestreo. En Estadística para negocios y
economía(281). México: Cengage Learning Editores, S.A. de C.V.
18
UNIVERSIDAD DE EL SALVADOR
FACULTAD DE CIENCIAS ECONÓMICAS
DEPARTAMENTO DE MATEMÁTICA Y ESTADÍSTICA
ESTADÍSTICA II CICLO II - 2018
19
11) Al efectuar una auditoría en las cuentas de una empresa, es normal que el auditor seleccione una muestra
de cuentas para verificar saldos. Explique el procedimiento a realizar para seleccionar una muestra
sistemática en 5850 facturas emitidas entre los meses de enero a marzo.
12) Una Institución de Salud tiene 6100 empleados y se quiere determinar cómo es el clima laboral en la
organización, usando una muestra de tamaño 250, obtenga el número de empleados a consultar por
categoría, si se tiene en cuenta, que las diferentes categorías de empleados que pueden influir en la
opinión de los trabajadores, tienen la siguiente distribución: Contabilidad y Costos 80 empleados,
Administración 150, operativos 5600, seguridad 180 y otros cargos 90. ¿Qué método de muestreo es
el apropiado para este caso?
13) La empresa CIEM requiere llevar a cabo un estudio de mercado para determinar la aceptación de los
usuarios sobre el servicio de recolección de escombros, para ello, se obtuvo la siguiente información:
Usuarios residenciales 125.000
Usuarios industriales 45.000
Otros usuarios 1.500
Encuentre el tamaño de muestra para cada categoría de usuario, si previamente se ha determinado un
tamaño global de 380 observaciones. ¿Qué método de muestreo es apropiado?
14) Una biblioteca pública está organizada en cinco secciones con los números de libros que se indican en
esta tabla:
Sección 1 Sección 2 Sección 3 Sección 4 Sección 5
500 860 1200 700 740
Se quiere seleccionar una muestra de120 libros mediante muestreo estratificado aleatorio, considerando
como estratos las secciones. Determina el número de libros que habría que seleccionar en cada sección
si:
a) Consideramos afijación igual.
b) Consideramos afijación proporcional.
15) El supervisor de una cadena de ferreterías desea estimar la proporción de circuitos integrados
defectuosos enviados a sus almacenes por determinado fabricante. Los circuitos vienen en paquetes de
25 cajas, cada una de las cajas contiene 10 circuitos. ¿Cuál es el procedimiento de selección de una
muestra de 30 circuitos utilizando muestreo por conglomerados?
16) Un investigador quiere estimar el consumo promedio de agua por familia en una ciudad. Analice los
méritos relativos a seleccionar familias individuales, unidades habitacionales (casas para una sola familia,
edificios de apartamento, etc.) y manzanas de la cuidad como unidades de muestreo. ¿Cuál tipo de
muestreo es el más apropiado?, ¿Cuál sería el marco de muestreo a utilizar?
17) Indique si las poblaciones siguientes se consideran finitas o infinitas.
a. Los votantes registrados en el municipio de San Salvador
b. Los televisores que pueden ser producidos en una determinada fábrica.
d. Las llamadas de emergencia que pueden ser recibidas en una estación de policía.
e. Todas las piezas producidas por Fibercon, Inc., en el segundo turno el 15 de agosto, pasado.
18) En 2021 se llevará a cabo la elección de diputados(as) de la Asamblea Legislativa de El Salvador. Un
grupo de estudiantes está interesado en conocer las preferencias de la población por los candidatos
inscritos. Para ello tienen que definir un muestreo. ¿Qué les sugiere a sus compañeros en cuanto a:
a. la población de interés
b. marco muestral
20
c. unidades de muestreo
d. unidades de análisis
e. tipo de muestreo a emplear
19) ¿Cuál es la diferencia entre una distribución de probabilidad y una distribución muestral?
20) La información siguiente representa los días de ausentismo por año en una población de seis empleados
de una compañía pequeña: 1, 3, 6, 7, 7, 12. Suponiendo que se muestrea sin reposición:
a) Seleccione todas las muestras posibles de tamaño 2 y establezca la distribución muestral de la media.
b) Calcule la media de todas las medias muestrales y calcule también la media de la población. ¿Son
iguales? ¿Cómo se llama a esta propiedad?
c) Haga las partes a) y b) para todas las muestras posibles de tamaño 3
d) Compare la forma de la distribución muestral de la media obtenida en las partes a) y c). ¿Cuál
distribución muestral parece tener la menor variabilidad? ¿Por qué?
21) Las edades de seis aspirantes a ejecutivos de una compañía (considerada la población) son:
NOMBRE EDAD NOMBRE EDAD
Andrés 54 Dinora 52
Balmore 50 Ernesto 48
Carolina 50 Frida 52
a) ¿Cuántas muestras de tamaño dos son posibles?
b) Seleccione todas las muestras posibles de tamaño dos de la población de ejecutivos y calcule las
medias.
c) Organice las medias en una distribución muestral
d) ¿Cuál es la media de la población y cuál es la media de las medias muestrales?
21
e) ¿Qué forma tiene distribución de la población? (grafique en eje de “x” las edades y en eje de “y”, las
frecuencias)
f) ¿Qué forma tiene la distribución muestral? (grafique en eje de “x” las edades promedio y en eje de
“y”, las frecuencias)
22) Las bolsas de papel para empacar abarrotes están fabricadas de tal forma que su resistencia a la rotura
tenga distribución normal con una media de 5 libras por pulgada cuadrada y una desviación estándar de
una libra por pulgada cuadrada.
a) ¿Qué proporción de las bolsas producidas tiene una resistencia a la rotura entre 5 y 5.5 libra por
pulgada cuadrada?
b) ¿Qué proporción resiste entre 4 y 4.1 libras?
c) Si se seleccionan al azar muchas muestras de 16 bolsas:
c.1) ¿A qué se podría esperar que equivaldrían la media y el error estándar de la media?
c.2) ¿Qué distribución seguirían las medias muestrales?
c.3) ¿Qué proporción de medias muestrales estarían entre 5.0 y 5.5 libras por pulgada cuadrada?
c.4) ¿Qué proporción de medias muestrales estarían entre 4.0 y 4.1 libras?.
d) Compare las respuestas de a) con c.3) y de b) con c.4). Comente
23) Las llamadas telefónicas de larga distancia tienen distribución normal con media de 8 minutos y
desviación estándar de 2 minutos. Si se seleccionaran muestras aleatorias de 25 llamadas:
a) Calcule la desviación estándar de las medias muestrales (𝜎𝑥̅ )
b) ¿Qué proporción de las medias muestrales estarían entre 7.8 y 8.2 minutos?
c) ¿Qué proporción estaría entre 7.5 y 8 minutos?
d) Si se seleccionaran al azar muestras de 100 llamadas, ¿Qué proporción de las medias muestrales
estarían entre 7.8 y 8.2 minutos?
e) Explique la diferencia entre los resultados de b) y d).
24) La renta media de los habitantes de un país se distribuye uniformemente. Entre $400 y $1000, está el
ingreso del 95% de los habitantes. Calcular la probabilidad de que al seleccionar al azar a 100 personas
la suma de sus rentas supere los $72,500 R/ 0.0475
25) El tiempo que un cajero de banco dedica a cada cliente tiene una media poblacional de 3.10 minutos y
una desviación estándar de 0.40 minutos. Si se selecciona una muestra al azar de 16 clientes:
a) ¿Qué probabilidad existe, que el tiempo promedio dedicado a cada cliente sea por lo menos de 3
minutos?
b) ¿Cuánto es la media muestral límite, de manera que el 85% de las mismas, son menores o iguales a
ese límite?
c) ¿Qué suposición se debe hacer para resolver a) y b)?
d) Si se tomara al azar una muestra de 64 clientes, Cuánto es la media muestral límite, de manera que
el 85% de las mismas, son menores o iguales a ese límite?
26) Una gran cadena de centros de artículos domésticos tiene en existencia una marca de taladros eléctricos
portátiles que se distribuye en todo el país. A fin de obtener el máximo descuento por volumen, los
pedidos de reposición de los taladros para todas las tiendas se harán juntos. La decisión de reordenar
existencias es hacerlo cuando el inventario promedio en una muestra de tiendas sea inferior a 25
taladros. En base a información anterior se supone que la desviación estándar es de 10 taladros. Si se
selecciona una muestra aleatoria de 25 tiendas ¿Cuál es la probabilidad de que el taladro sea ordenado
cuando el inventario promedio real de todas las tiendas:
22
a) Sea de 20 taladros?
b) Sea de 30 taladros?
c) ¿Qué suposiciones se tienen que hacer en a) y b)?
d) ¿Cuál es la respuesta de a) y b) si el tamaño de la muestra se aumenta a 36?
27) Ciertos tubos fabricados por una compañía tienen una duración media de 800 horas y una desviación
típica de 60 horas. Hallar la probabilidad de que una muestra aleatoria de 16 tubos tomada de entre
ellos tenga una duración media:
a) Entre 790 y 810 horas
b) Menor que 785 horas
c) Mayor que 820 horas
d) Entre 770 y 830 horas
e) ¿Será necesario suponer que la distribución en la población es normal?
28) La desviación típica del tiempo empleado para formar a un trabajador en la realización de una tarea
específica es de 40 minutos. Se toma una muestra aleatoria de 64 trabajadores.
a) Cuál es la probabilidad de que la media muestral supere a la media de la población en más de 5
minutos?
b) Cuál es la probabilidad de que la media muestral sea inferior en más de 8 minutos a la media de la
población?
29) Se tomó una muestra aleatoria de 81 compras en unos grandes almacenes locales para estimar la media
de todas las compras. Se sabe que la desviación típica es de 25 dólares.
a) Cuál es la probabilidad de que la media muestral supere a la media de la población en no más de $4?
b) Cuál es la probabilidad de que la media muestral subestime la media de la población en más de $1.?
30) Con base en información anterior se sabe que el 30% de las compras con tarjetas de crédito en un gran
almacén es por importes que exceden de US$100. Si se seleccionan muestras aleatorias de 100 compras
con tarjetas de crédito:
a) ¿Qué proporción de las muestras es probable que tengan entre el 20% y 30% con importes que
exceden de US$100?
b) ¿Dentro de qué límites simétricos del porcentaje de la población se encontrará el 95% de los
porcentajes de la muestra?
f. Un encuestador político efectúa un análisis de los resultados de la muestra para hacer predicciones
para la elección. Supóngase que se trata de una elección con dos candidatos. Si un candidato
específico recibe cuando menos 55% del voto en la muestra, se pronosticará que ese candidato será
el ganador de la elección. Si selecciona una muestra aleatoria de 100 votantes, ¿Cuál es la
probabilidad de que se pronostique como ganador a ese candidato cuando:
a) El porcentaje real de sus votos es 50.1%?
b) El porcentaje real de sus votos es 60%?
31) Una encuesta de agentes de compras de 250 compañías industriales, señaló que el 25% de los
compradores reportaron niveles aceptables de nuevos pedidos en enero de este año, respecto a meses
anteriores. Supóngase que los 250 agentes de la muestra representan una muestra aleatoria de los agentes
de compras de compañías de todo un país.
a) ¿Cuál es la probabilidad de que la proporción muestral, p, difiera en más de 0.01 de la proporción
poblacional, P?
23
b) ¿Cuál es la probabilidad de que la proporción de agentes que reportaron niveles aceptables de nuevos
pedidos en enero de este año, en comparación con meses anteriores, sea de menos del 10%?.
32) Una fábrica de pasteles elabora, en su producción habitual, un 3% de pasteles defectuosos. Un cliente
recibe un pedido de 500 pasteles de la fábrica. Calcula la probabilidad de que encuentre más del 5% de
pasteles defectuosos.
33) Una empresa dedicada a la fabricación de lámparas asegura que éstas tienen una duración que se
distribuye aproximadamente normal con media de 800 horas y desviación estándar de 40 horas. ¿Cuál
es la probabilidad de que una muestra aleatoria de 16 lámparas tenga un promedio de vida menor a 780
horas?
34) Un medicamento para malestar estomacal tiene la advertencia de que el 3% de usuarios pueden
presentar una reacción adversa a él. Si una muestra aleatoria de 150 personas con malestar estomacal
usa el medicamento, encuentre la probabilidad de que la proporción de la muestra de los usuarios que
realmente presentan una reacción adversa, exceda el 4%.
g. Se ha encontrado que el 2% de las piezas producidas por cierta máquina son defectuosas. ¿Cuál es la
probabilidad de que en un lote de 400 piezas sean defectuosas:
a) El 3% o más?
b) El 2% o menos?
35) Suponga que se va a realizar una prueba de mercado en la cual los estudiantes probarán dos marcas
diferentes de refrescos. Su tarea es identificar correctamente la marca probada. Si se seleccionan
muestras aleatorias de 200 estudiantes y se supone que éstos no tienen capacidad para distinguir entre
las dos marcas:
a) ¿Qué proporción de las muestras obtendrán entre el 50% y el 60% de identificaciones correctas?
b) ¿Dentro de qué límites simétricos del porcentaje de la población se encontrará el 90% de porcentajes
de las muestras?
c) ¿Cuál es la probabilidad de obtener un porcentaje de muestra de identificaciones correctas que
exceda el 65%?
d) ¿Qué es más probable que ocurra: más de un 60% de identificaciones correctas en una muestra de
200, ó más del 55% de identificaciones correctas en una muestra de 1,000?. Explique.
i
Levin Richard I. (2004). Capítulo 6: Muestreo y distribuciones de muestreo. En Estadística para administración y
economí(237). México: Pearson Educación de México, S.A. de C.V..
ii
Levin Richard I. (2004). Capítulo 6: Muestreo y distribuciones de muestreo. En Estadística para administración y
economí(241). México: Pearson Educación de México, S.A. de C.V..
iii
Anderson Sweeney Williams. (2012). Capítulo 7: Muestreo y distribuciones de muestreo. En Estadística para negocios y
economía(281). México: Cengage Learning Editores, S.A. de C.V.
24