Vous êtes sur la page 1sur 8

Luis Enrique Villanueva Solis

27 de enero 2020

Tarea 2
Teorema del Límite Central
De los siguientes 500 números obtén los intervalos de confianza, aplicando el Teorema del
Límite Central (TLC) para dos tipos de muestreo: 30 muestras de n=5 y 20 muestras de n=30.
Tabla de 500 datos aleatorios del 1 al 100
31.1 75.5 20.9 93.3 97.5 94.7 81.6 52.3 38.6 48.6
65 2.6 53 80.6 10.9 69.2 3.4 42.2 10.8 62.4
23.8 44.6 36.2 20.3 65.6 57.9 59.7 57.9 83.3 68.8
71.8 67 6.2 97.9 37.9 28.5 74.1 99.5 4.8 7.5
88.9 79.4 42.8 55.8 80.1 31.8 70.2 15.8 98.5 53.7
47.7 93.2 38.9 3.1 54.4 1.7 5.4 44.9 51.2 80.7
21.1 6.5 56.5 77.1 94.8 90.3 93.5 25 76.5 50.2
98.3 30 22.4 27.8 60.6 59.8 3.5 40.6 2.6 23.8
62.9 78.6 73.6 4.1 64 27.4 9 6.5 10 2.5
80 99.7 76.4 44.6 41.6 50.8 54.2 18.9 47.1 4.6
96.8 6.1 27.4 37 59.9 44.1 60.7 11 62.5 40.8
98.2 47.4 17.6 20.5 45 35.2 73.3 73.8 53.1 45.3
67.7 18.5 39.8 48.7 97.8 58.6 59.4 92.9 16 19.2
57.5 17.7 52.7 40.6 83.7 37.2 4.2 8.2 39.4 28.6
85.9 70.1 43.8 43 59.9 7.2 23.1 9.2 11.3 93.8
17 97.1 6.8 36.1 60 28 83.8 68.2 51.4 19.3
74.9 55.4 26.5 17.3 43.2 27.8 63 2.7 82 10.8
80.7 1.2 36.6 31.3 85.3 42.3 56.3 47.9 96.4 6.7
42.3 21.1 9.1 26.8 14.5 59.4 86.7 35.2 94.9 55.9
60 3.9 15.4 39.6 26.2 27.9 47.3 86.2 53.3 5.7
46.6 34.1 45.3 28.5 85.1 60.1 19.5 43.2 66.1 81.9
13.1 36.7 14.2 30.2 23.8 14.5 85.4 22.4 53.4 78.7
77.2 31.8 51.3 59.7 5.6 76.1 9.3 60.5 96.6 26.2
31.2 88.7 59.1 73.8 70.7 44.7 45.1 82.4 56.4 66.8
64 39.9 45.5 50.1 97.3 71.8 42.5 78.8 37.8 90.6
77 49.2 61.6 39.4 33.1 75.2 21.3 78.1 50.7 15.8
42.6 44.8 58.6 49 45.2 39.6 76.1 11.8 27.3 33.1
58.7 12.8 26.2 36.5 26.7 11.1 88.1 54.2 13.5 33.8
30.3 12.8 99.5 37.4 15.5 8.7 41.3 73.6 75.2 59.9
56.5 23.6 66.8 32.6 35.4 37.1 13.3 10 45.7 98.5
47.1 61 89.8 14.9 41.7 39.2 33.4 84.3 55.1 94.8
16.6 24.4 84.7 8.9 9 27.3 23.4 58.6 68.9 62.5
37.3 41.9 27 40.2 27.3 35.4 1.2 18.5 82 82.1
99.6 73.7 97.4 54.8 4.6 64.4 78.4 28.4 12.3 50.6
26 40.9 30.5 35.6 22 48.3 70.4 60.3 9.3 36.6
81.7 61.7 8.9 80.3 51.3 95.2 79.9 81.2 81.9 99.6
95.3 84.6 33.7 44.8 41.2 66.7 85.8 29.9 9 54
8.5 21.9 76.5 28.5 69.2 57.8 95.2 54.1 2 4.6
80.4 30 52.4 20.6 93.8 5.1 67.7 53 100 80.4
36.3 16.1 2.1 14 39.3 56.5 28.7 21.3 5.3 83.4
62.9 51.9 86.6 47.2 85.1 43.2 81.7 87.6 87 37.3
33.3 2.1 87.3 70.9 7.4 17.3 8.2 18.1 48.6 39.5
91.6 49.4 78.7 23.4 62.3 81.6 68.7 80.9 76.1 34.7
55.4 39.7 39.6 69 57.2 74.7 11.2 4.2 12.6 96.1
24.6 32.5 2 56.8 80.6 61.3 71.5 79.2 39.5 37.5
97.7 28 69 82 98.6 33.4 24.9 78 29.6 29.9
92.2 9 77 4.3 52.5 63.9 51.9 59.7 24.2 57
17 1.4 90.5 11.7 24.1 52.8 3.8 83.9 21.9 81.3
44.8 11.9 71 71.7 78.2 80.9 95.4 16.3 65.4 80.2
67.2 68.4 9.8 82 48.5 16.1 24.2 38.7 20.4 36.7

Tabla 1

1
Luis Enrique Villanueva Solis
27 de enero 2020

Población original

Media 48.14
Error típico 1.26
Mediana 46.85
Moda 9
Desviación estándar 28.11
Se realiza la estadística descriptiva de dichos datos Varianza de la muestra 790.16
Curtosis -1.11
para poder analizar la desviación estándar y la Coeficiente de asimetría 0.10
media poblacional (Tabla 2). Dichos parámetros Rango 98.8
son importantes para el análisis con el teorema del Mínimo 1.2
límite central. Máximo 100
Suma 24069.8
Cuenta 500
Nivel de confianza(95.0%) 2.47
Clase Frecuencia FR% P Tabla 2
10 56 11.2
20 44 8.8
30 57 11.4
40 56 11.2 Se tomaron los máximos y mínimos para
50 52 10.4 poder realizar la distribución de
60 61 12.2 frecuencias de los 500 números, esos
70 40 8 datos se muestran en la Tabla 3 y el
80 44 8.8 Gráfico 1.
90 49 9.8
100 41 8.2
y mayor... 0
Tabla 3

Gráfica 1

2
Luis Enrique Villanueva Solis
27 de enero 2020
Una vez que se vio que los datos de la población no tienen una distribución normal, se
tomaron dos tipos de muestras y se aplicó el TLC:
1. 30 muestras con una n=5, tomados de manera aleatoria, tal como se muestra en la
tabla 4.
Muestras 30x5
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
97.4 98.5 62.5 51.9 57.9 41.9 35.2 1.2 76.1 39.7 85.1 46.6 47.1 52.8 95.4 9 47.1 97.7 70.4 17.6 97.9 80.6 44.1 40.2 80.7 41.7 75.5 77 59.1 43.2
50.1 99.6 47.1 64 2.6 68.4 22 77.2 66.7 50.2 20.4 53 53.3 36.6 73.3 34.7 57.2 47.3 46.6 59.9 30.2 37.2 77.2 35.2 20.9 55.9 27.3 59.9 59.8 53
83.7 52.5 60 42.6 90.6 70.2 95.2 80 10 82.4 6.2 20.4 47.7 76.1 97.4 13.3 57.5 4.2 93.8 21.3 95.3 42.6 80.6 90.3 18.5 38.9 60.3 23.4 47.1 14.5
84.7 46.6 22.4 5.7 99.6 63.9 78.1 40.9 4.2 69 88.9 19.5 93.3 80.9 37.8 44.6 76.5 40.2 52.7 33.7 44.1 18.1 40.8 38.9 45.7 45.2 77.1 9.2 7.2 83.9
3.1 12.8 67.7 88.7 85.3 61 47.9 53.3 10.8 54.8 50.6 24.1 35.4 52.4 4.1 53 96.8 71.7 53.7 68.7 32.6 81.7 23.1 21.3 59.9 74.1 3.4 76.1 40.9 27.8
Promedio 63.8 62.0 51.9 50.6 67.2 61.1 55.7 50.5 33.6 59.2 50.2 32.7 55.4 59.8 61.6 30.9 67.0 52.2 63.4 40.2 60.0 52.0 53.2 45.2 45.1 51.2 48.7 49.1 42.8 44.5
Tabla 4

Con los Promedios de la muestras se realizó el análisis estadístico (Tabla 6), la distribución
de frecuencias (Tabla 5) y su correspondiente histograma (Grafica 2).

Muestras 30 x 5
Clase Frecuencia FR% M 30x5
Media 52.03
10 0 0
Error típico 1.78
20 0 0
Mediana 51.99
30 0 0
Moda #N/D
Desviación estándar 9.76
40 3 10
Varianza de la muestra 95.18 50 7 23
Curtosis -0.23 60 12 40
Coeficiente de asimetría -0.50 70 8 27
Rango 36.28 80 0 0
Mínimo 30.92 90 0 0
Máximo 67.2 100 0 0
Suma 1560.94 y mayor... 0
Cuenta 30
Tabla 5
Nivel de confianza(95.0%) 3.64
Tabla 6

Gráfica 2

3
Luis Enrique Villanueva Solis
27 de enero 2020
Se observa que la distribución de frecuencias de los promedios muestrales comparada con la
distribución de frecuencias de la población original cambia y se acerca más a un
comportamiento Gaussiano, con esto se cumple el primer punto del teorema del Límite
Central, el cual dice: La distribución de los promedios muestrales es aproximadamente
normal, independiente de la distribución que tengan los valores de la población original de
la que se tomaron las muestras. Para comprobarlo se comparan, gráficamente, las Frecuencias
Relativas Porcentuales (FR%) de la población original y de los promedios muestrales
(Grafica 3).

Gráfica 3

El segundo criterio a cumplir es que “La media de los promedios muestrales es


aproximadamente igual a la Media poblacional”, tal como se muestra a continuación:

𝑥̅𝑥̅ ≈ 𝜇
52.03 ≈ 48.14

El tercer criterio a cumplir es que “La desviación estándar de las medias muestrales es menor
a la desviación estándar de la población”, lo cual se cumple de acuerdo con lo siguiente:

𝑆𝑥̅ < 𝜎
9.76 < 28.11

4
Luis Enrique Villanueva Solis
27 de enero 2020
Se desea obtener el Intervalo de confianza al 95% (IC 95%), para lo cual se necesita calcular
el Error estándar (e.e.). Dicho error puede obtenerse de dos formas: la primera es con la
desviación estándar de los promedios muestrales y la segunda con el cociente de la desviación
estándar entre la raíz de n de una muestra aleatoria.
30
a. ⅇ. ⅇ. = 𝑆𝑥̅ por lo tanto ⅇ. ⅇ. = 9.76 43.2
53
𝑆 14.5
b. ⅇ. ⅇ. = tomando a la muestra número 30 (Ilustración 1), calculando la
√𝑛 83.9
desviación estándar, el error estándar da como resultado: 27.8
44.5
26.5 Ilustración 1
ⅇ. ⅇ. = = 11.8
√5
Con esto podemos comprobar que ambos errores estándar son similares. Con estos valores
pasamos a determinar el IC 95% como se muestra a continuación:

𝐼𝐶 95% = 𝑥̅ ± 1.96(ⅇ. ⅇ)
𝐼𝐶 95% = 52.03 ± 1.96(9.76) = 52.03 ± 19.21 = [32.82 − 71.24]

Esto nos indica que la media poblacional (µ) se encuentra dentro de ese intervalo. Se
plantea modificar el tipo de muestreo, incrementando el número de datos aleatorios
de 5 a 30, ya que el intervalo es muy amplio.

5
Luis Enrique Villanueva Solis
27 de enero 2020
2. 20 muestras con una n=30, tomados de manera aleatoria, tal como se muestra en la
tabla 7.
Muestra 20x30
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
81.6 60 47.1 31.2 5.6 44.6 54.8 14 33.4 67.7 2.5 87 26 60 11.8 4.3 42.5 28.6 71.7 68.8
48.5 97.8 80.7 27 66.8 39.5 12.3 48.6 14.9 99.6 58.6 11 3.8 30 73.7 90.3 28.5 12.8 51.2 45
66.8 45.7 90.6 83.3 56.3 27.3 62.3 71.8 39.5 83.3 12.8 86.6 14.2 83.9 27.3 21.1 81.3 88.7 36.6 30
56.5 47.7 8.2 2.7 97.5 80.6 22 71 21.9 51.9 80.2 62.5 65.6 82.1 46.6 97.9 78.1 36.2 48.6 71.8
13.3 68.7 98.3 6.1 98.6 27.8 33.3 8.9 1.4 18.5 2 1.7 61 40.6 53 30.3 47.1 58.6 34.1 71.5
82.4 16.1 44.8 71.5 86.7 51.9 12.6 51.4 40.8 9.1 98.2 63.9 71 57.5 78.2 54 71.7 50.1 60 54.1
57 2 40.6 81.7 60 69.2 6.2 40.6 7.2 7.5 10.8 30.2 28.5 76.4 73.8 26.2 59.8 61 52.7 2
44.6 75.2 85.8 46.6 15.8 65 64 12.3 41.3 81.7 39.6 60 6.8 4.6 37.3 63 24.2 81.6 88.7 41.2
50.6 80.2 58.6 27.8 42.5 78.6 31.8 87.6 29.9 60.6 43.2 83.4 47.4 30.5 11.7 83.8 76.1 25 50.1 35.2
5.3 79.4 28 37.3 27.8 70.2 70.2 98.2 80.3 45.2 67 8.9 21.9 66.8 26.5 27.3 93.5 26.5 36.7 18.1
12.8 78.7 96.1 53.7 48.6 60.1 98.2 27.4 6.5 66.8 20.6 35.2 87 56.5 23.4 37.3 26.8 53 42.5 33.1
1.7 82 93.8 8.9 13.3 20.5 12.8 81.7 92.2 67 86.6 17.7 27.3 36.1 27.4 9.8 26.2 65.4 19.2 80.6
70.9 18.9 68.4 14.2 23.8 82 28 82.1 39.9 8.9 92.2 14.5 45 50.1 39.2 44.6 40.8 79.9 83.9 61
2.7 70.9 45.5 94.9 60 47.2 35.2 81.2 76.5 90.6 16.1 52.3 16.6 80.2 17.6 12.6 73.3 13.5 24.4 53
39.6 35.2 70.2 99.6 62.5 59.7 31.2 73.6 37.4 47.7 90.5 30.5 76.1 16.6 75.2 99.6 41.9 18.9 18.1 32.5
84.3 57.2 13.3 34.1 71 11.2 47.3 27.8 82 60.7 76.4 77.1 20.3 32.5 42.2 68.2 81.9 84.7 83.3 24.9
58.6 11.3 33.1 40.2 45.7 98.5 76.5 27 42.2 35.4 66.8 80.4 62.5 70.9 36.7 92.2 54.1 70.7 44.7 83.8
4.8 36.7 26.2 94.7 85.1 11.2 97.3 61.3 59.9 53 30 44.8 27.3 83.9 44.8 1.2 27 14.5 39.9 37.8
27.3 62.4 40.6 47.2 41.2 10 67 37.4 40.2 4.8 88.1 57.8 62.5 40.8 81.6 45.5 33.1 2.5 81.3 55.1
28.5 8.7 74.1 61.3 78.4 35.4 40.9 85.1 96.1 64 26.2 4.1 37.8 40.6 3.1 9 45.7 35.2 73.8 41.7
55.4 27.8 15.8 80.4 69 49.4 39.6 51.2 5.7 33.4 59.4 39.4 8.9 2.7 47.7 27.3 62.3 60.7 80.9 30.3
52.7 69.2 33.4 77.1 17 20.6 49.2 4.6 78.2 38.7 35.2 36.5 24.4 33.1 26.2 3.9 28.4 76.1 39.9 79.4
6.5 65 43.8 1.2 37.3 20.3 60.7 36.2 73.8 80.7 9.1 38.7 17.3 58.7 80.6 64 80.3 30 10.9 3.1
73.6 50.8 39.5 18.9 59.7 8.9 5.7 33.4 30.3 37.1 42.5 80.7 52.5 13.5 68.9 23.4 29.9 99.5 17.7 44.6
57.9 73.3 47.4 39.6 75.2 26.8 58.7 27.8 22.4 4.6 55.8 99.6 39.5 78.2 66.8 45.3 40.8 15.8 18.5 54.2
33.3 70.9 41.6 68.8 33.4 75.2 93.5 5.7 38.7 64 95.2 73.6 33.4 66.1 27.4 44.8 41.3 36.6 20.9 2
24.4 20.5 11 8.5 21.3 59.9 23.1 41.3 75.2 53.7 41.6 10 39.6 24.2 9.2 80.6 59.7 80.7 59.7 38.9
32.6 14.5 39.6 54.2 37.4 44.8 56.5 37.2 67 36.2 82 70.2 21.9 50.7 3.9 47.1 39.7 42.6 29.9 76.5
29.6 89.8 4.2 62.5 9.1 40.8 11.2 17 9 68.8 11.7 76.1 57 59.9 41.6 12.6 76.1 73.3 75.5 70.2
44.6 83.7 69 2 78.2 27.8 78.7 62.5 6.8 24.4 88.9 18.9 62.9 67.7 50.6 67.7 39.2 79.9 45.3 81.7
Promedio 41.6 53.3 49.6 45.9 50.8 45.5 46.0 46.9 43.0 48.9 51.0 48.4 38.9 49.8 41.8 44.5 51.7 50.1 48.0 47.4

Tabla 7

Se realizó el mismo tipo de análisis que para el tipo de muestra 1. A continuación se


presenta el análisis estadístico (Tabla 8), la distribución de frecuencias (Tabla 9) y el
histograma correspondiente (Grafica 4).

Clase Frecuencia FR% M 20x30


Muestra 20 x 30
10 0 0
Media 47.16 20 0 0
Error típico 0.85 30 0 0
Mediana 47.71 40 1 5
Moda #N/D 50 14 70
Desviación estándar 3.79 60 5 25
Varianza de la muestra 14.34
70 0 0
Curtosis -0.26
80 0 0
Coeficiente de asimetría -0.53
90 0 0
Rango 14.48
100 0 0
Mínimo 38.87
Máximo 53.34 y mayor... 0
Suma 943.27 Tabla 9
Cuenta 20
Nivel de confianza(95.0%) 1.77

Tabla 8

6
Luis Enrique Villanueva Solis
27 de enero 2020

Gráfica 4

Al comparar las Frecuencias relativas porcentuales de los promedios muestrales con la


población original se puede ver que se acerca más a una distribución normal que la muestra
de 30x5, tal como se muestra en la Gráfica 5.

Gráfica 5

La media de los promedios muestrales para este caso es más cercana a la media poblacional,
que la de 30x5, tal como se muestra a continuación:

𝑥̅𝑥̅ ≈ 𝜇
47.16 ≈ 48.14

7
Luis Enrique Villanueva Solis
27 de enero 2020
La desviación estándar de los promedios muestrales es menor a la desviación estándar
poblacional, lo cual cumple con dicho criterio:

𝑆𝑥̅ < 𝜎
3.79 < 28.11
Se determina el Intervalo de confianza al 95% (IC 95%), para lo cual se necesita calcular 1
el Error estándar (e.e.). 81.6
48.5
66.8
c. ⅇ. ⅇ. = 𝑆𝑥̅ por lo tanto ⅇ. ⅇ. = 3.79 56.5
13.3
82.4
𝑆 57
d. ⅇ. ⅇ. = tomando a la muestra número 1 (Ilustración 2), calculando la 44.6
√𝑛 50.6
5.3
desviación estándar, el error estándar da como resultado: 12.8
1.7
70.9
25.4 2.7
ⅇ. ⅇ. = = 4.63 39.6
84.3
√30 58.6
4.8
Con esto podemos comprobar que ambos errores estándar son similares. Con estos valores 27.3
28.5
pasamos a determinar el IC 95% como se muestra a continuación: 55.4
52.7

𝐼𝐶 95% = 𝑥̅ ± 1.96(ⅇ. ⅇ) 6.5


73.6
57.9
𝐼𝐶 95% = 47.16 ± 1.96(3.79) = 47.16 ± 7.43 = [39.73 − 54.59] 33.3
24.4
32.6
29.6
44.6
Esto nos indica que dentro de este intervalo podemos encontrar a la media poblacional 41.6

(µ), lo cual es cierto, ya que µ= 48.14. Ilustración 2

Con este análisis, comparando ambos IC 95% (30x5 y 20x30) podemos concluir que al
tomar una muestra con un número mayor de elementos nos da una mayor certeza al momento
de establecer el intervalo de confianza .

Vous aimerez peut-être aussi