Vous êtes sur la page 1sur 8

Análisis de Frecuencias

Pablo Flores Muñoz

Índice
Análisis de Frecuencias para datos agrupados: 1
Ejemplo: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
Tabla de frecuencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Gráfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

I
Índice de tablas
1. Análisis de Frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2. Mi Tabla 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3. ANOVA de un factor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
4. mtcars . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

II
Índice de figuras
1. Diagrama de Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2. My first graph . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3. ESPOCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

III
Análisis de Frecuencias para datos agrupados:
Cuando una variable posee una gran cantidad de datos, y además las categorías o distintos datos son
muchos, es conveniente agrupar esta información por intervalos y determinar la frecuencia o repitencia
de datos que existe dentro de dicho intervalo. Se suele utilizar con mayor frecuencia este análisis en
variables de tipo cuantitativas continuas.
La tabla de frecuencias cuando agrupamos los datos es la misma que para datos simple o no agrupados
con la única diferencia que en la primera columna no se coloca los datos simples sino los datos agrupados.
La forma de crear los intervalos se detalla a continuación: - Determinar el valor máximo y mínimo de
los datos y calcular el rango o amplitud total, que es el valor máximo encontrado en la base de datos
menos el valor mínimo

R = xmax − xmin (1)


Determinar el número de intervalos que se desea obtener.- El número de intervalos suele ser
determinado a menudo por conveniencia del analista, sin embargo se recomienda que no sea
menor que 5 ni mayor que 12. Si el analista no tiene claro el número de intervalos a generar puede
aplicar la regla de Sturges:

ni = 1 + 3,32log(n) (2)
Calcular el ancho del intervalo que se obtiene dividiendo el rango para el número de intervalos
R
a= (3)
ni

Ejemplo:
En R existe una base de datos llamada “BJSales”, la cual posee 150 datos acerca de la venta en dólares
que ha hecho una tienda en ciertos periodos no especificados. Los datos son los que se muestran a
continuación:
BJsales

Time Series:
Start = 1
End = 150
Frequency = 1
[1] 200.1 199.5 199.4 198.9 199.0 200.2 198.6 200.0 200.3 201.2 201.6
[12] 201.5 201.5 203.5 204.9 207.1 210.5 210.5 209.8 208.8 209.5 213.2
[23] 213.7 215.1 218.7 219.8 220.5 223.8 222.8 223.8 221.7 222.3 220.8
[34] 219.4 220.1 220.6 218.9 217.8 217.7 215.0 215.3 215.9 216.7 216.7
[45] 217.7 218.7 222.9 224.9 222.2 220.7 220.0 218.7 217.0 215.9 215.8
[56] 214.1 212.3 213.9 214.6 213.6 212.1 211.4 213.1 212.9 213.3 211.5
[67] 212.3 213.0 211.0 210.7 210.1 211.4 210.0 209.7 208.8 208.8 208.8
[78] 210.6 211.9 212.8 212.5 214.8 215.3 217.5 218.8 220.7 222.2 226.7
[89] 228.4 233.2 235.7 237.1 240.6 243.8 245.3 246.0 246.3 247.7 247.6
[100] 247.8 249.4 249.0 249.9 250.5 251.5 249.0 247.6 248.8 250.4 250.7
[111] 253.0 253.7 255.0 256.2 256.0 257.4 260.4 260.0 261.3 260.4 261.6
[122] 260.8 259.8 259.0 258.9 257.4 257.7 257.9 257.4 257.3 257.6 258.9
[133] 257.8 257.7 257.2 257.5 256.8 257.5 257.0 257.6 257.3 257.5 259.6
[144] 261.1 262.9 263.3 262.8 261.8 262.2 262.7
c(-2, 5, pi, sqrt(-2))

## [1] -2.000000 5.000000 3.141593 NaN


Enlaces web:
https://yihui.name/knitr/options/

1
https://rmarkdown.rstudio.com/lesson-1.html
El código para obtener los intervalos con sus respectivas frecuencias absolutas se muestra a continuación:
h <- hist(BJsales, plot = F)
h$breaks

[1] 190 200 210 220 230 240 250 260 270
h$counts

[1] 6 18 48 17 3 14 32 12

Tabla de frecuencia
Se propone el siguiente código para conseguir la tabla de frecuencia:
h <- hist(BJsales, plot = F)
fa <- h$counts
faa <- cumsum(fa)
fr <- (fa/length(BJsales))*100
fra <- cumsum(fr)
tab.frec <- data.frame(fa, faa, fr, fra)
b <- c("190-200", "200-210", "210-220",
"220-230", "230-240", "240-250",
"250-260", "260-270")
row.names(tab.frec) <- b

Mostramos la tabla
tab.frec

fa faa fr fra
190-200 6 6 4.000000 4.00000
200-210 18 24 12.000000 16.00000
210-220 48 72 32.000000 48.00000
220-230 17 89 11.333333 59.33333
230-240 3 92 2.000000 61.33333
240-250 14 106 9.333333 70.66667
250-260 32 138 21.333333 92.00000
260-270 12 150 8.000000 100.00000
Una mejor forma de hacerlo es utilizando la función kable del paquete knitr,
library(knitr)
kable(x = tab.frec, caption = "Análisis de Frecuencias")

Tabla 1: Análisis de Frecuencias

fa faa fr fra
190-200 6 6 4.000000 4.00000
200-210 18 24 12.000000 16.00000
210-220 48 72 32.000000 48.00000
220-230 17 89 11.333333 59.33333
230-240 3 92 2.000000 61.33333
240-250 14 106 9.333333 70.66667
250-260 32 138 21.333333 92.00000
260-270 12 150 8.000000 100.00000

Otra tabla es:

2
α β
0.05 0.75

Tabla 2: Mi Tabla 2

Una nueva tabla es:

2 Pedro
C1
3 Juan
C2 5 Luis

Tabla de Análisis de Varianza


La siguiente tabla indica el Análisis de varianza, usando una significancia α = 0,05

Tabla 3: ANOVA de un factor


Fuente Suma de Grados de Cuadrado F
Variación Cuadrados Libertad medio Calculado
SSA 69726.33 4 17431.58 2.59
SSE 167955.67 25 6718.22 fe = 2.59
SST 237682 29 8195.93 f0,05 = 4.25
f0,05 = 2.76

Hagamos la ecuación de las raíces de una ecuación de 2 grado:



−b ± b2 − 4ac
x= (4)
2a

Con b2 − 4ac > 0


Resolvamos la siguiente ecuación

(x + 1)2 = (x + 1)(x + 1)
= x2 + 2x + 1

Gráfica
Finalmente proponemos un histograma para graficar las frecuencias absolutas de datos agrupados:
hist(BJsales, main = "", col = "skyblue", probability = T,
border = "green", xlab = "Datos", ylab = "Frecuencias")
curve(dnorm(x, mean(BJsales), sd(BJsales)), col = "red", add = T)

Vamos a incluir una gráfica


La siguiente gráfica es el sello de la ESPOCH.
La Tabla 2 es una tabla referenciada al igual que la Grafica ??
La Ecuación 1 denota un caracter especial La tabla 2 es muy bonita
La Tabla 3 representa el análisis de varianza La figura 3 pertenece a las espoch
library(knitr)
kable(mtcars, row.names = F, caption = "mtcars", digits = 1)

3
0.030
0.020
Frecuencias

0.010
0.000

200 220 240 260

Datos

Figura 1: Histograma

Figura 2: My first graph

4
Figura 3: ESPOCH

Tabla 4: mtcars

mpg cyl disp hp drat wt qsec vs am gear carb


21.0 6 160.0 110 3.9 2.6 16.5 0 1 4 4
21.0 6 160.0 110 3.9 2.9 17.0 0 1 4 4
22.8 4 108.0 93 3.8 2.3 18.6 1 1 4 1
21.4 6 258.0 110 3.1 3.2 19.4 1 0 3 1
18.7 8 360.0 175 3.1 3.4 17.0 0 0 3 2
18.1 6 225.0 105 2.8 3.5 20.2 1 0 3 1
14.3 8 360.0 245 3.2 3.6 15.8 0 0 3 4
24.4 4 146.7 62 3.7 3.2 20.0 1 0 4 2
22.8 4 140.8 95 3.9 3.1 22.9 1 0 4 2
19.2 6 167.6 123 3.9 3.4 18.3 1 0 4 4
17.8 6 167.6 123 3.9 3.4 18.9 1 0 4 4
16.4 8 275.8 180 3.1 4.1 17.4 0 0 3 3
17.3 8 275.8 180 3.1 3.7 17.6 0 0 3 3
15.2 8 275.8 180 3.1 3.8 18.0 0 0 3 3
10.4 8 472.0 205 2.9 5.2 18.0 0 0 3 4
10.4 8 460.0 215 3.0 5.4 17.8 0 0 3 4
14.7 8 440.0 230 3.2 5.3 17.4 0 0 3 4
32.4 4 78.7 66 4.1 2.2 19.5 1 1 4 1
30.4 4 75.7 52 4.9 1.6 18.5 1 1 4 2
33.9 4 71.1 65 4.2 1.8 19.9 1 1 4 1
21.5 4 120.1 97 3.7 2.5 20.0 1 0 3 1
15.5 8 318.0 150 2.8 3.5 16.9 0 0 3 2
15.2 8 304.0 150 3.1 3.4 17.3 0 0 3 2
13.3 8 350.0 245 3.7 3.8 15.4 0 0 3 4
19.2 8 400.0 175 3.1 3.8 17.1 0 0 3 2
27.3 4 79.0 66 4.1 1.9 18.9 1 1 4 1
26.0 4 120.3 91 4.4 2.1 16.7 0 1 5 2
30.4 4 95.1 113 3.8 1.5 16.9 1 1 5 2
15.8 8 351.0 264 4.2 3.2 14.5 0 1 5 4
19.7 6 145.0 175 3.6 2.8 15.5 0 1 5 6
15.0 8 301.0 335 3.5 3.6 14.6 0 1 5 8
21.4 4 121.0 109 4.1 2.8 18.6 1 1 4 2

Vous aimerez peut-être aussi