Académique Documents
Professionnel Documents
Culture Documents
Índice
Análisis de Frecuencias para datos agrupados: 1
Ejemplo: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
Tabla de frecuencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Gráfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
I
Índice de tablas
1. Análisis de Frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2. Mi Tabla 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3. ANOVA de un factor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
4. mtcars . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
II
Índice de figuras
1. Diagrama de Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2. My first graph . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3. ESPOCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
III
Análisis de Frecuencias para datos agrupados:
Cuando una variable posee una gran cantidad de datos, y además las categorías o distintos datos son
muchos, es conveniente agrupar esta información por intervalos y determinar la frecuencia o repitencia
de datos que existe dentro de dicho intervalo. Se suele utilizar con mayor frecuencia este análisis en
variables de tipo cuantitativas continuas.
La tabla de frecuencias cuando agrupamos los datos es la misma que para datos simple o no agrupados
con la única diferencia que en la primera columna no se coloca los datos simples sino los datos agrupados.
La forma de crear los intervalos se detalla a continuación: - Determinar el valor máximo y mínimo de
los datos y calcular el rango o amplitud total, que es el valor máximo encontrado en la base de datos
menos el valor mínimo
ni = 1 + 3,32log(n) (2)
Calcular el ancho del intervalo que se obtiene dividiendo el rango para el número de intervalos
R
a= (3)
ni
Ejemplo:
En R existe una base de datos llamada “BJSales”, la cual posee 150 datos acerca de la venta en dólares
que ha hecho una tienda en ciertos periodos no especificados. Los datos son los que se muestran a
continuación:
BJsales
Time Series:
Start = 1
End = 150
Frequency = 1
[1] 200.1 199.5 199.4 198.9 199.0 200.2 198.6 200.0 200.3 201.2 201.6
[12] 201.5 201.5 203.5 204.9 207.1 210.5 210.5 209.8 208.8 209.5 213.2
[23] 213.7 215.1 218.7 219.8 220.5 223.8 222.8 223.8 221.7 222.3 220.8
[34] 219.4 220.1 220.6 218.9 217.8 217.7 215.0 215.3 215.9 216.7 216.7
[45] 217.7 218.7 222.9 224.9 222.2 220.7 220.0 218.7 217.0 215.9 215.8
[56] 214.1 212.3 213.9 214.6 213.6 212.1 211.4 213.1 212.9 213.3 211.5
[67] 212.3 213.0 211.0 210.7 210.1 211.4 210.0 209.7 208.8 208.8 208.8
[78] 210.6 211.9 212.8 212.5 214.8 215.3 217.5 218.8 220.7 222.2 226.7
[89] 228.4 233.2 235.7 237.1 240.6 243.8 245.3 246.0 246.3 247.7 247.6
[100] 247.8 249.4 249.0 249.9 250.5 251.5 249.0 247.6 248.8 250.4 250.7
[111] 253.0 253.7 255.0 256.2 256.0 257.4 260.4 260.0 261.3 260.4 261.6
[122] 260.8 259.8 259.0 258.9 257.4 257.7 257.9 257.4 257.3 257.6 258.9
[133] 257.8 257.7 257.2 257.5 256.8 257.5 257.0 257.6 257.3 257.5 259.6
[144] 261.1 262.9 263.3 262.8 261.8 262.2 262.7
c(-2, 5, pi, sqrt(-2))
1
https://rmarkdown.rstudio.com/lesson-1.html
El código para obtener los intervalos con sus respectivas frecuencias absolutas se muestra a continuación:
h <- hist(BJsales, plot = F)
h$breaks
[1] 190 200 210 220 230 240 250 260 270
h$counts
[1] 6 18 48 17 3 14 32 12
Tabla de frecuencia
Se propone el siguiente código para conseguir la tabla de frecuencia:
h <- hist(BJsales, plot = F)
fa <- h$counts
faa <- cumsum(fa)
fr <- (fa/length(BJsales))*100
fra <- cumsum(fr)
tab.frec <- data.frame(fa, faa, fr, fra)
b <- c("190-200", "200-210", "210-220",
"220-230", "230-240", "240-250",
"250-260", "260-270")
row.names(tab.frec) <- b
Mostramos la tabla
tab.frec
fa faa fr fra
190-200 6 6 4.000000 4.00000
200-210 18 24 12.000000 16.00000
210-220 48 72 32.000000 48.00000
220-230 17 89 11.333333 59.33333
230-240 3 92 2.000000 61.33333
240-250 14 106 9.333333 70.66667
250-260 32 138 21.333333 92.00000
260-270 12 150 8.000000 100.00000
Una mejor forma de hacerlo es utilizando la función kable del paquete knitr,
library(knitr)
kable(x = tab.frec, caption = "Análisis de Frecuencias")
fa faa fr fra
190-200 6 6 4.000000 4.00000
200-210 18 24 12.000000 16.00000
210-220 48 72 32.000000 48.00000
220-230 17 89 11.333333 59.33333
230-240 3 92 2.000000 61.33333
240-250 14 106 9.333333 70.66667
250-260 32 138 21.333333 92.00000
260-270 12 150 8.000000 100.00000
2
α β
0.05 0.75
Tabla 2: Mi Tabla 2
2 Pedro
C1
3 Juan
C2 5 Luis
(x + 1)2 = (x + 1)(x + 1)
= x2 + 2x + 1
Gráfica
Finalmente proponemos un histograma para graficar las frecuencias absolutas de datos agrupados:
hist(BJsales, main = "", col = "skyblue", probability = T,
border = "green", xlab = "Datos", ylab = "Frecuencias")
curve(dnorm(x, mean(BJsales), sd(BJsales)), col = "red", add = T)
3
0.030
0.020
Frecuencias
0.010
0.000
Datos
Figura 1: Histograma
4
Figura 3: ESPOCH
Tabla 4: mtcars