Académique Documents
Professionnel Documents
Culture Documents
1.1. INTRODUCCIÓN
𝒌 𝒍
𝒏𝒊𝒋 =n
𝒊=𝟏 𝒋=𝟏
1.4. TABLA DE DISTRIBUCIÓN DE FRECUENCIA BIDIMENSIONAL ABSOLUTA
n*j es la suma total de las frecuencias absolutas nij según el índice i, o sea,
𝑘
n*j = 𝑖=1 𝑛𝑖𝑗
Veamos algo más sencillo
Individuos A B C .......
Carácter X x1 x2 x3 ........
Carácter Y y1 y2 y3 ..........
Ejemplo 1:
La lista de pares de datos correspondientes a cada individuo de la población (repetidos o no), es lo que llamamos variable
estadística bidimensional.
A cada uno de los trabajadores de una fábrica se les talla y pesa. Se trata de dos variables cuantitativas.
Ejemplo 2:
Entre los empleados de una empresa se ha realizado una encuesta sobre el consumo del tabaco, que ha arrojado los
siguientes resultados:
A cada uno de los trabajadores de una fábrica se les talla y pesa. Se trata de dos variables cuantitativas.
Hábito
Fumadores No fumadores Totales de filas
Sexo
Varones 49 64 113
Mujeres 43 37 80
Totales de columnas 92 101 Total general 193
1.4. TABLA DE DISTRIBUCIÓN DE FRECUENCIA BIDIMENSIONAL
n** (igual a n) es la suma total de las frecuencias absolutas nij según los índices i y j, así como también la suma
total de los totales ni* según j o de los totales n*j según i, esto es.
𝒌 𝒍
𝑘 𝑙
𝑛 ** = 𝒊=𝟏 𝒋=𝟏
𝒏𝒊𝒋
= 𝑖=1 𝑛𝑖 ∗ = 𝑗=1 𝑛 ∗ 𝑗 =𝑛
La frecuencia absoluta ni* es el número de observaciones que presentan el valor xi de la característica x, independiente de
los valores de la característica y. Análogamente, n*j es el número de observaciones que corresponden al valor yi de la
característica e independiente de los valores de la variable x.
Nota 1.4.1. Si la variable x (y/o la variable y) es contínua xi (y/o yj) representará la marca de clase número i (o j), de tal
manera que se reducirá el caso contínuo al caso discreto como al estudiar las variables estadísticas de una dimensión.
Nota 1.4.2. Si las variables x e y son cualitativas la tabla de distribución bidimensional se llama Tabla de Contingencia.
1.4.1 Frecuencias relativas
Se llama frecuencia relativa o simplemente
frecuencia de la pareja de valores xi e yj (o DISTRIBUCIÓN DE FRECUENCIAS RELATIVAS BIDIMENSIONALES
bien frecuencia total) a la proporción de Valores de y 𝑙
observaciones que presentan = 𝑗=1 ℎ𝑖𝑗 =hi*
y1 y2 … yj … yl
simultáneamente los valores xi e yj . Es Valores de x
decir,
x1 h11 h12 … hij … h1l h1*
x2 h21 h22 … h2j … h2l h2*
𝑛 𝑖𝑗
hij = 𝑛
… … … … … … … …
xi hi1 hi2 … hij … hil hi*
… … … … … … … …
En algunas situaciones de acuerdo a objetivos específicos, podrá definirse las frecuencias con relación al total
de cada o de cada fila. Es decir tendrá:
𝑛𝑖𝑗 𝑛𝑖𝑗
y , i = 1, 2, …, k; j = 1, 2, …, l
𝑛𝑖 𝑛𝑗
∗ ∗
1.4.2. Distribuciones marginales
𝑛 𝑗
h*j = ∗
𝑛
Caso 1:
Un grupo de estudiantes de la facultad de Ingeniería de la UCCI están a punto de iniciar sus prácticas pre profesionales
en diferentes regiones de nuestro país (costa, sierra, selva). Se ha encuestado a un grupo de ellos para conocer su
género y la región elegida para llevar a cabo dichas prácticas. Los datos se muestran a continuación:
Organiza los datos en una tabla de contingencia. Luego elabore la distribución de frecuencias marginales y construya
su gráfico de barras agrupadas.
Solución: Caso 1
Primero.- Construimos la tabla considerando la variable “Género” en las filas y “Región” en las columnas:
Segundo.- Completamos cada celda de la tabla con el número de veces que aparece cada dato bivariado. Para
ello contamos la cantidad de estudiantes de género masculino que viajarán a la costa, que viajarán a la sierra y
a la selva. Hacemos lo propio con las estudiantes de género femenino. Luego sumamos para calcular los totales
de fila y columna.
Tercero.- Elaboramos las tablas de frecuencias marginales:
Cuarto.- Se elabora el gráfico de barras agrupadas.
5 4
4
3
3
2
2
1
0
0
Lengua: 3, 7, 8, 7, 5, 2, 5, 9, 5, 4, 3, 5, 3, 6, 3, 8, 5, 7, 7, 6, 2, 4, 9, 4, 9 , 7, 6, 7, 1, 7
Nueva tabla en la que se ha añadido una fila y una columna más con los totales:
X Distribuciones
0 1 2 3 4 5 6 7 8 9 10 marginales de Y
Y Total
0 1 1
1 2 2
2 2 2 4
3 0
4 3 3
5 3 2 2 7
6 1 2 3
7 3 3
8 2 2
9 3 3
10 2 2
Distribuciones
marginales de X 0 1 2 4 4 5 2 7 2 3 0 30
Total
Distribuciones marginales
Se denomina distribución marginal de una variable bidimensional a la distribución que se obtiene al estudiar
independientemente cada variable.
Si tomamos la primera columna y la última columna en la tabla anterior, obtenemos la distribución de frecuencias
marginales de la variable estadística Y.
Y 0 1 2 3 4 5 6 7 8 9 10
nj 1 2 4 0 3 7 3 3 2 3 2
x 0 1 2 3 4 5 6 7 8 9 10
n´j 0 1 2 4 4 5 2 7 2 3 0
EJEMPLO 1:
Suponga que la población masculina de 7 ciudades se ha clasificado en casados y solteros, obteniéndose la siguiente
tabla.
Ciudades y
A B C D E F G
Condición x
Casados 133 164 155 106 153 123 146
Solteros 36 57 40 37 55 39 36
Hallar:
a. La tabla de distribución de frecuencias relativas.
b. La distribución marginal de x y de y.
c. El porcentaje de casados y e porcentaje de solteros.
d. La tabla de distribución de frecuencia acumulada absoluta.
Solución 1: La tabla de distribución conjunta de frecuencias relativas de las variables x e y, se construye usando
la relación hij = nij / n, con n= 1280 = Σσnij:
ciudades y Suma
A B C D E F G
Condición x horizontales
Casados 133 164 155 106 153 123 146 980
Solteros 36 57 40 37 55 39 36 300
Suma Verticales 169 221 195 143 208 162 182 1280
7
n1* = 𝑗=1 𝑛𝑖𝑗 = 133+164+155+106+153+123+146 =980
7
n2* = 𝑗=1 𝑛𝑖𝑗 = 36+57+40+37+55+39+36 =300
Para y:
2
n*1 = 𝑗=1 𝑛𝑖𝑗 = 133+36 = 169
2
n*2 = 𝑗=1 𝑛𝑖𝑗 = 164+57 = 221
…
2
n*7 = 𝑗=1 𝑛𝑖𝑗 = 146+36=182
Las frecuencias marginales están calculadas en la tabla de la pregunta (a). Entonces, se tiene las tablas
siguientes:
Entonces,
1 1 1
N11 = 𝑟=1 𝑝=1 𝑛𝑟𝑝 = 𝑟=1 𝑛𝑟1 = n11 = 133;
1 2 1
N12 = 𝑟=1 𝑝=1 𝑛𝑟𝑝 = 𝑟=1(𝑛𝑟1 + nr2) = n11 + n12 = 133 + 164 = 297;
2 1 2
N21 = 𝑟=1 𝑝=1 𝑛𝑟𝑝 = 𝑟=1 𝑛𝑟1 = n11 + n21 = 133 + 36 = 169;
2 2 2 2 2
N22 = 𝑟=1 𝑝=1 𝑛𝑟𝑝 = 𝑛 (n
𝑟=1 𝑟1 r1 + n r2 )= 𝑛
𝑟=1 𝑟1 + 𝑟=1 𝑛𝑟2
N22 = n11 + n21 + n12 + n22 = 133 + 36 + 164 + 57 = 390
Así sucesivamente:
2 7
N27 = 𝑟=1 𝑝=1 𝑛𝑟𝑝 = 1280
La tabla de distribución acumulada absoluta es la siguiente:
y
A B C D E F G
x
Casado 133 164 155 106 153 123 146
10
9
8
7
6
5
4
3
2 Muertos
1
0
X
Recuperados
Tratados
No tratados
2. RECONSTRUCCIÓN DE TABLAS
Intervalos fi hi Fi Hi
[ - 29 >
[ - > 0,10
[ - > 0,30 14 0,47
[ - > 7
[ 41 - > 0,90
[ - > 30
Solución:
Primero.- Para completar los intervalos necesitamos la amplitud, la cual se obtiene de la siguiente manera:
Intervalos fi hi Fi Hi
[ - 29 > (41 – 29) / 3
[ 29 - > 0,10 = 4 (amplitud)
[ - > 0,30 14 0,47
[ - 41 > 7
[ 41 - > 0,90
[ - > 30
n = 30
Segundo.- Al multiplicar el número de datos (n) por la frecuencia relativa se obtiene la frecuencia absoluta.
Además, completamos las frecuencias absolutas y relativas que faltan (sumando frecuencias).
Intervalos fi hi Fi Hi
[ 25 - 29 > 2 2
[ 29 - 33 > 3 0,10 5
[ 33 - 37 > 9 0,30 14 0,47
[ 37 - 41 > 7 21
[ 41 - 45 > 6 0,90
[ 45 - 49 > 3 0,10 30 1,00
n = 30
30 x 0.30
=9
0,90 + 0,10 = 1,00
Tercero.- Al tener las frecuencias absolutas es más fácil completar toda la tabla.
Intervalos fi hi Fi Hi
n = 30 1
Econ: Nataly Lillian Delgado Aguilar