Académique Documents
Professionnel Documents
Culture Documents
ANÁLISIS DE DATOS CATEGÓRICOS obtiene una muestra de tamaño n y se construye una tabla de frecuencias conjunta
con una estructura similar a la tabla 1. Dicha tabla se denomina tabla de clasificación
cruzada, tabla bivariante, tabla bidimensional, etc. La denominación más utilizada
Hugo Saavedra Saavedra es la de tabla de contingencia, que tiene la siguiente estructura.
Hipótesis Nula Ho: Las variables A y B. Que es lo mismo que decir que No existe relación
2. Tabla de contingencia. entre las variables A y B
Con mucha frecuencia el análisis estadístico se orienta a la evaluación de la
Hipótesis Alternativa H1: Las variables A y B no son independientes (Existe relación entre
existencia o no de una relación entre dos variables a partir de una muestra aleatoria
las variables A y B)
de tamaño n. Cuando ambas variables son cuantitativas y se realizan mediciones de
los valores en cada uno de n elementos o individuos, usando una escala de ordinal,
de intervalo o de razón, el análisis se realiza a través de alguno de los coeficientes Estadístico de prueba (Prueba Ji-Cuadrado)
de correlación.
El estadístico que se usa para probar esta hipótesis es el conocido estadístico Ji-Cuadrado
Cuando se trata de analizar la relación entre dos variables cualitativas, medidas en que está dado por,
escala nominal u ordinal, o cuando una o ambas variables cuantitativas han sido
c r (nij eij ) 2 2) Para evitar el inconveniente de las frecuencias esperadas menores que cinco,
2 se recomienda combinar categorías de las variables a fin de contar con
j 1 i 1 eij frecuencias esperadas mayores a cinco. Esta combinación de las celdas re
realiza siempre que no se pierda el sentido del propósito u objetivo del análisis.
Cuando la hipótesis nula es cierta este estadístico tiene una distribución que se aproxima a
una Chi-Cuadrado con grados de libertad igual a (r-1)*(c-1).
Ejemplo
Las nij son las frecuencias observadas y las
Un administrados lleva adelante un estudio con el objetivo de descubrir la posible
relación que puede existir entre el las fallas de que presentan cinco máquinas y el
eij son las frecuencias esperadas bajo la hipótesis de independencia. Estas turno de operación de dichas máquinas. Se han obtenidos datos de 160 fallas y se
frecuencias esperadas se calculan mediante la relación
han clasificado en la siguiente tabla de contingencia.
ni . * n. j Máquina
eij , Máquina Máquina Máquina Máquina
n Turno A B C D Total
Mañana 12 6 12 13 43
Tarde 10 12 19 22 63
Dado que la tabla de contingencia es una tabla de r filas y c columnas se suele Noche 13 10 13 18 54
llamar tabla r*c. Nótese que para calcular el valor del estadístico es necesario calculas las Total 35 28 44 53 160
r*c frecuencias esperadas.
3.1. Región crítica. Vamos a realizar la Prueba de independencia para las dos variables involucradas en
Es una prueba unilateral, de extremo derecho y la región crítica o región de rechazo este caso.
es: El objetivo del estudio es descubrir la posible relación entre las fallas de las
máquinas y el turno de trabajo.
2 [21 , ( r 1)(c1)]
1) La hipótesis nula y alternativa son:
Se puede observar que no hay frecuencias esperadas menores que cinco, por lo que
procedemos a calcular el valor del estadístico.
c r (nij eij ) 2
2
=
j 1 i 1 eij
(12 9.41) 2 (6 7.53) 2 (18 17.89) 2
2 ... 2.87
9.41 7.53 17.89 b) Para datos que ya están en una base de datos
5) Decisión. Dado que 2.87 es menor que 12.59, no se rechaza la hipótesis nula.
6) Se concluye que no hay relación entre las fallas de las máquinas y el turno de COMPLEMENTOS MegaStat Chi-Square/Crosstab Crosstabulation
trabajo de las mismas.
¿Es posible concluir que las proporciones de consumidores de las cinco marcas de
gaseosa no son homogéneas en las cuatro ciudades? Use un nivel de significancia
del 5%.
SOLUCIÓN. Para responder a la pregunta anterior es necesario realizar una prueba - Si la tabla no es cuadrada, sino de dimensión rxc, entonces sea
de homogeneidad. h = mín{r, c}
Realizar la prueba respectiva siguiendo los pasos de una prueba de hipótesis.
ACTIVIDAD.
Buscar dos problemas del campo de la Contabilidad o la Administración
que implique realizar una prueba de independencia, realizar el análisis
correspondiente y evaluar el grado de relación mediante los coeficientes
de contingencia y de Cramér.