Vous êtes sur la page 1sur 9

Chi-cuadrado

El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una


comparacin global de grupos de frecuencias. Para este problema el mtodo es
diferente, pues el test que se utiliza se denomina Chi-Cuadrado de Pearson, y con ese
test lo que queremos determinar es si la frecuencia observada de un fenmeno es
significativamente igual a la frecuencia terica prevista, o s, por el contrario, estas
dos frecuencias acusan una diferencia significativa para, por ejemplo, un nivel de
significacin del 5%. Las posibles aplicaciones son muchas: eleccin de un cartel
turstico publicitario presentado a grupos de clientes; comparar la rentabilidad de un
proyecto hotelero en dos espacios tursticos; determinar las preferencias o gustos de
los turistas por determinados espacios geogrficos, o por determinados servicios
hoteleros, etc. El mtodo que se sigue es el siguiente:
1) Se designan las frecuencias observadas con letras minsculas y con letras
maysculas las frecuencias esperadas o tericas.
2) Las frecuencias se presentan en cuadros o tablas con un cierto nmero de
columnas y de filas. Pueden ser tablas de 1 x 2, o de 2 x 2 etc. Aplicaremos el mtodo
con una tabla 1 x 2; y despus con una tabla 2 x 2. Supongamos que se ha
comprobado fallas leves (atributos) en dos proyectos tursticos que no han satisfecho
plenamente a la clientela. Estas fallas han ocurrido en los sitios tursticos A y B. O
sea, de un total de 102 fallas, 59 han tenido lugar en el sitio A y 43 fallas en el sitio B.
Formulamos la hiptesis nula que no existe relacin entre el nmero de fallas y el
hecho de que hayan ocurrido en los sitios A y B. Si la hiptesis nula no se rechaza,
quiere decir que cada sitios es independiente del hecho y entonces no existe razn
para suponer que por ejemplo A es menos predispuesto a fallas que B. Si se rechaza
la hiptesis nula, entonces alguno de los dos sitios si est propenso a mayor nmero
de fallas. Para este anlisis se aplica el test Chi-cuadrado de Pearson. Vamos a
observar los datos empricos (59 y 43= 102) y los datos esperados o sea una
reparticin por igual de las fallas entre el proyecto A y el B (51 y 51 = 102). a = 59 b
= 43 A = 51 B = 51 La frmula que permite obtener el Chi-cuadrado incluye una
correccin igual a O,50 por ser muestras pequeas y su valor estimado con la frmula
es 2,206. Al ir a la tabla del encontramos que para un grado de libertad, el valor del
Chi-cuadrado debe ser igual o mayor que 3,841 para un nivel de significacin del 5%.
Dado que el valor encontrado en el anterior clculo es igual a : 2,206, podemos
admitir que la hiptesis nula es correcta, pues no existe razn para suponer que se
produzcan ms fallas en el espacio turstico A que en el espacio B. Si la tabla es de 2
x 2 De nuevo el fin del test es comparar las frecuencias observadas empricamente de
dos muestras, con las frecuencias esperadas o tericas. Dos procedimientos de
refrigeracin (x e y) se han ensayado en el Dpto. de Alimentos y Bebidas de un

Hotel con el fin de aumentar la duracin de las materias primas perecederas. Los
resultados son segn atributos cualitativos los siguientes: Primero veremos las
frecuencias empricas u observadas: Refrigeracin X : fracasos =77; xitos =63 y el
total 140. Y para la Refrigeracin Y: fracasos = 54; xitos = 66 y el total 120. Los
totales de las tres columnas son: 131,129 y 260. En seguida veremos las frecuencias
tericas o esperadas: Refrigeracin X : fracasos = 70,54; xitos=69,46 y el total 140.
Refrigeracin Y : fracasos =60,46; xitos = 59,54 y el total 120. Todos los totales de
las tres columnas son; 131,129 y 260. Las frecuencias tericas fueron estimadas de
esta manera:a1 = 131 x 140 / 260 = 70,54; b1 = 129 x 140 / 260 = 69,46; a2 = 131 x
120 / 260 = 60,46; b2 = 129 x 120 / 260 = 59,54. Cuando las muestras son pequeas
se aplica en la frmula una correccin igual a 0,50. Y al aplicar la frmula del Chicuadrado obtenemos el valor de: 2,200. De nuevo se compara el resultado 2,20 con el
de la tabla para un grado de libertad y para el nivel de significacin del 5% con un
valor de 3,841. La diferencia entre las dos muestras no es significativa y no se puede
llegar a ninguna conclusin razonada sobre los dos procedimientos de refrigeracin.
ANLISIS DE LAS PRUEBAS DE CHI CUADRADO
2. Distribucin Chi Cuadrado
Se define a la Distribucin Chi Cuadrado como: Aquella distribucin denominada
tambin ji-cuadrado de Pearson, es una distribucin de probabilidad continua con un
parmetro k, que representa los grados de libertad de la variable aleatoria. Segn
http://www.es.wikipedia.org/wiki/Estadstica/ Prueba_de_ - 20k.
Es considerada como una prueba no paramtrica, que mide la discrepancia entre una
distribucin observada y otra terica (bondad de ajuste), indicando la medida de las
diferencias existentes entre ambas, y de haberlas, se deben al azar en el contraste de
hiptesis, tambin se utiliza para probar la independencia de dos variables entre s,
mediante la presentacin de los datos en tablas de contingencia.
Las Pruebas de Chi Cuadrado, nos permiten verificar si ms de dos proporciones de
poblaciones pueden considerarse iguales. En realidad, stas nos permiten hacer
muchas cosas y no simplemente probar la igualdad de varias proporciones. Por
ejemplo: si clasificamos una poblacin de diversas categoras respectos a dos
atributos, como la edad y rendimiento en el trabajo, se puede aplicar entonces la
Prueba del Chi Cuadrado, para determinar si ambos atributos son independientes
entre s.
2.1. El Estadstico Chi Cuadrado
El estadstico de Chi Cuadrado, se calcula a travs de una frmula y los clculos son
fciles de hacer. Si el valor de Chi Cuadrado da cero, indica que las frecuencias

observadas son exactamente iguales a las frecuencias esperadas. Si el valor es


diferente de cero, entonces este valor obtenido refleja, que hay diferencia entre los
valores observados y los valores esperados, es importante mencionar que este valor
es comparado con otro estadstico de Chi Cuadrado, que se determina cuando se
calculan los grados de libertad y se tiene el nivel de significancia escogido; este
valor es buscado en la tabla de Distribucin Chi Cuadrado, correspondiente al
extremo derecho y as se determina si se rechaza la hiptesis nula o se acepta.
La frmula que da el estadstico es la siguiente:
2

x =

( f of e )2
fe

Donde:
X= Chi Cuadrado
= La suma de
fo= Frecuencia observada
fe= Frecuencia esperada
El Chi Cuadrado es un estadstico muestral, que se calcula a travs de una serie de
pasos, los mismos se pueden observar a travs de la frmula, estos son:
Restamos fe a fo.
Elevamos al cuadrado cada una de la diferencias.
Dividimos entre fe cada diferencia elevada al cuadrado.
Sumamos las respuestas.
Cuanto mayor sea el valor o el resultado de X2, es menor la posibilidad de que la
hiptesis sea correcta. De la misma forma, cuanto ms se aproxima a cero el valor de
Chi-Cuadrado, ms ajustadas estn ambas distribuciones.

3.2. Determinacin De Los Grados De Libertad


El grado de libertad, es un estimador del nmero de categoras independientes en un
test particular o experimento estadstico. Para utilizar la prueba de Chi Cuadrado,
debemos calcular el nmero de grados de libertad (gl), mediante la aplicacin de la
siguiente ecuacin:

gl=( nmero de renglones 1)(nmero de columnas1)


gl=( r1)(k1) . Donde r es el nmero de filas y k el nmero de columnas .

Existe un criterio de decisin para seleccionar la hiptesis, que es el siguiente:


Se acepta la hiptesis nula (H0), cuando X < Xt (r-1) (k-1), en tal caso que sea
contrario se rechaza la hiptesis nula (H0) y se acepta la hiptesis alternativa.
Donde t representa el valor proporcionado por las tablas, segn el nivel de
significancia estadstico elegido
3.3. Caractersticas De La Distribucin De Chi Cuadrado
Es una curva asimtrica a la derecha, es decir, con sesgo positivo y las frecuencias
ms altas se encuentran en el lado izquierdo de la media; mientras que en el derecho
hay frecuencias ms pequeas.
A continuacin se presenta una grfica que muestra la distribucin asimtrica
positiva, en donde se puede apreciar que hacia el lado izquierdo de la media, van a
estar las frecuencias ms altas y hacia el lado derecho de la media se encuentran las
frecuencias ms pequeas.
Figura N 4. Distribucin Asimtrica Positiva

Es muy utilizada en Estadstica Inferencial para realizar pruebas de hiptesis,


relativas a variables cualitativas.
El valor de Chi Cuadrado nunca es negativo, porque la diferencia entre fo y fe se
eleva al cuadrado, esto es (fo y fe).
Existe una familia de distribuciones de Chi Cuadrado; una para cada grado de
libertad (gl). El nmero de grados de libertad est determinado por (K-1), donde
K, es el nmero de categoras, en consecuencia, la forma de la distribucin de la
muestra no depende del tamao de sta. Por ejemplo, si 200 empleados de una
aerolnea, se clasifican en una de estas tres categoras: personal de vuelo, personal

auxiliar en tierra y personal administrativo; entonces habra K-1 = 3-1= 2 grados de


libertad.
Las distribuciones de Chi Cuadrado tienen sesgo positivo, pero conforme aumenta
el nmero de grados de libertad, la distribucin se aproxima a la de tipo normal.
A continuacin, se presenta una grfica que contiene las distribuciones de Chi
Cuadrado, las cuales son diferentes para cada uno de los valores de los grados de
libertad. Esta grfica muestra que, en cuantos menos grados de libertad vayan
asociados a una distribucin; mayor es el sesgo positivo de la misma y as mismo, a
medida de que los grados de libertad aumentan, se puede observar que la distribucin
se aproxima a la distribucin normal.
Figura N 5. Distribuciones de Chi Cuadrado para diferentes grados de libertad
seleccionados.

La moda de cada distribucin, es igual a D-2 en la escala de X, esto se da cuando


D es igual o mayor que 2; siendo D (nmero de grados de libertad). Por ejemplo,
el mximo valor de Y para la curva con D= 5, est en el punto donde X= 3 (5-2=3).
El rea total bajo cada curva es 1 o 100%. La mediana es una distribucin X, que
divide el rea en dos partes iguales, siendo cada parte 0,5 50%, es decir, es el
centro de la curva. La media de una distribucin X, es igual al nmero de grados de
libertad.
Las curvas muestran una aproximacin bastante rpida hacia la simetra, cuando el
nmero de grados de libertad aumenta, es decir, que la curva toma una forma
parecida a la de la distribucin normal.

El Chi Cuadrado es obtenido de nmeros al cuadrado, por lo tanto nunca puede ser
negativa. El valor ms pequeo posible para Chi Cuadrada es 0, y el mayor valor
posible es el infinito.
Entonces se puede decir, que si X=0, las frecuencias observadas concordarn
exactamente con las frecuencias tericas o esperadas. Mientras mayor es el valor de
X, mayor es la diferencia entre las frecuencias tericas y esperadas.
Al probar una hiptesis mediante el uso de la distribucin X, se puede determinar
si las diferencias entre los conjuntos de frecuencias son significativas, o si las
diferencias son demasiados grandes, para ser atribuibles a fluctuaciones de la
muestras.
3.5. Limitaciones De Las Pruebas De Chi Cuadrado:
Se debe tener mucho cuidado, al aplicar una prueba de Chi Cuadrado (X) en algunos
problemas. Si se da el caso en que existe una frecuencia esperada pequea en una
celda, el Chi Cuadrado (si se aplica) puede llevar a una conclusin errnea. Esto se
debe a que la frecuencia esperada (fe), aparece en el denominador en la frmula del
estadstico Chi Cuadrado, y la divisin entre un nmero muy pequeo produce un
coeficiente demasiado grande.
A continuacin se mencionan dos reglas de aceptacin general, respecto a pequeas
frecuencias de celda, las cuales son:
Si solo hay dos celdas, la frecuencia esperada en cada celda debe ser igual a 5 o
mayor (fe 5), es decir, para utilizar la prueba de hiptesis de Chi Cuadrado, se debe
tener un tamao de muestra lo suficientemente grande, para garantizar la similitud
entre la distribucin terica correcta y nuestra distribucin de muestreo de X,
porque lo ms probable es que se rechace la hiptesis nula, cuando la misma es
verdadera al tener muestras menores a 5 o muestras muy pequeas.
El clculo de Chi Cuadrado, si se puede realizar en el siguiente ejemplo, el cual
implica un valor mnimo de 6 para la frecuencia esperada (fe).
A continuacin se presenta la tabla, que expresa un ejemplo de valores correctos, que
deben tener las frecuencias esperadas en un problema determinado.
Tabla N 2. Regla N 1: Valores correctos de las Frecuencias esperadas (fe 5).

Persona

fo

fe

Alfabeta

643

642

Analfabeta

Si las frecuencias esperadas de la tabla N 2, fueran menores el valor o resultado de


Chi Cuadrado estar sobrestimado y por lo tanto se tendr como resultado
demasiados rechazos de la hiptesis nula, entonces para evitar incurrir en inferencias
incorrectas de la prueba de hiptesis de Chi Cuadrado se debe seguir la Regla N 1.
Para ms de dos celdas, no debe aplicarse X, si ms de 20% de las celdas de
fe, tienen frecuencias esperadas menores de 5.
a esta regla que se menciona, se puede calcular el X, para la informacin en la parte
izquierda de la tabla que se presenta a continuacin, ya que slo una de seis celdas, es
decir, el 17%, contiene una frecuencia menor que 5, pero el X no debe utilizarse para
la informacin gerencial que se encuentra en la parte derecha de la tabla N 3, porque
tres de las siete frecuencias esperadas, es decir, el 43% tienen un valor menor que 5,
por lo tanto segn la Regla N 2, no se puede aplicar la prueba de Chi Cuadrado,
porque el porcentaje es mayor al 20%.

A continuacin de presenta la tabla N 3, que contiene los datos del ejemplo


explicado anteriormente:
Tabla N 3. Regla N 2: Frecuencias esperadas con aceptacin de un 20% mximo,
de valores menores que 5.
Nmero
Nmero
Nivel Directivo

fo

fe

Nivel Directivo

fo

fe

Asistente

18

16

Asistente

30

32

Supervisor

39

37

Supervisor

110

113

Gerente

13

Gerente

86

87

Gerente General

Gerente General

23

24

Vicepresidente Adj

82

78

Vicepresidente Adj

Vicepresidente

10

15

Vicepresidente

163

163

Vicepresidente Ejec

3.2. Prueba De Independencia


La Prueba de Independencia, es una prueba estadstica de proporciones de
frecuencias; que se utiliza para determinar si la pertenencia de una variable a
categoras, es diferente como funcin de la pertenencia a la categora de una segunda
variable. En muchas ocasiones, las gerencias necesitan saber si las diferencias que
observan entre varias proporciones de muestra son significativas o solamente son
resultado del azar.
En el anlisis de una prueba de independencia, se considera que la muestra una vez
escogida, se clasifica segn los criterios de inters; por ello se supone que las
muestras provienen de una poblacin.
En las aplicaciones estadsticas, es frecuente interesarse en calcular si dos variables
de clasificacin, ya sea cuantitativa o cualitativa, son independientes o si estn
relacionadas.
La Prueba de Independencia, lo que busca es resolver aquellas situaciones en las que
se est interesado en determinar; si dos variables estn relacionadas. Por ejemplo, un
especialista en marketing, quisiera determinar si hay alguna conexin entre los
niveles de renta de los consumidores y su preferencia por el producto que l vende;
este procedimiento implicara comparar dos atributos: rentas y preferencias. La
comparacin de estos dos atributos para determinar si son independientes, se realiza
analizando la diferencia entre frecuencias observadas reales y frecuencias esperadas.

3.2.1Tablas De Contingencias:
Segn Mason et al. (2000:583). Tablas de contingencia consiste en: Si dos
caractersticas, como educacin e ingreso, se registran en clasificacin cruzada en
una tabla, el resultado se denomina Tabla de Contingencia. El valor estadstico de la
Prueba Chi Cuadrado, se aplica para determinar si las dos caractersticas estn
relacionadas.
En la tabla de contingencia para pruebas de independencia, las frecuencias de las
celdas son llamadas, Frecuencias Bidimensionales. En total la frecuencia de cada
hilera o cada columna es llamada, la Frecuencia Marginal.
Al probar una hiptesis se involucra una tabla de contingencia, primero se calcula las
correspondientes frecuencias esperadas o tericas de acuerdo con la hiptesis. La
suma de todas las frecuencias esperadas, debe ser igual a las sumas de todas las
frecuencias observadas.
Las tablas de contingencia, son usadas frecuentemente en pruebas de independencia.
Este tipo de pruebas nos dir si son o no independientes (o no relacionadas), las dos
bases de clasificacin usadas respectivamente, hileras y columnas.
Tambin son consideradas como una herramienta fundamental para este tipo de
anlisis; se caracterizan porque estn compuestas por filas (horizontales), para la
informacin de una variable y columnas (verticales), para la informacin de otra
variable. Estas filas y columnas delimitan celdas, donde se encuentran las frecuencias
de cada combinacin de las variables analizadas. En su expresin ms elemental, las
tablas tienen solo 2 filas y 2 columnas (tablas de 2x2).
Para realizar una Prueba de Independencia, se deben llevar a cabo una serie de
procedimientos que consisten en lo siguiente:
Plantear la hiptesis nula y la hiptesis alternativa.
Calcular las frecuencias esperadas, correspondientes a cada frecuencia
observada.
Calcular el valor de Chi Cuadrado.
Calcular el valor crtico de Chi Cuadrado.
Comparar el valor esperado con el valor crtico.
Conclusiones.