Vous êtes sur la page 1sur 20

APLICACIONES DE LA CHI-CUADRADO X2

1. TEST X2 PARA LA BONDAD Y AJUSTE

Se utiliza para probar si un conjunto de datos se distribuye conforme a una distribucin


terica conocida. La prueba de hiptesis es detectar si existen diferencias estadsticas
entre la frecuencia de datos observados y los esperados.

Las hiptesis a probar son las siguientes:

H0: f observada = f espera


H1: f observada f esperada

La frmula del estadstico de prueba:

( )2
2 = [ ]

1.1 Prueba de Bondad y ajuste con frecuencias homogneas

La prueba de bondad y ajuste es una especificacin al patrn de frecuencias esperado en


un conjunto de categoras. El patrn puede ajustarse a la suposicin de igual probabilidad
y por lo tanto puede ser uniforme u otros como Normal, Poisson y Binomial

Ejemplo 1.
Un distribuidor regional de sistemas de aire acondicionado ha subdivido la regin en
cuatro territorios. A un posible comprador de la distribuidora se le asegura que las ventas
de equipo estn distribuidas de manera aproximadamente igual en los cuatro territorios.
El comprador extrae de los archivos de la empresa una muestra aleatoria de 400 ventas
realizadas durante el ao pasado y encontr lo siguiente:

Tabla 1. Nmero de ventas de sistemas de aire acondicionado de acuerdo con el territorio

Territorios A B C D Total
Nmero de ventas en la muestra 60 120 140 80 400
Nmero de ventas esperado 100 100 100 100 400
Procedimiento en SPSS:

1. Ingresar datos en SPSS, una vez creada la variables territorios y ventas

2. Hacer clic en: DATOS/PONDERAR CASOS/PONDERAR CASOS MEDIANTE/ingresas la


variable VENTAS POR TERRITORIOS/ACEPTAR. En el visor de resultados aparece:
WEIGHT BY Ventas.
3. Luego ir a: ANALIZAR/PRUEBAS NO PARAMETRICAS/CUADRO DE DIALOGOS
ANTIGUO/CHI-CUADRADO

4. En el cuadro ingresar variable TERRITORIOS/ACEPTAR


5. Resultado

TERRITORIOS

N observado N esperada Residuo

A 60 100,0 -40,0
B 120 100,0 20,0
C 140 100,0 40,0
D 80 100,0 -20,0
Total 400

Estadsticos de prueba

TERRITORIOS

Chi-cuadrado 40,000a
gl 3
Sig. asinttica ,000

a. 0 casillas (0,0%) han esperado


frecuencias menores que 5. La
frecuencia mnima de casilla
esperada es 100,0.

6. Interpretacin

H0: El nmero de ventas se distribuye de manera uniforme entre los cuatro territorios
H1: El nmero de ventas no se distribuye de manera uniforme entre los cuatro territorios

Valor p < 0.01 ** La diferencia es altamente significativa, se rechaza H0 con 1-=99%


Valor p > 0.01 ^ <0.05 * La diferencia es significativa, se rechaza H0 con 1-=95%
Valor p > 0.05 NS La diferencia no es significativa, se acepta H0

El valor- p de significacin observado (0.00) es menor que = 0.01 y = 0.05, se decide


rechazar la H0 y aceptar la H1.

La probabilidad de significacin asinttica observada nos conduce a afirmar que el


nmero de ventas no se distribuye de manera uniforme entre los cuatro territorios

Conclusin: Se detecta que las mayores ventas de sistemas de aire acondicionado estn
en los territorios C y B seguidos de los territorios Dy A en ese orden respectivo.
1.2 Prueba de Bondad y Ajuste con frecuencias heterogneas

La prueba de bondad y ajuste tambin sirve para comparar si los datos observados siguen
un patrn histrico y no necesariamente una distribucin uniforme.

Ejemplo 2.

A lo largo del tiempo las ventas de un fabricante de televisiones han sido 40% de aparatos
de pantalla pequea (< 20 in), 40% de pantalla mediana (20 27 in) y 20% de pantalla
grande (>27 in). Con el fin de elaborar un programa de produccin para el mes siguiente,
se extrae una muestra aleatoria de 100 compras realizadas durante el actual periodo, y
encuentra que 55 de los aparatos comprados fueron pequeos, 35 fueron medianos y 10
fueron grandes

Tabla 2. Ventas observadas y esperadas de TV por tamao de pantalla

Tamao de Ventas
pantalla Observadas Esperadas
Pequea 55 40
Mediana 35 40
Grande 10 20
Total 100 100

Procedimiento en SPSS:

1. Ingrese los registros de venta al visor de datos de SPSS


2. Dar clic en: ANALIZAR/PRUEBAS NO PARMETRICAS/CUADRO DE DIALOGOS/CHI-
CUADRAD0.

3. Ingresar variable a lista de variables de prueba


4. En valores esperados seleccionar VALORES ingresar los patrones histricos en el
mismo orden en que fueron creados 1. Pequea (40), 2. Mediana (40), 3. Grande (20),
luego ACEPTAR

5. Resultado

Venta observada TV por tamao de pantalla

N observado N esperada Residuo

pequea 55 40,0 15,0


mediana 35 40,0 -5,0
grande 10 20,0 -10,0
Total 100

Estadsticos de prueba

Venta
observada TV
por tamao de
pantalla

Chi-cuadrado 11,250a
gl 2
Sig. asinttica ,004

a. 0 casillas (0,0%) han esperado


frecuencias menores que 5. La
frecuencia mnima de casilla
esperada es 20,0.
6. Interpretacin

Chi-cuadrado

H0: El patrn actual de ventas es igual al patrn histrico


H1: El patrn actual de ventas es diferente al patrn histrico

Valor p < 0.01 ** La diferencia es altamente significativa, se rechaza H0 con 1-=99%


Valor p > 0.01 ^ <0.05 * La diferencia es significativa, se rechaza H0 con 1-=95%
Valor p > 0.05 NS La diferencia no es significativa, se acepta H0

El valor de p o nivel crtico de significacin observado (0.004) es menor que = 0.01 y =


0.05, se decide rechazar la H0 y aceptar la H1.

La probabilidad de significacin asinttica observada nos conduce a afirmar que el patrn


de ventas actual difiere de forma altamente significativa del patrn histrico.

Conclusin: Las variaciones principales son que se venden ms aparatos pequeos y


menos aparatos grandes y se detecta una pequea disminucin en las ventas de los
aparatos medianos.
2. PRUEBA DE INDEPENDENCIA DE DOS VARIABLES CATEGRICAS

Para analizar la relacin de dependencia o independencia entre dos variables cualitativas


nominales o factores, es necesario estudiar su distribucin conjunta o tabla de
contingencia.

La tabla de contingencia es una tabla de doble entrada, donde en cada casilla figurar el
nmero de casos o individuos que poseen un nivel de uno de los factores o caractersticas
analizadas y otro nivel del otro factor analizado.

Se contrasta la hiptesis nula que presupone la independencia entre ambas variables,


mediante el estadstico X2 de Pearson.

H0: Las variables son Independientes (que los valores de una no cambian con los valores
de la otra variable
H1: Las variables son dependientes

Se define el estadstico observado:


Ejemplo 3.

Se analiz el nivel de aceptacin de un sistema de servicio de atencin a clientes de una


empresa. Los clientes se estratificaron de acuerdo a su nivel de ingresos. Los resultados
de la encuesta se presentan a continuacin:

OPINION DEL SISTEMA


NIVEL DE INGRESO Bueno Regular Malo Total
Bajo 31 34 26 91
Medio 23 39 26 88
Alto 23 31 27 81
Muy alto 29 17 24 70
Total 106 121 103 330

Procedimiento en SPSS:

1. Ingrese los resultados de la encuesta al visor de datos de SPSS

2. Dar clic en: ANALIZAR/ESTADISTICOS DESCRIPTIVOS/TABLASCRUZADAS


3. Ingresar las variables en filas y columnas y seleccionar: ESTADISTICOS/CHICUADRADO.
Luego seleccionar: CASILLAS/OBSERVADO-ESPERADO/ACEPTAR

4. Resultado

Resumen de procesamiento de casos

Casos

Vlidos Perdidos Total

N Porcentaje N Porcentaje N Porcentaje

NIVEL DE INGRESOS *
OPINION SOBRE EL 330 100,0% 0 0,0% 330 100,0%
SISTEMA

Tabla cruzada NIVEL DE INGRESOS*OPINION SOBRE EL SISTEMA

OPINION SOBRE EL SISTEMA

Bueno Regular Malo Total

NIVEL DE INGRESOS Bajo Recuento 31 34 26 91


Recuento esperado 29,2 33,4 28,4 91,0
Medio Recuento 23 39 26 88

Recuento esperado 28,3 32,3 27,5 88,0

Alto Recuento 23 31 27 81

Recuento esperado 26,0 29,7 25,3 81,0

Muy alto Recuento 29 17 24 70

Recuento esperado 22,5 25,7 21,8 70,0


Total Recuento 106 121 103 330

Recuento esperado 106,0 121,0 103,0 330,0

Pruebas de chi-cuadrado

Significacin
asinttica
Valor gl (bilateral)

Chi-cuadrado de Pearson 8,337a 6 ,214


Razn de verosimilitud 8,565 6 ,200
Asociacin lineal por lineal ,000 1 ,991
N de casos vlidos 330

a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento


mnimo esperado es 21,85.

5. Interpretacin
Chi-cuadrado

H0: Las variables son Independientes


H1: Las variables son dependientes

Valor p < 0.01 ** La diferencia es altamente significativa, se rechaza H0 con 1-=99%


Valor p > 0.01 ^ <0.05 * La diferencia es significativa, se rechaza H0 con 1-=95%
Valor p > 0.05 NS La diferencia no es significativa, se acepta H0

El valor de p o nivel crtico de significacin observado (0.214) es mayor que = 0.05, se


decide aceptar la H0.

La razn de verosimilitudes (RV) est asociada a una probabilidad de significacin


asinttica, en este caso el valor de p (0.200) es menor = 0.05, conduce a rechazar la
hiptesis nula, concluyendo que no existe dependencia entre las variables analizadas.

Los estadsticos X2 y RV llevan a la misma conclusin, en caso contrario, se elige el


estadstico con menor significacin asinttica.
Conclusin: No existe una relacin de dependencia entre el nivel de ingresos y la opinin
sobre la aceptacin del sistema atencin al cliente.

Ejercicio 4.

Tres mtodos de empaquetado de tomates fueron probados durante un perodo de


cuatro meses; se hizo un recuento del nmero de kilos por 1000 que llegaron
estropeados, obtenindose la tabla adjunta. Con un nivel de significacin de 0,05, tienen
los tres mtodos la misma eficacia?

Tipo de empaquetado
Meses A B C
1 6 10 10
2 8 12 12
3 8 8 14
4 9 14 15

Procedimiento en SPSS:

1. Ingresar datos
2. Ponderar por la frecuencia. DATOS/PONDERAR CASOS, ingresar
FRECUENCIA/ACEPTAR

3. Crear tabla de contingencia/ESTADISTICOS chi-cuadrado/ CASILLAS valor esperado/


ACEPTAR
4. Resultados
a. Chi-cuadrado

Tabla cruzada Meses*Tipo de empaquetado

Tipo de empaquetado

A B C Total

Meses 1er. mes Recuento 6 10 10 26

Recuento esperado 6,3 9,0 10,6 26,0

2do. mes Recuento 8 12 12 32

Recuento esperado 7,8 11,1 13,1 32,0

3er. mes Recuento 8 8 14 30

Recuento esperado 7,3 10,4 12,3 30,0

4to. mes Recuento 9 14 16 39

Recuento esperado 9,5 13,5 16,0 39,0


Total Recuento 31 44 52 127

Recuento esperado 31,0 44,0 52,0 127,0

Pruebas de chi-cuadrado

Significacin
asinttica
Valor gl (bilateral)

Chi-cuadrado de Pearson 1,240a 6 ,975


Razn de verosimilitud 1,274 6 ,973
Asociacin lineal por lineal ,059 1 ,808
N de casos vlidos 127

a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento


mnimo esperado es 6,35.

INTERPRETACION:

H0: Los mtodos de empaquetado tienen la misma eficiencia


H1: Los mtodos de empaquetado no tienen la misma eficiencia

Valor p < 0.01 ** La diferencia es altamente significativa, se rechaza H0 (1-=0.99)


Valor p > 0.01 ^ <0.05 * La diferencia es significativa, se rechaza H0 (1-= 0.95)
Valor p > 0.05 NS La diferencia no es significativa, se acepta H0
X2 tiene un valor-p = 0.975 > 0.05, se acepta Ho. Por lo tanto los mtodos de
empaquetado tienen la misma eficiencia.

RV con un valor-p = 0.973 > 0.05, conduce aceptar Ho, llegando a la misma conclusin
que X2.

Para medir si estn relacionados se plantea las hiptesis.

H0: Meses y mtodos de empacado no estn relacionados (Independencia)


H1: Meses y mtodos de empacado estn relacionados (Dependencia)

El valor de los coeficientes aparece acompaado de su correspondiente nivel crtico (Sig.


aproximada), puesto que el nivel crtico de todas las medidas listadas es grande (> 0,05)
se acepta la hiptesis nula de independencia, concluyendo que los meses y el mtodo de
empaquetado no estn relacionados.
3. PRUEBA DE HOMOGENIDAD

Esta prueba se realiza cuando se quiere demostrar que dos o ms muestras proceden de
la misma poblacin, o dos o ms poblaciones tienen la misma distribucin. Se dice que
dos o ms poblaciones tienen la misma distribucin cuando sus respectivas proporciones
poblacionales son similares u homogneas.

2
2
( )
=

=1 =1

Donde:
F = nmero de filas
C = nmero de columnas
Oij = Frecuencia observada correspondiente a la i-sima fila y j-sima columna
Eij = Frecuencia esperada correspondiente a la i-sima fila y j-sima columna


Siendo: =

Las hiptesis a probar son:

H0: Todas las muestras proceden de la misma poblacin


H1: Todas las muestras proceden de la misma poblacin

Ejercicio 5.

En un experimento un psiclogo selecciona tres palabras y decide evaluar su componente


emocional en una muestra aleatoria. Presenta, independientemente, cada palabra a 100
sujetos y registra si la palabra es percibida como emocionalmente positiva, negativa o
neutra. A la vista de los resultados, Podr el psiclogo considerar que las tres palabras
tienen el mismo componente emocional?

Componente Palabras
emocional de la
palabra 1 2 3
Positivo 26 45 32
Negativo 32 27 38
Neutro 42 28 30
100 100 100
Procedimiento en SPSS:

1. Ingrese datos

2. Ponderar frecuencia: DATOS/PONDERAR CASOS / ACEPTAR


3. ANALIZAR/ESTADISTICOS DESCRIPTIVOS/TABLAS CRUZADAS/INGRESAR VARIABLES
CUALITATIVAS

4. ESTADISTICOS Chi-cuadrado/ CASILLA valor esperado/ ACEPTAR


5. RESULTADO

Tabla cruzada Emocin que experimenta*Tipo de palabra

Tipo de palabra

Palabra 1 Palabra 2 Palabra 3 Total

Emocin que experimenta Positivo Recuento 26 45 32 103

Recuento esperado 34,3 34,3 34,3 103,0

Negativo Recuento 32 27 38 97

Recuento esperado 32,3 32,3 32,3 97,0

Neutro Recuento 42 28 30 100

Recuento esperado 33,3 33,3 33,3 100,0


Total Recuento 100 100 100 300

Recuento esperado 100,0 100,0 100,0 300,0

Pruebas de chi-cuadrado

Significacin
asinttica
Valor gl (bilateral)

Chi-cuadrado de Pearson 10,811a 4 ,029


Razn de verosimilitud 10,591 4 ,032
Asociacin lineal por lineal 2,386 1 ,122
N de casos vlidos 300

a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento


mnimo esperado es 32,33.

6. INTERPRETACION

H0: Las tres palabras tienen idntica distribucin de componente emocional;


H1: La distribucin de componente emocional de alguna palabra es diferente .

X2 tiene un valor-p = 0.029 < 0.05, se rechaza Ho. Por lo tanto el componente emocional no se
distribuye homogneamente en las diferentes palabras

RV con un valor-p = 0.032 < 0.05, conduce rechazar Ho, llegando a la misma conclusin que X2.

Vous aimerez peut-être aussi