Vous êtes sur la page 1sur 21

Prueba Chi cuadrado

Mgr. Erbert Osco M.

Pruebas no paramtricas
No dependen de un tipo de distribucin, libres de distribucin
Son procedimientos estadsticos que pueden utilizarse para
contrastar hiptesis cuando no son posibles los supuestos
respecto a los parmetros o a las distribuciones poblacionales.

PRUEBAS
PARAMETRICAS
Supuesto de que la
poblacin
se
encuentra distribuido
uniformemente.

Distribucin chi cuadrado


Oi= frecuencia de eventos observados en
los datos muestrales
Ei= frecuencia eventos esperados (terica).
Si la hiptesis nula es correcta
K= Numero de categoras o clases

Existe una distribucin chi cuadrado para cada grado de libertad.


A medida que se incrementa el N de grados de libertad, la
distribucin chi cuadrado se vuelve menos sesgada.

Grados de libertad: Los grados


de libertad son una cantidad que
permite introducir una correccin
matemtica en los clculos
estadsticos para restricciones

1.- Para Una variable:


Bondad de ajuste:

Mtodo para medir si los datos resultantes de una


muestra provienen de una distribucin terica, o
pertenecen a cierta distribucin poblacional.

Es necesario que los valores de la variable de la


muestra este dividida en clases de ocurrencia o
equivalente. Hay que categorizar los datos
asignando sus valores a diferentes clases o grupos.

2.- Para dos variables:


2.1.- Homogeneidad de varias muestras cualitativas ,

comprueba si varias
muestras de carcter cualitativo proceden de la misma poblacin (ejm. Las tres muestras
de alumnos provienen de poblaciones con igual distribucin de aprobados). Es necesario
que las dos muestras a medir estn representadas en categoras con las cuales se
construye la tabla de contingencia.

2.2.- Independencia: comprobar si las dos caractersticas cualitativas estn


relacionadas entre si (color de ojos relacionados con cabello).
Cuando se quiere comprobar una variable en dos situaciones o poblaciones
diferentes, deseamos estudiar si existen diferencias en las dos poblaciones
respecto a la variable de estudio.

Ejemplo 1: Pruebas de bondad de ajuste


En cierta mquina Expendedora de Refrescos existen 4 canales que
expiden el mismo tipo de bebida.
Estamos interesados en averiguar si la eleccin de cualquiera de
estos canales se hace de forma aleatoria o por el contrario existe
algn tipo de preferencia en la seleccin de alguno de ellos por los
consumidores. La siguiente tabla muestra el nmero de bebidas
vendidas en cada uno de los 4 canales durante una semana.
Contrastar la hiptesis de que los canales son seleccionados al azar
a un nivel de significancia del 5%.
Can N de bebidas consumidas
al
mediante este expendedor
1

13

22

18

17

Solucin:

1. Calcular las frecuencias esperadas de cada suceso bajo la hiptesis


de uniformidad entre valores
2. Si la seleccin de canal fuera aleatoria, todos tendran la misma
probabilidad, por lo tanto la frecuencia esperada debera ser la
misma.
TABLAse
DEhan
CONTINGENCIA
Como
vendido 70 refrescos, la frecuencia esperada en c/canal
(foes:
fo
Canal
fo-fe
(fo-fe)2 fe)2/fe
Ei=
n * Pi =(bebidas)
70 * = fe
17.5
1
13
17.5
-4.5
20.3
1.2
2
22
17.5
4.5
20.3
1.2
3
18
17.5
0.5
0.3
0.0
4
17
17.5
-0.5
0.3
0.0
TOTAL
70
70.0
0.0
2.3

Bsqueda en la tabla de distribucin ji-cuadrado


Con los datos: alfa= 5%, y (M-1)= (4-1) = 3 grados de libertad

El valor obtenido para un valor de 5% y 3 grados de libertad es:


7.81

Tabla H. pagina 616

Conclusion: Puesto que el valor estadstico


calculado es menor que el valor critico, no
se rechaza la hiptesis. Es decir que los
canales son seleccionados aleatoriamente
entre los consumidores.

Ejemplo 2
Estamos interesados en comprobar la perfeccin de un dado cubico
(un dado normal de 6 caras. Para esto se realiza 100 lanzamientos del
dado anotando los puntos obtenidos en cada lanzamiento. A la vista de
los resultados obtenidos, podemos concluir que el dado no es
perfecto?. Nivel de significancia a 5%.

Puntuacin del
dado
1
2
3
4
5
6

fo

(N| veces q se
obtiene)

14
22
18
17
20
9

Solucin:
Hay que comprobar si la distribucin del dado es una distribucin uniforme, con
probabilidad de obtener cada una de las caras igual a 1/6.
Se puede calcular el numero esperado de resultados obtenidos en cada clase
multiplicando la probabilidad de obtener cada una de las caras (p= 1/6) por el
numero de lanzamiento (n=100)
fo=p (1/6) * Numero de lanzamientos (100)

Punt
dado
1
2
3
4
5
6

fo

(N|
veces)

14
22
18
17
20
9

P(X)
1/6
0.166
0.166
0.166
0.166
0.166
0.166

fe
16.6
16.6
16.6
16.6
16.6
16.6

Como se observa los valores


observados
y
esperados
no
coinciden. Por lo que parece existir
irregularidades en el dado.
Calculando
el
estadstico
chi
cuadrado

Punt
dado
1
2
3
4
5
6
TOTAL

fo

(N|
veces)

14
22
18
17
20
9
100

P(X)
1/6
0.166
0.166
0.166
0.166
0.166
0.166

fe
16.6
16.6
16.6
16.6
16.6
16.6
99.6

fo-fe
(fo-fe)2
-2.6
6.8
5.4
29.2
1.4
2.0
0.4
0.2
3.4
11.6
-7.6
57.8
0.4

(fofe)2/fe
0.41
1.76
0.12
0.01
0.70
3.48
6.47

Bsqueda en la tabla de distribucin


ji-cuadrado
Con los datos: alfa= 5%, y (6-1) = 5
grados de libertad

Conclusion:Puesto que el valor estadstico calculado es


menor que el valor critico, no se rechaza la hiptesis.
No se rechaza la distribucin uniforme para los posibles
resultados del dado.

2.1.- Prueba de homogeneidad


Para determinar si los datos correspondientes a dos o mas
muestras aleatorias provienen de las misma poblacin.
Se usara el estadstico:

Ejemplo 1 de Homogeneidad
Se esta interesado en
estudiar la fiabilidad de cierto componente
informtico con relacin al distribuidor que nos suministra. Para realizar
esto, tomamos una muestra de 100 componentes de cada uno de los tres
distribuidores que nos sirven el producto comprobando el numero de
defectuosos en cada lote. La siguiente tabla muestra el numero de
defectuosos en para cada uno de los distribuidores.

Compone
ntes
defectuos
os

Compone
ntes
correctos

Distribuidor
1

16

94

110

Distribuidor

24

76

100

o: No hay diferencias entre los distribuidores. Existe homogeneidad de los distrib


1: Hay diferencias entre los distribuidores. No existe Homogeneidad de los distr
No existe homogeneidad, por lo tanto
hay diferencias entre los tres
distribuciones

Solucin

Se debe realizar un contraste de homogeneidad para concluir


si entre los distribuidores existen diferencias de fiabilidad
referente al mismo componente.
Ei= 49/3 = 16.33
Ei= 251/3 = 83.66

Conclusin: El Valor estadstico Xt (5.99) es menor que x


calculado (8.96), No existe homogeneidad, por lo tanto hay
diferencias entre los tres distribuciones

Ejemplo 2 de homogeneidad
Se esta interesado en estudiar la relacin entre cierta enfermedad y
la adicin de tabaco. Para realizar esto se selecciona una muestra de
150 individuos, 100 individuos no fumadores y 50 fumadores. La
siguiente tabla muestra las frecuencias de enfermedad en cada
grupo (completar la tabla). Realizar un contraste de homogeneidad y
obtener las conclusiones sobre la relacin entre variables.

Para considerar este contraste como un contraste de homogeneidad se supone


que las fumadoras y no fumadoras constituyen dos poblaciones diferenciadas.
Este ejemplo podra plantearse como contraste de independencia.
Hiptesis: que las proporciones de enfermos en ambas poblaciones es la misma
Ho: No existe relacin entre la enfermedad y la adiccin al tabaco
H1: Existe relacin entre la enfermedad y la adiccin al tabaco

Resultados:
Enfermos
Canal
Fumad
No
Fumad
TOTAL

fo

(enf)

fe

12

12.0

25
37

12.5
24.5

(fofo-fe
(fo-fe)2
fe)2/fe
0.0
0.0
0.0
12.5
12.5

156.3

12.5
12.5

No
enfermos
Canal
Dist 1
Dist2
TOTAL

fo

(No enf)

88
25
113

fe
88.0
12.5
100.5

Chi calculado = 25

(fofo-fe
(fo-fe)2
fe)2/fe
0.0
0.0
0.0
12.5
156.3
12.5
12.5
12.5
Chi12+88=100
total
25.00
25+25= 50

(f-1)(c-1)=1 grado de libertad;

= 5%

Conclusin: Se rechaza Ho. El valor de Xt (3.84) < Xc (25); Por lo


que los fumadores tienen mayor propensin a padecer de
enfermedad.

2.2 Prueba de independencia


Para medir relaciones entre variables si realizar supuesto
adicionales sobre las distribuciones de estas.
Tambin aplicable a variables cuantitativas si no se verifican los
supuestos necesarios a satisfacer por otras tcnicas estadsticas.

Ejemplo1
La seorita keeto es la directora de invesitigacion de productos Chemical. Desea
Determinar si exsite alguna relacion entre la clasificacion de efectividad que los
consumidores asignan a un nuevo insecticida y el sitio (urbano o rural). De 100
consumidores 75 viven en zona urbana y 25 en zonas rurales.comparar el atributo B
(Ubicacin) con el atributo A (clasificacin del producto). Su hiptesis es:
Ho: la clasificacin y la ubicacin no tienen relacin (son independientes)
H1: la clasificacin y la ubicacin tienen relacin (no son independientes)
La ubicacin no tiene ningn impacto en la clasificacin de la efectividad, entonces
el porcentaje de residentes urbanos que clasifican el producto por encima del
promedio debera ser igual al % de residentes rurales que clasifican el producto
por encima del promedio. Este % a su vez debera ser igual al de todos los usuarios
que clasificaron el producto por encima del promedio.

CLASIFICACION

Canal
Por encima del
promedio
Promedio
Por debajo del
promedio

TOTAL

Canal
>x
x
<x
TOTAL

UBICACION
urbano
rural
fo
fo

total

20
40

11.0
8.0

31.0 %
48.0 %

15
75

6.0
25.0

21.0 %
100.0 %

fo urbano fe urbano
20
23.3
40
36.0
15
15.8
75
75.0
75 * 0.31=23.3

fo rural
11.0
8.0
6.0
25.0

75 ---100%
X ----- 31%

fe rural
7.75
12.0
5.25
25.0

x= 23.3

Grados de libertad :(f-1)(c-1)=(3-1)


(2-1)=2
Alfa= 10%
Segn tabla= 4.60

Conclusin:
- No se rechaza la Ho xc (3.76)
< xt (4.605). la clasificacin y la
ubicacin no tienen relacin
( son independientes)

Vous aimerez peut-être aussi