Vous êtes sur la page 1sur 42

Unidad 3

Sesin presencial 3.2

Aplicaciones de la
chi cuadrado.

Estadstica Inferencial

Motivacin
Si un joven recin egresado le
ofrecieran un prstamo Para qu
lo utilizara?

Si una persona de mayor edad le


ofrecieran un prstamo Para qu
lo utilizara?

ESTN
RELACIONADOS?

EDAD DEL
CLIENTE

MOTIVO
DEL
PRSTAMO

MOTIVACIN
Si una mujer tuviera acceso a un prstamo
personal, que le interesara comprar?
Si un hombre tuviera acceso a un
prstamo personal, que le interesara
comprar?

Tendrn las mismas prioridades?

Distribucin del motivo del prestamos


de las mujeres

Distribucin del motivo del


prestamos de los hombres

Homognea
(=)
o
No homognea
()

La distribucin del motivo del prstamo es


diferente para el grupo de mujeres y
hombres?

Logros
Al terminar la sesin, ser capaz de
Determinar si dos variables categricas estn relacionadas.
Verificar si una variable categrica se distribuye
homogneamente en dos o ms subpoblaciones.
Diferenciar entre una prueba de independencia y una de
homogeneidad de subpoblaciones.
Entender que es un valor esperado y la esencia de las
aplicaciones de la chi-cuadrado.
Tomar decisiones en el mbito de su especialidad sobre la
independencia de dos variables categricas.
Tomar decisiones en el mbito de su especialidad sobre la
homogeneidad de dos o ms distribuciones categricas.

USOS DE LA DISTRIBUCION CHI


CUADRADO
Permite comparar frecuencias observadas
(obtenidas de la muestra) con frecuencias
esperadas (valores tericos) segn un modelo
supuesto.
Esta caracterstica de la distribucin Chi-cuadrado
permite efectuar las siguientes pruebas:
1.Prueba de independencia.
2.Prueba de homogeneidad de subpoblaciones.
3.Pruebas de bondad de ajuste a una distribucin
de probabilidades.

PRUEBA DE INDEPENDENCIA
Esta prueba permite evaluar si dos variables
categricas estn relacionadas.
El director de mercadotecnia de un diario
de la capital se pregunta: Est
relacionado el sector donde vive el lector
y la parte del peridico que lee primero?

PRUEBA

DE

INDEPENDENCIA

Relacionada con dos variables categricas.


Una muestra de n elementos, donde cada
uno de ellos es clasificado segn dos
criterios diferentes.
El inters es saber si los dos criterios de
clasificacin estn estadsticamente
relacionados.
Cada uno de los criterios tiene diferentes
niveles, digamos r niveles para el primer
criterio y c niveles para el segundo criterio.

Hiptesis:
H0: Las variables son independientes (No
estn relacionadas)
H1: Las variables no son independientes
(estn relacionadas)

Estadstica de prueba:
r
c (O E ) 2
ij
ij
2
2

[( c 1)*( r 1)]
Eij
i 1 j 1
10

Regla de decisin:
Rechazar Ho si:

1-
2
crit

2
cal

[1 ; ( r 1) ( c 1)]

Ejemplo 1
Un criminalista realiz una investigacin para
determinar si la incidencia de ciertos tipos de
crmenes varan de una parte a otra en una
ciudad grande. Los crmenes particulares de inters
son: asalto, robo, hurto y homicidio. La siguiente tabla
muestra el nmero de delitos cometidos en tres reas
de la ciudad durante el ao pasado:

SOLUCION:
1. Hiptesis:
H0: El tipo de crimen que se comete en una ciudad es
independiente del sector donde ocurre el crimen.
No hay relacin entre el tipo de crimen que se comete en
una ciudad y el sector donde ocurre el crimen.
H1: El tipo de crimen que se comete en una ciudad No es
independiente del sector donde ocurre el crimen.
Hay relacin entre el tipo de crimen que se comete en
una ciudad y el sector donde ocurre el crimen.

2. Nivel de significacin =0,01


3. Estadstica de prueba:
k

i 1

oi ei
ei

~ (2 ) ; r 1 c 1 g .l.

4. Regin crtica y criterios de decisin:


Distribucin Chi cuadrado con 6 g.l.

0,01
16,8

Si Chi cal >16,8 se rechaza la hiptesis


nula.

5. Procedimiento:
Clculo de los valores esperados
D-I

D-II

D-III

Total

Asalto

162

171.1

310

348.9

258

210.0

730

Robo

118

118.9

196

242.3

193

145.8

507

Hurto

451

446.6

996

910.5

458

547.9

1905

15.2

53

Homicidio

18

Total

749

12.4

25
1527

25.3

Por

10

919

3195

Entre

Clculo del valor de la estadstica de prueba

Total de obs.

Total de esp.

2cal

6. Decisin
conclusin

estadstica

Rechazar Ho
Conclusin: Con un nivel de
significacin del 1% se puede
afirmar que el tipo de crimen que
se comete en una ciudad no es
independiente del sector donde
ocurre el crimen. Esto es, existe
relacin entre el tipo de crimen y
el sector donde ocurre ste.

Prueba de homogeneidad de
poblaciones

sub

Se desea verificar si la distribucin de


los sujetos de la poblacin (variable
categrica) es la misma en todas las k
sub-poblaicones.
Se tienen k muestras independientes
tomadas de cada una de las k
poblaciones, el tamao de las muestras
no son necesariamente iguales.
La variable de inters tiene r niveles.
19

Prueba de homogeneidad de
subpoblaciones
La distribucin de las personas que estn a
favor o en contra del alcalde de Lima es la
misma en los tres distritos ?

Aceptacin del
candidato

Variable categrica

A favor
En contra

Poblaciones

Distritos

De cada distrito se selecciona una muestra

La Molina

La Victoria

San Isidro

Hiptesis
H0: La distribucin de los sujetos de la
poblacin (variable categrica) es
homognea en las k subpoblaciones.

Estadstica de prueba
r

(Oij Eij )

i 1 j 1

Si

2
cal

Eij
2
tab

( r 1) ( k 1)

se rechaza H0
22

Ejemplo
De acuerdo con un estudio de la Universidad Johns
Hopkins publicado en el American Journal of Public
Health, las viudas viven ms que los viudos.
Considere los siguientes datos de sobrevivencia de
100 viudas y 100 viudos despus de la muerte del
cnyuge:

Se puede concluir con un nivel de significacin de


0,05 que la distribucin de la los aos que
sobreviven a sus parejas las viudas y los viudos
no son similares?

Solucin
1. Planteamiento de hiptesis
Ho: La distribucin de los aos que sobreviven a sus
parejas las viudas y los viudos son similares.
H1: La distribucin de los aos que sobreviven a sus
parejas las viudas y los viudos no son similares.

2. Nivel de significacin =0,05


3. Estadstica de prueba:
k

i 1

oi ei
ei

~ ; r 1 c 1 g .l.
2
( )

4. Regin crtica y criterios de decisin:


Distribucin Chi cuadrado con 2 g.l.

0,05
5,99

Si Chi cal >5,99 se rechaza la hiptesis nula.

2cal

6. Decisin
conclusin

estadstica

No Rechazar Ho
Conclusin: Con nivel de
significacin del 0,05, podemos
decir que la distribucin de la los
aos que sobreviven las viudas
y los viudos a sus parejas son
similares.

Problema de Aplicacin

En un estudio de los sistemas lectores de cajas registradoras, se usaron muestras de


compras para comparar los precios ledos con los precios anunciados. En la tabla
adjunta se resumen los resultados para una muestra de 819 artculos. Cuando las
tiendas usan lectores para registrar las compras, las tasas de error son las mismas
para los artculos a precio normal y los artculos en oferta?Cmo podra cambiar la
conducta de los consumidores si creen que ocurre un nmero desproporcionado de
cobros de ms con los artculos en oferta? Use un nivel de significacin del 6%

Cobro de
menos
Cobro de
ms
Precio
correcto

Artculos
normales
20

Artculos en
oferta
7

15

29

384

364

Estadstica Inferencial

28

Evaluacin
La llegada al pas de bancos con capitales
slidos ha originado una mayor competencia y
por ende una mayor oferta de servicios. En su
afn por consolidar su participacin en el
mercado, los bancos vienen ofertando
novedosos tipos de ahorro y ofreciendo
diferentes tipos de crditos. Por lo tanto se ha
realizado un estudio para analizar esta
problemtica.

Evaluacin

1. Si se considera que se ha seleccionado una muestra aleatoria de


325 clientes. Presente las hiptesis relevantes en este estudio y
su tabla de contingencia correspondiente.
2. Se realiz un muestreo estratificado segn grupo de edad y se
seleccion una muestra de 77 personas con una edad Menor de
30 aos, 93 personas con una edad entre 30 y 40 aos, y 155
personas mayores de 40 aos. Presente las hiptesis relevantes
en este estudio y su tabla de contingencia correspondiente.

Unidad 3
Sesin presencial 3.2

Pruebas de bondad
de ajuste:
Distribucin de
Poisson.

Estadstica Inferencial

Logros
Al finalizar la sesin el estudiante ser capaz de:

Identificar, dentro del contexto del problema, a qu


distribucin terica podra ajustarse la variable en
estudio.
Realizar pruebas de hiptesis para verificar si la
variable de su mbito profesional que est analizando
sigue el comportamiento de una distribucin terica
conocida: Multinomial, uniforme o Poisson.
Identificar qu parmetro es necesario estimar en
una distribucin de Poisson

Participacin en el mercado
A lo largo de los aos las
participaciones en el mercado se
han estabilizado en 30% para la
empresa A, 50% para la B y 20%
para la empresa C. Recientemente
la empresa C ha elaborado un
nuevo y mejorado producto para
sustituir a uno de sus productos en
el mercado. Este nuevo producto
modificara su participacin en
el mercado? Cmo podramos
responder a esta pregunta?

Motivacin
Situacin
El gerente de un banco est muy ocupado
para revisar los email que le llegan pero es
de inters los email de clientes VIP.
Cada 30 min cuenta el nmero de email de clientes VIP
que le llegan a su computador.

Cul es la distribucin del nmero de clientes VIP que


llegan a su computador cada 30 min?

Estadstica Inferencial

34

Cmo modelar
probabilsticamente el nmero de
email VIP que llegan cada 30
De los email que le llegaron durante
la ltima
min
? semana, registra la
cantidad de email que llegaron en 100 de 30 minutos cada uno.

Cul es la tasa promedio de


llegada de email VIP en 30 mim?
Estadstica Inferencial

35

Hiptesis
En todos estos casos necesitamos de las
repeticiones de experimentos, que nos darn
los valores observados, para luego
compararlos con los valores esperados o
tericos que indican la distribucin propuesta.
H0:Los datos muestrales provienen de una
distribucin especificada (Poisson, Uniforme,
Multinomial)
H1:Los datos muestrales no provienen de una
distribucin especificada (Poisson, Uniforme,
Multinomial)

Estadstica de prueba

0 1

Regin de Rechazo y No Rechazo de la Ho


Decisin estadstica:

Rechazar Ho si 2cal > 2


No Rechazar Ho si 2cal 2

Ejemplo
Para establecer cuotas de ventas el gerente de
marketing supone que en las cuatro sucursales, el
potencial de ventas es el mismo. A continuacin se
presenta una muestra de 200 ventas. debe
rechazarse la suposicin
del gerente? Use =0,05
Sucursal
I

II

III

IV

60

45

59

36

a.La hiptesis nula es: _______________________


b.EL valor crtico de Chi cuadrado es: ___________
c.Dado que: Chi calculado es 8,0 cul es tu
conclusin?

Ejemplo de Aplicacin 1
Suponga que los investigadores desean determinar si el patrn de distribucin del ingreso
familiar en el Per, ha cambiado significativamente durante los ltimos cinco aos. Se
sabe que hace cinco aos la distribucin del ingreso familiar para las distintas clases de
ingreso era la siguiente:
Clase
1
2
3
4
5
6
7

Clase de Ingreso ($)

% de todas las
familias en la
clase

< 3000
[ 3000 - 5000[
[ 5000 - 7000[
[ 7000 - 10000[
[10000 - 15000[
[ 15000 -25000[
> 25000

TOTAL

9
11
12
22
27
15
4
100

Se elige una muestra aleatoria de 1000 familias y se obtiene la siguiente


distribucin:
Clase de Ingreso
1
2
3
4
5
6
7
($)
Nmero de
Con
= 0,05, el patrn
de distribucin
del ingreso
familiar es
70 actual
100 110
200 300 170
50
familias

significativamente distinto al de hace cinco aos?

Estadstica Inferencial

39

Bondad de ajuste:
Distribucin Poisson
Hiptesis:
H0: La variable en estudio tiene distribucin de
Poisson.
H1: La variable en estudio no tiene distribucin
k o e 2
de Poisson.
Estadstico
de prueba:
c2 i i ~ 2k 1 m
ei
i 1

o x

i i

ei n pi

Criterio de rechazo: c2 2 , k 1 m

Ejemplo
Suponga que X: el nmero de llamadas
telefnicas que entran al conmutador de una
empresa durante intervalos de un minuto
tiene una distribucin de Poisson. Use un nivel
de significacin del 10% y los siguientes datos
para probar la hiptesis de que las llamadas
que entran tienen una distribucin de Poisson.
X
Nmero de
intervalos de un
min

15

31

20

15

13

Ejemplo de Aplicacin 2

Segn un reporte publicado el ltimo ao, el nmero de fallas por auto


reportadas por el servicio de mantenimiento se encuentra distribuido segn
la siguiente tabla:
Nmero
de fallas

Nmero de
autos

10

25

65

80

180

210

Identifique la distribucin de probabilidades para la variable nmero de


fallas, luego pruebe que la variable sigue esa distribucin. Use un nivel
de significacin del 2%.

Estadstica Inferencial

42

Vous aimerez peut-être aussi