Académique Documents
Professionnel Documents
Culture Documents
Estadı́stica II
NELSON CUBI
DIEGO PORTILLA
DANIELA TONATO
ALEX SALAZAR
GALO CANCHIGNIA
JEFFERSON PALOMO
NRC: 2766
24/01/2019
1
1. Las siguientes son las frecuencias que se observaron de cuatro categorı́as: 5, 6, 8 y
13. Suponga que queremos utilizar un nivel de significancia de 0.05 para probar la
aseveración de que las cuatro categorı́as son todas igualmente probables.
a) ¿Cúal es la hipótesis nula?
b) ¿Cúal es la frecuencia que se espera para cada una de las cinco categorı́as?
c) ¿Cúal es el valor del estadı́stico de prueba?
d) ¿Cual es el valor crı́tico?
e) ¿Qué concluye acerca de la aseveración que se plantea
b) α = 0,05
F.O 5 6 8 13
F.E 8 8 8 8
Sumatoria F.O = 32
Sumatoria F.E = 32
X 2 = 4,75
α = 0,05
Xc2 = gradosdelibertad = 3
numerodecolas = 1
Xc2 = 7,815
e) Conclusión
Como X 2 = 4,75 < Xc2 = 7,815 podemos decir que no rechazo Ho, no existe suficiente evidencia
estadı́stica para hacerlo, por lo tanto las frecuencias observadas y esperadas son iguales
3. Prueba para categorı́as con proporciones diferentes. Las siguientes son las frecuen-
cias que se observan para cinco categorı́as: 9, 8,13, 14, 6. Suponga que queremos
utilizar un nivel de significancia de 0.05 para probar la aseveración de que las cinco
categorı́as tienen proporciones de 0.2, 0.2, 0.2, 0.3 y 0.1, respectivamente.
a) ¿Cúal es la hipótesis nula?
b) ¿Cúal es la frecuencia que se espera para cada una de las cinco categorı́as?
c) ¿Cúal es el valor del estadı́stico de prueba?
d) ¿Cual es el valor crı́tico?
e) ¿Qué concluye acerca de la aseveración que se plantea
2
a) H0 :Las frecuencias observadas y esperadas no son iguales
b) α = 0,05
F.O 9 8 13 14 6
Probabilidad 0.2 0.2 0.2 0.3 0.1
F.E 10 10 10 15 5
Sumatoria F.O = 50
Sumatoria F.E = 50
Probabilidad = 1.0
X 2 = 1,67
α = 0,05
Xc2 = gradosdelibertad = 4
numerodecolas = 1
Xc2 = 9,488
e) Conclusión
Como X 2 = 1,67 < Xc2 = 9,488 podemos decir que no rechazo Ho, no existe suficiente evidencia
estadı́stica para hacerlo, por lo tanto las frecuencias observadas y esperadas no son iguales
Dı́gito 0 1 2 3 4 5 6 7 8 9
F.O 8 8 12 11 10 8 9 8 12 14
F.E 10 10 10 10 10 10 10 10 10 10
b) α = 0,05
3
c) Cálculo del Estadı́stico de Prueba.
P (F.O−F.E)2
X2 = F.E = 4.2
X 2 = 4,2
α = 0,05
Xc2 = gradosdelibertad = 9
numerodecolas = 1
Xc2 = 16,919
e) Conclusión
Como X 2 = 4,2 < Xc2 = 16,919 podemos decir que no rechazo Ho, no existe suficiente evidencia
estadı́stica para hacerlo, por lo tanto los dı́gitos se distribuyen de manera uniforme, la aseveración
es correcta
5 Dado cargado. El autor taladró un hoyo en un dado y lo rellenó con plomo, luego procedió a
lanzarlo 200 veces. Las siguientes son las frecuencias que se obsevaron para los resultados de 1,
2, 3, 4, 5 y 6, respectivamente: 27, 31, 42, 28 y 32. Utilice un nivel de significancia de 0.05 para
probar la aseveración de que los resultados no son igualmente probables. ¿Parece que el dado
cargado se comparta de forma diferente a un dado balanceado?
Solución:
II) α = 0,05
P (F o−F e)2
III) χ2observ = Fe = 5,86
V) No rechazo H0
Conclusión: Las frecuencias observadas y esperadas no tienen diferencia, por lo tanto el dado
no importa si el dado es cargado o no.
4
semana, como viernes o sabado. se selecciona aleatoriamente una muestra de muertes en vehiculos
de motor en Montana en un año reciente. El nümero de decesos para los diferentes dı́as de la
semana se lista en la tabla adjunta. con un nivel de significancia de 0.05, pruebe la aseveracion
de que los accidentes ocurren con igual frecuencia en los diferentes dı́as.
Solución:
II) α = 0,05
P (F o−F e)2
III) χ2observ = Fe = 9,23
V) No rechazo H0
Conclusión: Los accidentes ocurren con igual frecuencia independientemente del dı́a
II) α = 0,05
P (F o−F e)2
III) χ2observ = Fe = 10,65
5
V) Rechazo la H0 y acepto la HI
Conclusión: Los accidentes ocurren con igual frecuencia independientemente del dı́a.
Factores:
Cambio de personal
Turno del dı́a o noche
Cantidad de trabajo en la semana.
Digito Lider 1 2 3 4 5 6 7 8 9
Frecuencia 72 23 26 20 21 18 8 8 4
RESOLUCION
La ley de Benford estipula lo siguiente
Digito Lider 1 2 3 4 5 6 7 8 9
Probabilidad 30,1 17,6 12,5 9,7 7,9 6,7 5,8 5,1 4,6
Por lo tanto
Digito Lider Frecuencia observada Frecuencia esperada (F o − F e)2 /F e
1 72 60,2 2,313
2 23 35,2 4,228
3 26 25 0,04
4 20 19,4 0,019
5 21 15,8 1,711
6 18 13,4 1,579
7 8 11,6 1,117
8 8 10,2 0,474
9 4 9,2 2,939
P (F o−F e)2
Fe = 14, 42
1)Pruebas de Hipotesis
2)α = 0, 05
P (F o−F e)2
3)χ2 = Fe = 14, 42
5)
χ2critico > χ2
Por tanto χ2 cae dentro de la zona de aceptacion. No tengo evidencia suficiente para rechazar la
hipotesis nula, por lo tanto los datos cumplen con la ley de Benford.
6
2. Tablas de contingencia: independencia y homogeneidad
2.1. ¿Existe discriminacion racial?
La discriminacion racial es la practica controversial de señalar que alguien tiene una conducta
criminal con base en su raza,nacion de origen o grupo etnico.La tabla adjunta resume resultados de
condutores que se seleccionaron al azar y que detuvo la policia en un año reciente(segun datos del
Departamento de Justicia de Estados Unidos, Bureau of Justice Statistics).Utilice un nivel de signifi-
cancia de 0,05 para provar la aseveracion de que el hecho de que se detenga a alguein es independiente
de la raza y del grupo etnico.Con base en la evidencia disponible,¿concluiriamos que hay discrimina-
cion racial?
1)Pruebas de Hipotesis
2)α = 0, 05
P (F o−F e)2
3)χ2 = Fe = 0, 412
5)
χ2critico > χ2
Por tanto χ2 cae dentro de la zona de aceptacion. No tengo evidencia suficiente para rechazar la
hipotesis nula, por lo tanto las detenciones son independientes de la raza.
7
2.2. Correo electronico y privacidad
Se pregunto a trabajadores y a jefes de alto nivel si era poco etico vigilar el correo electronico de
los empleados;los resultados se resumen en la tabla(segun una encuesta de Gallup).Utilice un nivel
de significancia de 0,05 para provar la aseveracion de que la respuesta es independiente del hecho de
que el sujeto sea un trabajador o un jefe de alto nivel.¿Cambia la conclusion si se emplea un nivel de
significancia en lugar?
Si No
Trabajadores 192 244
Jefes 40 81
RESOLUCION
Frecuencia observada
Si No Total
Trabajadores 192 244 436
Jefes 40 81 121
Total 232 325 557
Frecuencia esperada
Si No Total
Trabajadores 181,6 254,4 436
Jefes 50,4 70,6 121
Total 232 325 557
(F o−F e)2
Fe
Si No
Trabajadores 0,596 0,425
Jefes 2,146 1,532
P (F o−F e)2
Fe = 4, 699
1)Pruebas de Hipotesis
2)α = 0, 05
P (F o−F e)2
3)χ2 = Fe = 4, 699
5)
χ2critico < χ2
Por tanto χ2 cae fuera de la zona de aceptacion. No tengo evidencia suficiente para aceptar la hipotesis
nula, por lo tanto acepto la hipotesis alternativa.La respuesta es dependiente del cargo ocupado.
8
H0 :Las variables respuesta y cargo son independientes.
H1 :Los variables respuesta y cargo son dependientes.
2)α = 0, 01
P (F o−F e)2
3)χ2 = Fe = 4, 699
5)
χ2critico > χ2
Por tanto χ2 cae dentro de la zona de aceptacion. No tengo evidencia suficiente para rechazar la hi-
potesis nula.La respuesta es independiente del cargo ocupado.
Ejercicio 5
La tabla 10-7 resume datos de sujetos hombres que se encuestaron y la tabla adjunta resume
datos de una muestra de mujeres. Utilice un nivel de significancia de 0.01 y suponga que los
tamaños muestrales de 800 hombres y 400 mujeres están predeterminados, y pruebe la asevera-
ción de que las proporciones de las respuestas de acuerdo al desacuerdo son las mismas para los
sujetos que entrevistaron hombres y los sujetos que entrevistaron mujeres.
IFrec Obs
(F O−F E)2
Aplico FE
Hombre Mujer
Acuerdo 5.031 10.06
Desacuerdo 12.12 24.24
9
Ejercicio 7
El Marist Institute for Public Opinión realizo una encuesta entre 1014 adultos, 45 % de los cuales
eran hombres. Los resultados de encuesta muestran que el 12 % de los hombres y el 33 % de las
mujeres temen volar. Después de construir una tabla de contingencia que resuma los datos en
forma de conteos de frecuencias, utilice un nivel de significacia del 0.05 para probar la asevera-
ción de que el genero es independiente del temor a volar.
Datos
n=1014
48 % H
Hombre Mujer
Miedo a volar 111.56 120.85
No miedo a volar 375.16 406.43
Hombre Mujer
Miedo a volar 25.32 23.37
No miedo a volar 7.53 6.95
10
Ejercicio 15
La tabla adjunta lista resultados de encuesta que se detuvieron de una muestra aleatoria de
victimas de diferentes crı́menes. Con un nivel de significancia de 0.05, pruebe la aseveración de
que el tipo de crimen es independiente del hecho de que el criminal sea un extraño.Como afec-
tarı́an los resultados la estrategia que los oficiales de policı́a utilizan cuando investigan crı́menes?
(F O−F E)2
Aplico FE
11
3. Ejercicio 9
Repita el ejercicio 8 despues de incluir los datos adicionales que se muestran en la tabla
RESOLUCION
Frecuencia Observada
Frecuencia Esperada
X2
P (F O − F E)2
= X2
FE
X 2 = 3,06
12
Prueba de Hipotesis
H0 : variablessonindependientes
H1 : variablessondependientes
Establecer el nivel de significancia.
∝= 0,05
Determinar X 2
X 2 = 3,06
Determinar Xc2
∝= 0,05
Xc2 = 5,991
Conclusion
No se rechaza H0 por lo tanto las variables son independientes y no tienen relacion tipo de nicotina
con sujetos de estudio (fuman o no fuman )
4. Ejercicio 11
Utilice los datos de la tabla para aprobar la aseveración de que la ocupación es independiente de
que la causa de muerte sea un homicidio.La tabla se basa en datos del Departamento de Trabajo de
Estados Unidos.¿Parece que alguna ocupacion en particular sea propensa a homicidios?.
RESOLUCION
Frecuencia Observada
13
policia cajero taxista guardia Total
Homicidio 82 107 70 59 318
Otra causa diferente
92 9 29 42 172
de homicidio
Total 174 116 99 101 490
Frecuencia Esperada
X2
P (F O − F E)2
= X2
FE
X 2 = 65,521
Prueba de Hipotesis
H0 : variablessonindependientes
H1 : variablessondependientes
Establecer el nivel de significancia.
∝= 0,05
Determinar X 2
X 2 = 65,521
Determinar Xc2
∝= 0,05
Xc2 = 7,815
Conclusión
14
Se rechaza H0 por lo tanto las variables de ocupación y causa de nivel estan completamente
relacionados
5. Ejercicio 13
Un estudio de personas que se rehusaron a responder preguntas de encuestas proporcionó los datos
muestrales, que se seleccionaron aleatoriamente, los cuales se muestran en la tabla. Con un nivel de
significancia de 0.01 pruebe la aseveración de que la cooperación del sujeto (responder o rehusarse)es
independiente de la categoria de edad.¿Parece que algunos grupos de edad es poco cooperativo?.
EDAD
18-21 22-29 30-39 40-49 50-59 60 o mayores
respondieron 73 255 245 136 138 202
se rehusaron 11 20 33 16 27 49
RESOLUCION
Frecuencia Observada
EDAD
18-21 22-29 30-39 40-49 50-59 60 o mayores Total
respondieron 73 255 245 136 138 202 1049
se rehusaron 11 20 33 16 27 49 156
Total 84 275 278 152 165 251 1205
Frecuencia Esperada
EDAD
18-21 22-29 30-39 40-49 50-59 60 o mayores Total
respondieron 73.125 239.398 242.009 132.322 143.639 218.505 1049
se rehusaron 10.874 35.601 35.990 19.678 21.361 32.494 156
Total 84 275 278 152 165 251 1205
X2
EDAD
18-21 22-29 30-39 40-49 50-59 60 o mayores
respondieron 0.000213 1.016 0.0369 0.102 0.221 1.246
se rehusaron 0.00146 6.836 0.248 0.687 1.488 8.384
15
P (F O − F E)2
= X2
FE
X 2 = 20,266
Prueba de Hipotesis
H0 : variablessonindependientes
H1 : variablessondependientes
Establecer el nivel de significancia.
∝= 0,01
Determinar X 2
X 2 = 20,266
Determinar Xc2
∝= 0,01
Xc2 = 15,086
Conclusión
Se rechaza H0 por lo tanto las variables cooperación del sujeto y edad no son independientes.Tanto
la aseveracion de responder o rehusarse depende de la edad del sujeto a encuestar.
16
Enviados a prisión No enviados a prisión
Declaración de culpabilidad 392 58
Declaración de inocencia 564 14
Solución:
(450)(956)
E11 = 1028 = 418, 48
(450)(72)
E12 = 1028 = 31, 52
(578)(956)
E21 = 1028 = 537, 52
(578)(72)
E22 = 1028 = 40, 48
Cálculo de chi-cuadrado:
P P (fij −Eij )2
X2 = i j Eij
X 2 = 42, 54
2) α = 0, 05
Valor en tablas:
2
Xgl;α 2
= X1;0,05 = 7,8794
X 2 > X1;0,05
2
17
Conclusión:
-En base a los valores obtenidos se tiene que no existe correspondencia entre los valores de la
sentencia con la declaración de inocencia.
-Estos valores no se convierten en contundentes ya que se requerirı́a de otros factores determi-
nantes.
Placebo 10 mg de 20 mg de 40 mg de 80 mg de
atorvastatin atorvastatin atorvastatin atorvastatin
Dolor de cabeza 19 47 6 2 6
Sin dolor de cabeza 251 816 30 77 88
Placebo 10 mg de 20 y 40 mg 80 mg Total
atorvastatin atorvastatin atorvastatin
Dolor de cabeza 19 47 8 6 80
Sin dolor de cabeza 251 816 107 88 1262
Total 270 863 115 94 1342
(80)(270)
E11 = 1342 = 16, 09
(80)(863)
E12 = 1342 = 51, 44
(80)(115)
E13 = 1342 = 6, 855
(80)(94)
E14 = 1342 = 5, 603
fi fj
Eij = n
(1262)(270)
E21 = 1342 = 253, 9
(1262)(863)
E22 = 1342 = 811, 55
(1262)(115)
E23 = 1342 = 108, 14
(1262)(94)
E24 = 1342 = 88, 4
18
X2 =
(19−16,09)2 2 2 2 2 2 2 2
16,09 + (47−51,44)
51,44 + (8−6,85)
6,85 + (6−5,603)
5,603 + (251−253,9)
253,9 + (816−811,55)
811,55 + (115−108,14)
108,14 + (94−88,4)
88,4
X 2 = 1, 978
2) α = 0, 05
Valor en tablas:
2
Xgl;α 2
= X3;0,05 = 12, 83
2
X3;0,05 > X2
Conclusión:
-En base a lo obtenido se puede observar que las variables dosis de atorvastatin y dolor de cabeza
son independientes una de otra.
Solución
(171)(200)
E11 = 1600 = 21, 375
(171)(1400)
E12 = 1600 = 149, 625
(1429)(200)
E21 = 1600 = 178, 625
(1429)(1400)
E22 = 1600 = 1250, 37
19
Negros y Blancos
no hispanos no hispanos
Detenidos por la policı́a 21,375 149,625
No Detenidos por la policı́a 178,625 1250,37
Cálculo de chi-cuadrado
a)
P (O−E)2
E
Negros y Blancos y
no hispanos no hispanos
Detenidos por la policı́a 0,3223 0,046
No detenidos por la policı́a 0.0385 0,055
X 2 = 0, 4123
b)
P (|O−E|−0,5)2
E
Negros y Blancos y
no hispanos no hispanos
Detenidos por la policı́a 0,2112 0,0302
No detenidos por la policı́a 0,0252 0,0036
X 2 = 0, 2702
Conclusión:
Realizando una comparación entre los valores obtenidos, se puede observar que al añadir la
corrección de Yates el valor mejora con respecto a la condición de que se acerca al valor de
cero. Al estar el valor muy cercano a cero, la concordancia entre las frecuencias observadas y las
esperadas será perfecta.
20