Vous êtes sur la page 1sur 17

UNIVERSIDAD CENTRAL DE VENEZUELA

FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES


ESCUELA DE ESTADÍSTICA Y CIENCIAS ACTUARIALES

ESTADÍSTICA II
MARÍA TERESA SALOMÓN, SANDRA PINTO, GÉNESIS BRICEÑO,
ELOY ELIGÓN, JONATTAN RAMOS Y CARLOS FIGUEROA

TEMA NRO. 4
ALGUNAS PRUEBAS DE ESTADÍSTICA NO PARAMÉTRICA

CONTRASTE PARA LA BONDAD DEL AJUSTE (GOODNESS OF FIT)

II 2016
CONTRASTE PARA LA BONDAD DEL AJUSTE (GOODNESS OF FIT)

Propuesta por Karl Pearson en el año 1900, esta prueba consiste en verificar si la distribución
de frecuencias de una variable aleatoria satisface los supuestos de un modelo probabilístico
determinado.

KARL PEARSON
1857 – 1936
Matemático Británico
Contribuyó en el desarrollo de lo que se
conoce como Estadística Matemática, así como
en el Análisis de Regresión, e introdujo
definiciones como Correlación, Desviación
Típica y Coeficiente de Variación, las cuales son
ampliamente utilizadas en la actualidad.

Fuente: Website del Cuaderno de Cultura Científica

Pearson planteó evaluar el ajuste de una distribución teórica a una muestra aleatoria
(variables aleatorias independientes e idénticamente distribuidas o v.a.i.i.d), a través de un
estadístico que permita medir los desvíos de las frecuencias observadas frente a las
frecuencias teóricas. Dicho planteamiento constituyó la primera evaluación formal de la
calidad del ajuste a una distribución. Previo a ese desarrollo riguroso, se habían intentado
algunas comparaciones pero de carácter subjetivas.

ALGUNAS PRUEBAS DE ESTADÍSTICA NO PARAMÉTRICA


CONTRASTE PARA LA BONDAD DEL AJUSTE

El contraste de hipótesis para la Bondad del Ajuste, que forma parte de la familia de Métodos
no Paramétricos, permite establecer si es apropiado (bondad) explicar el comportamiento de
una variable aleatoria a través de un determinado modelo teórico (ajuste).
Sea X una variable aleatoria con un espacio muestral S. Sean además C1, C2, …, Ck una
partición del espacio muestral, tal que:
k Clases exhaustivas y
C 1  C 2  ...  C k   C i  S  C i  C j   , i  j mutuamente excluyentes
i 1

Suponga además que se toma una muestra de n observaciones x1, x2, …, xn con la cual se
puede construir la siguiente tabla:

Clases oj pj ej

C1 o1 p1 e1 Donde:
o oi es la frecuencia observada en la i-ésima clase.
C2 o2 p2 e2 o pi es la probabilidad de la i-ésima clase, es decir:
P x  C i 
   
o ei es la frecuencia esperada de la i-ésima clase.
Ck ok pk ek

Total n 1 n

ALGUNAS PRUEBAS DE ESTADÍSTICA NO PARAMÉTRICA


CONTRASTE PARA LA BONDAD DEL AJUSTE

Cabe destacar, que oi es una variable aleatoria que mide el “número de observaciones que
pertenecen a la clase Ci de las n que integran la muestra”. Por tanto, oi se comporta como una
variable aleatoria Binomial:
oi ~ bn, pi   Eoi   ei  npi
A partir de este resultado, se puede probar que la suma de las frecuencias esperadas es igual
a n:
k k k
 Eoi    npi  n pi  n1  n
i 1 i 1 i 1

A manera de ilustración, en el siguiente gráfico se representa un ejemplo del ajuste


(aproximación) de la distribución de frecuencias de una variable a un Modelo Probabilístico
Normal:

ALGUNAS PRUEBAS DE ESTADÍSTICA NO PARAMÉTRICA


CONTRASTE PARA LA BONDAD DEL AJUSTE

1. HIPÓTESIS
H0: la variable aleatoria X se distribuye según el modelo probabilístico 𝑓𝑋
H1: la variable aleatoria X no se distribuye según el modelo probabilístico 𝑓𝑋
2. NIVEL DE SIGNIFICACIÓN 
3. ESTADÍSTICO DE CONTRASTE
k oi  ei 2
 *  
2

i 1 ei
𝛿 = 𝑘 − 𝑝 − 1, donde 𝑘 es el número de clases y 𝑝 es el número de parámetros que se
deben estimar para obtener las frecuencias esperadas 𝑒𝑖 en cada clase 𝐶𝑖 .
Este estadístico mide las distancias entre las frecuencias observadas y esperadas a través
de la suma de los desvíos al cuadrado de las frecuencias observadas con respecto a las
esperadas (oi - ei)2 relativos a las frecuencias esperadas.
Se dice que este estadístico se aproxima a una distribución Chi-cuadrado con 𝛿 grados
de libertad si el tamaño de la muestra es grande. Para este caso, n será grande si se
cumple que npi ≥ 5 ∀𝑖. Ahora bien, en caso de que no se cumpla esa condición, se deben
rehacer las clases hasta cumplir con el requerimiento de que npi ≥ 5 ∀𝑖.

ALGUNAS PRUEBAS DE ESTADÍSTICA NO PARAMÉTRICA


CONTRASTE PARA LA BONDAD DEL AJUSTE

Una expresión simplificada, que genera menor error a la hora de realizar los cálculos es:

 k oi2 
 *      n
2
DEMOSTRAR
 i 1 ei 
4. REGIÓN CRÍTICA
Si el estadístico χ2∗
𝛿 toma valores pequeños, indica que existe cercanía entre las
frecuencias observadas y esperadas, y por tanto, el ajuste al modelo probabilístico
seleccionado es bueno. Por el contrario, valores grandes del estadístico de contraste
conducirán a rechazar la hipótesis nula, ya que el modelo seleccionado pareciera no ser
el apropiado. En consecuencia, se procede como si se tratara de un contraste unilateral
derecho.
RC  2 ; 1 , 

5. REGLA DE DECISIÓN
Rechazar H0 si y solo si  *   ; 1
2 2

ALGUNAS PRUEBAS DE ESTADÍSTICA NO PARAMÉTRICA


CONTRASTE PARA LA BONDAD DEL AJUSTE

EJEMPLO (CHAO, 1982, PÁG 248)


Una fábrica desea determinar si el número de partes defectuosas utilizadas en determinado
montaje se ciñe a la distribución Poisson. Para ello, el ingeniero de control de calidad
inspecciona una muestra de 200 cajas, cada una con 100 partes terminadas. Use α = 5%
Sea Xi el número de partes defectuosas encontradas en la caja y fi la frecuencia observada:

Xi 0 1 2 3 4 5 6 7 Total

fi 21 62 50 40 22 0 5 0 200

Considerando el enunciado, planteamos un Contraste para la Bondad del Ajuste:


0. VARIABLE ALEATORIA
X: Número de partes defectuosas por caja X  0 ,1 ,2 ,...,100
1. HIPÓTESIS
H0: El número de partes defectuosas por caja se ciñe a una distribución Poisson
H1: El número de partes defectuosas por caja no se ciñe a una distribución Poisson
2. NIVEL DE SIGNIFICACIÓN
  0,05

ALGUNAS PRUEBAS DE ESTADÍSTICA NO PARAMÉTRICA


CONTRASTE PARA LA BONDAD DEL AJUSTE

EJEMPLO (CHAO, 1982, PÁG 248) (CONT.)


3. ESTADÍSTICO DE CONTRASTE
Completamos la tabla para calcular el estadístico de contraste:

Xi fi Xi fi DISTRIBUCIÓN DE POISSON (REPASO)

0 21 0 Sea X una variable aleatoria discreta, se dice que X


sigue una Distribución de Poisson de parámetros 𝜆 > 0
1 62 62 si y sólo si su ley de probabilidad viene dada por:
x
2 50 100 PX x   e 
I0 ,1 , x 
x!
3 40 120 Donde 𝜆 es la tasa media de ocurrencia y X describe
“número de sucesos en una unidad soporte (intervalo de
4 22 88 tiempo, longitud, superficie, etc.)”
5 0 0
Teniendo en cuenta la Distribución Poisson, X describe
6 5 30 el “número de partes defectuosas encontradas en cada caja” y
la tasa media de ocurrencia, o bien, el promedio de
7 0 0 partes defectuosas por caja se estima como:
1 8 400
Total 200 400 ˆ
   Xi f i   2  X ~ P2 
n i 1 200

ALGUNAS PRUEBAS DE ESTADÍSTICA NO PARAMÉTRICA


CONTRASTE PARA LA BONDAD DEL AJUSTE

EJEMPLO (CHAO, 1982, PÁG 248) (CONT.)


Considerando la tasa media de ocurrencia estimada calculamos la probabilidad de la i-
ésima clase:

Xi fi Xi fi pi 20 ei e 1  n  p1
Px  0   e 2
e1  200  0 ,1353
0 21 0 0,1353 0! 27,0671

1 62 62 0,2707 54,1341
Para asegurar
2 50 100 0,2707 54,1341
la distribución
3 40 120 0,1804 36,0894 probabilística
del estadístico
4 22 88 0,0902 18,0447 de contraste

5 0 0 0,0361 7,2179

6 5 30 0,0120 2,4060 ei  5 , i
Calcular por
7 0 0 0,0045 complemento 0,9068

Total 200 400 1,0000 200

ALGUNAS PRUEBAS DE ESTADÍSTICA NO PARAMÉTRICA


CONTRASTE PARA LA BONDAD DEL AJUSTE

EJEMPLO (CHAO, 1982, PÁG 248) (CONT.)


Agrupamos las últimas tres clases que son las más pequeñas en una que llamaremos 5 y
Más:

Xi fi Xi fi pi ei fi2/ei
 * 
8  f i  ei 2   8 f i2 
   n
2
4
0 21 0 0,1353 27,0671 16,2929 i 1 ei  i 1 ei 

1 62 62 0,2707 54,1341 71,0088   42 *  207 ,0139  200

2 50 100 0,2707 54,1341 46,1816   42 *  7 ,0139


3 40 120 0,1804 36,0894 44,3343

4 22 88 0,0902 18,0447 26,8223

0 0

≥5 5 30 0,0526 10,53 2,3740

0 0

Total 200 400 1,0000 200 207,0139

ALGUNAS PRUEBAS DE ESTADÍSTICA NO PARAMÉTRICA


CONTRASTE PARA LA BONDAD DEL AJUSTE

EJEMPLO (CHAO, 1982, PÁG 248) (CONT.)


4. REGIÓN CRÍTICA
RC  2 ; 1 ,    6211 ; 10 ,05 ,   9 ,4877 , 

p = 1, ya que se estimo la media de la


=INV. CHICUAD(0,95;4)
Distribución de Poisson

5. REGLA DE DECISIÓN
Rechazar H0 si y solo si  *   ; 1   4 *  9 ,4877
2 2 2

6. DECISIÓN ESTADÍSTICA
Como el estadístico de contraste no pertenece a la región crítica o de rechazo, no existen
elementos suficientes para rechazar la hipótesis nula, por lo tanto se puede asumir que
el número de partes defectuosas por caja se ciñe a una distribución Poisson, con un
nivel de significación del 5%.

EJERCICIO
Haciendo uso del software R o RStudio, replique el ejemplo
anterior construyendo el respectivo script haciendo uso de las
librerías, funciones y/o herramientas correspondientes.

ALGUNAS PRUEBAS DE ESTADÍSTICA NO PARAMÉTRICA


CONTRASTE PARA LA BONDAD DEL AJUSTE

EJEMPLO - BONDAD DE AJUSTE NORMAL


Los siguientes datos corresponden a las ventas diarias de un Agente Autorizado de Telefonía
Celular (X) (Número de tarjetas prepago) del centro de la ciudad de Caracas. Estudiar si la
variable X se ciñe al modelo Normal. Use α = 3, 5%

68 70 93 92 85 88 79 80 71 72

71 75 90 91 75 91 93 83 98 82

Xi 73 69 77 87 86 74 89 94 95 97

78 79 82 81 80 80 83 81 77 79

84 86 79 81 84 83 78 77 77 90

0. VARIABLE ALEATORIA
X: Ventas diarias de tarjetas de un Agente Autorizado de Telefonía Celular (A.A.T.C.)
1. HIPÓTESIS
H0: Las ventas diarias de tarjetas de un A.A.T.C. se ciñe al modelo Normal
H1: Las ventas diarias de tarjetas de un A.A.T.C. no se ciñe al modelo Normal

ALGUNAS PRUEBAS DE ESTADÍSTICA NO PARAMÉTRICA


CONTRASTE PARA LA BONDAD DEL AJUSTE

EJEMPLO - BONDAD DE AJUSTE NORMAL (CONT.)


2. NIVEL DE SIGNIFICACIÓN
  0,035
3. ESTADÍSTICO DE CONTRASTE
En el caso de la bondad del ajuste para el modelo normal, lo que se debe hacer es
construir cuatro (4) intervalos equiprobables, los cuales quedarán definidos a través de
los cuartiles de la normal estándar (por definición de cuartil) y usando las propiedades
del modelo normal, pasaremos del modelo normal general al modelo normal estándar,
a través de la tipificación o estandarización, para luego encontrar los limites inferiores y
superiores de cada una de las 4 clases que garantizan la equiprobabilidad, y obtener así
las frecuencias observadas por clase de acuerdo a la muestra y con las frecuencias
esperadas realizar el Contraste para la Bondad del Ajuste.
Los intervalos definidos por los cuartiles de la normal estándar, también llamados
intervalos estandarizados, quedarían estructurados de la siguiente manera:

  , Z0 ,25    ,0 ,6745


Z0 ,25 , Z0 ,50   0 ,6745 ,0  Coincide con la Media y la Mediana
Z0 ,50 , Z0 ,75   0 ,0 ,6745
Z0 ,75 ,  0 ,6745 , 

ALGUNAS PRUEBAS DE ESTADÍSTICA NO PARAMÉTRICA


CONTRASTE PARA LA BONDAD DEL AJUSTE

EJEMPLO - BONDAD DE AJUSTE NORMAL (CONT.)


Por su parte, los intervalos reales:
  , a1 
a1 , a2 
a2 , a3 
a3 , 
Ahora bien, para hallar los valores reales ai, los despejamos de la expresión que nos
permite tipificar, ya que conocemos los cuartiles Zα, es decir:
a1  X
Z0 ,25   a1  X  Z0 ,25ŜX
ŜX
Y así de manera análoga para a2 y a3.
De acuerdo a ello, es necesario obtener la media y desviación típica muestral:
1 n 4107
 X   Xi   82 ,14
n i 1 50
1 n
 Xi  X   58 ,4494  ŜX  58 ,4494  7 ,6452
2 2
 ŜX 
n  1 i 1

ALGUNAS PRUEBAS DE ESTADÍSTICA NO PARAMÉTRICA


CONTRASTE PARA LA BONDAD DEL AJUSTE

EJEMPLO - BONDAD DE AJUSTE NORMAL (CONT.)


Entonces:
 a1  X  Z0 ,25ŜX  82 ,14   0 ,6745 7 ,6452   76 ,9834  77
 a2  X  Z0 ,50ŜX  82 ,14  0 7 ,6452   82 ,14  82
 a3  X  Z0 ,75ŜX  82 ,14  0 ,6745 7 ,6452   87 ,2966  87
Construyendo la tabla con las clases ya establecidas:

Clases oi pi ei oi2/ei oi  ei 2  j oi2 


4
 * 
2
1     n
i 1 ei  i  1 ei 
(-∞ , 77) 10 0,25 12,5 8,00

[77 , 82) 16 0,25 12,5 20,48


  12 *  52 ,16  50

[82 , 87) 10 0,25 12,5 8,00   12 *  2 ,16

[87 , +∞) 14 0,25 12,5 15,68

Total 50 1,00 50 52,16

ALGUNAS PRUEBAS DE ESTADÍSTICA NO PARAMÉTRICA


CONTRASTE PARA LA BONDAD DEL AJUSTE

EJEMPLO - BONDAD DE AJUSTE NORMAL (CONT.)


4. REGIÓN CRÍTICA
RC  2 ; 1 ,    42 2 1 ; 10 ,035 ,    4 ,4452 , 

p = 2, ya que se estimo la media y la


=INV. CHICUAD(0,965;1)
varianza de la Distribución Normal

5. REGLA DE DECISIÓN
Rechazar H0 si y solo si  1 *   ; 1   1 *  4 ,4452
2 2 2

6. DECISIÓN ESTADÍSTICA
Como el estadístico de contraste no pertenece a la región crítica o de rechazo, no existen
elemento suficiente para rechazar la hipótesis nula, por lo tanto se puede asumir que las
ventas diarias de tarjetas de un Agente Autorizado de Telefonía Celular se ciñe al
modelo Normal, con un nivel de significación del 3,5%.

EJERCICIO
Haciendo uso del software R o RStudio, replique el ejemplo
anterior construyendo el respectivo script haciendo uso de las
librerías, funciones y/o herramientas correspondientes.

ALGUNAS PRUEBAS DE ESTADÍSTICA NO PARAMÉTRICA


REFERENCIAS

• Chao, L. (1982). Estadística para las Ciencias Administrativas. México: McGraw-Hill.

• Glez, F. (2007). Prácticas de Estadística con R, Parte II. Santander: Escuela Técnica Superior
Ing. Industrial y Química - Universidad de Cantabria.

• Salomón, M., Pinto, S. (2016). Estadística, Probabilidad e Incertidumbre. Caracas: Facultad de


Ciencias Económicas y Sociales de la Universidad Central de Venezuela.

• buscabiografias.com. (1999). Biografía de Karl Pearson. [Documento en línea]. Disponible:


http://www.buscabiografias.com/biografia/verDetalle/6926/Karl%20Pearson [Consulta:
2017, Mayo 12]

• Centro de Matemática, Curso de Bioestadística. (2006). Pruebas de Bondad de Ajuste.


[Documento en línea]. Disponible: http://www.cmat.edu.uy/cmat/cursos/otras-
licenciaturas/practicos/bioestadistica/2006/ajuste06.pdf/view [Consulta: 2017, Mayo 12]

• Tomé, C. (2015). Las matemáticas como herramienta (y VI): el siglo XX. [Documento en línea].
Disponible: https://culturacientifica.com/2015/11/17/las-matematicas-como-herramienta-
y-vi-el-siglo-xx/ [Consulta: 2017, Mayo 12]

ALGUNAS PRUEBAS DE ESTADÍSTICA NO PARAMÉTRICA

Vous aimerez peut-être aussi