Vous êtes sur la page 1sur 45

Distribuciones Continuas Probabilidad

Identificacin y Ajuste
1
Ajuste de Distribuciones
Objetivo

Dada una muestra de valores obtenida de una distribucin de
probabilidad, nos proponemos determinar cul es la
distribucin que mejor se ajusta los datos y cuales son sus
parmetros.

Condiciones

Independencia de las observaciones.
Estabilidad de las probabilidades asociadas a los distintos
posibles valores de la variable.
2
Metodologa Clsica de Ajuste
Eleccin de la familia de distribuciones
Consideraciones Tericas
T.C.L
Errores de medicin
Distancia entre fallas aleatorias (Ej: fallas en telas)
Variables econmicas de corte transversal (Ej: saldo en cuentas)
Distribuciones de extremos (Ej: elongacin de rotura en hilo)
Conocimientos Empricos


Procedimientos de ajuste (determinar los parmetros)

Mtodo de igualacin de momentos
Mtodo de Mxima Verosimilitud
Mtodo de Ajuste por Fractiles
3
Mtodo de Ajuste por Momentos





En general las estimaciones son insesgadas
Pueden dar resultados incoherentess


( )
( )
2
2 2
1
2
1
2 2
1
1

1
1
1
n
i
n
i
i
n
i
i
i
x
n
X x
n
S x X
n
o o

o
=
=
=

~ =

~ =

~ =

4
Mtodo de Mxima Verosimilitud




El conjunto de parmetros que hacen
mxima la verosimilitud de la muestra,
definen un miembro de la familia, el de mejor
ajuste por mxima verosimilitud.
1 2
L ( \ , ,..., ,..., ) f (Q \ x1 , x2 , ... xn) f (xi \ Q) 
i n
x x x x u = =
5
Ajuste por Fractiles
(con 2 valores)
En un establecimiento agropecuario, el 10% de los novillos
que salen a venta pesan ms de 500 kg. y el 7% pesa menos
de 410 kg. Si la distribucin es normal, calcular la media y el
desvo de la distribucin.

410
0, 07
458, 2 32, 6
500
0,90
Kg Kg

|
o
o

|
o

| |
=
|
\ .
= . =
`

| |

=
|

\ .
)
6
Ajuste por Fractiles
(con n valores)
F1 F2 F3 F4 F2: mejor ajuste
0
0,2
0,4
0,6
0,8
1
-1 -0,5 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5
x
F(x) Fm
7
Ajuste por Fractiles
(Pasos)
1. Estimacin de los valores de
Estimacin para datos individuales
Estimacin para datos agrupados en intervalos

2. Determinacin de los parmetros de la
distribucin
Ajuste no Lineal de Fractiles
Ajuste Lineal de Fractiles

( )
i
F x
8
Ajuste por Fractiles
(Estimacin de para datos agrupados en intervalos)
0,003
0,001
0,002
fr
i
0 100 200 300 400 500 600 1400
0

( )
i
F x
9

Si se ordenan los valores de la muestra,

o
x
1
<
o
x
2
<
o
x
3
< <
o
x
j
< <
o
x
n-1
<
o
x
n


Para un j dado,
o
x
j
y y
j
= F(
o
x
j
) son variables aleatorias



y
j
= F(
o
x
j
)

o
x
j
0
0,3
0,6
0,9
1,2
1,5
1,8
0 0,5 1 1,5 2
x
f(x)
Ajuste por Fractiles
(Estimacin de para datos individuales)

( )
i
F x
10
n=9
j=1 j=9
j=3 j=5 j=7
0
1
2
3
4
5
6
7
8
9
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
y
j
f(y
j
)
Ajuste por Fractiles
(Distribucin de y
j
)
11
Primera aproximacin:
Segunda aproximacin:


Tercera aproximacin:

Ajuste por Fractiles
(Estimacin de para datos individuales)

( )
i
F x
12
1.- Se ordenan los n valores en forma creciente:
o
x
1
<
o
x
2
<
o
x
3
< ... <
o
x
n-1
<
o
x
n


2.- Un valor ordenado cualquiera
o
x
j
, define en la distribucin de
x una probabilidad acumulada que, para distintas muestras de
igual tamao e igual j vara de una a otra. Si se toma la
mediana y
j; 0,5
de esa distribucin como representativa de la
F
m
, a cada observacin ordenada le corresponder un valor:

Ajuste por Fractiles
(Estimacin de para datos individuales: RESUMIENDO)

( )
i
F x
13

3.- Si se lleva en un grfico esos valores en funcin de los
o
x
j
, j =
1 a n , se obtendr, para datos individuales, la funcin de
distribucin muestral F
m
(
o
x
j
)

0
0,2
0,4
0,6
0,8
1
-0,5 0 0,5 1 1,5 2 2,5
o
x
j
F
m
Ajuste por Fractiles
(Estimacin de para datos individuales: RESUMIENDO)

( )
i
F x
14
y = F
m
(x) n

=

51
j

=

2 j

=

50
j =

26
0
3
6
9
12
0 0,5 1
y
f(y)
Ajuste No Lineal por Fractiles
(Heterocedasticidad de los residuos)
As planteado el modelo es heterocedstico y los valores centrales de la distribucin
tienen mayor influencia que los valores extremos en la determinacin de los
parmetros 15
16
Eleccin de Familias de Distribucin
17
Elementos Tericos
Poseo

Informacin Previa
Elementos Empricos
Candidatos
Consideraciones Sobre el Dominio
No Poseo

Informacin Previa Consideraciones Sobre la Forma

(Asimetra)

)
" " A Priori
Necesidad de Ordenar Modelos
Una vez elegidas las familias factibles, debemos
estimar, para cada familia, los parmetros de la
distribucin. Para esto existen varios mtodos ya
vistos: Momentos, Mxima Verosimilitud, Ajuste
Lineal y No Lineal de Fractiles.

Por ltimo, necesitamos herramientas que nos
permitan comparar los distintos modelos para
poder evaluar cual de ellos es el mejor.
18
Ordenamiento de Modelos (MV)


Dada la muestra, y un conjunto de familias (Normal,
Lognormal, Gamma, etc.), a cada una corresponder
un miembro en particular que produzca el mejor
ajuste, y un valor de la verosimilitud mxima.

Se considerar que una familia ajusta mejor que otra
si su verosimilitud mxima supera a la de esta ltima.

Esto permitir ordenar a las familias por mxima
verosimilitud.

19
Ordenamiento de Modelos (ALF)
20
Se usa como ordenador r:
correlacin entre u
m
= u(F
m
) y u[F(x)]

Requiere el conocimiento de los parmetros de la F(x)

Para las distribuciones del primer grupo (comn), los
valores de r y r coinciden.


21
Ordenamiento de Modelos (ALF)
Comparacin de distribuciones con igual nmero de parmetros



22
Ordenamiento de Modelos (ALF)
Comparacin de distribuciones con distinto nmero de parmetros
23

Ordenamiento de Modelos (ALF)
Resumen

24

Ordenamiento de Modelos (ANLF)


25

Ordenamiento de Modelos (ALF)
Resumen

Eleccin de Modelos Candidatos
26
Eleccin de Modelos Candidatos
27
Eleccin de Modelos Candidatos
28
Eleccin de Modelos Candidatos
29
Eleccin de Modelos Candidatos
30
Mtodos de Validacin
Anlisis grfico A(F) - A(x)
Mtodo de los momentos funcionales
Mtodos de Bondad de Ajuste
Test de Kolmogorov-Smirnov
Test de Chi-Cuadrado
Test de Razn de Verosimilitudes
Grficos de Momentos

31
Validacin: Grficos de Ajuste Lineal (1/2)
32
Sin embargo la distribucin de Weibull no parece un
modelo apropiado ya que se observa una posible
curvatura.
33
Validacin: Grficos de Ajuste Lineal (2/2)
Validacin: Momentos Funcionales (1/4)
34
Hiptesis sobre 3 y 4 para distribuciones Normales

Aproximacin razonable para n > 150 (a
3
) n > 1000 (a
4
)




Para muestras menores

a
3
procedimiento de DAgostino (1970) aprox. razonable n > 9
a
4
procedimiento de Anscombe y Glinn (1983) aprox. razonable n > 20

35
Validacin: Momentos Funcionales (2/4)
Hiptesis sobre 3 y 4 para otras distribuciones
(Exponencial, Exponencial Desplazada, Pareto, Gumbel, Weibull )

E(a
3
) = o
3
; E(a
4
) = o
4
; D(a
3
) = o
3
; D(a
4
) = o
4


E(a
3
) ; E(a
4
) ; n o
3
; n o 4

Dependen fuertemente de n

Distribuciones alejadas de la Normal an para muestras grandes

Se desarrollaron ensayos especficos para a
3



36
Validacin: Momentos Funcionales (3/4)
37
Validacin: Momentos Funcionales (4/4)
38
Validacin: Grficos de Momentos (1/2)
39
Validacin: Grficos de Momentos (2/2)
Para datos individuales
Prueba de Kolmogorov-Smirnov (KS)

Para datos agrupados
Prueba de Kolmogorov-Smirnov (KS)
Test de Razn de Verosimilitudes
Test Chi-Cuadrado

40
Validacin: Pruebas de Bondad de Ajuste (1/6)
Kolmogorov-Smirnov (KS)



A o;n tabulado para distintos valores de o y n
Existen tablas para las distribucin Normal, Exponencial y
Gumbel
Existen tablas para distribuciones parmetros fueros
estimados por mxima verosimilitud
Para datos agrupados la aproximacin en es buena y el test es
muy conservador. Se recomiendan otros mtodos
41
Validacin: Pruebas de Bondad de Ajuste (2/6)
;
:
MAX n
CR f
o
A > A
Ho) La funcin de distribucin de x es F(x)
Kolmogorov-Smirnov (KS)

42
Validacin: Pruebas de Bondad de Ajuste (3/6)
)
`

)
`

= A ) (
1
, ) ( x F
n
j
x F
n
j
MAX MAX f
j MAX
0
0,2
0,4
0,6
0,8
1
0 0,5 1 1,5 2
x
F(x)
j

/

n
o
x
j
j / n
d
0
( j -1) / n
F(
o
x
j
)
d
-1
5%; 75
:
MAX n
CR f
o = =
A > A
Kolmogorov-Smirnov (KS)

43
Validacin: Pruebas de Bondad de Ajuste (4/6)
Test Chi-Cuadrado




Solo para datos agrupados
44
Validacin: Pruebas de Bondad de Ajuste (5/6)
( )
2
1 ; 1
: 5
i i
k P i
i
i
O E
CR E
E
o
_

> >

Ho) La funcin de distribucin de x es F(x)


Test Razn de Verosimilitudes




Solo para datos agrupados
45
Validacin: Pruebas de Bondad de Ajuste (6/6)
1 ; 1
: ( / )
i i i k P
i
CR G O Ln O E
o
_

= >

2
Ho) La funcin de distribucin de x es F(x)

Vous aimerez peut-être aussi