Vous êtes sur la page 1sur 7

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

CIUDAD UNIVERSITARIA
FACULTAD: CIENCIAS MATEMTICAS

ESCUELA ACADEMICA PROFESIONAL DE ESTADISTICA

PRUEBA
DE
ANDERSON-DARLING
Integrantes:

Caballero Rodriguez Kenny Mayer


Olivera
Casas
Franck

Docente:
Vigo Chacon, Geraldine Judith

Introduccin:

El test de Anderson Darling


La prueba de Anderson-Darling fue desarrollado en (1952) por Theodore Anderson y
Donald Darling. Es una prueba no paramtrica sobre si los datos de una muestra
provienen de una distribucin especfica, por ejemplo, la distribucin normal. La prueba
consiste en el clculo de la estadstica de Anderson-Darling.
Cuanto mejor se ajustan los datos a la distribucin, menor es el valor del estadstico de
Anderson-Darling. Usted puede utilizar el estadstico Anderson-Darling para comparar la
eficacia de un conjunto de datos adecuado para diferentes distribuciones.
La prueba Anderson-Darling es, en general, ms potente que la pruebas X2 de Pearson y
la de Kolmogorov-Smirnov. Resulta lgico pensar que la X2 de Pearson es menos
potente que la de Kolmogorov-Smirnov y la de Anderson- Darling debido a que trabaja
con datos agrupados debido al agrupamiento. Hay prdida de informacin.
Por otro lado, la prueba Kolmogorov-Smirnov es menos sensible a desajustes que
pudieran haber en las colas de la distribucin, que la prueba Anderson- Darling En
particular, la prueba Anderson- Darling funciona mejor que cualquiera otra, cuando haya
casos extraordinarios o aberrantes (outliers).

Supuestos

Puede utilizarse en tamaos mustrales n mayores a 25 observaciones o para muestras


menores a 25 esto se desarrollara detalladamente ms adelante.

La muestra es aleatoria por lo tanto las n observaciones son independientes.

Esta prueba solo se aplica a distribuciones continuas.

Utilizacin

Se utiliza para valorar si una muestra procede de una distribucin especfica. Al igual que
el test de Kolmogorov-Smirnov (KS) o el de ShapiroWilk (SW).

El test de AD es una modificacin del test de K-S en la que se da mayor ponderacin a las
colas que en este ltimo.

Utiliza distribuciones especficas para calcular la regin crtica. Esto hecho presenta la
ventaja de hacerlo ms sensible.

Hiptesis
Se desea docimar si:

H0 : Fx(x)=F0(x)

H1: Fx(x) F0(x), donde F0(x) est especificada.

O lo que equivale a decir:

H0:

La muestra { X1 , X2 , , Xn } procede de una poblacin con funcin de distribucin F0

H1:

La distribucin de la que procede la muestra { X1 , X2 , , Xn } no proviene de la poblacin


F0 con funcin de distribucin F0

Estadstico de Prueba:
El estadstico de la prueba de Anderson-Darling es:

[ ( )
[ ( )][

( )]
( )
( )]

Realizando los clculos correspondientes se obtiene una expresin ms sencilla:


A2= -n-S
Dnde S es:

S =

(Ln F( Xi ) + Ln(1- F(Xn+1-i)))

Donde:

n es el tamao de la muestra.
F(x) es la funcin de distribucin acumulada.
Ln : Logaritmo neperiano
Xn+1-i: La muestra ordenada de mayor a menor
Xi : Los valores de la muestra

Como calcular A2 (Caso de la normal)


1. Ordenar los datos {xi} de menor a mayor:
{X1 , X2, , Xn }

{X(1),X(2), ,X(n)}

2. Ordenar los datos {xi} de mayor a menor:


{X1 , X2, , Xn }

{X(n),X(n-1), ,X(1)}

3. Para hallar la media y la desviacin estndar tenemos 4 casos:


Caso 1: y
Caso 2:

conocidos.

conocida y desconocida y estimada por .

Caso 3: conocida y

desconocida y estimada por S=

Caso 4:
(

Ambos desconocidos, estimados por y Sn-1 =


en este ltimo caso tendremos
en cuenta un factor 1 + (0.75/n) + (2.25/n2), de correccin que ser multiplicado al A2
para mejorar la aproximacin.

4. Estandarizar los datos (transformarlos a un conjunto de media 0 y desviacin tpica 1):

5. Calcular la probabilidad pi de la distribucin acumulada de xi : pi = P(xi)


6. Por ultimo calcular

A2 :

A2 =

)(Ln ( pi ) + Ln ( 1-pn+1-I ))

-n

NOTA 1:
Para muestras pequeas se puede calcular el denominado estadstico de Anderson-Darling
ajustado, A2*, multiplicado A2 por un factor que depende de n:

A2*= A2

En este caso el estadstico de Anderson Darling ajustado tiene esta forma, pero mucho va a
depender la distribucin que se est especificando en el problema para usar esta u otra forma
que se detallara ms adelante.

Decisin:
Con un (

) = {0,90; 0,975; 0,99; 0,95} de confianza se rechaza Ho si A2 >Ac

Donde Ac es el valor crtico que encontrares en la siguiente tabla:

Por ejemplo si
en el caso de una distribucin normal entonces el valor crtico es de
0,751. Si A2 >0.751, por lo tanto se rechaza la hiptesis de normalidad.

En muchos casos (pero no todos), puede determinar un valor de p para el estadstico de


Anderson-Darling y utilizar este valor para ayudarle a determinar si la prueba es significativa o no
lo son. Recuerde que el p ("probabilidad") valor es la probabilidad de obtener un resultado que es
ms extremo si la hiptesis nula es verdadera. Si el valor p es baja (por ejemplo, <= 0,05), llega a
la conclusin de que los datos no siguen una distribucin normal.

Limitaciones

El test AD slo es aplicable a un nmero reducido de distribuciones: normal, lognormal,


exponencial, Weibull y logstica.
Si S=0 o cualquier pi= 0 pi=1 entonces A2 no puede calcularse (es indefinido).

Ejemplo: