Vous êtes sur la page 1sur 3

Gelman y Rubin

Gelman: Rubin(92) proponen una prueba de convergencia basada en 2 o más cadenas paralelas,
cada una partiendo de diferentes valores iniciales que están sobre-dispersos con respecto a la
verdadera distribución posterior (ver Gelman: Rubin: 92 para detalles relativos a la construcción de
distribuciones de partida sobre-dispersadas). Su método se basa en una comparación entre las
varianzas dentro y entre cadenas para cada variable (esencialmente un análisis clásico de varianza).
Esta comparación se utiliza para estimar el factor por el cual el parámetro de la escala de la
distribución posterior marginal de cada variable pudo ser reducido si la cadena fue funcionada al
infinito. Se obtienen mejores resultados para los parámetros cuyas densidades posteriores
marginales son aproximadamente normales. Por lo tanto, Coda transforma cualquier variable
especificada para ser positiva o restringida al rango (0,1) a las escalas logarítmicas o logit,
respectivamente, antes de calcular este diagnóstico.

Los diagnósticos de Gelman & Rubin reportados por Coda son el 50% y el 97,5% cuantiles de la
distribución de muestreo para este factor de reducción o encogimiento de escala. Tenga en cuenta
que estos cuantiles se estiman a partir de la segunda mitad de cada cadena solamente. Si ambos
cuantiles son aproximadamente 1,0, la convergencia eficaz se puede diagnosticar es decir las
muestras a partir de la segunda mitad que cada cadena se puede asumir para haber surgido de la
distribución inmóvil. En este caso, las estadísticas resumidas y las estimaciones de densidad, etc.,
pueden calcularse combinando el último 50% de iteraciones de todas las cadenas.
GELMAN AND RUBIN 50% AND 97.5% SHRINK FACTORS:
==============================================

Iterations used = 1:200


Thinning interval = 1
Sample size per chain = 200

-+----------+-----------------------------+-
| VARIABLE | Point est. 97.5% quantile |
| ======== | ========== ============== |
| | |
| alpha | 1.02 1.02 |
| beta | 1.00 1.00 |
| sigma | 1.04 1.12 |
-+----------+-----------------------------+-

Esto sugiere que 100 iteraciones eran suficientes para alcanzar la convergencia para Alpha, beta y
Sigma, y que las muestras 101-200 de ambas cadenas se pueden asumir para presentarse de las
distribuciones posteriores marginales para cada variable. Ocasionalmente, se puede mostrar un
valor de na para la estimación de puntos y el 97,5% Quantile. Esto se debe a problemas numéricos
durante el cálculo de los factores de encogimiento, y usualmente surge cuando hay poca o ninguna
mezcla entre las cadenas. Esto indica la convergencia lenta que requiere funcionamientos mucho
más largos del dechado de Gibbs.

Grafico de Gelman y Rubin

Al seleccionar la opción 2 se generarán diagramas como los que se muestran en la figura 3. Estas
parcelas se producen dividiendo la cadena para cada variable en un número de segmentos como
sigue: el primero contiene muestras 1:50; el segundo contiene muestras 1:(50 + n); el tercero
contiene muestras 1:(50 + 2N) y así sucesivamente. (Observe que estos segmentos se construyen
de manera diferente a los para trazar las puntuaciones Z de Geweke--véase § 4.1.1). El tamaño de
la bandeja por defecto es n = 10 para cadenas de 500 iteraciones o menos. Para cadenas más largas,
el tamaño de la cubeta se determina dividiendo la cadena por igual en 50 bins. Estos tamaños
pueden ser cambiados por el usuario (véase § 5.7.2). El diagnóstico de Gelman & Rubin se computa
para cada segmento, y la mediana y 97,5% quantile de la distribución de muestreo para el factor de
encogimiento resultante se trazan contra el número máximo de iteración del segmento. Las parcelas
de la figura 3 muestran que tanto la mediana como el 97,5% Quantile para beta se estabilizan
alrededor de un valor de 1,0 (indicado por la línea discontinua horizontal) para los segmentos de
cadena que contienen las primeras 150 iteraciones o más. Puesto que el diagnóstico se calcula a
partir de la segunda mitad de cada cadena solamente, esto sugiere que la convergencia primero fue
alcanzada después de aproximadamente 75 iteraciones. Los factores de reducción estimados para
Alpha y Sigma también parecen haber estabilizado alrededor de 1,0 para segmentos de cadena
mayores de 150 iteraciones. Sin embargo, ambos muestran pequeños saltos en la iteración 190 lo
que implica que un largo plazo puede ser apropiado. (tenga en cuenta que la escala vertical es
diferente para cada una de estas parcelas). Estas parcelas pueden tardar algún tiempo en producirse
debido al gran número de cálculos invovled: el proceso puede acelerarse reduciendo el número total
de bins, o aumentando el tamaño de la cubeta.

Las iteraciones tempranas en cada cadena a menudo muestran mala mezcla. Esto puede conducir
ocasionalmente a los errores numéricos al calcular Gelman y el diagnóstico de Rubin para los
segmentos iniciales. En tales circunstancias, Coda mostrará el siguiente mensaje de ADVERTENCIA:
******* Warning: *******
Could not compute Gelman & Rubin's diagnostic for * chain segments

donde * da el número de segmentos generando errores. Sin embargo, los factores de encogimiento
para los segmentos posteriores permanecen válidos y se mostrarán en la parcela. Si todos los
segmentos generan errores, no se producirán tramas y Coda mostrará el siguiente mensaje de error:
******* Error: *******
Cannot compute Gelman & Rubin's diagnostic for any chain segments
This indicates convergence failure ==> Run chains for more iterations

Vous aimerez peut-être aussi