Académique Documents
Professionnel Documents
Culture Documents
So Paulo
2006
rea de Concentrao:
Sistemas Eletrnicos
Orientador:
Prof. Dr. Luiz Antonio Baccal
So Paulo
2006
Agradecimentos
Ao meu orientador, Prof. Dr. Luiz Antonio Baccal, pela constante ajuda e estmulo, indispensveis para a realizao deste trabalho.
minha famlia, pelo apoio e compreenso.
Aos Professores Oswaldo Luiz do Valle Costa e Marcelo Gomes da Silva Bruno
pela participao na banca examinadora de qualificao.
FAPESP, pelo apoio financeiro1 .
A todos os demais que, direta ou indiretamente, contriburam para a realizao
deste trabalho.
Este trabalho contou com o apoio financeiro da FAPESP sob a forma de bolsa de doutoramento
(processo 02/11457-7).
Sumrio
1
Introduo
1.1 Formulao do Problema
1.2 Equalizao Bayesiana .
1.3 Organizao do texto . .
1.4 Principais Contribuies
1.5 Publicaes . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
2
4
5
6
7
Filtros de Partculas
2.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Degenerescncia e Reamostragem . . . . . . . . . . . . . . . . .
2.3 Escolha da funo de importncia . . . . . . . . . . . . . . . . .
2.4 Algoritmo SIR . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5 Filtros de Partculas para Modelos com Parmetros Desconhecidos
2.6 Exemplos de aplicao de filtros de partculas . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
8
8
11
14
16
19
23
.
.
.
.
.
.
.
.
.
.
.
.
29
29
30
33
36
38
50
.
.
.
.
.
.
.
.
.
.
.
.
53
Concluses
5.1 Sugestes para trabalhos futuros . . . . . . . . . . . . . . . . . . . .
76
78
54
55
61
63
73
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
99
. 99
. 101
. 105
. 106
109
. . . . . 109
. . . . . 111
. . . . . 112
. . . . . 113
. . . . . 119
125
125
126
127
F O Algoritmo BCJR
129
ii
Lista de Figuras
2.1
2.2
3.1
3.2
3.3
3.4
3.5
iii
26
28
42
42
43
43
44
3.6
iv
44
45
45
46
46
47
47
4.3
49
50
51
52
54
59
60
4.4
4.5
4.6
4.7
4.8
Desempenho mdio ao longo de 250 realizaes independentes de diversos algoritmos para equalizao e decodificao conjunta em funo da relao sinal-rudo (SNR) e do limiar para reamostragem para
um sistema empregando o cdigo convolucional (5, 7, 2). (A) Desempenho dos algoritmos empregando reamostragem multinomial, comparado com os esquemas alternativos descritos no texto. (B) O mesmo
para reamostragem residual. (C) O mesmo para reamostragem sistemtica. (D) Resultados dos ltimos 3 experimentos com limiar igual
0,2 e do filtro determinstico. . . . . . . . . . . . . . . . . . . . . . .
Desempenho mdio ao longo de 250 realizaes independentes de diversos algoritmos para equalizao e decodificao conjunta em funo da relao sinal-rudo (SNR) e do limiar para reamostragem para
um sistema empregando o cdigo convolucional (17, 12, 04). (A) Desempenho dos algoritmos empregando reamostragem multinomial, comparado com os esquemas alternativos descritos no texto. (B) O mesmo
para reamostragem residual. (C) O mesmo para reamostragem sistemtica. (D) Resultados dos ltimos 3 experimentos com limiar igual
0,2 e do filtro determinstico. . . . . . . . . . . . . . . . . . . . . . .
Desempenho mdio ao longo de 250 realizaes independentes de diversos algoritmos para equalizao e decodificao conjunta em funo da relao sinal-rudo (SNR) e do limiar para reamostragem para
um sistema empregando o cdigo convolucional (63, 44, 17). (A) Desempenho dos algoritmos empregando reamostragem multinomial, comparado com os esquemas alternativos descritos no texto. (B) O mesmo
para reamostragem residual. (C) O mesmo para reamostragem sistemtica. (D) Resultados dos ltimos 3 experimentos com limiar igual
0,2 e do filtro determinstico. . . . . . . . . . . . . . . . . . . . . . .
Sistema de comunicao empregando codificao diferencial em cascata com um codificador convolucional. . . . . . . . . . . . . . . . .
Desempenho mdio ao longo de 250 realizaes independentes de diversos algoritmos para equalizao e decodificao conjunta em funo da relao sinal-rudo (SNR) e do limiar para reamostragem para
um sistema empregando o cdigo convolucional (5, 7). (A) Desempenho dos algoritmos empregando reamostragem multinomial, comparado com os esquemas alternativos descritos no texto. (B) O mesmo
para reamostragem residual. (C) O mesmo para reamostragem sistemtica. (D) Resultados dos ltimos 3 experimentos com limiar igual
0,2 e do filtro determinstico. . . . . . . . . . . . . . . . . . . . . . .
vi
65
66
67
68
69
4.9
4.10
4.11
4.12
4.13
4.14
Desempenho mdio ao longo de 250 realizaes independentes de diversos algoritmos para equalizao e decodificao conjunta em funo da relao sinal-rudo (SNR) e do limiar para reamostragem para
um sistema empregando o cdigo convolucional (5, 7, 7). (A) Desempenho dos algoritmos empregando reamostragem multinomial, comparado com os esquemas alternativos descritos no texto. (B) O mesmo
para reamostragem residual. (C) O mesmo para reamostragem sistemtica. (D) Resultados dos ltimos 3 experimentos com limiar igual
0,2 e do filtro determinstico. . . . . . . . . . . . . . . . . . . . . . .
Desempenho mdio ao longo de 250 realizaes independentes de diversos algoritmos para equalizao e decodificao conjunta em funo da relao sinal-rudo (SNR) e do limiar para reamostragem para
um sistema empregando o cdigo convolucional (53, 75). (A) Desempenho dos algoritmos empregando reamostragem multinomial, comparado com os esquemas alternativos descritos no texto. (B) O mesmo
para reamostragem residual. (C) O mesmo para reamostragem sistemtica. (D) Resultados dos ltimos 3 experimentos com limiar igual
0,2 e do filtro determinstico. . . . . . . . . . . . . . . . . . . . . . .
Desempenho mdio ao longo de 250 realizaes independentes de diversos algoritmos para equalizao e decodificao conjunta em funo da relao sinal-rudo (SNR) e do limiar para reamostragem para
um sistema empregando o cdigo convolucional (47, 53, 75). (A) Desempenho dos algoritmos empregando reamostragem multinomial, comparado com os esquemas alternativos descritos no texto. (B) O mesmo
para reamostragem residual. (C) O mesmo para reamostragem sistemtica. (D) Resultados dos ltimos 3 experimentos com limiar igual
0,2 e do filtro determinstico. . . . . . . . . . . . . . . . . . . . . . .
Desempenho dos mtodos para equalizao e decodificao conjunta
baseados em filtros de partculas determinstico (DET) e estocstico
(STO) em funo da SNR, empregando os mtodos de reamostragem
multinomial, residual e determinstico (DET-DET), e do mtodo alternativo MAP descrito no texto. Os filtros de partculas estocsticos
empregam a funo de importncia tima. . . . . . . . . . . . . . . .
Desempenho dos mtodos para equalizao e decodificao conjunta
baseados em filtros de partculas determinstico (DET) e estocstico
(STO) em funo da SNR, empregando os mtodos de reamostragem
multinomial, residual e determinstico (DET-DET), empregando suavizao (10 amostras) e do mtodo alternativo MAP descrito no texto.
Os filtros de partculas estocsticos empregam a funo de importncia
tima. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Desempenho do algoritmo para equalizao e deteco conjunta determinstico (empregando reamostragem determinstica e suavizao
de 10 amostras) e do mtodo alternativo MAP descrito no texto em
funo do nmero de partculas empregado e da SNR. . . . . . . . . .
vii
70
71
72
74
75
75
5.1
Comparao do desempenho atingido por diversos mtodos para equalizao cega e pelo algoritmo de Viterbi em funo da relao sinalrudo para o canal h = [ 0, 41 0, 82 0, 41 ]T . A ordem do canal e a
varincia do rudo aditivo (gaussiano e real) foram assumidas conhecidas; os algoritmos EM e Gibbs (amostrador conjunto) operam sobre
blocos de 250 amostras do sinal recebido, descartando as 25 de cada
extremidade para fins de clculo de taxa de erro. O algoritmo baseado no filtro de partculas (estocstico - com funo de importncia
tima) tambm opera sobre 250 amostras, descartando as 100 primeiras, e emprega suavizao (5 amostras). O sinal transmitido binrio
e emprega codificao diferencial. . . . . . . . . . . . . . . . . . . .
A.1 Desempenho mdio ao longo de 250 realizaes independentes do algoritmo para equalizao cega em canal de ordem desconhecida de
5e2 L
4,
Miguez et al. [1], para ordens possveis 1 L
comparado com o desempenho do equalizador timo MAP (BCJR) e
do algoritmo para equalizao cega baseado em filtros de partculas
estocsticos com a funo de importncia tima (utilizando N = 300
partculas e suavizao (10 amostras)), num sistema BPSK com codificao diferencial, em funo da relao sinal-rudo (SNR). . . . . .
A.2 Histograma de 250 amostras do estimador MAP da ordem do canal
5 em funo da
provida pelo algoritmo de Miguez et al. com 1 L
relao sinal-rudo (SNR). O canal empregado tem ordem L = 3. . . .
A.3 Histograma de 250 amostras do estimador MAP da ordem do canal
4 em funo da
provida pelo algoritmo de Miguez et al. com 2 L
relao sinal-rudo (SNR). O canal empregado tem ordem L = 3. . . .
A.4 Desempenho mdio ao longo de 250 realizaes independentes do algoritmo para equalizao cega baseado no princpio da evoluo artificial (com P = 1, N = 300 partculas e suavizao de 5 amostras),
comparado com o desempenho do equalizador timo MAP (BCJR),
em funo da relao sinal-rudo (SNR) e da ordem assumida para o
canal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.5 Desempenho mdio ao longo de 250 realizaes independentes do algoritmo para equalizao cega baseado no princpio da evoluo artificial (com P = 5, N = 300 partculas e suavizao de 5 amostras),
comparado com o desempenho do equalizador timo MAP (BCJR),
em funo da relao sinal-rudo (SNR) e da ordem assumida para o
canal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.6 Desempenho mdio ao longo de 250 realizaes independentes do algoritmo para equalizao cega baseado no filtro de partculas determinstico (N = 300 partculas e suavizao de 5 amostras), comparado
com o desempenho do equalizador timo MAP (BCJR), em funo da
relao sinal-rudo (SNR) e da ordem assumida para o canal. . . . . .
viii
79
89
90
90
91
91
92
A.7 Desempenho mdio ao longo de 250 realizaes independentes do algoritmo para equalizao cega baseado no filtro de partculas estocstico (utilizando a funo de importncia tima, N = 300 partculas e
suavizao de 5 amostras), comparado com o desempenho do equalizador timo MAP (BCJR), em funo da relao sinal-rudo (SNR) e
da ordem assumida para o canal. . . . . . . . . . . . . . . . . . . . .
A.8 Desempenho mdio ao longo de 250 realizaes independentes do algoritmo para equalizao cega baseado no filtro de partculas estocstico (utilizando a funo de importncia a priori , N = 300 partculas
e suavizao de 5 amostras), comparado com o desempenho do equalizador timo MAP (BCJR), em funo da relao sinal-rudo (SNR)
e da ordem assumida para o canal. . . . . . . . . . . . . . . . . . . .
A.9 Desempenho mdio ao longo de 250 realizaes independentes do
equalizador timo MAP (linha cheia) e do algoritmos para equalizao cega baseado no filtros de partculas determinstico para canais
invariantes do tempo (linha tracejada)(utilizando N = 300 partculas
e suavizao (5 amostras)), em funo da relao sinal-rudo
(SNR) e
do valor = 0, 0125). . . . . . . . . . . . . . . . . . . . . . . . . .
A.13 Desempenho mdio ao longo de 250 realizaes independentes do
equalizador timo MAP (linha cheia) e do algoritmos para equalizao
cega baseado no princpio da evoluo artificial (linha tracejada)(com
P = 5, N = 1000 partculas e suavizao (5 amostras)), em funo da
relao sinal-rudo
(SNR) e do parmetro (indicado com mltiplos
do valor = 0, 0125). . . . . . . . . . . . . . . . . . . . . . . . . .
92
93
96
97
97
98
98
B.1 Desempenho mdio ao longo de 100 realizaes independentes do algoritmo para equalizao cega descrito na Sec. B.2 em funo da relao sinal-rudo(SNR) e o nmero de iteraes. . . . . . . . . . . . . . 105
ix
B.2 Desempenho mdio ao longo de 100 realizaes independentes da verso modificada do algoritmo para equalizao cega descrito na Sec. B.2.1
((i) = 100,1i ) em funo da relao sinal-rudo(SNR) e o nmero de
iteraes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
B.3 Desempenho mdio ao longo de 100 realizaes independentes da verso modificada do algoritmo para equalizao cega descrito na Sec. B.2.1
((i) = 100,05i ) em funo da relao sinal-rudo(SNR) e o nmero de
iteraes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
C.1 Desempenho mdio ao longo de 100 realizaes independentes do algoritmo para equalizao cega baseado no amostrador de Gibbs conjunto descrito na Sec. C.4.3 em funo da relao sinal-rudo (SNR) e
do nmero de iteraes da Cadeia de Markov. . . . . . . . . . . . . . 119
Lista de Tabelas
2.1
2.2
2.3
3.1
3.2
3.3
3.4
3.5
3.6
4.1
4.2
4.3
5.1
Algoritmo para equalizao e decodificao conjunta em sistemas empregando cdigos de bloco sistemticos baseado no algoritmo SIR estocstico, empregando a funo de importncia tima. . . . . . . . . .
Cdigos de bloco empregados nas simulaes da Seo 4.2.1: cada
matriz coleciona em suas linhas as palavras de cdigos vlidas. . . . .
Algoritmo para equalizao e decodificao conjunta em sistemas empregando cdigos convolucionais baseado no algoritmo SIR estocstico, empregando a funo de importncia tima. . . . . . . . . . . .
Complexidade computacional de diversos algoritmos para equalizao
cega, em funo da ordem do canal a equalizar L, do nmero de amostras de sinal tratado A, no nmero de partculas ou iteraes N , sendo
o uma constante tal que 1 o 10. . . . . . . . . . . . . . . . . .
14
16
17
34
36
37
38
39
52
56
59
63
78
xi
xii
Lista de Smbolos
AH
AT
L
N
T
bn
xn
yn
qa:b
{qi }N
i=0
x (x)
N (x|, 2 )
NC (x|, 2 )
BL (A)
I {A}
(x)
P(A)
p(x)
py (x)
|A|
A
E
xiii
Lista de Abreviaturas3
AR(n)
BER
BPSK
EA
EM
IID
ISI
LMMSE
LS
MAP
MCMC
ML
MMSE
QPSK
SNR
v.a.
xiv
Resumo
Nesta tese analisamos e propomos mtodos para a equalizao no-treinada (cega) de
canais de comunicao lineares FIR baseados em filtros de partculas, que so tcnicas
recursivas para a soluo Bayesiana de problemas de filtragem estocstica. Iniciamos propondo novos mtodos para equalizao sob rudo gaussiano que prescindem
do uso de codificao diferencial, ao contrrio dos mtodos existentes. Empregando
tcnicas de evoluo artificial de parmetros, estendemos estes resultados para o caso
de rudo aditivo com distribuio no-gaussiana. Em seguida, desenvolvemos novos
mtodos baseados nos mesmos princpios para equalizar e decodificar conjuntamente
sistemas de comunicao que empregam cdigos convolucionais ou em bloco. Atravs
de simulaes numricas, observamos que os algoritmos propostos apresentam desempenhos, medidos em termos de taxa mdia de erro de bit e velocidade de convergncia,
marcadamente superiores aos de mtodos tradicionais, freqentemente aproximando o
desempenho dos algoritmos timos (MAP) treinados. Alm disso, observamos que os
mtodos baseados em filtros de partculas determinsticos exibem desempenhos consistentemente superiores aos dos demais mtodos, sendo portanto a melhor escolha
caso o modelo de sinal empregado permita a marginalizao analtica dos parmetros
desconhecidos do canal.
xv
Abstract
In this thesis, we propose and analyze blind equalization methods suitable for linear
FIR communications channels, focusing on the development of algorithms based on
particle filters - recursive methods for approximating Bayesian solutions to stochastic
filtering problems. Initially, we propose new equalization methods for signal models
with gaussian additive noise that dispense with the need for differentially encoding
the transmitted signals, as opposed to the previously existing methods. Next, we extend these algorithms to deal with non-gaussian additive noise by deploying artificial
parameter evolution techniques. We next develop new joint blind equalization and decoding algorithms, suitable for convolutionally or block-coded communications systems. Via numerical simulations we show that the proposed algorithms outperform
traditional approaches both in terms of mean bit error rate and convergence speed, and
closely approach the performance of the optimal (MAP) trained equalizer. Furthermore, we observed that the methods based on deterministic particle filters consistently
outperform those based on stochastic approaches, making them preferable when the
adopted signal model allows for the analytic marginalization of the unknown channel
parameters.
xvi
Captulo 1
Introduo
A equalizao cega de canais de comunicao tornou-se um dos tpicos mais
freqentes na literatura especializada em processamento digital de sinais nas ltimas
dcadas, tanto pela dificuldade como pelos potenciais ganhos associados sua soluo.
Esta tcnica - que consiste de estimar uma mensagem digital transmitida por um canal seletivo em freqncia (de parmetros desconhecidos) a partir da observao exclusiva das sadas deste canal - permite contrabalanar os efeitos deletrios da propagao
de sinais por canais dispersivos sem incorrer em desperdcio de banda, seja pela necessidade de transmitir informaes redundantes (OFDM) ou conhecidas (equalizao
treinada) para obter os mesmos efeitos, encontrando aplicao em todos os sistemas
modernos de comunicao digital (telefones mveis, dispositivos GPS, receptores de
rdio e TV digitais).
Desde a publicao do trabalho pioneiro de Sato [2] desenvolveu-se uma extensa
literatura sobre algoritmos cegos para a equalizao/identificao de canais de comunicao [3]. Dada a impossibilidade prtica1 de se calcular a soluo tima deste
problema, a maioria dos mtodos inicialmente desenvolvidos (CMA, predio linear,
etc. [4]) envolve a determinao de um filtro inverso, tendo portanto o seu desempenho limitado por aquele do equalizador linear timo (calculado atravs da equao
de Wiener-Hopf [5]), que pode ser bastante insatisfatrio caso o canal de transmisso
equivalente em tempo discreto possua zeros sobre a circunferncia unitria.
Alm levar a um desempenho inferior ao que seria obtido caso se empregassem
estimativas Bayesianas, a maioria destes mtodos se fundamenta, explicitamente ou
no, na estimao de momentos dos sinais recebidos, o que introduz limitaes intrnsecas: por um lado, mtodos baseados em momentos de ordem superior exibem, em
1
Verifica-se facilmente que a determinao exata da densidade a posteriori dos smbolos transmitidos (necessria para a determinao da soluo tima MAP) requer a realizao de uma busca exaustiva
sobre todas mensagens possveis de serem transmitidas, cujo nmero cresce exponencialmente com o
tamanho do bloco de sinal recebido.
1.1
Formulao do Problema
Este trabalho tem por foco a deteco de smbolos transmitidos por sistemas de comunicao digitais lineares atravs de canais seletivos em freqncia FIR. Denotando por x0:n
a seqncia de smbolos transmitidos at o instante n, assumiremos que as amostras
yn do sinal recebido em banda-base obtidas taxa de smbolo T (i.e., yn = y(t T n))
2
L1
xni hi,n + vn ,
(1.1)
i=0
em que:
hi,n denota o isimo termo da resposta ao impulso do canal no instante n;
L denota a ordem (i.e., o nmero de coeficientes no-nulos da resposta ao impulso) do canal;
vn representa a contribuio do rudo aditivo.
Nos prximos captulos, descrevemos mtodos para a estimao dos smbolos
transmitidos adotando diferentes hipteses sobre cada um dos componentes do modelo descrito em (1.1), sem jamais abandon-lo, no entanto.
Nos termos da Eq. (1.1), a forma mais bsica do problema da equalizao cega
consiste de estimar a seqncia de smbolos transmitida x0:n baseando-se na observao de y0:m , m n, tendo conhecimento das estatsticas a priori dos parmetros do
canal, do rudo aditivo a da seqncia transmitida.
Este problema, que permaneceu sem soluo at 1.975, de fato bastante desafiador do ponto de vista da teoria de estimao, podendo ser entendido como um caso
particular de uma classe mais ampla de problemas de filtragem estocstica [14], uma
vez que (1.1) pode ser reescrita de modo que as variveis a estimar (smbolos transmitidos) constituam o estado desconhecido de um sistema dinmico
Xn+1 = F Xn + f xn
yn
= hH
n Xn + vn
(1.2)
1
1 0
0 0
0 0
F = 0 1
f =
..
.
...
0 0
0
0
1 0
Ao se reformular o problema da equalizao cega como um problema de filtragem estocstica, diversas concluses decorrem de forma imediata. Primeiramente, o
2
Este modelo de sinal representa fielmente o sinal recebido em banda base por um sistema de comunicaes linear caso o receptor esteja perfeitamente sincronizado como o receptor.
F
0
X
x
X
n+1
k
n
=
+
hn
hn
0
0 I
yn
= g(Xn , h) + vn
(1.3)
com g(Xn , hn ) = hH
n Xn , o que permite que se descreva o sinal observado como uma
funo no-linear de um vetor de estado estendido (pela incluso dos parmetros do
canal). Esta representao permite o uso de verses linearizadas do filtro de Kalman,
como por exemplo o EKF (Extended Kalman Filter). Infelizmente, o algoritmo obtido
em [16] apresenta srios problemas de estabilidade numrica, comuns maioria dos
mtodos baseados no EKF.
1.2
Equalizao Bayesiana
Neste caso, tima nos sentidos de MMSE, ML e MAP simultaneamente, pelo fato de Xn de um
vetor aleatria gaussiano.
4
Recebe a denominao LMMSE (Linear Minimum Mean Square Estimator) o estimador linear que
minimiza o erro mdio quadrtico.
posteriori ), i.e.
xl = arg max P(xl = x|y0:n ) .
x
(1.4)
1.3
Organizao do texto
fcil demonstrar que a distribuio em questo uma razo de somas de gaussianas, sendo o
nmero de termos das somas uma funo exponencial do tamanho do bloco n [18].
6
Esta limitao se deve primordialmente necessidade de se calcular e maximizar analiticamente
determinadas esperanas condicionais [19].
7
O mtodo determina aproximaes das estimativa ML/MAP dos parmetros do canal, que podem
ser empregadas para estimar (de forma subtima) os smbolos transmitidos.
no tempo, apresentando novas tcnicas para a soluo do problema da ambigidade de fase. Este captulo introduz tambm o uso de tcnicas de evoluo artificial de parmetros (EA) em equalizao, utilizando-as no desenvolvimento de
algoritmos para modelos de sinal com rudo aditivo no-gaussiano.
O Cap. 4 apresenta mtodos inditos para a equalizao cega e decodificao
conjuntas baseados em filtros de partculas. A Sec. 4.2 descreve um mtodo que
estima diretamente o sinal codificado, especialmente adequado a sistemas de comunicao que empregam cdigos de bloco sistemticos, enquanto a Sec. 4.3
apresenta uma segunda famlia de algoritmos, adequada a sistemas que empregam codificao convolucional.
As concluses, bem como sugestes de tpicos para investigaes futuras so deixadas para o Cap. 5.
No Apndice A, avaliamos o desempenho dos algoritmos descritos no Cap. 3 em situaes nas quais a ordem exata do canal desconhecida, estendendo-os tambm para
a equalizao de canais variantes no tempo segundo um modelo AR(1). Nos Apndices B e C, por sua vez, empregamos mtodos alternativos de estimao Bayesiana para
a soluo do problema da equalizao cega: no Apndice B, apresentamos a verso
Bayesiana do algoritmo EM, utilizando-a no desenvolvimento de um algoritmo para
identificao cega e avaliando o seu desempenho atravs de simulaes numricas; no
Apndice C, por sua vez, apresentamos uma breve introduo aos mtodos MCMC,
mostrando em seguida dois mtodos para equalizao cega baseados no Amostrador
de Gibbs.
1.4
Principais Contribuies
Neste trabalho, analisamos e estendemos diversos mtodos para equalizao propostos principalmente em [1],[11],[12] e [13]. Dentre os resultados originais obtidos,
destacam-se como mais importantes:
Desenvolvimento novos mtodos para a soluo do problema da ambigidade
de fase, atravs de novos algoritmos para equalizao (Cap. 3) e da utilizao de
cdigos com invarincias rotacionais (Cap. 4).
Desenvolvimento de algoritmos para equalizao cega sob rudo aditivo nogaussiano [20] (Cap. 3).
Desenvolvimento de algoritmos para equalizao e decodificao conjuntas em
canais seletivos em freqncia [21][22][23] (Cap. 4).
6
1.5
Publicaes
O contedo desta tese deu origem s seguintes publicaes (anexadas ao final deste
documento):
O artigo Particle Filters for Blind FIR Channel Equalization in Non-Gaussian
Noise [20], aceito para publicao nos anais do ICASSP 2006, trata do contedo
da Sec. 4.3, descrevendo um algoritmo para equalizao cega em modelos de sinal
com rudos de envoltria Weibull. Este trabalho inova ao propor o uso de tcnicas de
evoluo artificial de parmetros para equalizao cega, o que permite que se relaxe a
hiptese usual de gaussianidade do rudo aditivo.
O artigo Joint Blind Equalization and Decoding using Particle Filters [21], publicado nos anais do IEEE International Symposium on Signal Processing and Information Technology, aborda o contedo da Sec. 4.2 deste texto, propondo um novo
algoritmo para a equalizao e decodificao conjuntas em sistemas empregando cdigos de bloco.
O artigo Particle filter Algorithms for Joint Blind Equalization/Decoding of Convolutionally Coded Signals [22], publicado nos anais do ICASSP 2005, expe basicamente o contedo da Sec. 4.3, descrevendo um algoritmo para equalizao/decodificao conjuntas adequado a sinais codificados convolucionalmente. Em especial,
tratado o caso em que o cdigo empregado no-coerentemente no-catastrfico,
propriedade que permite contornar o problema da ambigidade de fase sem recorrer
aos artifcios mais comumente empregados na literatura.
O artigoDeterministic Particle Filters for Joint Blind Equalization and Decoding
in Frequency Selective Channels [23], publicao nos anais do IEEE Statistical Signal
Processing Workshop - SSP 05, aborda o resultado da Sec. 4.3, enfocando porm o uso
de cdigos convolucionais recursivos e de filtros de partculas combinando estruturas
estocsticas e determinsticas.
O artigo Equalizao Cega de Canais Lineares FIR empregando o Algoritmo
EM Bayesiano [24], publicado nos anais do XXII Simpsio Brasileiro de Telecomunicaes, que consiste do contedo do Apndice B, no qual aplicamos uma verso
Bayesiana do algoritmo EM para a equalizao cega de canais invariantes no tempo,
empregando mtodos de simulated annealing para a melhoria das caractersticas de
convergncia deste algoritmo.
Captulo 2
Filtros de Partculas
Neste captulo apresentamos os fundamentos da teoria dos filtros de partculas - mtodos recursivos para a aproximao de solues Bayesianas para problemas de filtragem estocstica. Aps deduzir na Sec. 2.1 o equacionamento bsico destes mtodos,
demonstrando a partir de princpios bsicos de teoria de probabilidade o uso de medidas empricas para a aproximao recursiva de densidades a posteriori, discutimos nas
Sec. 2.2 e 2.3 aspectos relacionados implementao dos mesmos, como a escolha da
chamada funo de importncia e do mtodo de reamostragem. Na Sec. 2.4, por sua
vez, descrevemos as verses estocstica e determinstica do algoritmo SIR (Sequential
Importance Resampling), generalizaes do filtro Bootstrap que empregamos ao longo
deste trabalho na soluo de problemas de comunicao.
Na Sec. 2.5, discutimos como aplicar filtros de partculas em modelos de sinal com
parmetros desconhecidos, classe de problemas cuja equalizao cega um exemplo. Conforme mostramos, problemas desta categoria podem ser resolvidos atravs da
marginalizao analtica (Rao-Blackwellizao) ou numrica (Evoluo Artificial) dos
parmetros desconhecidos. Por fim, a Sec. 2.6 contm dois exemplos de uso de filtros
de partculas em problemas de estimao.
2.1
Introduo
delar y0:n como a sada de um sistema dinmico, cuja varivel a estimar seja igual
(ou uma funo simples da) varivel de estado Xn :
Xn+1 = fn (X0:n , un )
yn
= gn (X0:n , vn )
(2.1)
N
i=1
(i)
(i)
wn (X0:n X0:n )
,
N
(i)
w
n
i=1
(2.2)
em que
(i)
(i)
(i)
(i)
n
(2.3)
k=1
p(X0:n |y0:n )
.
(X0:n |y0:n )
(2.4)
(2.5)
(2.6)
(2.7)
10
obtemos finalmente:
wn wn1
(2.8)
2.2
Degenerescncia e Reamostragem
N+
N
2
N wn(i) 1
1
.
(2.9)
i=1
(i)
das partculas com pesos maiores, idealmente sem introduzir perturbaes adicionais
nas estimativas de p(X0:n |y0:n ). Assim, dada a estimativa atual pN (X0:n |y0:n ), defi(i)
(i)
nida pelo conjunto de partculas e pesos {X0:n , wn }, deseja-se encontrar uma nova
k(i)
(i)
estimativa pN (X0:n |y0:n ), definida pelo conjunto {X0:n , wn = 1/N } (i.e., com pesos
uniformes), que seja prxima a pN (X0:n |y0:n ) segundo algum critrio.
Nas sees a seguir descrevemos alguns do diversos algoritmos para reamostragem
empregados na literatura.
i=1
(0)
com wn 0. Amostras de distribuies uniformes, por sua vez, podem ser obtidas
de acordo com inmeros mtodos derivados da teoria de nmeros, como os descritos
em [19].
12
E[k (i) ] = N w
(i)
+N
N w(i)
w(i)
N
= N w(i) .
(2.12)
(i 1) + un
, un U[0 ; 1[
N
(2.13)
i1
j=1
w(j) ;
i
w(j)
(2.14)
j=1
Alm de poder ser implementado com complexidade O(N ) pode-se verificar ([9],
Cap. 2) que o mtodo de reamostragem sistemtica timo no sentido de minimizar
E|
pN (X0:n |y0:n ) pN (X0:n |y0:n )|2 .
13
2.3
Embora a funo de importncia (Xn |X0:n1 , y0:n ) possa ser escolhida de forma essencialmente arbitrria5 , duas escolhas so particularmente freqentes na literatura sobre filtros de partculas: a funo de importncia tima e a funo de importncia a
priori.
14
(2.16)
A funo de importncia tima, por sua vez, pode ser obtida atravs da relao
p(Xn |X0:n1 , y0:n ) =
(2.18)
Note que a definio que empregamos nesta tese para a funo de importncia a priori mais geral
que a comumente encontrada na literatura, que particularizada para HMMs.
15
2.4
Algoritmo SIR
(2.19)
Observar que o algoritmo SIR reduz-se ao filtro bootstrap caso se adote (Xn |X0:n1 , y0:n ) =
p(Xn |X0:n1 , y0:n1 ) e TM IN = 1.
7
16
Isto implica que, num instante n, so calculadas as verossimilhanas de todos os estados Xn possveis. Dai, surgiu a idia de, ao invs de selecionar independentemente
(i)
(i)
um novo vetor de estados Xn para cada partcula dado Xn1 (como no algoritmo SIR
tradicional), selecionar N partculas dentre o conjunto de N D vetores Xn possveis8
(i)
(dados Xn1 , 0 < i N ). Na Tab. 2.3 descrevemos o algoritmo resultante.
(Inicializao)
Para i = 0 : N ,
(i)
X0 p(X0 ).
(i)
w0 = 1/N .
Fim
(Algoritmo)
Para n > 0,
1) Para i = 1 : N ,
Para j = 1 : D,
Calcule e normalize os pesos
(i,j)
(i)
(i,j)
(i)
wn wn1 p(Xn , yn |X0:n1 , y0:n1 )
Fim
Fim
2) Utilizando um mtodo de reamostragem estocstico ou determinstico,
(i,j)
selecione N entre os N D pares (i, j) baseado nos pesos wn ,
formando o conjunto {Ii , Ji }N
i=1 .
3) Para i = 1 : N ,
(i)
(I ,J )
(i)
(I ,J )
Faa Xn = Xn i i e wn = wn i i .
Fim
(i)
(i)
4) Estime p(X0:n |y0:n ) N
i=1 wn (X0:n X0:n ).
Fim
Tabela 2.3: Algoritmo SIR Determinstico.
Uma justificativa terica para o funcionamento
do algoritmo
SIR determinstico
(i,j)
(i,j
(i,j)
pode ser dada pela observao de que o conjunto wn , Xn ) (em que Xn denota
(i)
cada um dos D estados atingveis dado Xn1 , indexados em qualquer ordem) uma
amostra da densidade a posteriori desejada p(X0:n |y0:n ). Para demonstrar isto, note
que o procedimento descrito na Tab. 2.4 pode ser interpretado como uma instncia do
(i,j)
algoritmo SIR convencional, em que Xn obtido como
Xn(i,j) I
(i)
Xn(i,j) atingvel dado Xn1 Xn(i,j)
= Xn(i,k) , k
= j
, (2.20)
Estamos adotando por definio que cada vetor Xn s pode assumir D valores distintos dado Xn1 .
Conforme veremos nos prximos captulos, no caso de um sistema de comunicao digital, D ser
equivalente dimenso da constelao empregada.
17
(i)
(2.21)
o que obedece (2.8) uma vez que a funo de importncia empregada sempre unitria
(i,j)
para os valores de Xn possveis.
(i,j)
(i,j
Pelo fato do conjunto wn , Xn ) conter N D amostras, obrigatria a realizao de um passo de reamostragem a cada iterao para que o nmero de partculas
utilizado seja mantido constante. Isto pode ser feito atravs dos mtodos estocsticos descritos na Sec. 2.2 ou atravs de procedimentos determinsticos. Em particular,
o procedimento determinstico9 apresentado em [30], que consiste simplesmente em
(i,j)
selecionar os N elementos de Xn com os maiores pesos, freqentemente leva (por
razes ainda mal compreendidas) a resultados melhores do que os que se obteriam
utilizando mtodos de reamostragem estocstica [12].
(2.22)
Salvo meno em contrrio, utilizaremos este mtodo de reamostragem sempre que empregarmos
o algoritmo SIR determinstico.
18
2.5
Xn+1 = fn (n , X0:n , un )
n+1 = n (0:n , n )
yn
= gn (n , X0:n , vn )
(2.23)
Xn+1 = fn (X0:n ) + un
n+1 = n (n ) + n
yn
= gn (n , Xn ) + vn
(2.24)
2.5.1 Rao-Blackwellizao
Considerando o modelo de (2.24), poder-se-ia em princpio projetar um filtro de partculas para a aproximao da densidade conjunta p(X0:n , 0:n |y0:n ) utilizando os mtodos j descritos. Caso no haja interesse na estimao dos parmetros 0:n , no entanto,
19
(2.25)
(2.27)
e que
p(yn , n |X0:n , y0:n1 ) = p(yn |n , X0:n , y0:n1 )p(n |X0:n , y0:n1 ) .
(2.28)
(2.29)
e que
p(n |X0:n , y0:n1 ) = p(n |X0:n1 , y0:n1 ) .
(2.30)
20
interesse, necessrio:
Determinar p(Xn |X0:n1 ) (2.26);
Determinar pvn (yn gn (n , Xn )) (2.29);
Calcular a integral de (2.27);
Calcular p(n |X0:n1 , y0:n1 ) recursivamente.
Esta ltima exigncia , em geral, a mais restritiva, uma vez que a densidade
p(n |X0:n1 , y0:n1 ) a soluo de um segundo problema de filtragem estocstica:
n+1 = n (n ) + n
yn
= gn (n , Xn ) + vn
(2.31)
Como bem conhecido [14], o problema de (2.31) s admite soluo fechada nos
casos em que n e gn so lineares e n e vn so processos gaussianos. Neste caso
p(n |X0:n1 , y0:n1 ) gaussiana e pode ser calculada recursivamente atravs de um
filtro de Kalman, podendo tambm a integral de (2.27) ser calculada de forma trivial12 .
(X0:n , 0:n |y0:n ) = (X0:n1 , 0:n1 |y0:n1 )(Xn , n |X0:n1 , y0:n1 , 0:n1 ) ,
(2.33)
chega-se concluso de que, ao amostrar
{Xn , n } (Xn , n |X0:n1 , y0:n1 , 0:n1 ) ,
12
(2.34)
21
(2.35)
A densidade conjunta necessria atualizao dos pesos em (2.35) pode (em geral)
ser reescrita como
p(Xn , yn , n |X0:n1 , 0:n1 , y0:n1 ) = p(yn |X0:n , 0:n , y0:n1 )
p(Xn |X0:n1 , 0:n , y0:n1 )p(n |X0:n1 , 0:n1 , y0:n1 ) .
(2.36)
(2.38)
caso em que os pesos podem ser atualizados de acordo com a verossimilhana dos
pares (Xn , n ):
wn+1 = wn p(yn |Xn , n ) .
(2.39)
Observao 3 Observe que o princpio de evoluo artificial no pode ser empregado
em conjunto com o algoritmo SIR determinstico se a varivel de estado estimada
contiver elementos contnuos. Outro aspecto importante que, se o modelo tratado
13
uma vez que yn independente de das demais variveis dados n e Xn . Por outro lado, observe que Xn
independe de n se yn no for dado, implicando que:
p(Xn |X0:n1 , 0:n , y0:n1 ) = p(Xn |X0:n1 , 0:n1 , y0:n1 ) = p(Xn |X0:n1 ) .
De mesma forma, como n independe das demais variveis dado n1 , segue finalmente que
p(n |X0:n1 , 0:n1 , y0:n1 ) = p(n |n1 ) .
22
(2.40)
resulta, como conseqncia de (2.37), que qualquer partcula para que n
= 0 ter
seu peso anulado, e, conseqentemente, ser descartada no prximo passo de reamostragem. Este fato, que impede a adaptao do algoritmo, usualmente contornado
pela adoo de densidades de transio p(n |0:n1 ) suavizadas para os parmetros, usualmente densidades gaussianas com varincia fixa
p(n |0:n1 ) = N (n |n1 ; R) ,
(2.41)
2.6
(2.43)
(2.44)
(2.46)
!
2
2
2 2
n1 v
v
N (yn |Xn1 ; u2 + v2 ) .
; 2u+
N Xn | yn u+X
2 + 2
2
u
(2.47)
yn u2 + Xn1 v2 u2 v2
Xn |
; 2
u2 + v2
u + v2
#
(2.48)
24
(2.49)
(2.50)
Algoritmo
A adaptao do filtro de partculas descrito na Tabela 2.2 ao modelo de (2.42) resulta
ento no seguinte algoritmo:
Inicialize o algoritmo como descrito na Tabela 2.2.
Amostre cada partcula fazendo
Xn(i) N
(i)
yn u2 + Xn1 v2 u2 v2
Xn |
; 2
u2 + v2
u + v2
.
(2.51)
(i)
(2.52)
2
n1 v
2 PPn1
+v2
Pn1
(yn
Pn1 +v2
n1 )
X
(2.53)
u2
0 = E[Xn ] = 0 e P0 = u2 .
iniciadas com X
Simulao
Geramos uma seqncia de 100 amostras de Xn e yn de acordo com o modelo (2.42),
utilizando = 0, 999, u2 = 0, 1 e v2 = 0, 5. Em seguida, estimamos (a mdia
de) x0:100 a partir de y0:100 utilizando um filtro de Kalman e um filtro de partculas
(empregando M = 100 partculas, sem reamostragem). Na Figura 2.1 mostramos
os resultados obtidos. Como se pode observar, ambas as estimativas seguem o sinal
original com preciso razovel. Observou-se, no entanto, que varincia do erro de
estimao do filtro de partculas neste experimento (no mostrada no grfico) foi igual
25
a 0,16, maior que o observado para o filtro de Kalman (0,14), o que justificvel pelo
fato do filtro de Kalman ser timo para este modelo de sinal.
1.5
exato
KF
PF
0.5
-0.5
-1
-1.5
10
20
30
40
50
60
70
80
90
100
Figura 2.1: Grfico de uma realizao de X0:n gerado pelo modelo dado em (2.42) e
de suas estimativas atravs de um filtro de Kalman (KF) e de um filtro de partculas
(PF).
Xn+1 = Xn + un
1
yn
= (Xn ) 3 + vn
(2.54)
26
Xn(i) N Xn |Xn1 ; u2
!
.
(2.55)
(2.56)
Hn =
Pn|n1
n = HnH Pn|n1 Hn + v2
n = X
n1 + 1 [yn (X
n1 ) 13 ]Pn|n1 Hn
X
n
(2.57)
H
Pn = Pn|n1 n1 Pn|n1 Hn HnH Pn|n1
0 = E[Xn ] = 0 e P0 = u2 .
iniciadas com X
2.6.3 Simulao
Geramos uma seqncia de 100 amostras de Xn e yn de acordo com o modelo (2.54),
com = 0, 999, u2 = 0, 1 e v2 = 1. Em seguida, estimamos (a mdia de) x0:100 a
partir de y0:100 utilizando um filtro de Kalman estendido (EKF) e o filtro de partculas
descrito na Sec. 2.6.2 (empregando M = 150 partculas, com reamostragem multinomial acionada sempre que o tamanho efetivo da amostra cai abaixo de 50%). A Figura
2.1 ilustra os resultados obtidos. Como se pode observar, ambas as estimativas seguem
o sinal original com preciso razovel. Neste caso, ao contrrio do exemplo anterior, as
estimativas produzidas pelo filtro de partculas foram mais precisas: a varincia mdia
do erro de estimao (ao longo de 100 realizaes) foi igual a 0, 4806, contra um valor
27
8
exato
EKF
PF
xk
-1
10
20
30
40
50
k
60
70
80
90
100
Figura 2.2: Grfico de uma realizao de X0:n gerado pelo modelo dado em (2.54) e
de suas estimativas atravs de um filtro de Kalman estendido (EKF) e de um filtro de
partculas (PF).
28
Captulo 3
Filtro de Partculas para Equalizao
Cega
Neste captulo, empregamos filtros de partculas na soluo do problema de equalizao cega de canais lineares FIR invariantes no tempo. Este problema, que talvez
constitua uma das formulaes mais imediatas de filtragem estocstica com parmetros
desconhecidos, afetado intrinsecamente por ambigidades de fase, que impossibilitam a operao dos filtros de partculas caso providncias para estabelecer coerncia
de fase (entre as partculas) no sejam tomadas.
Desta forma, aps descrever o modelo de sinal adotado (Sec. 3.1) e deduzir o equacionamento bsico dos filtros de partculas Rao-Blackwellizados (Sec. 3.2), propomos
na Sec. 3.3 trs diferentes mtodos para contornar os efeitos da ambigidade de fase. A
Sec. 3.4, por sua vez, descreve mtodos para equalizao cega baseados em evoluo
artificial, os quais, diferentemente dos algoritmos empregando Rao-Blackwellizao,
so capazes de operar sob rudos aditivos no-gaussianos. Finalizando este captulo,
a Sec. 3.5 rene o resultado de simulaes numricas nas quais o desempenho dos
mtodos propostos avaliado.
3.1
Neste captulo, desenvolvemos filtros de partculas para a equalizao de canais de ordem conhecida e invariantes no tempo. Retomando a notao apresentada na Sec. 1.1,
adotamos que as amostras yn do sinal recebido em banda base podem ser descritas
como
L1
yn =
hi xni + vn ,
(3.1)
i=0
29
Xn+1 = F Xn + f xn+1
yn
= hH Xn + vn
(3.2)
n
I{Xm+1 = F Xm + f xm+1 } .
(3.3)
m=1
ou seja, caso X0:n relacione-se a xL+1:n de acordo com o modelo dado em (3.2) e
p(xL+1:1 ) seja uniforme, temos que
p(X0:n |y0:n ) = p(x0:n |y0:n ) .
3.2
Nesta seo, deduzimos as densidades necessrias ao funcionamento de filtros de partculas Rao-Blackwellizados (Sec. 2.5.1) para o modelo de sinal de (3.2) com canais h de ordem L conhecida. Como mostrado na Sec. 2.4, para projetarmos filtros de partculas para a aproximao de p(X0:n |y0:n ), devemos1 obter a expresso de
30
(3.4)
Explorando o modelo de sinal e utilizando argumentos semelhantes aos de (3.3) obtemos que o segundo termo do lado direito de (3.4) dado por
p(Xn |X0:n1 , y0:n1 ) = p(Xn |X0:n1 ) = p(xn |x0:n1 ) .
(3.5)
O clculo do primeiro termo do lado direito de (3.4) envolve manipulaes algbricas bastante extensas, mostradas em detalhes no Apndice D2 . Apresentamos aqui
uma verso resumida deste clculo, que se inicia pela observao de que
p(yn |X0:n , y0:n1 ) =
(3.6)
(3.7)
(3.8)
A obteno de uma expresso para o segundo termo do lado direito de (3.7) bastante
mais complexa. Para isto exploramos inicialmente o fato de que
p(h|X0:n , y0:n1 ) = p(h|X0:n1 , y0:n1 ) .
1
(3.9)
e a densidade
p(yn |X0:n1 , y0:n1 ) =
31
Como yn hH Xn +vn , conclui-se que, caso h tenha uma densidade a priori gaussiana
0;
0 ), a densidade a posteriori p(h|X0:n1 , y0:n1 ) tambm ser
da forma h N (h|h
gaussiana, podendo ser calculada atravs de um filtro de Kalman, projetado para o
seguinte modelo:
h = h
.
(3.10)
yn = hH Xn + vn
Projetando o filtro de Kalman para o modelo dado em (3.10), obtemos que
n1 ;
n1 ),
p(h|X0:n1 , y0:n1 ) = N (h|h
em que:
H Xn
yn h
n1
n1 Xn
Xn n1 Xn + v2
n1
n1 Xn XnH
= n1
n1 Xn + v2
XnH
n = h
n1 +
h
(3.11)
(3.12)
n1 ;
n1 )N (yn |hH Xn ; 2 ) .
dh N (h|h
v
(3.13)
Observe que, para poder calcular a integral em (3.13), devemos manipular as densidades gaussianas de forma a isolar os termos dependentes de h. Aps manipulaes
algbricas bastante longas, resulta que:
n1 ;
n1 )N (yn |hH Xn ; v2 ) =
N (h|h
n;
H Xn ; 2 + X H
n1 xn ) ,
n )N (yn |h
N (h|h
n1
v
n
(3.14)
(3.15)
32
Apesar de, em princpio, o resultado de (3.16) permitir o uso de qualquer uma das
verses do algoritmo SIR (Sec. 2.4) para a estimao de x0:n , a ambigidade4 de fase
inerente ao problema da equalizao cega destri a aproximao pN (x0:n |y0:n ) ao fazer
com que cada partcula seja afetada por uma rotao de fase arbitrria (i) .
Observao 2 Na prtica, devido replicao de partculas decorrente da reamostragem, o conjunto de valores assumidos pelas rotaes de fase (i) no uniformemente distribudo (como seriam caso as partculas evolussem independentemente).
Isto termina permitindo a obteno de aproximaes (potencialmente viesadas) de
p(x0:n |y0:n ), mesmo ao se desconsiderar os efeitos da ambigidade de fase.
3.3
(3.17)
(3.18)
Pelas relaes anteriores, a seqncia transmitida x1:n define unicamente a seqncia b0:n , o que, pelos mesmos argumentos de (3.3), implica que
(i)
(i)
33
(i)
podendo a densidade p(b0:n |y0:n ) ser estimada atravs do algoritmo da Tabela6 3.1.
(Inicializao)
Para i = 1 : N
(i)
X0 BL (1)
(i)
h0 N (h|h0 ; 0 )
Fim
(Algoritmo)
Para n > 0
1) Para i = 1 : N
(i)
(i)
A) Amostre Xn p(Xn |X0:n1 , y0:n )
(i)
(i)
(i)
B) Calcule e normalize os pesos wn = wn1 p(yn |X0:n1 , y0:n1 )
(i)
(i)
(i)
C) Calcule bn = xn1 xn
Fim
2) Reamostre o conjunto de partculas, conforme o critrio adotado.
3) Estime a densidade a posteriori dos smbolos transmitidos como
(i)
p(bn = B|y0:n ) N 1 N
i=1 I{bn = B} .
Fim
Tabela 3.1: Equalizador cego baseado no algoritmo SIR estocstico, empregando a
funo de importncia tima e codificao diferencial.
No algoritmo da Tab. 3.1, o passo (A) certamente o que encerra a maior dificuldade. Assumindo que os smbolos binrios transmitidos bk sejam IID e equiprovveis,
verifica-se inicialmente que P(xn = 1|x0:n1 ) = 1/2. Assim, a cada instante n, a
(i)
varivel Xn pode assumir dois valores distintos, com probabilidade proporcional a
(i)
(i)H
(i)
(i)
2
(i)H
(i) e
(i)
sendo os parmetros h
n1
n1 determinados iterativamente atravs do filtro de Kalman de (3.12). Reunindo estes fatos, o passo (A) pode ser descrito mais detalhadamente como:
(i)
34
(i)
(i) e
(i)
Uma vez escolhido Xn , atualize os parmetros h
n1
n1 atravs de (3.12).
(i)
(i) (i)
(i)
(i)
b(i)
n = (xn )(xn1 ) = xn xn1 .
(3.20)
A densidade a posteriori p(b0:n |y0:n ) pode ser ento aproximada a partir das amos(i)
tras b0:n determinadas atravs de (3.20), levando a uma estimativa b0:n , a partir da qual
8
Utilizamos o termo pivotamento"(pivoting) para nos referir ao algoritmo descrito nesta seo devido semelhana entre este mtodo e determinados algoritmos empregados em clculo numrico, que
escolhem heuristicamente um elemento de um vetor ou matriz como referncia para a normalizao dos
demais (em mdulo, e no em fase como neste caso).
9
Pelo fato de que a estimativa dos parmetros do canal h(i) em geral no varia abruptamente caso
seja prxima do valor verdadeiro h. De qualquer forma, partculas distantes da modas das distribuio a
posteriori normalmente esto associadas a pesos baixos, no tendo grande impacto sobre as estimativas.
35
(Inicializao)
Para i = 1 : N
(i)
X0 BL (1)
(i)
h0 N (h|h0 ; 0 )
Fim
(Algoritmo)
Para n > 0
1) Para i = 1 : N
(i)
(i)
A) Amostre Xn p(Xn |X0:n1 , y0:n )
(i)
(i)
(i)
B) Calcule e normalize os pesos wn = wn1 p(yn |X0:n1 , y0:n1 )
(i)
C) Se hl < 0, para algum 0 l < L pr-determinado,
(i)
(i)
(i)
(i)
faa hl = hl e X0:n = X0:n
Fim
2) Reamostre o conjunto de partculas, conforme o critrio adotado.
3) Estime a densidade a posteriori dos smbolos transmitidos como
(i)
p(xn = X|y0:n ) N 1 N
i=1 I{xn = X} .
Fim
Tabela 3.2: Equalizador cego baseado no algoritmo SIR estocstico, empregando a
funo de importncia tima e pivotamento.
uma estimativa da seqncia transmitida x0:n (e no de sua densidade) pode ser obtida
codificando diferencialmente b0:n atravs de (3.17), como ilustramos na Tab. 3.3.
3.4
Apesar do modelo de sinal da Sec. 3.1 permitir o desenvolvimento de filtros de partculas Rao-Blackwellizados (que, em princpio, levariam a um desempenho superior ao
de outros mtodos que estimam diretamente os parmetros do modelo), nesta seo10
desenvolvemos algoritmos para equalizao cega baseados no princpio da evoluo
artificial de parmetros, descrito na Sec. 2.5.2.
Aplicando diretamente os resultados de (2.38)-(2.39) ao modelo de sinal da Sec. 3.1,
e adotando como ncleo de transio para os parmetros desconhecidos hn a densidade
p(hn |h0:n1 ) = N (hn |hn1 ; I2 ) ,
(3.21)
Embora os algoritmos aqui descritos possam operar de acordo com qualquer um mtodos para
a resoluo do problema da ambigidade de fase descritos na Sec. 3.3, limitamo-nos descrio de
algoritmos operando com sinais codificados diferencialmente.
36
(Inicializao)
Para i = 1 : N
(i)
X0 BL (1)
(i)
h0 N (h|h0 ; 0 )
Fim
(Algoritmo)
Para n > 0
1) Para i = 1 : N
(i)
(i)
A) Amostre Xn p(Xn |X0:n1 , y0:n )
(i)
(i)
(i)
B) Calcule e normalize os pesos wn = wn1 p(yn |X0:n1 , y0:n1 )
(i)
(i)
(i)
C) Calcule bn = xn1 xn
Fim
2) Reamostre o conjunto de partculas, conforme o critrio adotado.
3) Estime a densidade a posteriori
(i)
(i)
p(b0:n |y0:n ) N
i=1 wn (b0:n b0:n ) .
4) Determine a estimativa MAP b0:n .
5) Codifique diferencialmente b0:n , obtendo a estimativa x0:n .
Fim
Tabela 3.3: Equalizador cego baseado no algoritmo SIR estocstico, empregando a
funo de importncia tima e codificao diferencial implcita.
wellizados, este algoritmo , em tese, capaz de operar sob rudos com distribuies
genricas pvn , exibindo uma complexidade computacional por partcula bastante inferior dos mtodos descritos anteriormente.
Nas simulaes numricas realizadas na Sec. 3.5, verificamos que o algoritmo da
Tab. 3.4 no produz resultados satisfatrios, no importando o nmero de partculas
empregado. Aps uma extensa anlise de simulaes numricas, nas quais consideramos o uso de diversas funes de importncia e de estruturas de filtragem de partculas
diferentes do algoritmo SIR (algoritmo Resample-Move, Auxiliary Particle Filter [9]),
conclumos que o melhor desempenho entre os algoritmos baseados em evoluo artificial obtido pelo uso do algoritmo SIR em conjunto com a funo de importncia
discreta
(i)
(i)
(i)
(i,r)
(Xn , hn |X0:n1 , h0:n1 ) pvn (yn hH
n Xn )p(Xn |Xn1 )I{hn = hn },
(i,j)
(i)
(3.22)
37
(Inicializao)
Para i = 1 : N
(i)
X0 BL (1).
(i)
0 ; 0 ).
h0 N (h0 |h
Fim
(Algoritmo)
Para n > 0
1) Para i = 1 : N
(i)
(i)
A) Amostre hn N (hn |hn1 ; I2 ).
(i)
(i)
B) Amostre Xn p(Xn |Xn1 ).
(i)
(i)
C) Obtenha bn decodificando x0:n
D) Calcule e normalize os pesos
(i)
(i)H (i)
wn pvn (yn hn Xn ) .
Fim
(i)
2) Reamostre o conjunto de partculas de acordo com os pesos wn .
3) Estime p(bn ) por
(i)
p(bn = B|y0:n ) N 1 N
i=1 I{bn = B} .
Fim
Tabela 3.4: Algoritmo para equalizao cega sob rudo com distribuio genrica baseado no mtodo de evoluo artificial utilizando funo de importncia a priori .
Verifica-se facilmente que, neste caso, a funo de atualizao dos pesos dada por
wn wn1
(i)
(i)
2
pvn (yn h(r)H
Xn(s) )p(Xn(s) |Xn1 )N (h(r)
n
n |hn1 ; I /2) .
(3.23)
r,s
3.5
Simulaes
Para avaliar o desempenho dos algoritmos descritos neste captulo realizamos simulaes numricas, medindo as taxas mdias de erro de bit (BER) obtidas ao longo de
250 realizaes independentes. O sistema de comunicao analisado transmite blocos
de 400 smbolos BPSK (1) (independentes e equiprovveis, codificados diferencialmente ou no dependendo do algoritmo empregado). Em todas as simulaes, os 100
primeiros smbolos so descartados para fins de medio das taxas de erro de modo a
permitir a convergncia dos algoritmos analisados. Nas simulaes a seguir, empregamos o canal h = [ 0, 41 0, 82 0, 41]T e rudo aditivo gaussiano branco (real) de
mdia nula e varincia v2 . Os filtros de partculas so inicializados de forma aleatria,
38
(Inicializao)
Para i = 1 : N
(i)
0 ; 0 ).
h0 N (h0 |h
(i)
X0 p(X0 ).
Fim
(Algoritmo)
Para n > 0
1) Para i = 1 : N ,
A) Para r = 1 : P , amostre
(i,r)
(i)
hn N (hn |hn1 ; I(2 /2)).
Fim
B) Amostre Xn e hn conjuntamente da densidade discreta
(i)
(i,r)
(Xn , hn ) pvn (yn hH
n Xn )p(Xn |Xn1 )I{hn = hn },
C) Calcule e normalize os pesos
(i)
(r)H (s)
(s)
(i)
(r) (i)
wn r,s pvn (yn hn Xn )p(Xn |Xn1 )N (hn |hn1 ; I2 /2) .
(i)
(i)
D) Obtenha bn decodificando x0:n .
Fim
(i)
2) Reamostre o conjunto de partculas de acordo com os pesos wn .
3) Estime p(bn ) por
N 1
(i)
p(bn = B|y0:n ) N1 i=0
I{bn = B} .
Fim
Tabela 3.5: Algoritmo para equalizao cega sob rudo com distribuio genrica baseado no mtodo de evoluo artificial utilizando funo de importncia modificada.
(i)
h2
.
v2
39
Estes resultados tambm foram verificados para os mtodos empregando o algoritmo SIR estocstico e para o mtodo baseado em evoluo artificial, e no foram includos nos grficos para facilitar as
suas leituras.
40
Nas Figuras 3.8 e 3.9, avaliamos os efeitos da variao do parmetro 2 (varincia do ncleo de transio) sobre o desempenho dos algoritmos baseados em evoluo
artificial (EA), para P = 1 e P = 5, respectivamente, empregando N = 1000 partculas e um atraso de suavizao de 10 amostras. Como se pode observar, o valor de 2
escolhido estabelece um bom compromisso, uma vez que valores inferiores a este tendem a degradar o desempenho observado sob baixos nveis de rudo, enquanto valores
superiores produzem uma degradao em toda a faixa de SNR analisada.
Finalmente, nas Figuras (3.10)-(3.12) analisamos os efeitos conjuntos da variao
do nmero de partculas e do limiar de reamostragem sobre o desempenho dos algoritmos baseados em filtros de partculas estocsticos. Na Figura 3.10 mostramos
o desempenho obtido pelo mtodo estocstico empregando a funo de importncia
tima, enquanto na Fig. 3.11, o resultado para a funo de importncia a priori. Como
se pode observar, o efeito da diminuio do limiar de reamostragem pequeno, sendo
percebido com mais intensidade quando o nmero de partculas menor.
Na Fig. 3.12, repetimos o mesmo experimento com N = 300 partculas e suavizao (10 amostras). Neste caso, a diminuio do limiar de reamostragem produziu
resultados benficos, uma vez que algoritmos empregando suavizao so mais sensveis ao empobrecimento amostral causado pela reamostragem freqente do conjunto
de partculas.
41
10
BER
10
10
BCJR
Det (Dif.)
Det (Pivot.)
Det (Implic.)
Estoc. (Post.)
Estoc. Priori
EA (P=1)
EA (P=5)
10
10
10
SNR
12
14
16
18
20
Figura 3.1: Desempenho mdio ao longo de 250 realizaes independentes dos algoritmos para equalizao cega baseados em filtros de partculas descritos neste captulo,
num sistema BPSK (empregando N = 100 partculas) e do equalizador timo MAP
(BCJR), em funo da relao sinal-rudo (SNR). Os algoritmos estocsticos e baseados em evoluo artificial (EA) empregam codificao diferencial.
0
10
BER
10
10
BCJR
Det (Dif.)
Det (Pivot.)
Det (Implic.)
Estoc. (Post.)
Estoc. Priori
EA (P=1)
EA (P=5)
10
10
10
SNR
12
14
16
18
20
Figura 3.2: Desempenho mdio ao longo de 250 realizaes independentes dos algoritmos para equalizao cega baseados em filtros de partculas descritos neste captulo,
num sistema BPSK (empregando N = 300 partculas) e do equalizador timo MAP
(BCJR), em funo da relao sinal-rudo (SNR).
42
10
BER
10
10
BCJR
Det (Dif.)
Det (Pivot.)
Det (Implic.)
Estoc. (Post.)
Estoc. Priori
EA (P=1)
EA (P=5)
10
10
10
SNR
12
14
16
18
20
Figura 3.3: Desempenho mdio ao longo de 250 realizaes independentes dos algoritmos para equalizao cega baseados em filtros de partculas descritos neste captulo,
num sistema BPSK (empregando N = 500 partculas) e do equalizador timo MAP
(BCJR), em funo da relao sinal-rudo (SNR).
0
10
BER
10
10
BCJR
Det (Dif.)
Det (Pivot.)
Det (Implic.)
Estoc. (Post.)
Estoc. Priori
EA (P=1)
EA (P=5)
10
10
10
SNR
12
14
16
18
20
Figura 3.4: Desempenho mdio ao longo de 250 realizaes independentes do equalizador timo MAP (BCJR) e dos algoritmos para equalizao cega baseados em filtros
de partculas descritos neste captulo, num sistema BPSK, empregando N = 300 partculas e suavizao (com atraso de 5 amostras), em funo da relao sinal-rudo (SNR).
43
10
BER
10
10
BCJR
Det (Dif.)
Det (Pivot.)
Det (Implic.)
Estoc. (Post.)
Estoc. Priori
EA (P=1)
EA (P=5)
10
10
10
SNR
12
14
16
18
20
Figura 3.5: Desempenho mdio ao longo de 250 realizaes independentes do equalizador timo MAP (BCJR) e dos algoritmos para equalizao cega baseados em filtros
de partculas descritos neste captulo, num sistema BPSK, empregando N = 300 partculas e suavizao (com atraso de 10 amostras), em funo da relao sinal-rudo
(SNR).
0
10
BER
10
10
10
BCJR
Determ. (N=100)
N=100
N=300
N=500
N=1000
N=2000
10
10
SNR
12
14
16
18
20
Figura 3.6: Desempenho mdio ao longo de 250 realizaes independentes do equalizador timo MAP (BCJR), do algoritmo determinstico (utilizando N = 100 partculas) e dos algoritmos para equalizao cega baseados em evoluo artificial (P = 1),
num sistema BPSK com codificao diferencial, em funo da relao sinal-rudo
(SNR) e do nmero de partculas N .
44
10
BER
10
10
10
BCJR
Determ. (N=100)
N=100
N=300
N=500
N=1000
N=2000
10
10
SNR
12
14
16
18
20
Figura 3.7: Desempenho mdio ao longo de 250 realizaes independentes do equalizador timo MAP (BCJR), do algoritmo determinstico (utilizando N = 100 partculas) e dos algoritmos para equalizao cega baseados em evoluo artificial (P = 5),
num sistema BPSK com codificao diferencial, em funo da relao sinal-rudo
(SNR) e do nmero de partculas N .
0
10
BER
10
10
10
BCJR
2/4
2
/2
2
22
2
4
10
10
SNR
12
14
16
18
20
Figura 3.8: Efeito da escolha da varincia 2 do ncleo de transio p(hn |hn1 ) sobre o desempenho mdio ao longo de 250 realizaes independentes dos algoritmos
para equalizao cega baseados em evoluo artificial (P = 1), utilizando N = 1000
partculas e suavizao (com atraso de 10 amostras) em funo da relao sinal-rudo
(SNR), comparado com o desempenho do equalizador timo MAP (BCJR).
45
10
BER
10
10
10
BCJR
2/4
2
/2
2
2
2
2
4
10
10
SNR
12
14
16
18
20
Figura 3.9: Efeito da escolha da varincia 2 do ncleo de transio p(hn |hn1 ) sobre o desempenho mdio ao longo de 250 realizaes independentes dos algoritmos
para equalizao cega baseados em evoluo artificial (P = 5), utilizando N = 1000
partculas e suavizao (com atraso de 10 amostras) em funo da relao sinal-rudo
(SNR), comparado com o desempenho do equalizador timo MAP (BCJR).
0
10
BER
10
10
10
BCJR
N=100
N=300
N=500
N=100 (lim=0,25)
N=300 (lim=0,25)
N=500 (lim=0,25)
10
10
SNR
12
14
16
18
20
Figura 3.10: Desempenho mdio ao longo de 250 realizaes independentes do equalizador timo MAP (BCJR) e do algoritmo para equalizao cega baseado no filtro de
partculas estocstico empregando a funo de importncia tima, num sistema BPSK
com codificao diferencial, em funo da relao sinal-rudo (SNR), do limiar de
reamostragem e do nmero de partculas empregado.
46
10
BER
10
10
10
BCJR
N=100
N=300
N=500
N=100 (lim=0,25)
N=300 (lim=0,25)
N=500 (lim=0,25)
10
10
SNR
12
14
16
18
20
Figura 3.11: Desempenho mdio ao longo de 250 realizaes independentes do equalizador timo MAP (BCJR) e do algoritmo para equalizao cega baseado no filtros
de partculas estocstico empregando a funo de importncia a priori , num sistema
BPSK com codificao diferencial, em funo da relao sinal-rudo (SNR), do limiar
de reamostragem e do nmero de partculas empregado.
0
10
BER
10
10
10
BCJR
Estoc. (Post.)
Estoc. (Priori)
Estoc. Post. (lim=0,25)
Estoc. Priori (lim=0,25)
10
10
SNR
12
14
16
18
20
Figura 3.12: Desempenho mdio ao longo de 250 realizaes independentes do equalizador timo MAP (BCJR) e de algoritmos para equalizao cega baseados em filtros
de partculas estocsticos (utilizando N = 300 partculas e suavizao (10 amostras)),
empregando a funo de importncia tima e a priori , num sistema BPSK com codificao diferencial, em funo da relao sinal-rudo (SNR) e do limiar de reamostragem.
47
(3.24)
para a > 1. Note que ao se adotar o valor a = 2, (3.24) se reduz a uma distribuio
Rayleigh. Para valores 1 < a 2 , vn supergaussiana (i.e., tem curtose positiva),
caracterstica enfatizada quando a 1.
Observao 3 Uma varivel aleatria que satisfaa (3.24) pode ser obtida [36] a
partir de duas variveis x, y Gaussianas IID, reais, de mdia nula e varincia 2
atravs da transformao
vnR = x(x2 + y 2 )1/a1/2
vnI = y(x2 + y 2 )1/a1/2
Pode-se verificar [36] que a densidade de probabilidade conjunta de (vnR , vnI ) dada
por
p(vnR , vnI )
#
"
a
1
R 2
I 2 a/21
R 2
I 2 a/2
.
=
((v ) + (vn ) )
exp 2 ((vn ) + (vn ) )
4 2 n
2
(3.25)
As densidades marginais pvnR e pvnI , no entanto, no podem ser determinadas analiticamente. Porm, pode-se verificar atravs de mtodos numricos que
1
pvnR (v) = pvnI (v) |v| 4 2 exp |v| / 2 .
48
(3.26)
10
BER
10
10
BCJR
EA (P=1)
EA (P=5)
N=1000
N=500
10
10
SNR
12
14
16
18
20
Figura 3.13: Desempenho mdio ao longo de 250 realizaes independentes do equalizador timo MAP (BCJR) e do algoritmo para equalizao cega baseado em evoluo
artificial, num sistema BPSK com codificao diferencial sob rudo de envoltria Weibull (real, com = 1, 1), em funo da relao sinal-rudo (SNR). As linhas cheias
mostram os resultados para N = 500 partculas, enquanto as linhas tracejadas, resultados para N = 1000 partculas.
Como se pode observar na Figura 3.13, o desempenho obtido pelas tcnicas de
EA bastante ruim ao no se utilizar suavizao. Utilizando suavizao (10 amostras
- Fig. 3.14), o desempenho obtido se aproxima por cerca de 3 dB do timo para o
caso em que P = 5. Note que, diferentemente do caso Gaussiano, o desempenho dos
mtodos EA sob rudo Weibull melhora significativamente ao se aumentar o valor de
P.
Nas Figuras 3.13 e 3.14, mostramos os resultados obtidos numa simulao distinta,
empregando modulao QPSK diferencial (com codificao Gray [37]) e rudo (de
Para a = 1, 1, a distribuio de vnR marcadamente no-gaussiana. Como indicador disto, podemos citar o fato de que P(vnR > 3vnR ) = 2, 5 103 , enquanto, para uma varivel gaussiana, esta
probabilidade de 3, 1 105 .
14
49
10
BER
10
10
BCJR
EA (P=1)
EA (P=5)
N=1000
N=500
0
10
SNR
12
14
16
18
20
Figura 3.14: Desempenho mdio ao longo de 250 realizaes independentes do equalizador timo MAP (BCJR) e do algoritmo para equalizao cega baseado em evoluo
artificial, num sistema BPSK com codificao diferencial sob rudo de envoltria Weibull (real, com = 1, 1), em funo da relao sinal-rudo (SNR), empregando suavizao (10 amostras). As linhas cheias mostram os resultados para N = 500 partculas,
enquanto as linhas tracejadas, resultados para N = 1000 partculas.
envoltria) Weibull complexo, com a = 1, 1. O canal empregado agora foi
h = [0, 45 0, 39 j0, 66 0, 22 + j0, 39 ]T .
Como se pode notar, os resultados obtidos so qualitativamente equivalentes ao
caso utilizando modulao BPSK. No entanto, pode-se observar que o algoritmo utilizando P = 1 tem um desempenho bastante inferior neste caso, e que ao se aumentar o
nmero de partculas para N = 1000, consegue-se uma melhora de desempenho no
observada no caso anterior.
3.6
Comentrios
10
BER
10
10
BCJR
EA (P=1)
EA (P=5)
N=1000
N=500
0
10
SNR
12
14
16
18
20
Figura 3.15: Desempenho mdio ao longo de 250 realizaes independentes do equalizador timo MAP (BCJR) e do algoritmo para equalizao cega baseado em evoluo
artificial, num sistema QPSK com codificao diferencial (Gray) sob rudo de envoltria Weibull (complexo, com = 1, 1), em funo da relao sinal-rudo (SNR).
As linhas cheias mostram os resultados para N = 500 partculas, enquanto as linhas
tracejadas, resultados para N = 1000 partculas.
mentos.
De uma forma geral, observamos que o desempenho dos algoritmos cresce como
funo do nmero de partculas at um determinado ponto, praticamente deixando
de ser influenciado por esta grandeza da para frente, exceto no caso dos algoritmos
determinsticos, para os quais um acrscimo no nmero de partculas alm um determinado valor torna-se prejudicial. Pudemos observar tambm que a convergncia
dos algoritmos prejudicada sob baixos nveis de rudo. Este fenmeno ainda no
foi quantificado analiticamente, mas pode ser explicado pela observao experimental de que o aumento na varincia dos pesos (causado pela compresso da funo
de verossimilhana das observaes) influencia negativamente a diversidade amostral,
causando uma degradao de desempenho, que exacerbada ao se empregar a tcnica
de suavizao descrita na Sec. 2.4.2.
Na Tabela 3.6, sumariamos os resultados obtidos neste captulo, reunindo os resultados referentes ao desempenho dos algoritmos para equalizao sob rudo gaussiano
(com N = 300). Os nmeros mostrados nesta tabela so resultados mdios obtidos
por cada classe de algoritmos testada (utilizando os parmetros que levam ao melhor
desempenho), comparados ao desempenho do equalizador timo (BCJR). Como j ha51
10
BER
10
10
BCJR
EA (P=1)
EA (P=5)
N=1000
N=500
0
10
SNR
12
14
16
18
20
Figura 3.16: Desempenho mdio ao longo de 250 realizaes independentes do equalizador timo MAP (BCJR) e do algoritmo para equalizao cega baseado em evoluo
artificial, num sistema QPSK com codificao diferencial (Gray) sob rudo de envoltria Weibull (complexo, com = 1, 1), em funo da relao sinal-rudo (SNR),
empregando suavizao (10 amostras). As linhas cheias mostram os resultados para
N = 500 partculas, enquanto as linhas tracejadas, resultados para N = 1000 partculas.
vamos observado na Sec. 3.5, o algoritmo Rao-Blackwellizado determinstico tem um
desempenho superior aos demais.
SNR(dB)
Rao-Black. Determinstico
Estocstico
Evoluo Artificial
Tabela 3.6: Desempenho dos algoritmos testados (N = 300), quantificado pela perda
de desempenho (em dB) em relao ao equalizador timo (BCJR) sob relaes sinalrudo de 6 e 20 dB, e complexidade computacional dos mtodos.
52
Captulo 4
Equalizao e Decodificao
Conjuntas empregando Filtros de
Partculas
Atualmente, a quase totalidade dos sistemas de comunicao prticos emprega alguma
forma de codificao para deteco ou correo de erros. Conseqentemente, caso o
canal de comunicao considerado seja seletivo em freqncia, o desenvolvimento de
um receptor timo implica no uso de um esquema conjunto de equalizao e decodificao, uma vez que a recepo tima requer a determinao da densidade a posteriori
dos dados transmitidos dado o sinal observado.
Diversos trabalhos (vide [38]) propuseram mtodos para este fim, na sua maior
parte baseados na tcnica iterativa conhecida como turbo-equalizao, uma vez que a
soluo tima para este problema tem, em geral, complexidade proibitiva. Alm de
terem aplicabilidade limitada ao caso em que o cdigo empregado possa ser soft decoded [37], as tcnicas de turbo-equalizao exibem uma complexidade computacional
bastante elevada, alm de limitaes de desempenho [39].
Neste captulo descrevemos algoritmos para equalizao cega e decodificao conjuntas de canais de comunicao seletivos em freqncia baseados em filtros de partculas. Os algoritmos que apresentamos aqui so inditos1 at onde temos conhecimento, e levam a desempenhos bastante superiores aos exibidos por algoritmos alternativos que realizam a equalizao do canal e a decodificao separadamente.
O contedo a seguir est organizado da seguinte forma: na Sec. 4.1, apresentamos
1
53
yn
(sinal recebido)
bn
(bits)
Codificador
xn=n(b0:n)
canal
hn
xn
(smbolos)
vn (rudo)
4.1
(4.1)
em que a funo R(n) mapeia convenientemente os ndices dos bits naqueles dos smbolos gerados. Da condio imposta em (4.1) segue que
P(b0:n |y0:R(n) ) =
P(x0:R(n) |y0:R(n) )
x0:R(n) =(b0:n )
(4.2)
ou seja, como a transmisso de uma seqncia de bits b0:n define unicamente uma
seqncia correspondente de smbolos x0:R(n) , as probabilidades a posteriori da seqncia de bits b0:n podem ser calculadas a partir das probabilidades a posteriori de x0:R(n)
pela simples inverso do mapeamento imposto pelo cdigo. importante observar
neste ponto que as seqncias x0:R(n) fora da imagem de (i.e., impossveis de serem
geradas pelo cdigo) tm probabilidades a priori nulas, o que deve se levado em conta
pelo algoritmo de equalizao para permitir o clculo de (4.2).
Nas sees a seguir, descrevemos mtodos originais para a equalizao e decodificao conjunta de canais seletivos em freqncia (i.e., mtodos para a aproximao
54
4.2
Considere um sistema de codificao em blocos binrio2 (M, K), no qual cada seqncia de K bits da mensagem transmitida bn b(n1)K+1:nK unicamente mapeada num
bloco de M elementos xn x(n1)M +1:nM da seqncia de smbolos transmitida por
xn = (bn ), em que uma funo determinstica definida pelo esquema de codificao (Fig. 4.1).
Neste captulo, assumimos que os smbolos so transmitidos por um sistema de
comunicao linear com canal de ordem finita e conhecida (Eq. 3.1) e invariante no
tempo. Nosso objetivo nesta seo , ento, desenvolver um algoritmo para a estimao
da densidade p(b0:nK |y0:nM ), a partir da qual podem-se obter estimativas timas para a
seqncia de bits transmitidos.
Observao 1 Os mtodos mais comuns (subtimos) para este fim obtm estimati n da seqncia de smbolos transmitida (ignorando a codificao)
vas preliminares x
e tentam recuperar os bits transmitidos bn atravs de algum mtodo tradicional, geralmente baseado em hard decisions [37]. interessante observar, no entanto, que
cdigos de bloco podem ser decodificados de forma tima (com complexidade computacional exponencial em K) explorando o fato de que as 2M K seqncias xn no
pertencentes imagem de no podem ser transmitidas, i.e., suas probabilidades a
priori so nulas, do que segue que
p(bn |y0:n ) = p(xn = (bn )|y0:n ) .
(4.3)
55
para a equalizao cega do sinal recebido (com densidades a priori para xn propriamente ajustadas de acordo com o cdigo empregado) da mesma forma que no Cap. 3,
e 2) inverte-se o mapeamento .
O primeiro passo pode ser implementado conforme descrito na Sec. 3.3.1, bastando
que se determine a densidade p(xn |x0:n1 ), necessria para o clculo de (3.16). Note
que esta densidade unicamente determinada pelo cdigo empregado, podendo ser
calculada por busca exaustiva, como no exemplo a seguir. Na Tab. 4.1 descrevemos o
algoritmo proposto (empregando o filtro de partculas estocstico).
(Inicializao)
Para i = 1 : N
(i)
X0 BL (1)
(i)
h0 N (h|h0 ; 0 )
Fim
(Algoritmo)
Para n > 0
1) Para i = 1 : N
(i)
(i)
A) Amostre Xn p(yn |X0:n , y0:n1 )p(xn |x0:n1 )
B) Calcule e normalize os pesos
(i)
(i)
(i)
wn wn1 Xn(i) p(yn |X0:n , y0:n1 )p(xn |x0:n1 )
Fim
2) Reamostre o conjunto de partculas, conforme o critrio adotado.
3) Caso (n 1)K + 1 n nK, estime a densidade
a posteriori dos bits transmitidos como
(i)
P (bn = B|y0:n ) N 1 N
i=1 I{xn = B} .
Fim
Tabela 4.1: Algoritmo para equalizao e decodificao conjunta em sistemas empregando cdigos de bloco sistemticos baseado no algoritmo SIR estocstico, empregando a funo de importncia tima.
56
= p(x3n )
= 0, 5 ,
1,
= p(x3n+1 |x3n )
=
p(x3n+1 |x0:3n )
1,
0,
1,
p(x3n+2 |x0:3n+1 ) = p(x3n+2 |x3n+1 ) =
1,
0,
x3n = 1
se x3n+1 = 1
se x3n+1 = 1
caso contrario
se x3n+2 = 1
se x3n+2 = 1
caso contrario
e x3n = 1
e x3n = 1
e x3n+1 = 1
e x3n+1 = 1
(4.4)
O clculo de p(xn |x0:n1 ) especialmente simplificado no caso em que os bits
transmitidos so equiprovveis e IID e o cdigo empregado sistemtico [37], i.e.,
cada bloco de M bits transmitido construdo como
(x(n1)M +1 , . . . , xnM ) =
(b(n1)K+1 , . . . , bnK , pnK+1 , . . . , pnM )
(4.5)
1/2, se (n 1)K + 1 n nK e a = 1
1, se nK + 1 n nM
e a = pn .
0, se nK + 1 n nM
e a=
pn
(4.6)
Assim, usando (3.16) e (4.6) pode-se calcular p(Xn , yn |X0:n1 , y0:n1 ) e estimar
p(x0:n |y0:n ) atravs dos algoritmos descritos anteriormente. Para se estimar p(b0:l |y0:n )
(i)
(l = M n/M ), basta notar que cada bloco de comprimento M de x0:n restrito, por
construo, a pertencer imagem de . Desta forma, amostras da densidade p(b0:l |y0:n )
(i)
(i)
podem ser obtidas pela relao3 b0:l = 1 (x0:n ).
Finalmente, deve-se mencionar que a estimao de p(b0:l |y0:n ) s possvel se alguma medida for tomada para contrabalanar os efeitos da ambigidade de fase. Alm
dos mtodos descritos no Cap. 3 para este fim, a codificao em bloco torna possvel
contornar este problema atravs do uso de cdigos rotacionalmente variantes, para
os quais (b(i) )
= (b(j) ), i, j. Na Sec. 4.2.1, analisamos atravs de simulaes
3
No caso dos cdigos sistemticos, basta tomar os K primeiros elementos de cada bloco de M
amostras.
57
4.2.1 Simulaes
Para avaliar o desempenho dos algoritmos descritos neste captulo realizamos simulaes numricas, medindo as taxas mdias de erro de bit (BER) obtidas ao longo de
250 realizaes independentes. O sistema de comunicao analisado transmite blocos
de 50 palavras de cdigo (cada uma escolhida de forma independente e equiprovvel),
sendo as 25 primeiras descartadas para fins de medio das taxas de erro de modo a
permitir a convergncia dos algoritmos analisados.
Nas simulaes a seguir, empregamos o canal h = [ 0, 41 0, 82 0, 41 ]T .
Os filtros empregam 250 partculas e so inicializados de forma aleatria, fazendo
(i)
h0 N (h|0; I). Na Figura 4.2 mostramos o desempenho mdio dos algoritmos para
equalizao e decodificao conjunta em funo da SNR e do atraso de suavizao
d, empregando o cdigo sistemtico B1 , descrito na Tabela 4.2. Este cdigo (6, 3)
formado [40] tomando-se as 8 palavras do cdigo de Hamming (7, 3) correspondentes
ao bit mais significativo "0", permitindo a resoluo da ambigidade de fase devido
sua assimetria rotacional4 .
Para efeito de comparao, avaliamos tambm a taxa mdia de erro obtida atravs
de um esquema alternativo treinado (MAP), utilizando o equalizador timo MAP (com
canal conhecido), seguido de um decodificador empregando hard decisions. Como se
pode observar na Fig. 4.2, os algoritmos baseados no filtro de partculas determinstico
tiveram um desempenho superior at mesmo ao do esquema treinado5 . Na Fig. 4.3
repetimos o mesmo experimento, utilizando o cdigo B2 descrito na Tab. 4.2, formado
de forma semelhante ao B1 , sem excluir, porm, a coluna de zeros comum todas as
palavras de cdigo. Como se pode observar, os resultados obtidos so semelhantes.
Note que, da forma como o cdigo definido, nenhuma palavra de cdigo vlida corresponde
negao de outra palavra de cdigo vlida.
5
Observe que o esquema treinado usado na comparao subtimo, e que a decodificao tima
MAP de cdigos em bloco demanda a realizao de buscas exaustivas, o que s factvel para cdigos
com M muito baixo.
58
B1 =
B2 =
0
0
0
0
1
1
1
1
0
0
0
0
1
1
1
1
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
0
1
0
1
0
1
0
1
0
1
0
1
0
1
0
1
0
1
1
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
1
1
0
0
1
1
0
0
1
1
0
1
0
0
1
0
0
1
1
1
1
0
0
0
1
1
0
1
0
0
1
Tabela 4.2: Cdigos de bloco empregados nas simulaes da Seo 4.2.1: cada matriz
coleciona em suas linhas as palavras de cdigos vlidas.
10
BER
10
10
10
MAP
DET (d=0)
DET (d=5)
DET (d=10)
STO (d=0)
STO (d=5)
STO (d=10)
10
10
SNR
12
14
16
18
20
Figura 4.2: Desempenho mdio ao longo de 250 realizaes independentes de algoritmos para equalizao e decodificao conjunta empregando o filtro de partculas
estocstico com funo de importncia tima (STO) e o filtro determinstico (DET), e
de um esquema treinado (MAP) descrito no texto, em funo da SNR e do atraso de
suavizao d, para um sistema empregando o cdigo de blocos B1 descrito na Tab. 4.2.
59
10
BER
10
10
10
MAP
DET (d=0)
DET (d=5)
DET (d=10)
STO (d=0)
STO (d=5)
STO (d=10)
10
10
SNR
12
14
16
18
20
Figura 4.3: Desempenho mdio ao longo de 250 realizaes independentes de algoritmos para equalizao e decodificao conjunta empregando o filtro de partculas
estocstico com funo de importncia tima (STO) e o filtro determinstico (DET), e
de um esquema treinado (MAP) descrito no texto, em funo da SNR e do atraso de
suavizao d, para um sistema empregando o cdigo de blocos B2 descrito na Tab. 4.2.
60
4.3
4.3.1 Fundamentos
O algoritmo que descrevemos a seguir emprega filtros de partculas para estimar a
densidade p(b0:n |y 0:n ) p(b0:n |y0:(n+1)R1 ), e se aplica a sistemas de comunicao
utilizando codificao convolucional no-catastrfica de taxa 1/R [37]. Denotando
a seqncia de bits transmitidos por bn ( {0; 1}), a seqncia (binria) xn ( 1)
de smbolos transmitidos por um sistema deste tipo dada por xnR+m = 2 cm
n 1,
0 m R, sendo a seqncia cm
n obtida como
cm
n =
K
i=0
bni dm
i +
K
m
cm
ni ri
mod 2,
(4.7)
i=1
m
em que K o constraint length do cdigo e dm
i , ri ( {0; 1}) so os coeficientes do
gerador.
Para desenvolver o algoritmo que propomos, devemos inicialmente obter a expresso da densidade p(bn , y n |b0:n1 , y 0:n1 ). Sob a hiptese de que bn seja uma seqncia
IID, segue que
(4.8)
61
(4.9)
(4.10)
j=Rn
(4.11)
(4.13)
Demonstrao de (4.13):
p(yi |y0:i1 , X0:j )
p(Xi+1:j |X0:i , y0:i )
p(Xi+1:j |X0:i )
=
=
=1.
p(yi |y0:i1 , X0:i )
p(Xi+1:j |X0:i , y0:i1 )
p(Xi+1:j |X0:i )
(4.12)
Note que os algoritmos para equalizao cega (Sec. 3) Rao-Blackwellizados exigem o clculo de um
passo de um filtro de Kalman por iterao independentemente do tamanho da constelao empregada,
uma vez que apenas o smbolo escolhido para cada partcula influencia o valor futuro dos parmetros.
62
(Inicializao)
Para i = 1 : N
(i)
X0 BL (1)
(i)
h0 N (h|h0 ; 0 )
Fim
(Algoritmo)
Para n > 0
1) Para i = 1 : N
(i)
(i)
A) Amostre bn p(bn |b0:n1 , y 0:n ) (densidade proporcional da Eq. 4.8)
(i)
(i)
(i)
B) Calcule e normalize os pesos wn = wn1 bn p(bn |b0:n1 , y 0:n )
Fim
2) Reamostre o conjunto de partculas, conforme o critrio adotado.
3) Estime a densidade a posteriori dos bits transmitidos como
(i)
P (bn = B|y 0:n ) N 1 N
i=1 I{bn = B} .
Fim
Tabela 4.3: Algoritmo para equalizao e decodificao conjunta em sistemas empregando cdigos convolucionais baseado no algoritmo SIR estocstico, empregando a
funo de importncia tima.
4.4
Simulaes
63
timo MLSE (com canal conhecido), seguido pelo mesmo decodificador de Viterbi do
esquema anterior.
Na Figura 4.4 mostramos o desempenho mdio dos algoritmos para equalizao e
decodificao conjunta, empregando o cdigo binrio (gerado pelo polinmio dado em
representao octal) (5, 7, 2). Este cdigo (R = 1/3) possui propriedades de invarincia rotacional, exibindo propriedades timas [41] quando detectado incoerentemente,
o que permite contornar o problema de ambigidade de fase descrito nos captulos anteriores. Como se pode observar na Fig. 4.4, algoritmo baseado no filtro de partculas
determinstico teve um desempenho superior at mesmo ao do esquema treinado (Viterbi) em todas as faixas de relao sinal-rudo, ultrapassando em muito o do esquema
com equalizao e decodificao separadas (Pf+Vit). Os algoritmos baseados em filtros de partculas estocsticos exibiram um desempenho significativamente inferior,
exceo do algoritmo empregando reamostragem multinomial, cujo desempenho excedeu o dos demais sob baixos nveis de rudo. Vale ainda notar que o desempenho mximo dos algoritmos estocsticos se deu para um limiar de reamostragem TM IN = 0, 2,
o que ilustra uma maior sensibilidade destes mtodos ao problema do empobrecimento
amostral se comparados aos mtodos do Cap. 3.
Nas Fig. 4.5 e 4.6 repetimos o mesmo experimento, utilizando os cdigos (17, 12, 04)
e (63, 44, 17) (que possuem as mesma propriedades de varincia rotacional do cdigo
(7, 5, 2) [41]). Como se pode observar, os resultados obtidos so semelhantes no caso
do cdigo (17, 12, 04). Para o cdigo (63, 44, 17), no entanto, o desempenho dos filtros
de partculas estocsticos muito pior, fato que no se altera (no mostrado no grfico)
mesmo ao se empregar um nmero de partculas bastante superior, resultado que pode
ser creditado memria mais longa deste cdigo, que introduz uma dependncia mais
forte em relao a decises passadas.
64
(A) Multinomial
10
10
Viterbi
Pf+Vit
Pf 0,0
Pf 0,2
Pf 0,4
Pf 0,8
Pf 1,0
10
10
BER
BER
10
10
2
4
SNR (dB)
10
10
(C) Residual
2
4
SNR (dB)
10
(D) Comparao
10
Viterbi
Pf+Vit
Mult.
Res.
Sist.
Det.
10
10
Viterbi
Pf+Vit
Pf 0,0
Pf 0,2
Pf 0,4
Pf 0,8
Pf 1,0
10
10
BER
BER
Viterbi
Pf+Vit
Pf 0,0
Pf 0,2
Pf 0,4
Pf 0,8
Pf 1,0
10
10
10
10
(B) Sistemtico
10
10
10
2
4
SNR (dB)
10
10
2
4
SNR (dB)
10
65
(A) Multinomial
10
10
Viterbi
Pf+Vit
Pf 0,0
Pf 0,2
Pf 0,4
Pf 0,8
Pf 1,0
10
10
BER
BER
10
10
2
4
SNR (dB)
10
10
(C) Residual
2
4
SNR (dB)
10
(D) Comparao
10
Viterbi
Pf+Vit
Mult.
Res.
Sist.
Det.
10
10
Viterbi
Pf+Vit
Pf 0,0
Pf 0,2
Pf 0,4
Pf 0,8
Pf 1,0
10
10
BER
BER
Viterbi
Pf+Vit
Pf 0,0
Pf 0,2
Pf 0,4
Pf 0,8
Pf 1,0
10
10
10
10
(B) Sistemtico
10
10
10
2
4
SNR (dB)
10
10
2
4
SNR (dB)
10
66
(A) Multinomial
10
10
Viterbi
Pf+Vit
Pf 0,0
Pf 0,2
Pf 0,4
Pf 0,8
Pf 1,0
10
10
BER
BER
10
10
2
4
SNR (dB)
10
10
(C) Residual
2
4
SNR (dB)
10
(D) Comparao
10
Viterbi
Pf+Vit
Mult.
Res.
Sist.
Det.
10
10
Viterbi
Pf+Vit
Pf 0,0
Pf 0,2
Pf 0,4
Pf 0,8
Pf 1,0
10
10
BER
BER
Viterbi
Pf+Vit
Pf 0,0
Pf 0,2
Pf 0,4
Pf 0,8
Pf 1,0
10
10
10
10
(B) Sistemtico
10
10
10
2
4
SNR (dB)
10
10
2
4
SNR (dB)
10
67
bits
transmitidos
bk
codificao
convolucional
ck
codificao
diferencial
sinal
transmitido
xk
68
(A) Multinomial
10
10
Viterbi
Eq+Dec
Pf 0,0
Pf 0,2
Pf 0,4
Pf 0,8
Pf 1,0
10
10
BER
BER
10
10
5
10
SNR (dB)
10
15
(C) Residual
5
10
SNR (dB)
15
(D) Comparao
10
10
10
Viterbi
Eq+Dec
Pf 0,0
Pf 0,2
Pf 0,4
Pf 0,8
Pf 1,0
10
10
BER
BER
Viterbi
Eq+Dec
Pf 0,0
Pf 0,2
Pf 0,4
Pf 0,8
Pf 1,0
10
10
10
10
(B) Sistemtico
10
10
Viterbi
Eq+Dec
Mult.
Res.
Sist.
Det.
10
5
10
SNR (dB)
10
15
5
10
SNR (dB)
15
69
(A) Multinomial
10
10
Viterbi
Eq.+Dec.
Pf 0,0
Pf 0,2
Pf 0,4
Pf 0,8
Pf 1,0
10
10
5
10
SNR (dB)
BER
BER
10
10
10
15
(C) Residual
5
10
SNR (dB)
15
(D) Comparao
10
10
10
Viterbi
Eq.+Dec.
Pf 0,0
Pf 0,2
Pf 0,4
Pf 0,8
Pf 1,0
10
10
5
10
SNR (dB)
BER
BER
Viterbi
Eq.+Dec.
Pf 0,0
Pf 0,2
Pf 0,4
Pf 0,8
Pf 1,0
10
10
10
10
(B) Sistemtico
10
10
Viterbi
Eq+Dec
Mult.
Res.
Sist.
Det.
10
10
15
5
10
SNR (dB)
15
70
(A) Multinomial
10
10
Viterbi
Eq.+Dec.
Pf 0,0
Pf 0,2
Pf 0,4
Pf 0,8
Pf 1,0
10
10
5
10
SNR (dB)
BER
BER
10
10
10
15
(C) Residual
5
10
SNR (dB)
15
(D) Comparao
10
10
10
Viterbi
Eq.+Dec.
Pf 0,0
Pf 0,2
Pf 0,4
Pf 0,8
Pf 1,0
10
10
5
10
SNR (dB)
BER
BER
Viterbi
Eq.+Dec.
Pf 0,0
Pf 0,2
Pf 0,4
Pf 0,8
Pf 1,0
10
10
10
10
(B) Sistemtico
10
10
Viterbi
Eq.+Dec.
Mult.
Res.
Sist.
Det.
10
10
15
5
10
SNR (dB)
15
Figura 4.10: Desempenho mdio ao longo de 250 realizaes independentes de diversos algoritmos para equalizao e decodificao conjunta em funo da relao
sinal-rudo (SNR) e do limiar para reamostragem para um sistema empregando o cdigo convolucional (53, 75). (A) Desempenho dos algoritmos empregando reamostragem multinomial, comparado com os esquemas alternativos descritos no texto. (B) O
mesmo para reamostragem residual. (C) O mesmo para reamostragem sistemtica. (D)
Resultados dos ltimos 3 experimentos com limiar igual 0,2 e do filtro determinstico.
71
(A) Multinomial
10
10
Viterbi
Eq.+Dec.
Pf 0,0
Pf 0,2
Pf 0,4
Pf 0,8
Pf 1,0
10
10
5
10
SNR (dB)
BER
BER
10
10
10
15
(C) Residual
5
10
SNR (dB)
15
(D) Comparao
10
10
10
Viterbi
Eq.+Dec.
Pf 0,0
Pf 0,2
Pf 0,4
Pf 0,8
Pf 1,0
10
10
5
10
SNR (dB)
BER
BER
Viterbi
Eq.+Dec.
Pf 0,0
Pf 0,2
Pf 0,4
Pf 0,8
Pf 1,0
10
10
10
10
(B) Sistemtico
10
10
Viterbi
Eq.+Dec.
Mult.
Res.
Sist.
Det.
10
10
15
5
10
SNR (dB)
15
Figura 4.11: Desempenho mdio ao longo de 250 realizaes independentes de diversos algoritmos para equalizao e decodificao conjunta em funo da relao sinalrudo (SNR) e do limiar para reamostragem para um sistema empregando o cdigo
convolucional (47, 53, 75). (A) Desempenho dos algoritmos empregando reamostragem multinomial, comparado com os esquemas alternativos descritos no texto. (B) O
mesmo para reamostragem residual. (C) O mesmo para reamostragem sistemtica. (D)
Resultados dos ltimos 3 experimentos com limiar igual 0,2 e do filtro determinstico.
72
(4.14)
Para permitir comparaes, mostramos tambm o desempenho de um mtodo alternativo (MAP), consistindo da cascata do equalizador timo MAP (utilizando os parmetros corretos do canal) com o decodificador timo MAP (sem realimentao).
Na Fig. 4.12, mostramos a taxa mdia de erro obtida pelos mtodos propostos.
Nesta simulao, todos os filtros de partculas empregam N = 250 partculas. Diferentemente das simulaes anteriores, consideramos aqui o uso de mtodos de reamostragem estocstica em conjunto com o algoritmo SIR determinstico. Como se pode
verificar, os mtodos baseados no filtro de partculas determinstico (DET) tiveram
mais uma vez um desempenho superior, sendo o melhor desempenho atingido pelo
mtodo utilizando reamostragem determinstica. Observe, no entanto, que o desempenho dos mtodos propostos deixa de melhorar para SNR superiores a 10 dB, efeito que,
conforme observado, persiste mesmo ao se aumentar o nmero de partculas utilizado.
Na Fig. 4.13 mostramos o desempenho atingido sob as mesmas condies, empregando agora suavizao (10 amostras). Neste caso, o desempenho praticamente no
se alterou exceto para o algoritmo determinstico (DET-DET), cujo desempenho foi
bastante melhorado, aproximando-se daquele do mtodo treinado (MAP).
Finalmente, na Fig. 4.14, avaliamos o desempenho do algoritmo determinstico
(DET-DET) em funo do nmero de partculas N . Como se pode observar, o desempenho do mtodo proposto melhora significativamente ao se aumentar o nmero de
partculas para N = 100, permanecendo no entanto praticamente estvel quando mais
partculas so acrescentadas.
4.5
Comentrios
Neste captulo, propusemos duas famlias de algoritmos para equalizao e decodificao conjuntas de canais de comunicao seletivos em freqncia. Na primeira famlia,
adequada a sistemas utilizando cdigos em bloco sistemticos, os algoritmos simulam da densidade a posteriori do sinal codificado xn , enquanto na segunda famlia,
obtm-se estimativas da densidade a posteriori desejada diretamente, s custas de uma
73
10
10
10
10
MAP
DETDET
DETMultinomial
DETResidual
STOMultinomial
STOResidual
10
10
12
Figura 4.12: Desempenho dos mtodos para equalizao e decodificao conjunta baseados em filtros de partculas determinstico (DET) e estocstico (STO) em funo da
SNR, empregando os mtodos de reamostragem multinomial, residual e determinstico
(DET-DET), e do mtodo alternativo MAP descrito no texto. Os filtros de partculas
estocsticos empregam a funo de importncia tima.
complexidade computacional mais elevada.
De uma maneira geral, observamos que os mtodos propostos (especialmente aqueles empregando filtros de partculas determinsticos) exibem desempenhos surpreendentes, comparveis aos de mtodos treinados. Devido falta de tempo, uma comparao destes mtodos com esquemas iterativos (turbo equalization) ficou faltando,
apesar das evidncias apresentadas em [39] de que estes ltimos no levam a bons
resultados sob as condies testadas.
74
10
10
10
10
MAP
DETDET
DETMultinomial
DETResidual
STOMultinomial
STOResidual
10
10
12
Figura 4.13: Desempenho dos mtodos para equalizao e decodificao conjunta baseados em filtros de partculas determinstico (DET) e estocstico (STO) em funo da
SNR, empregando os mtodos de reamostragem multinomial, residual e determinstico
(DET-DET), empregando suavizao (10 amostras) e do mtodo alternativo MAP descrito no texto. Os filtros de partculas estocsticos empregam a funo de importncia
tima.
0
10
10
10
10
MAP
N=50
N=100
N=250
10
10
12
Figura 4.14: Desempenho do algoritmo para equalizao e deteco conjunta determinstico (empregando reamostragem determinstica e suavizao de 10 amostras) e do
mtodo alternativo MAP descrito no texto em funo do nmero de partculas empregado e da SNR.
75
Captulo 5
Concluses
Nesta tese, propusemos e analisamos o desempenho de algoritmos para equalizao
cega baseados em mtodos numricos de estimao Bayesiana. No Cap. 2 descrevemos o algoritmo SIR, estrutura particular de filtragem de partculas empregada no
Cap. 3 para a equalizao de canais e, no Cap. 4, para a soluo conjunta dos problemas
de equalizao e decodificao. De forma complementar, no Apndice A avaliamos
o desempenho dos algoritmos descritos no Cap. 3 para canais de ordem desconhecida
e variantes no tempo. Nos Apndices B e C, finalmente, analisamos algoritmos para
equalizao baseados em outras tcnicas de estimao Bayesiana - o algoritmo EM e
o Amostrador de Gibbs.
Embora o contedo de todos os captulos contenha resultados originais (ao menos
no tocante forma de anlise de mtodos j existentes), as principais contribuies
deste trabalho concentram-se nos Cap. 3 e 4, consistindo principalmente do seguinte:
1. Desenvolvimento de novos mtodos para a soluo do problema da ambigidade
de fase, atravs de novos algoritmos de equalizao (Cap. 3) e da seleo de
cdigos com varincias rotacionais (Cap. 4).
2. Desenvolvimento de algoritmos para equalizao cega sob rudo aditivo nogaussiano (Cap. 3).
3. Desenvolvimento de algoritmos para equalizao e decodificao conjuntas em
canais seletivos em freqncia (Cap. 4).
De uma maneira geral, observamos que os algoritmos para equalizao (e decodificao conjuntas) baseados no algoritmo SIR determinstico exibem o melhor desempenho entre os mtodos testados, freqentemente equiparando-se ao desempenho timo
(MAP), sendo portanto a melhor escolha quando o modelo de sinal empregado permitir
a Rao-Blackwellizao dos parmetros do canal.
76
77
demais tcnicas, que operam em batelada. Alm disso, cabe ressaltar que os filtros
de partculas so, dentre estes trs mtodos, os mais adequados implementao em
computadores paralelos.
Algoritmo
Complexidade
No. de Partculas/
Iteraes
EM
N (oAL2 + L3 + o2L ) N 20
Filtro de Partculas (Determinstico) N (oAL2 )
N 2L (N 200)
Gibbs (Amostrador Conjunto)
N (oAL2 + oL3 )
N 2L (N 50)
Tabela 5.1: Complexidade computacional de diversos algoritmos para equalizao
cega, em funo da ordem do canal a equalizar L, do nmero de amostras de sinal
tratado A, no nmero de partculas ou iteraes N , sendo o uma constante tal que
1 o 10.
Como concluso geral, podemos afirmar que pelo seu desempenho e generalidade,
os algoritmos baseados em filtros de partculas constituem uma soluo quase que ideal
para o problema da equalizao cega, reunindo as caractersticas de robustez e velocidade de convergncia no possudas por nenhum mtodo baseado exclusivamente
em momentos. Isto se verifica, porm, s custas de uma complexidade computacional
ainda inadequada para aplicaes prticas, desvantagem esta que, felizmente, pode ser
revertida num futuro prximo.
5.1
Nesta tese analisamos um tema bastante recente, sobre o qual diversas questes de
natureza prtica e terica ainda persistem. Baseados nas constataes que fizemos ao
longo da preparao deste trabalho, sugerimos os seguintes tpicos para anlise futura:
1. Desenvolvimento de novos algoritmos para equalizao de canais com ordem
desconhecida.
Neste trabalho, verificamos que algoritmos recm-desenvolvidos para a equalizao de canais com ordem desconhecida so afetados por problemas estatsticos
de carter inerente, que levam sobre-estimao das ordens inferidas. De fato,
um problema recorrente [42] que se observa ao se estimar as ordens de modelos
por critrios Bayesianos o de que a verossimilhana de um modelo tende a
aumentar com a ordem adotada (mesmo que esta esteja sendo sobre-estimada),
fato que aparentemente no foi percebido pelos autores de [1].
Assim, um tpico pertinente para anlises futuras seria a investigao dos efeitos
i) da escolha de diferentes densidades a priori e ii) de funes de importncia
78
10
Gibbs
EM
FP
Viterbi
-1
10
-2
BER
10
-3
10
-4
10
-5
10
8
SNR (dB)
10
12
14
16
Figura 5.1: Comparao do desempenho atingido por diversos mtodos para equalizao cega e pelo algoritmo de Viterbi em funo da relao sinal-rudo para o canal
h = [ 0, 41 0, 82 0, 41 ]T . A ordem do canal e a varincia do rudo aditivo (gaussiano
e real) foram assumidas conhecidas; os algoritmos EM e Gibbs (amostrador conjunto)
operam sobre blocos de 250 amostras do sinal recebido, descartando as 25 de cada
extremidade para fins de clculo de taxa de erro. O algoritmo baseado no filtro de
partculas (estocstico - com funo de importncia tima) tambm opera sobre 250
amostras, descartando as 100 primeiras, e emprega suavizao (5 amostras). O sinal
transmitido binrio e emprega codificao diferencial.
sobre o desempenho de algoritmos para equalizao de canais de ordem desconhecida, como os propostos em [1].
2. Anlise da convergncia dos algoritmos para equalizao cega.
Dada a novidade do interesse no uso de filtros de partculas para equalizao
cega, muitos dos mtodos propostos no tiveram suas propriedades transitrias
devidamente analisadas. Assim, anlises numricas quanto i) a velocidade de
convergncia e ii) probabilidade de divergncia destes algoritmos, em funo do
nmero de amostras tratadas, do nmero de partculas empregadas, e da funo
de importncia empregada produziriam resultados inditos.
Apesar do fato de que simulaes numricas no permitem que se tirem concluses gerais sobre a convergncia de algoritmos da classe dos estudados, os
resultados obtidos nestas simulaes serviriam de contraponto falta de resultados tericos que garantam (ou descartem) a convergncia uniforme das solues
geradas por filtros de partculas quando utilizados em modelos como os tratados [31] (com parmetros fixos e desconhecidos).
79
80
Referncias Bibliogrficas
[1] J. Miguez and P. M. Djuric, Blind equalization of frequency-selective channels
by sequential importance sampling, IEEE Transactions on Signal Processing,
vol. 52, Outubro 2004.
[2] Y. Sato, A Method for Self-Recovering Equalization for Multilevel Amplitude
Modulation System, IEEE Transactions on Communications, vol. 23, pp. 679
682, 1975.
[3] S. Haykin, ed., Blind Deconvolution. Englewood Cliffs, NJ: Prentice Hall, 1994.
[4] Z. Ding and Y. Li, eds., Blind Equalization and Identification. New York: Marcel
Dekker, 2001.
[5] L. Scharf, Statistical Signal Processing: Detection, Estimation, and Time Series
Analysis. Addison-Wesley Pub. Co., 1991.
[6] C. J. Bordin Jr., Comparao entre algoritmos de Identificao No-Assistida
de Canais de Comunicao Baseados em Estatsticas de Segunda Ordem. Dissertao (mestrado). Escola Politcnica da Universidade de So Paulo, 2002.
[7] A. P. Dempster, N. M. Laird, and D. B. Rubin, Maximum likelihood from incomplete data via the EM algorithm, Journal of the Royal Statistical Society,
vol. 39, pp. 138, 1977.
[8] C. P. Robert and G. Casella, Monte Carlo Statistical Methods. Berlin: SpringerVerlag, 1999.
[9] A. Doucet, J. de Freitas, and N. Gordon, eds., Sequential Monte-Carlo Methods
in Practice. Berlin: Springer-Verlag, 2000.
[10] J. S. Liu and R. Chen, Blind Deconvolution via Sequential Imputations, Journal
of the American Statistical Association, vol. 90, pp. 567576, Junho 1995.
81
[11] T. Clapp, Statistical Methods for the Processing of Communication Data. PhD
thesis, University of Cambridge, 2000.
[12] E. Punskaya, Sequential Monte Carlo Methods for Digital Communications. PhD
thesis, University of Cambridge, 2003.
[13] P. M. Djuric, J. H. Kotecha, J. Zhang, Y. Huang, T. Ghirmai, M. F. Bugallo,
and J. Mguez, Particle Filtering, IEEE Signal Processing Magazine, vol. 20,
pp. 1938, Setembro 2003.
[14] M. S. Arulampalam, S. Maskell, N. Gordon, and T. Clapp, A Tutorial on Particle
Filters for Online Nonlinear/Non-Gaussian Bayesian Tracking, IEEE Transactions on Signal Processing, vol. 50, pp. 174188, Fevereiro 2002.
[15] T. Kailath, A. H. Sayed, and B. Hassibi, Linear Estimation. Upper Saddle River,
NJ: Prentice Hall, 1 ed., 2000.
[16] G. Lee, S. B. Gelfand, and M. P. Fitz, Bayesian Techniques for Blind Deconvolution, IEEE Transactions on Communications, vol. 44, pp. 826835, Julho
1996.
[17] H. L. van Trees, Detection, Estimation, and Modulation Theory, Part I. Wiley,
1968.
[18] A. Doucet, On Sequential Simulation-Based Methods for Bayesian Filtering,
Tech. Rep. CUED/F-INFENG/TR.310, University of Cambridge, 1998.
[19] M. A. Tanner, Tools for Statistical Inference. Springer Verlag, 3 ed., 1996.
[20] C. J. Bordin Jr. and L. A. Baccal, Particle Filters for Blind FIR Channel Equalization in Non-Gaussian Noise, in Proceedings of the 2006 IEEE International
Conference on Acoustics, Speech and Signal Processing - ICASSP 2006, (Toulouse - Frana), 2006. Trabalho aceito para publicao.
[21] C. J. Bordin Jr. and L. A. Baccal, Joint Blind Equalization and Decoding using
Particle Filters, in Proceedings of the 4th IEEE International Symposium on
Signal Processing and Information Technology - ISSPIT 2004, (Roma - Itlia),
pp. 14, 2004.
[22] C. J. Bordin Jr. and L. A. Baccal, Particle filter algorithms for joint blind
equalization/decoding of convolutionally coded signals, in Proceedings of the
2005 IEEE International Conference on Acoustics, Speech and Signal Processing - ICASSP 2005, vol. 3, (Philadelphia, PA - USA), pp. 497500, 2005.
82
[23] C. J. Bordin Jr. and L. A. Baccal, Deterministic Particle Filters for Joint Blind
Equalization and Decoding on Frequency Selective Channels, in IEEE Statistical Signal Processing Workshop - IEEE SSP 05, (Bordeaux - Frana), 2005.
Trabalho aceito para publicao.
[24] C. J. Bordin Jr. and L. A. Baccal, Equalizao Cega de Canais Lineares FIR
empregando o Algoritmo EM Bayesiano, in Anais do XXII Simpsio Brasileiro
de Telecomunicaes, (Campinas - SP), 2005.
[25] N. J. Gordon, D. J. Salmond, and A. F. M. Smith, Novel approach to non-linear
non-gaussian bayesian state estimation, IEE Proceedings-F Image & Signal Processing, vol. 140, pp. 107113, Abril 1993.
[26] A. Kong, J. S. Liu, and W. H. Wong, Sequential Imputations and Bayesian Missing Data Problems, Journal of the American Statistical Association, vol. 89,
pp. 278288, Maro 1994.
[27] W. G. Cochran, Sampling Techniques. New York: John Wiley and Sons, 3 ed.,
1977.
[28] J. D. Hol, Resampling in particle filters, Tech. Rep. LiTH-ISY-EX-ET-02832004, Institutionen for systemteknik - Linkopings Universitet, 2004.
[29] R. Chen, J. S. Liu, and X. Wang, Convergence Analyses and Comparisons of
Markov Chain Monte Carlo Algorithms in Digital Communications, IEEE Transactions on Signal Processing, vol. 50, pp. 255270, Fevereiro 2002.
[30] J. K. Tugnait and A. H. Haddad, Detection-Estimation Scheme for State Estimation in Switching Environments., Automatica, vol. 15, no. 4, pp. 477481,
1979.
[31] D. Crisan and A. Doucet, A Survey of Convergence Results on Particle Filtering
Methods for Practicioners, IEEE Transactions on Signal Processing, vol. 50,
pp. 736746, Maro 2002.
[32] S. J. Julier and J. K. Uhlmann, A New Extension of the Kalman Filter to
Nonlinear Systems, in In Proc. of AeroSense: The 11th Int. Symp. on Aerospace/Defence Sensing, Simulation and Controls, (Orlando, FL), SPIE, 1997.
[33] F. Sun and H. Leib, Multiple-Phase Codes for Detection Without Carrier Phase
Reference, IEEE Transactions on Information Theory, vol. 44, pp. 14771491,
Julho 1998.
83
84
[46] A. Doucet, C. Andrieu, and R. Urien, Bayesian Blind and Semi-Blind Equalization of Channels with Markov Inputs, IEE Proceedings-F Image & Signal
Processing, vol. 148, no. 4, pp. 269274, 2001.
[47] L. R. Bahl, J. Cocke, F. Jelinek, and J. Raviv, Optimal Decoding of Linear Codes
for Minimizing Symbol Error Rate, IEEE Transactions on Information Theory,
vol. 20, pp. 284287, Maro 1974.
[48] N. Metropolis, A. Rosenbluth, M. Rosenbluth, A. Teller, and E. Teller, Equation of State Calculations by Fast Computing Machines, Journal of Chemical
Physics, vol. 21, no. 6, pp. 10871092, 1953.
[49] P. Brmaud, Markov Chains. Berlin: Springer-Verlag, 1999.
[50] W. K. Hastings, Monte Carlo sampling methods using Markov chains and their
application, Biometrica, vol. 57, pp. 97109, 1970.
[51] G. D. Forney, The Viterbi Algorithm, Proceedings of IEEE, vol. 61, pp. 268
278, Maro 1973.
85
Apndice A
Equalizao de Canais de Ordem
Desconhecida e Variantes no Tempo
Empregando Filtros de Partculas
Neste apndice descrevemos algoritmos para equalizao cega aplicveis a modelos de
sinal mais complexos que o tratado nos captulos anteriores. Na Sec. A.1, avaliamos
atravs de simulaes numricas os efeitos do desconhecimento a priori da ordem do
canal sobre os algoritmos descritos na Cap. 3, descrevendo em seguida um mtodo
recm-proposto para a equalizao de canais de ordem desconhecida. Na Sec. A.2,
por sua vez, descrevemos verses dos algoritmos do Cap. 3 adequadas a canais variantes no tempo segundo um modelo AR(1), avaliando os seus desempenhos atravs de
simulaes numricas.
A.1
86
LL
= p(X0:n1 |y0:n1 )
LL
0:n1 , y0:n1 ) ,
p(L|X
(A.1)
O primeiro termo da
em que L um conjunto de valores possveis para a varivel L.
soma em (A.1) tem a mesma expresso de p(yn |X0:n , y0:n1 ) (Eq. 3.15), e o segundo
termo pode ser calculado de forma recursiva como
(A.2)
L|X
0:n1 , y0:n1 ) ,
p(yn |X0:n , y0:n1 , L)p(
(A.3)
LL
L|X
0:n1 , y0:n1 ) .
p(yn |X0:n , y0:n1 , L)p(
(A.4)
Xn LL
O algoritmo proposto por Miguez et al. pode ser interpretado, portanto, com um
conjunto de |L| filtros de partculas operando em paralelo, sendo as estimativas produ
zidas combinadas de acordo com a verossimilhana p(yn |X0:n , y0:n1 , L).
87
A.1.2 Simulaes
Realizamos simulaes numricas para avaliar o desempenho dos algoritmos descritos no Cap. 3 e do algoritmo de Miguez et al. na equalizao de canais de ordem
desconhecida, medindo as taxas mdias de erro de bit (BER) obtidas ao longo de 250
realizaes independentes. Da mesma forma que no Cap. 3, o sistema de comunicao analisado transmite blocos de 400 smbolos BPSK (1) (independentes e equiprovveis) codificados diferencialmente. Em todas as simulaes, os 100 primeiros
smbolos so descartados para fins de medio das taxas de erro de modo a permitir a
convergncia dos algoritmos analisados. Nas simulaes a seguir, empregamos o canal
h = [ 0, 41 0, 82 0, 41]T (L = 3) e rudo aditivo gaussiano branco (real) de mdia
nula.
Na Figura A.1, mostramos o desempenho mdio do algoritmo de Miguez et al.
considerando L = {1, 2, 3, 4, 5} e L = {2, 3, 4}, comparando-o com o desempenho
oferecido pelo algoritmo da Sec. 3.3.1 (SIS estocstico, com funo de importncia
tima) e pelo algoritmo BCJR. Como se pode observar, o desempenho do algoritmo
de Miguez et al. significativamente pior que o do algoritmo operando com o conhecimento da ordem exata do canal para L = {2, 3, 4}, degradando-se ainda mais ao se
assumir L = {1, 2, 3, 4, 5}.
Uma vez que o algoritmo de Miguez et al. aproxima a densidade a posteriori da
0:n , y0:n ), pode-se estimar esta grandeza de maneira tima como
ordem do canal p(L|X
AP
M
0:n , y0:n ) .
L
arg max p(L|X
n
AP
M
Nas Fig. A.2 e A.3, mostramos o comportamento mdio da estimativa L
ao longo
n
de 250 realizaes independentes. Em ambos os casos, as estimativas exibem uma
grande variabilidade, podendo-se no entanto notar que para nveis altos de rudo h
uma tendncia maior de se subestimar a ordem do canal, enquanto para nveis baixos
de rudo a probabilidade de se sobre-estimar a ordem do canal aumenta, sendo que,
para a SNR de 20 dB, o estimador detecta a ordem correta do canal em pouco mais de
40% dos casos.
Uma anlise mais detalhada dos resultados das Fig. (A.2)-(A.3) permite concluir
que o mtodo de Miguez et al. esbarra numa limitao fundamental de problemas de
estimao de ordens de modelos, que o fato de que a verossimilhana de um modelo
tende a crescer como funo da ordem adotada, mesmo que esta seja superior ordem
verdadeira. Vale notar que este problema, que contornado por critrios de estimao
de ordem (como o AIC, BIC [43]) atravs da introduo de uma penalizao (que
diminui artificialmente a verossimilhana dos modelos na medida em que a ordem
88
10
BER
10
10
BCJR
1 L 5
2 L 4
ord. corr.
10
10
SNR
12
14
16
18
20
Figura A.1: Desempenho mdio ao longo de 250 realizaes independentes do algoritmo para equalizao cega em canal de ordem desconhecida de Miguez et al. [1], para
5e2L
4, comparado com o desempenho do equaliordens possveis 1 L
zador timo MAP (BCJR) e do algoritmo para equalizao cega baseado em filtros de
partculas estocsticos com a funo de importncia tima (utilizando N = 300 partculas e suavizao (10 amostras)), num sistema BPSK com codificao diferencial,
em funo da relao sinal-rudo (SNR).
cresce), poderia em princpio ser combatido com a utilizao de distribuies a priori
adequadas para a ordem.
Finalizando, nas Fig. A.4 a A.8, mostramos o desempenho mdio obtido pelos
algoritmos do Cap. 3, empregando N = 300 partculas e suavizao (5 amostras),
em funo da ordem adotada para o canal e da relao sinal-rudo. Em todos estes
experimentos, observamos que o desempenho obtido bastante ruim quando a ordem
subestimada. A rapidez com que o desempenho se degrada na medida em que a
ordem aumentada alm do seu valor correto, no entanto, varia entre os algoritmos,
sendo o algoritmo baseado no filtro de partculas determinstico o menos robusto entre
os analisados.
89
1
L=1
L=2
L=3
L=4
L=5
0.9
0.8
0.7
freqncia
0.6
0.5
0.4
0.3
0.2
0.1
10
SNR
12
14
16
18
20
Figura A.2: Histograma de 250 amostras do estimador MAP da ordem do canal provida
5 em funo da relao sinal-rudo
pelo algoritmo de Miguez et al. com 1 L
(SNR). O canal empregado tem ordem L = 3.
1
L=2
L=3
L=4
0.9
0.8
0.7
freqncia
0.6
0.5
0.4
0.3
0.2
0.1
10
SNR
12
14
16
18
20
Figura A.3: Histograma de 250 amostras do estimador MAP da ordem do canal provida
4 em funo da relao sinal-rudo
pelo algoritmo de Miguez et al. com 2 L
(SNR). O canal empregado tem ordem L = 3.
90
10
BER
10
10
BCJR
L=2
L=3
L=4
L=5
10
10
SNR
12
14
16
18
20
Figura A.4: Desempenho mdio ao longo de 250 realizaes independentes do algoritmo para equalizao cega baseado no princpio da evoluo artificial (com P = 1,
N = 300 partculas e suavizao de 5 amostras), comparado com o desempenho do
equalizador timo MAP (BCJR), em funo da relao sinal-rudo (SNR) e da ordem
assumida para o canal.
0
10
BER
10
10
BCJR
L=2
L=3
L=4
L=5
10
10
SNR
12
14
16
18
20
Figura A.5: Desempenho mdio ao longo de 250 realizaes independentes do algoritmo para equalizao cega baseado no princpio da evoluo artificial (com P = 5,
N = 300 partculas e suavizao de 5 amostras), comparado com o desempenho do
equalizador timo MAP (BCJR), em funo da relao sinal-rudo (SNR) e da ordem
assumida para o canal.
91
10
BER
10
10
BCJR
L=2
L=3
L=4
L=5
10
10
SNR
12
14
16
18
20
Figura A.6: Desempenho mdio ao longo de 250 realizaes independentes do algoritmo para equalizao cega baseado no filtro de partculas determinstico (N = 300
partculas e suavizao de 5 amostras), comparado com o desempenho do equalizador
timo MAP (BCJR), em funo da relao sinal-rudo (SNR) e da ordem assumida
para o canal.
0
10
BER
10
10
BCJR
L=2
L=3
L=4
L=5
10
10
SNR
12
14
16
18
20
Figura A.7: Desempenho mdio ao longo de 250 realizaes independentes do algoritmo para equalizao cega baseado no filtro de partculas estocstico (utilizando a
funo de importncia tima, N = 300 partculas e suavizao de 5 amostras), comparado com o desempenho do equalizador timo MAP (BCJR), em funo da relao
sinal-rudo (SNR) e da ordem assumida para o canal.
92
10
BER
10
10
BCJR
L=2
L=3
L=4
L=5
10
10
SNR
12
14
16
18
20
Figura A.8: Desempenho mdio ao longo de 250 realizaes independentes do algoritmo para equalizao cega baseado no filtro de partculas estocstico (utilizando a
funo de importncia a priori , N = 300 partculas e suavizao de 5 amostras), comparado com o desempenho do equalizador timo MAP (BCJR), em funo da relao
sinal-rudo (SNR) e da ordem assumida para o canal.
93
A.2
Nesta seo, descrevemos como os algoritmos para equalizao cega do Cap. 3 podem
ser reprojetados para a equalizao de canais variantes no tempo. Para tanto, considere
inicialmente o modelo de sinal
Xn = F Xn1 + f xn
(A.5)
hn = hn1 + un
yn = hH
n Xn + vn
em que F e f so descritos na Sec. 1.1, un N (un |0; I) e vn N (vn |0; v2 ) so processos aleatrios gaussianos brancos e mutuamente independentes, e e so constantes reais. Este modelo de sinal permite a aplicao tanto de filtros de partculas
Rao-Blackwellizados (Sec. 2.5.1) como de filtros baseados em evoluo artificial, conforme mostramos a seguir.
Algoritmos Rao-Blackwellizados
No Apndice D, deduzimos as densidades necessrias para o projeto de filtros de partculas Rao-Blackwellizados para o modelo de (A.5). Como resultado principal, temos
que
H Xn ; X H (2
n1 + I 2 )Xn + 2 ,
p(yn |X0:n , y0:n1 ) = N yn |h
n1
n
v
(A.6)
n e
n serem calculados atravs das recurses
podendo os parmetros h
n = hn1 + 1
n Xn (yn hn1 Xn )
h
n
n1 n1
n = 2
n1 Xn XnH
n1 + 2 I
(A.7)
n1 Xn .
sendo n = v2 + XnH
A partir de (A.6), podem-se obter todas as densidades necessrias para o projeto
de algoritmos baseados nos algoritmos SIR estocsticos e determinsticos. Quanto aos
primeiros, note que a funo de importncia tima pode ser obtida a partir da relao
p(Xn |X0:n1 , y0:n ) p(yn |X0:n , y0:n1 ) ,
(A.8)
Xn
94
(A.9)
(A.10)
Evoluo Artificial
Diferentemente do caso envolvendo canais com parmetros fixos, pode-se projetar para
o modelo de sinal de (A.5) algoritmos baseados em evoluo artificial empregando a
densidade de transio verdadeira dos parmetros, que neste caso dada por
p(hn |hn1 ) = N (hn |hn1 ; I 2 ) .
(A.11)
A.2.1 Simulaes
Realizamos simulaes numricas para avaliar o desempenho dos algoritmos para
equalizao cega descritos no Cap. 3 adaptados para o modelo de sinal de (A.5), medindo as taxas mdias de erro de bit (BER) obtidas ao longo de 250 realizaes independentes. O sistema de comunicao analisado transmite blocos de 400 smbolos
BPSK (1) (independentes e equiprovveis) codificados diferencialmente. Em todas
as simulaes, os 100 primeiros smbolos so descartados para fins de medio das taxas de erro de modo a permitir a convergncia dos algoritmos analisados, e os filtros de
(i)
partculas so inicializados de forma aleatria, com h0 N (h0 |0; I) e X0 B(1).
Nas simulaes a seguir, o canal hn iniciado com o valor h0 = [ 0, 41
0, 82 0, 41]T (L = 3), e (sem perda de generalidade) normalizado a cada iterao,
de modo que a relao sinal-rudo se mantenha estvel. Os parmetros e foram
escolhidos de forma que 2 = 0, 0125 e 2 = 1 2 , o que faz com que o processo
h0:n tenha uma banda passante (Doppler, de 3 dB) igual a 4 103 (1/T ).
Na Fig. A.9, mostramos o resultado de uma simulao que ilustra os efeitos da
variabilidade do canal sobre o algoritmo para equalizao baseado no filtro de partculas determinstico projetado para canais invariantes no tempo, sendo o parmetro
do modelo de sinal variado para mltiplos do valor original ( 2 = 0, 0125). Como se
pode observar, o algoritmo projetado em desacordo com o modelo de sinal verdadeiro
falha completamente. Na Fig. A.10, por sua vez, mostramos os resultados obtidos para
o mesmo algoritmo, empregando agora o modelo de sinal correto, comparados com os
resultados do equalizador timo MAP: como esperado, o desempenho do equalizador
piora na medida em que aumenta, distanciando-se do valor timo, mesmo para SNR
elevadas.
Na Fig. A.11, repetimos o mesmo experimento para o algoritmo baseado no filtro
de partculas estocstico (com funo de importncia tima), obtendo resultados pi95
10
BER
10
10
BCJR
FP
2/4
2
/2
2
2
2
2
4
10
10
10
SNR
12
14
16
18
20
Figura A.9: Desempenho mdio ao longo de 250 realizaes independentes do equalizador timo MAP (linha cheia) e do algoritmos para equalizao cega baseado
no filtros de partculas determinstico para canais invariantes do tempo (linha tracejada)(utilizando N = 300 partculas e suavizao (5 amostras)), em funoda relao
sinal-rudo (SNR) e do parmetro (indicado com mltiplos do valor = 0, 0125).
96
10
BER
10
10
BCJR
FP
2/4
2
/2
2
2
2
2
4
10
10
10
SNR
12
14
16
18
20
Figura A.10: Desempenho mdio ao longo de 250 realizaes independentes do equalizador timo MAP (linha cheia) e do algoritmos para equalizao cega baseado no
filtros de partculas determinstico (linha tracejada)(utilizando N = 300 partculas e
suavizao (5 amostras)), em funo da
relao sinal-rudo (SNR) e do parmetro
(indicado com mltiplos do valor = 0, 0125).
0
10
BER
10
10
BCJR
FP
2/4
2
/2
2
22
42
10
10
10
SNR
12
14
16
18
20
Figura A.11: Desempenho mdio ao longo de 250 realizaes independentes do equalizador timo MAP (linha cheia) e do algoritmos para equalizao cega baseado no
filtros de partculas estocstico (linha tracejada)(utilizando a funo de importncia
tima, N = 300 partculas e suavizao (5 amostras)), em funo
da relao sinalrudo (SNR) e do parmetro (indicado com mltiplos do valor = 0, 0125).
97
10
BER
10
10
BCJR
FP
2/4
2
/2
2
2
2
2
4
10
10
10
SNR
12
14
16
18
20
Figura A.12: Desempenho mdio ao longo de 250 realizaes independentes do equalizador timo MAP (linha cheia) e do algoritmos para equalizao cega baseado no
princpio da evoluo artificial (linha tracejada) (com P = 5, N = 300 partculas e
suavizao (5 amostras)), em funo da
relao sinal-rudo (SNR) e do parmetro
(indicado com mltiplos do valor = 0, 0125).
0
10
BER
10
10
BCJR
FP
2/4
2
/2
2
22
42
10
10
10
SNR
12
14
16
18
20
Figura A.13: Desempenho mdio ao longo de 250 realizaes independentes do equalizador timo MAP (linha cheia) e do algoritmos para equalizao cega baseado no
princpio da evoluo artificial (linha tracejada)(com P = 5, N = 1000 partculas e
suavizao (5 amostras)), em funo da
relao sinal-rudo (SNR) e do parmetro
(indicado com mltiplos do valor = 0, 0125).
98
Apndice B
Equalizao Cega empregando o
Algoritmo EM
Introduzido em 1977 por Dempster et al. [7], o algoritmo EM um mtodo iterativo
que produz solues timas (nos sentidos ML ou MAP [5]) para problemas de estimao com dados latentes, ou seja, problemas nos quais a funo de verossimilhana
(a densidade a posteriori) somente tratvel se condicionada a um conjunto de dados
no-observados.
Apesar de terem-se desenvolvido diversos mtodos de obteno de solues timas
no sentido da mxima verossimilhana (ML) para o problema da equalizao cega
utilizando o algoritmo EM ([44][45]), apresentamos nesta seo um novo mtodo,
desta vez de cunho Bayesiano. Nele obtm-se aproximaes para a estimativa MAP
dos parmetros do canal admitindo-se para isto uma densidade a priori gaussiana.
Em conseqncia anlise dos resultados obtidos com esta abordagem, propomos
um segundo mtodo modificado para equalizao cega empregando uma tcnica de
annealing, que corrige deficincias de desempenho observadas quando a relao sinalrudo disponvel alta.
O contedo a seguir est organizado da seguinte forma: na Sec. B.1 apresentamos o
algoritmo EM na sua forma geral. Na Sec. B.2, descrevemos a aplicao do algoritmo
EM soluo do problema da equalizao cega, avaliando seu desempenho atravs de
simulaes numricas. Na Sec. B.3, finalmente, apresentamos o algoritmo modificado
e seu desempenho.
B.1
O algoritmo EM
Dado que se deseje inferir um vetor aleatrio a partir de um conjunto de observaes A e considerando uma varivel aleatria B latente (i.e. no-observada), de sorte
99
que se possa descrever por meio de uma p(|A, B) analiticamente simples, o algoritmo EM prescreve como obter uma seqncia de estimativas (i) , i 0, tais que
p((i+1) |A) p((i) |A). Em outras palavras, o algoritmo EM permite obter valores
(i) que maximizam localmente a densidade a posteriori da varivel inferida.
Dividido basicamente em dois passos, o algoritmo EM consiste primeiramente
(passo E) em determinar a esperana da densidade a posteriori aumentada p(|A, B)
dadas as observaes A e uma estimativa atual (i) . A isto segue-se (passo M) o clculo
da nova estimativa de (i+1) obtida ao maximizar-se a esperana determinada no passo
E em funo de , conforme descrito na Tabela B.1.
1. Passo E (expectation):
(i)
Q(, ) =
log p(|A, B)p(B|A, (i) )dB
(B.1)
2. Passo M (maximization):
(i+1) = arg max Q(, (i) )
(B.2)
p(|A)p(B|, A)
,
p(B|A)
(B.3)
(B.4)
(B.5)
Logo
log[p((i+1) |A)] log[p((i) |A)] =
[Q((i+1) , (i) ) Q((i) , (i) )]
+ [H((i+1) , (i) ) H((i) , (i) )]
[K((i+1) , (i) ) K((i) , (i) )] .
(B.6)
(i+1)
p(B|(i) , A)
, ) K( , )]
log
p(B|(i+1) , A)
B
(i)
(i)
(i)
%
p(B|(i) , A) dB (B.7)
B.2
Nesta seo temos como objetivo desenvolver uma algoritmo para a obteno de estimativas MAP dos parmetros do canal de transmisso h utilizando o modelo de sinal
descrito em (1.1). Em outras palavras, desejamos determinar o conjunto de parmetros
h que maximiza a densidade a posteriori p(h|y0:n , 2 ), em que y0:n { y0 , . . . , yn }.
Observao 1 A aplicao direta do algoritmo EM estimao do sinal transmitido
(i.e., estimativa da moda de p(x0:n |y0:n )) no possvel, uma vez que a grandeza
(i)
Q(x0:n , x0:n )
=
h
(i)
p(h|X0:n , y0:n ) =
(B.8)
(B.9)
(B.10)
(B.11)
j=0
(B.12)
X0:n
= E log p(h|X0:n , y0:n )|h(i) , y0:n .
(B.13)
Assumindo que a densidade a priori dos parmetros do canal Gaussiana complexa, ou seja,
p(h) = N |0 |1 exp h h0 21
NC (h|h0 ; 0 ) ,
(B.14)
(B.15)
Omitiremos a partir deste ponto a dependncia das densidades condicionais em relao ao parmetro 2 (varincia do rudo aditivo), uma vez que este assumido conhecido.
102
h0 21
0
n
1
2
yj hH Xj 2 .
j=0
(B.16)
h h0 21 +
0
n
1
= 2
(2 hH E Xj |h(i) , y0:n yj +
j=0
+hH E Xj XjH |h(i) , y0:n h)
2 hH 1
+ hH 1
0
0 h + .
(B.17)
(B.18)
Q(h, h(i) ) =
h
n
1
1
E Xj XjH |h(i) , y0:n h
0 + 2
j=0
n
1
+ 1
E Xj |h(i) , y0:n yj .
0 h0 + 2
j=0
(B.19)
n
1
1
E Xj XjH |h(i) , y0:n < 0.
0 + 2
j=0
103
(B.20)
Igualando-se (B.19) a zero, segue que o mximo de Q(h, h(i) ) dado por
1
n
1
=
1
E Xj XjH |h(i) , y0:n
0 + 2
j=0
n
1
1
E Xj |h(i) , y0:n yj .
0 h0 + 2
j=0
h(i+1)
(B.21)
As esperanas em (B.21) podem ser calculadas numericamente atravs do algoritmo BCJR [47] (vide Apndice), uma vez que
Ns
(i)
E Xj |h , y0:n = Xi P(Xj = Xi |h(i) , y0:n )
i=1
Ns
E Xj XjH |h(i) , y0:n =
(B.22)
(B.23)
i=1
(B.24)
b | xj =a
104
B.2.1
Simulaes
10
-1
BER
10
-2
10
-3
10
EM (1 iter.)
EM (10 iter.)
EM (25 iter.)
Viterbi
-4
10
10
SNR (dB)
12
14
16
18
20
Figura B.1: Desempenho mdio ao longo de 100 realizaes independentes do algoritmo para equalizao cega descrito na Sec. B.2 em funo da relao sinalrudo(SNR) e o nmero de iteraes.
B.3
Algoritmo Melhorado
105
B.3.1
Simulaes
Nas Figs. B.2 e B.3 mostramos o desempenho obtido pela verso modificada do algoritmo da Sec. B.2, utilizando (i) = 100,1i e (i) = 100,05i , respectivamente,
empregando as mesmas hipteses adotadas na Sec. B.2.1.
Como se pode observar, ao fazer (i) = 100,1i nota-se ainda uma degradao de
desempenho para SNR superiores a 12 dB (Fig. B.2). Diminuindo-se o nvel de rudo
adicional mais lentamente ((i) = 100,05i ), no entanto, o desempenho do algoritmo
modificado aproxima-se bastante daquele do detector timo MLSE (Viterbi) para 25
iteraes, como se pode observar na Fig. B.3.
B.4
Comentrios
Apresentamos neste captulo algoritmos para a equalizao de canais lineares FIR baseados na verso Bayesiana do algoritmo EM. O algoritmo desenvolvido gera estimativas dos parmetros do canal de transmisso que maximizam localmente a densidade
Note que o algoritmo EM opera de forma determinstica, e que os valores de h(i) e y0:n definem
completamente o comportamento do algoritmo nas iteraes posteriores.
3
106
10
-1
BER
10
-2
10
-3
10
EM (1 iter.)
EM (10 iter.)
EM (25 iter.)
Viterbi
-4
10
10
SNR (dB)
12
14
16
18
20
107
10
-1
BER
10
-2
10
-3
10
EM (1 iter.)
EM (10 iter.)
EM (25 iter.)
Viterbi
-4
10
10
SNR (dB)
12
14
16
18
20
108
Apndice C
Estimao atravs de Mtodos MCMC
Os mtodos MCMC (Markov Chain Monte Carlo) so ferramentas numricas para a
gerao de amostras de variveis aleatrias baseadas na simulao de cadeias de Markov [49]. A utilizao destes mtodos, que permaneceu limitada at os anos 90 devido
a restries na rea computacional, promoveu grandes avanos na rea da estatstica
aplicada por permitir a obteno de solues Bayesianas para inmeros problemas de
estimao praticamente intratveis por mtodos tradicionais.
Neste apndice apresentamos uma breve introduo s cadeias de Markov (Sec. C.1),
descrevendo em seguida os dois principais mtodos MCMC: o algoritmo de MetropolisHastings (Sec. C.2) e o Amostrador de Gibbs (Sec. C.3). Em seguida, descrevemos
dois algoritmos para equalizao cega baseados no Amostrador de Gibbs desenvolvidos em [11] e [29] (Sec. C.4), avaliando seu desempenho atravs de simulaes
numricas.
C.1
Nesta seo apresentamos uma sntese de resultados sobre cadeias Markov, enfatizando aqueles ligados ao funcionamento das tcnicas MCMC. Referncias completas
sobre o assunto podem ser encontradas em [8], [49] e [42], entre outros.
Entendemos por cadeias de Markov uma seqncia x0:n de variveis aleatrias tal
que
P(xk+1 A|x0:k ) = P(xk+1 A|xk ) .
(C.1)
109
pelo seu ncleo de transio (transition kernel) [42], uma funo K definida1 em X
B(X ) tal que
(i) x X , K(x, ) uma medida de probabilidade;
(ii) A B(X ), K(, A) mensurvel.
(iii) P(xk+1 A|xk ) =
A
K(xk , dxk+1 ).
Xk
K(xk , B)(dxk ) .
(C.2)
(C.3)
exista e seja igual distribuio da qual se deseja amostrar. Assim, desde que a k
convirja para p a uma taxa suficientemente3 alta, pode-se assumir para fins prticos
que xk p(x), k > k0 , sendo as amostras x0 , ..., xk0 descartadas (perodo de burn
in).
Um segundo resultado mais restritivo que garante a existncia de uma medida invariante a satisfao da condio de balano detalhado, definida como
K(y, x)(y) = K(x, y)(y) x, y .
(C.4)
Caso (C.4) for satisfeita, a cadeia de Markov em questo reversvel e possui medida
invariante .
Indicamos pela notao B(X ) o campo de Borel gerado pelos elementos de X .
Pela notao x p(x) entende-se que a varivel aleatria x tem sua densidade dada por p(x).
3
Infelizmente, difcil estabelecer condies gerais de convergncia para as medidas invariantes dos
ncleos de transio empregados pelos mtodos MCMC. possvel demonstrar que, sob condies de
regularidade expostas em ([8], Cap. 4 e 6), o algoritmo de Metropolis-Hastings e o Amostrador de
Gibbs geram cadeias tais que K n (x, ) h M rn , onde M e r so constantes e h denota [8]
&
&
&
&
&
h = sup & g(x)(dx)&& .
1
2
|g|h
110
C.2
Algoritmo de Metropolis-Hastings
O Algoritmo de Metropolis-Hastings (M-H) [50] um mtodo para a gerao de amostras de densidades uni- ou multivariadas baseado na simulao de cadeias de Markov,
aplicvel caso a densidade da qual se deseja amostrar tenha forma conhecida4 .
A operao deste algoritmo bastante similar5 das tcnicas de simulao de variveis aleatrias por aceitao/rejeio [19], obtendo novas amostras para a seqncia
gerada a partir de uma densidade proposta q(). Sendo p a densidade da qual se deseja
amostrar e xk o elemento atual da seqncia gerada, o elemento xk+1 obtido atravs
do procedimento descrito na Tab. C.1.
Dado xk
1. Gere yk q(y|xk ).
'
2. Faa
xk+1 =
em que
(x, y) = min
(
p(y) q(x|y)
,1 .
p(x) q(y|x)
111
C.3
Amostrador de Gibbs
O Amostrador de Gibbs (AG) uma tcnica baseada na simulao de cadeias de Markov adequada gerao de amostras de distribuies de probabilidade multivariadas.
Suponha que, para algum m > 1, a varivel aleatria multidimensional possa ser
escrita como = [(1) , , (m) ]T , sendo (i) parties uni- ou multidimensionais do
vetor . Suponha ainda que se possam gerar amostras das densidades condicionais
completas (p1 , , pm ), definidas como:
pi = p((i) |(1) , (2) , , (i1) , (i+1) , , (m) ) .
(C.5)
(m)
(2)
(m)
1. k+1 p1 ((1) |k , , k )
(2)
(1)
(3)
(m)
2. k+1 p2 (2 |k+1 , k , k )
.
.
.
(m)
(1)
(m1)
112
amostras obtidas aps o perodo de burn in das cadeias simuladas6 . Uma vez que as
amostras obtidas desta forma so distribudas de acordo com p() (a densidade conjunta a posteriori dos parmetros), pode-se ento estimar as densidades marginais de
qualquer um dos parmetros contidos em , atravs do histograma de sua densidade
a posteriori ou da relao:
(i)
p( ) =
N
1
p((i) |([i]) )n([i]) .
N n=1
(C.6)
([i])
C.4
Note que os elementos de uma amostra obtida desta forma so dependentes, j que a seqncia
n+1 , , n+K uma cadeia de Markov. Um esquema alternativo (e ineficiente) de amostragem
que garante a independncia das amostras geradas consiste em tomar como amostra da distribuio de
interesse apenas o ltimo elemento i gerado, repetindo o mesmo procedimento K vezes, empregando
0 independentes.
113
p(xj ) =
(C.7)
(C.8)
e que a varincia do rudo aditivo tenha a densidade a priori gama inversa, i.e.
p( 2 ) = IG( 2 |; ) =
( 2 )(+1) e 2 .
()
(C.9)
114
2. Itere
x0
(i+1)
x1
..
.
(i+1)
..
.
(i+1)
xn1
(i+1)
xn
h(i+1)
( 2 )(i+1)
(i)
(i)
(i+1)
(i+1)
(i)
(C.10)
p(x0:n |y0:n ) =
(i)
(x0:n x0:n )
(C.11)
(h h(i) )
(C.12)
( 2 ( 2 )(i) )
(C.13)
k=j+1
i
p(h|y0:n ) =
k=j+1
i
p( |y0:n ) =
k=j+1
Observao 4 Caso p(xi ) seja tal que p(xi ) = p(kxi ), para algum k C, no
possvel estimar a densidade a posteriori dos smbolos transmitidos atravs de (C.11)
(ambigidade de fase). Uma soluo para este problema (caso os smbolos transmitidos sejam binrios) assumir que os sinal transmitido codificado diferencialmente,
ou seja, xn = sn xn1 , em que sn {1} a mensagem transmitida. Neste caso,
amostras da mensagem podem ser recuperadas sem ambigidade de fase ( exceo
(i)
do primeiro elemento s0 ) pela relao
(i)
(i)
s(i)
n = xn xn1 ,
i
k=j+1
115
(i)
(s1:n s1:n ) .
(C.14)
Determinaremos agora as densidades condicionais completas da Eq. (C.10). Definindo inicialmente a seqncia x[j] = (x0 , . . . , xj1 , xj+1 , . . . , xn ), temos que
p(xn = Xj , x[n] , y0:n , h, 2 )
p(xn = Xj |x[n] , h, 2 , y0:n ) =
2
j p(xn = Xj , x[n] , y0:n , h, )
(C.15)
n
p(xi ) ,
(C.18)
i=0
e na passagem de (C.16) para (C.17), por sua vez, exploramos o fato de que
p(y0:n |x0:n , h, 2 ) =
n
p(yi |Xi , h, 2 ) ,
(C.19)
i=0
= NC (h|h0 ; 0 )
n
(C.20)
(C.21)
(C.22)
NC (yi |hH Xi ; 2 )
(C.23)
i=0
= NC (h|hn ; n ) ,
(C.24)
em que
hn = n
1
n
n
1
Xi yi + 1
0 h0
2 i=0
n
1
=
Xi XiH + 1
0 .
2 i=0
116
,
(C.25)
(C.26)
Caso a varincia do rudo aditivo seja assumida desconhecida, sua densidade condicional completa pode ser determinada como
p(y0:n |x0:n , h, 2 )p(x0:n )p(h)p( 2 )
p(y0:n |x0:n , h, 2 )p(x0:n )p(h)p( 2 )d 2
p(y0:n |x0:n , h, 2 )p( 2 )
n
2
= p( )
p(yi |Xi , h, 2 )
p( 2 |x0:n , h, y0:n ) =
i=0
= IG( 2 |; )
(C.28)
(C.29)
NC (yi |hH Xi ; 2 )
i=0
IG
n
(C.27)
N
2 | + ; +
yi hH Xi 2
2
i=0
n
(C.30)
.
(C.31)
2 (i+1)
(i+1)
( )
p( 2 |x0:n , h(i+1) , y0:n )
(C.32)
Para se obter amostras da densidade p(x0:n |h(i) , ( 2 )(i) , y0:n ), deve-se observar primeiro que
2
n1
(C.33)
i=0
Cada uma das densidades em (C.33) podem ser determinadas atravs de um procedimento conhecido como forward-backward sampling. O primeiro passo (forward)
117
consiste em fazer
p(yi+1 |xi+1 , y0:i , h, 2 )p(xi+1 |y0:i , h, 2 )
p(yi+1 |y0:i , h, 2 )
p(yi+1 |xi+1 , y0:i , h, 2 )p(xi+1 |y0:i , h, 2 )
p(xi+1 |y0:i+1 , h, 2 ) =
(C.34)
(C.35)
(C.36)
(C.37)
(C.38)
xi
xi
(C.39)
(C.40)
(C.41)
C.4.4 Simulaes
Realizamos simulaes numricas nas quais medimos as taxas mdias de erro de bit
(BER) obtidas pelos algoritmos descritos nas Sec. C.4.2 e C.4.3 ao longo de 100 experimentos independentes. O sistema de comunicao analisado transmite blocos de 100
smbolos binrios IID (empregando codificao diferencial), descartando os 5 ltimos
bits de cada extremidade para a determinao das taxas de erro. Empregamos o canal
h = [0, 41 0, 820, 41]T , sendo sua ordem e a potncia do rudo assumidas conhecidas
pelo receptor.
Confirmando os resultados apresentados em [11], o algoritmo baseado em amostragem seqencial (Sec. C.4.2) teve um desempenho bastante ruim: as taxas de erro
convergem para um patamar na faixa dos 20%, no decrescendo mesmo ao se iterar a
cadeia de Markov resultante por mais de 1.000 iteraes.
Na Fig. C.1 mostramos o desempenho obtido pelo algoritmo baseado no amostrador conjunto (Sec. C.4.3), em funo da SNR e do nmero de iteraes da cadeia de
118
Markov (100, 200 e 300 iteraes). Para estimar o sinal transmitido, empregamos em
todos os casos as 50% ltimas amostras simuladas. Como se pode observar, o algoritmo da Sec. C.4.3 teve um desempenho bastante prximo ao do detector timo MLSE
treinado (Viterbi).
Como tambm se pode observar, o desempenho deste algoritmo sofre uma degradao sob relaes sinal-rudo elevadas na medida em que se aumenta o nmero de
amostras empregadas, muito provavelmente devido ocorrncia de ciclos-limite (nos
moldes do observado para o algoritmo EM), uma vez que o Amostrador de Gibbs
comporta-se quase que deterministicamente nestas condies.
0
10
-1
10
-2
BER
10
-3
10
-4
10
100 iter
200 iter
300 iter
Viterbi
-5
10
8
SNR (dB)
10
12
14
16
Figura C.1: Desempenho mdio ao longo de 100 realizaes independentes do algoritmo para equalizao cega baseado no amostrador de Gibbs conjunto descrito na
Sec. C.4.3 em funo da relao sinal-rudo (SNR) e do nmero de iteraes da Cadeia
de Markov.
C.5
Comentrios
pela ambigidade de fase inerente ao problema da equalizao cega, uma vez que a
estimativa das densidades a posteriori s pode ser feita se as variveis mantiverem
coerncia de fase durante as diversas iteraes do algoritmo. Nas simulaes que realizamos, este problema foi contornado atravs do uso codificao diferencial.
120
Apndice D
Densidades empregadas pelos Filtros
de Partculas Rao-Blackwellizados
Neste apndice apresentamos a deduo da expresso da densidade p(yn |X0:n , y0:n1 )
empregada pelos filtros de partculas Rao-Blackwellizados (Sec. 3.2) para equalizao
cega sob rudo gaussiano (real ou complexo), com parmetros variantes no tempo, de
acordo com o modelo
Xn = F Xn1 + f xn
(D.1)
hn = hn1 + un
yn = hH
n Xn + vn
em que , R, o rudo de excitao un N (un |0; I), independente do rudo de
observao vn N (vn |0; v2 ), e F e f so descritos na Sec. 1.1.
Inicialmente, note que a densidade de interesse pode ser obtida como
p(yn |X0:n , y0:n1 ) =
dhn p(yn , hn |X0:n , y0:n1 )
=
dhn p(yn |hn , X0:n , y0:n1 )p(hn |X0:n , y0:n1 )
Como conseqncia do modelo de sinal, primeiramente obtemos que
p(yn |hn , X0:n , y0:n1 ) = p(yn |hn , Xn ).
Mas
p(hn |X0:n , y0:n1 )
p(Xn |, hn , X0:n1 , y0:n1 )
p(Xn |X0:n1 )
=
=
= 1,
p(hn |X0:n1 , y0:n1 )
p(Xn |X0:n1 , y0:n1 )
p(Xn |X0:n1 )
o que implica que
p(hn |X0:n , y0:n1 ) = p(hn |X0:n1 , y0:n1 ).
121
(D.2)
Assim
p(yn |X0:n , y0:n1 ) =
(D.3)
()
(D.4)
(D.5)
Conseqentemente
()() = ()
O+1
n1 |1/
v |
!1
2
1 1 2
H
2
2
,
exp v |yn hn Xn | hn hn1 1
n1
+,
*
(D.6)
(#)
(D.7)
1
= v2 Xn XnH + n1
n
2
1
n hn = v Xn yn + n1 hn1
(D.8)
(D.9)
n1 Xn XnH
n1
,
n1 Xn + v2
XnH
122
(D.10)
e que
n = h
n1
h
H Xn
n1 Xn yn h
n1
!
.
n1 Xn + v2
XnH
(D.11)
Assim
H
H 1
1
RES = v2 yn yn + h
n1 n1 hn1 hn n hn ,
(D.12)
H Xn |2
|yn h
n1
,
H
Xn n1 Xn + v2
(D.13)
e finalmente que
()() =
()
O+1
n1 |1/
v |
exp
1
H Xn |2
|yn h
n1
H
X n1 Xn + 2
n
n 2 1
+ hn h
(D.14)
2!
,
e, portanto,
n ; n )N (yn |h
H Xn ; X H
n1 Xn + 2 ) ,
()() = n N (hn |h
n1
n
v
em que
6
!
7
7 |
n1 Xn + 2
n1 | X H
n
v
8
n =
.
2
|n |v
(D.15)
(D.16)
1
n1 ||n |1 = |1
|
n n1 |
e que
1
1
n n1 = I
n1 Xn XnH
.
n1 Xn + v2
XnH
123
resultado desejado:
H Xn ; X H
n1 Xn + v2 ) .
p(yn |X0:n , y0:n1 ) = N (yn |h
n1
n
(D.17)
n1 e
n1 . Definindo
Resta agora obter expresses para h
n1 ;
n1 )
p(hn1 |X0:n1 , y0:n1 ) = N (hn1 |h
e explorando o fato de que
p(ht |X0:n1 , y0:n1 ) = p(ht |hn1 )
obtemos
n1
n1 = h
h
n1 + I 2
n1 = 2
(D.18)
(D.19)
(D.20)
n = hn1 + 1
n Xn (yn hn1 Xn )
h
n
n = 2
n1 Xn XnH
n1 + 2 I
n1 n1
(D.21)
n1 Xn .
sendo n = v2 + XnH
Note que se = 1 e = 0 (canal invariante no tempo):
H Xn ; X H
n1 Xn + v2
p(yn |X0:n , y0:n1 ) = N yn |h
n1
n
onde
n = h
n1 + 1
n1 Xn
n Xn yn h
h
n
n =
n1 Xn X H
n1
n1 1
n
n
124
(D.22)
(D.23)
Apndice E
Amostragem Seqencial Fundamentos
Neste apndice descrevemos o conceito de amostragem seqencial por importncia (no
qual se baseia o funcionamento dos filtros de partculas) a partir de princpios bsicos
da teoria de probabilidade. O contedo deste apndice est organizado da seguinte
forma: na Seo E.1, descrevemos como uma funo densidade de probabilidade genrica p(x) pode ser aproximada por uma soma ponderada de medidas discretas. Na
Seo E.2, apresentamos o princpio da amostragem por importncia, detalhando sua
aplicao aproximao de funes densidade de probabilidade. Na Seo E.3, mudando um pouco de linha, mostramos que a amostragem de densidades multivariadas
pode ser realizada de forma seqencial, mas que isto no se generaliza para densidades
multivariadas condicionais.
E.1
f (x)p(x)dx .
125
(E.1)
E[f (x)] =
f (x(i) ) ,
N i=1
(E.2)
(E.3)
Fazendo uso intensivo de conceitos avanados de probabilidade ([9], Cap. 2), podese verificar que pN (x) como definido em (E.3) converge em distribuio para a densidade correta quando N .
E.2
Definindo w(x)
p(x)
,
(x)
p(x)
(x) dx
(x)
p(x)
(x) dx
(x)
f (x)
(E.4)
temos
E[f (x)] =
(E.5)
A nica restrio que se impem sobre (x) que a mesma seja no-nula no suporte de p(x), por
razes bvias.
2
Note que o termo do denominador de (E.5) igual por definio a 1; sua introduo necessria
para que a estimativa (E.6) no seja viesada.
126
que, pelo mesmo princpio empregado em (E.2), pode ser aproximado por
(x)] =
E[f
N
f (x(i) ) w(x(i) )
,
N
(i)
i=1 w(x )
i=1
(E.6)
E.3
Amostragem Seqencial
(E.8)
)
A densidade conjunta das amostras obtidas ser dada3 ento por ni=0 pi (xi ). Fazendo
)
pi (xi ) = p(xi |x0 , . . . , xi1 ), temos que ni=0 pi (xi ) = p(x0 , . . . , xn ), respondendo a
pergunta inicial, j que:
p(x0 )p(x1 |x0 )p(x2 |x0 , x1 ) . . . p(xn |x0 , . . . , xn1 ) = p(x0 , . . . , xn ) .
(E.9)
Note que isto verdadeiro mesmo se as densidades pi (xi ) dependerem dos valores das demais
amostras, j que a amostragem independente.
127
n
i=1
128
(E.10)
Apndice F
O Algoritmo BCJR
Seja xn uma varivel aleatria discreta e yn o sinal observado de acordo com o seguinte
modelo:
Xn = f (Xn1 , xn )
(F.1)
yn = g(Xn ) + un
em que f e g so funes possivelmente no-lineares e un uma v.a. de distribuio
conhecida. O algoritmo BCJR [47] permite que, dada uma seqncia de observaes
y0:k , sejam calculadas recursivamente as densidades a posteriori p(xi |y0:k ), 0 i k.
Para demonstrar o funcionamento do algoritmo BCJR, note inicialmente que a densidade conjunta p(Xn = a, Xn+1 = b, y0:k ) pode ser fatorada da seguinte forma:
p(Xn = a, Xn+1 = b, y0:k ) = p(Xn = a, Xn+1 = b, y0:n1 , yn , yn+1:k )
(F.2)
(F.3)
129
(F.5)
(F.6)
(F.7)
(F.8)
(F.9)
Assumindo que o rudo un tem uma distribuio gaussiana branca com mdia nula e
varincia 2 , o primeiro fator em (F.9) dado por
p(yn |Xn = a, Xn+1
"
1
= b) =
exp 2 |yn g(Xn )|2
2
2 2
#
.
(F.10)
O segundo fator, por sua vez, pode ser calculado observando-se que
p(Xn+1 = a|Xn = b) = p(Xn = b, xn = s(a,b) )/p(Xn = b)
(F.11)
(F.13)
= p(xn = s(a,b) ) ,
(F.14)
(F.15)
(F.16)
(F.17)
(F.18)
(F.19)
(F.20)
a
a
(F.21)
(F.22)
(F.24)
(F.25)
b
(F.26)
resultando que
p(y0:k ) =
a
(F.27)
(F.28)
(F.29)
[n ]ij = n (i, j) ,
(F.30)
e a matriz
em que |X | denota o nmero de estados assumido pela v.a. Xn , obtemos que as recurses (F.20) e (F.25) podem ser reescritas como
n+1 = n n
n = Tn n+1 ,
131
(F.31)
(F.32)
(F.33)
A partir das probabilidades de transio de estado p(Xn = a, Xn+1 = b|y0:k ) podese determinar as probabilidades a posteriori individuais de cada smbolo transmitido
observa-se a relao
p(xn |y0:k ) =
s(a,b) =x
1
=
p(y0:k )
s(a,b) =x
(F.34)
(F.35)
(F.36)
1
n (a)n (a, b)n+1 (b) .
p(y0:k ) a
(F.37)
132
L1
xki hk,i + vk = hH
k X k + vk .
(1)
i=0
giving rise to the desired density via marginalization. However, if the usual Gaussian assumption is relaxed and the noise
distribution no longer admits sufficient statistics [6], RaoBlackwellized particle filters (i.e., algorithms which integrate
nuisance parameters) can no longer be developed. As a consequence, one must resort to methods that estimate jointly parameters and state as described in Sec. 3.
3. PARTICLE FILTERS FOR JOINT PARAMETER
AND STATE ESTIMATION
In this section we provide a brief introduction to the use of
particle filters in estimation problems with unknown fixed parameters. Please refer to [5, Ch. 2] and [4] for further information and discussion of open theoretical problems regarding
the convergence of these algorithms.
Suppose that one desires to sequentially approximate the
density p(X0:k , h0:k |y0:k ) by means of a set of weighted samples (particles). Upon observing yk , one must come up with
samples of the variables Xk and hk such that the joint posterior distribution of X0:k and h0:k is approximated. According to the classical Gordon method, this is achieved easily by
sampling from an arbitrary importance density (h0:k , X0:k |
y0:k ) defined as the product of its marginals, i.e.,
(h0:k , X0:k |y0:k ) = (h0:k1 , X0:k1 |y0:k1 )
(Xk , hk |h0:k1 , X0:k1 , y0:k ),
and by attributing the weight
(i)
(i)
(i)
(i)
(i)
(i)
(i)
(i)
(i)
(i)
(i) p(Xk , hk , yk |h0:k1 , X0:k1 , y0:k1 )
wk1
(i)
(i) (i)
(i)
(hk , Xk |h0:k1 , X0:k1 , y0:k )
. (2)
Under the assumption that the parameter vector is timeinvariant, one gets that p(hk |h0:k1 ) = (hk h0 ) (where
denotes the Dirac impulse function). This causes the weight
(i)
(i)
of any particle for which hk
= h0 to be zeroed, which prevents the adaption of the parameters no matter the importance
(4)
with 2 h0 2 .
3.2. Basic Blind Equalization Algorithm
For the signal model of Sec. 2, the remaining terms of (3) can
be easily determined. While the likelihood term is given by
p(yk |hk , Xk ) = g(yk hH
k Xk ),
(5)
(6)
where I{} denotes the event indicator and [A]i indicates the
ith element of a vector. Notice that the term that multiplies
p(xk |xk1 ) on the r.h.s. of (6) always equals 1 if the sequence
X0:k is consistent with its definition given in Sec. 2. Therefore
(7)
p(Xk |X0:k1 ) = p(xk ) ,
as the coded symbols xk are assumed i.i.d..
Observe also that (6) implies that p(X0:k ) = p(x0:k ), and,
similarly, exploiting the fact that b0:k uniquely defines x0:k ,
we obtain that p(X0:k , h0:k |y0:k ) = p(b0:k , h0:k |y0:k ). By
combining (4)-(7), one can evaluate (3) and, as a result, the
weight update function (2). Adopting the prior importance
function,
(i)
(i)
(i)
(i)
(i)
and normalized, and a sample is drawn from the resulting discrete joint density. The weights are then evaluated according
to (2).
(Initialization)
(i)
0 ; 0 ).
-Draw h0 NC (h0 |h
(i)
-Draw X0 p(X0 ).
For k > 0
For i = 0, ..., P 1,
(i)
(i)
-Draw hk N (hk |hk1 ; I2 ).
(i)
(i)
(i)
-Draw Xk p(Xk |Xk1 ).
(i)
(i)
-Obtain bk by decoding x0:k
-Calculate and normalize the weights
(i)
(i)H (i)
wk g(yk hk Xk ) .
End
-Resample [5] the particle set with probabilities
(i)
given by the weights wk .
-Estimate P (bk ) as
N 1
(i)
P (bk = B|y0:k ) N1 i=0 I{bk = B} .
End
Table 1. Basic Blind Equalization Algorithm (AE I)
3.3. Smoothing
A method described in [7] allows one to approximate the
smoothing density p(bk |y0:k+d ), d > 0, by a trivial modification of the algorithm of Table 1. Suppose that at instant k the
resampling step produces a set of indexes jk (i), 0 i < P .
(i)
(i)
(i)
jk (i)
Now, introducing the notation bk,k bk and bl,k+1 bl,k
,
l k, one can show that for d 0,
P (bkd = B|y0:k )
N 1
1
(i)
I{bkd,k = B} ,
N i=0
(9)
(i)
(Initialization)
(i)
0 ; 0 ).
-Draw h0 NC (h0 |h
(i)
-Draw X0 p(X0 ).
For k > 0
For i = 0, ..., P 1,
-For r = 0, ..., M 1, draw
(i,r)
(i)
hk NC (hk |hk1 ; I(2 /2)).
-Draw Xk and hk jointly from the discrete density
(i)
(i,r)
(Xk , hk ) g(yk hH
},
k Xk )p(Xk |Xk1 )I{hk = hk
(i)
-Calculate and normalize the weights wk
2
(r)H (s)
(s)
(i)
(r) (i)
Xk )p(Xk |Xk1 )N (hk |hk1 ; I 2 ) .
r,s g(yk hk
End
(i)
(i)
-Obtain bk by decoding x0:k , i = 0, ..., P 1.
-Resample the particle set with probabilities
(i)
given by the weights wk .
-Estimate P (bkL ) as
N 1
(i)
P (bkL = B) N1 i=0 I{bkd,k = B} .
End
Table 2. Modified Algorithm (AE II)
5. SIMULATION RESULTS
To quantify the performance of the proposed blind equalization methods, we carried out numerical simulations, evaluating the mean BER (bit error rates) along 250 independent
realizations, each containing a block of 400 independently
transmitted QPSK symbols. BER evaluation was made after discarding the first 100 symbols to allow for algorithm
convergence. The proposed algorithms were initialized as de 0 = 0 and
0 = I.
scribed in Tables 1 and 2, with h
We chose a white Weibull envelope noise model (see the
Appendix), with parameter a = 1.1 (strongly non-gaussian),
and employed order L = 3 normalized complex random channels, drawn from the complex Gaussian prior N (h|0; I). To
establish a comparison basis, we also evaluated the performance of the optimal MLSE equalizer (Viterbi) with exact
channel knowledge and using the Weibull envelope noise density to compute path metrics.
In all simulations, we adopted 2 = 0.05 and employed
the residual resampling algorithm [5, Ch. 1]. In Fig. 1 we
show the mean BER obtained by the algorithms with a smoothing lag of d = 10. As one can readily verify, the algorithm of
Table 1 (AE I) performed very poorly (the same was verified
for d = 0, not shown in the graphic). While the algorithm of
Table 2 (AE II) also performed poorly for M = 1, its performance was much improved for M = 5, approaching that of
[3] E. Punskaya, C. Andrieu, A. Doucet, and W. J. Fitzgerald, Particle Filtering for Demodulation in Fading Channels with non-Gaussian Additive Noise, IEEE Trans. on
Comm., vol. 49, no. 4, pp. 579582, April 2001.
10
-1
BER
10
-2
10
Viterbi
AE I
AE II (M=1)
AE II (M=5)
500 part.
1000 part.
0
10
SNR
12
14
16
18
20
Fig. 1.
Performance of blind equalization algorithms
(smoothing lag d = 10) under Weibull envelope white noise
as a function of the signal-to-noise ratio (SNR) and of the
number of particles employed, compared to the performance
of the optimal MLSE detector (Viterbi).
6. CONCLUSIONS
In this work we proposed and evaluated the performance of
blind equalization algorithms for known-order FIR channels
subject to additive non-gaussian noise. We introduced a new
importance function that led to greatly improved performance
under the simulation scenarios considered, in which QPSK
differentially modulated symbols are transmitted under Weibull envelope noise.
Due to computational restraints, we did not evaluate the
performance of the proposed methods in steady state. However, we did not notice convergence issues when the proposed
algorithms are run for up to 10.000 iterations.
7. REFERENCES
[1] P. M. Djuric, J. H. Kotecha, J. Zhang, Y. Huang, T. Ghirmai, M. F. Bugallo, and J. Miguez, Particle Filtering,
IEEE Sig. Proc. Mag., vol. 20, no. 5, pp. 1938, September 2003.
[2] C. J. Bordin and L. A. Baccala, Particle Filter Algorithms for Joint Blind Equalization/Decoding of Convolutionally Coded Signals, in Proc. of ICASSP 2005,
Philadelphia, PA - USA, 2005, vol. 3, pp. 497500.
[7] J. S. Liu and R. Chen, Blind Deconvolution via Sequential Imputations, Journal of the American Statistical Association, vol. 90, no. 430, pp. 567576, Junho 1995.
[8] L. Gang and K. Yu, Modelling and Simulation of Coherent Weibull Clutter, IEE Proc. F, vol. 136, no. 1, pp.
112, February 1989.
[9] A. Farina, A. Russo, F. Scannapieco, and S. Barbarossa,
Theory of Radar Detection in Coherent Weibull Clutter,
IEE Proc. F, vol. 134, no. 2, pp. 174190, 1987.
= x(x2 + y 2 )1/a1/2
= y(x2 + y 2 )1/a1/2
|v|
.
(11)
2 2
2 2
The kurtosis of v (as well as its variance) is a function of
the parameter a. It can be verified that for 1 < |a| 2, v is
supergaussian, characteristic that is emphasized when a 1.
Although Weibull envelope processes have long been used to
model heavy-tailed disturbances found, for instance, in radar
detection problems [9], most authors in the communications
literature tend to resort to gaussian sum models for the same
purpose.
After stating the estimation problem (Sec. 2) and overviewing particle filters (Sec. 3), we show how to obtain the
densities applicable to solving the joint blind equalization/decoding problem (Sec. 4). This is followed in Section 5 by
numerical illustrations leaving our conclusions to Section 6.
2. SIGNAL MODEL AND PROBLEM STATEMENT
Consider a convolutionally coded digital communication system that transmits BPSK symbols over an additive noise
frequency selective channel. Denoting the transmitted bit
sequence by xk and the code rate by 1/R, the transmitted
(binary) symbol sequence ck is obtained as
K
n
cRm+n =
xml pl
mod 2, 0 n < R, (1)
l=0
L1
hl skl + vk ,
(2)
l=0
(3)
where d 0 and y 0:k (y0 , . . . , y(k+1)R1 ). In next sections we describe how particle filters can be employed to
obtain estimates of the posterior densities p(xk |y 0:k+d ) for
the considered signal model.
3. PARTICLE FILTERS
Many estimation problems in discrete-time signal processing, including blind equalization, can be stated as that of
tracking the state xk of a dynamic system
'
xk+1 = fk (x0 , . . . , xk , uk )
(4)
= gk (x0 , . . . , xk , vk )
yk
from the observation of its output y0:k sequence, where fk
and gk , in full generality, may be nonlinear, time-varying
functions and uk and vk stand respectively for system driving and observation noise.
The Bayesian solution to (4) involves finding the posterior density p(xk |y 0:k ), which can be accomplished in closedform only in a few restrictive cases. Particle filters provide iterative approximations to p(x0:n |y 0:n ) (from which
p(xn |y 0:n ) can be obtained by marginalization) via a weighted sum of Dirac measures which approximates densities of
arbitrary shape [2].
3.1. Principles
Most particle filtering algorithms rest on the importance sampling principle, whereby the probability density p(x0:k |y 0:k )
can be consistently approximated [2] as the weighted sum
of Dirac measures
M (i)
(i)
wk x0:k (x0:k )
p(x0:k |y 0:k ) = i=1M
,
(5)
(i)
i=1 wk
(i)
(6)
(i)
wn(i)
xk
(9)
(7)
The choice of the importance function, though essentially arbitrary, impacts the algorithm performance: one can
show that (xk |x0:k1 , y 0:k ) = p(xk |x0:k1 , y 0:k ) is optimal in minimizing the conditional variance of the (unnor(i)
malized) weights wk hence improving algorithm performance. After some iterations, due to a phenomenon known
(8)
R(k+1)1
j1 +
= h
j1
j1
y j SjH h
SjH j1 Sj + v2
j1 Sj .
j1 Sj SjH j1
.
SjH j1 Sj + v2
(16)
(17)
From (11)-(17), one can see that evaluating (11) for each
particle requires the evaluation of 2R Kalman filter steps.
Thus, if M particles are employed, the proposed algorithms
require the evaluation of 2M R Kalman filter steps per bit,
twice the complexity of an equalization-only algorithm (operating at the symbol rate).
portance function) and the deterministic particle filter described in Sec. 3.1 can be obtained from p(xk , y k |x0:k1 ,
y 0:k1 ) using (9). Assuming that xk is an IID sequence one
can show that
j
h
j=Rk
(13)
In (13) we exploited the fact that p(yj |S0:j , y0:j1 ) = p(yj |
S0:k , y0:j1 ), k > j. In order to determine p(yj |S0:j , y0:j1 )
note that using definitions above, (2) can be rewritten as
'
Sj+1 = ASj + e1 sj+1
(14)
yj
= h H S j + vj
where A is a (L L) shift matrix (all entries zero, except the first subdiagonal, whose entries are ones), e1 =
[ 1 0 0 ]T and h = [ h0 hL1 ]T .
From (14) one can see that yj is conditionally gaussian
given Sj and h. Assuming that the parameter h has gaussian
prior distribution, and exploiting the fact it is conditionally
gaussian given S0:j and y0:j1 , it can be integrated out [4],
resulting in
!
H Sj ; S H j1 Sj + 2 ,
p(yj |S0:j , y0:j1 ) = NC yj | h
j1
j
v
(15)
5. SIMULATIONS
We implemented blind equalization and decoding algorithms
employing particle filters for the signal model in Section 2,
and evaluated their performance using Monte Carlo simulations that measured the bit error rates (BER) over 200 independent realizations. In our illustrative simulations, we used
the channel h = [ 0.41 0.82 0.41 ]T and adopted two
R = 3 noncoherently noncatastrophic convolutional codes
[6] with constraint length K = 3 and K = 4 (with coefficients given in octal notation by (7,5,2) and (17,12,4),
respectively) in order to avoid phase ambiguities.
To compute the mean BER the algorithms processed
150 message bits in each realization, and employed a fixed
smoothing lag of 25 samples. The particles initial states
(i)
S1 were drawn from IID equiprobable 1 r.v., and we as(i)
(i)
sumed that 1 = I and h1 NC (h|0; I). The BER
obtained by the proposed algorithms1 as a function of the
SNR (signal-to-noise ratio) using M = 100 particles and
the (17,12,4) code is shown in Fig. 1. For comparison, we
also show the performance obtained i) by the optimal MLSE
equalizer (Viterbi) followed by a hard-decision decoder and
ii) by a particle filter based blind equalization-only algorithm [4] (employing differential encoding) followed by an
optimal soft decoder (based on the BCJR algorithm [10]).
As one can readily verify, the deterministic joint algorithm outperformed all the others. The stochastic algorithm,
in turn, performed on average equivalently to the concatenated scheme, failing (i.e., obtaining BER of about 50%)
in some realizations even at high SNR.
Figure 2 depicts the bit error performances of the proposed (deterministic) joint equalization and decoding algorithm employing M = 50 and M = 100 particles and the
1 For the stochastic algorithm, we adopted that a multinomial resampling step that is carried out whenever the effective sample size [2] falls
below 20%.
10
-1
10
-2
10
-3
10
-4
-3
BER
BER
10
viterbi
separate det.
separate sto.
joint det.
joint sto.
-2
-1
1
2
SNR (dB)
10
-1
10
-2
10
-3
10
-4
50 part.
100 part.
-3
-2
-1
1
2
SNR (dB)
6. CONCLUSIONS
After introducing the novel use of particle filtering algorithms for joint blind equalization and message decoding
over frequency selective channels that employ convolutional
codes, this work showed that deterministic particle filtering is the best alternative, greatly outperforming both joint
stochastic particle filters and methods that equalize and decode messages separately.
7. REFERENCES
[1] Z. Ding and Y. Li, Eds., Blind Equalization and Identification, Marcel Dekker, New York, 2001.
[2] A. Doucet, J. de Freitas, and N. Gordon, Eds., Sequential Monte-Carlo Methods in Practice, SpringerVerlag, Berlin, Germany, 2000.
[3] J. S. Liu and R. Chen, Blind deconvolution via sequential imputations, Journal of the American Statistical Association, vol. 90, no. 430, pp. 567576, june
1995.
[4] P. M. Djuric, J. H. Kotecha, J. Zhang, Y. Huang,
T. Ghirmai, M. F. Bugallo, and J. Miguez, Particle
This work is organized as follows: we introduce particle filtering techniques in Sec. 2, followed by a description
(Sec. 3) of the joint equalization and decoding problem and
the deduction of the allied densities needed to solve it via
particle filtering. In Sec. 4 numerical simulation results illustrate the relative performance of the proposed methods,
wherefrom conclusions are summed up in Sec. 5.
2. PARTICLE FILTERS
Let yn denote the observed output at instant n of a possibly non-linear and time-varying stochastically driven system whose state variable xn we want to estimate. In a
Bayesian filtering framework, one wishes to determine the
posterior density p(x 0:n |y0:n ), x0:n := {x0 , . . . , xn }, which
collects all statistical information about x 0:n embodied by
y0:n . Particle filters approximate the desired posterior density by
pn (x0:n |y0:n ) =
P
1
(i)
(1)
i=0
(i)
Briefly consider Table 1 which describes the SPF algorithm known as Bootstrap Filter whose operation is aimed
at recursively generating samples of the joint posterior density p(x0:n |y0:n ). By factorizing this density as
(2)
3) Apply a (deterministic or stochastic) particle selection algorithm to obtain P samples from the discrete
(i,j)
(i,j)
1,D1
density {x0:n ; wn }P
i=0,j=0 .
Note that differently from stochastic algorithms, deterministic particle filters must perform particle selection (step
3) at each iteration to keep the number of particles constant.
In the present comparisons, we consider classical stochastic (multinomial and residual [4]) particle selection methods
(SPS) and the deterministic method (DPS) proposed in [2]
which has very low computational complexity, selecting a
new particle set by simply discarding the (D 1)P least
weighted particles of the original set and re-normalizing the
weights of the remaining ones. As opposed to stochastic
methods, the deterministic methods produce bias because,
on average, each particle is not selected a number of times
proportional to its own weight, a fact, however, that does
not affect algorithm convergence properties ( [4], Cap. 2).
(i)
1
{x0:n1 ; wn1 }P
i=0
(i)
1
{x0:n ; wn1 }P
i=0
1)
2)
3)
(i)
(i)
Table 1. Stochastic Particle Filter employing Prior Importance Function (Bootstrap Filter).
(i)
K
(m)
bki di
1
A set {x0:n ; wn }P
i=0 with P samples of the updated posterior density can then be obtained according to the following
procedure:
(m) (m)
cki ri
mod 2, (3)
i=1
(i)
wn1
i=0
K
yk =
L1
hl skl + vk ,
(4)
l=0
(6)
4. SIMULATION RESULTS
To compare these methods we carried out Monte Carlo simulations in which we measured mean bit error rates (BER)
over 500 independent realizations produced by a communication system that transmits BPSK (1) symbols over
a frequency selective channel with 3 random coefficients
drawn independently in each realization from the multivariate complex gaussian distribution N c (h|0; I). We assumed
that the additive noise is a zero-mean complex circular gaussian process with variance v2 , so that the signal-to-noise ratio (SNR) is defined as
SN R := h2 /2v2 .
The transmitted BPSK symbols are obtained as the noninterleaved output of the binary 1/2rate recursive systematic convolutional code given in polynomial notation by
$
%
1 + D + D2
1,
.
1 + D2
R(k+1)1
j=Rk
To determine p(y j |S0:j , y0:j1 ) note that the above definitions allow rewriting (4) as
'
Sj+1 = F Sj + e1 sj+1
(8)
yj
= hH Sj + vj
where F is an (L L) shift matrix (all entries zero, except for the first subdiagonal, whose entries are ones), e 1 =
[ 1 0 0 ]T and h = [ h0 hL1 ]T .
From (8) one can see that y j is conditionally gaussian
given Sj and h. Under the assumption that the parameters
h have a joint gaussian prior distribution, one obtains [5]
!
H
2
hH
p(yj |S0:j , y0:j1 ) = NC yj |
j1 Sj ; Sj j1 Sj + v ,
(9)
j and j , respectively the conditional mean and
where h
variance of h are obtained by means of conventional Kalman
filter iterations:
j1
yj SjH h
j1 +
j = h
j1 Sj . (10)
h
SjH j1 Sj + v2
j
j1
j1 Sj SjH j1
.
SjH j1 Sj + v2
(11)
As a final observation, it is worth mentioning that the algorithm described so far, in addition to providing filtered estimates, can be easily extended to determine fixed-lag smoothed estimates of the transmitted bits, since for d > 0 [6]:
M (i)
(i)
wk+d (b0:k b0:k )
.
(12)
p(b0:k |y 0:k+d ) i=1
(i)
M
i=1 wk+d
10
10
-1
10
-2
10
-3
10
MAP
DPF-DPS
DPF-Multinomial
DPF-Residual
SPF-Multinomial
SPF-Residual
10
10
-1
10
-2
10
-3
10
-4
MAP
DPF-DPS
DPF-Multinomial
DPF-Residual
SPF-Multinomial
SPF-Residual
-4
-2
10
12
Fig. 1. Performance of the deterministic (DPF) and stochastic (SPF) joint equalization and decoding methods as a function of the SNR, employing multinomial, residual and deterministic (DPS) resampling strategies (d = 0), and of the
alternative MAP method described in the text. The SPF algorithms employ the optimal importance function and are
implemented as described in [3].
to 100, remaining practically unchanged as P is further increased.
As a final remark, it is worth mentioning that the computational complexity of the proposed DPF-DPS scheme is
comparable to that of turbo joint blind equalization and decoding techniques [7]. While the proposed DPF-DPS technique requires O(P L 2 ) operations per bit, turbo techniques
performing MMSE channel re-estimation require O(I(L 2 +
2K )), where I is the number of iterations performed (usually I 10) and K is the code constraint length.
-2
10
12
Fig. 2. Performance of the deterministic (DPF) and stochastic (SPF) joint equalization and decoding methods as a function of the SNR, employing multinomial, residual and deterministic (DPS) resampling strategies (d = 10), and of the
alternative MAP method described in the text. The SPF algorithms employ the optimal importance function and are
implemented as described in [3].
10
10
-1
10
-2
10
-3
10
-4
5. CONCLUSION
In this work we evaluated the performance of deterministic particle filtering structures for joint blindly equalizing/decoding convolutionally coded signals transmitted over
frequency selective channels. Numerical simulations show
that the algorithms based on deterministic particle filters
outperform the stochastic alternatives, and that the performance advantage of the deterministic particle filtering method is widened if a deterministic particle selection strategy
is employed.
MAP
50 part
100 part
250 part
-2
10
12
6. REFERENCES
[1] E. Punskaya, C. Andrieu, A. Doucet, and W. Fitzgerald, Particle filtering for multiuser detection in fading
cdma channels, in Proceedings of the 11th IEEE Signal Processing Workshop on Statistical Signal Processing, 2001., Singapore, august 2001.
[2] B. Dong, X. Wang, and A. Doucet, A new class of soft
mimo demodulation algorithms, IEEE Transactions
on Signal Processing, vol. 51, no. 11, pp. 27522763,
november 2003.
[3] C. J. Bordin and L. A. Baccala, Particle filter algorithms for joint blind equalization/decoding of convolutionally coded signals, in Proceedings of the 2005
IEEE International Conference on Acoustics, Speech
and Signal Processing - ICASSP 2005, Philadelphia, PA
- USA, 2005, vol. 3, pp. 497500.
[4] A. Doucet, J. de Freitas, and N. Gordon, Eds., Sequential Monte-Carlo Methods in Practice, Springer-Verlag,
Berlin, Germany, 2000.
[5] P. M. Djuric, J. H. Kotecha, J. Zhang, Y. Huang, T. Ghirmai, M. F. Bugallo, and J. Miguez, Particle filtering,
IEEE Signal Processing Magazine, vol. 20, no. 5, pp.
1938, september 2003.
[6] T. Clapp, Statistical Methods for the Processing of
Communication Data, Ph.D. thesis, University of Cambridge, 2000.
[7] R. Koetter, A. C. Singer, and M. Tuchler, Turbo Equalization, IEEE Signal Processing Magazine, vol. 21, no.
1, pp. 6780, January 2004.
I. I NTRODUCTION
Blind equalization, i.e. estimating the symbol sequence
transmitted in a digital communication system exclusively
from the observation of distorted received signals, has challenged researchers despite the many approaches developed
since Satos pioneering work (1975) (see [1] for a review)
either because of limited robustness or slow convergence that
hampers their practical application.
Even when compensation for channel distortion via an
equalizer in unneeded, the effect of additive noise calls for
bit error control methods through adequate coding in all
practical digital communication systems. This paper shows
that message decoding and equalization can be done jointly
by monitoring signal probability densities and it is in this
context that particle filters [2], which are numerical techniques
for the solution of Bayesian estimation problems, can play
a role. Though not new in equalization [3], particle filters
did not attract much attention until recently, possibly due to
the scarcity of theoretical results coupled with the need for
sufficiently powerful computers that are only now becoming
more widely available. As a matter of fact, [4] shows that,
despite their large computational complexity, particle filters
are almost optimal while using fairly reduced amounts of data.
Another important characteristic of particle filters, because of
their generality, is that they allow handling elaborate signal
models, as for instance that in synchronous CDMA reception
[5] which makes them a rather powerful tool.
After a brief overview of particle filtering (Sec. II), we
show how to apply it for blind equalization over a frequency
selective channel and in conjunction to decoding in systems
that perform error control with help of block codes (Section
III). In Section IV we illustrate the particle filtering algorithms
via numerical simulations and leave conclusions to Section V.
Mr. Bordin work was funded by FAPESP under the grant 02/11457-7.
(i)
(i)
(x(i)
n |x0:n1 , y0:n )(x0:n1 |y0:n1 )
, (3)
(i)
(i)
wn(i) wn1
(5)
+
sk h(t kT ) + v(t) ,
(8)
n=
(10)
0,
if mK + 1 n mN
and a
= pn
(18)
Hence, from (14) and (18) one can find
p(xn , yn |x0:n1 , y0:n1 ), and estimate p(s0:n |y0:n ) using
the algorithms described herein. To estimate p(b0:l |y0:n ),
(i)
it suffices to note that each N block of particle s0:n is
constrained, by design, to belong in the image of . Thus,
(i)
inverting on each N block of s0:n , leads to desired
(i)
sequence b0:l , which constitutes a sample from p(b0:l |y0:n ).
Finally, one must mention that estimating p(b0:l |y0:n ) is
only possible if some measure is taken to deal with the phase
ambiguity2 that is inherent to the blind equalization problem.
We avoid phase ambiguity by using a rotationally variant
coding function , in which (b(i) )
= (b(j) ), i, j, as is
the case of the code we employ in our illustrative simulations.
(11)
T
n1 + yn xn hn1 n1 xn
= h
T
xn n1 xn + v2
n1 xn xTn n1
= n1 T
xn n1 xn + v2
(15)
(16)
other relevant densities can be derived from this density using (7).
(s(m1)N +1 , . . . , smN ) =
(b(m1)K+1 , . . . , bmK , pmK+1 , . . . , pmN )
(17)
IV. S IMULATIONS
We implemented blind equalization and decoding algorithms employing the particle filters described in Sec. II for
the signal model described in Sec. III-C, and evaluated their
performance using Monte Carlo simulations that measured the
bit error rates (BER) over 200 independent realizations.
In our illustrative simulations, we used the channel h =
[ 0.5 1.0 0.5 ]T and adopted a (7, 3) binary systematic
code, formed3 by taking the 8 codewords of the (7, 4)
Hamming code for which the first message bit is 1 to ensure
s lack of rotational invariance.
In order to compute the mean BER the algorithms
processed in each realization 100 message bits, discarding
results for the first 25 bits to allow for algorithm convergence.
The BER obtained by the proposed algorithms as a function of
2 Phase ambiguities arise in blind equalization problems when the prior
densities are symmetrical p(s0:n ) = p(s0:n ) and p(h) = p(h) as
(i)
p(yn |xn , h) = p(yn | xn , h), so that that each particle x0:n becomes
affected by a random rotation, preventing p(x0:n |y0:n ) estimation via (2).
3 In [11] it is argued that such code exhibits good properties for noncoherent
detection purposes. Note that the (7, 4) Hamming code codewords need to
be permuted to satisfy (17).
10
10
10
deterministic M=100
deterministic M=250
stochastic M=100
stochastic M=250
optimal
10
10
Fig. 1.
10
12
14
16
signaltonoise ratio (dB)
18
20
22
10
proposed M=100
proposed M=250
eq. only M=100
eq. only M=250
V. C ONCLUSIONS
This work proposed and examined the use of particle
filtering algorithms for joint blind equalization and message
decoding over frequency selective channels when systematic
block codes are used for message error control. Numerical
simulations showed that the algorithm based on deterministic
particle filtering is the best alternative, outperforming the
optimal linear equalizer at moderate SNRs, and that the
proposed approach greatly outperforms a similar equalizationonly algorithm.
R EFERENCES
[1] Z. Ding and Y. Li, Eds., Blind Equalization and Identification. New
York: Marcel Dekker, 2001.
[2] A. Doucet, J. de Freitas, and N. Gordon, Eds., Sequential Monte-Carlo
Methods in Practice. Berlin, Germany: Springer-Verlag, 2000.
[3] J. S. Liu and R. Chen, Blind deconvolution via sequential imputations,
Journal of the American Statistical Association, vol. 90, no. 430, pp.
567576, june 1995.
[4] P. M. Djuric, J. H. Kotecha, J. Zhang, Y. Huang, T. Ghirmai, M. F.
Bugallo, and J. Miguez, Particle filtering, IEEE Signal Processing
Magazine, vol. 20, no. 5, pp. 1938, september 2003.
[5] E. Punskaya, C. Andrieu, A. Doucet, and W. Fitzgerald, Particle filtering for multiuser detection in fading cdma channels, in Proceedings
of the 11th IEEE Signal Processing Workshop on Statistical Signal
Processing, 2001., Singapore, august 2001.
[6] M. S. Arulampalam, S. Maskell, N. Gordon, and T. Clapp, A tutorial
on particle filters for online nonlinear/non-gaussian bayesian tracking,
IEEE Transactions on Signal Processing, vol. 50, no. 3, pp. 174188,
february 2002.
[7] N. J. Gordon, D. J. Salmond, and A. F. M. Smith, Novel-approach to
nonlinear non-gaussian bayesian state estimation, IEE Proceedings-F
Image & Signal Processing, vol. 140, no. 2, pp. 107113, april 1993.
[8] B. Dong, X. Wang, and A. Doucet, A new class of soft mimo
demodulation algorithms, IEEE Transactions on Signal Processing,
vol. 51, no. 11, pp. 27522763, november 2003.
[9] H. L. van Trees, Detection, Estimation, and Modulation Theory, Part
I. Wiley, 1968.
[10] J. G. Proakis and M. Salehi, Communication Systems Engineering.
Englewood Cliffs: Prentice Hall, NJ, 1994.
[11] D. Warrier, U. Madhow, and R. Koetter, Coding for noncoherent
communication, in Proceedings of the Internation Symposium on
Information Theory, Sorrento - Italy, 2000.
A PPENDIX
signaltonoise ratio (dB)
10
TABLE I
D ETERMINISTIC PARTICLE FILTER A LGORITHM
Set m = 0 (initialization)
For i = 1, . . . , M
(i)
10
10
10
12
14
raw bit error rate
16
18
20
22
(I )
(Jt )
t
- Make x0:m1 = x0:m1
and x(t)
.
m = x
(t)
- Make wm
= w(I,J)t .
- Normalize the weights.
- Estimate p(x0:m |y0:m ) as in (2).
XXII SIMPOSIO
BRASILEIRO DE TELECOMUNICACOES
- SBrT05, 04-08 DE SETEMBRO DE 2005, CAMPINAS, SP
Resumo Neste trabalho descrevemos metodos para equalizar cegamente canais de comunicaca o lineares FIR atraves da
versao Bayesiana do consagrado algoritmo EM (ExpectationMaximization). Os metodos desenvolvidos fornecem estimativas
que maximizam localmente a densidade de probabilidade a
posteriori dos parametros do canal de comunicaca o, estimando
os smbolos transmitidos atraves do algoritmo BCJR. Para contornar dificuldades de convergencia observadas sob baixos nveis
de rudo, modificamos a proposta original ao considerar tecnicas
de annealing, que proporcionam um desempenho proximo ao
o timo (Viterbi) sem incorrer em aumento de complexidade
computacional, conforme atestam simulaco es numericas.
Palavras-Chave Equalizaca o cega, Algoritmo ExpectationMaximization Bayesiano, Annealing.
Abstract This work describes blind equalization methods
for linear FIR channels using a Bayesian version of the wellknown EM (Expectation-Maximization) algorithm. The proposed
methods produce estimates that locally maximize the posterior
density of the channel parameters, leading to estimates of
the transmitted bits via the BCJR algorithm. Without increasing the overall computational complexity, we next propose an
enhanced scheme based on annealing techniques to circumvent
bad convergence properties observed in the original algorithm
when the noise level is low, leading to performances close to
optimal (Viterbi for known channel parameters) as confirmed
by numerical simulations.
Keywords Blind
Equalization,
Maximization Algorithm, Annealing.
Bayesian
Expectation-
I. I NTRODUC AO
A despeito dos avancos observados nas u ltimas decadas,
a equalizaca o cega [1] [2] de canais de comunicaca o ainda
carece de soluco es simultaneamente satisfatorias nos quesitos
robustez, velocidade de convergencia e complexidade computacional. Neste contexto, o algoritmo EM [3] oferece uma
soluca o de compromisso para o problema da equalizaca o
cega ao prover estimativas aproximadamente o timas para os
parametros do canal de transmissao, embora a uma complexidade computacional relativamente elevada.
Introduzido em 1977 por Dempster et al. [4], o algoritmo
EM e um metodo iterativo que aproxima soluco es o timas
(nos sentidos ML ou MAP [5]) para problemas de estimaca o
com dados latentes, ou seja, problemas nos quais a funca o de
verossimilhanca (a densidade a posteriori) somente e tratavel
se condicionada a um conjunto de dados nao-observados.
Apesar de terem-se desenvolvido diversos metodos de
obtenca o de soluco es o timas no sentido da maxima
verossimilhanca (ML) para o problema da equalizaca o cega
utilizando o algoritmo EM ([6][7]), neste trabalho propomos
Escola Politecnica, Universidade de Sao Paulo, Sao Paulo, Brasil, E-mails:
{bordin,baccala}@lcs.poli.usp.br.
um novo metodo, desta vez de cunho Bayesiano. Nele obtemse aproximaco es para a estimativa MAP dos parametros do
canal admitindo-se para este uma densidade a priori gaussiana.
Em conseque ncia a` analise dos resultados obtidos com esta
abordagem, propomos um segundo metodo para equalizaca o
cega empregando uma tecnica de annealing que corrige deficiencias de desempenho observadas quando a relaca o sinalrudo disponvel e alta.
O conteudo deste trabalho esta organizado da seguinte
forma: na Sec. II apresentamos o algoritmo EM, descrevendo
em seguida o modelo de sinal empregado (Sec. III). Na
Sec. IV, descrevemos a aplicaca o do algoritmo EM a` soluca o
do problema da equalizaca o cega, avaliando seu desempenho
atraves de simulaco es numericas. Na Sec. V apresentamos
o algoritmo modificado e seu desempenho, conduzindo a` s
conclusoes formalizadas na Sec. VI.
II. O ALGORITMO EM
Dado que se deseje inferir um vetor aleatorio a partir de
um conjunto de observaco es A e considerando uma variavel
aleatoria B latente (i.e. nao-observada), de sorte que se possa
descrever por meio de uma p(|A, B) analiticamente simples, o algoritmo EM prescreve como obter uma seque ncia de
estimativas (i) , i 0, tais que p((i+1) |A) p((i) |A). Em
outras palavras, o algoritmo EM permite obter valores (i) que
maximizam localmente a densidade a posteriori da variavel
inferida (veja o Apendice para detalhes).
Dividido basicamente em dois passos, o algoritmo EM
consiste primeiramente (passo E) em determinar a esperanca
da densidade a posteriori aumentada p(|A, B) dadas as
observaco es A e uma estimativa atual (i) . A isto segue-se
(passo M) o calculo da nova estimativa de (i+1) , obtida ao
maximizar-se a esperanca determinada no passo E em funca o
de , conforme descrito na Tabela I.
Como se pode observar na Tabela I, o algoritmo EM e um
procedimento bastante geral. Como tal, tem aplicabilidade a
diversos problemas de estimaca o, sendo sua praticidade determinada pela capacidade de se calcular e maximizar Q(, (i) )
de modo facil. Cabe salientar que as estimativas obtidas nao
sao necessariamente boas aproximaco es da estimativa MAP
do vetor aleatorio , ja que a convergencia do algoritmo so
e garantida ate maximos locais da densidade a posteriori [8],
propriedade que demonstramos no Apendice.
III. M ODELO DE S INAL
Neste trabalho temos como principal interesse a equalizaca o
de canais de comunicaca o lineares com resposta ao impulso
de duraca o finita. Assim, admitimos que a amostra yk do sinal
XXII SIMPOSIO
BRASILEIRO DE TELECOMUNICACOES
- SBrT05, 04-08 DE SETEMBRO DE 2005, CAMPINAS, SP
1) Passo E (expectation):
Q(, (i) ) =
log p(|A, B)p(B|A, (i) )dB
(1)
2) Passo M (maximization):
(i+1) = arg max Q(, (i) )
TABELA I
A LGORITMO EM
(6)
(2)
3) Itera-se at
e a converg
encia, ou
(i) seja
seja, at
e que (i+1)
suficientemente pequeno.
(5)
(7)
(8)
j=0
2
1
= E log p(h|X0:n , y0:n )|h(i) , y0:n .
(10)
yk =
L1
hi xki + vk ,
(3)
i=0
(4)
T
NC (h|h0 ; 0 ) ,
(11)
(12)
Q(h, h(i) ) =
h
n
1
2
1
1
E Xj XjH |h(i) , y0:n h
0 + 2
j=0
n
2
1
1
+ 1
E Xj |h(i) , y0:n yj . (16)
0 h0 + 2
j=0
1 Omitiremos a partir deste ponto a depend
encia das densidades condicionais
em relaca o ao parametro 2 (variancia do rudo aditivo), uma vez que este e
assumido conhecido.
XXII SIMPOSIO
BRASILEIRO DE TELECOMUNICACOES
- SBrT05, 04-08 DE SETEMBRO DE 2005, CAMPINAS, SP
(17)
n
2
1
1
E Xj XjH |h(i) , y0:n
h(i+1) = 1
0 + 2
j=0
n
1
2
1
1
.
E Xj |h(i) , y0:n yj (18)
0 h0 + 2
j=0
As esperancas em (18) podem ser calculadas numericamente
atraves do algoritmo BCJR [10] (vide Apendice), uma vez que
10
-1
10
BER
n
2
1
1
1
E Xj XjH |h(i) , y0:n < 0.
0 + 2
j=0
-2
10
Ns
1
2
E Xj |h(i) , y0:n =
Xi P(Xj = Xi |h(i) , y0:n ) (19)
i=1
Ns
2
1
E Xj XjH |h(i) , y0:n =
-3
10
EM (1 iter.)
EM (10 iter.)
EM (25 iter.)
Viterbi
i=1
A. Simulaco es
Atraves de simulaco es numericas avaliamos o desempenho
do algoritmo segundo a taxa media de erro de bit (BER) obtida
ao longo de 100 realizaco es independentes num sistema de
comunicaca o que transmite blocos de 250 smbolos binarios
i.i.d. atraves do canal h = [ 0, 41 0, 82 0, 41 ]T com ordem
e potencia de rudo conhecidas pelo receptor. A densidade a
priori do canal foi admitida igual a NC (h|0; I).
Na Fig. 1 mostramos o desempenho obtido em funca o da
relaca o sinal-rudo e do numero de iteraco es empregado pelo
2 Observe
-4
10
10
SNR (dB)
12
14
16
18
20
V. A LGORITMO M ELHORADO
Analisando mais detidamente o funcionamento do algoritmo
da Sec. IV observamos que, sob baixos nveis de rudo, as
densidades p(Xk |h(i) , y0:n ) estimadas (atraves do algoritmo
BCJR) assumem valores muito proximos de 0 ou 1, num
comportamento que parece contribuir para o aparecimento de
algo semelhante a um ciclo-limite3 , que impede a convergencia
do algoritmo para uma soluca o fixa.
Para contornar este problema, fizemos uma alteraca o de
carater heurstico no algoritmo da Sec. IV inspirada em
tecnicas de simulated annealing. Estas tecnicas [11], amplamente empregadas na soluca o de problemas de otimizaca o
nao-linear, baseiam-se na observaca o de fenomenos naturais
ligados a` cristalizaca o de metais, que sugerem que a convergencia para o mnimo global num problema de minimizaca o
iterativa pode ser obtida pela introduca o de perturbaco es
lentamente decrescentes (nas suas soluco es intermediarias).
Para evitar o aparecimento de oscilaco es cclicas como as
observadas para o algoritmo anteriormente descrito, substituimos a densidade p(Xk |h(i) , y0:n , 2 ) (calculada atraves do
algoritmo BCJR), necessaria para a determinaca o de (20), pela
densidade pi (Xk |h(i) , y0:n , 2 ) = p(Xk |h(i) , y0:n , 2 + (i)),
com (i) > 0 e uma funca o decrescente de i.
Note que, dado o maior nvel de rudo informado ao
algoritmo BCJR, a densidade pi (Xk |h(i) , y0:n , 2 ) exibe uma
3 Note que o algoritmo EM opera de forma determinstica, e que os valores
de h(i) e y0:n numa iteraca o definem completamente o comportamento do
algoritmo nas iteraco es posteriores.
XXII SIMPOSIO
BRASILEIRO DE TELECOMUNICACOES
- SBrT05, 04-08 DE SETEMBRO DE 2005, CAMPINAS, SP
0
10
-1
BER
10
A. Simulaco es
Nas Figs. 2 e 3 mostramos o desempenho obtido pela versao
modificada do algoritmo da Sec. IV, utilizando (i) = 100,1i
e (i) = 100,05i , respectivamente, empregando as mesmas
hipoteses adotadas na Sec. IV-A.
Como se pode observar, ao fazer (i) = 100,1i nota-se
ainda uma degradaca o de desempenho para SNR superiores
a 12 dB (Fig. 2). Diminuindo-se o nvel de rudo adicional
mais lentamente ((i) = 100,05i ), no entanto, o desempenho
do algoritmo modificado aproxima-se bastante daquele do
detector o timo MLSE (Viterbi) para 25 iteraco es, como se
pode observar na Fig. 3.
-2
10
-3
10
EM (1 iter.)
EM (10 iter.)
EM (25 iter.)
Viterbi
-4
10
10
SNR (dB)
12
14
16
18
20
10
R EFER E NCIAS
-1
BER
10
-2
10
-3
10
EM (1 iter.)
EM (10 iter.)
EM (25 iter.)
Viterbi
-4
10
10
SNR (dB)
12
14
16
18
20
XXII SIMPOSIO
BRASILEIRO DE TELECOMUNICACOES
- SBrT05, 04-08 DE SETEMBRO DE 2005, CAMPINAS, SP
A P E NDICE
A. Convergencia do Algoritmo EM
Proposica o: Iterando-se o algoritmo da Tabela I tem-se
que p((i+1) |A) p((i) |A).
onde
(31)
onde s(a,b) denota o valor assumido pela v.a. xk que provoca
a transica o do estado Xk = a para o estado Xk+1 = b.
Os demais termos em (30) somente podem ser determinados
recursivamente. Para isto, introduzimos a seguinte a notaca o
vetorial
(25)
Como, por definica o, (i+1) e escolhido de modo a maximizar Q((i+1) , (i) ), o primeiro termo em (25) e positivo
(ou nulo se (i+1) = (i) ). Pode-se verificar tambem que o
segundo termo e nulo, ja que H((i+1) , (i) ) nao e funca o de
(i+1) . Quanto ao terceiro termo, note que
[K((i+1) , (i) ) K((i) , (i) )]
2
1
p(B| (i) ,A)
p(B|(i) , A) dB
log
B
p(B| (i+1) ,A)
(26)
a
a
k
k
= p(Xk = a, y0:k1 )
(28)
= p(yk+1:n |Xk+1 = b)
= p(Xk+1 = b, yk |Xk = a) .
(29)
(30)
[ k (1) . . . k (Ns ) ] R
T
(27)
|Ns |1
(32)
,
(33)
e a matriz
[k ]ij = k (i, j) ,
k (a)
k+1 (b)
k (a, b)
(34)
= Tk k
= k k+1 ,
(35)
(36)