Vous êtes sur la page 1sur 4

Etude Comparative de Mthodes de Correction de

Pertes de Paquets en Transmission


de la Voix sur IP(VoIP)
KHEDDAR Hamza, BOUDRAA Bachir
Facult dlectronique et dinformatique, Laboratoire de communication parle et traitement du signal (LCPTS),
Universit des Sciences et de la Technologie Houari Boumediene (USTHB),
BP 32, El-Alia, Bab-Ezzouar, Alger, 16111, Algrie.
hamza.kheddar@gmail.com , bboudraa@usthb.dz
Rsum Le travail consiste mettre au point sous MATLAB
deux codeurs MELP fonctionnant respectivement 1.2 kbit/s et
2.4 kbit/s. Nous apportons ensuite des amliorations ces
codeurs par limplmentation de techniques de dissimulation des
trames perdues bases sur le rcepteur. Ces techniques consistent
en lentrelacement des trames dinformation. A cet effet, nous
avons dabord effectu une tude comparative de plusieurs
mthodes dentrelacement. Par la suite, nous avons tendu cette
comparaison une mthode dj mise au point au sein de notre
laboratoire, intitule codage par descriptions multiples (MDC).
Pour cela, nous avons utilis la technique dvaluation
normalise par ITU-T et appele PESQ (Perceptual Evaluation
of Speech Quality).
Mots cls Entrelacement, Codage MELP, MDC, PLC, PESQ.

I. INTRODUCTION
Dans un systme VoIP, au niveau du rcepteur, certains
paquets peuvent manquer, cette perte de paquets dgrade la
qualit de la voix et se traduit par des ruptures au niveau de la
conversation et une impression de hachure de la parole. Il est,
par consquent, indispensable de mettre en place un
mcanisme de dissimulation de ces pertes. Plusieurs
algorithmes de masquage des pertes de paquets appels aussi
PLC (Packet Loss Concealment) sont utiliss aussi bien au
niveau de lmetteur quau niveau du rcepteur.
Dans le laboratoire de codage de linstitut dlectronique, il
a t mis au point un codeur MELP pour la VoIP utilisant la
mthode dite de codage par description multiple (MDC), pour
combattre les pertes de paquets et augmenter ainsi la
robustesse des systmes face ces pertes. Cette multidescription contient dans un mme paquet deux codeurs
MELP la fois. Le premier fonctionne 2.4 kbps sert
obtenir une bonne qualit de la voix aprs une bonne
transmission de voix. Le second est utilis pour recouvrer les
ventuelles pertes des paquets.
Notre travail consiste en lamlioration du Codec MELP
par limplmentation de techniques de dissimulation des
trames perdues bases sur le rcepteur. Ces techniques
consistent en lentrelacement de trames dinformation. Nous
avons ensuite effectu une tude comparative des mthodes
implmentes avec la mthode MDC dj mise au point.
Lvaluation comparative a t faite en utilisant une
mthode dit PESQ (Perceptual Evaluation of Speech Quality).

II. LE CODAGE MELP


Le MELP est devenu actuellement le nouveau
standard militaire et fdral pour la parole 2.4 kbps, en
remplacement des normes fdrales FS-1015 (LPC-10) et FS1016 (CELP), qui produisent de la parole de mauvaise qualit
ce dbit. Limplmentation dun codeur MELP comporte
quatre tapes : lanalyse, lencodage, le dcodage et la
synthse [1]-[2].
A) Encodeur MELP
Dans la synthse MELP, la LP (prdiction linaire) de tous
les ples du filtre est excite par un signal construit partir
des contributions priodiques et du bruit.
l'encodeur (fig.1), les paramtres LP sont dabord
dtermins. Le rsiduel est ensuite obtenu. Le pitch est estim
partir du filtrage passe-bas du signal de la parole. Les
voisements sont valus en fonction des maxima de la
corrlation du signal filtr. Le voisement dtermine combien
les parties priodiques et le bruit contribuent l'excitation de
la LP dans les bandes de frquence spcifiques. Ils dcrivent,
en effet, la prsence de priodicit dans le signal en fonction
de la frquence. Les coefficients de Fourier dfinissent les
caractristiques spectrales de la partie excitation priodique de
LP. Ils sont gnralement calculs partir de la FFT du signal.
La dtermination du gain peut tre ralise soit sur la rsiduel
LP ou directement sur le signal de parole, de manire
synchrone ou avec une fentre de longueur fixe [3].

Fig.1 Schma de base du codeur MELP.

B) Dcodeur MELP
Au niveau du dcodeur (fig.2), la partie priodique
de l'excitation est gnre partir des coefficients de
Fourier interpols. La synthse de Fourier est applique des
spectres dans lequel les coefficients de Fourier sont placs
des frquences harmoniques drives de l'emplacement
interpol. Le bruit de l'excitation est gnr partir du bruit
blanc. Les bandes de frquence de la partie priodique et du
bruit des signaux sont formes par filtrage dans le domaine
temporel en fonction des informations transmises par
voisement. Les deux composants de l'excitation sont ajouts et
le signal est mis l'chelle par le gain cod. Enfin, la synthse
de prdiction linaire est effectue [3].

convolutif de taille ( = sous-squences) prend la


forme :
(1)
() = ( )

Fig.3 entrelaceur convolutif de degr d=4.

Fig.2 Schma synoptique du dcodeur MELP.

III. LENTRELACEMENT
Afin de raliser une transmission de la voix en temps rel
de haute qualit, un mcanisme de dissimulation de perte de
paquets doit tre mis en place. Plusieurs algorithmes de
masquage des pertes de paquets PLC (Packet Loss
Concealment) sont utiliss aussi bien au niveau de lmetteur
quau niveau du rcepteur [4]-[6].
Lentrelacement est une mthode efficace pour disperser
des clats de perte de paquets en une srie de petites pertes.
En consquence, les erreurs seront produites sur des mots
codes assez courts, ainsi lauditeur sera capable dinterpoler
mentalement les petites lacunes. Lintelligibilit de la parole
sera a lors prserve.
A) Implmentation de quelques mthodes dentrelacement
1) Entrelaceurs convolutifs
Un entrelaceur convolutif peut tre modlis comme un
arrangement de registres dcalage, contenant chacun un
vecteur caractristique. Dans un entrelaceur convolutif de
degr , le vecteur de squence d'entre, est partag en d sousquences. Chaque sous-squence est constitue d'un nombre
diffrent de registres dcalage connects, ce qui correspond
donc un retard diffrent selon le nombre de vecteurs
caractristiques qui y sont stocks [7]. Un entrelaceur
convolutif de degr 4 est illustr la fig.3. Un entrelaceur

2) Entrelaceur convolutif dcorrl


Lentrelaceur convolutif dcorrl introduit la mme
structure dcorrle de lentrelaceur convolutif dcrit
prcdemment. Un entrelaceur convolutif dcorrl est form
en permutant l'ordre dans lequel les sous-squences
individuelles sont accessibles. Pour un entrelaceur convolutif
dcorrl de taille , l'ordre dans lequel les sous-squences
sont accessibles est dfini par la permutation et la
longueur [7]. Par exemple, un entrelaceur dcorrl de taille
4, en utilisant la permutation = {1 3 0 2}, est montr dans la
fig.4. Dans le cas gnral, l'index de temps , un vecteur de
caractristiques sera livr en sous-squences ( ) , ayant
un dlai de (( ) ) trames. Cest dire :
() = ( )
(2)

Fig.4 Entrelaceur convolutif dcorrl de taille d=4 et pour une


permutation = {1 3 0 2}.

3) Entrelacement par groupement


Le processus de groupement et entrelacement produit un
vecteur de coefficients de = { | = 1, , 1 }. La fig.5
montre un exemple simple o = 3 reprsente lindice de
bloc et = 2 est la moiti de la longueur de la fentre
d'analyse du bloc. Les coefficients sont regroups et entrelacs
en utilisant les trois tapes suivantes :
En (1), chaque ligne correspond un bloc et dans chaque bloc,
les coefficients sont regroups dans des trames.
En (2), les trames de plus petite chelle (bloc 0) sont
entrelaces deux par deux avec la trame suprieure immdiate
dans le bloc 1. Cette premire tape produit deux nouvelles
trames de coefficients entrelacs.
En (3), les deux trames prcdentes sont entrelaces avec la
trame de plus grande chelle (bloc 2) de telle sorte que le

vecteur rsultant ait encore un coefficient de chaque bloc: un


bloc 2, suivi par l'un des blocs 1, suivi d'un vecteur du bloc 0,
suivi par un bloc 2, et ainsi de suite[8].

Fig.5 processus dentrelacement avec M = 3, L=2.

description supplmentaire doit permettre d'amliorer la


qualit de reconstruction. La qualit optimale est obtenue
lorsque toutes les descriptions sont reues [9].
Pour le format dun paquet, on a inclu les deux descriptions
comme indiqu la fig.7. La premire description possde
une quantification assez fine 2.4 kbps, c'est--dire celle
donne par le standard MELP 2.4 kbps. Cette description est
ddie la trame courante Tn. Elle est ncessaire pour
procurer une bonne qualit de la parole en condition de non
erreur (sans perte). La deuxime description est grossirement
quantifie 1.2 kbps. Elle contient trois trames successives
la trame courante : Tn+1, Tn+2 et Tn+3. Elle procure une
qualit raisonnable et sert recouvrer jusqu trois pertes de
paquets [9]. Le total des bits allous un paquet sera donc de
135 bits. On obtient un dbit total de transmission de 6 kbps,
correspondant la longueur dune trame de 22.5 ms.

4) Entrelaceurs optimaux de blocs de propagation


Un entrelaceur de blocs de taille , de degr =
fonctionne en permutant l'ordre de transmission d'un
bloc de vecteurs dentre. Deux entrelaceurs de blocs,
1 et 2 sont considrs optimaux en termes de
maximisation de leur propagation pour un degr donn, tels
que [7] :
1 ( + ) = ( 1 ) + 0 , 1

2 ( + ) = + ( 1 ) 0 , 1

(3)

(4)

Le fonctionnement de ces entrelaceurs peut tre considr


comme une rotation de des vecteurs caractristiques se
trouvant dans la mmoire tampon (buffer), soit de +90 ou de
90 (sens antihoraire), comme indiqu la fig.6.

Fig.6 Exemple de rotation du buffer de 90 dans le sens antihoraire [7].

IV. CODAGE PAR DESCRIPTION MULTIPLE (MDC)


Le codage par description multiple (MDC) est une
technique intressante pour lutter contre les pertes et les
erreurs de transmission. En MDC, la source est code en
plusieurs flux appels descriptions. Il sagit en fait de crer
plusieurs reprsentations distinctes mais corrles d'une
source qui seront transmises sur des chemins diffrents. La
rception d'une description quelconque doit permettre une
reconstruction de la source avec un niveau de qualit
acceptable. La reconstruction et la qualit s'amliorent avec le
nombre de descriptions reues. Chaque rception de

Fig.7 Schma synoptique de la paqutisation utilisant 2 descriptions [9].


a- Formation dun paquet laide des 2 codeurs MELP 2.4 et 1.2 kbits.
b- Affectation des trames.

V. ETUDE COMPARATIVE ENTRE LENTRELACEMENT ET LA


MDC
Nous avons simul diffrentes pertes de paquets pour
introduire des dgradations au niveau du signal synthtique.
Ces pertes ont t simules de faon alatoire par utilisation
de la fonction RAND de MATLAB qui suit une loi de
distribution uniforme. Le taux de perte des paquets est donn
par la formule suivante :
Taux =

nombre de trames perdues


nombre de total de trames

x 100

(5)

Nous calculons aussi le score PESQ par comparaison des


signaux de parole de sortie (synthtiss) avec ceux de parole
de rfrence.
1) Performances du codeur MELP 2.4 pour des diffrents
types dentrelacement

Le fig.8 prsente dans ce paragraphe donne les taux de


perte des trames, chiffrs en fonction du taux de perte avant et
aprs application des diffrents types lentrelacement :
entrelacement optimal, entrelacement par groupement,
entrelacement convolutif, entrelacement convolutif dcorrl.

Lintelligibilit du signal est prserve pour les deux


mthodes pour des taux avoisinant les 30%.

PESQ

PESQ

Nous donnons chaque fois la valeur moyenne des PESQ


pour chaque mthode et pour chaque valeur du taux de perte.

Taux de perte des paquets en %.

Taux de perte des paquets en %.


Fig.8 Evolution des PESQ du MELP 2.4 obtenus avant et aprs application
des techniques dentrelacement, pour diffrents taux de perte et pour des
locuteurs et locutrices.

La mthode dentrelacement par convolution dcorrle


ayant une moyenne de rehaussement de 0.44, se prsente
comme tant la
meilleure mthode
dentrelacement
comparativement aux techniques : entrelacement par
groupement, entrelacement optimal et entrelacement
convolutif, qui ont une moyenne de 0.34, 0.33, 0.31
respectivement.
Lentrelacement appliqu au corpus masculin et fminins
montre une dgradation du signal pour des taux de pertes
suprieurs 10%, pour la mthode de convolution dcorrle,
12% pour la mthode de convolution et la mthode
dentrelacement par groupement, et 15% pour la mthode
entrelacement optimal.
Aprs application des mthodes dentrelacement:
convolutif, optimal et entrelacement par groupement notre
signal commence perdre lintelligibilit pour des taux de
pertes avoisinant les 30% (PESQ infrieur 2).

Fig.9 Evolution des PESQ obtenus par le MELP 2.4 avant et aprs
application des techniques : MDC et entrelacement, pour diffrents taux de
perte pour des locuteurs et locutrices.

VI. CONCLUSION
A la faveur de cette tude, nous pouvons conclure que la
mthode dite dentrelacement convolution dcorrle se
prsente comme tant la meilleure mthode dentrelacement
comparativement aux autres techniques dentrelacement
exprimentes, savoir : entrelacement par groupement,
optimale et convolutive.
Nous pouvons aussi conclure que les performances de la
technique MDC, apporte une amlioration importante de la
qualit perceptuelle comparativement la mthode
dentrelacement convolutive dcorrle essentiellement
lorsque les taux de perte sont infrieurs 12 %, au del de
12%, les deux mthodes sont quivalents les unes aux autres.
REFERENCES
[1]

[2]

2) Comparaison entre lentrelacement et la MDC


Les rsultats donns dans la fig.9 montrent les taux de perte
des trames chiffrs en fonction des valeurs du PESQ pour les
trois cas, c'est--dire avant et aprs application de la MDC,
compars ceux de lentrelacement convolutif dcorrl jug
comme tant la meilleure mthode dentrelacement.
La mthode de masquage dite MDC ayant une moyenne de
rehaussement de 0.60, se prsente comme tant la meilleure
mthode de masquage par rapport aux techniques
dentrelacement. En effet, la meilleure mthode dite
convolution dcorrle donne une moyenne de rehaussement
de 0.50.
La mthode dentrelacement convolution dcorrle,
applique au corpus combin masculins et fminins, cause de
faibles dgradations de notre signal pour des taux de perte
inferieurs 5 %.

[3]
[4]

[5]

[6]

[7]

[8]

[9]

G.Baudoin, J. Cernock, P. Gournay, et G. Chollet, Codage de la


parole bas et trs bas dbit. Dpartement Signaux et
Tlcommunications, ESIEE BP 99 93162.
J. Edward, Daniel and Keith A, Federal Standard 2.4 kbps MELP
Over IP,Roc. 43 rd IEEE Midwest Symp. on Circuits and Systems,
Lansing MI, 0-7803-6475-9, pp.568-571, Aug 8-11,2000.
J. Stachurski, A. McCree, V. Viswanathan, high quality MELP coding
at bit-rates around 4 kb/s. 0-7803-5041-3/99, pp 485-488, IEEE 1999.
C. Perkins, O. Hodson, et V. Hardman, A Survey of Packet Loss
Recovery Techniques for Streaming Audio. 0890-8044, pp.40-48,
IEEE Network .September/October 1998.
Teck-Kuen Chua and David C. Pheanis, QoS Evaluation of SenderBased Loss-Recovery Techniques for VoIP. 0890-8044, pp.14-22,
IEEE Network. November/December 2006.
B.P. Milner, A.B. James. Analysis and compensation of packet loss in
distributed speech recognition using interleaving, pp.1947- 1950,
ISCA-SPEECH. September 1-4, 2003.
B.P. Milner, A.B. James, A Comparison of Efficient Interleaver
Designs for Real Time Distributed Speech Recognition, ASIDE,
November 10-11. 2005.
Gal Richard, E. Ravelli, Student et L. Daudet, Union of MDCT Bases
for Audio Coding, IEEE transactions on audio, speech, and language
processing, vol. 16, pp.1361-1372. No. 8, November 2008.
S. Mohamed, codage par description multiple en MELP pour la VoIP.
Mmoire magister, laboratoire LCPT universit USTHB, 2010.