Vous êtes sur la page 1sur 32

UNION INTERNATIONALE DES TLCOMMUNICATIONS

UIT-T P.862
SECTEUR DE LA NORMALISATION
DES TLCOMMUNICATIONS
DE L'UIT
(02/2001)

SRIE P: QUALIT DE TRANSMISSION
TLPHONIQUE, INSTALLATIONS TLPHONIQUES
ET RSEAUX LOCAUX
Mthodes d'valuation objective et subjective de la qualit


Evaluation de la qualit vocale perue: mthode
objective d'valuation de la qualit vocale de
bout en bout des codecs vocaux et des rseaux
tlphoniques bande troite

Recommandation UIT-T P.862
(Antrieurement Recommandation du CCITT)


RECOMMANDATIONS UIT-T DE LA SRIE P
QUALIT DE TRANSMISSION TLPHONIQUE, INSTALLATIONS TLPHONIQUES ET RSEAUX
LOCAUX

Vocabulaire et effets des paramtres de transmission sur l'opinion des usagers Srie P.10
Lignes et postes d'abonns Srie P.30
P.300
Normes de transmission Srie P.40
Appareils de mesures objectives Srie P.50
P.500
Mesures lectroacoustiques objectives Srie P.60
Mesures de la sonie vocale Srie P.70
Mthodes d'valuation objective et subjective de la qualit Srie P.80
P.800
Qualit audiovisuelle dans les services multimdias Srie P.900

Pour plus de dtails, voir la Liste des Recommandations de l'UIT-T.

UIT-T P.862 (02/2001) i
Recommandation UIT-T P.862

Evaluation de la qualit vocale perue: mthode objective d'valuation de la qualit vocale
de bout en bout des codecs vocaux et des rseaux tlphoniques bande troite



Rsum
La prsente Recommandation dcrit une mthode objective de prvision de la qualit subjective de
la tlphonie 3,1 kHz (bande troite) avec combin et des codecs vocaux bande troite. La
prsente Recommandation donne une description approfondie de la mthode, des conseils sur ses
modalits d'utilisation et prsente une partie des rsultats d'un test de performance effectu par la
Commission d'tudes 12 pendant la priode 1999-2000. Une implmentation de rfrence C-ANSI,
dcrite l'Annexe A, fait l'objet de fichiers spars qui font partie intgrante de la prsente
Recommandation. Est galement spcifie l'Annexe A une procdure d'essai de conformit qui
permet l'utilisateur de confirmer la validit d'une autre implmentation du modle. Cette
implmentation de rfrence C-ANSI prvaudra en cas de divergences entre le texte de la description
figurant dans la prsente Recommandation et la mise en uvre de rfrence C-ANSI.
La prsente Recommandation comporte un document lectronique contenant une implmentation de
rfrence en langage C de l'algorithme PESQ et des donnes de test de conformit.


Source
La Recommandation P.862 de l'UIT-T, labore par la Commission d'tudes 12 (2001-2004) de
l'UIT-T, a t approuve le 23 fvrier 2001 selon la procdure dfinie dans la Rsolution 1 de
l'AMNT.





ii UIT-T P.862 (02/2001)
AVANT-PROPOS
L'UIT (Union internationale des tlcommunications) est une institution spcialise des Nations Unies dans le
domaine des tlcommunications. L'UIT-T (Secteur de la normalisation des tlcommunications) est un
organe permanent de l'UIT. Il est charg de l'tude des questions techniques, d'exploitation et de tarification,
et met ce sujet des Recommandations en vue de la normalisation des tlcommunications l'chelle
mondiale.
L'Assemble mondiale de normalisation des tlcommunications (AMNT), qui se runit tous les quatre ans,
dtermine les thmes d'tude traiter par les Commissions d'tudes de l'UIT-T, lesquelles laborent en retour
des Recommandations sur ces thmes.
L'approbation des Recommandations par les Membres de l'UIT-T s'effectue selon la procdure dfinie dans la
Rsolution 1 de l'AMNT.
Dans certains secteurs des technologies de l'information qui correspondent la sphre de comptence de
l'UIT-T, les normes ncessaires se prparent en collaboration avec l'ISO et la CEI.





NOTE
Dans la prsente Recommandation, l'expression "Administration" est utilise pour dsigner de faon abrge
aussi bien une administration de tlcommunications qu'une exploitation reconnue.




DROITS DE PROPRIT INTELLECTUELLE
L'UIT attire l'attention sur la possibilit que l'application ou la mise en uvre de la prsente Recommandation
puisse donner lieu l'utilisation d'un droit de proprit intellectuelle. L'UIT ne prend pas position en ce qui
concerne l'existence, la validit ou l'applicabilit des droits de proprit intellectuelle, qu'ils soient
revendiqus par un Membre de l'UIT ou par une tierce partie trangre la procdure d'laboration des
Recommandations.
A la date d'approbation de la prsente Recommandation, l'UIT avait t avise de l'existence d'une proprit
intellectuelle protge par des brevets acqurir pour mettre en uvre la prsente Recommandation.
Toutefois, comme il ne s'agit peut-tre pas de renseignements les plus rcents, il est vivement recommand
aux responsables de la mise en uvre de consulter la base de donnes des brevets du TSB.



UIT 2001
Droits de reproduction rservs. Aucune partie de cette publication ne peut tre reproduite ni utilise sous
quelque forme que ce soit et par aucun procd, lectronique ou mcanique, y compris la photocopie et les
microfilms, sans l'accord crit de l'UIT.


UIT-T P.862 (02/2001) iii
TABLE DES MATIRES
Page
1 Introduction ................................................................................................................ 1
2 Rfrences normatives................................................................................................ 1
3 Abrviations ............................................................................................................... 2
4 Domaine d'application................................................................................................ 2
5 Conventions................................................................................................................ 4
6 Aperu gnral de l'valuation PESQ......................................................................... 5
7 Comparaison entre notes objectives et notes subjectives ........................................... 6
7.1 Coefficient de corrlation........................................................................................... 7
7.2 Erreurs rsiduelles ...................................................................................................... 7
8 Prparation du matriel vocal trait............................................................................ 7
8.1 Matriel source ........................................................................................................... 8
8.1.1 Choix du matriel source............................................................................... 8
8.1.2 Structure temporelle et dure du matriel source.......................................... 8
8.1.3 Filtrage et talonnage de niveau.................................................................... 9
8.2 Adjonction de bruit de fond........................................................................................ 9
8.3 Traitement dans le systme soumis l'essai............................................................... 9
9 Choix des paramtres exprimentaux......................................................................... 10
10 Description de l'algorithme PESQ.............................................................................. 10
10.1 Prtraitement d'alignement de niveau et d'alignement temporel (Figure 3) ............... 14
10.1.1 Calcul du gain total du systme..................................................................... 14
10.1.2 Filtrage du systme IRS ................................................................................ 14
10.1.3 Alignement temporel..................................................................................... 14
10.2 Modle perceptif (Figures 4a et 4b) ........................................................................... 16
10.2.1 Prcalcul de rglages de constantes .............................................................. 16
10.2.2 Filtrage la rception du systme IRS.......................................................... 17
10.2.3 Calcul de l'intervalle de temps de parole active ............................................ 17
10.2.4 Transforme rapide de Fourier court terme................................................ 17
10.2.5 Calcul des densits de puissance fondamentale ............................................ 17
10.2.6 Compensation partielle de la densit de puissance fondamentale initiale
pour l'galisation de la fonction de transfert ................................................. 18
10.2.7 Compensation partielle de la densit de puissance fondamentale soumise
distorsion pour les variations de gain dans le temps entre le signal
dgrad et le signal initial.............................................................................. 18
10.2.8 Calcul des densits de sonie......................................................................... 18
10.2.9 Calcul de la densit de perturbation .............................................................. 18

iv UIT-T P.862 (02/2001)
Page
10.2.10 Multiplication cellule par cellule avec un facteur dasymtrie ..................... 19
10.2.11 Cumul des densits de perturbation par rapport la frquence et
accentuation des parties du signal initial ayant une faible valeur de sonie... 19
10.2.12 Annulation de la perturbation pour les trames durant lesquelles le temps
de propagation a subi une diminution importante......................................... 20
10.2.13 Ralignement des intervalles errons............................................................ 20
10.2.14 Cumul des valeurs de perturbation dans des intervalles de fraction de
seconde.......................................................................................................... 20
10.2.15 Cumul des valeurs de perturbation pendant la dure du signal vocal
(10 secondes environ), incluant un facteur de rcentet ............................... 20
10.2.16 Calcul de la note d'valuation PESQ............................................................. 20
Annexe A Implmentation de rfrence de l'valuation PESQ et tests de conformit......... 21
Fichier lectronique: Implmentation de rfrence en langage C de l'algorithme PESQ
et donnes de test de conformit


UIT-T P.862 (02/2001) 1
Recommandation UIT-T P.862
Evaluation de la qualit vocale perue: mthode objective d'valuation de la qualit vocale
de bout en bout des codecs vocaux et des rseaux tlphoniques bande troite
1

1 Introduction
La mthode objective dcrite dans la prsente Recommandation est appele "Evaluation de la qualit
vocale perue" (PESQ, perceptual evaluation of speech quality). Elle constitue l'aboutissement de
plusieurs annes d'tude et s'applique non seulement aux codecs vocaux mais aussi aux mesures de
bout en bout.
Dans la ralit, les systmes peuvent tre soumis filtrage, prsenter un temps de propagation
variable et subir des distorsions dues des erreurs de transmission dans la voie et des codecs
faible dbit binaire. La mthode de mesure de la qualit vocale perue (PSQM, perceptual speech
quality measure) dcrite dans l'UIT-T P.861 (fvrier 1998), dont l'utilisation n'a t recommande
que pour l'valuation des codecs vocaux, n'a pas permis de tenir dment compte du filtrage, du temps
de propagation variable et des distorsions localises de courte dure. La mthode d'valuation PESQ
prend en compte ces effets au moyen de l'galisation de la fonction de transfert, de l'alignement
temporel et d'un nouvel algorithme de calcul des valeurs moyennes de distorsion dans le temps. La
validation de la mthode d'valuation PESQ a t assure par un certain nombre d'expriences qui
ont permis d'en tester expressment la performance compte tenu d'un ensemble de facteurs tel que le
filtrage, le temps de propagation variable, les distorsions due au codage et les erreurs de transmission
dans la voie.
Il est recommand d'utiliser la mthode PESQ pour l'valuation de la qualit de la parole de la
tlphonie 3,1 kHz (bande troite) avec combin et des codecs vocaux bande troite.
2 Rfrences normatives
La prsente Recommandation se rfre certaines dispositions des Recommandations UIT-T et
textes suivants qui, de ce fait, en sont parties intgrantes. Les versions indiques taient en vigueur
au moment de la publication de la prsente Recommandation. Toute Recommandation ou tout texte
tant sujet rvision, les utilisateurs de la prsente Recommandation sont invits se reporter, si
possible, aux versions les plus rcentes des rfrences normatives suivantes. La liste des
Recommandations de l'UIT-T en vigueur est rgulirement publie.
UIT-T P.800 (1996), Mthodes d'valuation subjective de la qualit de transmission.
UIT-T P.810 (1996), Appareil de rfrence bruit modul (MNRU).
UIT-T P.830 (1996), Evaluation subjective de la qualit des codecs numriques bande
tlphonique et large bande.
UIT-T Supplment 23 de la srie P (1998), Base de donnes de signaux vocaux cods de
l'UIT-T.
____________________
1
La prsente Recommandation comporte un document lectronique contenant une implmentation de
rfrence en langage C de l'algorithme PESQ et des donnes de test de conformit.

2 UIT-T P.862 (02/2001)
3 Abrviations
La prsente Recommandation utilise les abrviations suivantes:
ACR valuation par catgories absolues (absolute category rating)
CELP prdiction linaire avec excitation par code (code excited linear prediction)
DMOS note moyenne d'apprciation de la dgradation (degradation mean opinion score)
HATS simulateur de tte et de torse (head and torso simulator)
IRS systme de rfrence intermdiaire (intermediate reference system)
LQ qualit d'coute (listening quality)
MIC modulation par impulsions et codage
MOS note moyenne d'opinion (mean opinion score)
PESQ valuation de la qualit vocale perue (perceptual evaluation of speech quality)
PSQM mesure de la qualit vocale perue (perceptual speech quality measure)
4 Domaine d'application
Les Tableaux 1 3 donnent un aperu gnral des facteurs exprimentaux, des techniques de codage
et des applications retenus dans la prsente Recommandation, tablis d'aprs les rsultats du test de
performance effectu par la Commission d'tudes 12. Le Tableau 1 indique les relations entre les
facteurs exprimentaux, les techniques de codage et les applications pour lesquels la prsente
Recommandation s'est rvle d'une prcision acceptable. Le Tableau 2 rpertorie les conditions
pour lesquelles la mthode d'valuation PESQ dfinie dans la prsente Recommandation est rpute
fournir des prdictions inexactes ou n'est pas cense tre utilise. Enfin, le Tableau 3 numre les
facteurs, techniques et applications pour lesquels la mthode d'valuation PESQ n'a pas encore t
valide ce jour. Bien que les valeurs de corrlation entre les notes objectives et subjectives
obtenues lors du test de performance s'tablissaient au voisinage de 0,935 pour les donnes connues
et pour les donnes inconnues, l'algorithme PESQ ne saurait tre utilis en lieu et place d'essais
subjectifs.
Il convient galement de noter que l'algorithme PESQ n'offre pas une valuation complte de la
qualit de transmission. Il ne mesure que les effets produits dans un seul sens, par la distorsion du
son et le bruit affectant la qualit de la parole. Les effets de l'affaiblissement en sonie, du temps de
propagation, de l'effet local, de l'cho et d'autres dgradations lies l'interaction bidirectionnelle
(par exemple, crteur de centre) ne sont pas pris en compte dans les notes calcules par l'algorithme
PESQ. En consquence, il est possible d'avoir des notes PESQ leves malgr une qualit mdiocre
dans l'ensemble de la connexion.
Tableau 1/P.862 Facteurs pour lesquels la mthode PESQ s'est rvle
d'une prcision acceptable
Facteurs exprimentaux
Niveaux d'entre des signaux de parole dans un codec
Erreur de transmission dans la voie
Perte de paquets et masquage de perte de paquets avec les codecs CELP
Dbits lorsque le codec peut fonctionner selon plusieurs modes
Transcodages
Bruit ambiant du ct mission (Voir Note.)

UIT-T P.862 (02/2001) 3
Tableau 1/P.862 Facteurs pour lesquels la mthode PESQ s'est rvle
d'une prcision acceptable (fin)
Facteurs exprimentaux
Incidence de la variation du temps de propagation dans les essais d'coute seulement
Prdistorsion court terme du signal audio
Prdistorsion long terme du signal audio
Techniques de codage
Codecs temporels (G.711, G.726 et G.727, par exemple)
Codecs CELP et hybrides 4 kbit/s (G.728, G.729 et G.723.1, par exemple)
Autres codecs: GSM-FR, GSM-HR, GSM-EFR, GSM-AMR, CDMA-EVRC, TDMA-ACELP,
TDMA-VSELP, TETRA
Applications
Evaluation du codec
Slection du codec
Essais actifs dans le rseau par connexion numrique ou analogique au rseau
Essais de rseaux muls et prototypes
NOTE En prsence de bruit ambiant, on peut mesurer la qualit en appliquant la mthode PESQ au
signal original "propre" (c'est--dire exempt de bruit et au signal dgrad avec bruit.

Tableau 2/P.862 L'valuation PESQ est rpute fournir des prdictions
inexactes lorsqu'elle est utilise conjointement avec ces variables
ou n'est pas cense tre utilise avec ces variables
Facteurs exprimentaux
Niveaux d'coute (Voir Note.)
Affaiblissement en sonie
Incidence du temps de propagation dans les essais de conversation
Echo pour le locuteur
Effet vocal
Techniques de codage
Remplacement de fractions continues du signal vocal constituant plus de 25% de la conversation active
par un silence (crtage temporel extrme)
Applications
Dispositifs de mesure sans intrusion en service
Qualit des communications bidirectionnelles
NOTE L'algorithme PESQ suppose l'existence d'un niveau d'coute normalis de 79 dB SPL et
compense les niveaux de signaux non optimaux dans les fichiers d'entre. L'effet subjectif de l'cart par
rapport au niveau d'coute optimale n'est donc pas pris en compte.


4 UIT-T P.862 (02/2001)
Tableau 3/P.862 (Fera l'objet d'un complment d'tude)
Facteurs, techniques et applications pour lesquels la mthode
d'valuation PESQ n'a pas t encore valide ce jour
Facteurs exprimentaux
Perte de paquets et masquage de perte de paquets avec des codecs de type MIC (Voir Note 1.)
Ecrtage temporel du signal vocal (Voir Note 1.)
Ecrtage en amplitude du signal vocal (Voir Note 2.)
Variations selon le locuteur
Locuteurs multiples simultans
Discordance de dbit entre un codeur et un dcodeur si un codec possde plusieurs modes de dbit
Signaux d'information de couche rseau l'entre d'un codec
Signaux vocaux artificiels l'entre d'un codec
Signaux de musique l'entre d'un codec
Echo pour la personne qui coute
Effets/artefacts causs par le fonctionnement des annuleurs d'cho
Effets/artefacts causs par les algorithmes de rduction de bruit
Techniques de codage
Codecs CELP et hybrides < 4 kbit/s
HVXC MPEG4
Applications
Essais acoustiques des terminaux/combins au moyen du simulateur HATS, par exemple
NOTE 1 La mthode PESQ semble tre plus sensible que les sujets l'crtage temporel frontal,
notamment dans le cas de mots manquants susceptibles de ne pas tre perus par les sujets. Inversement, la
mthode PESQ peut tre moins sensible que les sujets l'crtage temporel normal de courte dure
(remplacement de courtes fractions du signal vocal par un silence). Dans un cas comme dans l'autre, la
corrlation entre la note d'valuation PESQ et la note MOS subjective pourra s'en trouver limite.
NOTE 2 Certains lments de preuve semblent indiquer que l'algorithme PESQ est en mesure de rendre
compte de l'crtage en amplitude, mais quatre conditions seulement sont censes avoir t incluses (dans
deux expriences caractrises par 50 conditions) dans la base de donnes de validation dcrite au
paragraphe 7.
5 Conventions
L'valuation subjective des rseaux tlphoniques et des codecs vocaux peut tre conduite au moyen
d'essais d'coute seulement ou au moyen de mthodes d'essais subjectifs par conversation. Pour des
raisons pratiques, les essais d'coute seulement sont la seule mthode possible d'essais subjectifs au
cours de la mise au point de codecs vocaux, lorsqu'une mise en uvre en temps rel de ces codecs
n'est pas ralisable. La prsente Recommandation expose une technique de mesure objective qui
permet d'estimer la qualit subjective obtenue lors des essais d'coute seulement, au moyen
d'quipements d'coute conformes aux caractristiques de rception du systme IRS ou du systme
IRS modifi.

UIT-T P.862 (02/2001) 5
La plupart des informations sur la performance de la mthode PESQ provient des expriences
subjectives sur la qualit d'coute (LQ, listening quality) pour la dtermination de l'valuation par
catgories absolues (ACR, absolute category rating). Par consquent, il faut considrer que la
prsente Recommandation se rapporte en premier lieu l'chelle d'opinion de qualit d'coute ACR.
6 Aperu gnral de l'valuation PESQ
L'valuation PESQ compare un signal initial X(t) un signal dgrad Y(t) produit par le passage
de X(t) travers un systme de communication. Elle permet de prvoir les notes de qualit de
perception qu'attribueraient au signal Y(t) les sujets participant un essai d'coute subjectif.
Pendant la premire phase de l'valuation PESQ, on calcule une srie de temps de propagation entre
le signal d'entre initial et le signal de sortie dgrad, un pour chaque intervalle de temps pour lequel
le temps de propagation diffre sensiblement de l'intervalle de temps prcdent. Pour chacun de ces
intervalles, on calcule un point de dpart et d'arrt correspondant. L'algorithme d'alignement repose
sur le principe d'un examen comparatif entre le niveau de confiance obtenu pour deux temps de
propagation pendant un intervalle de temps donn et le niveau de confiance obtenu pour un seul
temps de propagation pendant ce mme intervalle. L'algorithme permet de grer les variations du
temps de propagation pendant les silences et les parties de conversation active.
D'aprs les divers temps de propagation mesurs, l'valuation PESQ compare le signal (d'entre)
initial au signal de sortie dgrad et align du dispositif soumis l'essai selon un modle perceptif,
tel que reprsent sur la Figure 1. La cl de ce processus rside dans la transformation du signal
initial et du signal dgrad en une reprsentation interne analogue la reprsentation
psychophysique des signaux audio dans un systme auditif humain, compte tenu de la frquence
perue (en Bark) et de la sonie (en sone). Cette transformation est opre en plusieurs tapes:
alignement temporel, alignement du niveau par rapport un niveau d'coute talonn,
correspondance temps-frquence, prdistorsion des frquences et chelonnement en sonie par
compression.
La reprsentation interne est traite pour tenir compte des effets tels que les variations locales de
gain ou le filtrage linaire qui s'ils ne sont pas trop prononcs peuvent n'tre gure perceptibles.
Pour ce faire, on limite l'importance de la compensation en la retardant par rapport l'effet, ce qui
permet de compenser de faibles diffrences en rgime permanent entre le signal initial et le signal
dgrad. Les effets plus prononcs, ou les variations rapides, ne sont que partiellement compenss si
bien qu'un effet rsiduel subsiste qui contribue renforcer globalement la perturbation perue. Cela
permet d'utiliser un petit nombre d'indicateurs de qualit pour modliser les diffrents effets
subjectifs. Dans le cadre de l'valuation PESQ, deux paramtres d'erreur sont calculs dans le
modle cognitif, lesquels sont combins pour obtenir une note MOS objective concernant la qualit
d'coute. Les principes de base utiliss dans le cadre de l'valuation PESQ sont dfinis dans les
rfrences bibliographiques [1], ... [5].

6 UIT-T P.862 (02/2001)
T1212870-00
Signal d'entre
initial
Dispositif
soumis
l'essai
Signal de sortie
dgrad
MODELE
SUJET
Signal d'entre
initial
Signal de sortie
dgrad
Modle
perceptif
Reprsentation interne du
signal d'entre initial
Diffrence de reprsentation
interne dterminant la
diffrence audible
Modle
cognitif
Qualit
Reprsentation interne
du signal de sortie dgrad
Alignement
temporel
Modle
perceptif
Valeurs estimatives de temps
de propagation d
i
NOTE Un modle informatique du sujet, compos d'un modle perceptif et d'un modle cognitif, est utilis
pour comparer le signal de sortie du dispositif soumis l'essai son signal d'entre, d'aprs les donnes
d'alignement dcoulant des signaux temporels du module d'alignement temporel.

Figure 1/P.862 Aperu gnral des principes fondamentaux appliqus
pour l'valuation PESQ
7 Comparaison entre notes objectives et notes subjectives
Les votes subjectifs sont influencs par de nombreux facteurs tels que les prfrences des diffrents
sujets et le contexte (et les autres conditions) de l'exprience. Il faut donc prvoir un processus de
rgression avant de pouvoir procder une comparaison directe. La rgression doit tre monotone
pour assurer la prservation des donnes; on l'utilise normalement pour faire correspondre la note
PESQ objective avec la note subjective. Une mesure de qualit objective satisfaisante doit prsenter
une grande corrlation avec de nombreux essais subjectifs diffrents si la rgression en question est
effectue sparment pour chacun d'entre eux; dans la pratique, s'agissant d'une valuation PESQ, le
mappage assur par la rgression est souvent presque linaire, selon une chelle de type MOS.
Une des mthodes de rgression prfre pour calculer la corrlation entre la note PESQ et la
note MOS subjective, qui a t applique pour la validation de l'valuation PESQ, utilise un
polynme de troisime ordre soumis la contrainte d'tre monotone. Ce calcul est effectu pour
chaque tude. Dans la plupart des cas, la note MOS pour chaque condition est l'unit de mesure de
performance choisie, en sorte que la rgression doit tre applique entre la note MOS pour chaque
condition et les notes moyennes correspondantes d'valuation PESQ. Une condition devrait utiliser

UIT-T P.862 (02/2001) 7
au moins quatre chantillons vocaux diffrents. La rgression dbouche sur une note MOS objective
dans cet essai. Pour pouvoir comparer les notes objectives et les notes subjectives, les notes MOS
subjectives devraient tre dtermines partir d'un essai d'coute effectu selon l'UIT-T P.830.
7.1 Coefficient de corrlation
Le degr exact de correspondance entre les notes d'valuation PESQ et les notes subjectives peut tre
mesur en calculant le coefficient de corrlation. Pour ce faire, on se fonde en principe sur les notes
moyennes pour les diffrentes conditions, aprs mise en correspondance des notes objectives et des
notes subjectives. Le coefficient de corrlation est calcul selon la formule de Pearson:

( )( )
( ) ( )



=
2 2
y y x x
y y x x
r
i i
i i

o
i
x est la note MOS pour la condition i, et x est la moyenne des valeurs correspondantes de note
MOS
i
x .
i
y est la note moyenne d'valuation PESQ applique la condition i, et y est la moyenne
des valeurs prvues correspondantes de note MOS
i
y .
Pour les 22 expriences courantes du test de performance de l'UIT, le coefficient de corrlation
moyen s'est tabli 0,935. Pour une srie agre de huit expriences utilises au stade de la
validation finale expriences qui taient inconnues au stade de la mise au point de la mthode
d'valuation PESQ le coefficient de corrlation moyen s'est galement tabli 0,935.
7.2 Erreurs rsiduelles
Le mappage qu'opre la rgression limine tout dcalage systmatique entre les notes objectives et la
note MOS subjective, ce qui rduit la valeur quadratique moyenne des erreurs rsiduelles.
e
i
= x
i
y
i

Diverses mesures peuvent tre appliques aux erreurs rsiduelles pour donner un autre aperu de la
correspondance troite entre les notes objectives et la note MOS subjective. Ainsi, l'histogramme des
erreurs rsiduelles absolues
i
e donne un bref aperu de la frquence laquelle se produisent des
erreurs d'importance diffrentes
Pour les 22 expriences courantes du test de performance de l'UIT, la distribution moyenne des
erreurs rsiduelles a montr que l'erreur absolue tait infrieure une note MOS de 0,25 (0,25 sur
une chelle de 5 points) pour 69,2% des conditions et infrieure une note MOS de 0,5. Pour une
srie agre de sept expriences utilises au stade de la validation finale, expriences qui taient
inconnues au stade de la mise au point de la mthode d'valuation PESQ, l'erreur absolue tait
infrieure une note MOS de 0,25 (0,25 sur une chelle de 5 points) pour 72,3% des conditions et
infrieure une note MOS de 0,5 (0,5 sur une chelle de 5 points) pour 91,1% des conditions.
8 Prparation du matriel vocal trait
Il importe que les signaux d'essai destins tre utiliss pour l'valuation PESQ soient reprsentatifs
des signaux rels transports par les rseaux de communication. Les rseaux peuvent traiter la parole
et les silences de manire diffrente. De ce fait, tant souvent optimiss pour la parole, les
algorithmes de codage peuvent donner des rsultats dnus de sens si on leur applique des signaux
d'essai ne contenant pas les proprits temporelles et spectrales des signaux vocaux. Il est souvent
ncessaire de poursuivre le prtraitement pour tenir compte du filtrage sur le trajet d'mission d'un
combin, et pour veiller ce que les niveaux de puissance soient fixs dans une fourchette
approprie.

8 UIT-T P.862 (02/2001)
8.1 Matriel source
8.1.1 Choix du matriel source
A l'heure actuelle, tous les rsultats officiels de performance en matire d'valuation PESQ se
rapportent aux expriences menes en utilisant les mmes enregistrements de parole naturelle pour
l'essai subjectif et l'essai objectif. L'utilisation de signaux vocaux artificiels et de signaux d'essai
vocaux rels concatns n'est recommande que si ces signaux sont reprsentatifs de la structure
temporelle (intervalles de silence compris) et de la structure phontique des signaux vocaux rels.
La prparation des signaux d'essai vocaux artificiels peut tre assure de plusieurs manires. On peut
construire un signal d'essai vocal rel concatn en concatnant de courts fragments (d'une seconde,
par exemple) de parole relle tout en conservant une structure reprsentative de la parole et des
silences. On peut aussi adopter une approche phontique pour produire un signal vocal artificiel trs
peu redondant qui soit reprsentatif de la structure tant temporelle que phontique d'un large ventail
de signaux vocaux naturels [6]. Les signaux d'essai doivent tre reprsentatifs des locuteurs et des
locutrices. Au cours des essais prliminaires, les signaux vocaux artificiels de haute qualit et les
signaux vocaux rels concatns ont donn de bons rsultats dans le cas de l'valuation PESQ. Au
cours de ces essais, les notes objectives pour les signaux d'essai dans chaque condition ont t
utilises pour prvoir les valeurs de note MOS des conditions subjectives. Cette faon de procder
constitue la mthode la plus simple pour dterminer la qualit du systme soumis l'essai. Ce point
appelle un complment d'tude.
En cas d'utilisation d'enregistrements de parole naturelle, il convient de suivre les indications
donnes dans le paragraphe 7/P.830; de plus, il est recommand qu'un minimum de deux locuteurs et
de deux locutrices soit mis contribution pour chaque condition d'essai. Si la variation selon le
locuteur doit tre value en tant que facteur autonome, il est recommand de faire appel un plus
grand nombre de locuteurs comme suit: 8 hommes, 8 femmes et 8 enfants. A l'heure actuelle,
l'UIT-T P.862 n'est pas valide pour la variation selon le locuteur.
8.1.2 Structure temporelle et dure du matriel source
Pour tre reprsentatifs des pauses naturelles dans la conversation, les signaux d'essai doivent
comporter des salves de parole spares par des priodes de silence. A titre indicatif, la dure d'une
salve de parole est gnralement de une trois secondes, encore que cette dure varie
considrablement d'une langue l'autre. Certains types de dtecteur d'activit vocale ne sont
sensibles qu'aux priodes de silence de plus de 200 ms. La parole devrait tre active pendant 40
80% du temps, bien que ce pourcentage, l encore, dpende quelque peu de la langue.
La plupart des expriences retenues pour l'talonnage et la validation de l'valuation PESQ
contenaient des paires de phrases spares par des silences, d'une dure totale de huit secondes; dans
certains cas, trois ou quatre phrases ont t utilises, avec des enregistrements lgrement plus longs
(jusqu' 12 secondes). Les enregistrements destins tre utiliss pour l'valuation PESQ devraient
tre sensiblement de mme longueur et de mme structure.
Ainsi, dans le cas o une condition doit tre soumise un essai sur une longue priode, il est plus
indiqu d'effectuer plusieurs enregistrements distincts de huit vingt secondes de conversation
environ et de traiter chaque fichier sparment aux fins de l'valuation PESQ. Cette solution prsente
d'autres avantages: si on utilise dans chaque cas le mme enregistrement original, les variations de la
qualit de la condition en fonction du temps seront trs apparentes; on peut aussi utiliser plusieurs
locuteurs et/ou enregistrements sources diffrents, ce qui permet de mesurer de manire plus prcise
les variations selon le locuteur ou le matriel dans cette condition.
A noter qu'il dcoule du processus d'intgration non linaire dans le cadre de l'valuation PESQ que
la note moyenne pour un ensemble de fichiers ne sera gnralement pas gale la note d'une version
concatne du mme ensemble de fichiers, considre isolment.

UIT-T P.862 (02/2001) 9
8.1.3 Filtrage et talonnage de niveau
Les signaux doivent traverser un filtre dont les caractristiques de frquence permettent de simuler
les caractristiques de frquence d'mission d'un combin tlphonique, et doivent tre soumis la
mme forme d'galisation de niveau que des voix relles. L'UIT-T recommande l'emploi de la
caractristique de frquence l'mission du systme de rfrence intermdiaire (IRS, intermediate
reference system) modifi, tel qu'il est dfini dans l'Annexe D/P.830. L'galisation du niveau une
amplitude qui soit reprsentative du trafic rel doit tre effectue conformment au 7.2.2 de
l'UIT-T P.830.
Dans certains cas, le systme de mesure utilis (une interface analogique 2 fils, par exemple) peut
tre l'origine de variations de niveau importantes. Il convient de tenir compte de ces variations pour
veiller ce que le niveau du signal traversant le rseau soit reprsentatif.
Aprs filtrage ( l'mission) dans le combin et galisation du niveau, le matriel source prpar est
normalement utilis comme signal initial pour l'valuation PESQ.
8.2 Adjonction de bruit de fond
Il est possible d'utiliser l'valuation PESQ pour valuer la qualit de systmes acheminant des
signaux vocaux en prsence de bruit de fond ou de bruit ambiant (vhicule, rue, etc.). Les
enregistrements de bruit doivent tre effectus travers un filtre appropri reprenant la
caractristique d'mission du systme IRS modifi c'est l une condition particulirement
importante pour les signaux basse frquence tels que les bruits l'intrieur d'un vhicule qui sont
fortement attnus par le filtre du combin puis rgls au niveau souhait pour l'essai. Pour que
l'valuation PESQ puisse tenir compte de la perturbation subjective dans un contexte ACR, en raison
du bruit ainsi que des ventuelles distorsions due au codage, le signal initial utilis pour valuation
PESQ doit tre "propre" (c'est--dire exempt de bruit), mais le bruit doit tre ajout avant que les
signaux ne traversent le systme soumis l'essai. L'valuation PESQ est valide pour les signaux
d'entre avec prsence de bruit. Le processus d'adjonction de bruit est reprsent sur la Figure 2 b).
T1212880-00
Signal initial
Systme
Signal
dgrad
PESQ
Systme
Bruit
PESQ
Signal initial
Signal
dgrad
a) Essai de conversation en l'absence de bruit ambiant
b) Essai de conversation en prsence de bruit ambiant

Figure 2/P.862 Mthodes de mesure de la qualit en prsence et
en l'absence de bruit ambiant
8.3 Traitement dans le systme soumis l'essai
Le signal source doit tre dment trait dans le systme soumis l'essai. Il est souhaitable d'viter
toute nouvelle distorsion imputable des oprations inutiles: quantification, crtage en amplitude
ou rchantillonnage. Le format prfr pour l'enregistrement du signal initial et du signal dgrad
est le codage MIC linaire 16 bits et frquence d'chantillonnage de 8 kHz. L'valuation PESQ a
t valide pour les frquences d'chantillonnage de 8 kHz et de 16 kHz.

10 UIT-T P.862 (02/2001)
9 Choix des paramtres exprimentaux
Les effets de divers facteurs de qualit sur la performance du codec ou du systme peuvent tre
examins par une valuation subjective ou objective. L'UIT-T P.830 donne des indications sur les
mthodes d'valuation subjective des facteurs de qualit suivants:
1) niveaux d'entre des signaux de parole dans un codec;
2) niveaux d'coute lors d'expriences subjectives;
3) locuteurs (y compris locuteurs multiples simultans);
4) erreur de transmission dans la voie entre un codeur et un dcodeur;
5) dbits lorsque le codec peut fonctionner selon plusieurs modes;
6) transcodages;
7) discordance de dbit entre un codeur et un dcodeur si un codec possde plusieurs modes de
dbit;
8) bruit ambiant du ct mission;
9) signaux d'information de couche Rseau l'entre d'un codec;
10) signaux de musique l'entre d'un codec.
L'valuation PESQ permet d'valuer nombre de ces facteurs de qualit (1, 4, 5, 6 et 8).
NOTE 1 La mesure objective de facteurs de qualit autres que ceux qui sont expressment indiqus dans la
prsente Recommandation comme tant applicables est encore l'tude. Ces facteurs ne devront donc tre
mesurs qu'aprs vrification de l'exactitude de la mesure objective en liaison avec les essais subjectifs selon
l'UIT-T P.830.
Outre les conditions requises pour les codecs, l'UIT-T P.830 prconise l'utilisation de conditions de
rfrence pour les essais subjectifs. Ces conditions sont utiles pour faciliter les comparaisons entre
les rsultats d'essais subjectifs issus de laboratoires diffrents ou du mme laboratoire des moments
diffrents. En outre, dans le cas o les rsultats des essais objectifs sont exprims en termes de
valeurs Q quivalentes, il convient de soumettre les conditions de rfrence des essais en utilisant
l'appareil de rfrence bruit modul (MNRU, modulated noise reference unit) spcifi dans
l'UIT-T P.810.
NOTE 2 Etendre la mesure objective de la qualit d'autres codecs normaliss tels que les codecs MIC
64 kbit/s G.711, MICDA 32 kbit/s G.726, LD-CELP 16 kbit/s G.728 et CS-ACELP 8 kbit/s G.729, ainsi
qu' l'appareil MNRU peut aider comparer la performance du systme soumis l'essai celle des codecs
normaliss.
Ces paramtres exprimentaux sont expliqus en dtail dans l'UIT-T P.830.
10 Description de l'algorithme PESQ
Un grand nombre des phases de l'valuation PESQ tant relativement difficiles dcrire sous forme
d'algorithme, une telle description ne saurait commodment tre exprime par des formules
mathmatiques. Cette description tant par dfinition textuelle, le lecteur est invit se reporter au
code source C pour de plus amples prcisions. Les Figures 3, 4a et 4b donnent un aperu gnral de
l'algorithme sous forme d'organigramme. La Figure 3 concerne l'alignement, la Figure 4a l'lment
central du modle perceptif et la Figure 4b la dtermination finale de la note d'valuation PESQ.
Chacun des blocs fait l'objet d'une description approfondie.

UIT-T P.862 (02/2001) 11
T1212950-01
d
i
X(t) Y(t)
X
S
(t)
X
IRSS
(t)
X
ES
(t)
k
Y
S
(t)
Y
IRSS
(t)
X
ES
(t)
k
Echelonnement un
niveau fixe au-dessus
de 300 Hz
Dtermination
des enveloppes
Dtermination des
occurrences d'mission
de parole
Occurrences d'mission de
parole pour le temps de
propagation approximatif
Occurrences d'mission de
parole pour le temps de
propagation exact
Dtermination des
intervalles de temps pour
un temps de propagation
constant
Valeurs estimatives du temps de propagation
par intervalle de temps, avec chantillons
de dbut et de fin
Echelonnement un
niveau fixe au-dessus
de 300 Hz
Dtermination
des enveloppes
Dtermination des
occurrences d'mission
de parole
Filtrage du
systme IRS
Filtrage du
systme IRS

Figure 3/P.862 Aperu gnral de la procdure priodique d'alignement utilise dans le cadre
de l'valuation PESQ pour dterminer le temps de propagation par intervalle de temps d
i

12 UIT-T P.862 (02/2001)
T1212960-01
S
n1
S
n
LY(f)
n
LX(f)
n
DA(f)
n
D(f)
n
d
i
DA
n
D
n
D(f)
n
PPY'
WIRSS
(f)
n
PPX'
WIRSS
(f)
n
PPX
WIRSS
(f)
n
PPY
WIRSS
(f)
n
PY
WIRSS
(f)
n
PX
WIRSS
(f)
n
X
WIRSS
(t)
n
X
IRSS
(t)
Y
WIRSS
(t)
n
Y
IRSS
(t)
Prdistorsion de frquence
par rapport l'chelle
fondamentale
Reprsentation de la
puissance de la
transforme FFT
Calcul de la
compensation de
frquence linaire
Calcul du facteur
d'chelonnement
local
Prdistorsion d'intensit
par rapport l'chelle
de sonie
Accentuation des
parties de silence
Intgration de
frquence L
3
Enregistrement
Traitement de l'asymtrie
Soustraction
perceptive
Intgration de
frquence L
1
Fentre de Hanning
Accentuation des
parties de silence
Prdistorsion d'intensit
par rapport l'chelle
de sonie
Fentre de Hanning
Reprsentation de la
puissance de la
transforme FFT
Prdistorsion de frquence
par rapport l'chelle
fondamentale
NOTE Les distorsions par trame D
n
et

DA
n
ont t cumules dans le temps (indice
n
) pour obtenir
les perturbations finales (voir Figure 4b qui indique galement le ralignement du signal dgrad).

Figure 4a/P.862 Aperu gnral du modle perceptif

UIT-T P.862 (02/2001) 13
T1212910-00
d
i
D'
n
= 0
D
n
d
i1
d
i
< 1/2W
+ 4,5

D'
n
= D
n
d
i
D'
n
D''
n
= D'
n
D
n
re
D''
n
= min (D'
n
,D
n
re
)
D
n
''

Oui Non
Oui Non
Note d'valuation PESQ
Dtermination des
intervalles errons
Compteur des intervalles
errons
Pour chaque
intervalle erron,
recalculer
d
i
d'
i
Nombre
d'intervalles errons
= 0
Recalculer la
perturbation
DA"
n
(De manire quivalente)
Intgration de l'instant L
6
dans les fractions de seconde
Intgration de l'instant L
2

dans les fractions de
seconde et accentuation
de la partie finale
Intgration de l'instant L
6
dans les fractions de seconde
Intgration de l'instant L
2
dans les fractions de
seconde et accentuation
de la partie finale
NOTE Aprs ralignement des intervalles errons, les distorsions par trame D''
n
et DA''
n
sont intgres par rapport au
temps et mappes la note d'valuation PESQ. W est la longueur de la fentre de la transforme FTT dans les chantillons.

Figure 4b/P.862 Aperu gnral du modle perceptif

14 UIT-T P.862 (02/2001)
10.1 Prtraitement d'alignement de niveau et d'alignement temporel (Figure 3)
10.1.1 Calcul du gain total du systme
Le gain du systme soumis l'essai n'est pas connu a priori et peut varier considrablement selon,
par exemple, qu'on a utilis pour la mesure une connexion RNIS ou une interface analogique deux
fils. En outre, il n'existe pas de niveau d'talonnage unique auquel le signal initial sera enregistr. Il
faut donc aligner le niveau du signal initial X(t) et le niveau du signal dgrad Y(t) sur le mme
niveau de puissance constant. L'valuation PESQ suppose que le niveau d'coute subjectif soit fix
une valeur constante de 79 dB SPL au point de rfrence oreille (voir 8.1.2/P.830). L'algorithme
d'alignement de niveau dans le cadre de l'valuation PESQ fonctionne comme suit:
les versions filtres du signal initial et du signal dgrad sont calcules. Le filtre bloque tous
les lments au-dessous de 250 Hz, reste stable jusqu' 2000 Hz et prsente une rponse
linaire qui diminue lment par lment au passage par les points suivants: {2000 Hz,
0 dB}, {2500 Hz, 5 dB }, {3000 Hz, 10 dB}, {3150 Hz, 20 dB}, {3500 Hz, 50 dB},
{4000 Hz et au-dessus, 500 dB}. Ces versions filtres des signaux sont utilises
uniquement pour l'opration considre ici, savoir le calcul du gain total du systme;
on calcule la valeur moyenne des chantillons vocaux du signal initial filtr et des
chantillons vocaux du signal dgrad filtr levs au carr;
diffrents gains sont calculs et appliqus pour aligner le signal vocal initial X(t) et le signal
vocal dgrad Y(t) sur un niveau cible constant dcoulant des versions chelonnes X
S
(t) et
Y
S
(t) de ces signaux.
10.1.2 Filtrage du systme IRS
On part du principe que les essais d'coute ont t effectus en utilisant une caractristique de
rception du systme IRS ou du systme IRS modifi dans le combin. Un modle perceptif
d'valuation de la qualit de la parole par des sujets doit tenir compte de ce principe pour modliser
les signaux que les sujets ont effectivement entendus. On calcule donc les versions filtres la
rception de type IRS du signal vocal initial et du signal vocal dgrad.
Dans une valuation PESQ, ce filtrage est mis en uvre au moyen d'une transforme FFT sur toute
la longueur du fichier, dans le domaine frquentiel, avec une rponse linaire lment par lment
analogue la caractristique de rception du systme IRS (non modifi) (UIT-T P.830), puis au
moyen d'une transforme FFT inverse sur toute la longueur du fichier de signaux vocaux. On obtient
ainsi les versions filtres X
IRSS
(t) et Y
IRSS
(t) des signaux d'entre et de sortie chelonns X
S
(t) et Y
S
(t).
On utilise un seul et mme filtre de rception de type IRS pour l'valuation PESQ, indpendamment
du type de filtrage (IRS ou IRS modifi) utilis pendant l'exprience subjective relle. Cette manire
de procder s'explique par le fait que dans la plupart des cas on ignore le type exact de filtrage utilis
et que, mme quand on le connat, le couplage du combin l'oreille reste inconnu. Il est donc
impratif que la mthode objective soit relativement insensible au type de filtrage utilis dans le
combin.
Les signaux filtrs par le systme IRS sont utiliss la fois dans la procdure d'alignement temporel
et dans le modle perceptif.
10.1.3 Alignement temporel
La procdure priodique d'alignement temporel fixe des valeurs de temps de propagation applicables
au modle perceptif pour permettre de comparer les parties correspondantes des fichiers du signal
initial et du signal dgrad. Ce processus d'alignement se droule en plusieurs phases:
estimation du temps de propagation de groupe (enveloppes) d'aprs l'ensemble signal initial
et signal dgrad;

UIT-T P.862 (02/2001) 15
subdivision du signal initial en un certain nombre de sous-lments appels occurrences
d'mission de parole (ou paroles mises);
estimation du temps de propagation de groupe (enveloppes) d'aprs les occurrences
d'mission de parole;
identification, par corrlation fine ou par histogramme, du temps de propagation par rapport
l'chantillon le plus proche d'aprs les occurrences d'mission de parole;
coupure des paroles mises et ralignement des intervalles de temps en vue de reprer les
variations du temps de propagation en cours de conversation;
d'aprs le modle perceptif, identification et ralignement de longs passages comportant des
erreurs importantes en vue de reprer les erreurs d'alignement.
10.1.3.1 Alignement selon les enveloppes
Les enveloppes X
ES
(t)
k
et Y
ES
(t)
k
sont calcules d'aprs les signaux initial et dgrad chelonns X
S
(t)
et Y
S
(t). L'enveloppe est dfinie par la formule LOG (MAX(E(k)/Ethresh, 1)), o E(k) est l'nergie
dans une trame k de 4 ms et Ethresh est le seuil de conversation dtermin par un dtecteur d'activit
vocale. La corrlation croise des enveloppes du signal initial et du signal dgrad est utilise pour
estimer le temps de propagation approximatif entre ces signaux, avec une rsolution d'environ 4 ms.
10.1.3.2 Alignement temporel fin
Les modles perceptifs tant sensibles aux dcalages temporels, il est ncessaire de calculer une
valeur de temps de propagation exacte par chantillon. Cette valeur se calcule comme suit:
les trames de 64 ms (se chevauchant 75%) sont soumises un fentrage de Hanning et
une corrlation croise entre le signal initial et le signal dgrad, aprs alignement selon les
enveloppes;
le maximum de la corrlation, la puissance 0,125, est utilis pour mesurer le niveau de
confiance de l'alignement dans chaque trame. L'indice du maximum indique la valeur
estimative du temps de propagation pour chaque trame;
un histogramme de ces valeurs estimatives du temps de propagation, pondres par le niveau
de confiance mesur, est calcul. L'histogramme est ensuite liss par convolution avec un
noyau triangulaire symtrique d'une largeur de 1 ms;
l'indice du maximum dans l'histogramme, conjugu la valeur estimative du temps de
propagation prcdent, indique la valeur estimative du temps de propagation final;
le maximum de l'histogramme, divis par la somme de l'histogramme avant convolution
avec le noyau, indique un niveau de confiance compris entre 0 (aucune confiance) et 1
(confiance maximale).
L'alignement temporel fin permet d'obtenir une valeur de temps de propagation et un niveau de
confiance correspondant pour chaque occurrence d'mission de parole, compte tenu des variations du
temps de propagation pendant les priodes de silence. Connaissant les points o commence et o
prend fin chaque occurrence d'mission de parole, l'alignement temporel fin permet d'identifier le
temps de propagation de chaque trame dans le modle perceptif.
10.1.3.3 Coupure des occurrences d'mission de parole
On mesure les variations du temps de propagation pendant la conversation en coupant et en
ralignant les intervalles de temps de chaque occurrence d'mission de parole. On procde
l'alignement selon le temps de propagation de groupe (enveloppes) pour calculer la valeur estimative
du temps de propagation de chaque lment, puis on procde un alignement temporel fin pour
dterminer le temps de propagation et le niveau de confiance de chaque lment. On procde de
nouvelles coupures en diffrents points de chaque occurrence d'mission de parole et on identifie la
coupure qui produit le niveau de confiance le plus lev. Si l'on obtient ainsi un niveau de confiance

16 UIT-T P.862 (02/2001)
plus lev que par l'alignement sans coupures, et que les deux parties ont des temps de propagation
sensiblement diffrents, l'occurrence d'mission de parole est divise en consquence. L'essai est
appliqu de faon rcursive chaque partie, aprs coupure, pour mesurer de nouvelles variations du
temps de propagation.
Cette manire de procder permet de tenir compte des variations du temps de propagation tant
pendant la conversation que pendant les silences et de calculer le temps de propagation par intervalle
de temps (d
i
) ainsi que les chantillons adapts de dbut et de fin. Le nombre d'intervalles de temps
est dtermin par le nombre de variations du temps de propagation.
10.1.3.4 Ralignement perceptif
Aprs que le modle perceptif a t appliqu, on identifie les sections qui prsentent une perturbation
trs importante (suprieure une valeur de seuil donne) et on les raligne par corrlation croise.
Cette opration amliore la prcision du modle pour un petit nombre de fichiers difficiles aligner
dans lesquels le processus d'alignement temporel prcdent n'a pas permis d'identifier correctement
les variations du temps de propagation. Les modalits d'implmentation de cette procdure de
ralignement sont dcrites au 10.2.13.
10.2 Modle perceptif (Figures 4a et 4b)
Le modle perceptif d'valuation PESQ est utilis pour calculer une distance entre le signal vocal
initial et le signal vocal dgrad (note d'valuation PESQ). Comme indiqu au paragraphe 7, cette
opration doit passer par une fonction monotone pour obtenir une prvision de la note MOS
subjective pour un essai subjectif donn. La note d'valuation PESQ est applique une chelle de
type MOS, sous la forme d'un numro unique compris entre 0,5 et 4,5, bien que dans la plupart des
cas le signal de sortie soit compris entre 1,0 et 4,5, ce qui correspond l'amplitude normale de
valeurs MOS observes dans une exprience de qualit d'coute ACR.
10.2.1 Prcalcul de rglages de constantes
Certaines valeurs et fonctions de constantes sont prcalcules. Pour celles d'entre elles qui dpendent
de la frquence d'chantillonnage, les versions correspondant aux frquences d'chantillonnage de
8 kHz et de 16 kHz sont enregistres dans le programme.
10.2.1.1 Dpendance de la taille de la fentre FFT l'gard de la frquence d'chantillonnage
(8 ou 16 kHz)
Au cours de l'valuation PESQ, on applique les signaux temporels au domaine des frquences
temporelles en utilisant une transforme rapide de Fourier (FFT) avec une fentre Hanning d'une
taille de 32 ms. Cela reprsente, pour la frquence de 8 kHz, 256 chantillons par fentre et, pour la
frquence de 16 kHz, 512 chantillons par fentre, avec un taux de chevauchement des trames
adjacentes de 50%.
10.2.1.2 Seuil d'audibilit absolu
On procde l'interpolation du seuil d'audibilit absolu P
0
(f ) pour obtenir les valeurs au centre des
bandes de Bark qui sont utilises. Ces valeurs sont mises en mmoire et utilises dans la formule de
sonie de Zwicker.
10.2.1.3 Facteur d'chelonnement de la puissance
La transforme FFT produit une constante de gain arbitraire aux fins de l'analyse temps-frquence.
Cette constante est calcule pour une onde sinusodale d'une frquence de 1000 Hz avec une
amplitude de 29,54 (40 dB SPL) transpose dans le domaine frquentiel au moyen d'une transforme
FFT fentre sur 32 ms. On assure ensuite la conversion de l'axe des frquences (discrtes) une
chelle de Bark modifie par segmentation des bandes FFT. L'amplitude de crte des frquences
spectrales segmentes pour la conversion l'chelle des frquences de Bark (appele la "densit de

UIT-T P.862 (02/2001) 17
puissance fondamentale") peut tre de 10 000 (40 dB SPL). Cette valeur est obtenue par une
post-multiplication avec une constante, le facteur d'chelonnement de puissance S
p
.
10.2.1.4 Facteur d'chelonnement en sonie
La mme tonalit de rfrence de 40 dB SPL est utilise pour talonner l'chelle de sonie
psycho-acoustique (en sones). Aprs segmentation des frquences pour la conversion l'chelle de
Bark modifie, on soumet l'axe de l'intensit une prdistorsion pour le convertir l'chelle de sonie
selon la loi de Zwicker, d'aprs le seuil d'audibilit absolu. La valeur entire de la densit de sonie
sur l'chelle de frquences de Bark, en cas d'utilisation d'une tonalit d'talonnage de 1000 Hz et de
40 dB SPL, doit tre de 1 sone. Cette valeur est obtenue par une post-multiplication avec une
constante, le facteur d'chelonnement de la sonie S
l
.
10.2.2 Filtrage la rception du systme IRS
Comme indiqu au 10.1.2, on part du principe que les essais d'coute ont t effectus en utilisant
une caractristique de rception du systme IRS ou du systme IRS modifi dans le combin. Le
filtrage qu'il est ncessaire d'appliquer aux signaux vocaux est dj effectu lors du prtraitement.
10.2.3 Calcul de l'intervalle de temps de parole active
Si le fichier des signaux vocaux initial et dgrad commence ou prend fin par des intervalles de
silence importants, cela peut avoir une incidence sur le calcul de certaines valeurs de distorsion
moyenne dans les fichiers. On procde donc une estimation des priodes de silence au dbut et la
fin de ces fichiers. La somme des valeurs de cinq chantillons absolus successifs entre le dbut et la
fin du fichier du signal vocal initial doit tre suprieure 500 pour que cette position soit considre
comme le dbut ou la fin de l'intervalle actif. L'intervalle entre ces deux instants est dfini comme
l'intervalle de temps de parole active. Pour rduire les cycles de calcul ou l'encombrement en
mmoire, on peut limiter certains calculs l'intervalle actif.
10.2.4 Transforme rapide de Fourier court terme
L'oreille humaine opre une transformation temps-frquence. Dans une valuation PESQ, cette
transformation est mise en uvre au moyen d'une transforme FFT court terme fentre 32 ms.
Le chevauchement entre les fentres (trames) temporelles successives est de 50%. Les spectres de
puissance la somme des parties relle et imaginaire leves au carr des lments FFT complexes
sont enregistrs sparment dans chacun des ensembles de valeurs relles pour le signal initial et
pour le signal dgrad. L'information de phase figurant dans une fentre de Hanning unique est mise
au rebut pendant l'valuation PESQ et tous les calculs sont fonds sur les seules reprsentations des
puissances PX
WIRSS
(f)
n
et PY
WIRSS
(f)
n
.
Les points de dpart des fentres dans le signal dgrad sont dcals par rapport au temps de
propagation. L'axe des temps du signal vocal initial est laiss tel quel. Si le temps de propagation
augmente, certains lments du signal dgrad chappent tout traitement; si le temps de
propagation diminue, certains lments sont traits deux fois.
10.2.5 Calcul des densits de puissance fondamentale
Comme il ressort de l'chelle de Bark, le systme auditif humain a une rsolution plus fine aux
basses frquences qu'aux frquences leves. En application de ce principe, on segmente les
bandes FFT et on additionne les puissances correspondantes de ces bandes en normalisant les
lments somms. La fonction de prdistorsion qui tablit une correspondance entre l'chelle des
frquences en Hertz et l'chelle fondamentale en Bark ne suit pas exactement les valeurs indiques
dans la littrature. Les signaux produits par cette fonction sont connus comme tant les densits de
puissance fondamentale PPX
WIRSS
(f)
n
et PPY
WIRSS
(f)
n
.

18 UIT-T P.862 (02/2001)
10.2.6 Compensation partielle de la densit de puissance fondamentale initiale pour
l'galisation de la fonction de transfert
Pour les besoins du filtrage dans le systme soumis l'essai, on calcule la valeur moyenne dans le
temps du spectre de puissance des densits de puissance fondamentale du signal initial et du signal
dgrad. Cette valeur moyenne est dtermine pour les trames de parole active n'utilisant que des
cellules temps-frquence dont la puissance est suprieure de plus de 1 000 fois au seuil d'audibilit
absolu. Pour chaque segment de Bark modifi, on calcule un facteur de compensation partielle
d'aprs le rapport du spectre du signal dgrad au spectre du signal initial. La compensation
maximale n'est jamais suprieure 20 dB. On multiplie ensuite la densit de puissance fondamentale
initiale PPX
WIRSS
(f)
n
de chaque trame n par ce facteur de compensation partielle pour galiser le
signal initial et le signal dgrad. On obtient ainsi la densit de puissance fondamentale initiale
PPY'
WIRSS
(f)
n
filtre en sens inverse.
On recourt cette compensation partielle du fait qu'un filtrage rigoureux peut tre gnant pour la
personne qui coute. La compensation porte sur le signal initial du fait que le signal dgrad est
soumis l'apprciation des sujets dans une exprience ACR.
10.2.7 Compensation partielle de la densit de puissance fondamentale soumise distorsion
pour les variations de gain dans le temps entre le signal dgrad et le signal initial
Les variations de gain de courte dure sont partiellement compenses par le traitement des densits
de puissance fondamentale trame par trame. Pour les densits de puissance fondamentale du signal
initial et du signal dgrad, on calcule dans chaque trame n la somme de toutes les valeurs
suprieures au seuil d'audibilit absolu. On calcule le rapport de la puissance dans les fichiers du
signal initial et du signal dgrad, dans les limites de [3 10
4
, 5]. Un filtre passe-bas de premier
ordre (sur l'axe des temps) est appliqu ce rapport. On multiplie ensuite par ce rapport, dans chaque
trame n, la densit de puissance fondamentale soumise distorsion, ce qui permet d'obtenir la densit
de puissance fondamentale soumise distorsion avec compensation partielle de gain PPY'
WIRSS
(f)
n
.
10.2.8 Calcul des densits de sonie
A l'issue de la compensation partielle pour le filtrage et les variations de gain de courte dure, on
transforme les densits de puissance fondamentale du signal initial et du signal dgrad en une
chelle de sonie (en sones) en appliquant la loi de Zwicker [7].
( )
( ) ( )
( ) (
(

|
|
.
|

\
|
+ |
.
|

\
|
=

1
'
5 , 0 5 , 0
5 , 0
0
0
f P
f PPX f P
S f LX
n WIRSS
l n

o P
0
(f) est le seuil absolu et S
l
est le facteur d'chelonnement en sonie (10.2.1.4).
Au-dessus de 4 Bark, la puissance de Zwicker,

, est de 0,23, ce qui correspond la valeur indique


dans la littrature. Au-dessous de 4 Bark, on accrot lgrement la puissance de Zwicker pour tenir
compte de l'effet dit de recrutement. On appelle densits de sonie les ensembles bidimensionnels
LX(f)
n
et LY(f)
n
ainsi obtenus.
10.2.9 Calcul de la densit de perturbation
On calcule la diffrence de signe entre la densit de sonie du signal dgrad et la densit de sonie du
signal initial. Quand cette diffrence est positive, cela indique que des lments tels que le bruit ont
t ajouts. Quand cette diffrence est ngative, cela indique que des lments du signal initial ont
t omis. On appelle cet ensemble de diffrences la densit de perturbation brute.
On calcule la valeur minimale de la densit de sonie du signal initial et du signal dgrad pour
chaque cellule de frquence temporelle et on multiplie par 0,25 les valeurs minimales ainsi obtenues.

UIT-T P.862 (02/2001) 19
On appelle ensemble de masque l'ensemble bidirectionnel correspondant. On applique ensuite
chaque cellule temps-frquence les rgles suivantes:
Si la densit de perturbation brute est positive et suprieure la valeur de masque, on
soustrait celle-ci de la perturbation brute.
Si la densit de perturbation brute se maintient entre le plus et le moins de la valeur de
masque, on met la densit de perturbation zro.
Si la densit de perturbation brute est infrieure au moins de la valeur de masque, on ajoute
celle-ci la densit de perturbation brute.
Ces rgles ont pour effet de ramener vers zro les densits de perturbation brute, ce qui correspond
une zone de temps mort avant que les cellules temps-frquence soient effectivement perues comme
tant dformes. Ainsi s'opre la modlisation du traitement des petites diffrences inaudibles en
prsence de signaux ayant une valeur leve de sonie (masquage) dans chaque cellule temps-
frquence. Il en rsulte une densit de perturbation en fonction du temps (nombre de fentres n) et de
la frquence, D(f)
n
.
10.2.10 Multiplication cellule par cellule avec un facteur dasymtrie
L'effet d'asymtrie est d au fait que lorsqu'un codec produit une distorsion du signal d'entre, il sera
gnralement trs difficile d'introduire une nouvelle composante temps-frquence qui s'intgre dans
le signal d'entre, ce qui aura pour effet de dcomposer le signal de sortie en deux phnomnes
perceptifs diffrents, le signal d'entre et la distorsion, d'o une distorsion clairement audible [2].
Lorsque le codec carte une composante temps-frquence, le signal de sortie produit ne peut tre
dcompos de la mme manire et la distorsion est moins indsirable. On modlise cet effet en
calculant la densit de perturbation asymtrique DA(f)
n
par trame et en multipliant la densit de
perturbation D(f)
n
par un facteur d'asymtrie. Ce facteur d'asymtrie est gal au rapport des densits
de puissance fondamentale du signal dgrad et du signal initial levs la puissance de 1,2. S'il est
infrieur 3, le facteur d'asymtrie est mis zro. S'il est suprieur 12, on l'crte cette valeur.
Ainsi, seules demeurent les cellules temps-frquence, sous forme de valeurs non nulles, pour
lesquelles la densit de puissance fondamentale du signal dgrad est suprieure la densit de
puissance fondamentale du signal initial.
10.2.11 Cumul des densits de perturbation par rapport la frquence et accentuation des
parties du signal initial ayant une faible valeur de sonie
La densit de perturbation D(f)
n
et la densit de perturbation asymtrique DA(f)
n
sont intgres
(sommes) le long de l'axe des frquences au moyen de deux valeurs d'talonnage Lp diffrentes et
d'une pondration applique aux trames ayant une faible valeur de sonie.
( ) ( )
3
... , 1
3

=
=
Bark de bandes de nombre f
f n n n
W f D M D
( ) ( )

=
=
Bark de bandes de nombre f
f n n n
W f DA M DA
... , 1

o M
n
est un facteur de multiplication, 1/(puissance de la trame initiale plus constante)
0,04
,
reprsente une accentuation des perturbations survenant pendant les silences dans le fragment vocal
du signal initial, et W
f
une srie de constantes proportionnelles la largeur des segments de Bark
modifis. Aprs cette multiplication, les valeurs de perturbation de trame sont limites un
maximum de 45. Ces valeurs cumules, D
n
et DA
n
, sont appeles les perturbations de trame.

20 UIT-T P.862 (02/2001)
10.2.12 Annulation de la perturbation pour les trames durant lesquelles le temps de
propagation a subi une diminution importante
Si le signal dgrad subit une diminution du temps de propagation suprieure 16 ms (une
demi-fentre) la stratgie de rptition vise au 10.2.4 est modifie. Il s'est avr prfrable de ne pas
tenir compte des perturbations de trame en pareil cas dans le calcul de la qualit objective de la
parole. On annule donc les perturbations de trame en pareille situation. Les perturbations de trame
obtenues sont appeles D'
n
et DA'
n
.
10.2.13 Ralignement des intervalles errons
On appelle intervalles errons les trames conscutives qui prsentent une perturbation suprieure
un certain seuil. Dans une minorit de cas, la mesure objective prvoit de fortes distorsions sur un
nombre minimum de trames errones, imputables une mauvaise estimation des temps de
propagation observs lors du prtraitement. Pour ces intervalles dits errons, on estime une nouvelle
valeur de temps de propagation en maximisant la corrlation croise entre le signal initial absolu et
le signal dgrad absolu, ajusts d'aprs les temps de propagation observs lors du prtraitement.
Lorsque la corrlation croise maximale est infrieure un certain seuil, on en conclut que
l'intervalle rend bien compte (bruit pour bruit) de la ralit et on en interrompt le traitement du fait
qu'il ne saurait plus tre considr comme tant erron. Dans le cas contraire, on recalcule la
perturbation pour les trames durant les intervalles errons et, si elle est infrieure, on substitue cette
perturbation la perturbation de trame initiale. On obtient ainsi les perturbations de trame finales
D''
n
et DA''
n
qui sont utilises pour calculer la qualit perue.
10.2.14 Cumul des valeurs de perturbation dans des intervalles de fraction de seconde
On cumule ensuite les valeurs de perturbation de trames et les valeurs de perturbation de trames
asymtriques dans des intervalles de fraction de seconde de 20 trames (compte tenu du
chevauchement des trames: 320 ms environ) en utilisant des valeurs d'talonnage L
6,
une valeur p
suprieure comme dans le cas du cumul sur toute la longueur du fichier vocal. Ces intervalles
prsentent aussi un chevauchement de 50% et aucune fonction de fentre n'est utilise.
10.2.15 Cumul des valeurs de perturbation pendant la dure du signal vocal (10 secondes
environ), incluant un facteur de rcentet
On cumule prsent les valeurs de perturbation de fraction de seconde et les valeurs de perturbation
de fraction de seconde asymtrique pendant l'intervalle actif des fichiers vocaux (les trames
correspondantes) en utilisant les valeurs d'talonnage L
2
. La valeur leve de p pour le cumul dans
les intervalles de fraction de seconde par rapport la valeur infrieure de p pour le cumul dans le
fichier vocal est due au fait qu'en cas de distorsion de parties de fractions de seconde, la fraction de
seconde concerne perd toute signification, alors qu'en cas de distorsion de la premire phrase d'un
fichier vocal la qualit des autres phrases reste intacte.
10.2.16 Calcul de la note d'valuation PESQ
La note d'valuation PESQ finale est une combinaison linaire de la valeur de perturbation moyenne
et de la valeur de perturbation asymtrique moyenne. La note d'valuation PESQ s'chelonne de 0,5
4,5, bien que dans la plupart des cas la valeur du signal de sortie soit une note de type MOS de la
qualit d'coute comprise entre 1,0 et 4,5, ce qui correspond l'amplitude normale des valeurs MOS
observes dans une exprience ACR.

UIT-T P.862 (02/2001) 21
Bibliographie
[1] BEERENDS (J.G.), STEMERDINK (J.A.): A Perceptual Speech-Quality Measure Based on
a Psychoacoustic Sound Representation, J. Audio Eng. Soc., Vol. 42, No. 3, pp. 115-123,
mars 1994.
[2] BEERENDS (J.G.): Modelling Cognitive Effects that Play a Role in the Perception of
Speech Quality, Speech Quality Assessment, Workshop papers, Bochum, pp. 1-9,
novembre 1994.
[3] BEERENDS (J.G.): Measuring the quality of speech and music codecs, an integrated
psychoacoustic approach, 98th AES Convention, pre-print No. 3945, 1995.
[4] HOLLIER (M.P.), HAWKSFORD (M.O.), GUARD (D.R.): Error activity and error entropy
as a measure of psychoacoustic significance in the perceptual domain, IEE Proceedings
Vision, Image and Signal Processing, 141 (3), 203-208, juin 1994.
[5] RIX (A.W.), REYNOLDS (R.), HOLLIER (M.P.): Perceptual measurement of end-to-end
speech quality over audio and packet-based networks, 106th AES Convention, pre-print
No. 4873, mai 1999.
[6] HOLLIER (M.P.), HAWKSFORD (M.O.), GUARD (D.R.): Characterisation of
communications systems using a speech-like test stimulus, Journal of the AES, 41 (12),
1008-1021, dcembre 1993.
[7] ZWICKER (E), FELDTKELLER (R.): Das Ohr als Nachrichtenempfnger, S. Hirzel
Verlag, Stuttgart 1967.
ANNEXE A
Implmentation de rfrence de l'valuation PESQ et tests de conformit
Liste des fichiers fournis pour la mise en uvre de rfrence C-ANSI
La mise en uvre de rfrence C-ANSI de l'valuation PESQ est contenue dans les fichiers de texte
suivants, qui figurent dans le sous-rpertoire source du CD-ROM distribu:
dsp.c Procdures priodiques DSP de base
dsp.h Fichier d'en-tte pour dsp.c
pesq.h Fichier d'en-tte gnral
pesqdsp.c Procdures priodiques DSP PESQ
pesqio.c Fichiers d'entre/sortie
pesqmain.c Programme principal
pesqmod.c Modle PESQ de haut niveau
pesqpar.h Dfinitions du modle perceptif PESQ
La mise en uvre de rfrence C-ANSI, qui est fournie dans des fichiers distincts, fait partie
intgrante de la prsente Recommandation. En cas de divergences entre la description approfondie
figurant dans la prsente Recommandation et l'implmentation de rfrence C-ANSI, cette dernire
prvaudra.
Liste des fichiers fournis pour la validation de la conformit
Le processus de validation de la conformit dcrit ci-aprs fait rfrence aux fichiers suivants, qui
figurent dans le sous-rpertoire "conform" du CD-ROM distribu.

22 UIT-T P.862 (02/2001)
supp23.txt Paires de fichiers et notes PESQ pour la validation de la conformit par
rapport au Supplment 23
supp23.bat Script batch destin faciliter la validation par rapport au Supplment 23
voipref.txt Paires de fichiers et notes PESQ pour la validation de la conformit par
rapport la variation du temps de propagation
voipref.bat Script batch destin faciliter la validation par rapport la variation du
temps de propagation
or105.wav or109.wav or114.wav or129.wav or134.wav or137.wav
or145.wav or149.wav or152.wav or154.wav or155.wav or161.wav
or164.wav or166.wav or170.wav or179.wav or221.wav or229.wav
or246.wav or272.wav dg105.wav dg109.wav dg114.wav dg129.wav
dg134.wav dg137.wav dg145.wav dg149.wav dg152.wav dg154.wav
dg155.wav dg161.wav dg164.wav dg166.wav dg170.wav dg179.wav
dg221.wav dg229.wav dg246.wav dg272.wav
u_am1s01.wav u_am1s02.wav u_am1s03.wav
u_am1s01b1c1.wav u_am1s01b1c7.wav u_am1s02b1c9.wav
u_am1s01b1c15.wav u_am1s03b1c16.wav u_am1s03b1c18.wav
u_am1s01b2c1.wav u_am1s02b2c4.wav u_am1s02b2c5.wav
u_am1s03b2c5.wav u_am1s03b2c6.wav u_am1s03b2c7.wav
u_am1s01b2c8.wav u_am1s03b2c11.wav u_am1s02b2c14.wav
u_af1s01b2c16.wav u_af1s03b2c16.wav u_af1s02b2c17.wav
u_af1s03b2c17.wav u_am1s03b2c18.wav u_af1s01.wav
u_af1s02.wav u_af1s03.wav
Fichiers de signaux vocaux fournis pour la validation par rapport la variation du temps de
propagation.
Ces fichiers de signaux vocaux sont de format Wave (modulation MIC linaire 16 bits, classement
des octets de type Intel, en-tte de 44 octets) avec un taux d'chantillonnage de 8 kHz.
Validation de la conformit
La conformit d'une implmentation de l'valuation PESQ avec la prsente Recommandation doit
tre valide de la faon suivante. Le processus de validation est fond sur une comparaison entre
l'implmentation de rfrence (code C-ANSI dcrit dans la prsente annexe) et l'implmentation par
l'utilisateur de l'valuation PESQ. L'utilisateur peut ainsi procder une comparaison dtaille des
diffrentes variables en examinant les diffrences tous les niveaux requis.
Pour tre considre comme conforme la prsente Recommandation, une implmentation doit tre
soumise deux essais obligatoires consistant comparer la note PESQ celle qui est donne par
l'implmentation de rfrence dans les bases de donnes suivantes:
Supplment 23 aux Recommandations UIT-T de la srie P (1736 paires de fichiers);
conditions de variation du temps de propagation (40 paires de fichiers).
Comparaison par rapport au Supplment 23 aux Recommandations UIT-T de la srie P
Dans cette comparaison, la totalit des expriences (au nombre de 10) effectues selon le
Supplment 23 aux Recommandations de la srie P sont utilises fichier par fichier. Les noms du
fichier initial et du fichier dgrad, ainsi que la note PESQ donne par l'implmentation de rfrence,
sont indiqus dans le fichier supp23.txt qui est fourni avec le code C-ANSI PESQ de l'UIT.
Lorsqu'une implmentation est soumise cet essai, le rsultat est positif lorsque la diffrence absolue
entre la note PESQ et la note donne par l'implmentation de rfrence est infrieure 0,05 pour
tous les fichiers.
Cet essai de conformit est obligatoire pour toutes les implmentations.

UIT-T P.862 (02/2001) 23
Le Supplment 23 aux Recommandations de la srie P peut tre obtenu sparment auprs de l'UIT.
Comparaison par rapport aux fichiers des temps de propagation variables
Une base de donnes varie a t labore partir de 40 conditions (paires de fichiers) provenant de
deux essais subjectifs visant des connexions VoIP relles et simules, se caractrisant par un temps
de propagation variable. Vingt-trois de ces paires de fichiers dclenchent galement le processus de
ralignement des intervalles errons. Les noms du fichier initial et du fichier dgrad pour chaque
paire de fichiers et la note PESQ donne par l'implmentation de rfrence sont indiqus dans le
fichier voipref.txt qui est fourni avec le code C-ANSI.
Lorsqu'une implmentation est soumise cet essai, le rsultat est positif lorsque la diffrence absolue
entre la note PESQ et celle qui est donne par l'implmentation de rfrence est infrieure 0,05
pour 39 des 40 paires de fichiers. Une seule paire de fichiers peut prsenter une diffrence absolue
en matire de note PESQ infrieure 0,5. Il peut s'agir de n'importe laquelle des 40 paires de
fichiers.
Cet essai de conformit est obligatoire pour toutes les implmentations.
Comparaisons additionnelles
Un autre essai est disponible afin d'empcher les ralisateurs d'adapter un algorithme pour assurer la
conformit avec les prescriptions spcifies pour les fichiers dcrits ci-dessus. Une implmentation
de l'valuation PESQ conforme la prsente Recommandation doit, au moins dans 95% des cas,
donner une note dont la diffrence avec la note PESQ donne par l'implmentation de rfrence
C-ANSI doit tre infrieure 0,05.




Imprim en Suisse
Genve, 2001
SRIES DES RECOMMANDATIONS UIT-T
Srie A Organisation du travail de l'UIT-T
Srie B Moyens d'expression: dfinitions, symboles, classification
Srie C Statistiques gnrales des tlcommunications
Srie D Principes gnraux de tarification
Srie E Exploitation gnrale du rseau, service tlphonique, exploitation des services et facteurs
humains
Srie F Services de tlcommunication non tlphoniques
Srie G Systmes et supports de transmission, systmes et rseaux numriques
Srie H Systmes audiovisuels et multimdias
Srie I Rseau numrique intgration de services
Srie J Rseaux cbls et transmission des signaux radiophoniques, tlvisuels et autres signaux
multimdias
Srie K Protection contre les perturbations
Srie L Construction, installation et protection des cbles et autres lments des installations extrieures
Srie M RGT et maintenance des rseaux: systmes de transmission, circuits tlphoniques, tlgraphie,
tlcopie et circuits lous internationaux
Srie N Maintenance: circuits internationaux de transmission radiophonique et tlvisuelle
Srie O Spcifications des appareils de mesure
Srie P Qualit de transmission tlphonique, installations tlphoniques et rseaux locaux
Srie Q Commutation et signalisation
Srie R Transmission tlgraphique
Srie S Equipements terminaux de tlgraphie
Srie T Terminaux des services tlmatiques
Srie U Commutation tlgraphique
Srie V Communications de donnes sur le rseau tlphonique
Srie X Rseaux de donnes et communication entre systmes ouverts
Srie Y Infrastructure mondiale de l'information et protocole Internet
Srie Z Langages et aspects gnraux logiciels des systmes de tlcommunication


*20783*