Vous êtes sur la page 1sur 43

Transport en mode paquet

• Contraintes de transport
– Délai de transit ou latence <= 150ms
– Gigue <= 100ms
– Écho <= 50ms
– Perte de paquets <= 10%

• Problématique
– Transport en temps réel

– Réseau de paquets sans garantie


• de bande passante,
• Délai (Gigue)
• et perte de paquets
ToIP : Mise en oeuvre

Signalisation QoS

Réseau IP
VoIP : Mise en oeuvre

débit

Application

Présentation

H= ensemble Session
de fonctions
à fournir par
le système Transport

Réseau
Liaison
Physique
VoIP et BP

Pourquoi la voix est adaptée aux réseaux de données ?

22%
56% Silence Composantes
Répétitives

22%
composantes
essentielles
Codage/Compression

• Coding/voice compression sont les premiers facteurs


affectant potentiellement la qualité de la voix.
– Le codage refère à tout le processus de conversion analog/digital
• Pulse Code Modulation or PCM est le standard de représentation de la voix par un flux de 64Kbit.

– Compression est la méthode utilisée pour la reduction de la


quantité d’info numérique < 64K.

• La succession des opérations de conversion A/N affecte


négativement la qualité de transport du signal d’origine.
Codage de la Voix

Passage analogique / numérique

110
101
100
011
101110101...
010
001
000

Signal analogique Echantillonage Quantification/codage Signal numérique

Shanon : Fe ³ 2.Fmax
Codage par échantillonnage

• Principe général
– Echantillonnage du signal analogique à intervalle de temps
régulier

– Codage de l’intensité de l’échantillon en N bits

• Le silence consomme la même bande passante !!


Traitement de la voix

• Bande passante 40Hz à 4kHz


• Théorème de Nyquist (ou Shannon):
– Echantilloner au double de la fréquence pour pouvoir reconstituer un signal de
bonne qualité: 8kHZ
– 1 échantillon tous les 125 microsec (1/8000)

• Codage MIC (Modulation par Impulsion et Codage) (PCM: Pulse


Code Modulation): Norme G711
– 8 bits par la loi A (EMEA): 8bits à 8000Hz = 64 kbit/s
– 7 bits par la loi mu (US, Japon): 7bits à 8000Hz = 56 kbit/s
Traitement de la parole

• L’objectif de toute application du domaine du traitement de la parole est de


reproduire l’un ou l’autre des blocs de cette représentation, par un système
spécifique.
• La modélisation a pour but de simuler (ou synthétiser) la parole.
• Les techniques de reconnaissance vocales cherchent à remplacer le prétraitement
sensoriel, c’est à dire à pouvoir reconnaître des mots (enlever le bruit=filtrer)
découper les mot, éventuellement reconnaître les voyelles, les consonnes, i.e. les
phonèmes.
• C’est une analyse syntaxique (=correcteur d’orthographe de Word dans le domaine
de l’écrit).
• Les techniques encore plus évoluées utilisant l’intelligence artificielle, cherchent à
interpréter (=analyse sémantique, reconnaissance de phrases, notion de SENS,
pouvant permettre une prise de décision ou un apprentissage) .
Codage/compression

PCM Coder Voice coding


Voice Activity Detection
G711
64kbps

G729
8kbps

• Numériser le signal puis Réduire le débit en conservant une bonne qualité de la voix
• Types de codecs

– codage MIC: G711

– codage par synthèse : basé sur la construction d’un modèle de la voix qui permet de reconstituer
des échantillons de voix proches des originaux: ex G729: CELP (Code Excited Linear Predictive)
Méthode MIC ou PCM

Digital Signal Processor

Voila... Speech Compression

DSP
Codec
Loi A/µ

Initialement utilisé par les militaires


pour les besoins de sécurité
Codage par échantillonnage

• PCM (Pulse Code Modulation) = G.711


– Numérisation classique à 64 Kbit/s en Europe ou 56 Kbit/s en
Amérique du Nord.
– 1 échantillon codé sur 8 bits / 125 ms
– Débit constant de 64 Kbit/s

• ADPCM (Adaptative PCM) = G.726


– D’abord PCM
– Travailler sur les différences entre les échantillons plutôt que
d’effectuer un codage absolu,
– Différence entre échantillons successifs codé sur 4 ou 2 bits
– Débit constant de 32 Kbit/s ou 16 Kbit/s
Vulgarisation

• E1 = 128--à nbit = 7bit


• E2 = 129-à nbit = 8bit

• E1 + E2 -à 15bits

• E1 = 128--à nbit = 7bit


• E2 = 129
– E2-E1 = 1--à 1bit
– E1 + E2 -à 8bits

– E2=127
– E2-E1 =-1
Méthode CELP

Techniques plus élaborées

Utilisation des caractéristiques du système vocale et de l’ouie

1. Analyse (2,5 à 30 ms) la voix


– Déterminer les coefficients du signal d’excitation d’un filtre

– Modélisation à cours terme du signal

2. Synthèse du signal voix à partir des quatre derniers échantillons (vecteur)

3. Comparaison du vecteur obtenu à une table pré-établie de vecteurs (algorithme levinson,…)

4. Seul l’indexe d’entrée à la table et l’amplitude sont envoyés au récepteur

5. Le récepteur reconstitue le signal d’origine à partir du vecteur et d’une série de filtres


modélisant le conduit vocal de l’interlocuteur
Cinématique du CELP

PCM Encoder PCM


Filtering 11100100 Decoder
Sampling Sample
Quantizing Frames
Encoding

VocalCords
Throat
Nose Model 11100100 Model
Mouth Parameters Parameters
Parameters

Human
Speech Model

Analysis Synthesis

Performants : faible retard du à l’acquisition des données et à la prédiction


Traitement des silences : ACELP

• Les normes G.72X ne traitent pas les silences sauf G.729b

• Les normes ACELP sont les plus utilisées


– Qualité du son restitué

– Faible puissance calculatoire (MIPS : million d’instructions par seconde)

• D’autres techniques permettent de descendre au dessous de 8kbps


– Propriétaires
• Homogénéisation des équipements sur toute la chaine
Voice Activity Detection – G.729b

B/W gain

- 31 dbm

Pas de trafic
voix envoyé

Voice
Activity Hang Timer
(niveau de (200 ms)
puissance)

- 54 dbm

voix Silence voix

temps
Hang Timer est utilisé par la fonction VAD pour décider est ce que c’est un silence ou non
Traitement des silences

Bruit d’ambiance
• Niveau de puissance
• Spectre de fréquence

Voix Silence voix

Recréer l’ambiance d’une com téléphonique


Signaler au destinataire le silence
pour générer le bruit de fond aléatoire

Voice Activity Detection


• detection du silence
• Ne pas transmettre de silence
Traitement des silences

Paquet Spécifique

paquet
Codage et compression

Les différentes techniques de codage

- Temporelles : débit entre 16 et 64 kbps


préserve la forme de l’onde (ex : famille PCM)
1
PCM (Pulse Code Modulation) = G.711
ADPCM (Adaptative PCM) = G.726

- Par analyse et synthèse : débit entre 5 et 16 kbps


technique prédictive
2 analyse des silences, répétitions (ex : famille CELP)
CELP (Code-Excited Linear-Predictive) = G.728
ACELP (Adaptative CELP) = G.729

- Paramétriques : débit entre 2,4 et 4,8 kbps


3 modélisation simplifiée du signal (ex : LPC)
peu utilisée
Critères de choix d’un Codec
Critères de choix d’un Codec

débit
Le débit

• La plupart des vocoder génèrent un débit constant indépendant des


caractéristiques du signal entrant.

• En revanche nous pouvons mettre en place des techniques permettant la


suppression des silences et la création de bruit de fond de manière à réduire
encore le débit utilisé.

• Le principe simplifié consiste à transmettre avec un débit plus faible les


silences détectés à l’aide d’un filtre de type VAD (Voice Activity Detection)
et à régénérer, à l’autre extrémité, un bruit de fond pendant ces silences
(comfort noise)
Critères de choix d’un Codec

• Parmi les nombreux codeurs propriétaires du marché, citons notamment les suivants :
– StreamWorks à 8,5 Kbit/s ;
– VoxWare à 2,4 Kbit/s avec le codeur RT24 ;

– Microsoft à 5,3 Kbit/s avec une utilisation partielle de la norme G.723 ;

– VocalTec à 7,7 Kbit/s.


Critères de choix d’un Codec

Compléxité
/
Délai

débit
Complexité de l’algorithmique

• Les algorithmes d’encodage et de compression nécessitent


de nombreuses opérations, de ce fait les vocoder sont très
souvent directement intégrés dans des composants
matériels de type DSP ou ASIC.
• La quantité d’instructions à effectuer est fortement
dépendante de la complexité de l’algorithme et du nombre
de phases de calcul :
Méthode de compression MIPS
CSA CELP (G.729a) 10 pour 8kbps
CSA CELP (G.729) 20 pour 8kbps
G.723.1 14 à 20 pour 5,3/6,3 Kbps
Le délai

• l’ensemble des algorithmes utilisés dans les phases d’encodage et de décodage


engendre du délai.

• On considère que le délai acceptable en téléphonie ne doit pas excéder 300ms


(A/R) de bout en bout, mais il est coutume de demander une garantie de service en
deçà de 150ms.

• Lors de l’utilisation de système mettant en communication plus de 2 intervenants


(pont de conférences par exemple), le système doit garantir un délai jusqu’à
l’utilisateur de moins de 100ms pour obtenir un délai de bout en bout inférieur aux
200ms.
Le délai

Méthode de compression Délai (ms)


PCM (G.711) 0,75
ADPCM (G.726) 1
LD CELP (G.728) 3-5
CSA CELP (G.729) 10
CSA CELP (G.729a) 10
Critères de choix d’un Codec

délai

débit

MOS
Critères de choix d’un Codec

• Elément primordial lorsque l’on parle de transport de la voix, la qualité est


souvent le facteur oublié au dépend du débit utilisé.

• L’impossibilité technique de contrôler la qualité impose des mesures basées


sur des écoutes ayant pour objet de classifier les différents algorithmes utilisés.

• On constate souvent que le délai de transmission influe pour une grande part
dans la qualité ressentie, néanmoins, tous les algorithmes énoncés
précédemment obtiennent des notes entre 3.7 (G.723.1) et 4.2 (G.711) sur
une échelle de 1 à 5, 5 étant considéré comme excellent.
Critères de choix d’un Codec

• MOS (Mean Opinion Score)


– Mauvais = 1 et excellent = 5

– Résultat dépend de la séquence audio utilisée

• PSQM (Perceptual Speech Quality Measurement)


– ITU-T P.861

– Mauvais = 1 et excellent = 5
Mesure Mean Opinion Score

Rating Speech Quality Level of Distortion


5 Excellent Imperceptible
4 Good Juste perceptible mais non nuisible
3 Fair Perceptible et faiblement nuisible
2 Poor Nuisible mais pas d’objection
1 Unsatisfactory trés nuisible avec objection
Mean Opinion Score

• MOS is the mean of the numerical scores given by the subjects and is calculated as follows:

• Where NE, NG, NF, NP, NU and are the numbers of the subjects who have rated the test
conditions excellent‚ good‚ fair‚ poor and unsatisfactory‚ respectively; and N is the total
number of subjects: N= NE + NG + NF + NP + NU
Mean Opinion Score

• %GoB‚ which reads “Percent Good or Better‚” is the


percentage of the subjects who rate the test
conditions either good or excellent‚ that is‚ better
than “good‚” and is calculated as follows:
Mean Opinion Score

• %PoW‚ which reads “Percent Poor or Worse‚” is the


percentage of the subjects who rate the test
conditions either poor or unsatisfactory‚ that is‚ worse
than poor‚ and is calculated as follows:
Mean Opinion Score

The results of a subjective testing performed with 100 subjects are as


follows:
Excellent 30
Good 20
Fair 10
Poor 20
Unsatisfactory 20

Determine the MOS‚ %GoB and %PoW.


Mean Opinion Score

The results of a subjective testing performed with 100 subjects are as follows:

Excellent 30
Good 20
Fair 10
Poor 20
Unsatisfactory 20

Determine the MOS‚ %GoB and %PoW.


Mean Opinion Score

Les mesures MOS sont trés subjectives


MAIS sont
– off-line
– lents
– couteux
– Différents labs/testeurs donnent differents resultats
Mesure Mean Opinion Score

• Des algorithmes automatiques ont donc été spécifiés pour permettre


l’évaluation des réseaux et obtenir des notes en corrélation avec le MOS
– P.800.1, P.863 et J.247
• L’ITU recommande à travers sa norme P861 l’utilisation de la méthode :
• PSQM (Perceptual Speech Quality measurement ) ou PAMS (Perceptual
Analysis Measurement System), développé par British Telecom, qui fournit
également un score très corrélé au MOS
Critères de choix d’un Codec

délai

débit

MOS

Perte
Critères de choix

• Le taux de perte acceptable dépend


– Des couches supérieures
– Des performances du codec utilisé
• jusqu’à 20% pour G.711
– Se traduit par une voix hachée
» Perte < 2% => Bonne qualité de la voix
» Perte < 10% => Qualité moyenne
» Perte < 20% => Acceptable
• jusqu’à 1 à 2% pour G.729

• Au delà, les pertes affectent fortement l’auditivité


Critères de choix d’un Codec

coût
délai

débit

MOS

Perte
Choix d’un algorithme

• Chaque norme définie le fonctionnement du vocoder,


la résultante met en évidence 04 paramètres à prendre
en compte dans la sélection de l’algorithme :

– Débit
– Délai
– Qualité
– Perte

• Critère financier

Vous aimerez peut-être aussi