Vous êtes sur la page 1sur 38

CAVADORE Clment

PRADEILLES Christophe
Expos Couches Basses (A1)
Premier Trimestre
~
Transmission numrique de mdia sonores
DESS TNI
Administration & Scurit des Rseaux
2004/2005
Transmission numrique de mdia sonores
SOMMAIRE
I. Introduction : La transmission numrique de mdia sonores
a) Le besoin 3
b) Dfinition 3
c) Le pseudo-streaming et le streaming 3
d) La voix sur IP 4
e) La tlphonie IP 5
II. Fonctionnement gnral d'une transmission audio numrique
a) La phase d'mission 5
b) La phase de rception 6
III. Les diffrents types de diffusion
a) L'Unicast 8
b) Le Broadcast 9
c) Le Multicast 9
IV. Les diffrents protocoles utiliss
a) La problmatique 14
b) Qualit de Service (QoS) 15
c) Les diffrents protocoles 16
c-1) ISDN (RNIS) 14
c-2) ATM 19
c-3) TCP 20
c-4) UDP 20
c-5) RTP/RTCP 21
c-6) RTSP 24
c-7) RSVP 28
c-8) Protocoles et VoIP 29
c-9) H.323 30
c-10) SIP 32
c-11) MGCP 37
V. Conclusion 38
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 2
Transmission numrique de mdia sonores
I. Introduction : La transmission numrique de mdia sonores
a) Le besoin
Avec l'avnement de l'internet haut dbit, du multimdia, et la possibilit pour les foyers
d'acqurir des prix bon march un ordinateur connect l'internet, l'outil informatique est
devenu, aujourd'hui, beaucoup plus qu'une simple machine de calcul, de bureautique, ou de
recherche. Avec le dveloppement croissant des technologies de communication numrique est
n l'intrt d'utiliser le rseau Internet pour envoyer de l'audio et de la vido. L'ordinateur est de
nos jour un support multimdia comparable sur certains points un appareil Hi-Fi, ou une
tlvision.
Ce qui le dmarque d'un appareil Hi-Fi conventionnel, c'est sa capacit s'interconnecter de
multiple rseaux de par le monde, grce Internet, pour pouvoir rcuprer des donnes audio
numriques. Il est donc n naturellement un besoin de communication de mdias sonores,
besoin qui n'a cess d'voluer et de prendre forme, jusqu' aujourd'hui.
Le simple besoin d'interconnexion fiable de rseaux tlphoniques, est devenu besoin de
transfert de fichiers (audio) (MP3, ogg, etc...), puis il a volu jusqu' devenir LA priorit des
utilisateurs. Ces derniers tant de plus en plus dsireux de s'changer des donnes sonores (voix,
tlphonie numrique) ou encore d'couter de la musique (diffusion radio, etc...) le tout en
temps rel et moindre cot.
L'internet, ainsi que l'infrastructure qui compose le rseau existe, et fonctionne parfaitement
bien. Il devient donc intressant d'utiliser ce rseau, pour diffuser des mdias sonores. C'est ce
que nous allons dtailler maintenant.
b) Dfinition
Largement exploit de nos jours pour l'change (plus ou moins lgal) de fichiers audio, la
transmission de mdia sonore s'apparente soit un simple change de fichiers musicaux, soit
l'coute en temps rel d'une source numrique musicale (streaming). C'est sur ce deuxime point
que nos travaux ont eu lieu.
c) Le pseudo-streaming et le streaming
Le mot streaming vient de l'anglais stream , signifiant flot/flux .Streaming dsigne
d'une manire gnrale l'action de commencer couter ou visualiser un contenu multimdia
avant la fin de la transmission du fichier. Le streaming est utilis pour rendre accessible un flux
audio ou vido des utilisateurs distants. Cette technique permet la diffusion de mdias sonores
et/ou visuel en flux continu (sans interruption) et en temps rel (au moment o se passe
lvnement).
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 3
Transmission numrique de mdia sonores
Le pseudo streaming, ou tlchargement progressif permet l'utilisateur de lire un mdia alors
que le fichier est encore en cours de tlchargement. Avec le pseudo streaming, une copie du
fichier est conserv sur le disque de l'utilisateur, ce qui lui permettra de relire le mdia
ultrieurement. Le tlchargement progressif est galement appel streaming HTTP car les
logiciels serveur Web utilisant des protocoles standard (serveurs HTTP/FTP) peuvent
transmettre des fichiers tlchargement progressif. C'tait la mthode la plus utilise avant
1995, lorsque les autres protocoles spcifiques au stream n'existaient pas.
Il se diffrencie du vrai streaming qui permet la transmission de contenu en temps rel, (les
paquets formant ce protocole ont une contrainte temporelle car il n'y a pas de systme de
bufferisation , qui impliquerait qu'un dlai trop fort entre l'mission d'un paquet, et son
rendu entranerait la destruction du paquet, et l'interruption de la connexion). Le vrai
streaming tire parti des protocoles spciaux tel que RTP utiliss par les logiciels serveur de
mdias pour adapter la transmission la bande passante.
Le vrai streaming permet de parcourir, d'avancer et de revenir un point donn du contenu,
contrairement au tlchargement progressif, qui requiert de visionner le contenu du dbut la
fin.
Le streaming est une alternative utile si l'on ne veut pas avoir stocker le contenu d'un morceau
(par exemple, pour le cas d'une web radio ou d'une dmonstration de morceaux sur des sites
marchands...), car le droit de conserver une musique est interdit juridiquement parlant...
d) La voix sur IP
Elle reprsente le transport de la voix (numris par paquets), sur une infrastructure IP (Internet,
Rseau LAN priv, etc...), en appliquant le mme traitement ces paquets identifis VOIX
que celui appliqu sur les autres types de paquets identifis DONNEES .
La Voix sur IP est une transmission intgrale de la voix analogique entirement numrise en
mode paquets au format TCP/UDP.
Il ne faut pas confondre la Voix sur IP (transport de la voix sur IP), et la Tlphonie sur IP
(terminaux et solutions de tlphonie pour l'IP).
Faire basculer diffrents types de donnes sur un mme rseau permet avant tout de simplifier
son administration. En particulier, le principe de la VoIP (Voice Over IP) doit permettre de
faciliter le dveloppement d'applications utilisant la voix et d'autres types de donnes. Le
principal domaine concern est le collaboratif : vido confrence, messagerie unifie...
Comme toute innovation technologique qui se respecte, la VoIP doit simplifier le travail et faire
conomiser de l'argent. Les entreprises dpensent normment en communications
tlphoniques, or le prix des communications sur Internet est drisoire en comparaison. En
particulier, plus les interlocuteurs sont loigns, plus la diffrence de prix est intressante.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 4
Transmission numrique de mdia sonores
e) La tlphonie IP
Pour tirer profit du dveloppement dInternet pour le grand public, des socits ont dvelopp
des logiciels de " tlphonie IP ". Avec ces programmes, il est possible de transporter de la voix
entre deux ordinateurs et ainsi de communiquer. La seule diffrence avec la VoIP est que la
tlphonie IP gre la notion d'adressage, en analogie avec la notion de numro de tlphone, en
tlphonie conventionnelle. Bien que cela puisse paratre rvolutionnaire, cela est devenu
insuffisant. En effet, pour pouvoir tre viable, un tel rseau de "tlphonie IP " doit tre
interconnect avec le rseau tlphonique commut (RTC), le rseau de tlphonie analogique
classique.
La tlphonie IP n'est donc qu'une simple surcouche de la voix sur IP.
Le but de la tlphonie sur IP est de finaliser la convergence voix/donnes autour dun protocole
unique, IP (et IPv6 dans le futur). En effet, la tlphonie IP se base sur la mme architecture que
lInternet et utilise les mmes infrastructures. De plus en plus dentreprises sont quipes de
rseaux LAN (Local Area Network) et WAN (Wide Area Network), et peuvent donc tirer profit
de la voix sur IP moindre cot. En intgrant voix et donnes, la tlphonie IP simplifie
ladministration du rseau car tout est centralis dans un unique rseau. Elle procure aussi des
facilits pour le dveloppement dapplications utilisant de la voix et des donnes. En tlphonie,
tout est bas sur le matriel alors que la tlphonie IP tire avantage dune architecture base sur
du logiciel. De plus, la tlphonie sur IP utilise jusqu' dix fois moins de bande passante que la
tlphonie traditionnelle, selon les formats de compression utiliss (Codec).
II. Fonctionnement gnral d'une transmission audio numrique
Plusieurs traitement du signal audio sont ncessaires avant l'mission, et aprs la rception. Nous allons
survoler rapidement les principales tapes qui sont gnriques indpendamment du protocole utilise.
a) La phase d'mission
a-1) L'acquisition audio
Le module d'acquisition audio est en gnral compos d'un microphone et d'une carte
audio. Les signaux lectriques capts par le microphone sont numriss par la carte et
mis disposition du logiciel de traitement de ces signaux. Il s'agit en fait de transformer
l'information (codage du signal audio analogique) de telle manire qu'elle puisse tre
transmise sur un rseau numrique comme Internet.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 5
Transmission numrique de mdia sonores
a-2) La dtection de silence
Le premier travail effectu par ce logiciel est la dtection des priodes de silence et
d'activit. Cette dtection se fait sur la base de calculs d'nergie (et parfois d'analyse
spectrale, afin de diffrencier un bruit de fond d'un signal spectralement plus structur).
La dtection de silence permet bien sr de n'mettre des donnes que lorsque la source
audio est active. Ceci est intressant car il a t montr par exemple que les
conversations tlphoniques comportent environ 30% de silence.
a-3) Le codage et la compression
Le codage comprime les donnes numriques selon un schma de compression afin de
rduire le dbit mis, et favoriser ainsi le transfert de donnes en temps rel. Il existe une
multitude de types de compressions diffrentes au niveau applicatif (nous n'entrerons pas
dans les dtails de chaque algorithme).
Ces diffrents codage de l'information influent principalement sur trois facteurs
primordiaux dans une communication :
--> Le dbit en mission.
--> La charge processeur pour coder/dcoder l'information.
--> Le niveau de qualit sonore du mdia.

La plupart des algorithmes de compression favorise une caractristique au dtriment
d'une autre. Dans les formats de fichiers les plus connu, l'on peut citer : Mp3,
Ogg/Vorbis dont les formats sont libres et Windows Media Audio, Real Audio,
QuickTime Audio pour lesquel ces formats sont propritaires.
a-4) La transmission des paquets
Le module de transmission transforme le flot de bits la sortie du codeur audio en un
flot de paquets (ou datagrammes). Cette transformation peut s'effectuer aux travers de
diffrents protocoles que nous tudierons plus loin dans ce rapport.
b) La phase de rception
b-1) La rception des paquets
Le module ou protocole de rception prend les paquets disponibles sur le rseau et place
l'information audio contenue dans ces paquets l'intrieur d'un buffer de rception. Les
paquets peuvent provenir de diffrentes sources.

CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 6
Transmission numrique de mdia sonores
b-2) La phase dcodage/dcompression de l'information
Ce module utilise l'un des formats de dcompression disponibles, pour restituer une
information audio non code. En fonction de la compression originelle, la qualit obtenu
en sortie se verra pour la plupart du temps plus ou moins diminue (dans l'optique d'
augmenter le dbit).
b-3) Le mixage audio
Ce module de mixage a pour but de mixer les donnes dcompresses provenant des
diffrentes sources.
b-4) La restitution audio
Le module de restitution envoie les chantillons mixs sur le driver de sortie pour qu'ils
soient jous sur un haut parleur ou un casque.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 7
Transmission numrique de mdia sonores
III. Les diffrents types de diffusion
a) L'unicast
C'est le mode conventionnel de communication dans un rseau IP. Une connexion sert un seul
utilisateur, et il faut autant de connexions que d'utilisateurs. Dans le cas d'une diffusion, si on
fait l'analogie avec une radio et un rseau filaire, c'est comme s'il tait ncessaire pour la radio
de tirer un fil jusqu' chacun de ses auditeurs. On peut imaginer le nombre important, voir
mme ingrable d'arrives filaires la station de radio.
Chaque client monopolise une ressource au niveau du serveur (ici, la bande passante de celui-ci,
matrialise par une large bande noire son arrive), provoquant une rapide monte en charge
de cette dernire.
Fig 1: Principe de l'unicast
Ce mode de diffusion point--point est particulirement inadapt la diffusion d' un contenu
destin plusieurs destinations (de type webradio ou webTV ).
Ce procd est le plus utilis sur Internet car il fonctionne bien sur le rseau actuel et na pas les
problmes dimplmentation rencontrs avec le multicast.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 8
Transmission numrique de mdia sonores
b) Le Broadcast
Lors dune diffusion en broadcast, un seul flux est mis pour tous les utilisateurs. Cette
technique a lavantage de diminuer la bande passante ncessaire et de diminuer la charge, au
niveau du serveur.
En effet, il na plus grer N connexions distinctes. Ce type de diffusion n'est possible que sur
un mme domaine de broadcast, savoir un rseau local (pas de routage possible).
c) Le multicast
c-1) Fonctionnement gnral
Ce principe de diffusion fonctionne un peu comme le broadcast, en effet un seul flux est
mis partir du serveur. Mais ici, on se place dans le cadre d'une diffusion de groupe, sur le
mode on envoie la donne, et le client la prend s'il le dsire . Cette mthode est appele
galement communication de groupes , ou multipoint IP . Les clients qui ne sont pas
abonns au groupe ne recevrons pas le flux. Cette technique peut tre utilise pour faire du
streaming sur internet.
Fig 2: Principe du multicast
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 9
Transmission numrique de mdia sonores
Au niveau de l'implmentation de cette technique, on utilise une certaine classe d'adresse IP
(la classe D , ajoute aux trois classes conventionnelles (A,B,C), dont les htes sont
compris entre 224.0.0.0 et 239.255.255.255) pour la diffusion multicast. L'adresse de rseau
commence donc, en binaire, par la suite 1110 .
Etant donn la notion de groupe de diffusion , combine la notion d'abonnement un
groupe, il est ncessaire (dans un souci d'conomie de bande passante) de mettre en place
un protocole permettant de demander la diffusion d'un groupe dans une partie du rseau,
ainsi que l'arrt de diffusion de celui-ci, en cas de dsabonnement. IGMP (Internet Group
Management Protocol, dfini dans le rfc 1112), un protocole appartenant IP rpond ce
besoin.
Au niveau de la couche n2 (couche liaison), il existe dans le cas d'ethernet une
spcification (IEEE802.3), qui spcifie que pour transporter des trames multicast, on
construit l'adresse MAC de destination de la faon suivante: les 23 bits de poids faible de
l'adresse de groupe multicast sont mis dans les 23 bits de poids faible de l'adresse Ethernet
01-00-5E-00-00-00.
Par exemple, si l'on veut diffuser l'adresse 229.6.9.172 , au niveau de la couche rseau, on
enverra une trame destination de 01-00-5E-06-09-AC.
Mais l'adresse de groupe multicast se compose de 28 bits et non de 23 bits. Du fait qu'il n'y
a pas assez de place dans l'adresse MAC pour faire tenir les 28 bits du groupe multicast,
cette adresse n'est pas unique.
On en dduit que pour chaque trame comportant une adresse multicast, il y a 2
5
adresses IP
de groupes multicast possibles.
Ce qui signifie que si les 23 bits de poids faible ne suffisent pas discriminer la trame il
faudra faire appel au pilote de priphrique ou la couche IP pour lever l'ambigut.
Quand une trame de type multicast est lue par la station Ethernet puis par le pilote de
priphrique, si l'adresse correspond l'une des adresses de groupe multicast pralablement
configures, le datagramme franchit la couche IP et une copie des donnes est dlivre aux
processus qui ont joint le groupe multicast.
A un niveau plus haut dans le modle en couches OSI, il est ncessaire de router les paquets
multicast. Il existe plusieurs protocoles de routages, comme le DVMRP (un routage
vecteurs de distances driv du protocole RIP), le MOSPF/MBGP ou le PIM (Protocol
Independent Multicast), mais nous ne dtaillerons pas leurs spcifications ici, tant donn
que nous nous consacrons sur les couches basses.
A noter qu'tant donn les proprits intrinsques du multicast, on ne peut utiliser que de
l'UDP (et les protocoles de niveau suprieur pouvant s'appuyer sur UDP, tel que RTP) pour
transporter les datagrammes.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 10
Transmission numrique de mdia sonores
c-2) Les bnfices d'une telle mthode de diffusion.
Le premier avantage que l'on peut trouver une telle mthode, c'est l'conomie de bande
passante cot serveur. En effet, contrairement toutes mthodes de diffusion unicast
conventionnelle, pour une seule source, on n'aura qu'un seul flux sortant du serveur. On ne
risque donc pas de saturer les ressources rseaux d'un serveur, avec l'afflux de nouveaux
clients. Cela permet donc le dveloppemet de grands rseaux de diffusion, tel que celui du
fournisseur d'accs internet Free avec son offre FreeBox , qui utilise le protocole
multicast pour la diffusion de mdias vido et audio travers son rseau ( l'aide d'un
logiciel bien connu, Videolan).
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 11
Transmission numrique de mdia sonores
c-3) Quelques inconvnients.
L'inconvnient majeur de cette mthode est qu'elle ncessite que les routeurs de l'internet
soient adapts ce mode de diffusion. Malheureusement, au jour d'aujourd'hui, la plupart de
ces routeurs ne fonctionnent qu'en unicast, ce qui fait que certaines parties du rseau
Internet sont encore en zone d'ombre vis--vis de cette mthode de diffusion.
Par ailleurs, toutes les implmentations de la pile TCP/IP ne supportent pas la technique du
multicast, mme si cela a tendance se gnraliser. Pour les gens dont la pile IP ne supporte
pas cette technologie, ou ceux raccords des rseaux non multicasts, il existe des
passerelles effectuant la conversion Multicast <> Unicast, mais on retrouve donc les
problmes lis l'unicast (bande passante, ...):
Fig 3: Passerelle Unicast <> Multicast
Ici, le client du bas est derrire un rseau unicast, et le serveur rflecteur (reflector) joue le
rle de serveur unicast conventionnel.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 12
Transmission numrique de mdia sonores
c-4) Le Mbone et ses drivs (M6Bone, FMBone...)
Afin de pouvoir diffuser un contenu multicast travers un rseau ne le supportant pas, et
ainsi contourner le problme des rseaux ne supportant pas le multicast, la communaut a
cr un rseau auto-gr, le Mbone. A base de tunnels traversant les parties unicast, il
interconnecte entre eux les sous-rseaux supportant le multicast, formant le rseau multicast
public .
Voici la topologie du rseau Mbone, tel qu'il a t cre en 1994. Plusieurs autres sous-
rseaux s'y sont rattachs depuis.
Fig 4: Le MBone
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 13
Transmission numrique de mdia sonores
En France, le premier rseau s'intresser de prs ce mode de diffusion a t le rseau de
la recherche et de l'enseignement suprieur, Renater. Aujourd'hui, ils oprent galement un
rseau Ipv4 entirement multicast, et participent un rseau exprimental en IPv6, le
M6Bone (http://www.m6bone.net), en collaboration avec d'autres rseaux de recherche
trangers.
Pour plus d'informations sur le M6Bone, il existe une mailing-liste, hberge par Renater,
dont l'adresse est m6bone@ml.renater.fr
D'autres organisations s'intressent au multicast, soit pour une utilisation prive (de type
diffusion ferme, non relie au MBone telle que la diffusion audio/vido du rseau Free),
soit pour un raccordement global (De type Yacast, pour une diffusion radio globale).
IV. Les diffrents protocoles utiliss
a) La problmatique
Le but dun serveur de streaming est de diffuser un flux avec la meilleure qualit possible
(sonore ou visuelle) et dempcher toutes interruptions. Il y a vraiment un compromis entre
qualit et dbit. Pour viter les interruptions pendant la diffusion, une technique est utilise : le
buffering. Elle consiste mmoriser une partie du flux afin de pouvoir continuer la transmission
mme si le trafic est perturb. Le buffering ncessite donc chaque connexion un temps pour
remplir le buffer (mmoire). Sa taille est variable et dpends de chaque serveur.
La taille du buffer est un paramtre important. Si celui-ci est trop petit, il nempchera pas les
interruptions de flux, au contraire si il est trop important le client mettra plus de temps au
dmarrage et les performances globales seront dgrades (traitements inutiles effectus par le
client).
Les rseaux dans lesquels sont susceptibles d'tre dployes des applications offrant du
streaming peuvent tre de nombreuses natures, dpendant essentiellement du type de public
vis. Pour remdier aux problmes de squencements et de synchronisation induis par l'usage
d'un rseau sans qualit de service tel que Internet, de nombreux protocoles ont fait leur
apparitions permettant une gestion du streaming adapte aux diffrents types de rseaux.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 14
Transmission numrique de mdia sonores
Fig 5: Schma gnral des protocoles de diffusion
Le schma ci-dessus reprsente l'ensemble des protocoles qui peuvent tre utiliss pour la
diffusion numrique de mdia sonore. On remarquera que la majorit des protocoles se situent
au niveau applicatif.
Dans un premier temps nous traiterons des protocoles situs au niveau couches basses tel que
RNIS et ATM. Nous voquerons ensuite ceux dont l'utilisation s'effectue au niveau de la couche
transport et des couches suprieures. Mais avant a, il est ncessaire de dfinir le terme
Qualit de Service utilis par tous les protocoles.
b) Qualit de services(QoS)
La qualit de service est une notion ne chez les oprateurs de tlcommunication vers 1997.
On parle de contrat de niveau de service quand une entreprise exige de son oprateur une haute
disponibilit de son rseau. Gnralement, la qualit de service correspond l'ensemble des
mthodes ou processus qu'une organisation de services met en oeuvre pour maintenir un niveau
de qualit prcis.
QoS est un ensemble de contraintes que le rseau doit respecter pour offrir un niveau de service
appropri la transmission des donnes.
L'implmentation de QoS permet aux programmes en temps rel d'utiliser le plus efficacement
possible la bande passante du rseau. Comme il garantit des ressources rseau suffisantes, il
fournit au rseau partag un niveau de service similaire celui d'un rseau priv.
Une garantie QoS indique un niveau de service qui permet un programme de transmettre des
donnes d'une faon acceptable dans un dlai raisonnable.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 15
Transmission numrique de mdia sonores
c) Les diffrents protocoles
c-1) ISDN (RNIS, Rseau Numrique Intgration de Services)
Dfinition
La technologie ISDN a t dveloppe dans les annes 80, pour rpondre un besoin
de plus en plus pressant: En effet, l'poque, les oprateurs tlcom avaient tendance
dvelopper des rseaux spcifiques un service: Un rseau pour la voix, un rseau
pour les donnes, etc...
La multiplicit et l'indpendance des rseaux a conduit une certaine lourdeur de
gestion, autant du cot oprateur que du cot utilisateur, donc l'ide est ne de
fusionner ces rseaux, et de les rendre multi-services.
Pour se faire, il est apparu ncessaire de transmettre les donnes sous forme
numrique, de telle sorte que la transmission d'une information soit indpendante de
la nature de celle-ci (voix, donnes, images, etc...), mais tout de mme gre avec de
puissants outils et normes internationales. ISDN (RNIS) est une technologie ayant
donc pour vocation l'intgration de services. Ses principaux avantages sont une
bonne QoS:
--> Un dbit constant et garanti
--> Un temps de transfert court et constant
... le rendant de fait particulirement adapt la transmission de mdias numriques.
Fonctionnemment gnral
Le RNIS est une volution du rseau tlphonique actuel. Il propose la continuit
numrique de bout en bout. Ce n'est pas un rseau supplmentaire entrant en
concurrence avec les rseaux existants comme le tlphonique traditionnel, les
rseaux X.25 ou les liaisons spcialises. C'est plutt un accs universel ces rseaux
ou plus exactement ces services supports.
L'un des principes du RNIS est de sparer les informations de signalisation,
permettant dtablir les communications, et les informations lies au transfert des
donnes. Les informations lies la signalisation sont transportes dans un canal de
signalisation spcifique dit "canal D".
Le transfert des informations se fait alors dans des canaux spcifiques dits "canaux B"
de 64Kbits/s. Les canaux B peuvent alors vhiculer de la voix ou des donnes en
fonction de l'application mise en oeuvre. La notion de canal est comprendre comme
notion d'intervalle temporel allou un type dinformation. Le RNIS apparat comme
un moyen de communication rapide, normalis, intelligent et souple.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 16
Transmission numrique de mdia sonores
Plus rapide, car l'accs de base 144 Kbit/s comporte 2 voies 64 Kbit/s et une voie
16 Kbit/s (2B+D). Les canaux B permettent, par exemple, de tlphoner tout en
envoyant une tlcopie rapide. Le canal D, pour sa part, convoie les signaux servant
l'tablissement de la communication et toutes les informations de service ; il peut
aussi transporter des informations bas dbit. L'aggrgation de canal (de 1 30
canaux B de 64 Kbits/s) + un canal D permet d'atteindre des dbits allant de 64
Kbits/s jusqu' 1920 Kbits/s ;
Plus intelligent, car les centraux sont capables de grer une signalisation bien plus
riche que celle du tlphone classique. Cette possibilit offre un grand nombre de
services complmentaires comme, par exemple, l'identification de l'appelant ou la
possibilit de transfert d'appel. Par ailleurs, il existe un contact permanent entre
l'abonn et le rseau ; par exemple, si un abonn occupe ses 2 canaux B avec une
communication tlphonique et un transfert de donnes, le rseau pourra, grce au
canal D, avertir l'utilisateur qu'un autre correspondant cherche le joindre ;
Plus souple et simple, car le RNIS a la vocation d'hberger la grande majorit des
services de communication et fait un pas vers la transparence des rseaux avec son
accs universel aux services de tlcommunication ;
Plus normalis, car tous les lments d'accs au RNIS sont spcifis par des normes
internationales : mme canal de base, mme canal D, mme cablge et mme prise
(RJ 45) servent pour tous ;
La norme H320
La norme qui a t adopte par la communaut internationale concernant les
communications par RNIS est la recommandation H320.
Compose de plusieurs sous-normes , les principales sont, pour la composante
audio, les suivantes :
G711 : 300 3400 Hz (bande passante du tlphone) et 64 ou 56kbit/s. Ce type de
codage est aussi appel MIC (Modulation par Impulsions et Codage) et est surtout
utilis pour le RNIS ;
G726 : codage permettant de ramener le dbit du son numris 40, 32, 24, 16 kbit/s
amlioration du codage MIC permettant de ramener le dbit du son numris 32
kbit/s. Il s'appelle le codage MICDA (Modulation par Impulsion et Codage
Diffrentiel Adaptatif) ;
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 17
Transmission numrique de mdia sonores
G722 : 50 7000 Hz, pour un dbit de 64, 56, ou 48 kbit/s. Ce codage est aussi
appel SB-MICDA (Modulation et Codage Diffrentiel Adaptatif Sous-Bandes);
G728 : 300 3400 Hz. Codage de la parole 16 kbit/s en utilisant prdiction linaire
faible dlai avec excitation par code LD-CELP (Low-Delay Code Excited Linear
Prediction);
Organisation des protocoles RNIS dans la modlisation OSI.
La couche physique (ou niveau 1) est tout naturellement identique pour les canaux B
et D, qui y sont multiplexs. Au niveau de la couche liaison (niveau 2), il existe 3
modes de connexion : commutation de circuits, mode semi-permanent et
commutation de paquets.
Commutation de circuits
Le circuit est tabli, maintenu et libr en utilisant la signalisation du canal D. Les
donnes utilisateur sont changes sur les canaux B avec les protocoles utilisateur.
Mode semi-permanent
Le circuit est tabli entre les utilisateurs et le rseau pour une dure dlimite ou non.
Une fois le circuit tabli, le canal D n'est plus ncessaire pour la signalisation.
Commutation de paquets
Dans ce cas, une connexion en mode commutation de circuits doit tre tablie entre
l'abonn RNIS et un noeud du rseau commutation de paquets sur le canal B. Cette
connexion en mode commutation de circuits implique l'utilisation de la signalisation
du canal D. Le rseau commutation de paquets peut tre partiellement RNIS. RNIS
peut donc fournir un service de commutation de paquets sur les canaux B.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 18
Transmission numrique de mdia sonores
Format d'une Trame RNIS
Fig 6: Trame RNIS
Champs
Discriminateur protocole : protocole utilis
Longueur valeur appel rfrence : dtermine la longueur du champ suivant. La
rfrence d'appel peut tre d'une longueur de 1 ou 2 octets qui dpend de la taille de la
valeur code.
Flag : mis 0 pour les messages mis par le parti qui allou la valeur de l'appel de
rfrence; autrement mis 1.
Valeur appel ref : une valeur arbitraire est alloue pour la dure de la session, qui
identifie l'appel entre la machine maintenant l'appel et le commutateur RNIS
Type message : dfinit le premier sujet de la trame. Le type de message peut tre de 1
ou 2 octets. Quand il y a plus d'un octet, le premier octet ne contient que des 0.
Le principal inconvnient du RNIS est qu'il est limit sur la distance, et que toutes les
lignes de cuivre standard ne sont pas forcment compatibles avec la norme. En effet,
elles ne doivent pas dpasser la distance de 6 Kms, et doivent avoir une qualit suffisante
(peu de bruit authoris).
Certains constructeurs ont tards se mettre d'accord sur les normes d'aggrgations des
canaux. Ceci a pos pendant trs longtemps des problmes pour l'implmentation de
RNIS.
RNIS tant une technologie trs riche, et ayant plusieurs finalits d'utilisation, nous ne la
dtaillerons pas plus ici, vu la spcificit de notre prsentation.
c-2) ATM
Comme RNIS, ATM est un protocole intgr qui n'est pas spcifique la transmission
de donnes audio, mais plutt orient transfert de donnes au sens large. En effet, il a
t dvelopp par les oprateurs de rseaux tlcoms dans le but d'intgrer la
communication des donnes brutes aussi bien que les communications tlphoniques.
Nous ne le dtaillerons pas ici, car il fait l'objet d'autres prsentations.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 19
Transmission numrique de mdia sonores
c-3) TCP (Transfert Control Protocol)
Ce protocole (de la couche transport) n'est que peu utilis dans le cadre de la
transmission de donnes audio de type stream . En effet, il n'a que peu d'avantages
pour ce mode de transfert de donnes, et dborde d'inconvnients. TCP, bien que rput
fiable, ne convient pas ce type de transmission pour plusieurs raisons:
La premire, est que lorsqu'il y a une perte de paquet (ou d'un ensemble de paquets),
TCP doit attendre que la totalit des paquets soit retransmise, avant de le faire passer
la couche applicative.
Lorsqu'il s'agit de donnes en temps rel, cela peut poser un problme de continuit
dans le temps. En effet, il suffit d'imaginer que l'utilisateur est en train d'couter un
stream radio en TCP, et qu'un groupe de paquets soit perdus pour une raison
quelconque. La destination du stream TCP demande donc la remission des paquets
perdus (modulo un timeout), ce qui fait que le stream radio devrait s'interrompre, le
temps que le buffer de rception soit suffisamment rempli.
La deuxime problme de TCP est que lorsque les paquets n'arrivent pas dans l'ordre,
il faut que protocole les remette dans le bon sens avant de les faire remonter la
couche applicative. Pour que tout ceci se passe sans encombre, il faudrait crer un
buffer de rception de taille considrable, et esprer que la gigue du rseau soit faible.
Mais un buffer norme sous-entend donc un dcalage entre le moment o la source
met la musique, et le moment o la destination peut le transcrire sur les haut
parleurs. Pour la tlphonie ou la voix sur IP, ceci est compltement impensable.
De plus, TCP ne gre pas les transmissions multicasts.
On remarque donc que les points forts pour lesquels TCP a t dvelopp jouent en sa
dfaveur, pour tout ce qui concerne la transmission audio. On verra qu'UDP est
particulirement mieux adapt ce type de communication.
c-4) UDP (User Datagram Protocol)
UDP, bien que rput non fiable , apparat comme une solution correcte pour la
transmission des donnes audio. En effet, en cas de perte de paquet, la destination peut
retranscrire une donne audio lgrement diffrente de la source, mais tant donn que le
destinataire est humain, les quelques imperfections dans le son, sont en gnral
tolrables. En cas de perte massive de paquets, la transmission est interrompue. La
majorit des protocoles de niveau applicatif destins palier les contraintes temps-
rel utilisent UDP.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 20
Transmission numrique de mdia sonores
c-5) RTP/RTCP
RTP
RTP (Real-time Transfer Protocol) est un protocole qui a t dvelopp au dbut
des annes 90, au sein de l'outil VAT (Visual Audio Tool). Le but de ce protocole
est de transporter des donnes avec une garantie temporelle sur l'arrive de ces
donnes.
Standardis en 1996 par l'IETF (RFC 1889 et 18890), ce protocole fournit des
fonctions de transport de bout en bout pour les applications temps rel. Le rle
principal de RTP consiste mettre en oeuvre des numros de squence de paquets
IP pour reconstituer les informations de voix ou vido mme si le rseau sous-
jacent change l'ordre des paquets. C'est un protocoles qui se situent au niveau de
l'application et utilisent les protocoles sous-jacents de transport TCP ou UDP.
Mais l'utilisation de RTP se fait gnralement au-dessus de UDP. Il permet de :
Reconstituer la base de temps des diffrents flux multimdia (audio, vido...)
en ajoutant des marqueurs temporels et des numros de squence
l'information transporte
Dtecter les pertes de paquets
Identifier le contenu des paquets pour leur transmission scurise.
Contrler l'arrive destination des paquets
RTP peut utiliser aussi bien le mode Unicast (point point) que le mode
Multicast (multipoint).
En revanche, il n'est pas capable de :
Rserver des ressources dans le rseau (Voir RSVP).
Apporter une fiabilit dans le rseau (Voir RTCP).
Garantir le dlai de livraison
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 21
Transmission numrique de mdia sonores
L'en-tte RTP comporte les informations suivantes:
Fig 7: En tte de trame RTP
L'en-tte RTP comporte des informations de synchronisation, de numrotation et de
timing ncessaires la synchronisation de flux temps rel du type son et vido.
Voici la signification des diffrents champs de l'en-tte:
V: Version : Version du protocole (V=2).
P: Padding : Egal 1 si le paquet contient du bourrage.
X: Extension: Si X=1 l'en-tte contient un paquet d'extension
CC: CSRC count : Nombre de CSRC qui suivent l'entte .
M: Marker: Dfini par l'application.
PT: payload type : Type du payload (audio, vido, image, texte, html, etc.)
Seq Num: Numro de squence, sur 16 bits.
Timestamp: 32 bits, reflte l'instant o le premier octet du paquet RTP
a t chantillonn.
SSRC: 32 bits, identifie de manire unique la source, sa valeur
est choisie de manire alatoire par l'application. Le
champ SSRC identifie la source de synchro. Cet
identificateur est choisi de manire alatoire avec l'intrt
qu'il soit unique parmi toutes les sources d'une mme
session La liste des CSRC identifie les sources (SSRC)
qui ont contribu l'obtention des donnes contenues
dans le paquet qui contient ces identificateurs. Le nombre
d'identificateurs est donn dans le champ CC
CSRC: 32 bits, identifie les sources.
RTP fonctionne de pair avec le protocole RTCP (Real-time Transfert Control Protocol).
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 22
Transmission numrique de mdia sonores
RTCP
Bas sur la transmission priodique de paquets de contrle tous les participants dans une
session, RTCP s'assure quant lui de tout ce qui est contrle de flux, accuss de rception,
gestion de l'unicit des utilisateurs, avertissement de la source en cas de congestion, etc...
L'objectif de RTCP est de fournir diffrents types d'informations et un retour quant la
qualit de rception et de service.
Il existe 5 types de paquets RTCP pour transporter des informations de contrle :
SR : Sender Report, statistiques des participants actifs en mission.
RR : Receiver Report, statistiques des participants passifs.
SDES : Source Description (CNAME, NAME, EMAIL, PHONE,...)
BYE : Fin de participation
APP : Fonctions spcifiques l'application
Chaque paquet RTCP commence par une partie fixe, suivie par des lments structurs qui
peuvent tre de longueur variable selon le type de paquet, mais toujours termin sur une
frontire de 32 bits. Plusieurs paquets RTCP peuvent tre concatns sans sparateur pour
tre envoys dans un seul paquet UDP (paquet compos).
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 23
Transmission numrique de mdia sonores
L'en-tte RTCP comportera donc des informations diffrentes selon le type de paquet
RTCP qu'il s'agit.
La partie commune de l'entte contient les informations suivantes:
Fig 8: Parties communes de l'entte RTCP
V: Version Version du protocole
P: Padding Egal 1 si le paquet contient du bourrage
SC: reception report count Nombre de compte-rendus dans le paquet
PT: Packet Type Type de packet (200 pour SR)
L: Length Longueur du paquet en mots de 32 bits
SSRC: Source spcifique l'metteur
Le reste de l'en-tte dpend du type de paquet RTCP (donc est en fonction de la valeur de
PT ).
RTP/RTCP sont des protocoles de bout en bout, c'est--dire qu'ils permettent de grer les
ventuels problmes aux extrmits. Les ventuels problmes sur le chemin sont grs par
d'autres protocoles, ou prvus par d'autres technologies (RSVP)
c-6) RTSP ( Real Time Streaming Protocol)
Il s'agit d'un protocole de plus haut niveau, dvelopp par Real Networks, Netscape et
l'Universit de Columbia. L'intrt principal de RTSP est d'offrir des fonctions de pilotage
distance du mdia (lecture, pause, avance rapide, rembobinage rapide, arrt...). Il peut tre
utilis pour rechercher un mdia sur un serveur de mdias, inviter un serveur de mdias
rejoindre une confrence (dans le e-learning par exemple), ou ajouter un mdia une
prsentation existante.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 24
Transmission numrique de mdia sonores
Principes de fonctionnement
Le navigateur Web sollicite tout dabord un fichier de description de prsentation auprs du
serveur Web. Celle-ci peut contenir des rfrences plusieurs fichiers de donnes
audio/vido transmission en flux continu ainsi que des instructions concernant leur
synchronisation, ce qui est interprt par un logiciel spcifique (Real Player, Apple
QuickTime ou Windows Media Player). Chaque prsentation et chaque flux mdia est
identifi par une URL RTSP (rtsp://).
Dans le protocole RTSP on na pas de notion de connexion mais le serveur maintient des
identifiants de chaque session tablie. En effet, pendant sa session RTSP le client peut
demander plusieurs flux multimdia qui peuvent tre achemins de faon diffrente
utilisant le protocole de leur choix (TCP, UDP ou RTP).
RTSP est un protocole similaire HTTP. Ce sont deux protocoles textuels et mme les
codes de rponse du serveur sont quasiment les mmes (200 OK etc.). La diffrence vient
du fait que RTSP doit conserver quelque part des informations sur le numro de chaque
session. Lautre diffrence est que HTTP est un protocole o tout se passe dans la bande (la
rponse est renvoye directement sur la mme connexion TCP) alors que chez RTSP le
transport des flux seffectue sur dautres connexions. A la diffrence de RTSP, HTTP
utilise uniquement le protocole TCP.
Quelques proprits de RTSP
Le protocole RTSP peut contrler aussi bien une Lecture (du serveur vers le client), quune
Ecriture (du client vers le serveur). Ceci permet quun client source utilise le serveur
comme intermdiaire pour diffuser du continue en stream dautres clients.
RTSP supporte les oprations suivantes :
Rcupration de donnes du serveur multimdia : Le client peut demander une
description de la prsentation via http. Si la prsentation est en multicast, sa
description contient les adresses et ports multicast. Si elle est en unicast, le client
fournit ladresse de destination pour plus de scurit.
Invitation dun serveur multimdia une confrence : Un serveur multimdia peut
tre invit rejoindre une confrence existante, soit pour dlivrer son contenu soit
pour enregistrer la confrence. Ce mode est utile pour faire du e-Learning. Plusieurs
personnes peuvent participer tour de rle, en appuyant sur la tlcommande .
Addition de contenu une prsentation existante : Utile pour des prsentations en
temps rel, quand le serveur peut prvenir le client qu'un nouveau contenu vient
d'apparatre.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 25
Transmission numrique de mdia sonores
RTSP a les proprits suivantes :
Extensible : De nouvelles mthodes et paramtres peuvent tre facilement ajouts
RTSP.
Facile analyser (parser) : RTSP peut tre analys par des analyseurs standard de
HTTP ou de MIME.
Scuris : RTSP rutilise des mcanismes de scurit du web. Tous les mcanismes
d'authentification de HTTP tels que l'authentification de base et de digest sont
directement applicables. On peut galement rutiliser le transport ou les mcanismes
de scurit de couche rseau.
Indpendant du transport : RTSP peut utiliser le protocole non fiable de datagramme
(UDP) ou un protocole fiable tel que TCP. RTP peut tre utilis mais cest une
surcouche dUDP.
Multi serveurs : Chaque flux multimdia dans une prsentation peut rsider sur un
serveur diffrent. Le client tablit automatiquement plusieurs sessions de commande
en parallle avec les diffrents serveurs de mdia. La synchronisation des flux est
effectue au niveau transport.
Commande des dispositifs d'enregistrement : Le protocole peut commander des
dispositifs d'enregistrement et de lecture, aussi bien que les dispositifs qui peuvent
alterner entre les deux modes.
Sparation des commandes de flux (transfert de donnes) de celles initialisant la
confrence : Les commandes de flux (transfert de donnes) sont spares de celles
invitant (par exemple) un serveur une confrence. La seule condition est que le
protocole dinitiation de confrence fournit puisse tre employ pour crer un
identificateur unique de confrence. En particulier, SIP ou H.323 peuvent tre
employs pour inviter un serveur une confrence.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 26
Transmission numrique de mdia sonores
Les mthodes de RTSP
Avec RTSP on peut utiliser plusieurs mthodes pour contrler ses fonctionnalits :
OPTIONS : Peut tre utilis tout moment pour signaler que le client essaie dutiliser
une mthode non standard.
DESCRIBE : Permet davoir une description de lobjet multimdia partir de son URL.
ANNOUNCE : Utilis dans deux cas. Du client vers le serveur pour annoncer la
description dun objet multimdia ; du serveur vers le client pour mettre jour la
description de la session en temps rel.
SETUP : Initialise une session RTSP pour un flux. Permet de spcifier le protocole de
transport.
PLAY : Indique au serveur de commencer la lecture utilisant les mcanismes spcifis
par SETUP. Cette mthode permet de spcifier un temps pour synchroniser les flux. On
peut ainsi demander de commencer par exemple le son 10s plus tard que les images.
PAUSE : Mettre en pause temporairement.
TEARDOWN : Permet de mettre fin une session en librant ainsi des ressources sur le
serveur.
GET_PARAMETER : Permet de rcuprer la valeur dun paramtre dune prsentation
ou dun flux.
SET_PARAMETER : Permet dattribuer une valeur un paramtre dune prsentation
ou dun flux.
REDIRECT : Indique au client quil doit chercher ailleurs sa page.
RECORD : Enregistrement dune mission dun client.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 27
Transmission numrique de mdia sonores
Echange client-serveur laide de RTSP
Fig 9: Echange Client-Serveur (RTSP)
c-7) RSVP (Ressource Reservation Protocol)
RSVP n'est pas un protocole de transmission audio proprement parler, mais plutt un des
protocoles de signalisation (niveau transport) pouvant tre utiliss par une plate-forme de
transmission audio.
En effet, la transmission de flux sonores travers un rseau requiert gnralement une grande
fiabilit de celui-ci, aussi est-il utile de mettre en oeuvre de la qualit de service sur ce rseau,
ce dont se charge RSVP.
Le demandeur de la ressource l'envoie son routeur par dfaut, qui propage la demande jusqu'au
prochain routeur, rservant au passage la ressource, si celle-ci est disponible (que ce soit une
certaine quantit de dbit, une gigue assure, etc...).
Sur le schma ci-dessous, on suppose que:
chaque lien a une taille de 30 Mbit/s.
Le poste d'en haut a fait une demande (russie) de rservation de 25 Mbits/s en premier.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 28
Transmission numrique de mdia sonores
Fig 10: Principe de RSVP
Lorsque le poste du bas demandera rserver 10 Mbits/s, la demande sera accepte aux deux
premiers routeurs, puis rejete au routeur d'aprs, car le lien ne peut pas accepter les 25 Mbit/s
du premier poste, et les 10 Mbits/s du deuxime poste (35Mbit/s au total > 30Mbit/s de
capacit)
c-8) Protocoles et VoIP
Technologie de plus haut niveau (vu qu'il s'agit de protocoles sur IP), il n'en demeure pas moins
une des technologies les plus dynamiques, en ces temps de dveloppement du tout-connect .
De par l'essence mme de l'internet, aucun tablissement de connexion n'est ncessaire, la
diffrence des rseaux tlphoniques conventionnels, ou des rseau RNIS. La VoIP est donc
une liaison par commutation de paquets.
Cette technique est apparu au milieu des annes 90, avec l'apparition de logiciels de tlphonie
sur Internet, et a t normalis en 96, crant ainsi la spcification H323, qui fournit des
spcifications pour le temps-rel (ncessaire pour la vidoconfrence interactive, la voix sur IP),
le partage de donnes, et d'autres applications plus spcifiques.
D'autres protocoles de communications plus spcifiques que le H323 existent, notamment le
SIP. Mis au point par lInternet Engineering Task Force (IETF), SIP est moins dense, et est
conu spcifiquement pour la tlphonie IP.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 29
Transmission numrique de mdia sonores
Plus concis et plus efficace que la norme H.323, le SIP tire parti des protocoles existants pour
traiter certaines parties du processus. Le protocole MGCP (Media Gateway Control Protocol),
par exemple, est utilis par le protocole SIP pour tablir une passerelle de liaison au systme
RTC.
Le fait de ne pas utiliser de liaison commute permet doptimiser lutilisation des ressources du
rseau (les liaisons commutes sont tablies en dbut dappel et libres quand lappel est
termin, et durent mme lorsquil ny a pas de trafic vocal, quand, par exemple, les
interlocuteurs se taisent ; les rseaux de commutation par paquets, en revanche, n ouvrent la
connexion que le temps denvoyer un petit volume de donnes appel paquets ).
Cependant, on ne peut garantir la livraison temps et dans lordre du paquet vocal (sur Internet,
les paquets circulent sur des voies qui ne peuvent tre prdfinies si nous, en Suisse,
souhaitons tlcharger une image dun site Web en Allemagne, les paquets IP transportant les
portions de limage peuvent arriver par des chemins diffrents, en passant par les USA, ou le
Japon). Des pertes ne sont pas exclure (la perte de certains paquets provoque des blancs ou
priodes de silence dans la conversation, et donne un effet de discours hach). Il peut aussi y
avoir du retard dans le traitement des paquets.
La limitation de la bande passante disponible pose galement un problme les connexions
Internet peuvent tre satures sur certains segments du rseau Internet sil ny pas suffisamment
de bande passante. Lobjectif du concept QoS est de fournir une qualit de tlphonie VoIP
comparable celle obtenue par commutation de circuit sur ligne fixe. Un service VoIP tant
bas sur IP, tous les supports fournissant IP et QoS y donnent accs, comme lxDSL, le Cble,
les rseaux LAN, et les rseaux ddis IP spcifiques. Pour qu'une communication de voix sur
IP puisse s'tablir, il est ncessaire de convertir le signal analogique en un signal numrique,
puis de le compresser le cas chant, pour ensuite le convertir en paquets IP, qui pourront tre
transmis sur un rseau de type Internet.
c-9) La norme H.323
Le systme VoIP utilise deux protocoles principaux, dfinissant chacun des modes de
connexion entre dispositifs par lutilisation du VoIP. Ils comprennent aussi des spcifications
pour les codecs audio. Un codec (forme abrge de codeur-dcodeur), convertit un signal-son
en signal numrique comprim pour la transmission et le reconvertit en signal-son non-
comprim pour le rejouer.
La norme H.323, cre par lUnion internationale des tlcommunications (UIT), est un
recommandation exhaustive et extrmement complexe. Elle fournit des spcifications pour le
temps-rel, la vidoconfrence interactive, le partage de donnes et les applications telles que la
tlphonie IP. H.323 englobe de nombreux protocoles individuels labors pour des
applications spcifiques.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 30
Transmission numrique de mdia sonores
Bien au point, c'est la norme la plus utilis par les applications de tlphonie sur IP et de visio-
confrence (95 % du trafic), les rseaux d'oprateurs et les systmes de tlphonie IP
d'entreprise.
La norme H323 a substitue la H320. La norme H320 caractrise le rseau RNIS, alors que la
norme H323 caractrise un rseau local et INTERNET.
La norme H323 est une tentative dattirer le !rand "ublic des internautes. #vec lvolution des
"er$ormances ordinateurs , il est "ossible dutiliser des visio"%ones sur le rseau de tl"%onie
traditionnel &RT'( sans Internet. 'est la norme H.323 qui se c%ar!e de controler les "aram)tres
de trans$ert sur le rseau. La "lu"art des lo!iciels sur le marc% sont con$ormes au*ourd%ui +
cette norme.
H.323 ne fonctionne qu'en unicast.
Fig 11 : Schma d' ensemble de la recommandation H.323
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 31
Transmission numrique de mdia sonores
c-10) SIP (Session Initiation Protocol)
Un nouveau protocole, beaucoup mieux adapt l'Internet a t dvelopp par l'IETF: SIP.
C'est ce protocole qui va permettre le dveloppement des fonctions tlphoniques. Il permet
aussi de dvelopper des "tlphones SIP" qui permettent de se connecter directement l'Internet
en se passant de PC.
C'est un protocole qui permet de crer et grer des sessions entre participants pour changer des
donnes. Il est indpendant de la nature des donnes et du protocole de transport. Il peut donc
servir tablir des conversations tlphoniques et des confrences, mais il n'est pas limit cet
usage.
Un utilisateur peut se connecter avec les utilisateurs d'une session dj ouverte. Pour ouvrir une
session, un utilisateur met une invitation transportant un descripteur de session permettant aux
utilisateurs souhaitant communiquer de s'accorder sur la compatibilit de leur mdia. SIP
permet donc de relier des stations mobiles en transmetttant ou redirigeant les requtes vers la
position courante de la station appele.
Avec SIP, les utilisateurs qui ouvrent une session peuvent communiquer en mode unicast ou en
multicast. Les tlphones SIP permettent d'avoir un numro de tlphone unique qui sera
utilisable quelque soit l'endroit dans le monde o le tlphone sera connect (sur le rseau
Internet).
Il existe une version scurise du protocole: SIPS qui utilise TLS comme protocole scuris de
la mme manire que le protocole https vis vis de http.
- Fonctionnalits de SIP:
SIP possde cinq grandes fonctions pour tablir et terminer des communications
multimdia :
1. Rcupration de l'adresse de l'utilisateur pour dterminer le systme terminal qui
doit tre utilis pour la communication.
2. Rcupration de la disponibilit de l'utilisateur pour dterminer si l'utilisateur a
envie de participer la communication.
3. Rcupration des moyens de l'utilisateur pour dterminer le mdia dont dispose
l'utilisateur et ses caractristiques.
4. Fonctionnalits de mise en route de la session "sonnerie" et tablissement des
paramtres de la session.
5. Gestion de la session incluant le transfert et la fin de session, la modification des
paramtres de la session ou l'appel de services.
Toutes ces fonctions sont assures par un rseau de machines appeles des "Serveur Proxy".
Les utilisateurs s'adressent ces serveurs pour s'enregistrer ou demander l'tablissement de
communications. Toute la puissance et la simplicit du systme vient de l.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 32
Transmission numrique de mdia sonores
On peut s'enregistrer sur le proxy de son choix indpendamment de sa situation
gographique. L'utilisateur n'est plus "attach" son autocommutateur. Une entreprise avec
plusieurs centaines d'implantation physiques diffrentes n'a besoin que d'un serveur proxy
quelque part sur l'Internet pour tablir "son" rseau de tlphonique "gratuit" sur l'Internet
un peu la manire de l'e-mail.
Les dizaines de milliers d'autocommutateurs en tlphonie conventionnelle peuvent tre
remplaces par quelques serveurs proxy.
- Implmentation:
Ouverture de session
Les diffrents lments intervenant dans louverture dune session sont tablit :
Suivant la nature des changes, choix des protocoles les mieux adapts (RSVP, RTP,
RTCP).
En dterminant le nombre de sessions : par exemple, pour vhiculer de la vido, 2
sessions doivent tre ouvertes (lune pour limage et lautre pour la vido).
De maire ce que chaque utilisateur et sa machine soit identifi par une adresse que
lon nomme URL SIP et qui se prsente comme une URL Mailto :
.Informations_utilisateur@domaine paramtre
.Informations_utilisateur : nom dutilisateur ou numro de tlphone
.Domaine : nom de domaine ou adresse IP : port
.Paramtres : transport = udp ou tcp / user = phone ou IP / method = INVITE,
ACK, OPTIONS, BYE, CANCEL, REGISTER / ttl = 0 255 / maddr = adresse
IP de multicast
Requte URL : permet de localiser le proxy server auquel est rattach la machine de
lappel
Requte SIP : une fois le client (machine appelante) connect un serveur SIP distant, il
peut lui adresser une ou plusieurs requtes SIP et recevoir une ou plusieurs rponses de
ce serveur.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 33
Transmission numrique de mdia sonores
Description des mthodes de requtes :
Les changes entre un terminal appelant et un terminal appel se font par lintermdiaire
de requtes :
INVITE : cette requte indique que lapplication (ou utilisateur) correspondante
lURL SIP spcifi est invit participer une session. Le corps du message dcrit
cette session (par ex : mdia supports par lappelant ). En cas de rponse
favorable, linvit doit spcifier les mdias quil supporte.
ACK : permet de confirmer que le terminal appelant a bien reu une rponse
dfinitive une requte INVITE.
OPTIONS : un proxy server en mesure de contacter un terminal appel, doit
rpondre une requte OPTIONS en prcisant ses capacits contacter le mme
terminal.
BYE : cette requte est utilise par le terminal de lappel fin de signaler quil
souhaite mettre un terme la session.
CANCEL : cette requte est envoye par un terminal ou un proxy server fin
dannuler une requte non valide par une rponse finale : Si une machine ayant
t invite participer une session, et ayant accept linvitation ne reoit pas de
requte ACK, alors elle met une requte CANCEL.
REGISTER : cette mthode est utilise par un client pour enregistrer son adresse
auprs du serveur auquel il est reli.
- Format des messages SIP
Un message SIP peut tre la fois une requte dun client (terminal appelant) vers un
serveur (terminal appel), ou une rponse dun serveur vers un client :
> Requte dun client vers un serveur :
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 34
Transmission numrique de mdia sonores
> Rponse d'un serveur vers un client:
mthode : ACK ou INVITE ou BYE ou CANCEL ou OPTIONS ou REGISTER.
code dtat : entier cod sur 3 bits indiquant un rsultat lissue de la rception dune requte.
reason phase : motif du refus ou de lacceptation dune requte.
en-ttes gnral : Accept (permet dindiquer les types de mdia qui seront accepts dans la
rponse ou Accept-Encoding ou Call-ID (identifie une invitation prcise) ou Cseq
en-ttes de requte : Priority (indique le niveau de priorit de la requte) ou Route (dtermine le
chemin que prendra la requte)
en-ttes dentit : Content-Encoding (valeur indique le code utilis pour crire et lire len-tte
dentit) ou Content-Length (taille du corps du message envoy) ou Content-Type (indique les
types de mdia utiliss dans le corps du message).
en-ttes de rponse : Allow ou Server
corps du message : dans le cas des requtes, un corps est ajout ou non selon la mthode utilise
(par exemple : le corps du message dune requte INVITE contient des informations indiquant
la progression de la requte). Dans le cas des rponses, le corps du message est obligatoire (par
exemple : la rponse une requte INVITE contient dans le corps du message, une description
de la session).
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 35
Transmission numrique de mdia sonores
- Scurit et Authentification
Les messages SIP peuvent contenir des donnes confidentielles, en effet le protocole SIP
possde 3 mcanismes de cryptage :
Cryptage de bout en bout du Corps du message SIP et de certains champs den-tte.
Cryptage au saut par saut (hop by hop) afin dempcher des pirates de savoir qui appelle
qui.
Cryptage au saut par saut du champ den-tte pour dissimuler la route qua emprunt la
requte.
De plus, fin dempcher tout intrus de modifier et retransmettre des requtes ou rponses
SIP, des mcanismes dintgrit et dauthentification des messages sont mis en place. Et pour
des messages SIP transmis de bout en bout, des cls publiques et signatures sont utilises par
SIP et stockes dans les champs den-tte Authorization.
- SIP face son principal concurrent (H.323):
Avantages du protocole H.323
Il existe de nombreux produits (plus de 30) utilisant ce standard adopt par de grandes
entreprises telles Cisco, IBM, Intel, Microsoft, Netscape, etc.
Les cinq principaux logiciels de visioconfrence (Picturel 550, Proshare 500, Trinicon
500, Smartstation, Cruiser 150, utilisent sur IP la norme H.323.
Un niveau dinteroprabilit trs lev , ce qui permet plusieurs utilisateurs d'changer
des donnes audio et vido sans faire attention aux types de mdia qu'ils utilisent.
Avantages du protocole SIP
SIP est un protocole plus rapide : la sparation entre ses champs den-tte et son corps
du message facilite le traitement des messages et diminue leur temps de transition dans
le rseau.
nombre des en-ttes est limit (36 au maximum et en pratique, moins d'une dizaine d'en-
ttes sont utilises simultanment), ce qui allge l'criture et la lecture des requtes et
rponses.
SIP est un protocole indpendant de la couche transport : il peut aussi bien sutiliser avec
TCP que UDP.
De plus, il spare les flux de donnes de ceux la signalisation : ce qui rend plus souple
l'volution "en direct" d'une communication (arrive d'un nouveau participant,
changement de paramtres).
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 36
Transmission numrique de mdia sonores
- Conclusion
La simplicit, la rapidit et la lgret dutilisation (tout en tant trs complet) du protocole
SIP sont autant darguments qui pourraient permettre SIP de convaincre les investisseurs.
De plus, ses avances en matire de scurit des messages sont un atout important par rapport
ses concurrents.
c-11) MGCP
C'est un protocole de contrle et de transmission utilis dans les installations de type VoIP. De
plus bas niveau que H.323 ou SIP, il se limite la commande de terminaux partir de
commandes lmentaires. De par sa nature maitre/esclave , il plait aux constructeurs et
oprateurs de la tlphonie traditionnelle, qui l'exploitent pour les fonctionnalits de scurit et
les possibilits de facturation qu'il apporte.
Les fournisseurs ADSL franais utilisent en rgle gnrale le protocole MGCP qui est un
protocole asymtrique (le serveur, contrle le tlphone de l'abonn), alors que les logiciels de
Voix sur IP utilisent en gnral SIP qui est un protocole symtrique.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 37
Transmission numrique de mdia sonores
V. Conclusion
Comme nous avons pu le voir, la transmission numrique de mdias sonore est un sujet extrmement
vaste. Il est donc de fait trs difficile d'en faire le tour compltement, tant il y a de choses en dire.
Nous avons essay d'aller l'essentiel, et de nous attacher tous les protocoles les plus utiliss
actuellement et les plus prometteurs dans les annes venir.
Quoi qu'il en soit, la dynamique actuelle et la multiplicit des solutions nous conduit penser que dans
un futur proche, le rsultat de toutes ces innovations ne pourra qu'tre excellent.

Demain, il sera trs certainement possible d'couter une radio japonaise au rveil, une radio amricaine
au repas de midi, et une franaise le soir, ou de communiquer volont avec l'autre bout du monde.
Force est d'admettre que les actuels mtiers de la tlcommunication vont devoir voluer, et se baser
non plus sur le temps d'utilisation du rseau, mais plutt sur un forfait d'accs, ou sur les services
associs l'accs ce rseau.
CAVADORE Clment Module A1 Couches basses
PRADEILLES Christophe Page 38