Sommaire
Deux modes de transmission :
o Transmission via Numeris
o Transmission sous IP. Les protocoles
Deux familles de normes : H320 et H323
o Des normes et des formats
o Transmettre la vido et laudio
o Prsenter et partager des documents
o Nouveauts et volutions
Les contraintes lies aux rseaux locaux et leurs quipements spcifiques
o La gestion des adresses IP
o Le passage des firewalls
o Un outil particulier : le Gatekeeper
La visioconfrence en multi points
Interconnecter les deux familles : les passerelles
Ce document fera le point sur toutes ces technologies. Cependant, compte tenu du fort
dveloppement des visioconfrences sous IP, laccent sera donn sur cette technologie.
Le dernier chapitre abordera la problmatique des rseaux locaux et des contraintes quils
induisent gnralement dans le bon fonctionnement dune session de visioconfrence.
Cette tude se limitera aux utilisations traditionnelles, (en entreprise, dans les lyces) mais
nabordera pas la problmatique des tablissements de lenseignement suprieur qui, en
ayant la possibilit dtre raccords au rseau haut dbit Renater, disposent de spcificits
et doutils particuliers qui ne sont pas encore proposs sur lInternet classique.
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 2 / 26
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 3 / 26
Sur un rseau IP, les donnes sont dcoupes en paquets. Lentte contient des
informations pour le routage, notamment ladresse IP du poste expditeur et celle du poste
destinataire.
Conu lorigine pour des applications qui ntaient pas multimdia, Internet repose la
base sur deux protocoles IP et TCP. Le protocole IP assure lacheminement des paquets de
point en point, jusquau terminal final mais sans se proccuper du contenu. Il ne gre pas les
pertes et les retards. Ce protocole simple mais peu fiable est complt par le protocole TCP
qui assure la fiabilit de la transmission en demandant la r-mission des paquets perdus ou
dtruits. Du fait de cette procdure de r-mission, TCP est un protocole lent. Cette fiabilit
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 4 / 26
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 5 / 26
possible entre le mouvement des lvres et la voix des intervenants). Des dispositifs
similaires sont proposs chez les autres fournisseurs.
Rien que le transfert des donnes vido et audio, pas moins de 8 flux RTP et RTCP sont gnrs et transfrs sous UDP.
A chacun des flux RTP unidirectionnel qui transporte des donnes audio ou vido correspond un flux bi-directionnel
RTCP qui ne transporte que des donnes de supervision.
Encadr : Sur un rseau IP, la circulation des donnes obit trois grands principes.
Avec mon premier, les donnes utiles ne circulent pas en un flot continu sur le rseau mais
sont dcoupes en paquets. A chacun dentre eux est affect une entte (header en
anglais) qui contient des informations pour le service.
Avec mon second, le traitement de linformation est hirarchis sous la forme de couches
fonctionnelles, chacun dentre elles correspondant une fonctionnalit prcise (couche
application, couche transport, couche rseau) et donc un ou plusieurs protocoles
spcifiques.
Concrtement, le flux dinformations transform en paquets est transmis de couche en
couche. Chacune dentre elles ajoute cependant ses propres informations de service aux
donnes utilisateurs correspondant aux divers protocoles utiliss. A la manire de poupes
russes sembotant les unes dans les autres, chaque paquet avec sa charge utile et son entte
devient la charge utile de la couche suivante et est complte par une entte (et aussi, le cas
chant, par des octets de fin). On parle dencapsulation, cest le troisime principe.
La succession de nombreux protocoles, si elle rpond la ncessit damliorer la
transmission des donnes, a aussi pour consquence ngative un accroissement important
des donnes de service comparativement au volume des informations utiles et donc
une augmentation du volume total transmettre. Ces enttes successives contiennent des
informations qui sont, pour certaines, identiques dune entte lautre. Des techniques de
compression ont t labores pour allger le volume de ces enttes et permettre la
suppression de ces redondances lmission.
Lencapsulation des donnes (ici les donnes issues dun codec vido) : chaque couche
ajoute sa propre entte aux donnes quelle reoit de la couche suprieure.
Les deux protocoles RTP et RTCP nont donc pas pour mission dagir sur les quipements
constitutifs du rseau. Dans cette qute pour loptimisation des transmissions, une deuxime
tape est dintervenir sur tous les lments intermdiaires. Le transfert des paquets sur le
rseau peut tre amlior,
- soit en balisant le chemin et en rservant de la bande passante : la rservation de
ressources stablit via le protocole de rservation RSVP (Ressource Reservation
Protocol). Ces rservations sont demandes par le rcepteur et adresses priodiquement
aux diffrents routeurs.
- soit en affectant des priorits aux paquets contenant des donnes sensibles : les donnes
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 7 / 26
audio et vido sont rendues prioritaires par rapport aux autres donnes lorsque des
congestions se produisent sur des routeurs.
Ces deux derniers points, sils peuvent tre mis en oeuvre sur des rseaux privs ou sur des
rseau universitaires (Renater), restent encore pour aujourdhui largement inexploitables sur
Internet.
La qualit dune visioconfrence est galement tributaire des caractristiques du rseau
informatique local. Sur un rseau de type Ethernet, les dbits sont levs, dans la majorit
des cas 100 Mb/s (les rseaux 10 Mb/s sont viter). Mme si la bande passante
disponible est partager entre tous les utilisateurs du rseau (cest avant tout un rseau
informatique), elle est gnralement suffisante pour assurer le transit des donnes
ncessaires une visioconfrence. Les rseaux Ethernet commuts sont prfrables des
rseaux partags, car ils offrent de meilleures performances en terme dutilisation de la
bande passante. En scrutant ladresse du destinataire dans chaque paquet IP, le switch ou
commutateur naiguille le paquet que vers la sortie correspondant la seule machine
destinatrice, par opposition au HUB avec lequel un message mis par une machine est
visible par lensemble des machines, mme sil ne peut tre exploit que par celle qui est
destinataire. Le switch est un aiguillage automatique, le hub une prise multiple !
La fluidit dans le rseau pourra tre galement amliore par la prsence dun quipement
particulier, le GateKeeper. Ce dispositif spcifique pour la visioconfrence (mais facultatif)
a principalement un rle dannuaire, mais il peut galement participer la gestion des flux
en rgulant le trafic supplmentaire gnr par la sance de visioconfrence : il pourra par
exemple interdire un interlocuteur de participer une session si le trafic gnr risque de
saturer le rseau. Ce point sera abord dans un prochain paragraphe.
Dans un tablissement scolaire cbl, en sappuyant sur un rseau qui est gnralement
largement dploy dans la quasi totalit des salles, il est possible de raliser facilement et
rapidement une session de visioconfrence en tout lieu, puisquil suffit simplement de
disposer dun prise rseau proximit pour y connecter un quipement, quil soit
individuel ou destin un usage collectif. Cette souplesse dutilisation nest pas possible
avec le RNIS, les lignes ntant gnralement dployes que dans quelques salles
spcifiques. A ces facilits, sajoutent des avantages conomiques : pas de cot de
communication, pas dabonnement spcifique, si ce nest celui de la connexion haut dbit
Internet, mais dj comptabilis par ailleurs car indispensable. A noter que sur les accs de
type ADSL qui sont majoritairement proposs aujourdhui, les liaisons sont asymtriques :
les dbits sont diffrents dans le sens montant et dans le sens descendants, par exemple 1024
Kb/s en rception mais seulement 128 Kb/s en mission1. Dans une session de
visioconfrence simple entre deux points, les dbits ncessaires sont identiques dans les
deux sens (les liaisons sont symtriques). Dans lexemple prcdent, sauf fonctionnalit
spcifique, cest la valeur commune (donc ici 128 Kb/s) qui pourrait tre automatiquement
adopte par les deux quipements.
La technologie DSL (Digital Subscriber Line) est une grande famille de normes. LADSL (Asymmetric
Digital Subscriber Line), asymtrique comme son nom lindique, est lun de ses lments. Des versions
symtriques existent aussi.
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 8 / 26
Quelques chiffres pour fixer les esprits : une squence vido numrique non compresse de qualit studio de
tlvision exige un dbit de 166 Mb/s. La diffusion dun programme tlvis dans le cadre dun bouquet
numrique satellitaire (TPS, Canal Sat) ou par un rseau cbl urbain seffectue avec des dbits de 4 6 Mb/s.
Pour les matriels de visioconfrence, les dbits proposs sur les quipements sont au maximum de 1 2 Mb/s,
mais restent le plus souvent limits quelques centaines de Kb/s.
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 9 / 26
Diffrents codecs sont proposs dans les normes. Ils sont diffrents pour laudio et pour la
vido.
Les codecs pour laudio ont pour nom gnrique G7xx. : G711 peu utilis, G723.1, G728,
G729 Ils offrent des bandes passantes qui restent limites aux environs de 3 KHz, ce qui
ne correspond, ni plus ni moins, qu la qualit tlphonique. Ces codecs diffrent par le
dbit ncessaire pour obtenir cette qualit (et donc par leur complexit 3). G722 permet une
restitution de meilleure qualit avec une bande passante atteignant 7 KHz offrant de ce fait
un meilleur confort dcoute. Diffrentes dclinaisons de cette norme ont t prvues. Si la
premire version tait prvue pour des dbits compris entre 48 et 64 Kb/s, la version G.722.2
permet dobtenir la mme qualit pour des dbits pouvant descendre jusqu 6,6 Kb/s. Des
codecs propritaires peuvent galement tre prsents, par exemple le codec TDAC
dvelopp par France Telecom qui offre une bande passante de 7 KHz.
Des nouveaux codecs plus performants ont t dvelopps plus rcemment. La socit
Polycom a ainsi implment sur ces matriels sa technologie VSX Siren 14 qui permet
dobtenir un son de qualit avec une bande passante de 14 KHz. Une restitution
strophonique est galement disponible sur certains modles. Tandberg a pour sa part
intgr un codec AAC-LD (Advanced Audio Coding Low Delay). AAC est un codage
standardis par l'ISO (International Organisation for Standardisation) et faisant partie de la
spcification MPEG-4. Sa particularit est doffrir des encodages de qualit avec des temps
de calcul trs courts (do lappellation Low Delay) : il convient donc particulirement bien
pour des applications bidirectionnelles comme la visioconfrence.
Pour la vido, trois normes de compression peuvent tre utilises. H261 est la plus ancienne
(elle a t labore par le CCITT entre 1988 et 1990) et a t dveloppe lorigine pour une
utilisation sur RNIS. La norme H263 est plus rcente mais elle est aussi plus performante et
3
Pour une qualit donne, plus le dbit obtenu est faible et plus les circuits de compression doivent tre
performants.
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 10 / 26
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 11 / 26
Pour une image de tlvision, le dbit traditionnel est de 25 images par seconde (30 pour le
continent amricain). On pourra retrouver ces valeurs sur les dpliants commerciaux fournis
par les fabricants dquipements de visioconfrence (15 images par secondes au maximum
sur les plus petits matriels). Pratiquement, les chiffres rels sont bien plus faibles. Il ne faut
pas oublier que ces valeurs ne pourront pas tre atteintes si les dbits sur le rseau ne sont
pas suffisants (notamment pour les rseaux IP en cas de congestion). De ce fait, une fluidit
correcte des images ne sera pas toujours obtenue.
Les matriels de visioconfrence disposent souvent de sorties informatiques qui
permettent la connexion dun moniteur informatique ou dun vido projecteur pour une
visualisation sur grand cran. Les rsolutions graphiques habituellement proposes sont :
SXGA : 1280 x 1024
XGA : 1054 x 768
SVGA : 800 x 600
VGA : 640 x 480
norme H239 a t dveloppe pour faire suite aux solutions propritaires qui avaient t
dployes ( Duo Video pour Tandberg, People and Content pour Polycom). Elle est
apparue au dbut de lanne 2004 et a t implmente sur les premiers produits six mois
plus tard. Les participants distants peuvent visualiser les deux images, soit sur un seul cran
(lune des images est en incrustation), soit sur deux crans distincts. Pour une image
informatique (diffuse via lentre XGA), la qualit de la restitution dpendra du type
daffichage utilis sur le site distant. Avec un tlviseur ou un moniteur vido, elle pourra
souffrir du transcodage (XGA vers H261 /H263) et sera affiche dans le format CIF (352 x
288) alors quavec un moniteur informatique elle conservera sa dfinition et sa qualit
dorigine (matriels Aethra notamment).
Certains matriels disposent dune fonction PowerPoint intgre permettant la diffusion
et la gestion dune prsentation dans ce format sans avoir recours un micro-ordinateur
extrieur. Le document est stock en local (aprs transfert sous IP partir dun poste
informatique reli au rseau, cest le cas par exemple avec les matriels Aethra) ou sur des
priphriques de stockage de type Memory Stick ou similaires (Sony). Pour en faciliter
lexploitation, lquipement de visioconfrence intgre alors toutes les fonctionnalits
spcifiques ncessaires lexploitation dun document de ce genre : affichage en local et en
mode vignette de lintgralit de la prsentation, modification de lordre des diapositives,
suppression Laffichage (tout comme celui de toute image fixe, photographie ou texte) est
ralis par rfrence lannexe D de la norme H 261 qui avec une rsolution de 576 lignes x
704 points permet une restitution de meilleure qualit que celle qui peut tre offerte par le
format CIF. Sur les sites distants, les diapositives seront prsentes en plein cran (avec en
incrustation limage vido de linterlocuteur) ou diffuses sur un deuxime cran.
Les dispositifs de visioconfrence individuels installs sur micro-ordinateurs disposent dun
atout supplmentaire par rapport leurs homologues de type console : ils intgrent par
construction un lment de stockage de grande contenance (le disque dur !). Tous les
documents qui y sont enregistrs peuvent tre spontanment et sans doute beaucoup plus
facilement diffuss vers lensemble des correspondants distants. Cest le cas par exemple
pour le logiciel eConf dvelopp par France Telecom R&D et de sa fonction Drag and
Stream Multimedia . Il permet la diffusion facile de tout fichier vido (format mpeg, avi,
mov, qt) ou audio (wav, mp3..) avec de surcrot la possibilit dassurer simultanment un
commentaire vocal ou crit.
Avec certains matriels (Aethra, Sony), il sera galement possible de renforcer limpact
dune session de visioconfrence par une diffusion vido et audio en direction du rseau IP
de ltablissement ou plus gnralement vers Internet. Certains quipements intgrent en
effet une fonction serveur de streaming. Sous condition daccs par mot de passe, et aprs
connexion ladresse IP du serveur, elle permet tout un chacun de suivre distance le
droulement de la visioconfrence sur son propre poste informatique. Cest bien de diffusion
(audio et vido) dont on parle, et donc sans aucune interactivit possible, mais dans ce cadre,
le nombre de spectateurs est illimit. Cette diffusion audio et vido pourra tre ralise
en unicast ou en multicast (voir encadr), et, en fonction du choix opr par le fabricant,
dans lun des formats vido habituellement disponible sur Internet (Real, Windows Media
ou Quick Time).
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 13 / 26
les signaux audio, vido, de contrle propres la session. Cette transmission sappuie sur
le protocole TCP, car il est ncessaire de conserver lintgrit des documents transmis (les
paquets perdus doivent tre r-mis).
plage de frquence de 2,4 GHz et permet un dbit thorique de 11 Mb/s. Plus rcente, la
norme 802.11g autorise des dbits qui peuvent atteindre 54 Mb/s. Dans les deux cas, les
liaisons sont bi-latrales mais restent limites de courtes distances (100 m en champ libre
mais beaucoup moins lintrieur dun btiment).
Lquipement de visioconfrence est quip dun module spcifique dmission et rception.
Une borne dmission rception relie au rseau local de ltablissement doit tre prsente
faible distance.
La confidentialit avec le cryptage AES (Advanced Encryption Standard) :
Les matriels de visioconfrence offrent dsormais des dispositifs dencryptage qui
permettent dassurer la confidentialit des changes, avec des communications qui sont
scurises et chiffres. Cest une possibilit qui est propose pour les entreprises
sensibles mais qui ne concerne pas directement le monde de lducation. Cette
fonctionnalit est totalement transparente pour lutilisateur. Diffrentes normes existent
H233, H234 la plus rcente tant H 235.
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 17 / 26
Sous IP, des contraintes lies aux rseaux locaux et leurs quipements spcifiques
Paralllement aux difficults inhrentes Internet et dj voques dans les chapitres
prcdents, la visioconfrence sous IP souffre galement des maux lis certains dispositifs
informatiques spcifiques mis en place dans les rseaux locaux dentreprise. Situs la
frontire entre le rseau local et le rseau extrieur, ces dispositifs sont principalement de
deux ordres : ceux destins assurer la gestion des adresses IP de lensemble des microordinateurs connects au rseau local et ceux destins assurer la scurit et la protection
des connexions (FireWall). Dans le cadre dune visioconfrence, ces quipements induisent
des difficults dexploitation particulires quil est ncessaire de bien connatre.
La gestion des adresses
Sur Internet tout comme sur les rseau locaux de type Ethernet, chaque poste informatique
se voit affecter un identifiant unique appel adresse IP. Deux postes sur un mme rseau
(Internet tant considr comme lun dentre eux) ne peuvent pas avoir la mme adresse IP.
Ces adresses sont codes sur 4 octets de 8 bits (soit 32 bits)4 dans la version actuelle du
protocole IP et leur nombre est par consquent limit. Cette limitation devrait disparatre
avec la future version IPv6.
La technique de translation dadresse (NAT en anglais pour Network Address Translation) a
t mise au point pour grer la pnurie dadresses possibles face aux besoins croissants
dInternet. Il a ainsi t dcid de rpartir le volume des adresses possibles en deux sous
ensembles : les adresses publiques (utilisables sur Internet) et les adresses prives
(employables uniquement lintrieur des rseaux privs). Sur les rseaux locaux, ces
dernires peuvent tre utilises sans dautre restriction que ne pas attribuer deux fois la
mme adresse dans un mme rseau local. Compte tenu de ce confinement, il ny a aucun
risque de conflit lorsquune mme adresse prive est utilise sur des rseaux locaux
diffrents.
Sachant quune adresse prive ne peut pas tre utilise sur Internet, lorsquun poste souhaite
se connecter, le mcanisme de translation dadresse va remplacer ladresse prive prsente
dans lentte de chacun des paquets par une adresse publique avant de router ensuite le
paquet vers lextrieur. Il ralisera lopration inverse au retour de la rponse. Cette
translation pourra tre statique ( chaque adresse prive correspondra toujours la mme
adresse publique) ou dynamique (il ny a pas dassociations prdfinies). Dans ce cas,
ltablissement disposera en gnral de moins dadresses publiques au regard du nombre de
postes rellement prsent dans le rseau local. Elles seront attribues par le systme au fur et
mesure des demandes de connexion. Plusieurs utilisateurs pourront se voir attribuer la
mme adresse, la diffrenciation au retour entre les donnes destines aux uns et des autres
et la dtermination du poste metteur original seffectuant alors sur dautres critres.
Outre le fait que la technologie de la translation dynamique dadresses permet de limiter le
nombre dadresses publiques utilises par un rseau souvrant sur lextrieur, elle permet
aussi dassurer la protection des machines internes contre des actions malveillantes en
provenance dInternet puisque leur adresse IP relle nest en fait pas directement visible
de l extrieur . Cette fonction de scurit est la deuxime raison de lexistence des NAT.
4
Elles sont indiques par quatre nombre compris entre 0 et 255 spars par un point (par exemple
194.250.164.58 est lune dentre elles) ce qui reprsente environ 4,3 milliards dadresses possibles.
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 18 / 26
Ce dispositif nest malheureusement pas pris en compte par certaines des normes (H225 ou
H245) utilises dans le cadre des visioconfrences. Ces deux normes nexploitent pas les
adresses contenues dans les enttes, mais elles inscrivent (et utilisent ensuite) des
informations dadresse quelles placent dans le corps mme du paquet (dans le schma cidessous, cest ladresse prive du terminal A qui va tre ainsi transmise au terminal B lors de
lappel initial de A). Compte tenu de sa localisation dans la charge utile, cette adresse nest
pas transforme par le NAT. En tentant dexploiter cette information pour rpondre,
lquipement de visioconfrence distant ne peut trouver quune adresse prive totalement
inexploitable sur Internet. Ltablissement de la session de visioconfrence est impossible.
Certains quipements de visioconfrence intgrent des fonctionnalits spcifiques (fonction
NAT IP Adress mask pour Vcon, Aethra NAT pour Aethra) qui permettent de
pallier cet tat de fait (via un menu de configuration, lutilisateur peut indiquer
manuellement ladresse IP publique qui sera systmatiquement attribue). Lutilisation de
firewall ou de proxy compatibles H323 (voir chapitre suivant) sont aussi des mthodes pour
rsoudre ces cas de figure.
Incompatibilit entre les dispositifs de translation dadresses (NAT) et les normes H323 : suite la sollicitation initiale
de A, la rponse du terminal B ne peut pas aboutir : il ne connat de A que ladresse prive qui tait contenue dans la
charge utile des paquets (qui na pas t translate par le NAT) et qui nest pas utilisable sur Internet.
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 19 / 26
Les firewalls bloquent la plupart des paquets non sollicits, ici une tentative de connexion
pour une visioconfrence. Pour que la communication stablisse, de nombreux ports
doivent tre ouverts sur le FireWall, commencer par le port 1720 qui est utilis lors de
linitialisation de la liaison.
Un firewall va galement assurer la surveillance des ports qui sont utiliss. Sur un microordinateur, chaque application logicielle se voit attribuer un port (le port est en quelque sorte
ladresse dune application). Lors dune connexion classique Internet la majorit
des ports sont ferms sur le firewall, seuls les quelques uns qui correspondent aux
applications directement concerns sont ouverts. Dans le cadre de la visioconfrence, de
nombreuses connexions doivent tre simultanment maintenues entre les terminaux, et de
nombreux ports doivent y tres ouverts, certains alatoirement (cest dire sans que lon
puisse prvoir pralablement leur numro). Cette notion de ports dynamiques ne facilite pas
la configuration des firewall : pas question de laisser tous les ports entre 1024 et 65535
ouverts ! Sauf mise en place de dispositifs particuliers, louverture de tous ces ports sont
autant de failles dans la scurit globale dun rseau local. A linverse, du fait des dispositifs
de protection adopts par les administrateurs de rseau, la mise en place de sances de
visioconfrence peut se rvler difficile, parfois mme impossible.
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 20 / 26
Type
Statique
Statique
Dynamique
Dynamique
Dynamique
Protocoles
UDP
TCP
TCP
UDP (RTP)
UDP (RTCP)
Description
Gatekeeper RAS
Q.931 (Call Setup)
H245 (Call parametrers)
Video and audio Data Stream
Control Video and audio Stream
Statique
Statique
TCP
TCP
Un proxy est une passerelle spcialise qui va permettre des flux H323 de traverser dans certaines conditions
les firewall
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 23 / 26
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 24 / 26
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 25 / 26
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 26 / 26