Vous êtes sur la page 1sur 26

Visioconfrence : les technologies daujourdhui

Sommaire
Deux modes de transmission :
o Transmission via Numeris
o Transmission sous IP. Les protocoles
Deux familles de normes : H320 et H323
o Des normes et des formats
o Transmettre la vido et laudio
o Prsenter et partager des documents
o Nouveauts et volutions
Les contraintes lies aux rseaux locaux et leurs quipements spcifiques
o La gestion des adresses IP
o Le passage des firewalls
o Un outil particulier : le Gatekeeper
La visioconfrence en multi points
Interconnecter les deux familles : les passerelles

On appelle visioconfrence la technologie multimdia qui permet deux ou plusieurs


interlocuteurs distants de communiquer en temps rel par lintermdiaire dun dispositif de
sonorisation et de visualisation (crans, tlviseurs) et de travailler sur des documents
communs (textes imprims, photographies, mdias audiovisuels ou informatiques).
La mise en relation de deux groupes de personnes grce limage et au son sappuie sur
deux entits technologiques distinctes : dune part, un rseau de transmission et dautre part,
des quipements et des terminaux spcifiques pour les utilisateurs. Des dispositifs
particuliers ont t dvelopps pour permettre des relations entre plusieurs groupes (liaison
multipoint).
Le rseau de transmission assure lacheminement de toutes les informations (images, sons,
donnes informatiques, signaux de services) entre les diffrents points.
Traditionnellement, cette fonction soprait via le Rseau Numrique de France Telecom
plus connu sous le nom commercial de Numeris. Avec le dveloppement de lInternet et des
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 1 / 26

rseaux dentreprises, on assiste aujourdhui une vritable monte en puissance de


dispositifs qui sappuient dsormais sur les technologies et sur les protocoles utiliss pour
Internet (et plus communment nomms sous IP pour Internet Protocol).
Les quipements pour les utilisateurs sont placs aux points terminaux. Quelle que soit la
technologie utilise pour lacheminement des donnes, ces quipements vont reposer sur les
mmes principes de base, mme sils ne sappuient pas exactement sur les mmes normes.
Un dispositif de visioconfrence, quil soit construit autour dun micro-ordinateur pour un
usage individuel ou autour dquipements spcifiques pour une utilisation collective, sera
toujours compos de la mme srie de composants : une (ou plusieurs) camra, un (ou
plusieurs) microphone, les codecs, les dispositifs de visualisation (tlviseurs, moniteurs,
vido projecteur, crans numriques), linterface rseau Des lments annexes (pont,
passerelle, gatekeeper) pourront tre ajouts le cas chant lorsque des fonctionnalits
plus tendues seront ncessaires.

Architecture gnrale dun dispositif de visioconfrence sous IP.

Ce document fera le point sur toutes ces technologies. Cependant, compte tenu du fort
dveloppement des visioconfrences sous IP, laccent sera donn sur cette technologie.
Le dernier chapitre abordera la problmatique des rseaux locaux et des contraintes quils
induisent gnralement dans le bon fonctionnement dune session de visioconfrence.
Cette tude se limitera aux utilisations traditionnelles, (en entreprise, dans les lyces) mais
nabordera pas la problmatique des tablissements de lenseignement suprieur qui, en
ayant la possibilit dtre raccords au rseau haut dbit Renater, disposent de spcificits
et doutils particuliers qui ne sont pas encore proposs sur lInternet classique.

MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 2 / 26

Deux modes de transmission


Pour tablir une visioconfrence entre deux sites, deux modes de transmission sont donc
aujourd'hui privilgis : le rseau Numeris de France Telecom dune part, les rseaux IP au
sens large du mot, cest dire le rseau Internet dans son aspect mondial, et les rseaux
informatiques locaux (de type Ethernet par exemple) qui y sont connects. Les deux
modes de transmission ont en commun dtre tous les deux entirement numriques, mais la
similitude sarrte l. Des diffrences fondamentales existent. Les deux modes de diffusion
sont technologiquement trs diffrents et sappuient sur deux familles de normes
spcifiques : lun est plus ancien, et bien ancr dans les habitudes, le second est plus rcent
et se dveloppe actuellement de manire importante mme sil nest pas toujours le plus
performant.
Les liaisons entre les sites distants sont en temps rel et en full duplex (les liaisons sont bidirectionnelles et chaque site est simultanment metteur et rcepteur). Les dbits sont
identiques dans les deux sens.
La majorit des matriels commercialiss en France depuis 5 ans peuvent fonctionner sous
IP. Un grand nombre dentre eux adoptent la double compatibilit IP et RNIS.
Numeris
Le rseau de tlcommunication numrique de France Telecom (RNIS pour Rseau
Numrique Intgration de Service, en anglais ISDN - Integrated Service Digital Network),
plus connu en France sous le nom commercial de NUMERIS, est disponible en France
depuis le dbut des annes 1990. Cest un rseau numrique de bout en bout (par opposition
au rseau tlphonique (RTC) o les liaisons terminales avec lusager sont toujours
analogiques) et le dbit y est garanti. Un accs dit de base comprend deux canaux B 64
kb/s pour les donnes soit un dbit utile de 128 Kb/s, et un canal pour la signalisation (canal
D 16 Kb/s). Des dbits suprieurs, 256 Kb/s ou 384 Kb/s, sont possibles par le
regroupement de plusieurs accs de base. Des couplages plus importants sont galement
ralisables : un accs dit primaire comprend 30 canaux B 64 Kb/s ce qui correspond
alors un dbit utile de 2 Mb/s. La qualit des images (et dans une moindre mesure des
sons) est directement dpendante du dbit possible dans le rseau de transmission : plus il
sera lev et meilleure sera la restitution. Pour obtenir une fluidit correcte des images, il est
ncessaire dopter au minimum pour une liaison 384 Kb/s.
A limage dune communication tlphonique classique, on tablit une connexion
temporaire pour mettre en relation les interlocuteurs distants (on utilise le terme de
commutation de circuit). Elle permet ltablissement dun chemin direct qui est ddi la
communication entre les points participants. Toutes les donnes vont suivre le mme chemin
pendant toute la dure de la session. La qualit de service est assure : le dbit tant garanti,
la qualit des images et des sons nest pas sujette variations, voire des coupures. On a
une qualit de service optimum, ce qui nest pas le cas, on le verra avec les technologies
sous IP.
Numris est disponible sur abonnement auprs de France Tlcom. Le RNIS est
pratiquement disponible dans le monde entier et est normalis. Comme pour le tlphone, les
communications sont factures en fonction de la dure de la communication et de la
distance. Le cot est galement proportionnel au nombre de canaux B utiliss. De ce fait,
dans la majorit des cas, les dbits adopts ne dpasseront pas 384 Kb/s.

MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 3 / 26

La visioconfrence sous IP : des avantages mais aussi des contraintes spcifiques


Le titre gnrique de visioconfrence sous IP est utilis dans son sens le plus large, cest
dire pour dsigner des visioconfrences qui sappuient la fois sur les technologies
dInternet mais aussi sur celles des rseaux privs ou locaux (rseaux Ethernet, Intranet ).
A linverse de Numeris, la visioconfrence sur IP repose, en ce qui concerne sa transmission
sur les rseaux, sur des principes techniques totalement diffrents. Cette technologie apporte
de nombreux avantages mais engendre aussi des inconvnients spcifiques.
La visioconfrence sur IP utilise une infrastructure qui na pas t conu lorigine pour des
applications vido. Que ce soit sur Internet ou dans le cadre du rseau informatique dun
tablissement, les lignes utilises sont parcourues par des flux divers et varis, leurs
capacits en terme de bande passante doivent tre partages en permanence entre de
nombreuses applications ou priphriques informatiques Le dbit possible (et donc la
qualit de la transmission) dpend directement de la charge du rseau un moment donn et
peut donc tre trs variable en fonction du moment. Le dbit ny est pas garanti do le
risque dune mauvaise fluidit des images et des sons.
A loppos de la visioconfrence sur RNIS pour laquelle on tablit une liaison directe et
permanente entre les participants et o toutes les informations numriques circulent sous la
forme dun flux continu avec un dbit constant, (et donc avec une qualit de service
constante), les donnes numriques sur un rseau IP sont dcoupes en paquets. Ces paquets
circulent sur le rseau et sur Internet totalement indpendamment les uns des autres. Ils
peuvent, en toute autonomie, prendre des itinraires diffrents (en plus des donnes
utiles , chacun dentre eux intgre une entte contenant diffrentes informations,
notamment ladresse IP darrive). Ces paquets peuvent parvenir destination avec des
carts variables et pas ncessairement dans le bon ordre voire tre dtruits en cours de route.
De prime abord, ces caractristiques pourraient paratre totalement incompatibles pour une
restitution correcte de la vido et de laudio qui exige par nature un flux continu et rgulier.
Sur le plan qualitatif, les problmes de transit voqus peuvent se matrialiser lcran par
une dgradation des images (apparition dartefacts) voire leur gel ou leur disparition
complte. Des technologies particulires ont t dveloppes pour adapter les rseaux IP au
contraintes du transport des donnes vido et audio en temps rel.

Sur un rseau IP, les donnes sont dcoupes en paquets. Lentte contient des
informations pour le routage, notamment ladresse IP du poste expditeur et celle du poste
destinataire.

Conu lorigine pour des applications qui ntaient pas multimdia, Internet repose la
base sur deux protocoles IP et TCP. Le protocole IP assure lacheminement des paquets de
point en point, jusquau terminal final mais sans se proccuper du contenu. Il ne gre pas les
pertes et les retards. Ce protocole simple mais peu fiable est complt par le protocole TCP
qui assure la fiabilit de la transmission en demandant la r-mission des paquets perdus ou
dtruits. Du fait de cette procdure de r-mission, TCP est un protocole lent. Cette fiabilit
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 4 / 26

qui est un atout pour la transmission de fichiers informatiques devient, du fait de la


lenteur, un inconvnient pour la transmission de la vido et de laudio.
Encadr 1 : Dans le cadre dune visioconfrence, les changes sont
symtriques. Sur un rseau IP, le dbit pour chacune des directions est la
somme des dbits ncessaires pour laudio, la vido, et les donnes. Il faut y
ajouter les informations ncessaires la transmission des paquets et qui sont
contenues dans lentte de chacun des paquets (compter environ 20%). Une
visioconfrence tablie entre deux centres avec une vido 384 Kb/s et de
laudio 64 Kb/s, engendrera sur le rseau un dbit total de deux fois (384 +
64) x 1,2 = 540 Kb/s soit un total de plus de 1 Mb/s.
Encadr 2 : Un des principaux problmes des rseaux est la congestion ou la
surcharge du trafic qui va provoquer des retards et les dlais dans
lacheminement des paquets ( larrive, les carts temporels entre paquets ne
sont pas identiques ce quils taient au dpart : on appelle cela la gigue). On
utilise souvent le terme de "qualit de service" (QoS) pour caractriser
laptitude dun rseau assurer la transmission des donnes.
La qualit de service "best effort" est celle qui est fournie traditionnellement
par l'Internet et correspond en fait une absence de qualit de service. La
notion de priorit nexiste pas, le rseau traite de faon identique tous les flux
qui circulent chaque instant, quel quen soit le contenu. Les dgradations
(ralentissements, pertes) dues aux ventuelles surcharges sont rparties
galit entre tous. Le rseau "fait de son mieux" (best effort) pour acheminer le
plus efficacement possible la totalit des donnes, sans s'inquiter des besoins
spcifiques correspondant chacun des flux, et donc sans tablir de
diffrenciation entre les donnes audiovisuelles et les donnes
informatiques .

Pour compenser la lenteur de TCP, on a ainsi cr le protocole UDP (User Datagram


Protocol), un protocole simplifi lextrme, sans r-mission des paquets perdus mais qui
prsente lavantage dtre beaucoup plus rapide. Au cours dune session de visioconfrence,
les deux protocoles TCP et UDP sont simultanment utiliss conjointement avec IP en
fonction des caractristiques des donnes transmettre : TCP pour les donnes ne souffrant
aucune perte (tablissement des appels, signalisation et gestion des communications,
applications informatiques partages) et UDP pour la transmission bilatrale des signaux
audios et vidos pour lesquels une transmission en temps rel est exige et o des pertes
peuvent tre tolres.
Ces protocoles majeurs ont t complts par des protocoles spcifiques et par des
mcanismes particuliers destins optimiser la transmission des donnes audiovisuelles.
Le protocole RTP (Real-time Transport Protocol) contrle les flux vido et audio dans les
applications en temps rel. Il assure la numrotation des squences, ajoute une rfrence
temporelle (timestamp) qui indique linstant exact dmission du paquet la source
permettant ainsi larrive de replacer les paquets dans le bon ordre, et de rtablir la
rgularit temporelle. Sous le terme de Packet Assist, la socit VCON rassemble sur ses
matriels tout un package de fonctionnalits destines justement compenser tous ces
dfauts temporels : Packet Ordering pour replacer les paquets dans le bon ordre, Jitter
Correction pour recaler leur squencement, Lip Sync Correction pour raliser la resynchronisation des donnes audio et vido et Lip Sync Delay Ajustment pour modifier
ventuellement le dcalage entre le son et limage (et compenser une dsynchronisation

MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 5 / 26

possible entre le mouvement des lvres et la voix des intervenants). Des dispositifs
similaires sont proposs chez les autres fournisseurs.

Rien que le transfert des donnes vido et audio, pas moins de 8 flux RTP et RTCP sont gnrs et transfrs sous UDP.
A chacun des flux RTP unidirectionnel qui transporte des donnes audio ou vido correspond un flux bi-directionnel
RTCP qui ne transporte que des donnes de supervision.

Loptimisation de la qualit des transmissions passe galement par limplmentation de


mcanismes spcifiques au niveau des applications terminales et des lments intermdiaires
du rseau (les routeurs).
Une premire tape est dadapter en temps rel le dbit de la vido en fonction des capacits
instantanes du rseau (et donc dassurer une qualit des images aussi optimale que
possible). Cette adaptation repose sur les changes qui sont tablis intervalles rguliers
entre les organes terminaux et qui sappuient sur les protocoles RTP et RTCP (Real-time
Transport Control Protocol). En fonction des compte-rendus de rception mis par le
terminal, la station mettrice modifie les paramtres de compression et de diffusion des
donnes vido (et parfois aussi audio). La qualit de la restitution va ainsi diminuer
lgrement lorsque le dbit sur le rseau devient plus faible (pour les images vido, la
dfinition sera un peu moins bonne, la fluidit moins soutenue, pour laudio, la bande
passante sera plus rduite ) et vice et versa. Dans un rseau provisoirement congestionn,
il est sans doute prfrable dafficher des images avec une qualit amoindrie - plus fortement
compresses, elles ncessitent un dbit plus faible - mais partiellement exemptes de dfauts
de transmission (peu de pertes de paquets, jitter faible) que des images de meilleure facture
(compresses pour un dbit plus lev) mais qui prsenteraient, compte tenu de la saturation
du rseau, des taux de pertes et de jitter importants et donc de nombreux artefacts, voire un
gel complet.
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 6 / 26

Encadr : Sur un rseau IP, la circulation des donnes obit trois grands principes.
Avec mon premier, les donnes utiles ne circulent pas en un flot continu sur le rseau mais
sont dcoupes en paquets. A chacun dentre eux est affect une entte (header en
anglais) qui contient des informations pour le service.
Avec mon second, le traitement de linformation est hirarchis sous la forme de couches
fonctionnelles, chacun dentre elles correspondant une fonctionnalit prcise (couche
application, couche transport, couche rseau) et donc un ou plusieurs protocoles
spcifiques.
Concrtement, le flux dinformations transform en paquets est transmis de couche en
couche. Chacune dentre elles ajoute cependant ses propres informations de service aux
donnes utilisateurs correspondant aux divers protocoles utiliss. A la manire de poupes
russes sembotant les unes dans les autres, chaque paquet avec sa charge utile et son entte
devient la charge utile de la couche suivante et est complte par une entte (et aussi, le cas
chant, par des octets de fin). On parle dencapsulation, cest le troisime principe.
La succession de nombreux protocoles, si elle rpond la ncessit damliorer la
transmission des donnes, a aussi pour consquence ngative un accroissement important
des donnes de service comparativement au volume des informations utiles et donc
une augmentation du volume total transmettre. Ces enttes successives contiennent des
informations qui sont, pour certaines, identiques dune entte lautre. Des techniques de
compression ont t labores pour allger le volume de ces enttes et permettre la
suppression de ces redondances lmission.

Lencapsulation des donnes (ici les donnes issues dun codec vido) : chaque couche
ajoute sa propre entte aux donnes quelle reoit de la couche suprieure.

Les deux protocoles RTP et RTCP nont donc pas pour mission dagir sur les quipements
constitutifs du rseau. Dans cette qute pour loptimisation des transmissions, une deuxime
tape est dintervenir sur tous les lments intermdiaires. Le transfert des paquets sur le
rseau peut tre amlior,
- soit en balisant le chemin et en rservant de la bande passante : la rservation de
ressources stablit via le protocole de rservation RSVP (Ressource Reservation
Protocol). Ces rservations sont demandes par le rcepteur et adresses priodiquement
aux diffrents routeurs.
- soit en affectant des priorits aux paquets contenant des donnes sensibles : les donnes
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 7 / 26

audio et vido sont rendues prioritaires par rapport aux autres donnes lorsque des
congestions se produisent sur des routeurs.
Ces deux derniers points, sils peuvent tre mis en oeuvre sur des rseaux privs ou sur des
rseau universitaires (Renater), restent encore pour aujourdhui largement inexploitables sur
Internet.
La qualit dune visioconfrence est galement tributaire des caractristiques du rseau
informatique local. Sur un rseau de type Ethernet, les dbits sont levs, dans la majorit
des cas 100 Mb/s (les rseaux 10 Mb/s sont viter). Mme si la bande passante
disponible est partager entre tous les utilisateurs du rseau (cest avant tout un rseau
informatique), elle est gnralement suffisante pour assurer le transit des donnes
ncessaires une visioconfrence. Les rseaux Ethernet commuts sont prfrables des
rseaux partags, car ils offrent de meilleures performances en terme dutilisation de la
bande passante. En scrutant ladresse du destinataire dans chaque paquet IP, le switch ou
commutateur naiguille le paquet que vers la sortie correspondant la seule machine
destinatrice, par opposition au HUB avec lequel un message mis par une machine est
visible par lensemble des machines, mme sil ne peut tre exploit que par celle qui est
destinataire. Le switch est un aiguillage automatique, le hub une prise multiple !
La fluidit dans le rseau pourra tre galement amliore par la prsence dun quipement
particulier, le GateKeeper. Ce dispositif spcifique pour la visioconfrence (mais facultatif)
a principalement un rle dannuaire, mais il peut galement participer la gestion des flux
en rgulant le trafic supplmentaire gnr par la sance de visioconfrence : il pourra par
exemple interdire un interlocuteur de participer une session si le trafic gnr risque de
saturer le rseau. Ce point sera abord dans un prochain paragraphe.
Dans un tablissement scolaire cbl, en sappuyant sur un rseau qui est gnralement
largement dploy dans la quasi totalit des salles, il est possible de raliser facilement et
rapidement une session de visioconfrence en tout lieu, puisquil suffit simplement de
disposer dun prise rseau proximit pour y connecter un quipement, quil soit
individuel ou destin un usage collectif. Cette souplesse dutilisation nest pas possible
avec le RNIS, les lignes ntant gnralement dployes que dans quelques salles
spcifiques. A ces facilits, sajoutent des avantages conomiques : pas de cot de
communication, pas dabonnement spcifique, si ce nest celui de la connexion haut dbit
Internet, mais dj comptabilis par ailleurs car indispensable. A noter que sur les accs de
type ADSL qui sont majoritairement proposs aujourdhui, les liaisons sont asymtriques :
les dbits sont diffrents dans le sens montant et dans le sens descendants, par exemple 1024
Kb/s en rception mais seulement 128 Kb/s en mission1. Dans une session de
visioconfrence simple entre deux points, les dbits ncessaires sont identiques dans les
deux sens (les liaisons sont symtriques). Dans lexemple prcdent, sauf fonctionnalit
spcifique, cest la valeur commune (donc ici 128 Kb/s) qui pourrait tre automatiquement
adopte par les deux quipements.

La technologie DSL (Digital Subscriber Line) est une grande famille de normes. LADSL (Asymmetric
Digital Subscriber Line), asymtrique comme son nom lindique, est lun de ses lments. Des versions
symtriques existent aussi.
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 8 / 26

Deux familles de normes : H320 pour RNIS et H323 pour IP

Des normes et des formats


Pour ces deux mthodes de transmission, des normes spcifiques ont t tablies afin de
garantir l'interoprabilit de tous les matriels de visioconfrence. Elabore au dbut des
annes 90, la norme H320 a t prvue pour les rseaux commutation de circuits et
s'applique donc aux communications sur les lignes RNIS. La norme H323 concerne les
rseaux commutation de paquets, cest dire notamment aux rseaux IP. Elles ont t
dveloppes par lITU (International Telecommunication Union).
Les deux normes H320 et H323 sont des normes conteneurs et correspondent en fait un
assemblage de normes spcifiques pour tous les domaines concerns. Ces dernires peuvent
tre identiques pour H320 et H323 ou bien diffrentes. Elles concernent ltablissement et
la gestion des communications, le contrle et la signalisation (H225, Q931 pour
linitialisation des appels, H245 pour la ngociation des canaux des mdias), le traitement
de la vido et de laudio, le partage dapplications (T120), le contrle des camras
distantes (H281 en mode RNIS, H282 et H283 en mode IP...) ou le fonctionnement en
multipoint (H243). Ces normes garantissent le bon fonctionnement des diffrentes phases
dune visioconfrence et linteroprabilit entre des matriels dorigines diffrentes.
Pour la transmission des donnes sur un rseau IP, la norme H323 sappuie par ailleurs sur
les protocoles de transport (TCP, UDP, RTP) dicts par lIETF (Internet Engineering
Task Force) et voqus dans le chapitre prcdent.
Transmettre la vido et laudio
Les images vido exigent des dbits importants comparativement aux autres mdias. Des
technologies spcifiques ont t dveloppes afin de diminuer la quantit dinformations
devant tre transmise et par la mme diminuer le dbit ncessaire et le rendre compatible
avec les capacits des lignes de transmission utilises (RNIS ou IP)2. Cette rduction
saccompagne invitablement dune altration de la qualit des images et de leur frquence
de dfilement. On appelle CODEC lentit charge de la COmpression des donnes audio ou
vido dans un sens ( la prise de vue) et de leur DECompression dans le sens contraire (pour
en permettre laffichage). Plus le dbit est lev et meilleure sera la qualit de la restitution,
lidal tant dobtenir la meilleure qualit possible pour un dbit qui reste le plus faible
(cest dire un taux de compression le plus lev possible).

Quelques chiffres pour fixer les esprits : une squence vido numrique non compresse de qualit studio de
tlvision exige un dbit de 166 Mb/s. La diffusion dun programme tlvis dans le cadre dun bouquet
numrique satellitaire (TPS, Canal Sat) ou par un rseau cbl urbain seffectue avec des dbits de 4 6 Mb/s.
Pour les matriels de visioconfrence, les dbits proposs sur les quipements sont au maximum de 1 2 Mb/s,
mais restent le plus souvent limits quelques centaines de Kb/s.
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 9 / 26

Compresser une squence vido,


cest diminuer la quantit dinformations la
caractrisant.
Cest donc rduire
la dimension des images,
leur frquence daffichage (avec pour
corollaire une diminution de la fluidit !)
mais cest aussi exploiter
les redondances spatiales (par exemple, les
plages uniformes lintrieur de chacune des
images),
les redondances temporelles (dans une
squence vido, les diffrences entre deux
images successives sont minimes),
les redondances subjectives (il est inutile de
coder les dtails fins que lil ne voit pas).

Diffrents codecs sont proposs dans les normes. Ils sont diffrents pour laudio et pour la
vido.
Les codecs pour laudio ont pour nom gnrique G7xx. : G711 peu utilis, G723.1, G728,
G729 Ils offrent des bandes passantes qui restent limites aux environs de 3 KHz, ce qui
ne correspond, ni plus ni moins, qu la qualit tlphonique. Ces codecs diffrent par le
dbit ncessaire pour obtenir cette qualit (et donc par leur complexit 3). G722 permet une
restitution de meilleure qualit avec une bande passante atteignant 7 KHz offrant de ce fait
un meilleur confort dcoute. Diffrentes dclinaisons de cette norme ont t prvues. Si la
premire version tait prvue pour des dbits compris entre 48 et 64 Kb/s, la version G.722.2
permet dobtenir la mme qualit pour des dbits pouvant descendre jusqu 6,6 Kb/s. Des
codecs propritaires peuvent galement tre prsents, par exemple le codec TDAC
dvelopp par France Telecom qui offre une bande passante de 7 KHz.
Des nouveaux codecs plus performants ont t dvelopps plus rcemment. La socit
Polycom a ainsi implment sur ces matriels sa technologie VSX Siren 14 qui permet
dobtenir un son de qualit avec une bande passante de 14 KHz. Une restitution
strophonique est galement disponible sur certains modles. Tandberg a pour sa part
intgr un codec AAC-LD (Advanced Audio Coding Low Delay). AAC est un codage
standardis par l'ISO (International Organisation for Standardisation) et faisant partie de la
spcification MPEG-4. Sa particularit est doffrir des encodages de qualit avec des temps
de calcul trs courts (do lappellation Low Delay) : il convient donc particulirement bien
pour des applications bidirectionnelles comme la visioconfrence.
Pour la vido, trois normes de compression peuvent tre utilises. H261 est la plus ancienne
(elle a t labore par le CCITT entre 1988 et 1990) et a t dveloppe lorigine pour une
utilisation sur RNIS. La norme H263 est plus rcente mais elle est aussi plus performante et
3

Pour une qualit donne, plus le dbit obtenu est faible et plus les circuits de compression doivent tre
performants.
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 10 / 26

a t plus particulirement adapte pour les communications faibles dbits. La norme


H263+ est une amlioration de H263 et prend mieux en compte les spcificits des rseaux
IP.
Des dveloppements rcents ont t raliss en direction de la norme MPEG-4 et plus
particulirement vers le dernier codec vido, baptis sous le double nom de H264 et Mpeg 4
part 10 (mais que lon trouve parfois aussi sous lappellation AVC pour Advanced Video
Coding). Sur le plan qualitatif, les gains apports sont importants. Pour des dbits infrieurs
1 Mb/s, ce codec dlivre, dbit gal, un niveau de qualit dimage de 30 50 % suprieur
celui de la premire gnration de codecs MPEG-4 ASP (Advanced Simple Profile) et par
comparaison de 60 % suprieur celui du MPEG-2 qui est utilis pour la tlvision
numrique ou le DVD. Appliqu la visioconfrence, il va permettre, qualit dimage
gale, une rduction importante des dbits ncessaires ou en dautres termes, pour des dbits
quivalents ceux utiliss aujourdhui une amlioration de la qualit et de la fluidit des
images. On estime gnralement, quavec une connexion de type RNIS, la qualit obtenue
aujourdhui 256 Kb/s est identique celle que lon obtenait hier 384 Kb/s avec un autre
codec.
Diffrents fabricants ont dj implment H264 sur leurs matriels. Des quipements pour
micro-ordinateurs commencent aussi intgrer cette possibilit. Le processus de
normalisation de ce codec est aujourdhui abouti (depuis juin 2004) ce qui devrait parfaire
linteroprabilit entre les diffrents matriels.
Pour pouvoir profiter pleinement des avantages apports par H264, il faut bien videmment
que ce codec soit prsent au deux extrmits de la chane, faute de quoi le systme basculera
automatiquement sur un autre codec, H263 par exemple. Ces innovations techniques se
traduisent par une complexit accrue des dispositifs de traitement. Les ressources
machines sont trs sollicites (on estime parfois quavec H264, il faut quatre fois plus de
ressources machines quavec H263) et plus encore pour celles qui intgreront un pont multisites (ces quipements doivent grer les flux issus des diffrents sites, les puissances de
calcul doivent tre multiplis dautant). Du fait de cette complexit accrue, les quipements
H264 en multipoint ne sont pas encore disponibles sur le march.
Diffrents formats dimages ont t dtermins par les normes. Ils sont dfinis en fonction
du nombre de lignes (dans le sens vertical) et de points (dans le sens horizontal) qui
constituent limage vido. Le format CIF (Common Interchange Format) est le format de
base de la visioconfrence. Il se compose de 352 points sur 288 lignes et correspond environ
un quart de lcran sur un tlviseur.
Des formats drivs, multiples et sous multiples, ont t galement dfinis ainsi que le
montre le tableau ci-dessous. Ces valeurs sont comparer celles adoptes pour une image
de tlvision classique (720 points x 576 lignes).
Formats
CIF
QCIF
SQCIF
4CIF
16CIF

Common Interchange Format


Quarter CIF
sub quarter CIF
4 x CIF
16 x CIF

Nb de points /nb de lignes


(pour la luminance)
352 x 288
176 x 144
128 x 96
704 x 576
1408 x 1152

MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 11 / 26

Pour une image de tlvision, le dbit traditionnel est de 25 images par seconde (30 pour le
continent amricain). On pourra retrouver ces valeurs sur les dpliants commerciaux fournis
par les fabricants dquipements de visioconfrence (15 images par secondes au maximum
sur les plus petits matriels). Pratiquement, les chiffres rels sont bien plus faibles. Il ne faut
pas oublier que ces valeurs ne pourront pas tre atteintes si les dbits sur le rseau ne sont
pas suffisants (notamment pour les rseaux IP en cas de congestion). De ce fait, une fluidit
correcte des images ne sera pas toujours obtenue.
Les matriels de visioconfrence disposent souvent de sorties informatiques qui
permettent la connexion dun moniteur informatique ou dun vido projecteur pour une
visualisation sur grand cran. Les rsolutions graphiques habituellement proposes sont :
SXGA : 1280 x 1024
XGA : 1054 x 768
SVGA : 800 x 600
VGA : 640 x 480

Prsentation et partage de documents


Une session de visioconfrence ne se rsume pas uniquement des changes oraux entre des
intervenants distants, mais saccompagne souvent de la diffusion et de la prsentation de
documents annexes. Proposs par lun ou lautre des participants, ces mdias doivent
pouvoir tre diffuss en direction de lensemble des sites. Ils peuvent tre de diffrentes
natures (images fixes, photographies, squences vido, fichiers informatiques, ou plus
simplement, notes et schmas ralises en direct sur un tableau blanc) et proposer des
degrs dinteractivit variables. Ces prsentations peuvent tre mises en oeuvre de
diffrentes faons.
La diffusion simple :
Cest la possibilit la plus simple, puisquil ne sagit que de prsenter un document, sans
aucune interactivit possible. Pour la projection des documents vido, les dispositifs de
visioconfrence sont gnralement munis dentres composites ou S-Video permettant la
connexion dquipements de lecture, magntoscopes VHS par exemple. Ces entres peuvent
tre galement utilises pour le raccordement dun banc titre. Constitu dune camra vido
fixe verticalement sur un pitement, cet quipement permet de prsenter des petits objets ou
des documents papiers .
Des entres analogiques dans des formats informatiques courants sont galement
proposs pour le raccordement des micro-ordinateurs. Il ne sagit pas ici de vouloir raliser
un travail collaboratif et interactif avec les partenaires distants mais seulement de diffuser
limage cran dun contenu informatique via une liaison de type XGA entre lordinateur et le
dispositif de visioconfrence. Cest une solution simple qui ne ncessite quun seul
ordinateur, et qui nimplique pas la mise en place de logiciels spcialiss.
Des dispositifs particuliers ont t dvelopps par les industriels pour permettre la diffusion
simultane de deux sources vido ou dune source vido et dun flux XGA. Une nouvelle
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 12 / 26

norme H239 a t dveloppe pour faire suite aux solutions propritaires qui avaient t
dployes ( Duo Video pour Tandberg, People and Content pour Polycom). Elle est
apparue au dbut de lanne 2004 et a t implmente sur les premiers produits six mois
plus tard. Les participants distants peuvent visualiser les deux images, soit sur un seul cran
(lune des images est en incrustation), soit sur deux crans distincts. Pour une image
informatique (diffuse via lentre XGA), la qualit de la restitution dpendra du type
daffichage utilis sur le site distant. Avec un tlviseur ou un moniteur vido, elle pourra
souffrir du transcodage (XGA vers H261 /H263) et sera affiche dans le format CIF (352 x
288) alors quavec un moniteur informatique elle conservera sa dfinition et sa qualit
dorigine (matriels Aethra notamment).
Certains matriels disposent dune fonction PowerPoint intgre permettant la diffusion
et la gestion dune prsentation dans ce format sans avoir recours un micro-ordinateur
extrieur. Le document est stock en local (aprs transfert sous IP partir dun poste
informatique reli au rseau, cest le cas par exemple avec les matriels Aethra) ou sur des
priphriques de stockage de type Memory Stick ou similaires (Sony). Pour en faciliter
lexploitation, lquipement de visioconfrence intgre alors toutes les fonctionnalits
spcifiques ncessaires lexploitation dun document de ce genre : affichage en local et en
mode vignette de lintgralit de la prsentation, modification de lordre des diapositives,
suppression Laffichage (tout comme celui de toute image fixe, photographie ou texte) est
ralis par rfrence lannexe D de la norme H 261 qui avec une rsolution de 576 lignes x
704 points permet une restitution de meilleure qualit que celle qui peut tre offerte par le
format CIF. Sur les sites distants, les diapositives seront prsentes en plein cran (avec en
incrustation limage vido de linterlocuteur) ou diffuses sur un deuxime cran.
Les dispositifs de visioconfrence individuels installs sur micro-ordinateurs disposent dun
atout supplmentaire par rapport leurs homologues de type console : ils intgrent par
construction un lment de stockage de grande contenance (le disque dur !). Tous les
documents qui y sont enregistrs peuvent tre spontanment et sans doute beaucoup plus
facilement diffuss vers lensemble des correspondants distants. Cest le cas par exemple
pour le logiciel eConf dvelopp par France Telecom R&D et de sa fonction Drag and
Stream Multimedia . Il permet la diffusion facile de tout fichier vido (format mpeg, avi,
mov, qt) ou audio (wav, mp3..) avec de surcrot la possibilit dassurer simultanment un
commentaire vocal ou crit.
Avec certains matriels (Aethra, Sony), il sera galement possible de renforcer limpact
dune session de visioconfrence par une diffusion vido et audio en direction du rseau IP
de ltablissement ou plus gnralement vers Internet. Certains quipements intgrent en
effet une fonction serveur de streaming. Sous condition daccs par mot de passe, et aprs
connexion ladresse IP du serveur, elle permet tout un chacun de suivre distance le
droulement de la visioconfrence sur son propre poste informatique. Cest bien de diffusion
(audio et vido) dont on parle, et donc sans aucune interactivit possible, mais dans ce cadre,
le nombre de spectateurs est illimit. Cette diffusion audio et vido pourra tre ralise
en unicast ou en multicast (voir encadr), et, en fonction du choix opr par le fabricant,
dans lun des formats vido habituellement disponible sur Internet (Real, Windows Media
ou Quick Time).

MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 13 / 26

Diffusion vido en unicast ou en multicast


Sur Internet, la diffusion en temps rel dune squence vido (ou
streaming) peut tre ralise suivant deux mthodes.
La diffusion unicast correspond au concept de la vido la
demande : chaque requte dun utilisateur correspond un flux
vido qui est dlivr par le serveur. Il y aura donc sur le rseau
autant de flux que de demandes. A la manire dun magntoscope,
toutes les formes dinteractivit sont possibles.
Le multicast sapparente plus la diffusion tlvisuelle classique
telle que nous la connaissons par ailleurs (hertzienne, par
satellite). La diffusion est ralise un instant donn, le mme
pour tous, sans aucune interactivit possible. Pour visualiser la
squence, il suffit de se connecter au moment ad hoc une adresse
IP spcifique. Ce procd permet doptimiser la bande passante du
rseau, puisque le serveur ne gnre quun seul flux. Ce flux sera
ensuite dupliqu si ncessaire au niveau de chacun des nuds du
rseau sil se trouve en amont un rcepteur valide.

Partage de documents et fonction tableau blanc


Ici, il ne sagit plus de prsenter simplement un document informatique, mais de raliser
avec les interlocuteurs distants un vritable travail interactif sur une application commune.
Ce travail ncessite la connexion dun micro-ordinateur sur chacun des sites participants.
La norme T120 est la norme de partage dapplications informatiques. Elle nest pas
spcialement ddie la visioconfrence et fonctionne sur diffrents types de rseaux. Cest
aussi une norme container car elle englobe bon nombre de protocoles spcifiques (T123,
T124, T125).
Pour raliser le partage de documents, la grande majorit des dispositifs de visioconfrence
sappuient sur le logiciel NetMeeting dvelopp par Microsoft. Cest un logiciel dj ancien
mais qui prsente lavantage dtre disponible sur la plupart des micro-ordinateurs car
intgr aux systmes dexploitation Windows (on voque cependant sa probable disparition
dans les versions futures). NetMeeting est un vritable outil de communication, permettant
des changes audio, vido ou textuels, et qui propose des fonctionnalits de type tableau
blanc, partage dapplication, transfert de fichiers Seules ces trois dernires fonctions sont
utilises par les quipements de visioconfrence. La fonction tableau blanc fait rfrence
un espace commun, visible par tous, sur lesquels les diffrents interlocuteurs peuvent
simultanment intervenir : crire, dessiner, coller un texte ou un tableau... Le partage
dapplication permet un travail collectif sur un mme document (traitement de texte, tableur
ou autre). Ce dernier reste hberg sur le micro-ordinateur de son propritaire, mais il est
visible et peut tre modifi distance (si autorisation et aprs validation) par tous les
intervenants. La fonction transfert de fichiers ralise la copie de tout document en direction
des sites distants.
La mise en oeuvre dun travail collaboratif dans le cadre dune session de visioconfrence
ncessite que tous les sites soient quips dun micro-ordinateur sur lequel NetMeeting est
actif. La liaison entre le micro-ordinateur et la console de visioconfrence est tablie, soit par
lintermdiaire dune liaison IP (connexion directe ou travers le rseau), soit via une
liaison srie de type RS 232 (du nom de la norme laquelle elle fait rfrence). Alors mme
que le travail collaboratif est directement ralis sur les micro-ordinateurs, la transmission
est par contre effectue par les quipements de visioconfrence eux mmes, en parallle avec
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 14 / 26

les signaux audio, vido, de contrle propres la session. Cette transmission sappuie sur
le protocole TCP, car il est ncessaire de conserver lintgrit des documents transmis (les
paquets perdus doivent tre r-mis).

Le travail collaboratif avec T120

Le couplage avec un tableau blanc numrique :


Dispositif indpendant des systmes de visioconfrence, un tableau blanc interactif est un
quipement spcifique de visualisation destin une utilisation collective. Interconnect un
micro-ordinateur et un vido projecteur, il permet non seulement la projection du contenu
de lcran informatique (quel quen soit le contenu), mais offre galement (en sur-impression
sur le document projet ou sur une surface blanche mais dans les deux cas la manire dun
tableau classique) des fonctions dcriture, de dessin, dannotation, de surlignage La
spcificit de cet quipement est de permettre la sauvegarde de tous les travaux qui y sont
raliss et dassurer le pilotage distance du micro-ordinateur.
Ces dispositifs ont t conus pour une utilisation en local dans une salle de formation, mais
ils peuvent tre galement coupls des quipements de visioconfrence. Lensemble des
oprations ralises sur la tableau sont alors totalement visualisables par lensemble des
interlocuteurs distants.
Web confrences
Une Web confrence est une runion virtuelle tablie via Internet (ou via un rseau IP) entre
diffrents interlocuteurs situs sur des zones gographiques distantes. Ces dispositifs ne sont
conus que pour des utilisations individuelles partir dun micro-ordinateur et offrent
gnralement des fonctionnalits de messagerie, de communications interactives
instantanes (chat), de prsentation de documents, de navigation sur le Web, de tableau
blanc Les documents prsenter doivent avoir t placs sur un serveur spcifique qui
pourra tre ventuellement hberg par une socit tierce, et auquel tous les participants
pourront facilement se connecter (par exemple, laide dun simple navigateur). Linitiateur
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 15 / 26

de la session conserve la gestion de lorganisation (invitation, dfinition des mots de passe)


et la matrise du droulement de la runion (diffusion dun document, suivi des
interventions). Diffrentes fonctionnalits supplmentaires peuvent tre proposes : prise
de contrle distance, enregistrement de la session
Ces dispositifs ont t conus indpendamment de tout systme de visioconfrence et
nincluent dailleurs pas ncessairement des outils vido ou audio. Ils peuvent cependant
intgrer une liaison audio entre les participants, soit directement via les outils disponibles sur
le poste informatique, soit par lintermdiaire dune communication tlphonique classique
tablie par ailleurs. Dautres peuvent galement offrir la retransmission de limage vido de
la personne qui a la parole.
Ces dispositifs peuvent venir en complment des solutions compltes de visioconfrences
qui apporteront alors des liaisons audios et vido de bien meilleure qualit.
Nouvelles normes et volutions
Centraliser les adresses avec la nouvelle norme H350
Cette nouvelle norme (elle date de septembre 2003) concerne la fonction dannuaire et
normalise les procdures de stockage des donnes dadresses (qui taient souvent
propritaires). Elle permet la centralisation sur un serveur spcifique de toutes ces
informations, non seulement les adresses IP ou les alias des terminaux H323 de
visioconfrence, mais galement celles utilises par dautres types dquipements,
notamment ceux destins la tlphonie sur IP. La recommandation H350 sappuie sur le
protocole LDAP (Lightweight Directory Access Protocol ). Elle est compatible H320, H323,
SIP
SIP (Session Initiation Protocol)
SIP est lorigine un protocole tlphonique sur lequel on a ajout aujourdhui la possibilit
de transmettre de la vido. Pour les quipements de visioconfrence, cest lune des
dernires tendances pour cette fin danne 2004. La norme SIP a t implmente sur des
produits Polycom depuis le mois de juillet 2004.
SIP est plus rcent que H323. Cette norme a t dveloppe et normalise sous la tutelle de
lITU-T (le monde des tlcoms !) par opposition H323 qui a t dvelopp sous lgide de
IETF (le monde de lInternet !). Elle simplante largement dans les entreprises grce au
succs croissant de la tlphonie sous IP (ou VoIP). Pour la visioconfrence, ce protocole na
cependant pas la richesse de H323 et il offre des possibilits en terme de fonctionnalits
plus rduites (il ne permet pas de faire du multipoint directement, il prsente des
insuffisances pour la commande distance des camras). Mais il prsente lavantage de
pouvoir sappuyer sur les rseaux tlphoniques dentreprise sur IP pour la mise en uvre
des dispositifs de visioconfrences. SIP peut donc constituer une alternative davenir
H323.
WiFi (Wireless Fidelity) :
Il ne sagit pas ici dune fonctionnalit spcifique aux quipements de visioconfrence mais
simplement de la mise en oeuvre dune liaison sans fil en lieu et place de la liaison filaire
classique ncessaire entre le terminal de visioconfrence et le rseau IP. WiFi est une norme
de transmission radio (802.11) qui permet lchange de donnes entre deux priphriques.
Plusieurs dclinaisons ont t ralises. La plus connue est la norme 802.11b qui utilise la
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 16 / 26

plage de frquence de 2,4 GHz et permet un dbit thorique de 11 Mb/s. Plus rcente, la
norme 802.11g autorise des dbits qui peuvent atteindre 54 Mb/s. Dans les deux cas, les
liaisons sont bi-latrales mais restent limites de courtes distances (100 m en champ libre
mais beaucoup moins lintrieur dun btiment).
Lquipement de visioconfrence est quip dun module spcifique dmission et rception.
Une borne dmission rception relie au rseau local de ltablissement doit tre prsente
faible distance.
La confidentialit avec le cryptage AES (Advanced Encryption Standard) :
Les matriels de visioconfrence offrent dsormais des dispositifs dencryptage qui
permettent dassurer la confidentialit des changes, avec des communications qui sont
scurises et chiffres. Cest une possibilit qui est propose pour les entreprises
sensibles mais qui ne concerne pas directement le monde de lducation. Cette
fonctionnalit est totalement transparente pour lutilisateur. Diffrentes normes existent
H233, H234 la plus rcente tant H 235.

MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 17 / 26

Sous IP, des contraintes lies aux rseaux locaux et leurs quipements spcifiques
Paralllement aux difficults inhrentes Internet et dj voques dans les chapitres
prcdents, la visioconfrence sous IP souffre galement des maux lis certains dispositifs
informatiques spcifiques mis en place dans les rseaux locaux dentreprise. Situs la
frontire entre le rseau local et le rseau extrieur, ces dispositifs sont principalement de
deux ordres : ceux destins assurer la gestion des adresses IP de lensemble des microordinateurs connects au rseau local et ceux destins assurer la scurit et la protection
des connexions (FireWall). Dans le cadre dune visioconfrence, ces quipements induisent
des difficults dexploitation particulires quil est ncessaire de bien connatre.
La gestion des adresses
Sur Internet tout comme sur les rseau locaux de type Ethernet, chaque poste informatique
se voit affecter un identifiant unique appel adresse IP. Deux postes sur un mme rseau
(Internet tant considr comme lun dentre eux) ne peuvent pas avoir la mme adresse IP.
Ces adresses sont codes sur 4 octets de 8 bits (soit 32 bits)4 dans la version actuelle du
protocole IP et leur nombre est par consquent limit. Cette limitation devrait disparatre
avec la future version IPv6.
La technique de translation dadresse (NAT en anglais pour Network Address Translation) a
t mise au point pour grer la pnurie dadresses possibles face aux besoins croissants
dInternet. Il a ainsi t dcid de rpartir le volume des adresses possibles en deux sous
ensembles : les adresses publiques (utilisables sur Internet) et les adresses prives
(employables uniquement lintrieur des rseaux privs). Sur les rseaux locaux, ces
dernires peuvent tre utilises sans dautre restriction que ne pas attribuer deux fois la
mme adresse dans un mme rseau local. Compte tenu de ce confinement, il ny a aucun
risque de conflit lorsquune mme adresse prive est utilise sur des rseaux locaux
diffrents.
Sachant quune adresse prive ne peut pas tre utilise sur Internet, lorsquun poste souhaite
se connecter, le mcanisme de translation dadresse va remplacer ladresse prive prsente
dans lentte de chacun des paquets par une adresse publique avant de router ensuite le
paquet vers lextrieur. Il ralisera lopration inverse au retour de la rponse. Cette
translation pourra tre statique ( chaque adresse prive correspondra toujours la mme
adresse publique) ou dynamique (il ny a pas dassociations prdfinies). Dans ce cas,
ltablissement disposera en gnral de moins dadresses publiques au regard du nombre de
postes rellement prsent dans le rseau local. Elles seront attribues par le systme au fur et
mesure des demandes de connexion. Plusieurs utilisateurs pourront se voir attribuer la
mme adresse, la diffrenciation au retour entre les donnes destines aux uns et des autres
et la dtermination du poste metteur original seffectuant alors sur dautres critres.
Outre le fait que la technologie de la translation dynamique dadresses permet de limiter le
nombre dadresses publiques utilises par un rseau souvrant sur lextrieur, elle permet
aussi dassurer la protection des machines internes contre des actions malveillantes en
provenance dInternet puisque leur adresse IP relle nest en fait pas directement visible
de l extrieur . Cette fonction de scurit est la deuxime raison de lexistence des NAT.
4

Elles sont indiques par quatre nombre compris entre 0 et 255 spars par un point (par exemple
194.250.164.58 est lune dentre elles) ce qui reprsente environ 4,3 milliards dadresses possibles.
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 18 / 26

Ce dispositif nest malheureusement pas pris en compte par certaines des normes (H225 ou
H245) utilises dans le cadre des visioconfrences. Ces deux normes nexploitent pas les
adresses contenues dans les enttes, mais elles inscrivent (et utilisent ensuite) des
informations dadresse quelles placent dans le corps mme du paquet (dans le schma cidessous, cest ladresse prive du terminal A qui va tre ainsi transmise au terminal B lors de
lappel initial de A). Compte tenu de sa localisation dans la charge utile, cette adresse nest
pas transforme par le NAT. En tentant dexploiter cette information pour rpondre,
lquipement de visioconfrence distant ne peut trouver quune adresse prive totalement
inexploitable sur Internet. Ltablissement de la session de visioconfrence est impossible.
Certains quipements de visioconfrence intgrent des fonctionnalits spcifiques (fonction
NAT IP Adress mask pour Vcon, Aethra NAT pour Aethra) qui permettent de
pallier cet tat de fait (via un menu de configuration, lutilisateur peut indiquer
manuellement ladresse IP publique qui sera systmatiquement attribue). Lutilisation de
firewall ou de proxy compatibles H323 (voir chapitre suivant) sont aussi des mthodes pour
rsoudre ces cas de figure.

Incompatibilit entre les dispositifs de translation dadresses (NAT) et les normes H323 : suite la sollicitation initiale
de A, la rponse du terminal B ne peut pas aboutir : il ne connat de A que ladresse prive qui tait contenue dans la
charge utile des paquets (qui na pas t translate par le NAT) et qui nest pas utilisable sur Internet.

MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 19 / 26

Le passage des firewalls


Un Firewall (pare feu dans la littrature franaise) est un dispositif de scurit plac la
jonction entre deux rseaux distincts, le rseau informatique interne un tablissement et le
rseau extrieur, Internet en loccurrence. Organe de scurit destin protger le rseau
interne, sa tache principale est dinterdire les activits malveillantes en provenance de
lextrieur. La contrainte du firewall est dtre le plus transparent possible pour les activit
lintrieur de lentreprise et dtre la fois le plus efficace possible en offrant un niveau
maximum de scurit. Cest essentiellement un outil de filtrage destin au contrle de la
circulation des paquets, et qui doit assurer le blocage de toutes les donnes qui ne doivent
pas passer dun ct lautre. Il va gnralement interdire toutes les entres de donnes
qui ne rpondraient pas une requte pralable de lun des postes du rseau local. Comment
ds lors, rpondre une demande dinitialisation pour une session de visioconfrence
lorsquelle est sollicite depuis lextrieur ?

Les firewalls bloquent la plupart des paquets non sollicits, ici une tentative de connexion
pour une visioconfrence. Pour que la communication stablisse, de nombreux ports
doivent tre ouverts sur le FireWall, commencer par le port 1720 qui est utilis lors de
linitialisation de la liaison.

Un firewall va galement assurer la surveillance des ports qui sont utiliss. Sur un microordinateur, chaque application logicielle se voit attribuer un port (le port est en quelque sorte
ladresse dune application). Lors dune connexion classique Internet la majorit
des ports sont ferms sur le firewall, seuls les quelques uns qui correspondent aux
applications directement concerns sont ouverts. Dans le cadre de la visioconfrence, de
nombreuses connexions doivent tre simultanment maintenues entre les terminaux, et de
nombreux ports doivent y tres ouverts, certains alatoirement (cest dire sans que lon
puisse prvoir pralablement leur numro). Cette notion de ports dynamiques ne facilite pas
la configuration des firewall : pas question de laisser tous les ports entre 1024 et 65535
ouverts ! Sauf mise en place de dispositifs particuliers, louverture de tous ces ports sont
autant de failles dans la scurit globale dun rseau local. A linverse, du fait des dispositifs
de protection adopts par les administrateurs de rseau, la mise en place de sances de
visioconfrence peut se rvler difficile, parfois mme impossible.

MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 20 / 26

Pour en savoir plus


Sur un micro-ordinateur, chaque application logicielle se voit attribuer un port (le port est
en quelque sorte ladresse de lapplication). Pour des donnes en provenance de
lextrieur, le numro de port indique quelle application sont destines les donnes. Les
ports sont cods sur 16 bits, 65535 ports sont thoriquement disponibles, pratiquement
moins, car 1024 sont rservs.
Lors dune connexion classique sur Internet la majorit des ports sont ferms, seuls les
quelques uns qui correspondent aux applications directement concerns sont ouverts pour
permettre les changes de donnes (port 80 pour HTTP, ports 25 et 110, respectivement
pour les changes SMTP et POP3 de la messagerie). Bloquer lutilisation dun port,
cest interdire le transit des donnes correspondant certaines applications.
Dans le cadre de la visioconfrence, certains de ces ports sont spcifis dune manire
dfinitive (ports statiques) par la norme H263, par exemple, port 1720 pour lappel initial,
port 1719 en cas dutilisation dun gatekeeper, port 1503 pour le partage dapplications
via la norme T120 Dautres (ports dynamiques) sont attribus alatoirement au moment
de ltablissement de lappel (ports compris entre 1024 et 65535). Ce sont par exemple
ceux utiliss pour le transfert des donnes vido et audio (flux RTP et RTCP).
Suivant le type de donnes, les transferts pourront seffectuer en utilisant les protocoles
TCP ou UDP.
Quelques exemples des ports utiliss pour une visioconfrence :
Port
1719
1720
1024-65535
1024-65535
1024-65535
Ports
optionnels
389
1503

Type
Statique
Statique
Dynamique
Dynamique
Dynamique

Protocoles
UDP
TCP
TCP
UDP (RTP)
UDP (RTCP)

Description
Gatekeeper RAS
Q.931 (Call Setup)
H245 (Call parametrers)
Video and audio Data Stream
Control Video and audio Stream

Statique
Statique

TCP
TCP

ILS Registration (LDAP)


T.120

Diffrentes solutions techniques ont t dveloppes pour contourner ces obstacles et


permettre un fonctionnement correct des protocoles H323 travers les firewalls :
- Utiliser des firewalls intgrant H323 :
Cest sans doute la meilleure solution, et celle qui offre la meilleure scurit. Beaucoup des
firewalls rcents intgrent dsormais H323 (sous lappellation Application Level Gateways
ou ALG dans certains textes). Ces quipements ont la facult de scruter les communications
qui sont tablies en amorce une visioconfrence afin de dtecter les numros de ports qui
seront effectivement utiliss. Ils pourront alors autoriser louverture de ces ports spcifiques
et permettre le trafic entre appel et appelant pendant une dure qui restera limite celle de
la session. Ces ports sont referms ensuite. On utilise parfois le terme de pinholing pour
dsigner cette mthode qui consiste nouvrir que les quelques ports ncessaires (des trous
dpingle ) dans le firewall.
Certains modles intgrent galement la fonction NAT. Lors de la translation dadresses, ils
sont capables, non seulement de remplacer une adresse prive par une adresse publique dans
lentte des paquets, mais galement de raliser cette opration dans le corps mme de la
charge utile, permettant de ce fait le fonctionnement correct de toute session de
visioconfrence.
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 21 / 26

- Utiliser des proxys


Un proxy est une passerelle spcialise qui va permettre des flux H323 de contourner dans
certaines conditions les firewalls, sans affaiblir les conditions de scurit. Il va agir comme
un intermdiaire. Cest lui qui va assurer la gestion de tous le trafic H323 en lieu et place des
terminaux de visioconfrences qui seront ainsi totalement isols dInternet (ils seront
invisibles de lextrieur, y compris pont et passerelle).
Lors de ltablissement dune liaison, ce nest plus un appel qui sera gnr mais deux. Le
premier sera initi par lquipement de visioconfrence situ lintrieur du rseau local en
direction du proxy qui son tour en gnrera un second sur le rseau public (et en utilisant
sa propre adresse) en direction de lquipement distant. Seul le proxy peut inter-agir avec
lextrieur. Le Firewall devra tre correctement configur pour pouvoir fonctionner lui. Ce
mode de fonctionnement impose lutilisation dun gatekeeper (voir chapitre suivant).
Diffrentes configurations sont possibles pour le proxy : il pourra tre intgr au gatekeeper
ou au firewall.

Un proxy est une passerelle spcialise qui va permettre des flux H323 de traverser dans certaines conditions
les firewall

- Sappuyer sur une zone dmilitarise ou DMZ :


Une DMZ est une zone particulire du rseau informatique dun tablissement ou dune
entreprise. Cest une zone spare qui ne va hberger que les quipements qui doivent tre
accessibles depuis lextrieur, non seulement les serveurs (serveurs Web, serveurs FTP,
serveurs Email.) mais galement ventuellement des dispositifs de visioconfrence. Elle
est situe, sur le plan des risques, entre le rseau local priv (qui doit tre totalement protg)
et Internet (qui est une zone trs fort risque). La DMZ doit tre galement accessible
depuis le rseau priv. Les adresses pourront y tre prives ou ce qui est beaucoup mieux,
publiques pour permettre des accs sans translation dadresse. Les rgles de communications
entre les trois entits - le rseau local, la DMZ et Internet - seront diffrentes et gres par un
FireWall.
MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 22 / 26

Un quipement particulier : le Gatekeeper


La fonctionnalit de NAT na pas que des avantages. Pour la visioconfrence, elle ne permet
pas un utilisateur distant et extrieur de se connecter facilement (il ne connat pas ladresse
IP de son interlocuteur). Il est ncessaire dajouter au dispositif un lment supplmentaire,
le gatekeeper (garde barrire, en abrg GK dans la littrature concerne) qui sera charg en
dpit des procdures appliques aux adresses IP dassurer la communication entre les
diffrents sites et la mise en liaison des diffrents intervenants.
Un GK est un serveur spcifique qui va tenir la fois un rle de central tlphonique,
dannuaire et de gestionnaire. Il assure la gestion de tous les terminaux situs dans une zone
dtermine, les met en liaison les uns avec les autres, dans la mme zone ou vers dautres
zones.
Les GK sont optionnels (deux terminaux peuvent trs bien communiquer entre eux
directement) mais ils sont ncessaires si on souhaite dvelopper des fonctionnalits plus
compltes dans une zone.
Le gatekeeper permet didentifier et de rfrencer les intervenants sous une forme plus
explicite que ladresse IP. Il est possible dutiliser un nom et un prnom, une adresse Email
ou toute autre indication. On utilise le terme dalias pour dsigner ce
rfrencement alphanumrique. Il est aussi possible dutiliser un indicatif numrique
sensiblement identique celui dun numro de tlphone (E164). Le GK tablit et mmorise
la relation entre ladresse IP de la machine et la dnomination sous laquelle elle a t
rfrence. Il sagit ici de traduction dadresse et non pas dune translation comme pour le
NAT. Tout comme une adresse IP, un alias doit tre unique. Lorsque un poste veut sintgrer
dans une visioconfrence et joindre un correspondant, il lui suffit dindiquer lalias du
correspondant. Lappel transitera par le GK situ dans la zone. Si le correspondant recherch
est localis dans une autre zone, il transmettra la demande vers dautres GK.
Encadr :
Sur un rseau local (mais cest aussi souvent le cas pour le
particulier qui se connecte Internet de chez lui travers son FAI),
ladresse IP dun poste nest pas toujours fixe et attribue une fois
pour toute (adresse statique). Dans certains cas, chaque ordinateur se
voit attribuer une adresse provisoire au moment de son allumage.
Cest le protocole DHCP (Dynamic Host Configuration Protocol)
qui assure automatiquement (et dune manire totalement
transparente pour lutilisateur) cette fonction dattribution et
dadministration des adresses dans le rseau local. Dans ce cas, le
GK doit tre mis jour en permanence : chacune des ouvertures du
logiciel de visioconfrence (pour un ordinateur individuel), il y a
transmission lannuaire de ladresse IP de la machine concerne
(elle senregistre auprs du GK).

Aprs ltablissement de la liaison et la mise en oeuvre des procdures prliminaires entre


les diffrents sites, le GK peut, soit tre mis hors du circuit de la visioconfrence (les
donnes vont alors transiter directement entre les interlocuteurs) soit, au contraire, assurer
aussi le transit partiel (uniquement les donnes de contrle) ou total de toutes les
communications (routage complet).

MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 23 / 26

Le rle du GK ne se limite pas la fonction dannuaire. Il peut galement raliser la gestion


des flux ou plus prcisment de la bande passante affecte une visioconfrence. Il pourra
par exemple autoriser ou non une connexion en fonction de la charge du rseau si cela
risque dengorger le rseau interne, limiter le dbit pour un utilisateur ou pour un groupe
dutilisateurs, limiter le nombre de terminaux H263 simultanment en fonction sur le rseau,
grer le contrle daccs et refuser des connexions.

La visioconfrence en multi point


Une sance de visioconfrence se droule rarement entre seulement deux intervenants.
Plusieurs sites sont en gnral concerns. Des dispositifs spcifiques doivent tre mis en
place pour permettre tous les intervenants de travailler dans les mmes conditions : chaque
site doit recevoir les images et le son en provenance de chacun des autres lieux. Il doit
pouvoir visualiser un seul site la fois (celui qui prend la parole est affich en plein cran)
ou plusieurs sites en simultan (lcran est divis), intervenir dans la conversation, travailler
en temps rel sur des documents informatiques
Hors rseaux universitaires (ils disposent dautres possibilits), on utilise gnralement un
quipement supplmentaire auquel tous les sites doivent tre connects (pont multi-points ou
MCU Multipoint Conferencing Unit). Cet quipement centralise les flux issus de tous les
sites et assure ensuite leur re-distribution vers lensemble des quipements participant la
visioconfrence. Ce sont donc des liaisons point point qui sont tablies entre le pont et
chacun des postes participants. Au moment de linitialisation de la session de
visioconfrence, soit cest le pont qui appelle les participants, soit cest linverse.
Un pont peut tre autonome ou intgr dans lune des stations. Dans le premier cas, cest le
pont (et le rseau auquel il est reli) qui supportera la multiplication des flux, chacune des
station ne supportant quun flux unitaire et somme toute quivalent ce quil serait pour une
liaison classique en point point (par exemple 256 Kb/s). Dans le second cas, tous les flux
convergeant vers la station qui intgre le pont, elle aura (ainsi que le rseau local sur lequel
elle est situe) grer un flux qui sera multipli par le nombre dinterlocuteurs extrieurs
(dans notre exemple, 256 Kb/s multipli par 3 soit 768 Kb/s pour une visioconfrence entre
4 points)
Un pont externe peut tre achet ou lou sparment la demande une socit tierce. Il
peut tre mixte RNIS et IP. Un pont MCU peut grer simultanment plusieurs
visioconfrences (sauf pour les modles bas de gamme).

MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 24 / 26

Les trois configurations possibles pour une visioconfrence :


en 1, liaison point point
en 2, visioconfrence entre quatre points avec un pont intgr
en 3, session entre quatre points avec un pont externe.

Interconnecter les deux familles RNIS et IP : les passerelles


Le monde de la visioconfrence est partag entre les quipements qui fonctionnent sur RNIS
et ceux qui sappuient sur IP. Il tait ncessaire de pouvoir tablir des liaisons entre ces deux
entits.
Une passerelle (gateway dans la littrature anglaise) est un quipement permettant la
communication entre une zone de visioconfrence fonctionnant sous RNIS et un site
fonctionnant sous IP, cest dire entre des terminaux qui rpondent la norme H323 et des
terminaux qui sappuient sur H320.
Entre ces deux familles de normes, bon nombre de protocoles sont diffrents. La passerelle
va assurer leur translation, notamment pour ceux qui concernent les formats de transmission

MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 25 / 26

(cest dire H225 en H221) ou les procdures de communications (H245 en H242). La


passerelle procdera aussi la transformation des adresses des terminaux (adresses sous la
forme IP pour la norme H323, adresses dans un format tlphonique pour la norme
H320) mais elle ne ralisera gnralement pas de translation au niveau des donnes vido et
audio, les codecs utiliss tant communs aux deux systmes.
La passerelle va galement assurer une remise en forme de toutes les donnes. Sous RNIS,
elles circulent en flux continu alors que sur IP, elles sont dcoupes en paquets. Lorsque les
donnes vont transiter du monde RNIS au monde IP, la passerelle va raliser le dcoupage
du flux continu de donnes et procder la cration des paquets. Elle va y ajouter des enttes
(ces donnes supplmentaires qui nexistent pas sous RNIS, qui contiennent notamment les
informations ncessaires pour lacheminement des paquets et quil faut galement
transmettre). Ces donnes supplmentaires vont gnrer un dbit supplmentaire qui pourra
atteindre 20 30% du dbit initial. A qualit gale une visioconfrence sur rseau IP
consommera donc une bande passante suprieure celle utilisant RNIS. Globalement, on
admet gnralement quil faut un dbit de 384 Kb/s sous IP pour obtenir une liaison
quivalente une visioconfrence avec RNIS 256 Kb/s. La passerelle effectuera
videmment lopration inverse pour les donnes circulant dans le sens IP vers RNIS

MSH Paris nord - Plate forme Arts, Sciences, Technologies Philippe GASSER Janvier 2005 26 / 26