Vous êtes sur la page 1sur 25

Voix / image sur IP

VoIP est un terme que l'on entend de plus en plus de nos jours. VoIP signifie 'Voice over IP' en anglais ce qui se traduit par Voix sur IP. Ce terme dsigne la technologie permettant de faire passer de la voix travers les rseaux informatiques afin d'offrir les mmes services que le rseau tlphonique. L'usage de cette technologie se rpand de plus en plus, chez les particuliers d'abord avec l'explosion des logiciels de dialogue gratuit pour communiquer d'un ordinateur un autre dans le monde entier, chez les fournisseurs d'accs ensuite qui proposent maintenant des forfaits comprenant les communications tlphoniques illimites et enfin chez les professionnels o la VoIP et limage sur IP remplacent peu peu le rseau tlphonique de l'entreprise.

1. Les principaux protocoles pour la VOIP et limage sur IP Les protocoles de VoIP et image sur IP sont les codages techniques qui permettent aux voix et images de passer sur l'internet. Il existe plusieurs normes concurrentes dans ce domaine. Les principaux protocoles utiliss pour l'tablissement des connexions en voix sur IP sont :

H.323 ; IAX (Asterisk) ; SIP ; UA/NOE (propritaire Alcatel-Lucent) ; UNISTIM (propritaire Nortel). Jingle, bas sur le protocole de messagerie instantane standard ouvert Jabber ; MGCP ; SCCP (propritaire Cisco Systems) ;

Protocole H.323

Le protocole H.323 est un protocole englobant tout un ensemble de normes utilises pour lenvoie de donnes audio et vidos sur Internet. Il a t cr en 1996 par lITU, Internationale Tlcommunication Union et est un des premiers

protocoles ddi la voix sur IP. On peut regrouper les protocoles englobs dans H.323 en trois catgories : La signalisation, la ngociation des codecs et le transport. Les messages de signalisation sont ceux que lon envoie pour joindre un correspondant, connatre son tat (occup, en attente, etc) et connatre la manire a utilis pour le joindre. Le H.323 utilise les protocoles de signalisation RAS, Registration, Administration and Status, pour lenregistrement et lauthentification et Q.931 pour linitialisation et le contrle dappel. La ngociation est utilise pour se mettre daccord sur la faon de coder les informations que lon va schanger. Il est important que tous les systmes utilisent la mme manire dencoder la voix, cest dire le mme codec. Ainsi il peut sagir du codec le moins gourmant en bande passante ou celui qui offre la meilleure qualit. Le protocole de ngociation utilis est le H.245. Le transport de linformation sappuie sur le protocole RTP, Real Time Protocol, qui transporte la voix, la vido ou les donnes numrises par les codecs. On peut aussi utiliser les messages RTCP, Real Time Control Protocol pour faire du contrle de qualit, voir demander de rengocier les codecs si, par exemple, la bande passante diminue. Le protocole H.323 est implment dans beaucoup de logiciel temps rel comme NetMeeting ou Ekiga. Cependant H.323 issu du monde des tlcommunications perd de plus en plus de terrain au profit de SIP, plus souple et plus adapt aux technologies rcentes.

SIP Session Initiation Protocol (dont l'abrviation est SIP) est un protocole normalis et standardis par l'IETF (dcrit par le RFC 3261 qui rend obsolte le RFC 2543, et est complt par le RFC 3265) qui a t conu pour tablir, modifier et terminer des sessions multimdia. Il se charge de l'authentification et de la localisation des multiples participants. Il se charge galement de la ngociation sur les types de mdia utilisables par les diffrents participants en encapsulant des messages SDP (Session Description Protocol). SIP ne transporte pas les donnes changes durant la session comme la voix ou la vido. SIP tant indpendant de la transmission des donnes, tout type de donnes et de protocoles peut tre utilis pour cet change. Cependant le protocole RTP (Realtime Transport Protocol) assure le plus souvent les sessions audio et vido. SIP remplace progressivement H.323.

Contexte de mise en place du protocole SIP l'heure de la rvolution de l'information par l'utilisation du rseau Internet, on assiste la convergence de la tlphonie et de l'informatique (couplage tlphonie-informatique). Les RTC et RNIS (ISDN) et par extension les tlphones de premire et seconde gnrations (satellitaires et GSM) ont fait leur temps en tant que rseaux supportant la voix uniquement, avec des bandes passantes et dbits trs faibles (RNIS permettait les transmissions de donnes, en liaison commute ou fixe sur abonnement, par unit de 64kb ou encore par paquet sur canal D). H.323 a t un protocole pionnier de la tlphonie sur IP, manant des instances du monde des tlcommunications (UIT ou ITU). SIP, conception un peu plus rcente, vient du monde de l'Internet (IETF) et s'intgre sans doute un peu mieux sur les rseaux IP. Les diteurs, fournisseurs de services et oprateurs mettant du temps offrir logiciels et services autour de H323 et SIP, la firme Skype s'est impose avec plusieurs millions d'utilisateurs en proposant le logiciel client, le service et la passerelle vers les rseaux publics entrants et sortants, mais toute cette technologie est ferme et donc non accessible aux dveloppeurs du monde libre. Actuellement, pour combler les faiblesses en termes de prsence et de rseaux (NAT) du protocole SIP, des diteurs et fournisseurs de service planchent sur l'intgration de SIP avec Jabber, protocole fiable, standard, ouvert et prouv de prsence et de messagerie instantane. Fonctionnement Sip intervient aux diffrentes phases de l'appel : Localisation du terminal correspondant, Analyse du profil et des ressources du destinataire, Ngociation du type de mdia (voix, vido, donnes...) et des paramtres de communication, Disponibilit du correspondant, dtermine si le poste appel souhaite communiquer, et autorise l'appelant le contacter. Etablissement et suivi de l'appel, avertit les parties appelant et appel de la demande d'ouverture de session, gestion du transfert et de la fermeture des appels. Gestion de fonctions volues : cryptage, retour d'erreurs, ...

Avec Sip, les utilisateurs qui ouvrent une session peuvent communiquer en mode point point, en mode diffusif ou dans un mode combinant ceux-ci. Sip permet donc l'ouverture de sessions en mode : Point--point - Communication entre 2 machines, on parle d'unicast. Diffusif - Plusieurs utilisateurs en multicast, via une unit de contrle M.C.U (Multipoint Control Unit) Combinatoire - Plusieurs utilisateurs pleinement interconnects en multicast via un rseau maillage complet de connexions. Voici les diffrents lments intervenant dans l'ouverture de session : Suivant nature des changes, choix des protocoles les mieux adapts (Rsvp, Rtp, Rtcp, Sap, Sdp). Dtermination du nombre de sessions, comme par exemple, pour vhiculer de la vido, 2 sessions doivent tre ouvertes (l'une pour l'image et l'autre pour la vido). Chaque utilisateur ou sa machine est identifi par une adresse que l'on nomme Url Sip et qui se prsente comme une Url Mailto. Requte Uri permettant de localiser le proxy server auquel est rattach la machine de l'appel. Requte Sip, une fois le client (machine appelante) connect un serveur Sip distant, il peut lui adresser une ou plusieurs requtes Sip et recevoir une ou plusieurs rponses de ce serveur. Les rponses contiennent certains champs identiques ceux des requtes, tels que : Call-ID, Cseq, To et From. Les changes entre un terminal appelant et un terminal appel se font par l'intermdiaire de requtes : Invite - Cette requte indique que l'application (ou utilisateur) correspondante l'Url Sip spcifi est invit participer une session. Le corps du message dcrit cette session (par ex : mdia supports par l'appelant ). En cas de rponse favorable, l'invit doit spcifier les mdias qu'il supporte. Ack - Cette requte permet de confirmer que le terminal appelant a bien reu une rponse dfinitive une requte Invite. Options - Un proxy server en mesure de contacter l'UAS (terminal) appel, doit rpondre une requte Options en prcisant ses capacits contacter le mme terminal.

Bye - Cette requte est utilise par le terminal de l'appel fin de signaler qu'il souhaite mettre un terme la session. Cancel - Cette requte est envoye par un terminal ou un proxy server fin d'annuler une requte non valide par une rponse finale comme, par exemple, si une machine ayant t invite participer une session, et ayant accept l'invitation ne reoit pas de requte Ack, alors elle met une requte Cancel. Register - cette mthode est utilise par le client pour enregistrer l'adresse liste dans l'URL TO par le serveur auquel il est reli. Une rponse une requte est caractrise, par un code et un motif, appels code d'tat et raison phrase respectivement. Un code d'tat est un entier cod sur 3 bits indiquant un rsultat l'issue de la rception d'une requte. Ce rsultat est prcis par une phrase, textbased (UTF-8), expliquant le motif du refus ou de l'acceptation de la requte. Le code d'tat est donc destin l'automate grant l'tablissement des sessions Sip et les motifs aux programmeurs. Il existe 6 classes de rponses et donc de codes d'tat, reprsentes par le premier bit : 1xx = Information - La requte a t reue et continue tre traite 2xx = Succs - L'action a t reue avec succs, comprise et accepte 3xx = Redirection - Une autre action doit tre mene afin de valider la requte 4xx = Erreur du client - La requte contient une syntaxe ronne ou ne peut pas tre traite par ce serveur 5xx = Erreur du serveur - Le serveur n'a pas russi traiter une requte apparemment correcte 6xx = Echec gnral - La requte ne peut tre traite par aucun serveur

En pratique, la mise en place de SIP repose sur trois lments : User Agent, registrar et proxy. User Agent Les User Agents dsignent les agents que l'on retrouve dans les tlphones SIP, les softphones (logiciels de tlphonie sur IP) des ordinateurs et PDA ou les passerelles SIP. En thorie, on peut tablir des sessions directement entre deux User Agents, deux tlphones par exemple. Mais cela ncessite de connatre l'adresse IP du destinataire. Cela n'est pas l'idal car une adresse IP peut ne pas

tre publique (derrire un NAT) ou changer et elle est bien plus complique retenir qu'une URI (Uniform Resource Identifier). Les User Agents peuvent donc s'enregistrer auprs de Registrars pour signaler leur emplacement courant, cest--dire leur adresse IP.. Registrar Le Registrar est un serveur qui gre les requtes REGISTER envoyes par les Users Agents pour signaler leur emplacement courant. Ces requtes contiennent donc une adresse IP, associe une URI, qui seront stockes dans une base de donnes. Les URI SIP sont trs similaires dans leur forme des adresses email : sip:utilisateur@domaine.com Gnralement, des mcanismes d'authentification permettent d'viter que quiconque puisse s'enregistrer avec n'importe quelle URI.

Proxy Un Proxy SIP sert d'intermdiaire entre deux User Agents qui ne connaissent pas leurs emplacements respectifs (adresse IP). En effet, l'association URIAdresse IP a t stocke pralablement dans une base de donnes par un Registrar. Le Proxy peut donc interroger cette base de donnes pour diriger les messages vers le destinataire.

Le Proxy se contente de relayer uniquement les messages SIP pour tablir, contrler et terminer la session. Une fois la session tablie, les donnes, par exemple un flux RTP pour la VoIP, ne transitent pas par le serveur Proxy. Elles sont changes directement entre les User Agents. 2. Les diffrents modes de diffusion de la voix

Le terme VoIP est en gnral utilis pour dcrire des communications point point . Pour la diffusion de son ou de vidos sur IP en multipoints, on

parlera plutt de streaming pour une simple diffusion, comme les radios Web par exemple. Le terme multipoints sera rserv des visioconfrences dont le nombre de participants est plus grand que deux. La voix ou le son sur IP peut se faire en mode Unicast, broadcast ou Multicast sur les rseaux, c'est--dire en mode point point , en mode une mission et plusieurs rceptions (comme un metteur TV, par exemple) et en mode une mission pour plusieurs rceptions (mais le signal n'est rout que s'il y a des rcepteurs) comme les radios Web. Le protocole H.323 ne fonctionne qu'en mode Unicast. Avec la banalisation des rseaux haut dbit, le nombre dapplications possibles a considrablement augment. Les applications de VoIP (Voice over IP) sont une des nouvelles possibilits offertes. Laugmentation des dbits et les connexions permanentes offrent des possibilits de dveloppement de la voix sur IP (Internet Protocol). Le dveloppement de la VoIP a entran les concepteurs de plates-formes de programmation dvelopper des API (Application Programming Interface) spcifiques la voix sur IP. Lintgration de nouveaux besoins dans une plate-forme de dveloppement permet dattirer les concepteurs de logiciels qui doivent intgrer des fonctions de voix sur IP dans leurs applications. Elles implmentent le protocole SIP. Les API de VoIP peuvent tre utilises dans de nombreuses applications, la plus simple tant les tlphones logiciels (soft phones). Dautres applications peuvent intgrer de la VoIP comme besoin secondaire. Par exemple les applications de messagerie instantane qui intgrent de plus en plus souvent la possibilit de parler directement avec ses contacts ou bien toutes les applications ncessitant une interaction textuelle entre les diffrentes applications clientes comme les jeux vido. 3. codage de la voix et dimages: les codecs L'objectif d'un codec est la transformation d'un signal analogue vers un signal numrique et vice-versa. Ici, le codec transforme donc le signal de la voix en donnes numriques facilement transportables sur un rseau. Aprs de transport, le mme codec se charge de retransformer le signal numrique vers un signal analogique. Il existe une diffrence majeure permettant de classer les codecs existants dans deux catgories : les codecs sans pertes ('lossless') et les codecs avec pertes ('lossy').

Dans un codec lossless, tout le signal est transform en binaire et le dcodage restitue des donnes parfaitement identiques celles donnes en entre. Ce type de codecs est utilis quand la qualit de la restitution est importante. Dans un codec lossy, certaines parties du signal sont cartes et supprimes. Dans l'exemple de la voix, l'oreille humaine rencontre ses limites lorsqu'il s'agit d'couter des frquences trop basses ou trop hautes. Les codecs avec pertes (aussi appels destructeurs) tirent parti de ce phnomne. Les sons dans les frquences hautes ou basses sont tronqus pour diminuer la quantit d'information transmettre. L'exploitation des particularits de l'oreille humaine s'appelle la psychoacoustique. Qualit de la voix :

Le transport de la voix sur un rseau IP ncessite au pralable tout ou une partie des tapes suivantes : Numrisation : dans le cas o les signaux tlphoniques transmettre sont sous forme analogique, ces derniers doivent d'abord tre convertis sous forme numrique suivant le format PCM (Pulse Code Modulation) 64 Kbps. Si l'interface tlphonique est numrique (accs RNIS, par exemple), cette fonction est omise. Compression : le signal numrique PCM 64 Kbps est compress selon l'un des formats de codec (compression / dcompression) (Tableau 3-3) puis insr dans des paquets IP. La fonction de codec est le plus souvent ralise par un DSP (Digital Signal Processor). Selon la bande passante disposition, le signal voix peut galement tre transport dans son format originel 64 Kbps. Dcompression : ct rception, les informations reues sont dcompresses .il est ncessaire pour cela d'utiliser le mme codec que pour la compression- puis reconverties dans le format appropri pour le destinataire (analogique, PCM 64Kbps, etc.). L'objectif d'un codec est d'obtenir une bonne qualit de voix avec un dbit et un dlai de compression le plus faibles possibles. Le cot du DSP est li la complexit du codec utilis. Le Tableau ci-dessous prsente les caractristiques des principaux codecs standards de l'UIT. Les codecs les plus souvent mis en oeuvre dans les solutions VoIP sont G.711, G.729 et G.723.1. La qualit d'un codec est mesure de faon subjective en laboratoire par une population test de personnes. Ces dernires coutent tout un ensemble de

conversations compresses selon les diffrents codecs tester et les valuent qualitativement selon la table suivante : Tableau 3: Echelle utilis pour l'valuation de la qualit de voix Qualit de la parole Excellente Bonne Correcte Pauvre Insuffisante Score 5 4 3 2 1

Sur la base des donnes numriques des apprciations, une opinion moyenne de la qualit d'coute (Mean Opinion Score . MOS) est ensuite calcule pour chaque codec. Les rsultats obtenus pour les principaux codecs sont rsums dans le tableau ci-dessous : Tableau 5: MOS des diffrents codecs Codec VoIP G.711 (PCM) G.726 G.729 G.723.1 G.723.1 GSM G.729 x2 G.729 x3 G.729 x GSM Dbit (Kbps) 64 32 8 6.4 5.3 13 Score MOS 4.1 3.85 3.92 3.9 3.65 3.5 3.27 2.68 3.17

Deux observations principales peuvent tre tires du Tableau 3-5 : La qualit de la voix obtenue par les codecs G.729 et G.723.1 ( 6.4Kbps) est trs proche de celle du service tlphonique actuel, et ce pour des dbits entre 8 et 10 fois infrieurs. Ces deux codecs prsentent une meilleure qualit que celle des rseaux tlphoniques cellulaires (GSM).

Le cumul, dans une mme communication, d'oprations de compression/dcompression conduit une rapide dgradation de la qualit. Les solutions mises en oeuvre doivent viter des configurations en tandem dans lesquelles un PBX reoit un appel d'un poste distant travers une liaison VoIP et le redirige vers une autre liaison semblable. Offrant une qualit de voix trs proche, les codecs G.729 et G.723.1 se distinguent essentiellement par la bande passante qu'ils requirent et par le retard que chacun introduit dans la transmission. Le choix d'un quipement implmentant l'un ou l'autre de ces codecs devra donc tre fait selon la situation, en fonction notamment de la bande passante disposition et du retard cumul maximum estim pour chaque liaison (selon les standards de l'UIT, le retard aller ( one-way delay ) devrait tre infrieur 150 ms). Le facteur du jitter est primordiale pour une bonne coute de la Voip.

Dans le domaine de la tlphonie sur IP, les diffrents codecs retransmettent plus ou moins bien le signal original. Pour mesurer la qualit de la voix restituer, on parle de score MOS (Mean Opinion Score). C'est une note comprise entre 1 et 5 et attribue par des auditeurs jugeant de la qualit de ce qu'ils entendent. Score MOS Score MOS Dfinition Exemple Haute qualit Tlphones RNIS 45 Tlphones fixes Qualit commerciale 3,5 4 classiques Qualit acceptable 3 3,5 Qualit militaire 2,5 3 infrieur Qualit synthtique Voix robotise 2,5 Plusieurs codecs peuvent servir dans la VOIP et limage sur IP :

G.711 Ce codec est le premier avoir t utilis dans la VoIP. Mme si il existe maintenant des codecs nettement plus intressants, celui ci continue d'tre implment dans les quipements a des fins de compatibilit entre marques d'quipements diffrentes.

Le principe utilis est le codage du signal selon une chelle logarithmique. Pour cela deux lois diffrentes sont utilises selon les pays. Ce codec produit un flux d'une taille de 64kbit/s et le score MOS qu'il a obtenue est de 4,2 ce qui en fait un codec de bonne qualit de restitution. La partie du spectre de frquence au dessus de 4kHz est cependant limine.

G.722 A la diffrence du G.711, ce codec transforme le spectre jusqu' 7kHz ce qui restitue encore mieux la voix. Les dbits que ce codec fournit sont 48,56 ou 64kbit/s. Une des particularits est de pouvoir immdiatement changer de dbit. Ceci est fortement apprciable lorsque la qualit du support de transmission se dgrade.

G.722.1 Driv du codec prcdent, celui ci propose des dbits encore plus faibles (32 ou 24kbit/s). Il existe mme des versions propritaires de ce codec fournissant un dbit de 16kbit/s.

G.723.1 C'est le codec par dfaut lors des communications faible dbit. Deux modes sont disponibles. Le premier propose un dbit de 6,4kbit/s et le deuxime un dbit de 5,3kbit/s. L aussi, le changement de mode peut se faire en pleine communication. Ce codec est un parfait exemple de codec pertes. Les tonalits DTMF (utilise par exemple lors d'un appel un serveur vocal lorsque l'on appuie sur les touches) ne sont pas correctement retransmises et donc non reconnues. Les scores MOS varient entre 3,7 et 3,9.

G.729 Ce codec est avec G.723 un des plus utiliss en VoIP. A l'instar de ce dernier, il ne convient pas pour des transmissions autres que la voix et ne retransmet pas correctement les tonalits DTMF. Le score MOS obtenu est 4.0.

H.261 Cest une recommandation de compression vido de l'UIT-T. C'est une volution de la norme H.120. Elle fut notamment popularise par la console de jeu Playstation de Sony, qui l'intgra entirement dans son moteur de dcompression de donnes. Les travaux sur la norme H.261 ont ultrieurement servi de base la norme MPEG. Cette norme devenu obsolte, sa succession fut assure par la norme H.263 de meilleure qualit pour la VoIP, pour l'encodage vido pur, on prfrera la norme H.264. Bande passante sur le rseau : 64 kbit/s. Formats d'images :

CIF, dbit de 15 images/seconde (352 288 pixels) QCIF, dbit de 30 images/seconde (176 144 pixels).

H.263 Cest une recommandation concernant la norme de codage vido dveloppe par lUIT-T Q.6/SG16.

lorigine, H.263 a t dvelopp pour la transmission de la vido sur des lignes trs bas dbits, pour des applications de visiophonie via le rseau tlphonique commut de type H.324. Elle a ensuite t intgre dans les protocoles de visioconfrence sur IP du type H.323 mais aussi SIP. Le mme codec a t repris par la norme H.324m qui permet de raliser des appels visio en mode circuit sur les rseaux mobiles de troisime gnration. Au dbut dune communication vido entre deux terminaux quips de ce codec, ils changent leurs caractristiques grce au protocole H.245 et choisissent les modes de H.263 quils utiliseront lors de la communication. Dans le cas de SIP, c'est la partie SDP qui est utilise.

H.264, ou MPEG-4 AVC (Advanced Video Coding), ou MPEG-4 Part 10, est une norme de codage vido dveloppe conjointement par l'UIT-T Q.6/SG16 Video Coding Experts Group (VCEG) ainsi que l'ISO/CEI Moving Picture Experts Group (MPEG) et est le produit d'un effort de partenariat connu sous le nom Joint Video Team (JVT). La norme UIT-T H.264 et la norme ISO/CEI MPEG-4 Part 10 (ISO/CEI 14496-10) sont techniquement identiques, et la technologie employe est aussi connue sous le nom AVC, pour Advanced Video Coding. La premire version de la norme a t approuve en mai 2003 et la plus rcente date de mars 2005 Compression du silence :

Cest une des mthodes utilises par les codecs pour rduire la quantit de donnes transmettre et de dtecter les silences. Dans une conversation tlphonique, chaque locuteur ne parle que 1/3 du temps en moyenne. Ce qui fait que 1/3 du temps d'une conversation est constitu de silence facilement reproductible et donc non cod par le codec. Ce mcanisme s'appelle VAD (Voice Activity Detection - DAV : Dtection d'activit de la voix).

Gnration de bruits de confort :

Pendant une conversation o les silences sont effacs, l'absence de bruit chez le rcepteur peut vite se rvler inconfortable. Dans cette optique, les codecs disposent d'un gnrateur de bruits de confort visant simuler des bruits de fond pour amliorer le confort des utilisateurs.

Robustesse sur les pertes de paquets :

Si les conditions de circulations sur le rseau se dgradent, certains paquets contenant de l'information peuvent se perdent ou arriver trop tard. Ce problme est en partie compens par l'utilisation des buffers mais la gigue peut tre telle que le codec soit oblig de retransmettre au rcepteur un paquet alors qu'il n'est pas arriv. Il existe plusieurs mthodes pour palier ce problme : Il est possible par exemple de simplement rpter le contenu du dernier paquet pour combler le vide. On peut aussi rpartir l'information sur plusieurs paquets de faon introduire une redondance des donnes. En cas de pertes de paquets, le codec dispose ainsi d'une copie du paquet retransmettre.

4. Qualit de Service

a) - Latence La matrise du dlai de transmission est un lment essentiel pour bnficier d'un vritable mode conversationnel et minimiser la perception d'cho (similaire aux dsagrments causs par les conversations par satellites, dsormais largement remplacs par les cbles pour ce type d'usage). Or la dure de traverse d'un rseau IP dpend de nombreux facteurs: Le dbit de transmission sur chaque lien Le nombre d'lments rseaux traverss Le temps de traverse de chaque lment, qui est lui mme fonction de la puissance et la charge de ce dernier, du temps de mise en file d'attente des paquets, et du temps d'accs en sortie de l'lment.

Le dlai de propagation de l'information, qui est non ngligeable si on communique l'oppos de la terre. Une transmission par fibre optique, l'oppos de la terre, dure environ 70 ms. Noter que le temps de transport de l'information n'est pas le seul facteur responsable de la dure totale de traitement de la parole. Le temps de codage et la mise en paquet de la voix contribuent aussi de manire importante ce dlai. Il est important de rappeler que sur les rseaux IP actuels (sans mcanismes de garantie de qualit de service), chaque paquet IP fait son chemin indpendamment des paquets qui le prcdent ou le suivent: c'est ce qu'on appelle grossirement le Best effort pour signifier que le rseau ne contrle rien. Ce fonctionnement est fondamentalement diffrent de celui du rseau tlphonique o un circuit est tabli pendant toute la dure de la communication. Les chiffres suivants (tirs de la recommandation UIT-T G114) sont donns titre indicatif pour prciser les classes de qualit et d'interactivit en fonction du retard de transmission dans une conversation tlphonique. Ces chiffres concernent le dlai total de traitement, et pas uniquement le temps de transmission de l'information sur le rseau. Classe n - Dlai par sens - Commentaires Classe n 1 2 3 4 Dlai par sens 0 150 ms 150 300 ms 300 700 ms Au del de 700 ms Commentaires Acceptable pour la plupart des conversations Acceptable pour des communications faiblement interactives Devient pratiquement une communication half duplex Inutilisable sans une bonne pratique de la conversation half duplex

En conclusion, on considre gnralement que la limite suprieure "acceptable" , pour une communication tlphonique, se situe entre 150 et 200 ms par sens de transmission (en considrant la fois le traitement de la voix et le dlai d'acheminement). b) Perte de paquets

Lorsque les buffers des diffrents lments rseaux IP sont congestionns, ils librent automatiquement de la bande passante en se dbarrassant d'une certaine proportion des paquets entrant, en fonction de seuils prdfinis. Cela permet galement d'envoyer un signal implicite aux terminaux TCP qui diminuent d'autant leur dbit au vu des acquittements ngatifs mis par le destinataire qui ne reoit plus les paquets. Malheureusement, pour les paquets de voix, qui sont vhiculs au dessus d'UDP, aucun mcanisme de contrle de flux ou de retransmission des paquets perdus n'est offert au niveau du transport. D'o l'importance des protocoles RTP et RTCP qui permettent de dterminer le taux de perte de paquet, et d'agir en consquence au niveau applicatif. Si aucun mcanisme performant de rcupration des paquets perdus n'est mis en place (cas le plus frquent dans les quipements actuels), alors la perte de paquet IP se traduit par des ruptures au niveau de la conversation et une impression de hachure de la parole. Cette dgradation est bien sr accentue si chaque paquet contient un long temps de parole (plusieurs trames de voix de paquet). Par ailleurs, les codeurs trs faible dbit sont gnralement plus sensibles la perte d'information, et mettent plus de temps reconstruire un codage fidle. Enfin connatre le pourcentage de perte de paquets sur une liaison n'est pas suffisant pour dterminer la qualit de la voix que l'on peut esprer, mais cela donne une bonne approximation. En effet, un autre facteur essentiel intervient; il s'agit du modle de rpartition de cette perte de paquets, qui peut tre soit rgulirement rpartie, soit rpartie de manire corrle, c'est dire avec des pics de perte lors des phases de congestion, suivies de phases moins dgrades en terme de QoS. c) - Gigue La gigue est la variance statistique du dlai de transmission. En d'autres termes, elle mesure la variation temporelle entre le moment o deux paquets auraient d arriver et le moment de leur arrive effective. Cette irrgularit d'arrive des paquets est due de multiples raisons dont: l'encapsulation des paquets IP dans les protocoles supports, la charge du rseau un instant donn, la variation des chemins emprunts dans le rseau, etc... Pour compenser la gigue, on utilise gnralement des mmoires tampon (buffer de gigue) qui permettent de lisser l'irrgularit des paquets. Malheureusement ces paquets prsentent l'inconvnient de rallonger d'autant le temps de traverse global du systme. Leur taille doit donc tre soigneusement dfinie, et si possible adapte de manire dynamique aux conditions du rseau. La dgradation de la qualit de service due la prsence de gigue, se traduit en

fait, par une combinaison des deux facteurs cits prcdemment: le dlai et la perte de paquets; puisque d'une part on introduit un dlai supplmentaire de traitement (buffer de gigue) lorsque l'on dcide d'attendre les paquets qui arrivent en retard, et que d'autre part on finit tout de mme par perdre certains paquets lorsque ceux-ci ont un retard qui dpasse le dlai maximum autoris par le buffer. d) Cration des Vlans Un VLAN (Virtual Local Area Network ou Virtual LAN, en franais Rseau Local Virtuel) est un rseau local regroupant un ensemble de machines de faon logique et non physique. En effet dans un rseau local la communication entre les diffrentes machines est rgie par l'architecture physique. Grce aux rseaux virtuels (VLANs) il est possible de s'affranchir des limitations de l'architecture physique (contraintes gographiques, contraintes d'adressage, ...) en dfinissant une segmentation logique (logicielle) base sur un regroupement de machines grce des critres (adresses MAC, numros de port, protocole, etc.).

5. Scurit VOIP

a) Les principaux risques Les principaux risques connus lis l'utilisation de la VoIP en entreprise sont : DoS : Attaques entranant l'indisponibilit d'un service/systme pour les utilisateurs lgitimes. Ecoute clandestine : Attaques permettant d'couter l'ensemble du trafic de signalisation et/ou de donnes. Le trafic cout n'est pas modifi. Dtournement du trafic : Attaques permettant de dtourner le trafic au profit de l'attaquant. Le dtournement peut consister rediriger un appel vers une personne illgitime ou inclure une personne illgitime dans la conversation. Identit : Attaques bases sur la manipulation d'identit (usurpation, ). Surfacturation Vols de services : Attaques permettant d'utiliser un service sans avoir rmunrer son fournisseur. Communications indsires : Attaques permettant une personne illgitime d'entrer en communication avec un utilisateur lgitime. b) Scurit rseau La scurit d'un rseau est un niveau de garantie que l'ensemble des machines du rseau fonctionnent de faon optimale et que les utilisateurs des dites machines possdent uniquement les droits qui leur ont t octroys. Il peut s'agir :

d'empcher des personnes non autorises d'agir sur le systme de faon malveillante d'empcher les utilisateurs d'effectuer des oprations involontaires capables de nuire au systme de scuriser les donnes en prvoyant les pannes de garantir la non-interruption d'un service rduire l'accs au rseau (firewall) rduire le nombre de points d'entre (ports) dfinir une politique de scurit interne (mots de passe, lancement d'excutables)

c) Authentification et cryptage Les messages Sip peuvent contenir des donnes confidentielles, en effet le protocole Sip possde 3 mcanismes de cryptage : Cryptage de bout en bout du Corps du message Sip et de certains champs d'entte sensibles aux attaques. Cryptage au saut par saut (hop by hop) fin d'empcher des pirates de savoir qui appelle qui. Cryptage au saut par saut du champ d'en-tte Via pour dissimuler la route qu'a emprunte la requte. De plus, fin d'empcher tout intrus de modifier et retransmettre des requtes ou rponses Sip, des mcanismes d'intgrit et d'authentification des messages sont mis en place. Et pour des messages Sip transmis de bout en bout, des cls publiques et signatures sont utilises par Sip et stockes dans les champs d'entte Autorisation. Une autre attaque connue avec Tcp ou Udp est le deny of service , lorsqu'un Proxy Server intrus renvoie une rponse de code 6xx au client (signifiant un chec gnral, la requte ne peut tre traite). Le client peut ignorer cette rponse. S il ne l'ignore pas et met une requte vers le serveur "rgulier" auquel il tait reli avant la rponse du serveur "intrus", la requte aura de fortes chances d'atteindre le serveur intrus et non son vrai destinataire.

6. VOIP: aspects logiciel et matriel a) Aspects Logiciels Avec la banalisation des rseaux haut dbit le nombre dapplications possibles a considrablement augment. Les applications de VoIP (Voice over IP) sont une des nouvelles possibilits offertes. En effet, laugmentation des dbits et les connexions permanentes offrent des possibilits de dveloppement de la voix sur IP (Internet Protocol). Le dveloppement de la VoIP a entran les concepteurs de plates-formes de programmation dvelopper des API (Application Programming Interface) spcifiques la voix sur IP. Lintgration de nouveaux besoins dans une plate-

forme de dveloppement permet dattirer les concepteurs de logiciels qui doivent intgrer des fonctions de voix sur IP dans leurs applications. Elles implmentent le protocole SIP. Les API de VoIP peuvent tre utilises dans de nombreuses applications, la plus simple tant les tlphones logiciels (soft phones). Dautres applications peuvent intgrer de la VoIP comme besoin secondaire. Citons par exemple les applications de messagerie instantane qui intgrent de plus en plus souvent la possibilit de parler directement avec ses contacts ou bien toutes les applications ncessitant une interaction textuelle entre les diffrentes applications clientes comme les jeux vido.

a-1) Serveurs Logiciels Libres


Asterisk, logiciel de PABX qui supporte entre autres SIP, IAX, MGCP et H323. OpenSER (disponibles dans la majorit des distributions Linux), OpenSIPS et Kamailio, contient une passerelle Jabber et gre l'authentification TLS, licence GPL OfficeSIPS, serveur SIP pour un usage professionnel. SIP Express Router (SER), licence GPL. GNU SIP Witch, serveur de voix sur IP en peer to peer utilisant une implmentation du protocole SIP comme solution de routage. FreeSWITCH, serveur SIP assez peu connu en France. Gatekeeper H323 Proxy H323 Pont multipoint IP H323 : OpenMCU du projet OpenH323 Passerelle H323/Rseau tlphonique : PSTNGw du projet OpenH323

Logiciels propritaires

Cisco SIP Proxy Server Eyeball SIP Proxy Server Sipleo (serveur PABX-IP & SIP Windows) PhonerLite, traduit dans 5 langues, avec une interface rudimentaire c'est le plus simple des clients SIP, l'envoi de SMS, ainsi que les statistiques de la connexion Microsoft Office Communications Server

Cisco Call Manager M2MSoft S5000, SIP Proxy Server et IPBX Linux ou Window

A -2 ) Clients Logiciels Libres


SIPInside, un client SIP qui fonctionne sous Windows. Licence GPL. Ekiga, pralablement nomm GnomeMeeting (Linux et Windows), gre voix et vido. Licence GPL. KPhone, utilise les librairies Qt. Licence GPL. Linphone, voix et vido, utilise les librairies GTK+. SIP Communicator, un client SIP (voix et vido) et de messagerie instantane en Java. SIPdroid, client Android, il permet de se connecter aux serveurs SIP, CSipSimple client Android, multi-comptes, wifi/3G/GPRS, bas sur la librarie native pjsip, GPLv3 SymPhonie, un client SIP pour Mac (beta). Licence GPL. Xlite Sjphone Telephone, un client SIP pour Mac. Licence BSD. Twinkle, logiciel SIP sous Linux (licence GPL), fonctionne en particulier avec Ubuntu. QuteComQuteCOM (prcdemment WengoPhone) logiciel bas sur SIP et client de messagerie instantane; fonctionne sous Windows, Mac et Linux (licence GPL). Environnement Microsoft : Netmeeting Linux : - OhPhone en version "command line" du projet OpenH323 Sun Solaris 2.8 : SunForum - (DC-Share) Silicon Graphics : sgimeeting en version d'valuation (DC-Share). HP : VISUALIZE CONFERENCE - (DC-Share) Windows Live Messenger Skype Yahoo! Messenger Google Talk VLVC Qnext aMSN OnlineCall CUworld Logiciel Ivisit ICUII

Eye Speak Neos mt IM4chat

Logiciels propritaires

Gizmo5 pour Windows XP, Windows 2000, Mac OS X, Linux et Symbian OS Zoiper, gratuit, pour Windows, Mac OS X et Linux X-Lite, gratuit, il fonctionne trs bien avec la Freebox Fring, gratuit, ddi l'iPhone, android, symbian et Windows Mobile Pangolin, dit par PortSIP, gratuit, il fonctionne sous Windows. Compatible avec la Freebox SJphone, edit par SJLabs, gratuit, il fonctionne sous Windows, Linux et MAC et l'iPhone. Compatible avec la Freebox Microsoft Office Communicator, pour Windows Hogunsoft Cont@ct Center, pour Windows, CRM intgre 3CXPhone pour Windows, Android et Iphone b) Aspect matriel

Applications matrielles Plusieurs entreprises produisent des puces capables de dcoder des vidos H.264/AVC. Les puces capables de dcoder en temps rel de la vido haute dfinition sont entre autres les suivantes :

Broadcom BCM7411. Conexant CX2418X. Sigma Designs SMP8634, SMP8635, EM8622L, et EM8624L. STMicroelectronics STB7100, STB7109, NOMADIK (srie STn 8800/8810/8815). WISchip (Micronas USA, Inc.) DeCypher 8100. Neotion NP4 - NEOTION Processor 4. ..

Ce type de puces permet un large dploiement de matriel bas cot capable de jouer des vidos H.264/AVC aux dfinitions de tlvision standard et hautes.

Notons la fabrication des tlphones IP, des passerelles IP GSM, des cartes PCI FX0, FXS, E1T1/PRI, des passerelles mistes avec les constructeurs tels: Tandberg, Polycom, Radvision, FVC, VCON, Cisco, Codian, Grandstream, cisco, Digium

7. TP

Mise en place de la plate-forme (un IPBX pour deux personnes) Ralisation dappels entrants et sortants, renvoi dappel Mise en place des services SDA et groupement d'appel Mise en place dun Serveur Vocal Interactif (IVR) Mise en place des services audio confrence et de messagerie vocale Mise en place des protocoles SIP, MGCP, H.323 avec tudes de traces Ralisation dappels de tlphones portables (GSM) vers les IPphones

8. L'avenir de la VOIP Actuellement, il est vident que la tlphonie IP va continuer de se dvelopper dans les prochaines annes. Le march de la tlphonie IP est trs jeune mais se dveloppe une vitesse fulgurante. C'est aujourd'hui que les entreprises doivent investir dans la tlphonie IP si elles veulent y jouer un rle majeur. Le fait est que IP est maintenant un protocole trs rpandu, qui a fait ses preuves et que beaucoup d'entreprises disposent avantage de la tlphonie IP, car elle demande un investissement relativement faible pour son dploiement. La tlphonie IP ouvre la voie de la convergence voix/donnes et celle de l'explosion de nouveaux services tels que les CTI. Maintenant que la normalisation a atteint une certaine maturit, il n'est plus dangereux de miser sur le standard H323 qui a t accept par l'ensemble de la communaut. La tlphonie IP est une bonne solution en matire d'intgration, de fiabilit, d'volutivit et de cot. Elle fera partie intgrante des Intranets d'entreprises dans les annes venir et apparatra aussi dans la tlphonie publique pour permettre des communications bas cot. Enfin, le dveloppement de cette technologie reprsente-t-il un risque ou une opportunit pour les oprateurs traditionnels ? La rponse n'est pas tranche. D'un cot, une stagnation des communications classiques; d'un autre cot l'utilisation massive d'Internet va augmenter le trafic et dvelopper de nouveaux services que pourront dvelopper les oprateurs. Bientt nous tlphonerons tous sur IP... On peut ainsi vraisemblablement penser que le protocole IP deviendra un jour un standard unique permettant l'interoprabilit des rseaux mondialiss.