Vous êtes sur la page 1sur 70

N° d’ordre : 03 / SII Année Universitaire : 2005 / 2006

UNIVERSITE D’ANTANANARIVO
-------------------------------------
ECOLE SUPERIEURE POLYTECHNIQUE
----------------------------------------
DEPARTEMENT TELECOMMUNICATION

MEMOIRE DE FIN D’ETUDES

en vue de l’obtention

du DIPLOME d’INGENIEUR

Spécialité : Télécommunications
Option : Signaux Images Informations

Par : RABARIMISA Solo Andriniaina

Soutenu le 30 Janvier 2007 devant la Commission d’Examen composée de :

Président : M. RATSIMBAZAFY Andriamanga

Examinateurs :
M. RANDRIARIJAONA Lucien Elino
M. RATSIHOARANA Constant
M. RAZAKARIVONY Jules

Directeur de mémoire : Mme RABEHERIMANANA Lyliane Irène


REMERCIEMENTS

Je tiens tout d’abord à remercier Dieu pour m’avoir donné la force et le courage de mener à terme
ce mémoire.

Je remercie également :
- Monsieur RAMANANTSIZEHENA Pascal, Directeur de l’ESPA,
- Monsieur RANDRIAMITANTSOA Paul Auguste, Chef du département
Télécommunications,
- Monsieur RATSIMBAZAFY Andriamanga pour l’honneur qu’il me fait en acceptant
de présider le Jury,
- Madame RABEHERIMANANA Lyliane, mon encadreur, pour ses précieuses aides et
indications et pour le temps qu’elle m’a consacré,
- Les membres du Jury qui ont bien voulu apporter leur appréciation, à savoir :
• Monsieur RANDRIARIJAONA Lucien Elino,
• Monsieur RATSIHOARANA Constant,
• Monsieur RAZAKARIVONY Jules,
- Tous les membres du corps professoral au sein du département Télécommunication qui
m’ont transmis de précieuses connaissances,
- Ma famille, qui m’a appuyé tout au long de ce travail,
- Mes amis et proches qui m’ont toujours supporté,
- Toutes les personnes qui ont contribué, de près ou de loin, à la réalisation de ce
mémoire.

Que Dieu vous réponde des biens que vous m’avez apportés.

Andriniaina
AVANT PROPOS

Ce rapport a été conçu pour donner un aperçu sur la VoIP et des notions sur le SVI. Il est
dédié à tous ceux qui en sont intéressés et surtout pour ceux qui veulent apporter des améliorations
sur le travail effectué.
Ceci est la concrétisation des connaissances acquises durant les années passées à l’Ecole
Supérieure Polytechnique d’Antananarivo dans le Département Télécommunication.
La conception du SVI utilisant la VoIP a été choisie du fait que c’est une technique en
pleine effervescence et qui trouvera sa place dans la vie de tous les jours. En effet, ce système ne
serait plus réservé uniquement pour les opérateurs téléphoniques mais surtout pour toutes
entreprises qui voudraient se rapprocher un peu plus de leur clientèle tout en réduisant leurs
dépenses en termes de coûts.
TABLE DES MATIERES

REMERCIEMENTS
AVANT-PROPOS
TABLE DES MATIERES……………………………………………….…………....…………..i
NOTATIONS………………………………………………………………………………...……iv

INTRODUCTION GENERALE………………………………………………...…….…………1
CHAPITRE 1 : GENERALITES SUR LA VOIX SUR IP………………………..……… …...3

1.1 Introduction [2] [3]…………………………………………………………………………………... . 3

1.2 Architecture [1] [2] [4]………………………………………………………………………………... 4

1.2.1 Topologie.......................................................................................................................................................... 4
1.2.2 Gateway et Gatekeeper..................................................................................................................................... 5

1.3 Les protocoles de la voix sur IP [2] [4] [5] [6] [7] [8] ……………………………………………... .. 6

1.3.1 Le protocole H.323.......................................................................................................................................... 6


1.3.1.1 Définition .................................................................................................................................................... 6
1.3.1.2 Principales applications du protocole H.323 ........................................................................................... 7
1.3.1.3 Architecture ............................................................................................................................................... 7
a) Communication « Point à Point » de deux clients simples......................................................................................... 7
b ) Communication « Point à Point » entre deux clients enregistrés auprès d'un Gatekeeper ........................................ 8
c ) Communication « Multipoints » entre plusieurs clients (MCU nécessaire)................................................................ 9
1.3.1.4 Avantages et inconvénients ..................................................................................................................... 10
1.3.2 Le protocole SIP ............................................................................................................................................ 10
1.3.2.1 Définition .................................................................................................................................................. 10
1.3.2.2 Fonctionnalités ......................................................................................................................................... 11
1.3.2.3 Architecture ............................................................................................................................................. 11
1.3.2.4 Ouverture d’une session ......................................................................................................................... 12
1.3.2.5 Description des méthodes de requêtes ................................................................................................... 13
1.3.2.6 Format des messages SIP ........................................................................................................................ 13
1.3.2.7 Exemple de message SIP ........................................................................................................................ 14
1.3.2.8 Sécurité et Authentification .................................................................................................................... 16
1.3.2.9 Avantages et inconvénients ..................................................................................................................... 16
1.3.3 Le protocole RTP ........................................................................................................................................... 17
1.3.3.1 Définition .................................................................................................................................................. 17
1.3.3.2 Les fonctions de RTP .............................................................................................................................. 17

i
1.3.3.3 En-tête RTP ............................................................................................................................................. 18
1.3.4 Le protocole RTCP ........................................................................................................................................ 18
1.3.4.1 Fonctionnement ....................................................................................................................................... 18
1.3.4.2 En-tête RTCP........................................................................................................................................... 21
1.3.5 Le protocole IAX ............................................................................................................................................ 21

CHAPITRE 2 : NOTIONS DE BASE SUR LE SVI………………………………….…….…22

2.1 Généralités [9] [10]…………………………………………………………………………………... 22

2.1.1 Définition ....................................................................................................................................................... 22


2.1.2 Avantages ....................................................................................................................................................... 23

2.2 Architecture………………………………………………………………………………………. .... 24

2.3 Arborescence vocale [9] [10]………………………………………………………………………... 25

2.3.1 Définition ....................................................................................................................................................... 25


2.3.2 Avantages ....................................................................................................................................................... 25
2.3.3 Exemple d’arborescence vocale .................................................................................................................... 26

2.4 Conception d’un script SVI [10]…………………………………………………………………… 27

2.4.1 Importation des messages vocaux ................................................................................................................. 27


2.4.2 Présentation des différentes actions .............................................................................................................. 28
2.4.3 La liste de diffusion ....................................................................................................................................... 28
2.4.4 La messagerie ................................................................................................................................................ 28
2.4.5 La sélection selon la plage horaire................................................................................................................ 29
2.4.6 Le branchement et les boucles....................................................................................................................... 29
2.4.6.1 Le branchement ....................................................................................................................................... 29
2.4.6.2 Les boucles ............................................................................................................................................... 29
2.4.7 L'accès aux bases de données ....................................................................................................................... 29
2.4.8 La fin de scénario .......................................................................................................................................... 30

2.5 VoiceXML [11] [12]………………………………………………………………………………… . 30

2.5.1 Généralité ....................................................................................................................................................... 30


2.5.2 Similitude entre HTML et VoiceXML ........................................................................................................... 31
2.5.3 Fonctionnement ............................................................................................................................................. 31
2.5.4 Avantages ....................................................................................................................................................... 32
2.5.5 Exemples ........................................................................................................................................................ 33

ii
CHAPITRE 3 : IMPLEMENTATION DU SVI SOUS LE SERVEUR PBX ASTERISK
……………………………………………………………………………………………….….…36

3.1 Présentation du travail…………………………………………………………………………… .... 36

3.2 Conception du SVI……………………………………………………………………………….. ..... 37

3.2.1 Choix du genre de la sonnerie ....................................................................................................................... 38


3.2.2 Choix de la sonnerie ....................................................................................................................................... 38
3.2.3 Choix d’envoi de la sonnerie .......................................................................................................................... 39

3.3 Réalisation du SVI ………………………………………………………………………………. ..... 39

3.3.1 Présentation d’Asterisk .................................................................................................................................. 39


3.3.1.1 Description générale ................................................................................................................................ 39
3.3.1.2 Caractéristiques ....................................................................................................................................... 40
3.3.1.3 Configuration matérielle ......................................................................................................................... 40
3.3.1.4 Configuration de la connexion réseau .................................................................................................... 40
3.3.2 Installation...................................................................................................................................................... 40
3.3.3 Description de Trixbox ................................................................................................................................... 41
3.3.4 Les fichiers de configuration ......................................................................................................................... 44
3.3.5 Sipphone .......................................................................................................................................................... 46
3.3.6 Les difficultés................................................................................................................................................. 47
3.3.6.1 Au niveau son ........................................................................................................................................... 47
3.3.6.2 Au niveau adresse IP ............................................................................................................................... 48
3.3.7 Amélioration du présent système ................................................................................................................... 48

CONCLUSION GENERALE .................................................................................................................... 50

A N N E X E S .............................................................................................................................................. 51

ANNEXE 1 : CODES DE LA SIMULATION DU SVI ........................................................................... 52

ANNEXE 2 : CENTRE D’APPELS........................................................................................................... 55

A.2.1 Définition……………………………………………………………………………………………. 55
A.2.2 Dimensionnement…………………………………………………………………………………… 55
A.2.3 Logiciels utilisés……………………………………………………………………………………... 56

ANNEXE 3 : SOFTPHONE ....................................................................................................................... 57

ANNEXE 4 : DOCUMENTATIONS SUR ASTERISK......................................................................... 528

BIBLIOGRAPHIE .............................................................................................. Erreur ! Signet non défini.9

iii
NOTATIONS

ACD : Automatic Call Distribution


ADSL : Asymmetric Digital Subscriber Line
AGI : Asterisk Gateway Interface
ASR : Automatic Speech Recognition
CCXML : Call Control XML
CRM : Customer Relationship Management
CTI : Couplage Téléphonie Informatique
DTMF : Dual Tone Multi Frequency
GSM : Global System for Mobile communications
IAX : Inter Asterisk eXchanged
IETF : Internet Engineering Task Force
ISDN : Integrated Service Digital Network
ISO : International Organization for Standardization
MGCP : Media Gateway Control Protocol
MRCP : Media Ressource Control Protocol
MCU : Multipoint Control Unit
NAT : Network Address Translator
NAT ALG : NAT Algorithme
PABX : Private Automatic Branch eXchange
PBX : Private Branch eXchange
PSTN : Public Switched Telephone network
QoS : Quality of Service
RAS : Registration Admission Status
RFC : Request For Comments
RTC : Réseau Téléphonique Commuté
RTCP : Real-Time Control Protocol
RTP : Real-Time transport Protocol
SDP : Session Description Protocol
SGBD : Structure de Gestion de Base de Données
SIP : Session Initiation Protocol

iv
SRGS : Speech Recognition Grammar Specification
SSML : Speech Synthesis Markup Language
SVI : Serveur Vocal Interactif
ToIP : Telephony over IP
TTS : Text To Speech
UDP : User Datagramme Protocol
UIT : Union Internationale des Télécommunications
URI : Uniform Ressource Identifier
VoIP : Voice over IP
VXML : Voice XML
XML : eXtensible Markup Language

v
INTRODUCTION GENERALE [1]

Actuellement, la concurrence entre les entreprises se situe au niveau de la relation clientèle. Elles
ne peuvent plus rester en tant que fournisseurs de services ou de produits. Le dialogue direct avec
les clients est devenu un enjeu très important afin d’écouter les besoins des clients devenus de plus
en plus exigeants en terme de qualité de service et d’informations claires et précises. C’est pour
cela que les systèmes SVI (Serveur Vocal Interactif) sont devenus incontournables dans les
entreprises. Il s’agit très souvent du premier contact téléphonique entre un client et le prestataire
de service. Le SVI a pour objectif de ‘router’ les appels vers les destinataires appropriés, de
transférer les appels vers la messagerie ou de consulter des informations spécifiques (état de son
compte en banque, météo,…). Les applications sont nombreuses et très variées. La réduction des
coûts est l’une des raisons pour laquelle les entreprises utilisent de plus en plus un tel service. En
effet, l’utilisation d’un SVI permet en fait un gain de temps pour les entreprises qui libèrent une
partie de leurs employés de tâches telles que répondre au téléphone pour des requêtes qui
pourraient être traitées par une machine. Le SVI permet de collecter des informations et d’en
délivrer.
La téléphonie sur Internet permet de donner un second souffle à la relation prestataire/client. La
relation téléphonique avec la clientèle peut être désormais aisément couplée avec l’informatique.
Le CTI (Couplage Téléphonie et Informatique) est en plein essor car il permet d’augmenter, de
manière significative, la productivité d’un centre d’appels par exemple, et de réduire bien entendu
le coût des communications. L’informatique dont il est question ici concerne les outils de gestion
des coordonnées des clients et le suivi des relations commerciales ou CRM (Customer
Relationship Management).
La voix sur IP est à elle toute seule un bond en avant dans le domaine des télécommunications car
désormais, il ne s'agit plus d'un domaine réservé aux professionnels et passionnés d'informatique.
Mais à l'intérieur même de ce monde VoIP (Voice over IP), la vitesse à laquelle les choses
évoluent est très impressionnante. Les technologies sont de plus en plus matures et de plus en plus
nombreuses. A titre d'exemple, les adeptes de la VoIP ont été témoin de mini révolutions

1
techniques avec l'apparition de nouveaux protocoles, de nouveaux codecs, de nouveaux logiciels.
Il existe actuellement des éditeurs de solutions qui mettent à la disposition de ces entreprises des
serveurs téléphoniques IP intégrant non seulement toutes les fonctionnalités d’un réseau
téléphonique classique, mais aussi de nouvelles applications comme la reconnaissance vocale, la
visioconférence, la boîte vocale, la gestion automatique des files d’attente,….
Le travail présenté ici est axé sur ce thème. Il s’intitule “Etude d’un Serveur Vocal Interactif
sur un serveur PBX“.
Pour ce faire, ce rapport de mémoire compte trois chapitres. Le premier chapitre va définir ce
qu’est vraiment la VoIP, son principe de fonctionnement, et les protocoles utilisés. Dans le second
chapitre, on va donner de plus amples descriptions sur le SVI, ainsi que sa fonctionnalité et sa
réalisation. L’implémentation du SVI sous le serveur Asterisk fera l’objet du dernier chapitre.

2
CHAPITRE 1 : GENERALITES SUR LA VOIX SUR IP

Ce chapitre décrit la technologie de la VoIP, son architecture dans un réseau d’entreprise et les
différents protocoles utilisés.

1.1 Introduction [2] [3]


La VoIP est une technologie de communication vocale en pleine émergence actuellement. Elle fait
partie d'un tournant dans le monde de la communication. La transmission de la voix, des données
et vidéo en même temps sur une seule voie devient un objectif majeur tant pour les entreprises que
pour les développeurs. L'Internet s'est étendu partiellement dans l'Intranet de chaque société,
voyant le trafic total basé sur un transport réseau de paquets IP surpassant le trafic traditionnel du
réseau voix (réseau à commutation de circuits). Devant cette avancée technologique, les
opérateurs, entreprises ou organisations et fournisseurs devaient, pour bénéficier de l'avantage du
transport unique IP, introduire de nouveaux services voix et vidéo. Au lieu de disposer à la fois
d'un réseau informatique et d'un RTC (Réseau Téléphonique Commuté), l'entreprise peut donc,
grâce à la VoIP, tout fusionner sur un même réseau. Schématiquement, le transport de la voix se
fait ainsi. Le codec audio de l'émetteur numérise et compresse la voix, ces données numériques
sont acheminées jusqu'au destinataire dans des paquets IP. Le codec du destinataire effectue les
opérations inverses (décompression, puis restitution du son). Cela vient du fait que la téléphonie
devient de la "data". Les nouvelles capacités des réseaux à haut débit devraient permettre de
transférer de manière fiable des données en temps réel. Ainsi, les applications de vidéo ou
audioconférence ou de téléphonie vont envahir le monde IP qui, jusqu'alors, ne pouvait
raisonnablement pas supporter ce genre d'applications.
Comme toute innovation technologique qui se respecte, la VoIP doit non seulement simplifier le
travail mais aussi faire économiser de l'argent. Les entreprises dépensent énormément en
communications téléphoniques, or le prix des communications de la ToIP (Téléphonie sur IP) est
dérisoire en comparaison. En particulier, plus les interlocuteurs sont éloignés, plus la différence de
prix est intéressante. Ceci apporte un grand intérêt pour la voix sur réseau privé. Il semblerait que
les entreprises après avoir émis un certain nombre de doutes sur la qualité de services soient
désormais convaincues de la plus grande maturité technologique des solutions proposées sur le
marché.

3
Les premières technologies de VoIP imaginées étaient propriétaires et donc très différentes les
unes des autres. Pourtant, un système qui est censé mettre des gens et des systèmes en relation
exige une certaine dose de standardisation. C'est pourquoi sont apparus des protocoles standards,
comme le H323 ou le SIP (Session Initiation Protocol).

1.2 Architecture [1] [2] [4]


1.2.1 Topologie
La figure 1.01 présente l’architecture d’un réseau téléphonique d’entreprise qui utilise la VoIP.

Figure 1.01 : Architecture d’une installation VoIP sur le réseau téléphonique d’entreprise

Suivant cette architecture, le réseau téléphonique PBX/VoIP est composé d’un ou de plusieurs
téléphones SIP/VoIP, d’un serveur PBX et éventuellement d’une passerelle VoIP pour les liaisons
analogiques (routeur ou matériel spécifique). Le serveur PBX est similaire à un serveur de proxy :
les clients SIP (des softphones ou des IP Phones) sont enregistrés auprès d’un serveur PBX.

4
Lorsqu’ils désirent passer un appel, ils demandent au PBX d’établir la connexion. Ce dernier
possède un registre de tous les téléphones/usagers et de leurs adresses SIP respectives. Ainsi, il est
capable de connecter un appel local ou de router un appel externe soit par le biais d’une passerelle
VoIP ou d’un fournisseur de service VoIP.

Le terme « VoIP » est en général utilisé pour décrire des communications « point à point ». Pour
la diffusion de son sur IP en multipoints, on parlera plutôt de streaming, comme les radios Web
par exemple. La voix ou le son sur IP peut se faire en mode Unicast, Broadcast ou Multicast sur
les réseaux, c'est-à-dire en mode « point à point », en mode « une émission et plusieurs
réceptions » (comme un émetteur TV, par ex.) et en mode « une émission pour plusieurs
réceptions » (mais le signal n'est routé que s'il y a des récepteurs). Le transport de communication
sur IP est très dépendant du délai de latence d'un réseau. Ce délai influe beaucoup sur la qualité
psycho-acoustique d'une conversation. Les connexions par liaison satellite souffrent d'un temps de
latence souvent trop important pour prendre en charge les applications de voix sur IP. En
moyenne, le temps de latence sur ce type de liaison est estimé entre 400 et 800 ms. Une connexion
filaire (fibre optique ou cuivre) bénéficie d'un temps de latence de 60 à 200 ms. Plus que la latence
c'est la gigue qui pénalise la voix sur IP. En effet, s'il y a des fluctuations du signal en amplitude et
fréquence il faudra un mécanisme de remise en ordre des paquets afin de restituer le message
vocal, processus qui se traduira par des blancs, des attentes.

1.2.2 Gateway et Gatekeeper


Le Gateway fournit la possibilité d'établir une connexion entre un terminal analogique et un
terminal multimédia (un PC en général). Les Gateway (partie physique) et les Gatekeeper (partie
logicielle) font l'objet de deux sections séparées pour bien cerner la différence. Certaines sociétés
vendent un produit " Gateway ", mais en réalité, elles incorporent une autre Gateway du marché
avec leur Gatekeeper pour proposer une solution commerciale. La plus-value ne se fait pas sur la
Gateway mais sur le Gatekeeper car c'est sur celui-ci qui fait la différence.
Un Gatekeeper intègre deux services principaux : la gestion des permissions et la résolution
d'adresses. Il est aussi responsable de la sécurité. Quand un client veut émettre un appel, il doit le
faire au travers du Gatekeeper. C'est alors que celui-ci fournit une résolution d'adresse du client de
destination. Dans le cas où il y a plusieurs Gateway sur le réseau, il peut rediriger l'appel vers un
autre couple Gateway/Gatekeeper qui essaiera à son tour de router l'appel. Pendant la résolution

5
d'adresse, le Gatekeeper peut aussi attribuer une certaine quantité de bande passante pour l'appel.
Il peut agir comme un administrateur de la bande passant disponible sur le réseau.

1.3 Les protocoles de la voix sur IP [2] [4] [5] [6] [7] [8]
Ce paragraphe décrit les cinq principaux protocoles utilisés en transmission de voix sur IP.

1.3.1 Le protocole H.323


1.3.1.1 Définition
Créé en 1996 par l’UIT (Union Internationale des Télécommunications), le H.323 est le protocole
standard international de communication multimédia pour les réseaux en commutation de paquet.
Trois protocoles de signalisation sont spécifiés dans le cadre de H.323 :
- RAS (Registration Admission Status) : Ce protocole est utilisé pour communiquer avec
un Gatekeeper. Il sert notamment aux équipements terminaux pour découvrir l'existence
d'un Gatekeeper et s'enregistrer auprès de ce dernier ainsi que pour les demandes de
traduction d'adresses. La signalisation RAS utilise des messages H.225 transmis sur un
protocole de transport non fiable (UDP, par exemple).
- Q.931 : H.323 utilise une version simplifiée de la signalisation ISDN Q.931 pour
l'établissement et le contrôle d'appels téléphoniques sur IP. Cette version simplifiée est
également spécifiée dans la norme H.225.
- H.245 : ce protocole est utilisé pour l'échange de capacités entre deux équipements
terminaux comme par exemple, pour se mettre d’accord sur la façon de coder les
informations échangées. Il est important que les téléphones (ou systèmes) se servent
d’un langage commun et s’il y a plusieurs langages, choisir le plus adapté. Il peut s’agir
du codec qui nécessite le moins de bande passante ou celui qui offre la meilleure
qualité. Il peut également servir à mesurer le retard aller-retour (Round Trip Delay)
d'une communication.

Le transport de l’information s’appuie sur le protocole RTP (Real-Time transport Protocol) qui
transporte la voix, la vidéo ou les données numérisées par les codecs. Les messages RTCP (Real-
Time Control Protocol) peuvent servir pour faire du contrôle de qualité, voire demander de
renégocier les codecs si, par exemple, la bande passante diminue.

6
1.3.1.2 Principales applications du protocole H.323
- Certaines Offres de Téléphonie sur IP grand public,
- Les clients (NetMeeting, Ekiga, ex-GnomeMeeting, Ophone, ichat AV, etc.),
- Les Gatekeeper, ou gardiens de porte, servant à l'administration des communications et
à la translation d'identifiants de connexion (ID H323),
- Les MCU (Multipoint Control Unit), des ponts multipoints,
- Les Gateway, des passerelles H.320 devenus H.323.

1.3.1.3 Architecture
Il existe plusieurs manières d’implémenter une architecture H.323. De nombreux messages sont
optionnels et dans la pratique, certains seulement sont utilisés. Par exemple, si l’authentification
n’est pas une préoccupation, des messages RAS ne sont pas nécessaires.
Il est également possible d’enchaîner les messages de plusieurs manières différentes comme ouvrir
les canaux RTP sans attendre le message « connect » indiquant que la personne appelée a bien
décrochée (early H.245).
Les messages H.225, H.245 et RTP peuvent passer par des chemins différents; par exemple la
signalisation traversera plusieurs Gatekeeper qui participent au contrôle et au routage de l’appel
alors que le flux RTP passe directement d’un poste à l’autre.

a) Communication « Point à Point » de deux clients simples


- L'appelant entre l'adresse IP du destinataire dans le champ du logiciel réservé à cet effet.
- Les protocoles de signalisation proposent au logiciel du destinataire d'établir la
communication et transmet son ID H323.
- Le logiciel du destinataire répond soit « occupé » soit « libre ».
- Si « libre », l'appelant énumère ses possibilités de codecs audio et vidéo (si disponibles).
- Le destinataire énumère les codecs compatibles à l'appelant pour accord. Si accord,
d'autres ports TCP et UDP sont négociés pour l'audio (UDP), la vidéo (UDP) et les
données (TCP).
- Chaque flux est ensuite transmis indépendamment des autres.
- A la fermeture d'une session, les ports sont libérés et les transmissions de contrôles
arrêtées.

7
La figure 1.02 illustre cette communication.

Figure 1.02 : Communication point à point de deux utilisateurs simples

b) Communication « Point à Point » entre deux clients enregistrés auprès d'un Gatekeeper
Le Gatekeeper intervient sur la signalisation.
- À l'ouverture du logiciel, le client A s'enregistre auprès du Gatekeeper en lui
transmettant son ID H323 et son adresse IP.
- Le client B fait de même.
- Le client A entre l'ID de connexion du client B dans le champ du logiciel réservé à cet
effet.
- Le logiciel du client A demande l'autorisation au Gatekeeper pour se connecter au client
B.
- Si le Gatekeeper accepte, celui-ci demande au client B son état (déjà en conversation ou
non).
- Si état compatible, le Gatekeeper transmet l'adresse IP du client B au client A.
- Le Gatekeeper informe le client B qu'une communication va avoir lieu avec le client A.
- Le client A entre directement en négociation avec le client B avec les protocoles de
contrôle de communication.
- Le client A énumère ses possibilités de codecs audio et vidéo (si disponibles).
- L'appelé énumère les codecs compatibles à l'appelant pour accord.
- Si accord, d'autres ports TCP et UDP sont négociés pour l'audio (UDP), la vidéo (UDP)
et les données (TCP).
- Tous les flux sont ensuite transmis indépendamment les uns des autres sans passer par le
Gatekeeper mais directement entre les clients.
- À la fermeture d'une session, le Gatekeeper est informé de la fin de connexion, les ports
sont libérés et les transmissions de contrôles arrêtés.

8
Cet échange est présenté sur la figure 1.03.

Figure 1.03 : Communication point à point avec Gatekeeper

c) Communication « Multipoints » entre plusieurs clients (MCU nécessaire)


Les MCU (Multipoint Control Unit) ont des capacités de traitement du signal (diffusion,
enregistrement, mixage,...). Ils sont utilisés pour permettre la conférence en mixant les flux audio,
diffuser des messages réseau comme la tonalité, le bip de mise en attente, voire réaliser des
fonctions élémentaires de messagerie vocale.
Le MCU s'annonce auprès du Gatekeeper et lui énonce ses possibilités :
- Nombre de clients possibles.
- Débit (en octets/secondes) possible par client ou débit total maximal.
- ID H323 de connexion.
Les communications seront ensuite traitées comme dans le cas précédent, le MCU devenant alors
un « simple client » au vu des appelants ; la différence se trouvant simplement dans le nombre de
communications acceptées avant transmission du message « occupé ».
La communication “ Multipoints “ est schématisée sur la figure 1.04.
Remarque : Les principaux ports utilisés par le protocole H.323 sont 1720 TCP et suivants, les
autres sont négociés dynamiquement. Le protocole H.323 ne suit pas les recommandations ISO
sur les séparations de couches du modèle réseau. On trouve des données sur les couches IP dans la
couche « Application » du modèle. D'autre part, le protocole a tendance à ouvrir des « ports » à la

9
volée pour la communication, ce qui fait que le passage d'un pare-feu (firewall) ou le NAT
(Network Address Translator) est souvent problématique. Néanmoins il existe aujourd'hui des
solutions applicatives (NAT ALG) qui permettent de contrecarrer la présence de données IP
(souvent privées) dans la partie application du modèle.
Des équipements réseaux sont conçus actuellement sachant gérer les protocoles associés à H.323,
notamment à cause de la téléphonie sur IP (ToIP).

Figure 1.04 : Communication multipoints

i. Avantages et inconvénients
Le tableau 01 montre les avantages et les inconvénients de l’utilisation du protocole H.232.

1.3.2 Le protocole SIP


1.3.2.1 Définition
A l’opposé de H.323, SIP a été introduit par le monde Internet. Son rôle est d’ouvrir, modifier et
libérer les sessions. L’ouverture de ces sessions permet de réaliser de l’audio ou vidéoconférence,
de l’enseignement à distance, de la voix (téléphonie) et de la diffusion multimédia sur IP
essentiellement.
Un utilisateur peut se connecter avec les utilisateurs d’une session déjà ouverte. Pour ouvrir une
session, un utilisateur émet une invitation transportant un descripteur de session permettant aux
utilisateurs souhaitant communiquer de s’accorder sur la compatibilité de leur média. SIP permet

10
alors de relier des stations mobiles en transmettant ou redirigeant les requêtes vers la position
courante de la station appelée.

Avantages Inconvénients
Codec standards pour la compression de Interopérabilité limitée : limitation de la qualité
données : sonore dépendamment du type de codec utilisé
- G.7XX pour l’audio de part et d’autre
- H.26X pour la vidéo
Gestion automatique de la bande passante : Protocole complexe : énorme traitement pour
limite le nombre de connexion les terminaux
attribue une partie de la bande
Economie de ressources : support du multipoint Déploiement coûteux
et du multicast
Interopérable : indépendant du réseau et du
système d’exploitation
Le plus utilisé en visioconférence sur IP

Tableau 01 : Avantages et inconvénients de H.323

1.3.2.2 Fonctionnalités
- Localisation du terminal appelé ;
- Analyse du profil et des ressources du destinataire ;
- Négociation du type de média (voix, vidéo, données…) et des paramètres de
communication ;
- Disponibilité de l’appelé : détermine si le poste appelé souhaite communiquer, et
autorise l’appelant à le contacter ;
- Etablissement et suivi de l’appel : avertit les parties appelant et appelé de la demande
d’ouverture de session, gestion du transfert et de la fermeture des appels.

1.3.2.3 Architecture
Avec SIP, les utilisateurs qui ouvrent une session peuvent communiquer en mode point à point, en
mode diffusif ou dans un mode combinant les deux suivant la figure 1.05.

11
- En point à point : communication entre deux machines, on parle d’unicast. C’est le cas
de la téléphonie sur IP.
- En diffusif : plusieurs utilisateurs en multicast, via une unité de contrôle M.C.U. La
visioconférence et le forum en sont des exemples.
- En mode combinatoire : plusieurs utilisateurs pleinement interconnectés en multicast
via un réseau à maillage complet de connexions.

Figure 1.05 : Architectures de communication en SIP

1.3.2.4 Ouverture d’une session


Différentes considérations interviennent dans l’ouverture d’une session :
- Suivant la nature des échanges, le choix des protocoles les mieux adaptés (RTP,
RTCP, SDP).
- Détermination du nombre de sessions : par exemple, pour véhiculer de la vidéo, deux
sessions doivent être ouvertes (l’une pour l’image et l’autre pour le son).
- Chaque machine est identifiée par une adresse appelée URL SIP de même structure
qu’une URL Mailto :
Informations_utilisateur@domaine paramètres en-têtes
où :
Informations_utilisateur est le nom d’utilisateur ou numéro de téléphone
Domaine : nom de domaine (mondomaine.mg) ou adresse IP : port
Paramètres : transport = udp ou tcp / user = phone ou IP / method = INVITE, ACK, OPTIONS,
BYE, CANCEL, REGISTER / ttl = 0 à 255 / maddr = adresse IP de multicast…
En-têtes : hname = hvalue & hname = hvalue…

12
1.3.2.5 Description des méthodes de requêtes
Les échanges entre un terminal appelant et un terminal appelé se font par l’intermédiaire de
requêtes.
- La requête URI : permet de localiser le proxy server auquel est rattachée la machine de
l’appelé.
- La requête SIP : une fois le client (machine appelante) connecté à un serveur SIP distant,
il peut lui adresser une ou plusieurs requêtes SIP et recevoir une ou plusieurs réponses
de ce serveur. Les réponses contiennent certains champs identiques à ceux des requêtes,
tels que : Call-ID, Cseq, To et From.
- INVITE : cette requête indique que l’application (ou utilisateur) correspondante à l’URL
SIP spécifiée est invitée à participer à une session. Le corps du message décrit cette
session (par ex : média supportés par l’appelant). En cas de réponse favorable, l’invité
doit spécifier les médias qu’il supporte.
- ACK : permet de confirmer que le terminal appelant a bien reçu une réponse définitive à
une requête INVITE.
- OPTIONS : un proxy server, en mesure de contacter un terminal appelé, doit répondre à
une requête OPTIONS en précisant ses capacités à contacter le même terminal.
- BYE : cette requête est utilisée par le terminal de l’appelé afin de signaler qu’il souhaite
mettre un terme à la session.
- CANCEL : cette requête est envoyée par un terminal ou un proxy server afin d’annuler
une requête non validée par une réponse finale : si une machine ayant été invitée à
participer à une session, et ayant accepté l’invitation ne reçoit pas de requête ACK, alors
elle émet une requête CANCEL.
- REGISTER : cette méthode est utilisée par un client pour enregistrer son adresse auprès
du serveur auquel il est relié.

1.3.2.6 Format des messages SIP


Un message SIP peut être à la fois une requête d’un client (terminal appelant) vers un serveur
(terminal appelé), ou une réponse d’un serveur vers un client. La figure 1.06 montre la structure
du message dans les deux sens.
Les différents champs qui y sont décrits sont définis dans le tableau 02.

13
Structure d’une requête client vers un serveur

Ligne de requête
(Méthode, Requête URI, version SIP)
En-tête général, ou de requête ou d’entité
CRLF (permet de spécifier la fin du champ d’en-tête, et le début du corps du message)
Corps du message

Structure d’une requête serveur vers un client

Ligne d’état
(version SIP, code d’état, Reason Phases)
En-tête général, ou de réponse ou d’entité
CRLF (permet de spécifier la fin du champ d’en-tête, et le début du corps du message)
Corps du message

Figure 1.06 : Structure des paquets IP suivant le protocole SIP

1.3.2.7 Exemple de message SIP


La figure 1.07 est la capture d’un paquet IP transmis utilisant le protocole SIP.

Figure 1.07 : Exemple de composition d’un message SIP

14
Sur cette figure, le logiciel de capture sépare bien les différents champs qui composent le message
SIP. L’en-tête général indique ici la source (0331468007@192.168.1.211) et le destinataire
(611@192.168.1.213). Il n’y a pas de code d’indication Accept ce qui vérifie la présence du
protocole SDP dans le corps du message.

Champs Description
Code d’état Entier codé sur 3 bits indiquant un résultat à l’issue de la réception
d’une requête
Reason phases Motif du refus ou de l’acceptation d’une requête
En-tête général Accept (permet d’indiquer les types de média qui seront acceptés dans
la réponse).Si aucun champ Accept, utilisation du protocole SDP.
Call ID (identifie une invitation précise)
Accept-Encoding, ou Cseq

En-tête de requête Priority (indique le niveau de priorité de la requête)

Route (détermine le chemin que prendra la requête)


En-tête d’entité Content-Encoding (indique le code utilisé pour écrire et lire l’en-tête
d’entité)

Content-Lenght (taille du corps du message envoyé)

Content-Type (indique le type de media utilisé dans le corps du


message)
En-tête de réponse Allow, Server

Corps du message En requête, un corps est ajouté ou non selon la méthode utilisée
(information qui indique la progression de la requête)
En réponse, le corps du message est obligatoire (description de la
session)

Tableau 02 : Description des champs qui composent les messages SIP

15
1.3.2.8 Sécurité et Authentification
Les messages SIP peuvent contenir des données confidentielles, en effet le protocole SIP possède
trois mécanismes de cryptage :
- Cryptage de bout en bout du Corps du message SIP et de certains champs d’en-tête
sensibles aux attaques.
- Cryptage au saut par saut (hop by hop) afin d’empêcher des pirates de savoir qui appelle
qui.
- Cryptage au saut par saut du champ d’en-tête Via pour dissimuler la route qu’a
empruntée la requête.
De plus, afin d’empêcher tout intrus de modifier et retransmettre des requêtes ou réponses SIP, des
mécanismes d’intégrité et d’authentification des messages sont mis en place. Et pour des messages
SIP transmis de bout en bout, des clés publiques et signatures sont utilisées par SIP et stockées
dans les champs d’en-tête Authorization. Une autre attaque connue avec TCP ou UDP est le «
deny of service », lorsqu’un Proxy Server intrus renvoie une réponse de code 6xx au client
(signifiant un échec général, la requête ne peut être traitée). Le client peut ignorer cette réponse.
S’il ne l’ignore pas et émet une requête vers le serveur "régulier" auquel il était relié avant la
réponse du serveur "intrus", la requête aura de fortes chances d’atteindre le serveur intrus et non
son vrai destinataire.

1.3.2.9 Avantages et inconvénients


Avantages Inconvénients
Protocole rapide : la séparation entre champs Se basant sur l’adresse IP, les appels derrière
d’en-tête et le corps des messages facilite le du NAT sont très difficiles.
traitement des messages et le temps de
transition dans le réseau
Indépendant de la couche transport : il peut
s’utiliser en TCP ou en UDP
Flux de données et signalisation séparés :
souple aux éventuels changements durant la
communication

Tableau 03 : Avantages et inconvénients du protocole SIP

16
Le protocole SIP présente beaucoup plus d’avantages que d’inconvénients comme ce qui est décrit
au tableau 03.

1.3.3 Le protocole RTP


1.3.3.1 Définition
RTP est un protocole qui a été développé par l'IETF (Internet Engineering Task Force) afin de
faciliter le transport en temps réel de bout en bout des flots de données audio et vidéo sur les
réseaux IP, c'est à dire sur les réseaux de paquets. Le protocole RTP, standardisé en 1996, a pour
but d'organiser les paquets à l'entrée du réseau et de les contrôler à la sortie, ceci de façon à
reformer les flux avec ses caractéristiques de départ. RTP est un protocole qui se situe au niveau
de l'application du modèle OSI et qui utilise les protocoles sous-jacents de transport TCP ou UDP.
Mais l'utilisation de RTP se fait généralement au-dessus de UDP ce qui permet d'atteindre plus
facilement le temps réel. Les applications temps réels comme la parole numérique ou la
visioconférence constitue un véritable problème pour Internet. Qui dit application temps réel, dit
présence d'une certaine qualité de service (QoS) que RTP ne garantit pas du fait qu'il fonctionne
au niveau Applicatif. De plus RTP est un protocole qui se trouve dans un environnement
multipoint, donc on peut dire que RTP possède à sa charge, la gestion du temps réel, mais aussi
l'administration de la session multipoint.

1.3.3.2 Les fonctions de RTP


RTP laisse la responsabilité du contrôle aux équipements d'extrémité. RTP est un protocole adapté
aux applications présentant des propriétés temps réel. Il permet ainsi de :
- Reconstituer la base de temps des flux (horodatage des paquets : possibilité de
resynchronisation des flux par le récepteur).
- Mettre en place un séquencement des paquets par une numérotation et ce afin de
permettre ainsi la détection des paquets perdus. Ceci est un point primordial dans la
reconstitution des données. Mais il faut savoir quand même que la perte d'un paquet
n'est pas un gros problème si les paquets ne sont pas perdus en trop grand nombre.
Cependant il est très important de savoir quel est le paquet qui a été perdu afin de
pouvoir pallier à cette perte. Ceci se fait en le remplaçant par un autre qui se compose
d'une synthèse des paquets précédents et suivants.
- Identifier le contenu des données pour leurs associer un transport sécurisé.

17
- L'identification de la source c'est à dire l'identification de l'expéditeur du paquet. Dans
un multicast l'identité de la source doit être connue et déterminée.
- Transporter les applications audio et vidéo dans des trames (avec des dimensions qui
sont dépendantes des codecs qui effectuent la numérisation). Les trames sont incluses
dans des paquets afin d'être transportées et doivent de ce fait être récupérées facilement
au moment de la phase de dépaquétisation pour que l'application soit décodée
correctement.
En revanche, ce n'est pas "la solution" qui permettrait d'obtenir des transmissions en
temps réel sur IP. En effet, il ne procure pas de :
- Réservation de ressources sur le réseau (pas d'action sur le réseau);
- Fiabilité des échanges (pas de retransmission automatique, pas de régulation
automatique du débit);
- Garantie dans le délai de livraison (seules les couches de niveau inférieur le peuvent) et
dans la continuité du flux temps réel.

1.3.3.3 En-tête RTP


L'en-tête d'un paquet RTP est constitué de 16 octets. Cet en-tête précède le "payload" qui
représente les données utiles.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Figure 1.08: En-tête RTP

Le tableau 04 décrit les différents champs d’en-tête d’un paquet RTP.

1.3.4 Le protocole RTCP


1.3.4.1 Fonctionnement
Le protocole RTCP (Realtime Transport Control Protocol) est fondé sur la transmission
périodique de paquets de contrôle à tous les participants d'une session. C'est le protocole UDP (par
exemple) qui permet le multiplexage des paquets de données RTP et des paquets de contrôle
RTCP. Le protocole RTP utilise le protocole RTCP, qui transporte les informations
supplémentaires suivantes pour la gestion de la session :

18
Nombre Nom du
Numéro Description
de bits champ
1 2 V Indique la version du RTP (V=2 actuellement).
1 P P=1 : les données possèdent une partie de bourrage.
1 X X=1 : l'en-tête est suivi d'un en-tête supplémentaire.
4 CC Nombre de CSRC qui suit l’en-tête.
2 1 M M=1 : l’interprétation de la marque est définie par un profil
d’application.
7 PT Identifie le type de payload.
3-4 16 Numéro de Numéro d’ordre d’émission des paquets.
séquence Sa valeur initiale est aléatoire.
Il s’incrémente de 1 à chaque paquet envoyé.
Sert à détecter les paquets perdus.
5-8 32 Timestamp Horloge d’échantillonnage de l’émetteur.
Elle doit être monotone et linéaire pour assurer la
synchronisation des flux.
9-12 32 SSRC Identifie de manière unique la source de synchronisation.
Valeur aléatoire choisie par l’application.
13-16 32 CSRC Identifie les sources de contribution, la liste des participants
ayant leur contribution aux données du paquet.

Tableau 04 : Description des champs d’en-tête RTP

- Les récepteurs utilisent RTCP pour renvoyer vers les émetteurs un rapport sur la QoS.
Ces rapports comprennent le nombre de paquets perdus, le paramètre indiquant la
variance d'une distribution (plus communément appelé la gigue : c'est à dire les
paquets qui arrivent régulièrement ou irrégulièrement) et le délai aller-retour. Ces
informations permettent à la source de s'adapter, par exemple, de modifier le niveau de
compression pour maintenir une QoS.
- Une synchronisation supplémentaire entre les médias. Les applications multimédias sont
souvent transportées par des flots distincts. Par exemple, la voix, l'image ou même des

19
applications numérisées sur plusieurs niveaux hiérarchiques peuvent voir les flots gérés
suivre des chemins différents.
- L'identification : en effet, les paquets RTCP contiennent des informations d'adresses,
comme l'adresse d'un message électronique, un numéro de téléphone ou le nom d'un
participant à une conférence téléphonique.
- Le contrôle de la session : RTCP permet aux participants d'indiquer leur départ d'une
conférence téléphonique (paquet Bye de RTCP) ou simplement de fournir une indication sur
leur comportement.
Le protocole RTCP demande aux participants de la session d'envoyer périodiquement les
informations citées ci-dessus. La périodicité est calculée en fonction du nombre de participants de
l'application. On peut dire que les paquets RTP ne transportent que les données des utilisateurs
tandis que les paquets RTCP ne transportent, en temps réel, que de la supervision. Ces différents
paquets de supervision fournissent aux noeuds du réseau les instructions nécessaires à un meilleur
contrôle des applications temps réel.
On peut détailler les paquets de supervision en cinq types suivant le tableau 05.

Type Nom Signification


200 SR (Sender Report) Regroupe des statistiques concernant la transmission
(pourcentage de perte, nombre cumulé de paquets
perdus, variation de délai (gigue), ...).
Ces rapports sont issus d'émetteurs actifs d'une
session.
201 RR (Receiver Report) Ensemble de statistiques portant sur la
communication entre les participants.
Ces rapports sont issus des récepteurs d'une session.
202 SDES (Source Description) Carte de visite de la source (nom, e-mail,
localisation).
203 BYE Message de fin de participation à une session.
204 APP Fonctions spécifiques à une application.

Tableau 05 : Les types de paquets de supervision RTCP

20
1.3.4.2 En-tête RTCP
La figure 1.09 montre l'en-tête commun à tous les paquets RTCP.

1 2 3 4 5 6 7 8

Figure 1.09 : En-tête RTCP

Le tableau 06 décrit les différents champs d’en-tête d’un paquet RTCP.

Numéro Nombre Nom du Description


de bits champ
1 2 V Version de RTCP (la même que dans les paquets RTP).
1 P P=1 : les données possèdent une partie de bourrage.
5 RC Nombre de blocs de rapport de réception contenus dans ce
paquet.
RC=0 est valide.
2 8 PT PT=200 : identifie le datagramme RTCP comme SR.
3-4 16 Length Longueur du paquet RTCP incluant l'en-tête et le bourrage.
5-8 32 SSRC Identification de la source pour le créateur du paquet SR.

Tableau 06 : Description des champs d’en-tête RTP

1.3.5 Le protocole IAX


IAX (Inter Asterisk eXchanged) est un protocole de voix sur IP issu du projet de PBX open source
Asterisk développé par la société Digium. Le nom IAX est souvent utilisé pour parler de la version
2 du protocole puisque la première version n'est pratiquement plus utilisée. Il permet la
communication entre client et serveur IP ainsi qu'entre serveurs. Il est plus puissant que SIP car il
a été conçu pour le contrôle et la transmission de flux multimédia avec un débit plus faible
(notamment pour la voix) et l'intégration dans les réseaux derrière du NAT, En effet IAX n'utilise
qu'un seul port UDP: le 4569 pour la signalisation et les données.
Ses faiblesses sont sa jeunesse et sa non standardisation, bien qu'il soit de plus en plus utilisé.

21
CHAPITRE 2 : NOTIONS DE BASE SUR LE SVI

Ce chapitre décrit des notions de base concernant le SVI, son utilisation, les étapes à suivre pour
sa conception, et le langage utilisé.

2.1 Généralités [9] [10]


2.1.1 Définition
Le SVI (Serveur Vocal Interactif) est une technologie permettant d’interagir au téléphone avec
une base de données afin d’obtenir des informations ou de générer des actions en pressant des
touches sur son téléphone.
C’est un outil vocal utilisé surtout dans les centres d'appels, permettant d'identifier les appelants,
de les aiguiller vers des services automatiques (de type consultation des comptes bancaires,
horaires de train...) ou des agents compétents. Il permet de désengorger le centre notamment au
niveau des demandes des appelants. En composant un numéro de téléphone, l'utilisateur est mis en
relation avec un système d'information dont la particularité est la diffusion d'informations sonores.
Le SVI fonctionne souvent avec des messages préenregistrés, mais peut aussi utiliser un
synthétiseur vocal pour générer son discours. En utilisant son clavier téléphonique, l'usager choisit
parmi les options proposées et obtient les informations qu'il désire. De plus, grâce aux progrès de
la technologie, les services vocaux sont bien plus que de simples répondeurs. Parmi eux :
- La synthèse vocale : diffusion automatique de fichiers textes dynamiques sans
enregistrement préalable.
- La reconnaissance Vocale : reconnaissance automatique et sans apprentissage de groupe
de mots pour accès direct à une information, service ou personne.
- Le CTI (Couplage Téléphonie Informatique) : intégration de l'informatique dans le
réseau téléphonique pour l'amélioration de la gestion de la relation client (CRM).
Le SVI trie les appels en fonction de leur degré d'importance et permet à l'appelant d'obtenir
rapidement l'information souhaitée, sans forcément passer par un téléopérateur. Par delà son rôle
de filtre et d'identification, ses missions sont en fait multiples et ses avantages nombreux, tant pour
l'appelant que pour l'agent. Mais, c'est doublé du CTI que le SVI atteint la plénitude de ses
fonctionnalités puisque, multipliant les canaux de communication, le SVI offre à l'appelant des
possibilités accrues pour obtenir non seulement la réponse qu'il cherche, mais aussi contacter
directement un téléopérateur par téléphone ou via le site Web, en utilisant les boutons Call

22
Through (dialogue demandé via IP) ou Call Back (rappel demandé sur portable ou ligne RTC).
Grâce à la préqualification de l'appel effectuée par le SVI, le téléopérateur devient ainsi un
téléconseiller spécialisé dans la finance, l'assurance, ou divers autres domaines, afin de pouvoir
donner en temps réel un maximum d'informations à l'appelant. Autre atout : en déclenchant une
remontée de fiche sur l'écran du téléconseiller, le SVI identifie l'appelant, avec pour conséquence
un gain de temps non négligeable. Si le téléconseiller n'est pas disponible, le SVI est capable de
rappeler tel ou tel client une fois le poste libéré. En l'absence de CTI, le SVI peut aussi transférer
le numéro de téléphone de l'appelant ou son compte client sur le cadran téléphonique du
téléconseiller, qui n'aura plus qu'à saisir les chiffres sur le clavier de son PC pour faire remonter la
fiche.
Le SVI n'est plus seulement un outil de gestion pertinent du temps d'attente. Il est devenu un
service à part entière et sait répondre, au moyen de techniques de numérotation appropriées, à un
grand nombre de demandes répétitives (consultation d'un compte bancaire, promotions en vigueur,
annuaire en ligne, envoi de documentation, etc.). Le SVI est donc censé libérer le téléopérateur
d'actions téléphoniques basiques, tout en offrant à l'entreprise une économie substantielle sur les
coûts de fonctionnement du système téléphonique.

2.1.2 Avantages
Le SVI contribue ainsi à éliminer les ennemis permanents de tout centre d'appels : côté appelant,
le temps d'attente, et un aiguillage peu clair ou trop long, via les touches de téléphone, vers le
service recherché ; côté téléconseiller, la surcharge d'appels, préjudiciable à la qualité d'écoute et
des réponses fournies. En frontal de la réception d'appels, le SVI contribue à : accueillir et
informer (24h/24 et 7j/7), répondre à 100 % aux appels (même en cas de saturation du centre
d'appels), gérer une file d'attente et un calendrier , prendre des messages , fournir des informations
générales ou personnalisées à partir d'un numéro de compte ou d'un numéro de dossier , transférer
l'appel vers le téléconseiller compétent, indiquer à l'appelant la durée d'attente, éventuellement,
rappeler ce dernier, envoyer une documentation appropriée en fonction de la nature de l'appel,
enrichir la base de données de l'entreprise, fournir des statistiques (nombre et types d'appels
entrants et sortants), temps d'attente, etc. Le SVI reflète l'organisation interne de l'entreprise :
accueillant et suffisamment directif, il donne satisfaction au client dans un délai raisonnable.
L'aspect technologique doit donc être complété par une qualité d'écoute et une efficacité
optimales.

23
Dimensionné aux plates-formes multicentres, le SVI intègre désormais le rythme de travail de
chaque téléconseiller (contacts utiles, pauses, absences, etc). L'intérêt majeur du SVI est donc de
préqualifier l'appel le plus tôt possible, pour en diminuer le coût et améliorer la qualité de service.
Avec Internet couplé au téléphone, il devient un acteur privilégié du centre d'appels multimédia.

2.2 Architecture
La figure 2.01 représente l’architecture d’interconnexion d’un serveur SVI avec ses équipements
matériels dans une entreprise.

Figure 2.01 : Serveur SVI intégré dans un CTI de Centre d’appel

Sur la figure, le serveur SVI est connecté directement avec l’opérateur téléphonique à partir d’un
PABX. Pour les appels entrants, la communication est routée vers la plateforme des téléopérateurs
concernés. Pour les appels sortants, elle emprunte le même chemin suivant le type et la
configuration du serveur SVI. Tout ceci se passe sous la supervision d’un serveur d’administration
afin d’identifier rapidement les éventuels problèmes qui peuvent survenir.

24
2.3 Arborescence vocale [9] [10]
2.3.1 Définition
Tous le services vocaux reposent sur la notion d’arborescence vocale. Il s’agit de menus vocaux
qui sont proposés à l’appelant. Les choix faits sont transmis au SVI grâce aux touches de son
téléphone. La figure 2.02 indique la position de l’arborescence vocale dans un serveur SVI.

Figure 2.02 : Emplacement de l’arborescence vocale

L’abonné entre en communication avec le serveur SVI. En fonction des touches de clavier de son
téléphone, il navigue dans l’arborescence vocale qui, soit accède à une boîte vocale, soit retire des
informations dans un serveur de base de données, ou bien envoie l’appel vers des téléopérateurs. Il
est à noter que la modification d’une base de données par l’appelant entraîne une insécurité
certaine de la base sauf dans le cas où l’authentification des appels est très stricte.

2.3.2 Avantages
Un guide vocal bien conçu permet aux entreprises d'optimiser leur accueil téléphonique grâce à la
qualification des appels et à leur orientation directe vers l'interlocuteur le plus à même de répondre
à la demande.
Les principaux atouts du guide vocal sont les suivants :
- Des clients aiguillés directement vers le bon interlocuteur,
- L'efficacité de l’accueil téléphonique améliore l'image et la compétitivité de l’entreprise,

25
- Un accueil téléphonique rationalisé et évolutif,
- Qualification des appels des clients et les faire traiter directement par le téléopérateur
concerné par la demande,
- Communication sur un même numéro pour donner accès à plusieurs services
(réservations, renseignements, offres spéciales...),
- Possibilité de modification de l'arborescence et les messages du guide vocal selon les
évolutions de l’entreprise,
- Une arborescence personnalisée selon l'organisation de l’entreprise,
- En choisissant le menu vocal, on peut constituer l'arborescence des menus et aiguiller le
client vers le téléopérateur ou site qui répondra directement à sa demande,
- En optant pour la saisie d'un code, les clients, par exemple, sont mis en relation avec
leur conseiller habituel, sans passer par un centre d'appels de premier niveau,
- Une meilleure optimisation est de mélanger dans une même arborescence le choix dans
un menu et la saisie de code, et associer ainsi les avantages de ces deux modes de
qualification,
- Des coûts d'accueil clients optimisés,
- Le guide vocal est un service clés en main, sans investissement matériel de la part de
l’entreprise,
- Son utilisation pour qualifier les appels en amont du site de réception diminue les coûts :
traités directement par l'interlocuteur compétent, les appels ne nécessitent pas de
transfert vers un autre poste.

2.3.3 Exemple d’arborescence vocale


La figure 2.03 illustre un exemple d’arborescence d’une boîte vocale. Il y a plusieurs chemins que
peut prendre l’appel en fonction du guide vocal et le choix de l’utilisateur. En considérant la ligne
verte, voici le chemin pris par l’appel.
L’appel entre dans le menu principal de la boîte vocale. En appuyant sur 1, l’utilisateur choisit de
passer au menu des messages dans la boîte d’arrivée. Dans ce nouveau menu, il a le choix
d’écouter (touche 4), de réacheminer (touche 6), de supprimer (touche 7), d’envoyer une réponse
(touche 8), de composer le numéro de l’appelant (touche 88), de sauvegarder (touche 9), ou de
passer au message suivant (touche #). En tapant sur la touche 4, il écoute d’abord le message.
Ensuite, la touche 8 lui dirige vers le menu d’envoi de réponse. Il enregistre sa réponse en

26
appuyant sur 1, la change en appuyant sur 2, la modifie en appuyant sur 3, ou la réachemine
comme urgence en faisant le 9.

Figure 2.03 : Exemple d’un menu de messagerie vocale

2.4 Conception d’un script SVI [10]


Le guide vocal est réalisé à partir d’un script écrit à partir d’un langage de programmation propre
à chaque serveur SVI. Par contre, les démarches et le principe restent toujours les mêmes.

2.4.1 Importation des messages vocaux


La première démarche consiste à importer les messages vocaux utilisés dans le script. Pour être
exploitable, ces messages vocaux doivent avoir l'extension ".wav" ou ".gsm", leur format doit être
le "CCITT 8 KHz, 8 BITS, Mono-Alaw". La conversion d’un fichier wav en fichier gsm sous
Linux est présentée sur la figure 2.04.

Figure 2.04 : Conversion d’un fichier wav en fichier gsm sous Linux

27
L’utilitaire SOX est le plus facile à utiliser puisque la taille du package est petite (260Ko) et que
son utilisation est simple.

2.4.2 Présentation des différentes actions


La diffusion de message est une action à laquelle sont associées plusieurs sous-fonctionnalités :
- Un Bip peut-être diffusé à la fin du message,
- Un message peut-être anticipé ou non : la diffusion est interrompue par une action de
l’interlocuteur.
La diffusion de message peut aboutir sur un menu DTMF (Dual Tone Multi Frequency) aiguillant
l’appel. Dans ce cas, le message peut être la présentation du menu offert à l’appelant. Ce menu
offre la possibilité de saisir 1, 2 ou # avec une sous-branche correspondant à chaque possibilité.
Lorsque le script vocal attend une interaction de l’appelant, il est souhaitable de traiter les cas où il ne
réagirait pas comme prévu : ici le cas de saisie d’une touche que celle attendue (1 ou 2 ou #) ou le cas de
non saisie de touche.
Le message peut aussi aboutir sur une saisie de touches à taper par l’appelant. Dans ce cas, le
message peut être l’invite de saisie des touches. Le script attend la saisie de trois touches terminée
par #. Cette variable de trois chiffres peut-être stockée puis exploitée dans le reste de
l’arborescence (par exemple pour identifier l’appelant).

2.4.3 La liste de diffusion


Cette fonction permet de diffuser un menu déroulant à l'appelant. A tout moment, l'appelant peut
interrompre ce menu pour effectuer une sélection vers un choix qui a retenu son attention. De
même, on peut retourner vers un point choisi du scénario par une autre saisie paramétrable. La
liste de diffusion est en fait un menu depuis lequel on peut accéder en tout point du scénario vocal.
La liste de diffusion vocale déroule une série de messages et effectue à la saisie d’un DTMF une
commutation vers une étiquette du script associé au message en cours de diffusion.

2.4.4 La messagerie
La messagerie offre la possibilité d’accès à une boîte vocale. La durée du message qui peut être
laissé dans la boîte est limitée par une valeur par défaut toutefois paramétrable suivant la capacité
du serveur. Le message est ensuite relu. Par conséquent il est préférable de laisser à l’appelant la
possibilité de rectifier le contenu de son message.

28
2.4.5 La sélection selon la plage horaire
La sélection suivant la plage horaire permet d’effectuer un aiguillage selon l’heure à laquelle se présente
l’appel. Cette fonctionnalité peut-être utilisée pour traiter des appels pendant les heures de fermeture, pour
rerouter des appels lors des périodes de désactivation de la campagne… La sélection peut se faire :
- pendant une plage de temps définie,
- à partir d’un certain moment,
- avant un temps défini.

2.4.6 Le branchement et les boucles


2.4.6.1 Le branchement
Le branchement permet d’effectuer un saut vers une étiquette prédéfinie. Il permet de traiter le cas
où l’appelant ne réagit pas comme le système s’y attend (par exemple pour forcer la saisie d’une
touche sur un menu DTMF). Le branchement permet aussi de ré-aiguiller l’appel dans
l’arborescence vocale. Le branchement par défaut est une possibilité offerte à l’issue d’un menu
DTMF. Il a pour effet de renvoyer vers la même étiquette en cas de saisie de la touche dans tout le
script vocal.
Par exemple : si on veut qu’en tout point de l’arborescence, la touche « # » renvoie au début, il
suffit d’effectuer un branchement par défaut sur « START ».

1.4.6.2 Les boucles


Les boucles permettent d’offrir à l’appelant un nombre limité de tentatives. Elles peuvent être
utilisées pour plusieurs cas:
- vérifier que l’appelant possède un combiné équipé de la DTMF pour lui permettre
d’évoluer dans le script vocal ou d’être directement routé vers un téléacteur,
- de lui permettre un nombre limité de tentatives de saisie d’un code ….

2.4.7 L'accès aux bases de données


L’accès à une base de données permet de faire intervenir au sein du scénario vocal, une valeur
contenue dans une table. Les exemples d’utilisation sont multiples :
- identification d’un client en fonction d’un code,
- diffusion d’une valeur contenue dans une base, par exemple un solde de code bancaire,
- priorité d’un client et différenciation prospect / client.

29
On peut aussi mettre à jour la base de données à partir de l’appel d’un client comme par exemple
la modification de son code d’accès.
Les logiciels de bases de données varient suivant le type de serveur SVI utilisé. Par contre, la
plupart de ces serveurs intègrent directement des serveurs de bases de données comme MySQL ou
PostGRES.

2.4.8 La fin de scénario


Plusieurs stratégies sont possibles en fin de script vocal :
- le raccroché,
- l’envoi vers les téléopérateurs concernés par le service demandé,
- l’envoi de l’appel vers la boîte vocale,
- le rappel automatique par exemple pour cause de non ouverture du centre ou
d’indisponibilité matérielle ou humaine …

2.5 VoiceXML [11] [12]


2.5.1 Généralité
Depuis leur avènement, les SVI ont été bâtis à partir de technologies propriétaires. Actuellement,
l'émergence du standard VoiceXML (VXML) démocratise leur déploiement.
Comme son nom l'indique, VoiceXML est fondé sur XML. C’est un standard défini par le
VoiceXML Forum, un consortium créé par AT&T, Lucent, Motorola et IBM. Il a depuis été
reconnu par le W3C (World Wide Web Consortium). Il est issu de l'unification des technologies
Phone Markup Language de Lucent et AT&T, VoxML de Motorola et SpeechML d'IBM.
VoiceXML est un dialecte XML qui est destiné à la programmation des applications
informatiques dites "Applications vocales". Une application vocale est un programme
informatique de téléphonie qui permet à une personne de discuter au téléphone avec un serveur
d'informations. Le service de consultation par téléphone des horaires de train est un exemple
d'application vocale : "Je compose un numéro, je demande un horaire, une machine m'annonce
l'horaire souhaité".
VXML est un langage de programmation pérenne et portable, normalisé par W3C. Il sert à
développer des services de communications interactifs, convergents avec Internet. Il permet
d'élaborer un scénario d'accueil de l'appelant en intégrant de multiples possibilités : jeu d'un
message préenregistré, reconnaissance des touches tapées sur le clavier téléphonique pour

30
conditionner une interaction, enregistrement d'un message et transmission par email, emploi de la
reconnaissance et de la synthèse vocales, gestion de plusieurs canaux (email, SMS, fax et Web),
traitement des appels entrants ou sortants, transfert d'appel, etc.
Une application vocale permet :
- la communication de l'utilisateur vers le système soit par reconnaissance vocale soit par
des codes DTMF (« touches musicales ») à l'aide des touches du clavier téléphonique ;
- la communication du système vers l'utilisateur soit par des annonces enregistrées, par
exemple en studio, soit par synthèse vocale.
VoiceXML est conçu pour être compris par un système particulier, appelé Navigateur vocal
(Voice browser), qui va interpréter les commandes de l'utilisateur (vocales ou sonores) et leur
répondre par les moyens indiqués.

2.5.2 Similitude entre HTML et VoiceXML


Il y a analogie entre les langages HTML et VoiceXML. Le premier est le langage de création des
pages Web et le second le langage d’écriture des scénarios vocaux. Ainsi le Navigateur vocal,
homologue du navigateur Web utilisé par l’internaute est intégré dans la plateforme vocale (SVI).
La navigation sur un site Web s’effectue grâce au clavier et à la souris. Dans un service vocal, elle
se fait grâce aux touches du téléphone (DTMF) ou bien par la parole : reconnaissance vocale.
Cette similitude entre les deux langages rend possible l’utilisation des mêmes infrastructures que
les serveurs Web, pour accéder aux systèmes d’informations.

2.5.3 Fonctionnement
Une page VXML est généralement distribuée en HTTP par un serveur Web. Cette page peut être
dynamique comme pour une page Web, Elle peut être générée « à la volée » par un serveur
d’application ou plus simplement grâce au langage PHP. Les balises constituant la page sont
interprétées par le serveur VXML : il s’agit de la phase dite de « parsing ». Le serveur VXML
envoie au client sur son téléphone des messages sonores, issus de fichiers son. En retour le client
par interaction sur les touches de son téléphone ou par sa voix expédie une réponse au serveur
VXML. Cette réponse va permettre au serveur de demander une nouvelle page VXML au serveur
Web. Il en est de même que pour une page Web qui en appelle une autre par un clic sur une URL.

31
2.5.4 Avantages
Le VoiceXML permet de réduire les charges de développement des applications vocales. A ce
jour, un très grand nombre d'acteurs de cette industrie s’accorde sur le fait que le développement
de scénarios vocaux est jusqu'à dix fois plus rapide en VoiceXML qu’avec un langage d’ancienne
génération. Ce facteur est d’autant plus grand que le projet est important. Dans le cadre de
renouvellement de plateforme, plusieurs références récentes dans le monde bancaire et
d’assurance ont permis à des intégrateurs de déployer des services vocaux sur les mêmes
webservices que ceux déployés pour le Web. Le service vocal qui aurait nécessité 5 à 6 mois de
développement spécifique et de mise au point a été réalisé en 10 jours en VoiceXML.
Cette rapidité de développement s’explique d’une part par l’utilisation de standard et non d’un
langage propriétaire nécessitant des spécialistes. D’autre part la « webisation » des applications
métiers (accès en mode simple client Web) permet l’utilisation des mêmes infrastructures que
celles développées par les serveurs Web, pour accéder aux systèmes d’informations (sécurité,
passerelle, SGBD, serveur d’applications). Tous ces services sont réutilisés pour accéder aux
données centrales en temps réel.
L'intégration d'un programme VoiceXML ne nécessite aucune recompilation du noyau car le
VoiceXML est un langage interprété en temps réel. Parce qu'il est basé sur les technologies Web,
le VoiceXML est adopté par les développeurs du Web et la création de portails vocaux s’effectue
sans compétences particulières dans le domaine vocal.
Le VXML intègre également les moteurs de reconnaissance vocale ASR (Automatic Speech
Recognition) et de synthèse vocale TTS (Text To Speech) grâce au protocole MRCP (Media
Ressource Control Protocol). Pour les utiliser, le développeur n'a qu'à écrire, dans le code VXML,
le texte à lire en voix de synthèse ou à reconnaître. Il est inutile de recompiler en cas de
modification. Des extensions de VXML étoffent ce fonctionnement et renforcent la portabilité. La
spécification SRGS (Speech Recognition Grammar Specification) guide le moteur d'ASR sur les
choix de mots possibles de l'utilisateur. Quant à SSML (Speech Synthesis Markup Language), il
définit la prononciation de la synthèse vocale TTS.
VXML n'est toutefois pas totalement abouti. Des mécanismes propriétaires restent nécessaires
pour certaines actions. C'est le cas pour déclencher des appels sortants. Quant aux appels entrants,
le nouveau standard CCXML (Call Control XML) est insuffisant pour gérer, via un ACD
(Automatic Call Distribution), les ressources d'un centre de contacts. CCXML ne permet pas de

32
récupérer des informations de contexte, par exemple, le numéro de compte client à partir du
numéro de téléphone.

2.5.5 Exemples
La figure 2.05 montre un exemple simple de code VoiceXML. Ici, la directive de dialogue de
l’application fait la lecture de "Hello World":

<? xml version="1.0"?>


<vxml version="2.0" xmlns="http://www.w3.org/2001/vxml">
<form>
<block> Hello World! </block>
</form>
</vxml>

Figure 2.05: Exemple de code VXML

La balise <vxml> est un conteneur de dialogue. Il existe deux types de dialogues: les formulaires
et les menus. Les formulaires présentent les informations et recueillent les informations entrées;
les menus offrent les choix à faire après. Cet exemple n’a qu’un seul formulaire, qui lit la phrase
"Hello World!" à l’utilisateur. Si aucun autre formulaire ne succède au dialogue, la conversation
se termine.
On rencontre des menus dans quasi toutes les applications VoiceXML. Le menu proposé à la
figure 2.06 permet de diriger l'utilisateur vers l'un des trois sujets proposés : sport, météo et
astrologie.

<?xml version="1.0"?>
<vxml version="1.0">
<menu>
<prompt> Bienvenue. Veuillez lire l’un de ces trois choix:

33
<enumerate/>
</prompt>
<choice next="http://www.sport.example/vxml/start.vxml"> Sport </choice>
<choice next="http://www.météo.example/intro.vxml"> Météo </choice>
<choice next="http://www.astrologie.example/voice/astro.vxml"> Astrologie </choice>
<noinput> Veuillez lire l’un de ces trois choix: </noinput>
<enumerate/>
</menu>
</vxml>

Figure 2.06 : Exemple d’application de menus VXML en mode Web

Voici un exemple du dialogue qui se présenterait avec une telle application :


Navigateur: Bienvenue. Veuillez lire l’un de ces trois choix: sport; météo; astrologie.
Humain : Astrologie
Navigateur: Je ne comprends pas ce que vous dites. (message par défaut de la plate-forme)
Navigateur: Bienvenue. Veuillez lire l’un de ces trois choix: sport; météo; astrologie.
Humain : sport
Navigateur: exécute le document http://www.sports.example/vxml/start.vxml

En utilisant les touches DTMF, un exemple de code est à la figure 2.07 pour naviguer dans un
menu identique à la précédente:

<menu>
<property name="inputmodes" value="dtmf"/>
<prompt>
Pour choisir le sport appuyer sur 1,
Pour choisir la météo appuyer sur 2,
Pour choisir l’horoscope appuyer sur 3.
</prompt>

34
<choice dtmf="1" next="http://www.sport.example/vxml/start.vxml"/>
<choice dtmf="2" next="http://www.meteo.example/intro.vxml"/>
<choice dtmf="3" next="http://www.astrologie.example/voice/astro.vxml"/>
</menu>

Figure 2.07 : Exemple d’application de menus VXML en mode téléphonie

35
CHAPITRE 3 : IMPLEMENTATION DU SVI SOUS LE SERVEUR PBX ASTERISK

Le présent travail consiste en la conception puis à la réalisation d’un SVI de téléchargement de


sonneries polyphoniques à l’aide du serveur PBX (Private Branch eXchange) Asterisk. Ce
chapitre présente donc la méthodologie utilisée ainsi que la configuration du serveur Asterisk.

3.1 Présentation du travail


La figure 3.01 représente le schéma de principe.

Figure 3.01 : Schéma de principe

Le SVI est intégré dans le serveur PBX. L’utilisateur effectue donc un appel sur ce serveur afin
d’obtenir une sonnerie polyphonique soit à envoyer directement sur son poste téléphonique, soit
l’envoyer vers celui de l’utilisateur 2 ou autre qui est évidemment polyphonique. Les sonneries
monophoniques n’ont pas été prises en compte ici puisqu’elles sont difficilement “trouvables“ sur
Internet et qu’il faut les composer pour les sonneries locales. Notons aussi que comme les
sonneries dans le serveur sont toutes polyphoniques, la liaison entre le serveur et les utilisateurs ne
peut se faire qu’avec une liaison GSM (Global System for Mobile communications).

36
3.2 Conception du SVI
La figure 3.02 représente l’organigramme complet du SVI. C’est l’arborescence vocale de la
simulation.

Figure 3.02 : Arborescence vocale de la simulation

37
Le SVI conçu ici ne fonctionne uniquement que pour les utilisateurs qui sont enregistrés dans la
base de données utilisée par le serveur PBX, ce qui fait que la première étape consiste à vérifier le
crédit de l’utilisateur. Si ce crédit est inférieur à 400Ar, la communication est interrompue. Dans
le cas contraire, le serveur demande à l’appelant de saisir un code d’accès. Ce code peut être pour
des clients privilégiés ou vendu sous forme de carte téléphonique pour les simples abonnés. Les
codes ont une durée de validité suivant le type d’utilisateur. Pour les clients privilégiés, un code
leur est offert gratuitement et indéfiniment du fait de leur fidélité alors que pour les simples
abonnés, la carte coûte 1000Ar pour 50 appels effectués sur le serveur. Ceci est dans le but de les
inciter à utiliser le SVI.
Si le code d’accès n’est pas valide, l’utilisateur peut procéder à d’autres tentatives mais celles-ci
peuvent aussi être éventuellement limitées. Dans le cas où le code est valide, l’utilisateur dispose
alors des différents choix proposés par le SVI.
Remarque : Si l’appelant appuie sur d’autres touches que celles qui sont indiquées dans le menu
offert, le système attend indéfiniment. Donc, la communication ne se termine que s’il raccroche
son téléphone.

3.2.1 Choix du genre de la sonnerie


L’utilisateur est sollicité à choisir le genre de sonnerie en appuyant sur la touche 1 pour les
sonneries en local, touche 2 pour les sonneries françaises et touche 3 pour d’autres sonneries. Le
système renvoie la communication vers le menu suivant en fonction du choix effectué.

3.2.2 Choix de la sonnerie


Pour choisir la sonnerie, l’appelant a la possibilité de choisir sur 4 touches suivant le tableau 07.

Touches à appuyer Signification


1 Ecoute de la sonnerie suivante
2 Ecoute de la sonnerie précédente
3 Validation
# Retour au choix du genre de sonnerie

Tableau 07 : Choix de la sonnerie

38
3.2.3 Choix d’envoi de la sonnerie
L’utilisateur a la possibilité d’envoyer la sonnerie sélectionnée vers son numéro de téléphone en
appuyant sur 1 ou l’envoyer vers un autre numéro en appuyant sur 2. Dans le premier cas,
l’appelant entend une confirmation d’envoi et la communication se termine. Dans le second cas, il
est amené à saisir le numéro du destinataire. Le SVI le lui confirme. En appuyant sur 1,
l’utilisateur valide ce numéro, entend la confirmation d’envoi et la communication se termine. En
appuyant sur la touche 2, il va ressaisir le numéro et revient au second cas.
Après la dernière validation, la communication prend fin. Un processus d’envoi de la sonnerie est
engagé. Ce processus n’est pas décrit ici puisque c’est une toute autre étude.

3.3 Réalisation du SVI [13] [14] [15] [16] [17] [18]


Le SVI fait partie d’un module de fonctionnalité de tout serveur téléphonique. Il ne peut donc pas
être réalisé sans la conception au préalable du serveur. L’idée c’est donc de trouver un logiciel
libre qui puisse être exploitée. Cela n’existe pas sur Internet puisque ces logiciels sont tous
payants. Toutefois, il existe un serveur PBX libre tournant sous Linux appelé Asterisk (cf. Annexe
4) qui offre toutes les possibilités d’un serveur téléphonique. Son seul inconvénient c’est qu’il faut
télécharger les packages un par un (500Mo en tout) de telle manière que, pour chaque package, les
dépendances varient en fonction de la configuration du PC serveur pour l’installation ce qui prend
un temps relativement long.

3.3.1 Présentation d’Asterisk


3.3.1.1 Description générale
L'une des solutions qui marquent le développement de la voix sur IP au sein des entreprises est la
solution PBX. Il s'agit brièvement de l'équivalent des PABX traditionnels mais utilisés dans un
réseau IP. Il permet de gérer les communications (gestionnaire d'appels) circulant dans
l’entreprise.
Asterisk est une application Linux basée sur la téléphonie IP. C’est un PBX qui offre les mêmes
fonctionnalités que les PABX traditionnels: SVI, transfert d'appel, numérotation interne,
messagerie vocale, identification du numéro, rejet d'appel, blocage des appels des utilisateurs,
rapport des appels, mise en attente, renvoi d'appels (sans réponse - occupés), notification d'e-
mails…. Il est possible de monter son réseau de téléphonie sur IP avec un serveur Asterisk. Ce
réseau peut également être connecté à un réseau téléphonique de type ISDN (Integrated Service

39
Digital Network) ou RTC. Il est aussi possible de mettre en place un réseau de téléphonie sur
Internet simple, basé autour d'un Asterisk. La connexion Internet doit être une connexion haut
débit afin d'assurer une qualité optimale des conversations téléphoniques.

3.3.1.2 Caractéristiques
Asterisk fonctionne sur tout système Linux avec noyau supérieur à 2.4. Il intègre le CTI qui lui
permet de faire des appels prédictifs, d’interfacer avec d’autres serveurs d’applications comme
PHP-MySQL ou PostGRESQL, PERL… et des serveurs d’applications media comme les logiciels
de vidéoconférence. Asterisk utilise PHPMyAdmin pour la connexion aux bases de données. Des
tables sont déjà conçues pour le journal des appels effectués.
Sur le plan matériel, la société Digium Company a conçu des cartes voies analogiques et
numériques pour l’interfaçage d’Asterisk avec la ligne PSTN ou ISDN. Asterisk fonctionne aussi
avec des matériels d’autres fabrications comme les équipements CISCO SCCP 7960 et 7940.
Asterisk implémente les protocoles IP comme le SIP, le H.323, le MGCP, et le IAX v2.
Asterisk utilise différents codecs audio employés pour la communication téléphonique tels le
G.711, le G.726, le G.729.

3.3.1.3 Configuration matérielle


La configuration matérielle du serveur Asterisk dépend de l’architecture du système ainsi que de
la bande passante de la ligne utilisée. Elle varie suivant le type de protocoles et le nombre
d’appels entrants et sortants traités. Par exemple, un serveur avec comme configuration 2.6 Ghz
Pentium 4, RAM 1GB connecté sur trois lignes T1 peut gérer 40 appels simultanés suivant le
protocole SIP sur un seul canal pour un total de plus de 5000 appels par jour.

3.3.1.4 Configuration de la connexion réseau


Chaque conversation téléphonique consomme entre 45 à 150Kbps en bande passante
dépendamment de la qualité du son. A 50Kbps, la qualité d’appel est comparable à celle du GSM.
Pour une communication en GSM, le nombre d’appels estimé par Mbit est de 68.

3.3.2 Installation
La version CD Live d’Asterisk TRIXBOX est sorti il y peu de temps. Tous les packages
téléchargés individuellement y sont regroupés. TRIXBOX inclut Centos, une distribution Linux

40
dérivée de Red Hat, comme système d’exploitation. Le seul problème avec TRIXBOX c’est qu’il
va formater tout le volume physique du disque dur du serveur avant de faire l’installation, donc il
est impossible de partitionner le disque.
Une fois l’installation terminée, on doit obtenir la fenêtre illustrée sur la figure 3.02 :

Figure 3.03 : Page d’accueil de Trixbox en mode terminal

Le deuxième problème avec TRIXBOX c’est que pour accéder à son interface graphique, il faut
une autre machine. Il suffit alors de lancer Internet Explorer ou tout autre navigateur Web, et de
taper l’adresse IP du serveur Asterisk (http://192.168.1.213). Après avoir entré l’identifiant et le
mot de passe, on obtient l’écran de configuration comme ce qui est montré à la figure 3.03.

3.3.3 Description de Trixbox


D’après la figure 3.04, il y a plusieurs menus offerts pour la configuration du serveur :
- Packages : cette section affiche les packages installés. Elle n’affiche rien si un compte
n’est pas créé sur le site d’Asterisk (il faut être connecté). Elle permet aussi d’installer
les packages non installés ou d’installer de nouvelles versions.
- Asterisk : contient tous les modules relatifs à la configuration d’Asterisk.
- System : affiche la configuration système du serveur.

41
Figure 3.04 : Interface graphique de configuration de Trixbox

Dans le menu Asterisk se trouve la configuration des appels comme le montre la figure 3.05.

Figure 3.05 : Page d’administration de Trixbox


Quatre menus sont proposés sur la page d’administration :
- Setup : cette partie permet de configurer les administrateurs du serveur (Administrators),
d’ajouter des utilisateurs suivant le type de protocole à utiliser (Extensions), de faire une
configuration des appels généraux comme les messageries vocaux (General Settings),
ainsi que le routage des appels si on utilise une carte voix.
- Tools : affiche les modules à mettre à jour ou à installer.
- Reports : affiche le journal des appels.
- Panel : panneau d’affichage des appels en cours et ceux en attente.
- Recordings : C’est un menu pour enregistrer des sons en ligne (il faut avoir un compte
en ligne).

42
Figure 3.06 : Page de configuration d’utilisateur SIP

Figure 3.07 : Journal des appels

43
D’après la figure 3.06, le menu Extensions à gauche de la page permet de configurer les
utilisateurs d’Asterisk suivant le protocole voulu en mode graphique. Pour l’ajout d’un utilisateur
SIP :
- User Extension : indique le numéro à appeler pour contacter cet utilisateur ;
- Display Name : c’est le nom affiché sur le téléphone de celui qui appelle ce numéro ;
- Secret : est l’authentification de l’utilisateur sur le serveur ;
- Dtmfmode : type de touche DTMF utilisée pour le SVI.
Pour l’enregistrement d’un nouvel utilisateur, on clique d’abord sur Add Extension, puis sur Apply
Configuration Changes.

La figure 3.07 montre le panneau d’affichage du journal des appels effectués et reçus. D’après
cette figure, la page affiche la date de l’appel, le type de protocole utilisé, la source , le
destinataire, et la durée de l’appel. Ce journal est exportable sur Excel. Des statistiques sont
données sur le flux d’appel par heure ou mensuel.

3.3.4 Les fichiers de configuration


Les fichiers de configuration d’Asterisk se trouvent dans le menu Asterisk > Config Edit ou
/etc/asterisk/ en mode terminal. En ce qui concerne la configuration du SVI, il faut éditer les
fichiers sip.conf pour la création d’un utilisateur qui effectue l’appel et extensions.conf pour la
programmation de l’arborescence vocale.
Voici quelques significations des codes dans le fichier sip.conf, comme ce qui est sur la figure
3.08 :
- bindport : indique le port utilisé par l’application (5060 pour le SIP),
- allow : ce sont les codec acceptés à être utilisés par le serveur utilisant SIP,
- type : permet à l’utilisateur 0331468007 d’appeler et d’être appelé à l’opposé de user
(appelant seulement) et peer (appelé seulement),
- secret : mot de passe de l’utilisateur pour son authentification,
- host : adresse IP du serveur.

Pour la conception du guide vocal, il faut éditer le fichier extensions.conf. Le langage utilisé par
Asterisk est propriétaire ce qui prend beaucoup plus de temps pour l’apprendre et le comprendre.

44
Figure 3.08 : Configuration d’un utilisateur SIP en mode texte

Par l’intermédiaire de l’AGI (Asterisk Gateway Interface), il est possible d’appeler d’autres
applications dans le programme comme PHP, PERL, FESTIVAL, ….
La programmation du SVI est beaucoup plus proche du langage PHP puisque :
- les variables sont identifiés par le signe “$“ ;
- dans un programme PHP, une ou plusieurs variables du programme du SVI peuvent y
être envoyée et manipulée ;
- inversement, une ou plusieurs variables du programme PHP peuvent être récupérée dans
le programme du SVI et y sont manipulée.
Le lecteur de son par défaut est le mpg123. Ce lecteur n’est pas stable du fait que la qualité de son
émise n’est pas bonne, et qu’un laps de temps vide, voire même un arrêt de lecture arrive pour une
succession de sons. Toutefois, d’autres lecteurs fonctionnent correctement sur Asterisk comme le
MPlayer. L’inconvénient c’est que le son en lecture ne peut être interrompu par l’appui d’une
touche de clavier téléphonique.

45
Figure 3.09 : Les codes du SVI écrits dans extensions.conf

Comme ce qui est décrit à la figure 3.09, les codes se définissent de la manière suivante :
- Contexte : c’est le nom de groupe d’extensions. Une extension définie dans un contexte
est complètement isolée des extensions d’autres contextes sauf si une interaction est
définie entre eux. Le nom du contexte est placé dans un crochet ([sonnerie]).
- Extension : elle se divise en trois :
 le nom ou numéro de l’extension,
 la priorité : chaque extension peut inclure multiples étapes. Le nombre d’étape est
appelé priorité,
 l’application : c’est la commande qui exécute les actions dans l’appel.
Ces trois composants sont séparés par une virgule comme ceci :

exten => nom, priorité, application()

3.3.5 Sipphone
Pour effectuer l’appel de PC à PC, il faut installer un Softphone sur chaque poste. C’est un logiciel
avec toutes les fonctionnalités d’un réel poste téléphonique. Si le protocole utilisé par le Softphone

46
est le SIP, le Softphone s’appelle alors Sipphone. Chaque Sipphone est authentifié dans le serveur
Asterisk avec leur droit. Le Sipphone freeware le plus utilisé est actuellement X-Lite sur le
plateforme Windows et Kphone pour le plateforme Linux.
La figure 3.10 représente X-Lite avec sa configuration.

Figure 3.10 : X-Lite et sa configuration

3.3.6 Les difficultés


3.3.6.1 Au niveau son
Asterisk possède des sons prédéfinis qu’on peut appeler directement à partir des applications de
lecture audio. Ses sons sont personnalisables en faisant des enregistrements au format wav et de
les intégrer dans le serveur sous le format gsm en utilisant l’utilitaire Sox.
Pour la conception du SVI, il fallait donc faire le pré enregistrement du son vocal. Tout d’abord,
un simple PC équipé d’une carte son avec un micro et un logiciel de traitement de son comme
NGWAVE a été utilisé. Cela ne fonctionne pas puisque les bruits interceptés par le micro
deviennent de plus en plus forts après conversion, ce qui rend la qualité du son très mauvaise.
Sous Linux, il existe un utilitaire qui s’appelle Festival permettant de transformer du texte en son.
Il suffit juste de saisir dans un fichier texte le son voulu et d’appeler ce fichier par le logiciel.

47
Deux problèmes persistent : le premier c’est que jusqu’à maintenant, il n’existe pas de speaker ou
speakerine en version française sur le logiciel, ce qui fait que l’accent anglais ou espagnol est
inévitable. Deuxièmement, la phonétique n’est pas bonne. C’est vrai qu’il est possible de régler
l’intonation, mais ce serait encore un tout autre travail.
La dernière solution c’est donc de faire un enregistrement dans un studio. Le coût est assez cher
mais c’est plus simple avec une grande qualité sonore.
Tout dernièrement, durant une visite dans une entreprise, un SVI y est utilisé. Le serveur est
propriétaire à son serveur téléphonique qui, utilisant un système de Text To Speech, permet
d’obtenir un son humain impeccable, et qui est de plus en version française. En créant un fichier
texte avec le son attendu, le logiciel génère automatiquement un fichier wav. Ils ont accepté
gracieusement de prêter le logiciel pour réaliser les sons de la simulation.

3.3.6.2 Au niveau adresse IP


Pour pallier au problème d’adressage, il existe actuellement des logiciels qui permettent d’intégrer
d’autres systèmes d’exploitations sur Windows. Parmi eux, il y a ce que l’on appelle VMWARE.
C’est un logiciel qui donne la possibilité d’avoir plusieurs systèmes sur son PC sans avoir à
partitionner, et sans faire du va et vient entre ces systèmes. Son point fort réside sur le fait qu’on
bénéficie d’une autre adresse réseau avec la même carte réseau et que sur le même écran, on peut
être à la fois serveur et client sans qu’il y ait conflit d’adresse. Son seul problème c’est que pour le
lecteur CD, il ne reconnaît que les lecteurs virtuels et qu’il ne communique pas avec les autres
systèmes ; cela revient à dire qu’il est impossible d’importer ou exporter des fichiers ou dossiers
d’un système installé dans VMWARE et de Windows sans utiliser un logiciel adéquat.

3.3.7 Amélioration du présent système


Bien évidemment, ce SVI peut être amélioré de différentes manières. A partir d’un site Web ou
de brochure, au lieu de sonneries uniquement, il est aussi possible d’envoyer des images ou même
des vidéo mais ceci aux dépens de l’infrastructure existante de l’opérateur ainsi que la rentabilité
du système. L’organigramme devient alors beaucoup plus complexe.
Ce système ne se limite pas uniquement au niveau de l’opérateur. Il est même tout à fait possible
que le serveur Asterisk soit installé dans une société quelconque et, à partir de nouvelles idées sur
les applications du SVI, le faire fonctionner en partenariat avec un opérateur téléphonique. La
société envoie alors le journal des appels reçus à cet opérateur pour régler la facture.

48
Asterisk implémente actuellement le VXML, ceci dans le but de standardiser le langage de
programmation du SVI bien que la licence soit payante pour un usage professionnel.

49
CONCLUSION GENERALE

Le présent mémoire a permis de simuler un SVI en utilisant la VoIP. On ne parle plus


actuellement que de la VoIP en terme de liaison téléphonique sur IP. L’application de ce système
dans la communication publique n’est pas encore autorisée dans plusieurs pays. Par contre, la
plupart des installations téléphoniques dans les grandes entreprises migrent vers la VoIP puisque
l’infrastructure matérielle est moindre ce qui revient à une dépense moins onéreuse.
Le SVI est un système complet dans la téléphonie moderne. Son interaction avec la base de
données le rend très dynamique et apprécié offrant la possibilité d’avoir tous les détails de chaque
appel, de donner des droits à chaque utilisateur enregistré dans la base, d’avoir surtout des
informations en temps réel. L’intégration du langage standard VoiceXML dans les serveurs SVI
facilitera la programmation de ceux-ci. La permission d’action sur la base de données reste un
dilemme puisque les concepteurs de SVI veulent que ceux qui l’utilisent aient la possibilité de
manipuler totalement la base alors que le risque de sécurité devient de plus en plus énorme.
Dans un avenir proche, l’installation d’infrastructures matérielles PABX ne sera plus nécessaire
puisque toute communication d’appel local dans la société peut être gérée à partir d’un logiciel
serveur PBX comme Asterisk. Ces serveurs sont équipés d’un module SVI qui permet de répondre
aux besoins de l’entreprise et de se rapprocher de ses clients. Il suffit donc d’avoir un simple
micro/casque pour appeler ou recevoir des appels. Pour les appels entrants et sortants, il existe des
matériels jouant le rôle de passerelle entre la VoIP et le PSTN comme les SIP Gateway qui
permettent d’interfacer directement un appel IP suivant le protocole SIP en voix suivant la ligne
téléphonique analogique et inversement.
Par l’évolution technologique incessante dans le domaine de la Télécommunication, des
améliorations ont été apportées sur le système SVI. On parle beaucoup actuellement de la
reconnaissance vocale qui sera intégrée dans le SVI très prochainement. C’est une application
vocale qui, au lieu de saisir sur les touches DTMF, l’appelant dialogue normalement comme si son
interlocuteur est une personne. De ce fait, l’appelant sera guidé à partir d’un guide vocal mais il
répondra par sa propre voix.

50
ANNEXES

51
ANNEXE 1 : CODES DE LA SIMULATION DU SVI

Les codes écrits dans extensions.conf pour la simulation du SVI sous Asterisk sont énoncés ici.

; extension.conf
; Asterisk Management Portal (AMP)

[sonnerie]
exten => 611,1,Answer()
exten => 611,2,Set(NUM_APP=${CALLERIDNUM})
exten => 611,3,DBget(CDT=credit/${NUM_APP})
exten => 611,4,GotoIf($[${CDT}>400]?7:)
exten => 611,5,Background(compte_insuff)
exten => 611,6,Hangup()
exten => 611,7,AGI(/etc/asterisk/nbr.php)
exten => 611,8,ReadFile(TPS_IN=/etc/asterisk/info.txt,10)
exten => 611,9,Goto(code,6110,1)

include => code


[code]
exten => 6110,1,WaitMusicOnHold(10)
exten => 6110,2,Set(N=1)
exten => 6110,3,Set(NBRE_CODE=5)
exten => 6110,4,Background(code_acces)
exten => _XXXXX,1,Set(CODE_CLT=${EXTEN})
exten => _XXXXX,2,Goto(code1,61100,1)

include => code1


[code1]
exten => 61100,1,DBget(CODE=code_acces/000${N})
exten => 61100,2,GotoIf($[${CODE}=${CODE_CLT}]?3:4)
exten => 61100,3,Goto(bienvenue,6111,1)

52
exten => 61100,4,Set(N=$[${N}+1])
exten => 61100,5,Set(NBRE_CODE=$[${NBRE_CODE}-1])
exten => 61100,6,GotoIf($[${NBRE_CODE}>0]?7:8)
exten => 61100,7,Goto(code1,61100,1)
exten => 61100,8,Playback(acces_refuse)
exten => 61100,9,Goto(code,6110,2)

include => bienvenue


[bienvenue]
exten => 6111,1,Playback(bienvenue)
exten => 6111,2,Set(J=0)
exten => 6111,3,Background(choix-langue)
exten => 1,1,Set(LNG=MG)
exten => 1,2,Goto(ecoute,6112,1)
exten => 2,1,Set(LNG=FR)
exten => 2,2,Goto(ecoute,6112,1)
exten => 3,1,Set(LNG=US)
exten => 3,2,Goto(ecoute,6112,1)
exten => #,1,Goto(bienvenue,6111,3)

include => ecoute


[ecoute]
exten => 6112,1,Background(choix-ecoute)
exten => 6112,2,Set(J=$[${J}+1])
exten => 6112,3,Background(${LNG}titre${J})
exten => 1,1,Goto(ecoute,6112,2)
exten => 2,1,Set(J=$[${J}-1])
exten => 2,2,Goto(ecoute,6112,3)
exten => 3,1,Goto(envoi,61130,1)
exten => #,1,Goto(bienvenue,6111,2)

include => envoi

53
[envoi]
exten => 61130,1,Background(envoi)
exten => 1,1,Goto(au-revoir,6113,1)
exten => 2,1,Goto(num_envoi,61131,1)
exten => #,1,Goto(bienvenue,6111,2)

include => num_envoi


[num_envoi]
exten => 61131,1,Background(num-envoi)
exten => _03XXXXXXXX,1,Playback(lecture-num)
exten => _03XXXXXXXX,2,SayDigits(${EXTEN})
exten => _03XXXXXXXX,3,Playback(confirmation)
exten => 1,1,Goto(au-revoir,6113,1)
exten => 2,1,Goto(num_envoi,61131,1)

include => au-revoir


[au-revoir]
exten => 6113,1,AGI(/etc/asterisk/isa.php)
exten => 6113,2,ReadFile(TPS_OUT=/etc/asterisk/info.txt,10)
exten => 6113,3,Set(TPS=$[ ${TPS_OUT}-${TPS_IN} ])
exten => 6113,4,SayNumber(${TPS})
exten => 6113,5,background(au-revoir)
exten => 6113,6,Hangup()

54
ANNEXE 2 : CENTRE D’APPELS [11]

A.2.1 Définition
Un centre d’appel est un Plate-forme téléphonique permettant de gérer à l’aide d’opérateurs ou de
manière automatique, un grand nombre d’appels téléphoniques entrants ou sortants.
Pour les appels : ils sont reçus, comme dans le cas d'un service de support après vente où les
clients demandent des informations à l'entreprise. Pour les appels sortants; ils sont alors, comme
dans le cas d'une prospection téléphonique où l'on va proposer des produits ou services à des
clients potentiels. Le centre d'appels peut être interne : ce sont les salariés de l'entreprise qui
répondent directement à la clientèle; ou externe : l'entreprise confie à un prestataire spécialisé dans
l'accueil téléphonique le soin de traiter les demandes de sa clientèle ou d'effectuer pour son
compte des enquêtes téléphoniques. Le centre d'appels joue un rôle important dans la relation avec
la clientèle.
Un centre d’appels peut être constitué par une entreprise pour ses besoins propres, mais est le plus
souvent le fait de spécialistes dont on loue les services. Un centre d’appels peut être utilisé pour
regrouper tous les appels concernant le service après vente en un même lieu, ou réunir des
téléacteurs dont la mission sera de prospecter ou d’informer le consommateur. On parlera de
centre d’appels multimédia (multimedia call center) lorsque les modalités de contacts ne sont pas
simplement téléphoniques mais multimédia (Internet, bornes interactives…). L’essor des
technologies de la communication via l’Internet a également permis le développement de Web call
centers (WCC), autrement dit des centres d’appels pour lesquels l’information transite par
l’Internet (e-mail ou chat essentiellement). En plus de services classiques de télémarketing, le call-
center prend en charge une partie importante des relations habituelles entre une société quelconque
(appelée ici “le client”) et sa propre clientèle (appelée consommateurs finaux”). Il joue donc une
fonction d’intermédiation.

A.2.2 Dimensionnement
Le centre d’appels doit être conçu et dimensionné en cohérence avec les différents canaux de
distribution ou d’information de l’entreprise. Il met en jeu quatre composantes majeures :
- les ressources humaines (télé-conseillers, superviseurs, managers, formateurs…)
- la technologie (téléphonie, informatique, Internet, logiciels, progiciels, serveurs
multimédias, base de données, cartes de communications, câblages…)

55
- la logistique (immobilier, mobilier, ergonomie de l’environnement, écrans…)
- une culture et des méthodes Marketing (stratégie de l’entreprise, relation client,
profitabilité…).
Les effectifs d’un centre d’appels peuvent varier de quelques personnes à plusieurs centaines voire
plusieurs milliers.

A.2.3 Logiciels utilisés


Le logiciel central d'appel est n'importe quel progiciel conçu pour améliorer la qualité, l'efficacité,
ou la productivité dans un environnement de centre d'appel. L'appel d'arrivée centre l'avantage du
logiciel tel que les distributeurs d'appel automatique (ACD) et le logiciel interactif de la réponse
de voix (IVR). Les centres en partance d'appel gagnent plus d'avantage des applications comme le
logiciel prédictif d'appeleur. Les deux types de centres d'appel peuvent faire la bonne utilisation du
logiciel de la gestion de logiciel de téléphonie d'ordinateur et de rapport de client (CRM).
Pour monter un Centre d’appel, voici les logiciels qu’on doit se procurer :
- Les distributeurs d'appel automatique (ACD) : distribuent également des appels d'arrivée
à tous les reps disponibles de service à la clientèle.
- Les systèmes interactifs de réponse de voix (IVR) : permettent à des centres d'appel
d'automatiser la collection de données de base des visiteurs et peuvent éliminer le besoin
de représentant de service à la clientèle à beaucoup d’appels courants.
- Logiciels prédictifs d’appeleurs : permettent à des téléprospecteurs en partance d’être
beaucoup plus efficaces avec du leur temps.
- Le logiciel de téléphonie d’ordinateur : intègre les systèmes de téléphone et
informatiques pour fournir un meilleur service à la clientèle tout en concurremment
réduisant des temps d’appel.
- Le logiciel de CRM : permet le support à la clientèle bout à bout sans coupure à travers
l’entreprise toute entière.
Actuellement, ces logiciels sont fournis directement avec le matériel serveur suivant l’éditeur de
solutions de centre de contact.

56
ANNEXE 3 : SOFTPHONE

Les softphones sont des logiciels de téléphonie IP avec les mêmes fonctionnalités que les postes
téléphoniques analogiques. A par le simple appel en émission et en réception, les softphones
implémentent les applications modernes de la téléphonie comme la visiophonie, les répondeurs
automatiques, les enregistrements d’appel et surtout la possibilité de recevoir ou d’effectuer
plusieurs appels en même temps. Ils permettent de téléphoner gratuitement uniquement entre deux
ordinateurs ou terminaux ou sur Internet, grâce à un microphone et un haut-parleur, ou un micro-
casque. Il est également possible de réaliser une messagerie instantanée basique permettant aux
utilisateurs de communiquer textuellement et de se transmettre des fichiers sur des softphones.
Les softphones fonctionnent avec presque tous les protocoles IP comme le SIP, H.323 et le IAX.
La plupart des softphones sont propriétaires comme Skype ou Wengo. Les appels effectués sur ces
softphones sont payants vers des lignes téléphoniques fixes et mobiles mais ont l’avantage depuis
peu de recevoir des appels téléphoniques depuis des téléphones fixes et mobiles, mais ceci
uniquement dans certains pays.
Par contre, il existe des softphones libres, c’est-à-dire qu’on peut modifier son code source,
comme Kphone ou X-Lite.

57
ANNEXE 4 : DOCUMENTATIONS SUR ASTERISK

Asterisk est un Open source, désigné à fonctionner sous Linux. Asterisk combine toutes les
connaissances en téléphonie dans une suite robuste d’applications de télécommunication. La
puissance d’Asterisk est liée dans sa nature personnalisable, complémentée par un inégalable
standard de conformité. Des applications comme la messagerie vocale, la conférence, la gestion de
file d’attente, la musique d’attente…. Encore plus, Asterisk peut s’intégrer avec les autres
technologies existantes.
Asterisk peut apparaître complexe pour les nouveaux utilisateurs, c’est pourquoi des sites et
documentations ont été créés. En voici les principaux sites :

The Asterisk WIKI Reference Guide


http://www.voip-info.org/wiki-Asterisk

The Asterisk Documentation Project


http://www.asterisk.org
http://www.asteriskdocs.org
Asterisk.org est le site Internet des projets sur Asterisk. Il contient les nouveautés sur Asterisk
ainsi que des informations sur la communauté Asterisk.

AstriCon
http://www.astricon.net
AstriCon est le centre de forum des utilisateurs, des tutoriaux, et des aides entre développeurs sur
Asterisk. AstriCon est conçu par Ipsando, Inc.

Forums
Il existe plusieurs forums disponibles couvrant de multiples thèmes sur Asterisk. Le site officiel
pour s’enregistrer et participer est http://forums.digium.com.

Digium Corporate Mailing List


Pour s’informer des nouveaux produits, des communiqués de presse, et des événements relatifs à
Asterisk, utiliser la liste de courrier de Digium sur http://www.digium.com.

58
BIBLIOGRAPHIE

[1] http:// www.stand4U.com/

[2] http:// www.frameip.com/voip/

[3] T. Wallingford, VoIP Hacks.chm, O’Reilly Publishing, 2005

[4] T. Kelly, VoIP for Dummies, Wiley Publishing: Indianapolis, 2005

[5] http:// fr.wikipedia.org/wiki/VoIP

[6] http:// www.tech-faq.com/lang/fr/

[7] http:// www.connect21.fr/index.php/

[8] http://www.entreprises.public.lu/content/voip/index.php?type=systemeInformationNTIC#1

[9] http:// www.voxeo.com/library/

[10] Manuel VOCALCOM, Serveur Vocal Interactif HERMES Pro, 2001

[11] http:// www.voicexml.org/tech_bkgrnd.htm

[12] http://www.w3.org/TR/voicexml

[13] http://www.centresdappels.com/Magazines/ConsultArticle.asp?ID_Article=6026&iPage=1

[14] http://aussievoip.com.au/wiki/index.php?page=TB-Installation

[15] http://www.asteriskguru.com/tutorials/asterisk_voip_ipphone.html

59
[16] http://www.voip-info.org/wiki/view/Asterisk+tips+ivr+menu

[17] M. Spencer, M. Allison, C. Rhodes, The Asterisk handbook Version 2.pdf, 2003

[18] P. Mahler, VoIP Telephony with Asterisk, Mahler: P.S, 2005

[19] M. Spencer, Asterisk Business Edition.pdf, 2005

[20] B. Dempster, K. Garrison, TrixBox Made Easy, Packt Publishing: Birmingham, 2006

60
Nom : RABARIMISA

Prénoms : Solo Andriniaina

Adresse : Lot 26 SOAMIAMPITA Andranonahoatra Itaosy


ANTANANARIVO 102

Tel : +261 33 05 957 86

Titre du mémoire : ETUDE D’UN SERVEUR VOCAL INTERACTIF


SUR UN SERVEUR PBX

Nombre de pages : 60

Nombre de tableaux : 07

Nombre de figures : 26

Mots clés : SVI, VoIP, PBX, SIP, Guide vocal, DTMF

Directeur de mémoire : Mme RABEHERIMANANA Lyliane Irène


RESUME

Le présent mémoire est axé sur la simulation d’un Serveur Vocal Interactif en utilisant le
serveur PBX Asterisk en tant que gestionnaire d’appel sur voix IP. Un aperçu sur l’intégration de
la VoIP dans l’entreprise ainsi qu’un mode de programmation standard du SVI ont été effectués
dans ce travail. L’évolution des infrastructures de télécommunications actuelle pousse les
entreprises à migrer vers les appels IP qui, dans sa mise en place, inclut automatiquement un
module SVI d’où l’intérêt de ce mémoire.

ABSTRACT

This notice is focused on the simulation of Interactive Voice Response using server PBX
Asterisk in so far as a call manager on Voice over IP. Some research about VoIP integration on
firm as well as a standard programming method were been carried out. Growth of wire
substructure drives the small enterprise to turn towards IP call which includes obviously an IVR
unit therefore the meaning of this work.

Vous aimerez peut-être aussi