Vous êtes sur la page 1sur 21

cours de traitement du signal avancé

Traitement de la parole

H. BELKEBIR1
E-mail: hicham.belkebir@usmba.ac.ma

1 Département Génie Électrique et Informatique


École Nationale des Sciences Appliquées - Fes
Université Sidi Mohamed Ben Abdellah

Support de cours de la filières GTR2, 2017-2018

Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 1 / 14


Plan du cours

1 Introduction

2 traitement numérique du signal

ensaf-logo

Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 2 / 14


Organisation du Cours

28 H de cours et travaux dirigés :


⇒ 4 séances de 4 H de cours de traitement de signal avancé (TSA);
Travaux pratiques :
⇒ 3 séances de TP par groupe;
Évaluation :
⇒ Contrôle continue au début de chaque séance de cours (à partir de la
deuxième séance).
⇒ Mini-projet de traitement de signal avancé.
⇒ Examen écrit de validation des acquis.

ensaf-logo

Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 3 / 14


Pré-requis du Cours

Physique et mathématiques (CP1 et CP2);

statistique et processus stochastique; (1ére année GTR)


informatique (POO) ;

traitement de signal.

ensaf-logo

Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 4 / 14


Introduction

ensaf-logo

Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 5 / 14


Introduction
Qu’est ce que la parole ?

Définition 1: "la parole est le fait de s’exprimer par le langage articulé"


(dictionnaire Larousse);

Définition 2: "Ensemble de Mots ou phrases prononcées pour exprimer


une pensé, un sentiment · · · (dictionnaire Larousse);

Définition 3: "Usage concret de la langue (système abstrait) par les


locuteurs" (selon les linguistiques)

Définition 4: sur le plan technique, la parole est un signal acoustique


produit par le système phonatoire pour servir de support
physique à l’information généré par le cerveau de L’être
humain.

ensaf-logo

Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 6 / 14


Introduction
Pourquoi le traitement du signal de la parole ?
Pour certaines application, la parole constitue la seule modalité
d’accès à l’information (exemple: communications téléphoniques).
Pour d’autres, elle occupe le rôle de modalité complémentaire
(exemple: contrôle vocale des systèmes);
l’Intérêt d’utiliser la parole comme moyen de communication réside
dans le fait que c’est une modalité riche d’un point de vue
informationnel;
la parole est un signal acoustique sur lequel on a imprimé
l’intelligence généré par notre cerveau par l’intermédiaire d’un mode
de production très complexe.
il en résulte, la nécessité de développer des techniques et des
méthodes appropriés pour :
Préserver le contenu informatif du signal de la parole;
élaborer des modèles qui facilite la représentation de ce signal; ensaf-logo
production artificiel du signal de la parole;
Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 7 / 14
Introduction
Domaines d’application

Reconnaissance de la parole (ASR) :


⇒ Parole interactive (dialogue);
⇒ Dictée vocale ;

Reconnaissance du locuteur :
⇒ Vérification ou identification ;
⇒ Dépendante ou indépendante du texte ;

Synthèse de la parole :
À partir du texte (text to speech synthesis) ;
Synthèse par règle → par concaténation → sélection d’unités

ensaf-logo

Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 8 / 14


Traitement numérique du signal

ensaf-logo

Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 9 / 14


traitement numérique du signal
représentation du signal de la parole

signal acoustique : est produit par le système phonatoire humain. Il


s’agit d’un signal analogique ayant un spectre qui couvre
l’intervalle de fréquence s’étalant de 20[Hz] à 20 [KHz] :
signal électrique : est le fruit de la transduction du signal acoustique
en signal électrique à l’aide de transducteurs spécifiques
(microphone). On admet que le signal électrique conserve les
traits caractéristiques du signal acoustique;
signal numérique : est le résultat de la numérisation du signal acquis
par le transducteur par le moyen d’un convertisseur
analogique numérique. Le signal de la parole issue de cette
étape est caractérisé par la fréquence d’échantillonnage Te et
la résolution du CAN (nombre de bits utilisé pour quantifier
l’amplitude du signal);
ensaf-logo

Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 10 / 14


traitement numérique du signal
système de traitement

Filtre : est un système linéaire temporellement invariant qui


introduira des modifications temporelles ou spectrales sur le
signal afin de l’adapter aux spécifications du système
d’exploitation;
Convolution numérique: est l’opération réalisé par le filtre pour
transformer le signal se présentant à son entrée :
Filtre
x (n) y (n)
H
X
y (n) = x (n) ∗ h(n) = x (m)h(n − m)
m

Chaque filtre est caractérisé par sa réponse impulsionnelle


h(n) :
δ(n) Filtre h(n) ensaf-logo

Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 11 / 14


traitement numérique du signal
transformée en z

définition : soit un signal numérique x (n), on définit la transformée en


z bilatérale par l’expression :
x (n)z −n
X
X (z) =
n

|x (n)||z −n | < ∞.
P
X (z) existe si
n
La transformée inverse est donnée par :
1
I
x (n) = X (z)z n−1 dz
ı2π
Région de convergence: Soit R1 et R2 deux réels tel que X (z)
n’existe que :
∀z ∈ C : R1 < |z| < R2
Alors l’ensemble des z vérifiant cette condition forme la
région de convergence de X (z); ensaf-logo

Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 12 / 14


traitement numérique du signal
exemples

impulsion de Dirac δ(n) :


Z {δ(n)} = 1
impulsion avec retard δ(n − k) :
Z {δ(n − k)} = z −k
échelon unité u(n) :
1
Z {u(n)} =
1 − z −1
porte u(n) − u(n − N) :
1 − z −N
Z {ΠN (n)} =
1 − z −1
puissance an u(n) :
1
Z {an u(n)} =
1 − az −1 ensaf-logo

Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 13 / 14


traitement numérique du signal
propriétés de la transformée en z

séquence transformée en z
1. Linéarité ax (n) + by (n) aX (z) + bY (z)
2. Retard x (n − k) z −k X (z)
3. Avance x (n + k) z k X (z)
dX (z)
4. Pondération linéaire nx (n) −z
dz
5. Pondération exponentielle an x (n) X (a−1 z)
6. Inversion temporelle x (−n) X (z −1 )
7. Convolution x (n) ∗ y (n) X (z)Y (z)
8. Multiplication x (n)y (n) 1 H z −1
ı2π C X (µ)Y ( µ )µ dµ

ensaf-logo

Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 14 / 14


Modèle numérique du signal de la
parole

ensaf-logo

Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 15 / 14


modèle numérique du signal de la parole
Processus de production de la parole

ensaf-logo

Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 16 / 14


Analyse spectrale du signal de la
parole

ensaf-logo

Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 17 / 14


Analyse spectral du signal de la parole
Analyse de Fourier à temps court

ensaf-logo

Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 18 / 14


Analyse spectral du signal de la parole
Analyse homomorphique

ensaf-logo

Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 19 / 14


Modélisation paramétrique du
signal de la parole

ensaf-logo

Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 20 / 14


modélisation paramétrique du signal de la
parole
prédiction linéaire

ensaf-logo

Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 21 / 14

Vous aimerez peut-être aussi