Vous êtes sur la page 1sur 41

Contenu

Production et perception de la parole Analyse et modlisation de la parole Reconnaissance de la parole Reconnaissance du locuteur Synthse de la parole Compression et codage de la parole Communication vocale homme-machine

Act de communication parle LOCUTEUR


Ide Traitement cognitif Traitement linguistique et phontique

AUDITEUR
Comprehnsion

Traitement cognitif Traitement cognitif Traitement linguistique et phontique Systme auditif priphrique Traitement linguistique et phontique Systme auditif priphrique

Production du son

La parole et la perception

La parole facult de communiquer la


pense par un systme de sons articuls mis par les organes de la phonation

La perception fonction par laquelle


lesprit se reprsente les objets

Le cerveau et la verbalisation

Phonme
Phonme (notion
phonologique) unit minimale du langage porteuse dune signification linguistique Allophone ralisation dun phonme (un phonme peut avoir plusieurs allophones)

La parole
La parole est un signal rel (4D), continu,
dnergie finie, non stationnaire.

Sa structure est complexe et variable dans le


temps: Tantt priodique (plus exactement pseudopriodique) pour les sons voiss, Tantt alatoire pour les sons fricatifs, Tantt impulsionnelle dans les phases explosives des sons occlusifs.

Exemple: voix-parole

Units de la parole

Words Phonemes Allophones Allophone models


Amplitude Frequency (kHz)

grey

whales

Spectrogram

Speech signal

Times (seconds)

Units of speech (after J.Makhoul & R. Schwartz)

Les phonmes de la langue franaise


Phonmes Voyelles
Orales

Semi-consonnes (semi-voyelles)
Liquides Nasales

Consonnes
Fricatives Occlusives

Nasales

Voises Voises Non-voises Non-voises

Phonemes in American English

Phonetic symbols for American English

Vowels and Consonants


No Vowels

Vowels and Consonants


No Vowels

No Consonants

Vowels and Consonants


No Vowels Full Text

No Consonants

Production et perception de la parole

Aperu anatomique Mcanisme de la phonation Phontique articulatoire Acoustique de la phonation Mcanisme de laudition Psychoacoustique
Masquage Bandes critiques

Bibliographie
A. Drygajlo, Traitement de la parole,
EPFL, Lausanne, 2005

A. Marchal, Les sons et la


parole, Gurin, Montral, 1980.

Production et modlisation de la parole


Partie supraglottique

Partie glottique

Partie subglottique

Il nexiste pas proprement parler dorgane spcifique destin la production de la parole.

Lappareil phonatoire
Partie subglottique
poumons, trache fournit lnergie ncessaire la phonation en insufflant lair vers la

partie glottique

Partie glottique ou larynx


ensemble de cartilages, ligaments et muscles cordes vocales: replis tendus horizontalement qui, sous leffet des

muscles, jouent un rle de valve vis--vis de lair des poumons; elles librent un flux dair vers la partie supraglottique

Partie supraglottique ou conduit vocal


Cavits orales (pharyngienne et buccale) gomtrie variable en

fonction des articulateurs: langue, mchoire infrieure, lvres Cavits nasales gomtrie fixe peuvent tre couples aux cavits orales par abaissement du voile du palais

Aperu anatomique

ARTICULATION

PHONATION

Cordes vocales

Laction des cordes vocales

Effet de Bernoulli, compression et rarfaction des


molcules dair La frquence de vibration des cordes vocales est appele frquence du fondamental (pitch) hommes: 80-200 Hz, femmes: 150-450 Hz, enfants: 200-600 Hz

Laction des cordes vocales

A) B) C) D)

Respiration normale Respiration forte Voix chuchote Phonation vibration des cordes vocales

Conduit vocal
Tube acoustique glotte lvres

Fonction daire

glotte

lvres

Filtre en treillis
ki coefficients de rflexion

Reprsentation spectrale
Formants

Harmoniques

i
Frquence du fondamental

Frquence fondamentale et formants

Reprsentation spectro-temporelle

Sources et rsonances
La production de la parole est contrle linguistiquement la fois au niveau de lexcitation (source) et des rsonances (conduit)

Sources
Source quasi-priodique:
cordes vocales en vibration Source de bruit: coulements turbulents produits par une obstruction du passage de lair dans le conduit vocal Rsonances Les articulateurs faonnent dans le conduit vocal des cavits dont les frquences de rsonance dterminent la forme du spectre

Modle excitation-filtre

Excitation

Conduit vocal

Vocodeur

Analyse
Parole

Synthse
Parole resynthse

Phontique articulatoire et acoustique de la phonation

Trapze articulatoire des voyelles

Voyelles
Source dexcitation
unique due la vibration des cordes vocales (excitation voise) Configuration quasistable du conduit vocal Elles peuvent tre orales (sans couplage avec le conduit nasal) ou nasales (conduit oral coupl avec le conduit nasal)

Formants des voyelles

Trapze acoustique des voyelles orales du franais


F2 - caractre antrieur-postrieur

F1 - ouverture

Trapze acoustique

cart

Semi-voyelles (semi-consonnes)

Sons voiss sans


source de bruit (comme les voyelles) Configurations nonstables du conduit vocal: transitions dune configuration vocalique

Consonnes: fricatives

Source de bruit
continue obtenue par une obstruction totale du passage de lair /s/

Occlusives
Source de bruit obtenue par une fermeture totale du
conduit buccale, produisant un silence, et suivie dun relchement brutal produisant une explosion qui ralise la consonne

Occlusives voises et non-voises


Voise Non-voise

Nonstationarit

Le signal vocal nest pas un signal


stationnaire: le conduit vocal se dforme dune faon continue et les paramtres du modle sont donc variables dans le temps.

Toutefois, les dformations sont suffisamment


lentes pour que les coefficients de la fonction de transfert puissent tre modliss comme quasiconstants pendant des intervalles de temps de lordre de 10 ms.

Transitions entre les phonmes

Coarticulation

Modle simplifi de la production de la parole

0104-05

Analyse court terme


0.0 80 dB 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

Power

0 dB 6 kHz

Puissance

Spectrum

Spectre

0 kHz

Waveform
0 ms

Onde Frquence du fondamental


Time

Pitch
15 ms

Digital sound spectrogram