Académique Documents
Professionnel Documents
Culture Documents
Traitement
du signal
DSP numérisé
carte son
Définition : son
Le son est une vibration de l’air qui se propage avec des caractéristiques variables
d’intensité, de fréquence, de portée, d’écho, ...
L’oreille humaine est sensible aux sons dans certaines limites d’intensité et de
fréquence, c’est le processus de l’audition.
Quand les cordes vocales créent des sons, c’est la voix et le processus de la phonation.
Définition : micro
Le microphone (abréviation micro) est le capteur utilisé par l’ordinateur pour
transformer le son en signal électrique, que l’on appelle signal audio. Le
micro est ainsi un transducteur électro-acoustique.
Définition : carte son
La carte son réalise l’interface entre l’unité centrale de l’ordinateur, le micro et les
haut-parleurs. On y trouve des bornes électriques pour échanger les signaux :
1. la borne micro reliée à l’entrée du CAN, acronyme pour Convertisseur Analogique
Numérique afin de numériser le signal électrique issu du micro.
2. la borne haut-parleur est reliée à la sortie du CNA ou Convertisseur Numérique
Analogique qui synthétise des sons audibles par blocage d’ordre zéro.
3. la borne line, qui permet d’échanger des signaux audio avec d’autres appareils Si
la carte son est amovible, on y trouve également un connecteur de bus pour les
échanges de données avec l’unité centrale. Parfois, on y trouve aussi un processeur
DSP pour traiter le signal audio directement dans la carte son.
Exemple : carte son
Sur la carte son amovible représentée ci-dessous, on peut repérer à droite les bornes
électriques utilisables pour brancher micro et haut-parleurs, et le connecteur de bus en
bas. Sur la carte, on repère le CNA (en anglais DAC), le DSP, microprocesseur
spécialisé, et sans doute le CAN en bas au centre.
Trois bornes :
micro, line et
haut-parleurs
Définition : CAN
Le convertisseur analogique numérique ou CAN est un circuit intégré électronique
capable de numériser le signal électrique présenté à la borne micro de la carte son.
Définition : CNA
Le CNA (pour convertisseur numérique analogique) est un circuit intégré qui constitue
à partir d’un signal numérique un signal électrique utilisable sur la borne haut-parleur
de la carte son en utilisant la technique du bloqueur d’ordre zéro.
Définition : haut-parleurs
Les haut-parleurs sont des transducteurs électroacoustiques capables de traduire un
signal électrique en vibration sonore de l’air, d’où un son. C’est l’inverse du micro.
Définition : DSP
Un DSP est un microprocesseur spécialisé capable de traiter les signaux associés aux
sons plus rapidement et plus efficacement que les microprocesseurs à usage général.
DSP est l’acronyme pour Digital Signal Processor, qui signifie Processeur de Signal
Numérique. Digital est la traduction anglaise de numérique.
THÈME 2 LES DIFFÉRENTES FORMES POSSIBLES DU SIGNAL AUDIO.
Les propriétés du signal audio électrique issu du microphone subissent plusieurs
transformations dans la carte son. C’est au départ un signal continu et un signal
analogique, avant de devenir un signal discret et surtout un signal numérique.
Définition : signal audio
Un signal habituellement est une fonction du temps créée par un capteur pour mesurer
une grandeur physique.
Le signal audio est un cas particulier de signal qui traduit la mesure d’un son.
Présenté à l’entrée du CAN, ce signal issu du micro est en réalité une tension
électrique qui reproduit les vibrations de l’air. Cette tension est proportionnelle à tout
instant à la pression de l’air mesure donc l’intensité instantanée du son. On la
représente aisément dans un chronogramme.
Formalisation : signal audio
On note s(t) l’intensité ou valeur instantanée du signal audio, en Volt à la sortie du
micro et à l’entrée des haut-parleurs, t est le temps exprimé en seconde (s).
Précision : signal audio
L’intervalle des valeurs permises au signal audio s(t) reste limité à IVP = 1[− ,]1,
c'est-à-dire que s(t) ∈[−1,1],∀t ou encore que −1 ≤ s(t) ≤ 1,∀t .
Définition : chronogramme
Quand on représente au cours du temps un signal audio, avec le temps en abscisse et
l’intensité en ordonnée, on obtient un chronogramme.
Définition : Matlab
MATLAB (ou Matrix Laboratory) est un logiciel de calcul et de simulation basé sur le
calcul matriciel et utilisé dans le domaine du Traitement du Signal et des Images, et
dans de nombreux domaines scientifiques et techniques.
Il sera utilisé dans la suite de ce cours pour analyser, traiter et représenter les sons
numériques, ce qui donnera l’occasion d’apprendre à s’en servir.
Quand on parle de Matlab, il peut être intéressant de connaître l’existence de Scilab
proche de MATLAB, et pourtant gratuit, créé et développé par l’INRIA Rocquencourt.
Définition : Goldwave
Goldwave est un shareware qui peut être utilisé en Travaux Pratiques pour enregistrer,
observer et traiter les sons numériques, la version d’évaluation est accessible sur le site
www.goldwave.com.
P= 2/2B .
Exemple : loi de quantification
La loi de quantification du CAN découpe l’intervalle IVP = 1[− ,]1 en 2B sous
intervalles égaux notés Pi , i de 0 à 12B − .
Si on note les bornes inférieures m0,m1,... m2B−1, la règle d’association est la suivante : si
(s nTe ) est inclus dans le pas de quantification Pi on lui associe le code i en binaire sur
B bit et la valeur d’intensité quantifiée sn = mi .
La variante qui consiste à associer à s)(nTe la valeur centrale ci du pas Pi qui le
contient, soit sn = ci et le code binaire i sur B bit, produit une erreur de quantification
s(nTe ) − sn centrée, c'est-à-dire nulle en moyenne.
Définition : caractéristique de quantification
La caractéristique de quantification représente graphiquement la loi de quantification,
et reporte l’échantillon s)(nTe en abscisse et la valeur quantifiée sn en ordonnée.
Exemple : caractéristique de quantification
Voici une caractéristique de quantification de type CAN dans le cas d’une longueur
binaire valant B = 4bit
Définition : spectre
Le spectre du signal s(t) est une fonction S( f ) de la fréquence f . Le spectre donne la
composition fréquentielle du signal.
Tout signal possède un spectre S( f ) que l’on peut calculer avec la transformée de
Fourier que l’on notera : S( f ) = TF[s(t)].
Le spectre S( f ) contient exactement la même information que le signal s(t).
Exemple : spectre
Un signal sinusoïdal de fréquence f0, par exemple s()(t = acos )2πf0t possède un
spectre simple réduit à une composante non nulle (ou raie) située à la fréquence f0.
Précision :
Si la taille du signal numérique est proportionnelle à la longueur binaire B , le pas de
quantification 2/2B (loi de quantification uniforme) y est inversement proportionnel.
Définition : erreur de quantification
L’échantillon s(nTe ) étant codé en binaire dans la valeur sn par le CAN, l’erreur de
quantification est définie par e(nTe ) = s(nTe ) − sn , la valeur de l’intensité mesurée
moins la valeur quantifiée.
Exemple : erreur de quantification
Avec l’exemple d’un CAN opérant sur B bits, l’erreur de quantification est positive et
reste limitée par le pas de quantification, soit 0 < s(nTe) − sn < 2/2B . On le voit
aisément sur la caractéristique de quantification.
Si par contre on associe à un code bianire la valeur centrale du pas de quantification,
l’erreur de quantification reste comprise entre −1/2B et 1/ 2B .
Précision : erreur de quantification
En pratique, il est impossible de traiter l’erreur de manière déterministe, car on ne sait
pas prédiree(nTe ) = s(nTe ) − sn . On préfère analyser l’incertitude de quantification, et
évaluer plutôt les limites et les propriétés statistiques de l’erreur.
L’hypothèse la plus simple est que les valeurs possibles de l’erreur de quantification
sont équiprobables, réparties uniformément entre les bornes de l’erreur, la moyenne de
l’erreur est alors la demi somme des bornes, et on sait calculer aussi simplement
l’écart type de l’erreur, c'est-à-dire la valeur moyenne de l’écart à la valeur moyenne.
Définition : rapport signal sur bruit
Une erreur de quantification e)(nTe est d’autant plus pénalisante que l’intensité du
signal audio est faible. Le rapport s)(nTe /e)(nTe donne la précision et la qualité de la
quantification. C’est un indicateur de la qualité de la quantification.
Cet indicateur conduit à la notion de rapport signal sur bruit (ou SNR pour Signal to
Noise Ratio) défini comme suit et exprimé en général en décibel (dB) :
écarttypesignal
SNR =
écarttypeerreur
Exemple : rapport signal sur bruit
Un SNR de 72dB est donné comme un excellent rapport signal sur bruit sur une ligne
téléphonique grand public, le bruit de quantification y est quasiment inaudible.
Précision : décibel
On définit le décibel (dB) pour a > 0 seulement ! C’est adB = 20log10)(a .
THÈME 6 COMMENT CALCULER DÉBIT ET TAILLE D’UN SON NUMÉRIQUE
Le débit et la taille d’un son numérisé croissent proportionnellement à la fréquence
d’échantillonnage fe et à la longueur binaire des échantillons B et décroissent par
contre proportionnellement au taux de compression.
Définition : débit d’un son numérisé
Le débit associé à un son numérisé est le nombre de bits créés chaque seconde par
l’opération de numérisation, c’est aussi le nombre de bits à télécharger par seconde
pour jouer le son sans ralentir . Le débit s’exprime en bit par seconde (bps).
Précision : débit
Un son numérisé en monophonie avec fe échantillons de B bit chaque seconde
provoque un débit de numérisation de fe × B bps (bit par seconde).
En cas de stéréophonie, on utilise deux haut-parleurs pour recréer l’information de
position des sources sonores, il faut doubler le débit par rapport à la monophonie.
Définition : taille d’un son numérisé
Si on numérise T seconde de signal audio, la taille mémoire nécessaire (en bit) pour
stocker le son numérique, est le produit du débit (en bps) par la durée en seconde, soit
fe × B×T bits en monophonie, il faut doubler ce résultat en stéréophonie.
Précision : taille
La taille d’un son numérique s’exprime en bit ou en octet (un octet égale 8 bit), mais
aussi en kilo-octet (ko), ou en mégaoctet. Attention ! Un kilo-octet égale 1024 = 210
octets et non pas 1000 octets !
Définition : taux de compression
Pour télécharger aisément un fichier son numérique, on le compresse en utilisant un
CODEC.
Le taux de compression peut être calculé indifféremment en faisant le rapport des
tailles ou le rapport des débits du son avant compression et du son compressé. Ainsi,
si on applique un taux de compression C à un son numérique,
× B×T
- sa taille est divisée par C et devient fe bit
C
×B
- et son débit est divisé par C et devient fe bps
C
Définition : CODEC
Un CODEC (pour COder DECoder) est un traitement logiciel utilisé pour appliquer un
taux de compression à un fichier audio (on dit aussi coder), et ensuite pour
décompresser (ou décoder) le fichier compressé.
Exemple : CODEC
On parle par exemple et pour les sons numériques de CODEC mp3, ou de CODEC
µ−law ou A-law, ou encore de CODEC ogg, ou de mpc, selon le principe de
compression appliqué à un son.
Il existe aussi des CODEC adaptés aux images, tels jpeg, et aux vidéos, tels mpg
Précision : CODEC
Les formats des fichiers audio sont multiples, qui seront évoqués dans ce cours :
- Le format PCM (Pulse Coded Modulation) est non compressé, on y trouve un
entête indiquant les paramètres de numérisation et tous les échantillons
- Le format MP3 (MPEG audio layer 3) est compressé avec des taux variables de
l’ordre de C =10 , mais la compression détermine une modification du signal
- Le format AU est compressé avec la loi mu avec un taux plus faible d’au plus
C = 2 mais sans modification du signal
- L’extension wav sur un fichier audio numérique peut recouvrir plusieurs formats,
dont PCM.
Précision : qualité téléphonique et qualité CD
Parler de qualité de numérisation équivaut à donner les paramètres de numérisation,
que sont fréquence d’échantillonnage, longueur binaire, débit, mono/stéréophonie : -
Qualité téléphonique signifie : monophonie (un seul canal sonore), fe =
8000Hz , B = 8bit , donc aussi un débit de 64kbps
- Qualité CD signifie : stéréophonie (deux canaux sonores), B =16bit par canal, et fe
= 44100Hz