Vous êtes sur la page 1sur 4

YM

• Audiosculpt : Paramètres d'analyse


o "Window Size" (Taille de la fenêtre) : la taille de la fenêtre détermine le nombre
d’échantillons du son dans chaque analyse. La taille de la fenêtre est le paramètre
essentiel de l’analyse : il détermine les résolutions fréquentielle et temporelle.
o Les champs "Window Size" et "Fundamental Frequency" sont interdépendants.
o "Fundamental Frequency" (Fréquence fondamentale) en Hz : permet d’ajuster la
résolution fréquentielle directement. Taille de la fenêtre, pas d’avancement et taille de la
FFT sont adaptés en conséquence. La taille de la fenêtre est programmée à 5 fois la
longueur de la période qui correspond à la fréquence fondamentale (résolution
fréquentielle) indiquées.
o "Window Step" (Pas d’avancement) : détermine l’intervalle de temps entre 2 analyses
successives. Celui-ci est mesuré en nombre d’échantillons. En manuel, vous précisez
vous-même le pas d’avancement.
o Le mode automatique adapte le pas d’avancement en fonction de l’opération demandée
pour un résultat optimal. Dans le cas de l’analyse, le pas d’avancement est égal au 1/8
de la taille de la fenêtre
o "FFT Size" (Taille de la FFT) : détermine le nombre de points de l’analyse ; il est
obligatoirement égal ou supérieur à la taille de la fenêtre.
o "Analysis Window" (Fenêtre d’analyse) : permet de spécifier le type de fenêtre utilisé
dans l’analyse. Trois types de fenêtres sont proposés : Blackman, Hanning et Hamming.

• Effets des paramètres d’analyses sur le sonagramme


o Effet de la taille de la fenêtre d’analyse sur le sonagramme
▪ Lorsqu’on demande à AudioSculpt une analyse FFT, le choix de la taille de la
fenêtre d’analyse (window size) influe directement sur le résultat graphique
obtenu. Ce paramètre agit sur la taille de la FFT et sur le pas d’avancement de la
fenêtre d'analyse (window step) qui vaut, par défaut, 1/8 de la taille de la fenêtre
d’analyse.
• Le choix de la taille de la fenêtre d’analyse est donc une affaire de
compromis entre la résolution temporelle et la résolution fréquentielle. On
favorisera l’une ou l’autre en fonction du travail à réaliser ou du type de
son à traiter.
o Pour les sons percussifs, on choisira plutôt des petites fenêtres
(entre 500 et 1000).
o Pour des sons harmoniques, surtout pour les sons graves, on
choisira une plus grande taille de fenêtre d’analyse afin d’être en
mesure de séparer les harmoniques dans le bas du spectre.
▪ Si on a besoin d’une bonne résolution fréquentielle, tout
en conservant la même résolution temporelle, il doit
utiliser le paramètre « Oversampling ». Ce menu, permet
d’augmenter la taille de la FFT (donc la résolution
fréquentielle) sans changer la taille de la fenêtre
d’analyse, donc sans changer la résolution temporelle.
Pour pouvoir faire le calcul de la FFT sur un plus grand
nombre d’échantillons, AS complète les échantillons
prélevés dans le signal par des zéros.
• Un réglage de l’oversampling sur « X2 » peut
donc être utilisé pour palier aux limitations d’une
FFT classique. On utilise ce réglage
principalement pour réaliser certaines analyses
comme le « Partial Tracking ».
FFT

o Abréviations
▪ TR (Temporal resolution)
▪ WS (Window Size)
▪ SR (Sample rate)
o Résolution temporelle
Durée de la fenêtre
▪ On sait que la fréquence d'échantillonnage (SR) du son correspond à 1 seconde,
et que la période est inverse de la fréquence.
TR = Taille de la fenêtre / SR
▪ TR = WS/SR
• 1024/44100 = 0.023219954648526078 (23 ms)
• Les variations d'un son rythmique se produisent généralement tous les
50 à 1000 échantillons, soit 11,3 à 22,6 ms
• Les variations dans un son stable se produisent généralement tous les
2000 à 4000 échantillons, soit 44 à 88 ms
▪ La durée de la fenêtre doit être cinq fois plus longue que la période du
signal que l'on veut détecter
• T(Window) = 5 * T(Signal)
o ex pour un signal de 440Hz
▪ 5*(1/440) = 0.011363636363636364
o Résolution fréquentielle
Fréquence détectable la plus basse
▪ Le choix de la taille de la fenêtre doit être fait en tenant compte de la fréquence
du signal. Si ces facteurs évoluent, cela doit être pris en compte. La fréquence
détectable la plus basse (F0) est déterminée par la taille - durée - de la fenêtre.
▪ F0 = 5 * (SR / WS)
• par exemple
▪ De la, pour trouver la WS en fonction de la fréquence :
• WS = 5*SR/F(Signal)
o 5*(44100/440) = 501.1363636363637
• En théorie, la taille de la fenêtre d'analyse utilisée sur un son doit
être égale à au moins quatre fois la période du son (pour les sons
périodiques), ou au moins quatre fois la période du partiel le plus
bas contenu dans le son (pour les sons non périodiques)
Effet du type de fenêtre (window type) sur le sonagramme

Lorsque AS effectue une FFT, il n’utilise pas directement les échantillons du signal. La portion de
signal s(t) utilisée pour faire le calcul est d’abord multipliée par la fenêtre d’analyse h(t). Dans le
domaine fréquentiel, la multiplication des signaux devient une convolution des spectres des
signaux S(f) et H(f) :
G(f), qui est ce qu’on observe dans AudioSculpt, ne représente donc pas le « vrai »
spectre du signal mais sa convolution avec le spectre de la fenêtre d’analyse. Il en résulte
deux principaux défauts :

▪ - un élargissement des pics d’autant plus grand que le lob principale de H(f) est
large.
▪ - un ajout de bruit de fond d’autant plus important que les lobs secondaires de
H(f) sont hauts.

Lorsque AS effectue une FFT, il n’utilise pas directement les échantillons du signal. La p Le
choix de la fenêtre d’analyse h(t) (donc de son spectre H(f) ) va donc minimiser ou augmenter
ces défauts

Voici les quatre principales fenêtres d’analyse h(t), leur spectre H(f) et leurs effets sur
le résultat de la FFT.

▪ La fenêtre rectangulaire est un simple fenêtrage, sans multiplication de


l’amplitude du signal. Le résultat est un spectre avec un bruit de fond important et
inexploitable. Cela justifie l’utilisation d’autres types de fenêtre nous permettant
d’être plus proche du « vrai » spectre du signal.
▪ Les fenêtres de hanning et blackman sont très proches. Elles ont en commun le
fait de multiplier le signal par zéro à ses extrémités. Blackman étant moins large
dans le domaine temporel, son spectre est plus large que celui de hanning dans
le domaine fréquentiel. Il en résulte que blackman élargie davantage les pics que
hanning mais ajoute moins de bruit de fond que cette dernière.
• En conséquence, hanning sera adaptée pour analyser des sons graves
(ex : violoncelle) c’est à̀ dire dans le cas où il est nécessaire de ne pas
trop élargir les pics afin de pouvoir correctement séparer les partiels dans
le bas du spectre.
• On utilisera blackman dans le cas de sons plus aigüs (ex : soprano)
pour diminuer le bruit de fond dans la mesure ou l’élargissement des pics
n’empêchera pas de distinguer les différents partiels.
▪ La fenêtre de hamming ne multiplie pas le signal par zéro aux extrémités. Cette
fenêtre élargie peu les pics mais ajoute beaucoup de bruit de fond par rapport
aux autres fenêtres d’analyse. Elle est moins utilisée que les autres fenêtres.

Voici un tableau qui récapitule les qualités et défauts des fenêtres d’analyses

Fenêtre Meilleur pour ce Résolution Absence de Précision de


type de signal fréquentielle bruit de fond l’amplitude

Blackman Aléatoire ou Mauvaise Excellente Bonne


périodique
Hanning Aléatoire Bonne Bonne Moyenne
Hamming Aléatoire Bonne Moyenne Moyenne

Vous aimerez peut-être aussi