Vous êtes sur la page 1sur 3

Comment fonctionne Shazam ?

1 : Qu’est ce que c’est Shazam ?


Shazam est un logiciel permettant de reconnaître une musique à partir du micro,
généralement peu qualitatif d’un téléphone portable, malgré des bruits parasites tel le
moteur d’une voiture ou le bruit d’une foule. Cette capacité a toute épreuve lui a valu un gros
succès et plus d’un milliard de téléchargement.

On peut donc être amené à se demander comment Shazam arrive à reconnaître un


morceau parmi des millions de musique en seulement une dizaine de secondes d’écoute de
musique.

2 : Fonctionnement théorique
Pour Shazam, chaque chanson a un code qui lui est propre. Quand on demande à
l’application de reconnaître un morceau, elle décompose le son et le transforme en code.
Elle le compare ensuite à ceux présents dans sa base de données et trouve le résultat
correspondant.

Pour créer ces codes, l’application délaisse la majeure partie de la chanson et se


concentre uniquement sur les passages intenses. Pour ce faire, l’algorithme utilise un
spectrogramme. Ce graphique à trois dimensions donne l’intensité d’un son en fonction de
sa fréquence et de son instant t dans le morceau.

Temps t (en seconde)


Ce qui nous donne : en ordonnées, le temps (de zéro jusqu’à la fin du morceau) et
en abscisses, la fréquence, de 20 Hz à 20 kHz (spectre audible de l’oreille humaine). La
troisième dimension est représentée par un code couleur servant à indiquer le volume (ici, le
rouge symbolise un fort volume et le bleu l’inverse).

Nous nous sommes inspiré du site statista.com

3 : Fonctionnement pratique et
expérience
Nous allons donc procéder à la première expérience, nous allons donc essayer de
faire reconnaître la musique Despacito par Luis Fonsi. Cette musique est reconnue au bout
de 4 secondes. Cependant lorsque l’on répète les essais de reconnaissance, on remarque
qu’une autre musique, Devagar de Jefferson berté est reconnue par l’application Shazam.
On décide donc de comparer les pistes audio des deux musiques à l’aide du logiciel
Audacity.

Capture d’écran de la reconnaissance Capture d’écran de la reconnaissance

de la musique despacito depuis Shazam de la musique Devagar depuis Shazam


Comparaison des pistes audios des deux musiques:

Capture d’écran représentant la piste audio de la musique Despacito de Luis Fonsi depuis à
l’aide du logiciel Audacity

Capture d’écran représentant la piste audio de la musique Devagar de Jefferson berté


depuis le logiciel Audacity

Suite à cette comparaison, on observe que les deux pistes audio se ressemblent fortement

On en conclut donc que shazam confond les deux musiques en raisons de leur fortes
ressemblances

4 : Conclusion
Cette expérience nous prouve donc que shazam est basée sur la reconnaissance de
la musique par des points de fréquence caractéristiques. Si ceux-ci sont similaires entre
deux musiques, alors l’application aura du mal à les différencier.

Ainsi, on sait que seules les musiques qui correspondent parfaitement à la version
contenu dans les banques de données de Shazam peuvent être reconnues. Une personne
qui va chanter Despacito ne pourra pas être reconnue par l’application. On peut exporter
cela au concert: si shazam reconnaît le morceau joué par l’artiste, alors vous pouvez être
certains que l’auteur fait du playback, et que ce n’est pas une version unique jouée en live.

Vous aimerez peut-être aussi