Académique Documents
Professionnel Documents
Culture Documents
1 Analyse de la parole
1. Comment peut-on distinguer les différentes voyelles sur un spectre ou un spectrogramme ?
2. Quel est l’intérêt de la représentation cepstrale lors de l’analyse du signal pour la recon-
naissance de la parole ? et à quoi sert l’échelle Mel ?
3. Lors de l’analyse du signal de parole et de l’extraction des paramètres MFCC, quelle est la
durée typique de la fenêtre d’analyse et pourquoi ?
4. A quoi servent les coefficients différentiels dans un système de reconnaissance de la parole ?
5. Quelles informations peuvent être extraites de la hauteur moyenne de la fréquence fon-
damentale (F0 ) ? de la variation de F0 en fin de phrase ? enfin des variations de F0 en
général ?
3 Vérification du locuteur
On dispose de deux systèmes A et B de vérification du locuteur. Suite à une évaluation des
performances, on recueille les résultats suivants :
— le système A accepte 10% d’imposteurs et rejette 20% de bons locuteurs ;
— le système B accepte 30% d’imposteurs et rejette 5% de bons locuteurs.
Peut-on dire quel système est le meilleur ? argumentez et proposez si nécessaire des tests complé-
mentaires.
1
4 Modélisation statistique du langage
1. Soit une séquence de mots W = w1,K = w1 w2 ...wK extraite du vocabulaire V . Supposons
que l’on choisisse d’estimer la probabilité de la séquence W par
Y
P (W ) = P (wi |wi−1 . . . wi−n+1 )
i
Comment s’appelle un tel modèle ? Explicitez les hypothèses faites. Quel ordre n est-il
classiquement utilisé ?
2. Pourquoi les mots hors vocabulaire posent-ils un problème ? Quelles sont les solutions pos-
sibles ?
3. Quel est l’intérêt des approches par réseau de neurones pour la modélisation statistique du
langage ?
4. Voici un extrait du journal Le Monde :
le livre de Bud et Ruth Schultz montre que la meilleure des démocraties
part inéluctablement à la dérive sans une vigilance de tous les instants
(a) à votre avis, quelles normalisations ont été réalisées à partir du texte initial et pourquoi ?
(b) sachant que le texte contient 168 mots, donnez sous forme de fraction la probabilité
estimée des unigrammes P(’de’), P(’la’) et P(’dans’) et des bigrammes P(’la’|’de’) et
P(’la’|’dans’).
(c) de manière générale, quels types de mots sont les plus frequents dans les journaux ? et
les moins fréquents ?