Académique Documents
Professionnel Documents
Culture Documents
La comunicacin oral
Qu es la voz?
Onda de sonido (onda de presin)
Producida por el aparato fonador
Utilizada para comunicacin (para
transmisin de mensajes)
Procesamiento de voz
Anlisis de voz
Codificacin y comprensin de voz
Sntesis de voz
Reconocimiento automtico de voz
Reconocimiento y verificacin de
locutores
Deteccin de patologas
Diseo de ayudas para la audicin
Variabilidad de las
seales de voz
40 ms correspondientes
al fonema /a/
Produccin de sonido:
Fonemas sonoros: vibracin cuerdas vocales
Fonemas sordos: flujo turbulento
Fonemas oclusivos: obstruccin + apertura
Formantes
Formantes: resonancias del tracto vocal
Por las dimensiones y la velocidad de
propagacin del sonido, aparece en
promedio 1 formante por cada kHz
El tracto vocal filtra la onda glotal: amplifica
cada componente de frecuencia con una
determinada ganancia
8
u(L,f) / uG(f)
10
11
12
Modelo acstico de
produccin de voz
Excitacin
Fonemas sonoros
Fonemas sordos
Fonemas oclusivos
13
14
Caractersticas de la voz
Excitacin:
Formantes:
Cavidad buco-nasal
Envolvente espectral
Caractersticas de la voz
Excitacin:
TONO
Formantes:TIMBRE
Cavidad buco-nasal
INTENSIDAD
Envolvente espectral
Modo de articulacin
Vocales
Consonantes
Lugar de articulacin
Vocales
Consonantes
17
Clasificacin de vocales
Modo de articulacin (formante 1)
Cerradas (i,u)
Medias (e,o)
Abiertas (a)
Formantes 1 y 2 en vocales
3000
2500
2000
/e/
/i/
1500
1000
500
200
/a/
/u/
300
/o/
400
500
600
700
800
900
1000
20
Transformada de Fourier
Transformada (FT):
Cambio de representacin
Misma informacin (otra representacin)
Existe transformada inversa (FT-1)
Transforma seal compleja en seal
compleja:
Im(z)
r
y
Re(z)
22
23
24
25
26
27
Filtrado
excitacin
seal filtrada
filtro
29
30
31
32
33
34
35
Transformada Fourier:
Resumen
36
DFT y FFT
Transformada discreta de Fourier (DFT)
Transformada rpida de Fourier (FFT)
La seal de voz
/sal/
38
La seal de voz
/s/
/a/
/l/
39
Estacionariedad de la voz
La seal de voz es estacionaria a trozos
Durante la pronunciacin de un fonema es quasiestacionaria
Velocidad cambios tracto vocal
Velocidad cambios cuerdas vocales
Estacionaria durante 20 40 ms
Velocidad de pronunciacin: 5-20 fonemas / seg
Anlisis de trozos de voz estacionarios:
ventanas
40
41
42
Espectro de consonantes
sonoras
/m/
/l/
/n/
/y/
//
/R/
45
Espectro de consonantes
fricativas
/s/
/z/
/sh/
/f/
/ss/
/j/
46
Fonemas no estacionarios
Fonemas estacionarios:
vocales: /a/ /e/ /i/ /o/ /u/
consonantes sonoras: /l/ /y/ /R/ /m/ /n/ //
consonantes fricativas: /s/ /sh/ /ss/ /z/ /f/ /j/
Fonemas no estacionarios:
Plosivas sordas: /p/ /t/ /k/
Plosivas sonoras: /b/ /d/ /g/
Otras consonantes: /ch/ /r/
47
Espectrograma
(representacin tiempo - frecuencia)
48
Espectrograma
(representacin tiempo - frecuencia)
m b o i a kom p r a R
pa n
49
50
Informacin relevante
de la seal de voz:
Para reconocimiento de voz:
Envolvente espectral (formantes)
Evolucin temporal de los formantes
Informacin espectral de tiempo corto
Informacin complementaria:
Tono fundamental
Estructura fina del espectro
51