Procesamiento de Senales Audio 2013 2

PROCESAMIENTO Y TRANSMISIN DE SEALES DE VOZ Y AUDIO
CURSO DE PROCESAMIENTO Y TRANSMISION III INGENIERIA DE TELECOMUNICACIONES U. DE ANTIOQUIA 2013
Aplicaciones de la seal de audio en los sistemas de telecomunicacin

Seales de Voz <3.5 Khz. (espectro restringido a la voz humana)
Redes y sistemas de telefona fija y mvil conmutada Sistema de transmisin y grabacin de mensajes de voz Redes privadas de transmisin de voz.
Seales de Audio 20-20000 hz. (voz humana natural, msica, espectro auditivo).
Sistemas de transmisin y grabacin de voz de alta calidad (7khz) Radiodifusin Sonora Anloga (AM, 9.5 khz; FM 12 khz) Radiodifusin Digital 20-20000 hz. ( IBOC, DAB, ) Canal sonoro en TV anloga y digital Sistemas de transmisin estereofnica y multicanal. Sistemas de grabacin de audio anlogo y digital
Conceptos bsicos del sonido

Mechanical wave. Frequency represents the number of periods in a second (measured in hertz, cycles/second) Human hearing frequency range: 10 Hz - 20 kHz (voice and audio), voice is about 500 Hz to 2 kHz. Amplitude of a sound is the measure of displacement of the air pressure wave from its mean.
8/23/2013
Conceptos bsicos del sonido

Fenmeno que conlleva la propagacin de una onda elstica . (perturbacin de tensin). Son convertidas a ondas mecanicas por el oido y percibidas por el cerebro) Se caracterizan po su intensidad ( amplitud), contra el tiempo, y rango de frecuencia El oido humano percibe los cambios de intensidad en el tiempo de un sonido. Espectro de audio es el rango de frecuencias posible de percibir por el oido humano.
8/23/2013
Importancia de la seal y su procesamiento previos a la transmisin: la codificacin de la fuente.

La codificacin de la fuente cumple un papel determinante en la eficiencia y calidad de la transmisin de seales, al transformar la seal original en secuencias binarias optimizadas para su transmisin o grabacin. En la codificacin del sonido son determinantes la redundancia y las limitaciones de percepcin del oido humano. Los procesos realizados se fundamentan en la Teora de la Informacin y el tratamiento electrnico de seales digitales
Importancia de la seal y su procesamiento previos a la transmisin: acciones a realizar en la codificacin de la fuente.

Digitalizacin de la seal sonora anloga: voz / audio. (formateo de la fuente) Optimizacin de la senal para su tratamiento digital: eliminacin de redudancia y limitaciones de percepcin en el receptor. (codificacin ptima y compresin). Adicin de tcnicas de deteccin y/ correcin de errores en la seal banda base. Acondicionamiento de las tramas de bits a normas y estndares predefinidos: homologacin Resultado: CODEC de Voz
Calidad de un codificador de fuente

Un sistema de procesamiento de fuente consta de:
Codificador y decodificador
Codificador y decodificador pueden ser:

Asimtricos
El codificador suele ser ms complejo y lento que el decodificador (Ej.: Vdeo por demanda)
Simtricos
Coste computacional similar (Ej: Videoconferencia).
Con prdidas (lossy compression) o irreversible

Adecuada para medios continuos (audio y vdeo). Mayores tasas de compresin.
Sin prdidas (lossless compression) o reversible:

Ficheros de datos, imgenes mdicas, etc.
7
Factores en el diseo de un codificador

Calidad de la seal
- BER (Bit Error Ratio) - SNR (Signal/Noise) - MOS (Mean Opinion Score)
Eficiencia
- Tasa de compresin
Retardo
Complejidad
- Espacio de memoria - Potencia (mW) - Operaciones/Seg.
8
Caracteristica de una seal de audio

Una seal de audio no es ms que una onda acstica (variaciones de presin del aire) La seal de audio es unidimensional (tiempo) El micrfono transforma las ondas acsticas que lo golpean, en seales elctricas (niveles de voltaje) El odo es muy sensible a las variaciones de sonido de corta duracin (ms) al contraro a la respuesta del ojo humano. La relacin de dos sonidos A y B se mide en decibelios:
dB=20 log10 (A/B).
La intensidad de un sonido A se mide en decibelios tomando como referencia el menor sonido audible.
0 dB: Menor sonido audible La seal de referencia (B) es una onda senoidal a 1khz que provoca una presin de 0.0003 dinas/cm2 A y B son amplitudes (si fueran potencias sera 10 log10 (A/B)) 50 dB: Conversacin normal. 9 120dB: Umbral del dolor.
Espectro acstico de la voz y la msica

Lmite superior de la radio FM Lmite superior de la radio AM
Canal telefnico
0 dB MSICA
Rango dinmico de la voz
Potencia relativa
-20 dB
VOZ Rango dinmico de la msica
-40 dB Ruido
300 Hz
-60 dB
3,4 KHz
10 Hz
100 Hz
1 KHz
10 KHz
100 KHz
Frecuencia
Ampliacin Redes 2-10
Calidad de una seal de audio

Voz (telefona) Se define para los servicios de telefona digital. Estndar G.711 (ITU): Codificacin logartmica. Japn y USA: Transformacin -law. Resto: Transformacin A-law. (+) Parmetros: Seal de audio de 3.5 KHz (BW). Sf = 8 KHz 8 bits/muestra. Tasa de bits: 64Kbps (N-ISDN). Otras tcnicas de codificacin y compresin: DPCM y ADPCM, G.72x, GSM, LPC y CELP etc
11
Calidad de una seal de audio

CD-Digital Audio. Calidad de audio superior: Sonido Hi-Fi estereofnico. Utiliza una codificacin lineal. Las diferencias de amplitud deben ser respetadas por igual. Parmetros: Seal de audio de 20 KHz (BW). Sf = 41.1 KHz 16 bits/muestra. Soporta estereofona (dos canales) Tasa de bits: 1.411 Mbps. Otros estndares utilizan esta calidad de audio: DAT (32.4 y 48 KHz), MPEG (32, 44,1 y 48 KHz), DVI
12
Parmetros especficos
Tasa de bits (throughput): Audio sin comprimir: Calidad telefnica: 64Kbps. Calidad CD: 1.411 Mbps. Audio comprimido: Calidad telefnica: 32, 16, 4 Kbps (ADPCM, CELP) Calidad CD: 192 Kbps. (MPEG audio) Retardo de trnsito (aplicaciones interactivas) Conversacin: Telefona: < 25 ms (evitar eco). 100 a 500 ms (sensacin de tiempo real).
13
Clasificacin algoritmos de compresin

Por su fidelidad:
Sin prdidas (lossless): usada para datos (ej.: norma V.42bis en mdems, ficheros .zip) Con prdidas (lossy): usada normalmente en audio y vdeo. Inaceptable para datos. Eliminan informacin no perceptible por el hombre.
Por su velocidad relativa de compresin/descompresin:

Simtricos: necesitan aproximadamente la misma potencia de CPU para comprimir que para descomprimir Asimtricos: requieren bastante ms CPU para comprimir que para descomprimir.
En multimedia se suelen utilizar algoritmos lossy Siempre se necesita ms CPU para comprimir que para descomprimir Generalmente los algoritmos que consiguen mayor compresin gastan ms CPU.
14
Tipos de algoritmos de compresin de audio (lossy )

Generales (aptos para todo tipo de sonidos):
Psicoacstica. Ej.: MPEG Adaptativa Diferencial. Ej.: ADPCM (Adaptative Differential Pulse Code Modulation))
Especficos para voz. Ej.:

CELP (Code Excited Linear Prediction) CS-ACELP (Conjugate-Structure Algebraic Code Excited Linear Prediction LPC GSM
Especficos para la msica. Ej.: MIDI (Musical Instrument Digital Interface)
Codificadores de voz: clasificacin

Los codificadores de voz pueden dividirse en 3 grupos:
Codificadores de forma de onda Conservan la forma de onda de la seal Calidad alta: 16 64 kbps
Vocoders (codificadores paramtricos, sintetizadores) Explotan la naturaleza de la seal de voz para reducir la rata de bits (BW del canal digital) Calidad baja/media: 1.2 4.8 kbps
Codificadores hbridos Mezcla de los dos anteriores Calidad media/alta: 2.4 16 kbps
Codificadores de forma de onda

Estos codificadores pueden clasificarse en dos grupos segn el dominio en el que operan:
En el dominio del tiempo: PCM, LogPCM, DPCM, ADPCM, etc En el dominio de la frecuencia: Codificacin por subandas Codificacin por transformada
Audio Encoding (1)
Audio Waves Converted to Digital
8/23/2013
electrical voltage input sample voltage levels at intervals to get a vector of values: (0, 0.2, 0.5, 1.1, 1.5, 2.3, 2.5, 3.1, 3.0, 2.4,...) A computer measures the amplitude of the waveform at regular time intervals to produce a series of numbers (samples). The ADC process is governed by various factors such as sample rate and quantization: binary number as output
18
Succeeding with Technology
19
Audio Encoding
Sampling Rate: rate at which a continuous wave is sampled (measured in Hertz) Examples: CD standard - 44100 Hz, Telephone quality - 8000 Hz The audio industry uses 5.0125 kHz, 11.025 kHz, 22.05 kHz, and 44.1 kHz as the standard sampling frequencies. These frequencies are supported by most sound cards. How often do you need to sample a signal to avoid losing information?
8/23/2013 20
Audio Encoding
Quantization (sample precision): the resolution of a sample value.
Samples are typically stored as raw numbers (linear PCM format) or as logarithms (u-law or Alaw) Quantization depends on the number of bits used measuring the height of the waveform Example: 16-bit CD quality quantization results in over 65536 values
8/23/2013 21
Teorema de muestreo de Nyquist (1924)

La digitalizacin de una seal analgica ha de hacerse muestreando al menos al doble de su ancho de banda. Ejemplos:
Canal telefnico: 3,1 KHz Muestreo 8 KHz Audio HiFi: 20 KHz Muestreo 44,1 KHz
Modulacin por Cdigo de Pulsos (PCM)

infinito nmero de valores de las muestras
n valores posibles
cdigo digital de m bits (n=2m) informacin digital binaria
seal analgica f(t)
MUESTREO
CUANTIZACIN
CODIFICACIN
frecuencia de muestreo n valores posibles
informacin digital binaria
DECODIFICACIN
seal analgica f(t)
De acuerdo a la manera como se realice la codificacin se puede tener tambin:
Modulacin DELTA (MD)

Modulacin PCM Diferencial Adaptable (ADPCM)
Telecomunicaciones Conversin de Seal Analgica a Seal Digital
Conversin analgico-digital: muestreo de la seal

Canal telefnico Ancho de banda 300 a 3.400 Hz
Proceso de muestreo 8.000 muestras/s (captura de 0 a 4 KHz)

Muestras
Seal analgica original

Seal muestreada a 8 KHz
Conversin analgico-digital PCM (Pulse Code Modulation)

Ruido (o error) de cuantizacin
Digitalizacin
La seal digital se ha de ajustar a uno de los valores preestablecidos de amplitud

El error de cuantizacin depende del nmero de bits por muestra. En telefona se utilizan 8 bits por muestra, lo cual da 28 = 256 posibles valores de amplitud.
Seal muestreada (valores continuos)
Seal digital (valores discretos)

100100111011001
Audio digital no comprimido

Tipo Frec. de Muestreo (KHz) 8 44,1 Ancho de banda (KHz) 4 22,05 Bits por muestra 8 16 Relacin S/R (dB) 48 96 Canales Caudal
Sonido telefnico (G.711) CD-DA (Compact Disc Digital Audio)
1 2
64 Kb/s (RDSI) 1,411 Mb/s (CD-ROM 1x)
DVD-Audio
192 (mx.)
96
24 (mx.)
144 (mx.)
9,216 Mb/s
Ejemplo de Compresin lossy : ADPCM (Adaptative Diferential PCM)

PCM:
115 118 120 118 115
110
Rango de amplitudes: 127
8 8 8 8 8 8
En PCM la amplitud de cada muestra se representa con 8 bits, independientemente del resto.
ADPCM:
110
2 -2
-3
Rango de amplitudes: 7
8 4 4 4 4 4
En ADPCM de 32 Kb/s solo la primera muestra se representa con 8 bits. El resto se representa con 4. Cada muestra est referida a la anterior.
Comunicacin entre telfonos analgicos

Enlace de central final Bucle de abonado Cdec Enlace de central final
Enlaces entre centrales de facturacin
Bucle de abonado Cdec
Central Telefnica final

Central Telefnica de facturacin
Central Telefnica primaria Central Telefnica de facturacin
Central Telefnica final
Seal Analgica (300-3.400 Hz)

Seal Digital (64 Kb/s)
Seal Analgica (300-3.400 Hz)
Comparacin de codecs
Fuente Simulacin de canal Limitacin Codec X
1 2 3 4 5
El tren es un medio de transporte cmodo.

MOS 5 4 3 Calidad voz Excelente Buena Regular Nivel de distorsin Imperceptible Apenas Perceptible, no desagradable Perceptible, levemente desagradable
1 2 3 4 5
2
1
Pobre
Insatisfactoria
Desagradable, pero aceptable

Muy desagradable. Inaceptable
MOS: Mean Opinion Score

MOS de 4.2 = Calidad ptima
Vocoders
Se basan en el modelo simplificado de produccin de voz Explotan las caractersticas de la voz Codificador:
Calcula los parmetros del modelo Transmite los parmetros al decodificador
Decodificador:
Reconstruye la seal de voz a partir de los parmetros
Permiten tasas binarias muy bajas Consiguen inteligibilidad pero no naturalidad.
Voz
Anlisis
Parmetros
Sntesis
Voz
Vocoders = Sintetizadores Modelamiento del tracto vocal
4.1.- Historia de los codificadores de voz

Wolfgang von Kempelen, 1791: Primer sintetizador de voz Mquina que reproduca fielmente la anatoma del aparato fonador humano
Modelamiento del tracto vocal -LD-CELP
Low-Delay CELP (Backward-Adaptive) Excitation VQ* Codebook LPC Synthesis Filter
Input Speech 64 kbit/s + Gain Perceptual Weighting Minimum MSE 16 kbit/s Output VQ Index
Gain Adaptation
Predictor Adaptation
* VQ= Vector Quantizer
Codificadores hbridos
Combinan las tcnicas de los codificadores de forma de onda con las de los vocoders Intencin: mejorar la calidad empleando bitrates bajos Forma de mejorar la calidad: Mejorar el modelo de la fuente Sustituir el modelo de la fuente Enviando el residuo (o parte de el) de alguna forma
A algunos de ellos se les conoce como codificadores de Anlisis por sntesis
EL SISTEMA DE COMUNICACIN DIGITAL
Compresion de Seales de Audio MODELO CELP DE GENERACIN DE LA VOZ
Codec de alta compresin optimizado para la voz humana
Se basan en un diccionario de fonemas. Estos codecs no son aptos para la msica u otros sonidos
Algunos formatos de audio digital

Formato PCM (G.711) ADPCM (G.721) SB-ADPCM (G.722) MP-MLQ (G.723.1) ADPCM (G.726) Frec. Muestreo (KHz) 8 8 16 8 8 8 8 Canales 1 1 1 1 1 1 1 Caudal por canal (Kb/s) 64 32 48/56/64 6,3/5,3 variable 16/24/32/40 16/24/32/40 16 Uso Telefona Telefona Vdeoconferenc. Telefona Internet Telefona Telefona Telefona/Videoc.
Bajo Retardo
E-ADPCM (G.727) LD-CELP (G.728)
CS-ACELP (G.729)
RPE-LTP (GSM 06.10) CELP (FS 1016)
8
8 8
1
1 1
8
13,2 4,8
Telefona Internet
Telefona GSM
LPC-10E (FS 1015)

CD-DA / DAT MPEG-1 Layer I
8
44,1/48 32/44,1/48
1
2 2
2,4
705,6/768 192-256 variable Audio Hi-Fi
Elevado retardo
MPEG-1 Layer II
MPEG-1 Layer III (MP3) MPEG-2 AAC
32/44,1/48
32/44,1/48 32/44,1/48
2
2 5.1
96-128 variable
64 variable 32-44 variable Hi-Fi Internet Hi-Fi Internet
Compresion de Seales de Voz para telefonia Estndares

64 kbit/s PCM 32 kbit/s ADPCM 64 kbit/s 7 KHz voice 16, 24, 32 & 40 kbit/s ADPCM 16, 24, 32 & 40 kbit/s E-ADPCM 16 kbit/s LD-CELP 8 kbit/s ACELP ITU -T Rec. G.711 (1960) ITU -T Rec. G.721 (1984) ITU -T Rec. G.722 (1990) ITU -T Rec. G.726 (1990) ITU-T Rec. G.727 (1990) ITU-T Rec. G.728 (1994) ITU-T Rec. G.729 (1996)
Compresin vs calidad
64 56 48
PCM (G.711)
Caudal (Kb/s)
40 32 24 16 8 0 0 1 2 3 4 5
LPC 4.8 ADPCM 24 (G.725) ADPCM 16 (G.726) CS-ACELP (G.729a) LDCELP 16 (G.728) CS-ACELP 8 (G.729) MP-MLQ 6,4 (G.723.1) ADPCM 32 (G.726) Normalmente para tener alta compresin con calidad hay que usar los chips llamados DSP (Digital Signal Processor)
MOS (Mean Opinion Score)

Medidas subjetivas de calidad

MOS:
Excelente
Buena
CELP
Codificacin de Forma de Onda
Codificadores
Hbridos
PCM G711 (a / u) GSM ADPCM G721, G726
Calidad
Aceptable
Codificacin Paramtrica
Baja
Vocoder LPC
(VOCODERS)
2.4
16
32
64 kbps
Tasa binaria
Medidas subjetivas de calidad
MOS: Mean Opinion Score Es un test de calidad

Puntuacin 5 4 3 Calidad Excelente Buena Aceptable Nivel distorsin Imperceptible Perceptible, pero no molesto Perceptible y ligeramente molesto
2
1
Pobre
Insatisfactoria
Molesto
Muy molesto
Codificacin de la voz: Recomendaciones ITU

G.701: Digitalizacin PCM G.711: Codificacin logartmica -law y A-law G.721: ADPCM
Muestreo a 8 Khz, muestras de 8 bits: 64 Kbps Utiliza diferencias de 4 bits: tasa de bits final 32 Kbps
G.722: Sub-Band ADPCM.

Muestreo a 16 Khz, muestras de 14 bits: 224 Kbps Codifica seales de audio de hasta 7 KHz (por el muestreo) Descompone la seal en dos bandas de 4 KHz. A cada banda le aplica ADPCM. Tasas de bits finales: 48, 56 y 64 Kbps.
G.723, G.726, G.727:

42
Variantes del G.721 (ADPCM).
Estndares para telefona:

G.711a y G.711u: LogPCM a 64kbps G.721: ADPCM 32 kbps G.722: Subband ADPCM a 48, 56 y 64 kbps G.723.1: CELP a 5.3 y 6.3 kbps G.726: ADPCM a 16, 24, 32 y 40 kbps G.728: LD-CELP (Low Delay) a 16 kbps G.729: CS-ACELP a 8 kbps GSM 6.10: RPE-LTP a 13 kbps
Estndares
Organismos de estandarizacin: ISO: International Standards Organization
ITU: International Telecommunication Union ETSI: European Telecommunication Standards Institute
Procesos de codificacin hbrida

LPC (Linear Predictive Coding) US-FS-1015

Define un modelo analtico del aparato fonador Reduce cada segmento de audio a los parmetros del modelo que ms se aproximan al original. El decodificador recoge estos parmetros y sintetiza la voz correspondiente. LPC-10E puede bajar hasta 2.4 Kbps. Es una versin mejorada del LPC. Diferencia: Utiliza un code-book con secuencias predefinidas para aplicarlas a cada frame de audio, eligiendo aquella que ms se aproxima al original. Adems, calcula los errores cometidos. Se envan los parmetros y la versin comprimida de los errores. Tasa de bits de hasta 4.8 Kbps (calidad similar a ADPCM G.721 a 32 Kbps)
CELP (Code Excited Linear Prediction) US-FS-1016.

Variantes CELP:
GSM, VSELP, LD-CELP, ITU G.729, QCELP, MELT, etc.
45
Tabla resumen de algunos codecs de audio.

Ao 1972 1976 1984 1990 1991 1991 1992 1992 1993 1995 1995 1995 1996
46
Calidad telefnica
Tasa de bits (Kbps) 64 2.4 32 4.15 13 4.8 16 8 1-8 8 6.3 5-6 2.4 Nombre PCM (PSTN) LPC-10 G.721 ADPCM INMARSAT GSM CELP (US 1016) G.728 (LD-CELP) VSELP QCELP G.729 G.723.1 Half-Rate GSM New LPC
MOS 4.4 2.7 4.1 3.2 3.6 3.2 4 3.5 3.4 4.2 3.98 3.4 3.3
Codificacin de Audio
Sistemas de codificacin de forma de onda en el tiempo: - PCM, Lineal, sin compresin, generalmente orientados a la grabacin de alta fidelidad. Ej. CD de audio Sistemas de codificacin con compresin. Codificacin de forma de onda en el dominio de la frecuencia. Orientados a la transmisin con calidades similares al CD, pero rata de bits inferiores y variables. Radiodifusin digital, Televisin digital, sistemas estereofnicos y multicanal.
Sistemas de grabacin
Codificacin de Audio
Generalmente a ms compresin menor calidad y mayor consumo de CPU. Los sistemas de caudal variable (MPEG, G.723.1) son los que mejor se adaptan a redes sin reserva de caudal constante, como el modelo DiffServ de Internet o los servicios UBR o ABR de ATM. (Available Bit Rate (ABR) and
Unspecified Bit Rate (UBR))
Los sistemas de caudal constante (G.711, G.722, G.729) son ms adecuados para servicios orientados a conexin (RSVP o circuitos CBR de ATM, por ejemplo). CBR (Constant Bit
Rate)
La compresin MPEG es la ms eficiente y da mayor calidad, pero consume mucha CPU e introduce mucho retardo por lo que no puede emplearse en aplicaciones interactivas (vdeoconferencia o telefona).
Compresin MPEG
Estndar de la Organizacin Internacional de Estandarizacin (ISO) Generado por el grupo de trabajo Moving Pictures Experts Group (MPEG) Objetivo: Codificacin de video y audio para medios digitales de almacenamiento hasta cerca de 1.5 Mb/s Fases: MPEG-1, MPEG-2, MPEG-4, MPEG-7
Estndar MPEG-1 MPEG-1 es la primera fase del trabajo del grupo MPEG, cuyo producto es el estandar ISO/IEC 11172 adoptado a finales de 1992.
MPEG-1 se divide en 5 partes: 1: Sistemas 2: Video 3: Audio 4: Especificacin de Pruebas 5: Implementacin en Software
Compresin MPEG-1 para Audio ISO/IEC 11172-3

Seales de audio monofnicas y estereofnicas. Basado en un modelo psicoacstico que considera las caractersticas auditivas del ser humano. Tres modos de operacin (Layers):
Velocidad (Stereo) Factor de Compresin
kbps
Layer I Layer II Layer III
384 192 128
4 8 12
Principios de Operacin de MPEG-1
Codificacin Perceptiva Codificacin en el Dominio de la Frecuencia Conmutacin de Ventana
Asignacin Dinmica de Bits
Codificacin Perceptiva y Enmascaramiento de Sonidos El odo humano se comporta como si tuviera filtros internos pasa-banda (bandas crticas) Fenmeno de enmascaramiento: un sonido deja de ser escuchado (percibido) en presencia de otro de mayor intensidad. Sonido enmascarador: inhibidor. Sonido enmascarado: inhibido El enmascaramiento es ms notorio cuando los sonidos simultneos pertenecen a una misma banda crtica.
Tambin se presenta enmascaramiento cuando los sonidos se producen en un intervalo de tiempo pequeo.
Caractersticas Generales de MPEG-1 para Audio Frecuencias de Muestreo de 32, 44.1 y 48 KHz
Subdivisin de la seal en 32 subbandas igualmente espaciadas a travs de un banco de filtros. Filtros de subbanda FIR de 512 coeficientes
Ancho de banda de cada subbanda: fmuestreo/64
MPEG-1 Layer I Velocidad de 32 kbps (mono) a 448 kbps (stereo)

Anlisis frecuencial con FFT de 512 puntos Cada seal de subbanda es de una longitud de 12 muestras
La cuantizacin se realiza en base a la velocidad deseada, fija.
MPEG-1 Layer II Velocidad de 32 kbps (mono) a 384 kbps (stereo)

Anlisis frecuencial con FFT de 1024 puntos Cada seal de subbanda es de una longitud de 36 muestras
La cuantizacin se realiza en base a la velocidad deseada, fija.
MPEG-1 Layer III

Velocidad de 32 kbps (mono) a 320 kbps (stereo)
Anlisis frecuencial con FFT de 1024 puntos Se aplica la transformada de coseno discreto modificada (MDCT) de 6 u 8 puntos a cada seal de subbanda, obtenindose el equivalente de hasta 576 componentes de frecuencia Se codifica la informacin de los coeficientes de la MDCT con Codificacin Huffman.
Codificacin con velocidad variable
Calidad CD
Estndares MPEG/audio (Estndar ISO)
MPEG (Moving Pictures Expert Group) MPEG/audio ofrece altos ndices de compresin, manteniendo la calidad del audio del stream original. Son algoritmos de compresin con prdidas*.
MPEG-1 /audio
Muestreos: 32, 44.1 y 48 KHz. Soportan uno o dos canales (diferentes modos de operacin). Tasas de bits: 32 a 256 Kbps/canal. Indices de compresin: 2.7 a 24.
MPEG-2 /audio
Compatibilidad hacia atrs con MPEG-1. Diseado para sistemas de sonido multicanal, DVD, Sonido TV.
58
MPEG-1 audio.
El stream comprimido puede incluir informacin auxiliar (acceso aleatorio, avance y retroceso rpido, CRC, etc.) Arquitectura de tres niveles
MPEG-1 Nivel I:
El ms sencillo. Tasa de bits 192 Kbps/canal. Aplicaciones: Philips DCC
MPEG-1 Nivel II:

Complejidad media. Tasa de bits 128 Kbps/canal. Aplicaciones: DAB, CD-I, Vdeo CD.
MPEG-1 Nivel III:

El ms complejo. Ofrece la mejor calidad de audio con tasas de bits sobre 64 Kbps/canal. Est preparado para N-RDSI.
Existen codecs hardware de los tres niveles para aplicaciones de tiempo real.
59
La transmisin de seales de audio (audio broadcast)

Sistemas de radiodifusin Analgica: Estaciones AM, FM y FM estereofnica. Normas y procesos de transmisin.
Radiodifusin del sonido en TV analgica y Digital Radiodifusin Digital: Estndares mundiales. Estructura de transmisores y receptores. Radio en internet.
Media Player or Helper Application

Three main streaming media companies or products are:
RealPlayer (RealNetworks),
Media Player (Microsoft) and

QuickTime (Apple).
Three basic tasks of media players:

Decompression Jitter Removal Error Correction
61
DIGITAL TV BROADCASTING STANDARDS

Terrestrial Digital Video Broadcasting (DVB-T) - Region 1 system B. Advanced Television Systems Committee (ATSC) USA sys C
Integrated Services Digital Broadcasting (ISDB-T)- Japan sys A.

Digital Terrestrial Multimedia Broadcasting (DTMB) - China Other Standards Mobile TV (DVB-H, MediaFlo). Internet Protocol Television (IPTV) for 2 way interactive services.
Promoting Universal ICT Access
DIGITAL AUDIO BROADCASTING STANDARDS

Terrestrial Terrestrial Digital Audio Broadcasting (T-DAB) reg. 1 Digital Radio Mondiale (DRM) for HF radio broadcasting.
DTSB / ISBD-TSB (Terrestrial Digital Sound Broadcasting).

In Band On Channel (IBOC) USA standard for FM. Other Parameters Set Top Box with CA for signal access. MPEG 2 / MPEG 4 for compression.
TRANSITION MODELS
Transition from analogue to digital broadcasting can be mainly achieved on the end user part through two basic models namely; Use of STB
Reception for both VHF and UHF channels. Use of digital TV

TV receiver with built-in digital tuner for the reception of digital TV signals. You do not necessarily need an HDTV receiver.
ANALOGUE SYSTEMS
DIGITAL SYSTEMS
KEY PLANNING CONSIDERATION #1
What is HD Radio?
Hint: HD doesnt stand for anything
HD Radio=brand name Digital sidebands straddling the analog carrier Some RF energy on adjacent channels
In-Band / On-Channel = IBOC
Backwards-compatible
Download these slides: www.friedbagels.com/cbi/
Simple FM IBOC Transmission Topology All IBOC Gear at Transmitter Site diagram courtesy of The IBOC Handbook, page 401
FM IBOC Transmission Topology with Exporter and Exgine Modules diagram courtesy of The IBOC Handbook, page 405
FM IBOC Transmission Topology with Exporter & Exgine Modules, plus Importer diagram courtesy of The IBOC Handbook, page 413
What is HD Radio? (AM)

Also just bits & bytes, just 32kbps No multicasting PAD/PSD, just barely Improved audio quality
What is HD Radio? (FM)

Digital carriers = bits & bytes 96kbps std (+12 or +24 ext.hybrid or MP3 mode; More carriers closer to analog carrier = no work with 92kHz SCA) Multicasting (HD2, HD3HD7) PAD/PSD, iTunes Tagging, Downloadable Content, etc. 20kHz audio bandwidth No multipath interference or stereo hiss
Multicasting
Killer app Extra stations hidden in the signal Require an HD tuner to hear Subdivides 96kbps total
Ext.Hybrid is separate
What is Streaming Technology

A technique for transferring data such that it can be processed as a steady and continuous stream, client does not have to download the entire file to view it.
Data Network
Source
The portion in the buffer

The portion client is viewing
79
Advantages
It reduces download time
It provides steady service Slower systems can take advantage of streaming technology Provide service on demand
Applications are utilizing this technology are:

Streaming Video, IP telephony, Internet Radio, Distance learning, Videoconferencing, Interactive games and so on
80
Disadvantages
It is difficult to keep the service steady if the bandwidth is low
The maintenance of streaming server is relatively expensive
Packet loss may occur during the transmission
81
3 types of delivery methods of streaming media

Streaming Stored Audio and Video Streaming Live Audio and Video
Real-Time Interactive Audio and Video
82

Procesamiento de Senales Audio 2013 2

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Procesamiento de Senales Audio 2013 2

Transféré par

Droits d'auteur :

Formats disponibles

PROCESAMIENTO Y TRANSMISIN DE SEALES DE VOZ Y AUDIO

CURSO DE PROCESAMIENTO Y TRANSMISION III INGENIERIA DE TELECOMUNICACIONES U. DE ANTIOQUIA 2013

Aplicaciones de la seal de audio en los sistemas de telecomunicacin

Conceptos bsicos del sonido

Conceptos bsicos del sonido

Importancia de la seal y su procesamiento previos a la transmisin: la codificacin de la fuente.

Importancia de la seal y su procesamiento previos a la transmisin: acciones a realizar en la codificacin de la fuente.

Calidad de un codificador de fuente

Codificador y decodificador pueden ser:

Con prdidas (lossy compression) o irreversible

Sin prdidas (lossless compression) o reversible:

Factores en el diseo de un codificador

Caracteristica de una seal de audio

Espectro acstico de la voz y la msica

Rango dinmico de la voz

VOZ Rango dinmico de la msica

Calidad de una seal de audio

Calidad de una seal de audio

Clasificacin algoritmos de compresin

Por su velocidad relativa de compresin/descompresin:

Tipos de algoritmos de compresin de audio (lossy )

Especficos para voz. Ej.:

Especficos para la msica. Ej.: MIDI (Musical Instrument Digital Interface)

Ampliacin Redes 2-15

Codificadores de voz: clasificacin

Codificadores de forma de onda

Audio Encoding (1)

Audio Waves Converted to Digital

Succeeding with Technology

Teorema de muestreo de Nyquist (1924)

Ampliacin Redes 2-22

Modulacin por Cdigo de Pulsos (PCM)

cdigo digital de m bits (n=2m) informacin digital binaria

seal analgica f(t)

frecuencia de muestreo n valores posibles

informacin digital binaria

seal analgica f(t)

De acuerdo a la manera como se realice la codificacin se puede tener tambin:

Modulacin DELTA (MD)

Conversin analgico-digital: muestreo de la seal

Proceso de muestreo 8.000 muestras/s (captura de 0 a 4 KHz)

Seal analgica original

Seal muestreada a 8 KHz

Conversin analgico-digital PCM (Pulse Code Modulation)

La seal digital se ha de ajustar a uno de los valores preestablecidos de amplitud

Seal muestreada (valores continuos)

Seal digital (valores discretos)

Audio digital no comprimido

Sonido telefnico (G.711) CD-DA (Compact Disc Digital Audio)

64 Kb/s (RDSI) 1,411 Mb/s (CD-ROM 1x)

Ampliacin Redes 2-26

Ejemplo de Compresin lossy : ADPCM (Adaptative Diferential PCM)

Rango de amplitudes: 127

Ampliacin Redes 2-27

Comunicacin entre telfonos analgicos

Enlaces entre centrales de facturacin

Bucle de abonado Cdec

Central Telefnica final

Central Telefnica primaria Central Telefnica de facturacin

Central Telefnica final

Seal Analgica (300-3.400 Hz)

Seal Digital (64 Kb/s)

Seal Analgica (300-3.400 Hz)

El tren es un medio de transporte cmodo.