Académique Documents
Professionnel Documents
Culture Documents
Seales de Audio 20-20000 hz. (voz humana natural, msica, espectro auditivo).
Sistemas de transmisin y grabacin de voz de alta calidad (7khz) Radiodifusin Sonora Anloga (AM, 9.5 khz; FM 12 khz) Radiodifusin Digital 20-20000 hz. ( IBOC, DAB, ) Canal sonoro en TV anloga y digital Sistemas de transmisin estereofnica y multicanal. Sistemas de grabacin de audio anlogo y digital
Mechanical wave. Frequency represents the number of periods in a second (measured in hertz, cycles/second) Human hearing frequency range: 10 Hz - 20 kHz (voice and audio), voice is about 500 Hz to 2 kHz. Amplitude of a sound is the measure of displacement of the air pressure wave from its mean.
8/23/2013
8/23/2013
Simtricos
Coste computacional similar (Ej: Videoconferencia).
Eficiencia
- Tasa de compresin
Retardo
Complejidad
- Espacio de memoria - Potencia (mW) - Operaciones/Seg.
8
La intensidad de un sonido A se mide en decibelios tomando como referencia el menor sonido audible.
0 dB: Menor sonido audible La seal de referencia (B) es una onda senoidal a 1khz que provoca una presin de 0.0003 dinas/cm2 A y B son amplitudes (si fueran potencias sera 10 log10 (A/B)) 50 dB: Conversacin normal. 9 120dB: Umbral del dolor.
Canal telefnico
0 dB MSICA
Potencia relativa
-20 dB
-40 dB Ruido
300 Hz
-60 dB
3,4 KHz
10 Hz
100 Hz
1 KHz
10 KHz
100 KHz
Frecuencia
Ampliacin Redes 2-10
12
Parmetros especficos
Tasa de bits (throughput): Audio sin comprimir: Calidad telefnica: 64Kbps. Calidad CD: 1.411 Mbps. Audio comprimido: Calidad telefnica: 32, 16, 4 Kbps (ADPCM, CELP) Calidad CD: 192 Kbps. (MPEG audio) Retardo de trnsito (aplicaciones interactivas) Conversacin: Telefona: < 25 ms (evitar eco). 100 a 500 ms (sensacin de tiempo real).
13
En multimedia se suelen utilizar algoritmos lossy Siempre se necesita ms CPU para comprimir que para descomprimir Generalmente los algoritmos que consiguen mayor compresin gastan ms CPU.
14
Codificadores de forma de onda Conservan la forma de onda de la seal Calidad alta: 16 64 kbps
Vocoders (codificadores paramtricos, sintetizadores) Explotan la naturaleza de la seal de voz para reducir la rata de bits (BW del canal digital) Calidad baja/media: 1.2 4.8 kbps
Codificadores hbridos Mezcla de los dos anteriores Calidad media/alta: 2.4 16 kbps
8/23/2013
electrical voltage input sample voltage levels at intervals to get a vector of values: (0, 0.2, 0.5, 1.1, 1.5, 2.3, 2.5, 3.1, 3.0, 2.4,...) A computer measures the amplitude of the waveform at regular time intervals to produce a series of numbers (samples). The ADC process is governed by various factors such as sample rate and quantization: binary number as output
18
19
Audio Encoding
Sampling Rate: rate at which a continuous wave is sampled (measured in Hertz) Examples: CD standard - 44100 Hz, Telephone quality - 8000 Hz The audio industry uses 5.0125 kHz, 11.025 kHz, 22.05 kHz, and 44.1 kHz as the standard sampling frequencies. These frequencies are supported by most sound cards. How often do you need to sample a signal to avoid losing information?
8/23/2013 20
Audio Encoding
Quantization (sample precision): the resolution of a sample value.
Samples are typically stored as raw numbers (linear PCM format) or as logarithms (u-law or Alaw) Quantization depends on the number of bits used measuring the height of the waveform Example: 16-bit CD quality quantization results in over 65536 values
8/23/2013 21
n valores posibles
MUESTREO
CUANTIZACIN
CODIFICACIN
DECODIFICACIN
Digitalizacin
100100111011001
1 2
DVD-Audio
192 (mx.)
96
24 (mx.)
144 (mx.)
9,216 Mb/s
110
8 8 8 8 8 8
En PCM la amplitud de cada muestra se representa con 8 bits, independientemente del resto.
ADPCM:
110
2 -2
-3
Rango de amplitudes: 7
8 4 4 4 4 4
En ADPCM de 32 Kb/s solo la primera muestra se representa con 8 bits. El resto se representa con 4. Cada muestra est referida a la anterior.
Comparacin de codecs
Fuente Simulacin de canal Limitacin Codec X
1 2 3 4 5
2
1
Pobre
Insatisfactoria
Vocoders
Se basan en el modelo simplificado de produccin de voz Explotan las caractersticas de la voz Codificador:
Calcula los parmetros del modelo Transmite los parmetros al decodificador
Decodificador:
Reconstruye la seal de voz a partir de los parmetros
Voz
Anlisis
Parmetros
Sntesis
Voz
Input Speech 64 kbit/s + Gain Perceptual Weighting Minimum MSE 16 kbit/s Output VQ Index
Gain Adaptation
Predictor Adaptation
Codificadores hbridos
Combinan las tcnicas de los codificadores de forma de onda con las de los vocoders Intencin: mejorar la calidad empleando bitrates bajos Forma de mejorar la calidad: Mejorar el modelo de la fuente Sustituir el modelo de la fuente Enviando el residuo (o parte de el) de alguna forma
Se basan en un diccionario de fonemas. Estos codecs no son aptos para la msica u otros sonidos
Ampliacin Redes 2-36
Bajo Retardo
CS-ACELP (G.729)
RPE-LTP (GSM 06.10) CELP (FS 1016)
8
8 8
1
1 1
8
13,2 4,8
Telefona Internet
Telefona GSM
8
44,1/48 32/44,1/48
1
2 2
2,4
705,6/768 192-256 variable Audio Hi-Fi
Elevado retardo
MPEG-1 Layer II
MPEG-1 Layer III (MP3) MPEG-2 AAC
32/44,1/48
32/44,1/48 32/44,1/48
2
2 5.1
96-128 variable
64 variable 32-44 variable Hi-Fi Internet Hi-Fi Internet
Compresin vs calidad
64 56 48
PCM (G.711)
Caudal (Kb/s)
40 32 24 16 8 0 0 1 2 3 4 5
LPC 4.8 ADPCM 24 (G.725) ADPCM 16 (G.726) CS-ACELP (G.729a) LDCELP 16 (G.728) CS-ACELP 8 (G.729) MP-MLQ 6,4 (G.723.1) ADPCM 32 (G.726) Normalmente para tener alta compresin con calidad hay que usar los chips llamados DSP (Digital Signal Processor)
Codificadores
Hbridos
PCM G711 (a / u) GSM ADPCM G721, G726
Calidad
Aceptable
Codificacin Paramtrica
Baja
Vocoder LPC
(VOCODERS)
2.4
16
32
64 kbps
Tasa binaria
2
1
Pobre
Insatisfactoria
Molesto
Muy molesto
Muestreo a 8 Khz, muestras de 8 bits: 64 Kbps Utiliza diferencias de 4 bits: tasa de bits final 32 Kbps
Estndares
Organismos de estandarizacin: ISO: International Standards Organization
ITU: International Telecommunication Union ETSI: European Telecommunication Standards Institute
Define un modelo analtico del aparato fonador Reduce cada segmento de audio a los parmetros del modelo que ms se aproximan al original. El decodificador recoge estos parmetros y sintetiza la voz correspondiente. LPC-10E puede bajar hasta 2.4 Kbps. Es una versin mejorada del LPC. Diferencia: Utiliza un code-book con secuencias predefinidas para aplicarlas a cada frame de audio, eligiendo aquella que ms se aproxima al original. Adems, calcula los errores cometidos. Se envan los parmetros y la versin comprimida de los errores. Tasa de bits de hasta 4.8 Kbps (calidad similar a ADPCM G.721 a 32 Kbps)
Variantes CELP:
GSM, VSELP, LD-CELP, ITU G.729, QCELP, MELT, etc.
45
Calidad telefnica
Tasa de bits (Kbps) 64 2.4 32 4.15 13 4.8 16 8 1-8 8 6.3 5-6 2.4 Nombre PCM (PSTN) LPC-10 G.721 ADPCM INMARSAT GSM CELP (US 1016) G.728 (LD-CELP) VSELP QCELP G.729 G.723.1 Half-Rate GSM New LPC
MOS 4.4 2.7 4.1 3.2 3.6 3.2 4 3.5 3.4 4.2 3.98 3.4 3.3
Codificacin de Audio
Sistemas de codificacin de forma de onda en el tiempo: - PCM, Lineal, sin compresin, generalmente orientados a la grabacin de alta fidelidad. Ej. CD de audio Sistemas de codificacin con compresin. Codificacin de forma de onda en el dominio de la frecuencia. Orientados a la transmisin con calidades similares al CD, pero rata de bits inferiores y variables. Radiodifusin digital, Televisin digital, sistemas estereofnicos y multicanal.
Sistemas de grabacin
Ampliacin Redes 2-47
Codificacin de Audio
Generalmente a ms compresin menor calidad y mayor consumo de CPU. Los sistemas de caudal variable (MPEG, G.723.1) son los que mejor se adaptan a redes sin reserva de caudal constante, como el modelo DiffServ de Internet o los servicios UBR o ABR de ATM. (Available Bit Rate (ABR) and
Unspecified Bit Rate (UBR))
Los sistemas de caudal constante (G.711, G.722, G.729) son ms adecuados para servicios orientados a conexin (RSVP o circuitos CBR de ATM, por ejemplo). CBR (Constant Bit
Rate)
La compresin MPEG es la ms eficiente y da mayor calidad, pero consume mucha CPU e introduce mucho retardo por lo que no puede emplearse en aplicaciones interactivas (vdeoconferencia o telefona).
Ampliacin Redes 2-48
Compresin MPEG
Estndar de la Organizacin Internacional de Estandarizacin (ISO) Generado por el grupo de trabajo Moving Pictures Experts Group (MPEG) Objetivo: Codificacin de video y audio para medios digitales de almacenamiento hasta cerca de 1.5 Mb/s Fases: MPEG-1, MPEG-2, MPEG-4, MPEG-7
Estndar MPEG-1 MPEG-1 es la primera fase del trabajo del grupo MPEG, cuyo producto es el estandar ISO/IEC 11172 adoptado a finales de 1992.
MPEG-1 se divide en 5 partes: 1: Sistemas 2: Video 3: Audio 4: Especificacin de Pruebas 5: Implementacin en Software
kbps
4 8 12
Codificacin Perceptiva y Enmascaramiento de Sonidos El odo humano se comporta como si tuviera filtros internos pasa-banda (bandas crticas) Fenmeno de enmascaramiento: un sonido deja de ser escuchado (percibido) en presencia de otro de mayor intensidad. Sonido enmascarador: inhibidor. Sonido enmascarado: inhibido El enmascaramiento es ms notorio cuando los sonidos simultneos pertenecen a una misma banda crtica.
Tambin se presenta enmascaramiento cuando los sonidos se producen en un intervalo de tiempo pequeo.
Caractersticas Generales de MPEG-1 para Audio Frecuencias de Muestreo de 32, 44.1 y 48 KHz
Subdivisin de la seal en 32 subbandas igualmente espaciadas a travs de un banco de filtros. Filtros de subbanda FIR de 512 coeficientes
Calidad CD
Estndares MPEG/audio (Estndar ISO)
MPEG (Moving Pictures Expert Group) MPEG/audio ofrece altos ndices de compresin, manteniendo la calidad del audio del stream original. Son algoritmos de compresin con prdidas*.
MPEG-1 /audio
Muestreos: 32, 44.1 y 48 KHz. Soportan uno o dos canales (diferentes modos de operacin). Tasas de bits: 32 a 256 Kbps/canal. Indices de compresin: 2.7 a 24.
MPEG-2 /audio
Compatibilidad hacia atrs con MPEG-1. Diseado para sistemas de sonido multicanal, DVD, Sonido TV.
58
MPEG-1 audio.
El stream comprimido puede incluir informacin auxiliar (acceso aleatorio, avance y retroceso rpido, CRC, etc.) Arquitectura de tres niveles
MPEG-1 Nivel I:
El ms sencillo. Tasa de bits 192 Kbps/canal. Aplicaciones: Philips DCC
Existen codecs hardware de los tres niveles para aplicaciones de tiempo real.
59
TRANSITION MODELS
Transition from analogue to digital broadcasting can be mainly achieved on the end user part through two basic models namely; Use of STB
ANALOGUE SYSTEMS
DIGITAL SYSTEMS
What is HD Radio?
Hint: HD doesnt stand for anything
HD Radio=brand name Digital sidebands straddling the analog carrier Some RF energy on adjacent channels
In-Band / On-Channel = IBOC
Backwards-compatible
Download these slides: www.friedbagels.com/cbi/
Simple FM IBOC Transmission Topology All IBOC Gear at Transmitter Site diagram courtesy of The IBOC Handbook, page 401
FM IBOC Transmission Topology with Exporter and Exgine Modules diagram courtesy of The IBOC Handbook, page 405
FM IBOC Transmission Topology with Exporter & Exgine Modules, plus Importer diagram courtesy of The IBOC Handbook, page 413
Multicasting
Killer app Extra stations hidden in the signal Require an HD tuner to hear Subdivides 96kbps total
Ext.Hybrid is separate
Source
Advantages
It reduces download time
It provides steady service Slower systems can take advantage of streaming technology Provide service on demand
Disadvantages
It is difficult to keep the service steady if the bandwidth is low
81
82