Vous êtes sur la page 1sur 83

PROCESAMIENTO Y TRANSMISIN DE SEALES DE VOZ Y AUDIO

CURSO DE PROCESAMIENTO Y TRANSMISION III INGENIERIA DE TELECOMUNICACIONES U. DE ANTIOQUIA 2013

Aplicaciones de la seal de audio en los sistemas de telecomunicacin


Seales de Voz <3.5 Khz. (espectro restringido a la voz humana)
Redes y sistemas de telefona fija y mvil conmutada Sistema de transmisin y grabacin de mensajes de voz Redes privadas de transmisin de voz.

Seales de Audio 20-20000 hz. (voz humana natural, msica, espectro auditivo).
Sistemas de transmisin y grabacin de voz de alta calidad (7khz) Radiodifusin Sonora Anloga (AM, 9.5 khz; FM 12 khz) Radiodifusin Digital 20-20000 hz. ( IBOC, DAB, ) Canal sonoro en TV anloga y digital Sistemas de transmisin estereofnica y multicanal. Sistemas de grabacin de audio anlogo y digital

Conceptos bsicos del sonido



Mechanical wave. Frequency represents the number of periods in a second (measured in hertz, cycles/second) Human hearing frequency range: 10 Hz - 20 kHz (voice and audio), voice is about 500 Hz to 2 kHz. Amplitude of a sound is the measure of displacement of the air pressure wave from its mean.

8/23/2013

Conceptos bsicos del sonido


Fenmeno que conlleva la propagacin de una onda elstica . (perturbacin de tensin). Son convertidas a ondas mecanicas por el oido y percibidas por el cerebro) Se caracterizan po su intensidad ( amplitud), contra el tiempo, y rango de frecuencia El oido humano percibe los cambios de intensidad en el tiempo de un sonido. Espectro de audio es el rango de frecuencias posible de percibir por el oido humano.

8/23/2013

Importancia de la seal y su procesamiento previos a la transmisin: la codificacin de la fuente.


La codificacin de la fuente cumple un papel determinante en la eficiencia y calidad de la transmisin de seales, al transformar la seal original en secuencias binarias optimizadas para su transmisin o grabacin. En la codificacin del sonido son determinantes la redundancia y las limitaciones de percepcin del oido humano. Los procesos realizados se fundamentan en la Teora de la Informacin y el tratamiento electrnico de seales digitales

Importancia de la seal y su procesamiento previos a la transmisin: acciones a realizar en la codificacin de la fuente.


Digitalizacin de la seal sonora anloga: voz / audio. (formateo de la fuente) Optimizacin de la senal para su tratamiento digital: eliminacin de redudancia y limitaciones de percepcin en el receptor. (codificacin ptima y compresin). Adicin de tcnicas de deteccin y/ correcin de errores en la seal banda base. Acondicionamiento de las tramas de bits a normas y estndares predefinidos: homologacin Resultado: CODEC de Voz

Calidad de un codificador de fuente


Un sistema de procesamiento de fuente consta de:
Codificador y decodificador

Codificador y decodificador pueden ser:


Asimtricos
El codificador suele ser ms complejo y lento que el decodificador (Ej.: Vdeo por demanda)

Simtricos
Coste computacional similar (Ej: Videoconferencia).

Con prdidas (lossy compression) o irreversible


Adecuada para medios continuos (audio y vdeo). Mayores tasas de compresin.

Sin prdidas (lossless compression) o reversible:


Ficheros de datos, imgenes mdicas, etc.
7

Factores en el diseo de un codificador


Calidad de la seal
- BER (Bit Error Ratio) - SNR (Signal/Noise) - MOS (Mean Opinion Score)

Eficiencia
- Tasa de compresin

Retardo

Complejidad
- Espacio de memoria - Potencia (mW) - Operaciones/Seg.
8

Caracteristica de una seal de audio


Una seal de audio no es ms que una onda acstica (variaciones de presin del aire) La seal de audio es unidimensional (tiempo) El micrfono transforma las ondas acsticas que lo golpean, en seales elctricas (niveles de voltaje) El odo es muy sensible a las variaciones de sonido de corta duracin (ms) al contraro a la respuesta del ojo humano. La relacin de dos sonidos A y B se mide en decibelios:
dB=20 log10 (A/B).

La intensidad de un sonido A se mide en decibelios tomando como referencia el menor sonido audible.
0 dB: Menor sonido audible La seal de referencia (B) es una onda senoidal a 1khz que provoca una presin de 0.0003 dinas/cm2 A y B son amplitudes (si fueran potencias sera 10 log10 (A/B)) 50 dB: Conversacin normal. 9 120dB: Umbral del dolor.

Espectro acstico de la voz y la msica


Lmite superior de la radio FM Lmite superior de la radio AM

Canal telefnico
0 dB MSICA

Rango dinmico de la voz

Potencia relativa

-20 dB

VOZ Rango dinmico de la msica

-40 dB Ruido

300 Hz
-60 dB

3,4 KHz

10 Hz

100 Hz

1 KHz

10 KHz

100 KHz

Frecuencia
Ampliacin Redes 2-10

Calidad de una seal de audio


Voz (telefona) Se define para los servicios de telefona digital. Estndar G.711 (ITU): Codificacin logartmica. Japn y USA: Transformacin -law. Resto: Transformacin A-law. (+) Parmetros: Seal de audio de 3.5 KHz (BW). Sf = 8 KHz 8 bits/muestra. Tasa de bits: 64Kbps (N-ISDN). Otras tcnicas de codificacin y compresin: DPCM y ADPCM, G.72x, GSM, LPC y CELP etc
11

Calidad de una seal de audio


CD-Digital Audio. Calidad de audio superior: Sonido Hi-Fi estereofnico. Utiliza una codificacin lineal. Las diferencias de amplitud deben ser respetadas por igual. Parmetros: Seal de audio de 20 KHz (BW). Sf = 41.1 KHz 16 bits/muestra. Soporta estereofona (dos canales) Tasa de bits: 1.411 Mbps. Otros estndares utilizan esta calidad de audio: DAT (32.4 y 48 KHz), MPEG (32, 44,1 y 48 KHz), DVI

12

Parmetros especficos
Tasa de bits (throughput): Audio sin comprimir: Calidad telefnica: 64Kbps. Calidad CD: 1.411 Mbps. Audio comprimido: Calidad telefnica: 32, 16, 4 Kbps (ADPCM, CELP) Calidad CD: 192 Kbps. (MPEG audio) Retardo de trnsito (aplicaciones interactivas) Conversacin: Telefona: < 25 ms (evitar eco). 100 a 500 ms (sensacin de tiempo real).

13

Clasificacin algoritmos de compresin


Por su fidelidad:
Sin prdidas (lossless): usada para datos (ej.: norma V.42bis en mdems, ficheros .zip) Con prdidas (lossy): usada normalmente en audio y vdeo. Inaceptable para datos. Eliminan informacin no perceptible por el hombre.

Por su velocidad relativa de compresin/descompresin:


Simtricos: necesitan aproximadamente la misma potencia de CPU para comprimir que para descomprimir Asimtricos: requieren bastante ms CPU para comprimir que para descomprimir.

En multimedia se suelen utilizar algoritmos lossy Siempre se necesita ms CPU para comprimir que para descomprimir Generalmente los algoritmos que consiguen mayor compresin gastan ms CPU.
14

Tipos de algoritmos de compresin de audio (lossy )


Generales (aptos para todo tipo de sonidos):
Psicoacstica. Ej.: MPEG Adaptativa Diferencial. Ej.: ADPCM (Adaptative Differential Pulse Code Modulation))

Especficos para voz. Ej.:


CELP (Code Excited Linear Prediction) CS-ACELP (Conjugate-Structure Algebraic Code Excited Linear Prediction LPC GSM

Especficos para la msica. Ej.: MIDI (Musical Instrument Digital Interface)

Ampliacin Redes 2-15

Codificadores de voz: clasificacin


Los codificadores de voz pueden dividirse en 3 grupos:

Codificadores de forma de onda Conservan la forma de onda de la seal Calidad alta: 16 64 kbps
Vocoders (codificadores paramtricos, sintetizadores) Explotan la naturaleza de la seal de voz para reducir la rata de bits (BW del canal digital) Calidad baja/media: 1.2 4.8 kbps

Codificadores hbridos Mezcla de los dos anteriores Calidad media/alta: 2.4 16 kbps

Codificadores de forma de onda


Estos codificadores pueden clasificarse en dos grupos segn el dominio en el que operan:
En el dominio del tiempo: PCM, LogPCM, DPCM, ADPCM, etc En el dominio de la frecuencia: Codificacin por subandas Codificacin por transformada

Audio Encoding (1)

Audio Waves Converted to Digital

8/23/2013

electrical voltage input sample voltage levels at intervals to get a vector of values: (0, 0.2, 0.5, 1.1, 1.5, 2.3, 2.5, 3.1, 3.0, 2.4,...) A computer measures the amplitude of the waveform at regular time intervals to produce a series of numbers (samples). The ADC process is governed by various factors such as sample rate and quantization: binary number as output
18

Succeeding with Technology

19

Audio Encoding
Sampling Rate: rate at which a continuous wave is sampled (measured in Hertz) Examples: CD standard - 44100 Hz, Telephone quality - 8000 Hz The audio industry uses 5.0125 kHz, 11.025 kHz, 22.05 kHz, and 44.1 kHz as the standard sampling frequencies. These frequencies are supported by most sound cards. How often do you need to sample a signal to avoid losing information?
8/23/2013 20

Audio Encoding
Quantization (sample precision): the resolution of a sample value.
Samples are typically stored as raw numbers (linear PCM format) or as logarithms (u-law or Alaw) Quantization depends on the number of bits used measuring the height of the waveform Example: 16-bit CD quality quantization results in over 65536 values
8/23/2013 21

Teorema de muestreo de Nyquist (1924)


La digitalizacin de una seal analgica ha de hacerse muestreando al menos al doble de su ancho de banda. Ejemplos:
Canal telefnico: 3,1 KHz Muestreo 8 KHz Audio HiFi: 20 KHz Muestreo 44,1 KHz

Ampliacin Redes 2-22

Modulacin por Cdigo de Pulsos (PCM)


infinito nmero de valores de las muestras

n valores posibles

cdigo digital de m bits (n=2m) informacin digital binaria

seal analgica f(t)

MUESTREO

CUANTIZACIN

CODIFICACIN

frecuencia de muestreo n valores posibles

informacin digital binaria

DECODIFICACIN

seal analgica f(t)

De acuerdo a la manera como se realice la codificacin se puede tener tambin:

Modulacin DELTA (MD)


Modulacin PCM Diferencial Adaptable (ADPCM)
Telecomunicaciones Conversin de Seal Analgica a Seal Digital

Conversin analgico-digital: muestreo de la seal


Canal telefnico Ancho de banda 300 a 3.400 Hz

Proceso de muestreo 8.000 muestras/s (captura de 0 a 4 KHz)


Muestras

Seal analgica original


Ampliacin Redes 2-24

Seal muestreada a 8 KHz

Conversin analgico-digital PCM (Pulse Code Modulation)


Ruido (o error) de cuantizacin

Digitalizacin

La seal digital se ha de ajustar a uno de los valores preestablecidos de amplitud


El error de cuantizacin depende del nmero de bits por muestra. En telefona se utilizan 8 bits por muestra, lo cual da 28 = 256 posibles valores de amplitud.

Seal muestreada (valores continuos)

Seal digital (valores discretos)


Ampliacin Redes 2-25

100100111011001

Audio digital no comprimido


Tipo Frec. de Muestreo (KHz) 8 44,1 Ancho de banda (KHz) 4 22,05 Bits por muestra 8 16 Relacin S/R (dB) 48 96 Canales Caudal

Sonido telefnico (G.711) CD-DA (Compact Disc Digital Audio)

1 2

64 Kb/s (RDSI) 1,411 Mb/s (CD-ROM 1x)

DVD-Audio

192 (mx.)

96

24 (mx.)

144 (mx.)

9,216 Mb/s

Ampliacin Redes 2-26

Ejemplo de Compresin lossy : ADPCM (Adaptative Diferential PCM)


PCM:
115 118 120 118 115

110

Rango de amplitudes: 127

8 8 8 8 8 8

En PCM la amplitud de cada muestra se representa con 8 bits, independientemente del resto.

ADPCM:
110

2 -2

-3

Rango de amplitudes: 7

8 4 4 4 4 4

En ADPCM de 32 Kb/s solo la primera muestra se representa con 8 bits. El resto se representa con 4. Cada muestra est referida a la anterior.

Ampliacin Redes 2-27

Comunicacin entre telfonos analgicos


Enlace de central final Bucle de abonado Cdec Enlace de central final

Enlaces entre centrales de facturacin

Bucle de abonado Cdec

Central Telefnica final


Central Telefnica de facturacin

Central Telefnica primaria Central Telefnica de facturacin

Central Telefnica final

Seal Analgica (300-3.400 Hz)


Ampliacin Redes 2-28

Seal Digital (64 Kb/s)

Seal Analgica (300-3.400 Hz)

Comparacin de codecs
Fuente Simulacin de canal Limitacin Codec X
1 2 3 4 5

El tren es un medio de transporte cmodo.


MOS 5 4 3 Calidad voz Excelente Buena Regular Nivel de distorsin Imperceptible Apenas Perceptible, no desagradable Perceptible, levemente desagradable
1 2 3 4 5

2
1

Pobre
Insatisfactoria

Desagradable, pero aceptable


Muy desagradable. Inaceptable

MOS: Mean Opinion Score


MOS de 4.2 = Calidad ptima
Ampliacin Redes 2-29

Vocoders
Se basan en el modelo simplificado de produccin de voz Explotan las caractersticas de la voz Codificador:
Calcula los parmetros del modelo Transmite los parmetros al decodificador

Decodificador:
Reconstruye la seal de voz a partir de los parmetros

Permiten tasas binarias muy bajas Consiguen inteligibilidad pero no naturalidad.

Voz

Anlisis

Parmetros

Sntesis

Voz

Vocoders = Sintetizadores Modelamiento del tracto vocal

4.1.- Historia de los codificadores de voz


Wolfgang von Kempelen, 1791: Primer sintetizador de voz Mquina que reproduca fielmente la anatoma del aparato fonador humano

Modelamiento del tracto vocal -LD-CELP

Low-Delay CELP (Backward-Adaptive) Excitation VQ* Codebook LPC Synthesis Filter

Input Speech 64 kbit/s + Gain Perceptual Weighting Minimum MSE 16 kbit/s Output VQ Index

Gain Adaptation

Predictor Adaptation

* VQ= Vector Quantizer

Codificadores hbridos
Combinan las tcnicas de los codificadores de forma de onda con las de los vocoders Intencin: mejorar la calidad empleando bitrates bajos Forma de mejorar la calidad: Mejorar el modelo de la fuente Sustituir el modelo de la fuente Enviando el residuo (o parte de el) de alguna forma

A algunos de ellos se les conoce como codificadores de Anlisis por sntesis

EL SISTEMA DE COMUNICACIN DIGITAL

Compresion de Seales de Audio MODELO CELP DE GENERACIN DE LA VOZ

Codec de alta compresin optimizado para la voz humana

Se basan en un diccionario de fonemas. Estos codecs no son aptos para la msica u otros sonidos
Ampliacin Redes 2-36

Algunos formatos de audio digital


Formato PCM (G.711) ADPCM (G.721) SB-ADPCM (G.722) MP-MLQ (G.723.1) ADPCM (G.726) Frec. Muestreo (KHz) 8 8 16 8 8 8 8 Canales 1 1 1 1 1 1 1 Caudal por canal (Kb/s) 64 32 48/56/64 6,3/5,3 variable 16/24/32/40 16/24/32/40 16 Uso Telefona Telefona Vdeoconferenc. Telefona Internet Telefona Telefona Telefona/Videoc.

Bajo Retardo

E-ADPCM (G.727) LD-CELP (G.728)

CS-ACELP (G.729)
RPE-LTP (GSM 06.10) CELP (FS 1016)

8
8 8

1
1 1

8
13,2 4,8

Telefona Internet
Telefona GSM

LPC-10E (FS 1015)


CD-DA / DAT MPEG-1 Layer I

8
44,1/48 32/44,1/48

1
2 2

2,4
705,6/768 192-256 variable Audio Hi-Fi

Elevado retardo

MPEG-1 Layer II
MPEG-1 Layer III (MP3) MPEG-2 AAC

32/44,1/48
32/44,1/48 32/44,1/48

2
2 5.1

96-128 variable
64 variable 32-44 variable Hi-Fi Internet Hi-Fi Internet

Ampliacin Redes 2-37

Compresion de Seales de Voz para telefonia Estndares


64 kbit/s PCM 32 kbit/s ADPCM 64 kbit/s 7 KHz voice 16, 24, 32 & 40 kbit/s ADPCM 16, 24, 32 & 40 kbit/s E-ADPCM 16 kbit/s LD-CELP 8 kbit/s ACELP ITU -T Rec. G.711 (1960) ITU -T Rec. G.721 (1984) ITU -T Rec. G.722 (1990) ITU -T Rec. G.726 (1990) ITU-T Rec. G.727 (1990) ITU-T Rec. G.728 (1994) ITU-T Rec. G.729 (1996)

Compresin vs calidad
64 56 48
PCM (G.711)

Caudal (Kb/s)

40 32 24 16 8 0 0 1 2 3 4 5
LPC 4.8 ADPCM 24 (G.725) ADPCM 16 (G.726) CS-ACELP (G.729a) LDCELP 16 (G.728) CS-ACELP 8 (G.729) MP-MLQ 6,4 (G.723.1) ADPCM 32 (G.726) Normalmente para tener alta compresin con calidad hay que usar los chips llamados DSP (Digital Signal Processor)

MOS (Mean Opinion Score)


Ampliacin Redes 2-39

Medidas subjetivas de calidad


MOS:
Excelente
Buena
CELP

Codificacin de Forma de Onda

Codificadores
Hbridos
PCM G711 (a / u) GSM ADPCM G721, G726

Calidad

Aceptable
Codificacin Paramtrica

Baja

Vocoder LPC

(VOCODERS)

2.4

16

32

64 kbps

Tasa binaria

Medidas subjetivas de calidad

MOS: Mean Opinion Score Es un test de calidad


Puntuacin 5 4 3 Calidad Excelente Buena Aceptable Nivel distorsin Imperceptible Perceptible, pero no molesto Perceptible y ligeramente molesto

2
1

Pobre
Insatisfactoria

Molesto
Muy molesto

Codificacin de la voz: Recomendaciones ITU


G.701: Digitalizacin PCM G.711: Codificacin logartmica -law y A-law G.721: ADPCM

Muestreo a 8 Khz, muestras de 8 bits: 64 Kbps Utiliza diferencias de 4 bits: tasa de bits final 32 Kbps

G.722: Sub-Band ADPCM.


Muestreo a 16 Khz, muestras de 14 bits: 224 Kbps Codifica seales de audio de hasta 7 KHz (por el muestreo) Descompone la seal en dos bandas de 4 KHz. A cada banda le aplica ADPCM. Tasas de bits finales: 48, 56 y 64 Kbps.

G.723, G.726, G.727:


42

Variantes del G.721 (ADPCM).

Estndares para telefona:


G.711a y G.711u: LogPCM a 64kbps G.721: ADPCM 32 kbps G.722: Subband ADPCM a 48, 56 y 64 kbps G.723.1: CELP a 5.3 y 6.3 kbps G.726: ADPCM a 16, 24, 32 y 40 kbps G.728: LD-CELP (Low Delay) a 16 kbps G.729: CS-ACELP a 8 kbps GSM 6.10: RPE-LTP a 13 kbps

Estndares
Organismos de estandarizacin: ISO: International Standards Organization
ITU: International Telecommunication Union ETSI: European Telecommunication Standards Institute

Procesos de codificacin hbrida


LPC (Linear Predictive Coding) US-FS-1015

Define un modelo analtico del aparato fonador Reduce cada segmento de audio a los parmetros del modelo que ms se aproximan al original. El decodificador recoge estos parmetros y sintetiza la voz correspondiente. LPC-10E puede bajar hasta 2.4 Kbps. Es una versin mejorada del LPC. Diferencia: Utiliza un code-book con secuencias predefinidas para aplicarlas a cada frame de audio, eligiendo aquella que ms se aproxima al original. Adems, calcula los errores cometidos. Se envan los parmetros y la versin comprimida de los errores. Tasa de bits de hasta 4.8 Kbps (calidad similar a ADPCM G.721 a 32 Kbps)

CELP (Code Excited Linear Prediction) US-FS-1016.


Variantes CELP:
GSM, VSELP, LD-CELP, ITU G.729, QCELP, MELT, etc.

45

Tabla resumen de algunos codecs de audio.


Ao 1972 1976 1984 1990 1991 1991 1992 1992 1993 1995 1995 1995 1996
46

Calidad telefnica
Tasa de bits (Kbps) 64 2.4 32 4.15 13 4.8 16 8 1-8 8 6.3 5-6 2.4 Nombre PCM (PSTN) LPC-10 G.721 ADPCM INMARSAT GSM CELP (US 1016) G.728 (LD-CELP) VSELP QCELP G.729 G.723.1 Half-Rate GSM New LPC

MOS 4.4 2.7 4.1 3.2 3.6 3.2 4 3.5 3.4 4.2 3.98 3.4 3.3

Codificacin de Audio
Sistemas de codificacin de forma de onda en el tiempo: - PCM, Lineal, sin compresin, generalmente orientados a la grabacin de alta fidelidad. Ej. CD de audio Sistemas de codificacin con compresin. Codificacin de forma de onda en el dominio de la frecuencia. Orientados a la transmisin con calidades similares al CD, pero rata de bits inferiores y variables. Radiodifusin digital, Televisin digital, sistemas estereofnicos y multicanal.
Sistemas de grabacin
Ampliacin Redes 2-47

Codificacin de Audio
Generalmente a ms compresin menor calidad y mayor consumo de CPU. Los sistemas de caudal variable (MPEG, G.723.1) son los que mejor se adaptan a redes sin reserva de caudal constante, como el modelo DiffServ de Internet o los servicios UBR o ABR de ATM. (Available Bit Rate (ABR) and
Unspecified Bit Rate (UBR))

Los sistemas de caudal constante (G.711, G.722, G.729) son ms adecuados para servicios orientados a conexin (RSVP o circuitos CBR de ATM, por ejemplo). CBR (Constant Bit
Rate)

La compresin MPEG es la ms eficiente y da mayor calidad, pero consume mucha CPU e introduce mucho retardo por lo que no puede emplearse en aplicaciones interactivas (vdeoconferencia o telefona).
Ampliacin Redes 2-48

Compresin MPEG
Estndar de la Organizacin Internacional de Estandarizacin (ISO) Generado por el grupo de trabajo Moving Pictures Experts Group (MPEG) Objetivo: Codificacin de video y audio para medios digitales de almacenamiento hasta cerca de 1.5 Mb/s Fases: MPEG-1, MPEG-2, MPEG-4, MPEG-7

Estndar MPEG-1 MPEG-1 es la primera fase del trabajo del grupo MPEG, cuyo producto es el estandar ISO/IEC 11172 adoptado a finales de 1992.
MPEG-1 se divide en 5 partes: 1: Sistemas 2: Video 3: Audio 4: Especificacin de Pruebas 5: Implementacin en Software

Compresin MPEG-1 para Audio ISO/IEC 11172-3


Seales de audio monofnicas y estereofnicas. Basado en un modelo psicoacstico que considera las caractersticas auditivas del ser humano. Tres modos de operacin (Layers):
Velocidad (Stereo) Factor de Compresin

kbps

Layer I Layer II Layer III

384 192 128

4 8 12

Principios de Operacin de MPEG-1

Codificacin Perceptiva Codificacin en el Dominio de la Frecuencia Conmutacin de Ventana

Asignacin Dinmica de Bits

Codificacin Perceptiva y Enmascaramiento de Sonidos El odo humano se comporta como si tuviera filtros internos pasa-banda (bandas crticas) Fenmeno de enmascaramiento: un sonido deja de ser escuchado (percibido) en presencia de otro de mayor intensidad. Sonido enmascarador: inhibidor. Sonido enmascarado: inhibido El enmascaramiento es ms notorio cuando los sonidos simultneos pertenecen a una misma banda crtica.
Tambin se presenta enmascaramiento cuando los sonidos se producen en un intervalo de tiempo pequeo.

Caractersticas Generales de MPEG-1 para Audio Frecuencias de Muestreo de 32, 44.1 y 48 KHz
Subdivisin de la seal en 32 subbandas igualmente espaciadas a travs de un banco de filtros. Filtros de subbanda FIR de 512 coeficientes

Ancho de banda de cada subbanda: fmuestreo/64

MPEG-1 Layer I Velocidad de 32 kbps (mono) a 448 kbps (stereo)


Anlisis frecuencial con FFT de 512 puntos Cada seal de subbanda es de una longitud de 12 muestras

La cuantizacin se realiza en base a la velocidad deseada, fija.

MPEG-1 Layer II Velocidad de 32 kbps (mono) a 384 kbps (stereo)


Anlisis frecuencial con FFT de 1024 puntos Cada seal de subbanda es de una longitud de 36 muestras

La cuantizacin se realiza en base a la velocidad deseada, fija.

MPEG-1 Layer III


Velocidad de 32 kbps (mono) a 320 kbps (stereo)
Anlisis frecuencial con FFT de 1024 puntos Se aplica la transformada de coseno discreto modificada (MDCT) de 6 u 8 puntos a cada seal de subbanda, obtenindose el equivalente de hasta 576 componentes de frecuencia Se codifica la informacin de los coeficientes de la MDCT con Codificacin Huffman.

Codificacin con velocidad variable

Calidad CD
Estndares MPEG/audio (Estndar ISO)
MPEG (Moving Pictures Expert Group) MPEG/audio ofrece altos ndices de compresin, manteniendo la calidad del audio del stream original. Son algoritmos de compresin con prdidas*.

MPEG-1 /audio
Muestreos: 32, 44.1 y 48 KHz. Soportan uno o dos canales (diferentes modos de operacin). Tasas de bits: 32 a 256 Kbps/canal. Indices de compresin: 2.7 a 24.

MPEG-2 /audio
Compatibilidad hacia atrs con MPEG-1. Diseado para sistemas de sonido multicanal, DVD, Sonido TV.
58

MPEG-1 audio.
El stream comprimido puede incluir informacin auxiliar (acceso aleatorio, avance y retroceso rpido, CRC, etc.) Arquitectura de tres niveles
MPEG-1 Nivel I:
El ms sencillo. Tasa de bits 192 Kbps/canal. Aplicaciones: Philips DCC

MPEG-1 Nivel II:


Complejidad media. Tasa de bits 128 Kbps/canal. Aplicaciones: DAB, CD-I, Vdeo CD.

MPEG-1 Nivel III:


El ms complejo. Ofrece la mejor calidad de audio con tasas de bits sobre 64 Kbps/canal. Est preparado para N-RDSI.

Existen codecs hardware de los tres niveles para aplicaciones de tiempo real.
59

La transmisin de seales de audio (audio broadcast)


Sistemas de radiodifusin Analgica: Estaciones AM, FM y FM estereofnica. Normas y procesos de transmisin.
Radiodifusin del sonido en TV analgica y Digital Radiodifusin Digital: Estndares mundiales. Estructura de transmisores y receptores. Radio en internet.

Media Player or Helper Application


Three main streaming media companies or products are:
RealPlayer (RealNetworks),

Media Player (Microsoft) and


QuickTime (Apple).

Three basic tasks of media players:


Decompression Jitter Removal Error Correction
61

DIGITAL TV BROADCASTING STANDARDS


Terrestrial Digital Video Broadcasting (DVB-T) - Region 1 system B. Advanced Television Systems Committee (ATSC) USA sys C

Integrated Services Digital Broadcasting (ISDB-T)- Japan sys A.


Digital Terrestrial Multimedia Broadcasting (DTMB) - China Other Standards Mobile TV (DVB-H, MediaFlo). Internet Protocol Television (IPTV) for 2 way interactive services.

Promoting Universal ICT Access

DIGITAL AUDIO BROADCASTING STANDARDS


Terrestrial Terrestrial Digital Audio Broadcasting (T-DAB) reg. 1 Digital Radio Mondiale (DRM) for HF radio broadcasting.

DTSB / ISBD-TSB (Terrestrial Digital Sound Broadcasting).


In Band On Channel (IBOC) USA standard for FM. Other Parameters Set Top Box with CA for signal access. MPEG 2 / MPEG 4 for compression.

Promoting Universal ICT Access

TRANSITION MODELS
Transition from analogue to digital broadcasting can be mainly achieved on the end user part through two basic models namely; Use of STB

Reception for both VHF and UHF channels. Use of digital TV


TV receiver with built-in digital tuner for the reception of digital TV signals. You do not necessarily need an HDTV receiver.

Promoting Universal ICT Access

ANALOGUE SYSTEMS

Promoting Universal ICT Access

DIGITAL SYSTEMS

Promoting Universal ICT Access

KEY PLANNING CONSIDERATION #1

Promoting Universal ICT Access

KEY PLANNING CONSIDERATION #2

Promoting Universal ICT Access

KEY PLANNING CONSIDERATION #3

Promoting Universal ICT Access

KEY PLANNING CONSIDERATION #4

Promoting Universal ICT Access

KEY PLANNING CONSIDERATION #5

Promoting Universal ICT Access

What is HD Radio?
Hint: HD doesnt stand for anything

HD Radio=brand name Digital sidebands straddling the analog carrier Some RF energy on adjacent channels
In-Band / On-Channel = IBOC

Backwards-compatible
Download these slides: www.friedbagels.com/cbi/

Simple FM IBOC Transmission Topology All IBOC Gear at Transmitter Site diagram courtesy of The IBOC Handbook, page 401

FM IBOC Transmission Topology with Exporter and Exgine Modules diagram courtesy of The IBOC Handbook, page 405

FM IBOC Transmission Topology with Exporter & Exgine Modules, plus Importer diagram courtesy of The IBOC Handbook, page 413

What is HD Radio? (AM)


Also just bits & bytes, just 32kbps No multicasting PAD/PSD, just barely Improved audio quality

Download these slides: www.friedbagels.com/cbi/

What is HD Radio? (FM)


Digital carriers = bits & bytes 96kbps std (+12 or +24 ext.hybrid or MP3 mode; More carriers closer to analog carrier = no work with 92kHz SCA) Multicasting (HD2, HD3HD7) PAD/PSD, iTunes Tagging, Downloadable Content, etc. 20kHz audio bandwidth No multipath interference or stereo hiss
Download these slides: www.friedbagels.com/cbi/

Multicasting
Killer app Extra stations hidden in the signal Require an HD tuner to hear Subdivides 96kbps total
Ext.Hybrid is separate

Download these slides: www.friedbagels.com/cbi/

What is Streaming Technology


A technique for transferring data such that it can be processed as a steady and continuous stream, client does not have to download the entire file to view it.
Data Network

Source

The portion in the buffer


The portion client is viewing
79

Advantages
It reduces download time
It provides steady service Slower systems can take advantage of streaming technology Provide service on demand

Applications are utilizing this technology are:


Streaming Video, IP telephony, Internet Radio, Distance learning, Videoconferencing, Interactive games and so on
80

Disadvantages
It is difficult to keep the service steady if the bandwidth is low

The maintenance of streaming server is relatively expensive

Packet loss may occur during the transmission

81

3 types of delivery methods of streaming media


Streaming Stored Audio and Video Streaming Live Audio and Video

Real-Time Interactive Audio and Video

82

Vous aimerez peut-être aussi