Universidad Nacional Abierta Y A Distancia: Escuela de Ciencias Básicas Tecnología E Ingeniería

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA

Contenido didáctico del curso Audio Digital
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
208035 - AUDIO DIGITAL (e-Learning)
JUAN DAVID MEJÍA LOZANO
(Director Nacional)
MILTON EDUARDO SALGADO
Acreditador
Bogotá – Colombia
Diciembre de 2010
INDICE DE CONTENIDO
INTRODUCCIÓN ......................................................................................................10
UNIDAD 1. ANÁLOGO VS. DIGITAL. .......................................................................11
Introducción ...........................................................................................................11
CAPITULO 1: INTRODUCCIÓN AL AUDIO DIGITAL ............................................11
Lección 1: Audio análogo. ..................................................................................11
Lección 2: Audio digital. ......................................................................................12
Lección 3: Propiedades. .....................................................................................15
Lección 4: Sistema binario. .................................................................................16
Lección 5: Características Digitales. ...................................................................19
CAPITULO 2: PROCESOS DE AUDIO DIGITAL. ..................................................20
Lección 6: Estructura general. ............................................................................20
Lección 7: El muestreador. .................................................................................22
Lección 8: Delay programable. ...........................................................................23
Lección 9: Compresión de tiempo.......................................................................24

Lección 10: Sincronización. ................................................................................25
Lección 11: Corrección. ......................................................................................26
CAPITULO 3: CODIFICACIÓN. .............................................................................27
Lección 12: Codificación de canal. .....................................................................27
Lección 13: Reducción de datos. ........................................................................28
Lección 14: Adaptador PCM. ..............................................................................29
Lección 15: Radiodifusión digital de audio. .........................................................30
UNIDAD 2: TRANSDUCCIÓN A/D, D/A. ...................................................................32
Introducción ...........................................................................................................32
CAPITULO 4: PROCESOS DE CONVERSIÓN .....................................................32
Lección 16. Rango auditivo. ...............................................................................32
Lección 17. Capacidad del audio análogo. .........................................................34
Lección 18. Descripción del proceso de conversión. ..........................................36
CAPITULO 5: MUESTREO Y ALIASING ...............................................................38
Lección 19. Descripción. .....................................................................................38
Lección 20. Reconstrucción. ...............................................................................40
Lección 21. Diseño de Filtros. .............................................................................42
Lección 22. Frecuencia de Muestreo. .................................................................45
Lección 23. Reloj de muestreo. ..........................................................................47
CAPITULO 6: CUANTIFICACIÓN Y DITHER. .......................................................50
Lección 24: Descripción. .....................................................................................50

Lección 25. Error de cuantificación .....................................................................52
Lección 26. El Dither...........................................................................................57
Lección 27. Dither Digital. ...................................................................................61
Lección 28. Conversión Digital-Analógica. ..........................................................67
Lección 29. Conversión Analógico-Digital. ..........................................................70
Lección 30. El Sobremuestreo. ...........................................................................74
UNIDAD 3. SOFTWARE Y HARDWARE ..................................................................83
Introducción ...........................................................................................................83
CAPITULO 7: SOFTWARE. ...................................................................................83
Lección 32: ¿Que es software? ..........................................................................85
Lección 33: Programas de reproducción.............................................................85
Lección 34: Software profesional. .......................................................................87
CAPITULO 8: HARDWARE. ..................................................................................93
Lección 36: Discos ópticos (CD y DVD) ..............................................................94
Lección 37: Especificaciones de los reproductores. ............................................94
Lección 38: Interfaces Externas ..........................................................................96
Lección 39: Interface y conexión USB ................................................................97
Lección 40: Interface y conexión FireWire. .........................................................98
Lección 41: Tarjetas de Sonido. .........................................................................99

Lección 42: Dispositivos externos de audio. ..................................................... 100
CAPITULO 9: ESPECIFICACIONES Y FORMATOS DE AUDIO. ........................ 102
Lección 43: Formatos de Audio Digital. ............................................................ 102
Lección 44: Comparación de formatos de Audio Digital. ................................... 103
Lección 45: Guerra de formatos. ...................................................................... 104
INDICE DE TABLAS
Tabla 1. Descripción de Interfaces. ...........................................................................97
Tabla 2. Formatos de Audio. ................................................................................... 103
INDICE DE ECUACIONES
Ecuación 1. Deducción de frecuencia de muestreo (60 Hz). .....................................46
Ecuación 2. Deducción de frecuencia de muestreo (50 Hz). .....................................46
Ecuación 3. Relación Señal-Ruido. ...........................................................................55
Ecuación 4. Potencia de ruido total. ..........................................................................66
Ecuación 5. Calculo de factor de ruido. .....................................................................67
Ecuación 6. Relación señal ruido. .............................................................................67
INDICE DE FIGURAS
Figura 1. Funcionamiento de la PCM. .......................................................................15
Figura 2. Sistema Binario. .........................................................................................17
Figura 3. Consecuencias de la transmisión. ..............................................................18
Figura 4. Señales binarias para transportar muestras de audio. ...............................18
Figura 5. Sencillo sistema digital de audio. ...............................................................21
Figura 6. Sistema de audio digital mejorado. ............................................................23
Figura 7. Dispositivo con retardo de audio. ...............................................................24
Figura 8. ADC alimenta un par de RAM. ...................................................................24
Figura 9. Componentes esenciales en equipo digital de grabación audio PCM. .......29
Figura 10. Señal analógica con ruido sobrepuesto. ...................................................35
Figura 11. Muestreador analógico y muestreador digital. ..........................................37
Figura 12. Proceso de muestreo. ..............................................................................38
Figura 13. Espectro de los impulsos de muestreo. ....................................................39
Figura 14. Efecto Aliasing. ........................................................................................40
Figura 15. Reconstrucción de la señal original. .........................................................41
Figura 16. Filtro con pendiente finita. ........................................................................42
Figura 17. Filtro Pasa-Bajo........................................................................................43
Figura 18. Descripción de funcionamiento filtro Pasa-Bajo........................................44
Figura 19. Descripción de frecuencia de muestreo. ..................................................45
Figura 20. Nivel de jitter permisible en picosegundos................................................48

Figura 21. Efecto de distintas cantidades de jitter. ....................................................49
Figura 22. Proceso de cuantificación. .......................................................................51
Figura 23. Técnica de re-muestreo. ..........................................................................53
Figura 24. Comparación, impulsos DAC y forma de onda analógica original. ...........54
Figura 25. Distorsión después del filtro anti-aliasing..................................................57
Figura 26. Dither aplicado a un cuantificador ideal. ...................................................58
Figura 27. Formas alternativas de ver el dither. ........................................................60
Figura 28. Uso adecuado del nivel de dither. ............................................................62
Figura 29. Sencillo sistema de dither digital. .............................................................63
Figura 30. Formas distintas de usar dither digital. .....................................................65
Figura 31. Sistema de conversión convencional. ......................................................68
Figura 32. Formas de obtener una señal analógica a partir de datos PCM. ..............69
Figura 33. Sistema convencional análogo-digita. ......................................................70
Figura 34. Conversor flash. .......................................................................................71
Figura 35. Conversor flash típico de 8 bits para video. ..............................................72
Figura 36. Sobremuestreo.........................................................................................75
Figura 37. Estructuras alternativas de conversión en PCM. ......................................76
Figura 38. Teoría de la información SNR. .................................................................77
Figura 39. Información por bit, longitud de palabra. ..................................................78
Figura 40. Un ADC convencional. .............................................................................80
Figura 41. Comparación de DAC (a) con implementación de sobremuestreo (b). .....81
INDICE DE IMÁGENES
Imagen 1, Software de Audio Digital. ........................................................................13
Imagen 2. Estructura del Oído. .................................................................................33
Imagen 3. Rango Auditivo. ........................................................................................34
Imagen 4. Conversor A/D. .........................................................................................50
Imagen 5. Software de Mezcla y Edición de Audio. ...................................................84
Imagen 6. Software de Mezcla y Masterización de Audio. ........................................84
Imagen 7. Reproductores de Audio Digital. ...............................................................86
Imagen 8. Aplicaciones para Pro Tools 9. .................................................................87
Imagen 9. Logic Platinum. .........................................................................................89
Imagen 10. Cubase. ..................................................................................................90
Imagen 11. Nuendo...................................................................................................92
Imagen 12. Reproductor de CD Audio Profesional. ...................................................95
Imagen 13. Reproductor de DVD-ROM. ....................................................................96
Imagen 14. Puertos USB...........................................................................................98
Imagen 15. Puertos Firewire. ....................................................................................99
Imagen 16. Tarjeta de Audio EDIROL modelo UA-25. ..............................................99
Imagen 17. Interface AVID M-Box III. ...................................................................... 101
Imagen 18. Interface, controles para entradas de Micrófonos o Guitarras............... 101

ASPECTOS DE PROPIEDAD INTELECTUAL Y VERSIONAMIENTO
El presente módulo fue diseñado en el año 2010 por el Ingeniero de Sonido Juan
David Mejía Lozano, docente de la UNAD ubicado en la Sede Nacional José
Celestino Mutis, Bogotá, y se ha desempeñado como tutor desde el año 2010.
Es la primera versión de este módulo y ha sido diseñado para hacer parte de la

carrera de Tecnología de Audio de la Universidad Nacional Abierta y a Distancia
(UNAD).
INTRODUCCIÓN
El concepto de Audio Digital se refiere específicamente a la codificación digital de

una señal eléctrica que representa una onda sonora. Este proceso consiste en una
secuencia de valores enteros que se obtienen de procesos principales: 1) el
muestreo y 2) La cuantificación o la captura digital de la señal eléctrica.
El muestreo básicamente consiste en determinar la amplitud de una señal eléctrica a

intervalos de tiempo regulares, lo que se denomina tasa de muestreo.
Una vez se determina el nivel de las muestras fijadas, la cuantificación convierte

estas en el proceso de muestreo, normalmente, un nivel de tensión, en un valor
entero de rango finito y predeterminado.
Debido a estos procesos, se crean y patentan distintos formatos de reproducción

para audio digital como lo es el PCM que maneja 44,1 kHz de tasa de muestreo y
cuantificación lineal de 16 bits y permite registrar señales analógicas con
componentes hasta los 20 kHz. A lo largo del curso se profundizará e indagara
mucho más al respecto.
UNIDAD 1. ANÁLOGO VS. DIGITAL.
Introducción
Muchos años atrás el mundo conoce el audio como elemento clave para
reproducciones sonoras y audiovisuales de todo tipo. De éste se crean tecnologías
que manipulan de manera profesional y con alta calidad los patrones y
características propias del mundo análogo. Pero desde que se conoce y trabaja
digitalmente la señal sonora, el panorama ha cambiado significativamente al punto
de desplazar a la ya consolidada maquinaria analógica.
CAPITULO 1: INTRODUCCIÓN AL AUDIO DIGITAL
Lección 1: Audio análogo.
En un principio, las grabaciones sonoras empleaban técnicas en las que se variaba

algún parámetro magnético, eléctrico o mecánico así como varía el gradiente de
presión del aire al momento de grabar. La tensión procedente de un micrófono
constituye una versión análoga de la presión del aire o a veces de la velocidad, pero
ambos varían en la misma escala temporal. El magnetismo de una cinta o la
deflexión del surco de un disco son el resultado análogo de la señal eléctrica de
entrada. En los sistemas de grabación, existe una correspondencia equivalente entre

el tiempo de la señal de entrada y la distancia a lo largo del medio o soporte físico.
A pesar que los equipos analógicos modernos puedan parecer más sofisticados los
principios empleados siguen siendo los mismos, tan solo ocurre que la tecnología es
ahora más avanzada.
En un sistema analógico, la información se obtiene mediante alguna variación infinita

de un parámetro continuo, como puede ser la tensión en un hilo o la intensidad de
flujo de una cinta. En un equipo de grabación, la distancia a lo largo del soporte físico
es también un elemento continuo y equivalente al tiempo.
Dichas características suponen la debilidad principal de las señales analógicas.

Dentro del ancho de banda permisible cualquier forma de onda es válida. Si la
velocidad del soporte no es constante, una forma de onda que sea válida pasara a
ser otra forma de onda también valida. No es posible detectar un error de base de
tiempos en un sistema analógico. Es característico de los sistemas analógicos el
hecho de que las alteraciones no puedan ser separadas de la señal original, por lo
que nada puede hacerse al respecto. Al final de un sistema análogo determinado, la
señal estará formada por la suma de todas las alteraciones introducidas en cada
etapa por cada etapa por las que haya pasado. Esto limita el número de etapas por
las que una señal puede pasar sin que quede inutilizable.
Lección 2: Audio digital.
Un equipo ideal de grabación de audio digital tiene las mismas características que
uno de características analógicas, ambos son totalmente transparentes y reproducen
la forma de onda introducida originalmente sin error alguno. No hay más que
comparar equipos analógicos y digitales de alta calidad y utilizar las mismas señales
para darse cuenta del grado de transparencia que tienen los equipos modernos. No
hace falta decir que, en el mundo real, rara vez se dan las condiciones ideales, por lo
que tanto los equipos analógicos como los digitales se quedan cortos con respecto a
lo que sería lo ideal. Ocurre simplemente que el audio digital se acerca algo más al
ideal que el analógico a un costo más reducido, o bien, si así lo decide el diseñador,
puede tener el mismo rendimiento que el analógico, pero con un coste mucho más
reducido.
Imagen 1, Software de Audio Digital.
Existe un sistema, conocido como modulación por codificación de impulsos PCM

(pulse code modulation), que se usa prácticamente de forma universal. La Figura 1
muestra el funcionamiento de la PCM. El eje temporal queda representado de forma
discreta, o paso a paso, y la forma de onda se obtiene a través de medidas hechas a
intervalos regulares. A este proceso se le denomina muestreo y a la frecuencia con
que se toman las muestras se denomina frecuencia de muestreo, FS. La frecuencia

de muestreo es generalmente fija y se procura en todo momento que el reloj de
muestreo no presente jitter, de modo que cada muestra se haga a intervalos de
tiempo exactamente regulares. Si se produce algún error de base de tiempo, variaran
los instantes en los que las muestras llegan, pero este efecto puede eliminarse
almacenando las muestras temporalmente en una memoria y leyéndolas utilizando
una señal de reloj estable generada localmente. A este proceso se le denomina
corrección de la base de tiempos y debe utilizarse en todos los sistemas digitales de
audio diseñados correctamente. Es evidente que el error de base de tiempo no
queda reducido, sino que se elimina por completo. Como resultado, no es necesario
medir el nivel de fluctuación y trémolo (wow/flutter) en un equipo de grabación digital,
puesto que no se producen.
Para los que no conocen el audio digital a fondo les preocupa el hecho de que el
muestreo se lleve parte de una señal debido a que no se da cuenta de todo lo que
ocurre entre las muestras. Así seria en un sistema con un ancho de banda infinito,
pero ninguna señal de audio analógica tiene un ancho de banda infinito. Todas las
fuentes de señales analógicas procedentes de micrófonos, reproductores de cintas o
capsulas fonocaptoras tienen un límite de respuesta en frecuencia, como ocurre con
nuestro oído. Cuando una señal tiene un ancho de banda finito, la frecuencia a la que
puede variar es limitada y es posible predecir el modo en que cambiará. Cuando una
forma de onda sólo puede cambiar entre muestras de una sola manera, únicamente
hace falta transmitir las muestras y, a partir de ellas, poder reconstruir la forma de
onda original.
Figura 1. Funcionamiento de la PCM.
La Figura 1 indica además que cada muestra es también discreta o está

representada paso a paso. La longitud de la muestra, que será proporcional a la
tensión de la forma de onda de audio, queda representada con un número entero.
Este proceso es conocido como la cuantificación y tiene como resultado una
aproximación, pero la magnitud del error puede controlarse hasta que llega a ser
despreciable. La ventaja de utilizar números enteros consiste en que no están
sujetos a sufrir derivaciones. Si puede llevarse un número entero de un lugar a otro
sin que se produzca ningún error numérico, no se producirá ningún cambio en
absoluto. Al describir numéricamente las formas de onda de audio, la información
original queda expresada de tal forma que se resiste más a cambios no deseados.
Lección 3: Propiedades.
En pocas palabras el Audio Digital lleva la forma de onda original de forma numérica.
El número de la muestra es el valor proporcional al tiempo y la magnitud de la
muestra es la variable proporcional a la presión en el micrófono.
Puesto que ambos ejes de la forma de onda representada digitalmente son discretos,
la forma de onda puede reconstruirse con precisión a partir de números como si se
estuviera representando sobre papel milimetrado. Si deseamos mayor precisión, tan
solo necesitaremos papel cuyos cuadrados sean de menor tamaño. Evidentemente,
se necesitaran entonces más números y cada uno de ellos podría variar a lo largo de
un rango mayor.
Fácilmente se podría afirma que la forma de onda de audio se transmite en un

equipo de grabación digital como si la tensión hubiese sido medida a intervalos
regulares con un medidor digital y se hubieran anotado las lecturas en un papel. La
velocidad a la que se han hecho las lecturas y la precisión del medidor son los únicos
factores que determinan la calidad, puesto que una vez un parámetro queda
expresado como números discretos, es posible transportar una serie de tales
números sin cambio alguno. Obviamente, y siguiendo con este ejemplo, la caligrafía
empleada y la calidad de papel utilizado no tiene ningún efecto en la información. La
calidad viene determinada solamente por la precisión de la conversión y es
independiente de la calidad que tenga el camino de la señal.
Lección 4: Sistema binario.
Generalmente estamos habituados a sistemas decimales o en base diez debido a

contamos en total con diez dedos en nuestras manos. Existen otras bases numéricas
como la duodecimal y sus múltiplos. El sistema binario es el más reducido, ya que
cuenta con solo dos dígitos, el 0 (cero) y el 1 (uno). El término “dígitos binarios” se
representa de forma universal como “bits” del inglés, BInary digiTS. Estos son
interpretados en los circuitos de conmutación mediante un estado activo on y un
estado inactivo off. De esta forma, teniendo solo dos estados, la probabilidad de error
es mínima.
Figura 2. Sistema Binario.
En los sistemas decimales, los dígitos que componen un número, representan las
unidades, las decenas, las centenas, los millares, etc. La Figura 2 muestra que, en el
sistema binario, los bits representan al 1, 2, 4, 8, 16, etc. Un número binario
compuesto por múltiples dígitos suele denominarse palabra y al número de bits de
dicha palabra se le denomina longitud de palabra. Al bit de la derecha se le
denomina bit menos significativo o LSB (least significant bit), mientras que al bit del
extremo izquierdo se le llama bit más significativo o MSB (most significant bit). Para
el sistema binario se necesitan un mayor número de dígitos que para sistema
decimal, pero son más fáciles de manejar. Una palabra de 8 bits se denomina byte
que proviene de la expresión inglesa by eigth, o por ocho. La capacidad de las
memorias y de los sistemas digitales de almacenamiento se miden en bytes, pero
con el fin d evitar números muy extensos, se suelen utilizar otros múltiplos como el
kilobyte (KB), el megabyte (MB), el gigabyte (GB), y por nuestros días, cada vez más
el terabyte (TB). Dado que las direcciones de memoria sin en sí mismas números
binarios, la longitud de palabra limita el valor de dirección. Este valor se calcula
elevando dos a la potencia de la longitud de palabra. Así una palabra de 4 bits tiene
16 combinaciones diferentes y puede direccionar una memoria compuesta de 16
posiciones. Una palabra de 10 bits tiene 1.024 combinaciones, lo que se aproxima a
1.000. En terminología digital 1K = 1.024, por tanto, una memoria de un kilobyte
contiene 1.024 bytes. Un megabyte (1MB) contiene 1.024 kilobytes y una gigabyte
contiene 1.024 megabytes.
Figura 3. Consecuencias de la transmisión.
En un sistema de audio digital, el número entero que representa la longitud de la

muestra se expresa en sistema binario. Las señales enviadas tienen dos estados y
conmutan en tiempos predeterminados de acuerdo con una señal de reloj estable. La
Figura 3 muestra las consecuencias que tiene este tipo de transmisión. Si la señal
binaria resulta degradada por el ruido, este será rechazado por el receptor, que se
encarga de discriminar la señal atendiendo únicamente si su nivel está por encima o
por debajo del nivel de umbral intermedio, proceso que se conoce como slicing o
troceado.
Figura 4. Señales binarias para transportar muestras de audio.

Existen dos formas de poder utilizar las señales binarias con el objeto de transportar
muestras de audio, como muestra la Figura 4. Cuando cada uno de los dígitos de un
número binario es transportado a través de un hilo diferente, se habla de transmisión
en paralelo. El estado de los hilos cambia de acuerdo con la frecuencia de muestreo.
La utilización de múltiples hilos resulta incomoda, especialmente si la longitud de
palabra es extensa, por lo que es posible utilizar un solo hilo en el que los dígitos
sucesivos de cada muestra son enviados en serie. Esta es la modulación por
codificación de impulsos. Es evidente que la frecuencia de reloj debe ser ahora
mayor que la frecuencia de muestreo. Aunque la transmisión digital de audio elimina
los errores de ruido y de base de tiempos, tiene la desventaja que solo un canal de
audio de alta calidad requiere aproximadamente 1 millón de bits por segundo. El
audio digital solo puede utilizarse cuando dicha cantidad de datos pueda manejarse
de forma económica. Son posibles otros tipos de aplicaciones cuando los medios de
reducción de tal cantidad de datos sean económicos.
Lección 5: Características Digitales.
A la pregunta ¿Por Qué Digital? se hace referencia a dos respuestas principales y

con el mismo grado de importancia dependiendo del punto de vista en que se mire.
1) La calidad de reproducción de un sistema digital de audio bien diseñado es

independiente del medio y depende únicamente de la calidad de los procesos
de conversión.
2) La conversión del audio al terreno digital permite grandes oportunidades que
le son negadas a las señales analógicas.
Si es de interés la calidad del sonido se juzgara la primera de las respuestas como la

de mayor relevancia. Si es posible disponer de conversores de buena calidad, se
puede eliminar la mayoría de los inconvenientes que presenta la grabación análoga,
obteniendo grandes ventajas. Es necesario realizar un gran esfuerzo en el diseño de
los conversores, mientras que para aquellas partes del sistema que se ocupan del
manejo de datos se necesita solo profesionalidad. Hoy ya son historia problemas
como la fluctuación, el ruido de partículas, las pérdidas de señales, los ruidos de

modulación, los errores de fase entre canales y el deterioro en los HF (high
frecuency). Cuando se copia una grabación digital, aparecen los mismos números en
la copia, no parece un duplicado si no una especie de clonación. Si no es posible
distinguir la copia del original, no se habrá producido ninguna perdida en la
generación. Las grabaciones digitales pueden copiarse indefinidamente sin que haya
pérdida en la calidad.
Una vez que el audio se encuentra en el campo digital, se convierte en datos y no es

posible distinguirlos de cualquier otro tipo de datos. Es posible utilizar en audio las
técnicas y los sistemas empleados en otras industrias cuyos fines son diferentes.
La fusión del audio digital y la informática tienen dos caras. Mientras el audio puede
aprovecharse de la tecnología de la RAM y del disco duro pertenecientes a la
industria informática, el Disco Compacto y semejantes ha sido utilizado en la
fabricación del CD ROM y de la RDAT para conseguir el proceso DDS digital data
storage o almacenamiento digital de datos.
CAPITULO 2: PROCESOS DE AUDIO DIGITAL.
Lección 6: Estructura general.
Aunque el campo del audio digital es muy amplio, no debe ser necesariamente difícil.
Todo proceso debe subdividirse en pasos más pequeños y fáciles de seguir, como se
verá en los capítulos y unidades siguientes. Una vez esté comprendida la estructura
general de los dispositivos digitales, se podrá tener una perspectiva mejor de los
temas siguientes.
Figura 5. Sencillo sistema digital de audio.
La Figura 5(a) muestra un sistema digital básico de audio. Se trata de una conexión
punto a punto capaz de transmitir señales de audio analógicas de un lugar a otro. Se
compone de un par de conversores y de hardware para codificar y decodificar las
muestras. Se necesita cierta estandarización en la transmisión en serie de modo que
sea posible conectar entre sí varios dispositivos.
Las señales analógicas que entran en el sistema son convertidas por el conversor
análogo-digital ADC en muestras expresadas en números binarios. Una muestra
típica tendría una longitud de palabra de 16 bits. La muestra se introduce en paralelo
en un registro de desplazamiento el cual se desplaza con una señal de reloj que va a
16 veces la frecuencia de muestreo. Los datos se envían en serie al otro extremo de
la línea en donde un fragmentador (slaicing) rechaza el ruido captado en la señal.
Los datos que han sido fragmentados son trasladados al registro de desplazamiento
receptor con una señal de reloj de bits. Una vez cada 16 bits el registro de
desplazamiento contiene una muestra completa que es leída por el reloj de
frecuencia de muestreo, o reloj de palabras y es enviada al conversor digital-análogo
DAC, que a su vez convierte la muestra de nuevo en un valor de tensión analógico.
Si se realiza un estudio poco riguroso, podríamos concluir diciendo que si los

conversores tuvieran una calidad transparente, el sistema sería ideal. Esto es
incorrecto. Como se indico en la Figura 3 el ruido puede variar la sincronización de
una señal muestreada. A pesar que este sistema rechaza el ruido que amenaza con
variar el valor numérico de las muestras, no es capaz de evitar que el ruido ocasione
jitter en la recepción de la señal del reloj de palabras. La existencia de ruido en la
señal del reloj de palabras significa que las muestras no son convertidas con una
base de tiempos regular y el desajuste que esto provoca puede ser percibido. Así no
se evita que las características análogas de la interconexión afecten la forma de
onda reproducida y por tanto, el sistema no es del todo digital.
El problema del jitter se resuelve en la Figura 5(b) con la incorporación de un bucle

de sincronización de fase, formado por un oscilador que se sincroniza a sí mismo con
la frecuencia media de la señal de reloj, pero que filtra el jitter instantáneo. El
funcionamiento de un bucle de sincronización de fase es análogo a la función que
tiene el circuito volante de un motor con pistones. Las muestras pasan entonces al
conversor con un espaciado regular y el desajuste ya no es perceptible.
Lección 7: El muestreador.
El sistema de la Figura 5 se describe aun más en la Figura 6 con la incorporación de

una memoria aleatoria RAM. La función de este dispositivo está determinada por la
forma en que se controla la dirección de la RAM. Si la dirección de la RAM aumenta
en uno cada vez que se almacena en ella una muestra procedente del ADC, es
posible realizar una grabación durante un breve periodo de tiempo hasta que la RAM
esté completa.
Figura 6. Sistema de audio digital mejorado.
La grabación puede reproducirse repitiendo la secuencia de direcciones a la misma

frecuencia de reloj, pero leyendo de la memoria al DAC. El resultado se denomina
muestreador. Si se hace funcionar el reloj de reproducción a distintas frecuencias, se
puede alterar el tono y la duración del sonido reproducido. A una frecuencia de 1
millón de bits por segundo, 1 Megabite de memoria da solo para 8 segundos de
grabación, por lo que los muestreadores están restringidos a un tiempo de
reproducción muy breve, aunque éste pueda ampliarse utilizando métodos de
reducción de datos.
Lección 8: Delay programable.
Si se utiliza la RAM de una forma diferente, es posible escribir y leer en ella al mismo
tiempo. El dispositivo se convierte así en un retardador de audio. Controlando la
relación entre las direcciones se varía el retardo. Las direcciones son generadas por
contadores que vuelven a 0 (cero) una vez alcanzado el punto máximo de conteo.
Como resultado, el espacio de la memoria adopta un aspecto circular, tal como
muestra la Figura 7. Las direcciones de lectura y escritura son controladas por un
reloj común y se persiguen una a la otra en sentido. Si la dirección de lectura sigue
muy de cerca a la de escritura el retardo será breve, si se sitúa justo delante de la
dirección de escritura se alcanzara el valor máximo de retardo.
Figura 7. Dispositivo con retardo de audio.
Los retardos programables son de gran utilidad para los estudios de televisión ya que
permite la alineación de las señales de audio con las de video que hayan sido
retardadas en varios procesos. También pueden utilizarse en auditorios con el fin de
alinear el sonido procedente de distintos altavoces.
Lección 9: Compresión de tiempo.
Cuando las muestras son convertidas, el ADC debe funcionar a una frecuencia de
reloj constante y lleva a la salida una cadena continua de muestras. La compresión
de tiempo permite dividir la cadena de muestras en bloques con el fin de poder
manejarlos mejor.
Figura 8. ADC alimenta un par de RAM.

La Figura 8 muestra el modo en que un ADC alimenta un par de RAM. Cuando el

ADC se encuentra escribiendo en una de ellas, la otra puede ser leída, y viceversa.
En cuanto la primera de las RAM se llena, la salida del ADC conmuta a la entrada de
la otra RAM de modo que no se produzca ninguna pérdida de muestras. Entonces
puede leerse la primera de las RAM a una frecuencia de reloj superior a la de
muestreo. Así se tarda menos tiempo de leer la RAM que escribirla y la salida del
sistema se detiene entonces hasta que la segunda RAM esta completa. Las
muestras se encuentran ahora comprimidas en el tiempo. En lugar de ser una
cadena continua difícil de manejar las muestras se encuentran ahora distribuidas en
bloques, entre los cuales existen espacios adecuados.
Por consiguiente, es posible invertir cualquier compresión de tiempo mediante el

proceso de expansión de tiempo. Las muestras se escriben en la RAM con la llegada
de la frecuencia de reloj de entrada, pero se leen a la frecuencia de muestreo
estándar. A menos que exista un fallo en el diseño, la compresión de tiempo es
totalmente imperceptible. En un equipo de grabación, la etapa de expansión de
tiempo puede combinarse con la etapa de corrección de la base de tiempos, con el
fin de poder eliminar a la vez las variaciones de velocidad del soporte. La técnica de
compresión de tiempo es utilizada universalmente en la grabación digital de audio. La
velocidad instantánea de los datos en el soporte no es la misma que la de los
conversores, aunque evidentemente, la velocidad media debe ser la misma.
Lección 10: Sincronización.
La transferencia de muestras entre dispositivos digitales de audio en tiempo real es

únicamente posible si ambos utilizan una frecuencia de muestro común y están
sincronizados. Un equipo de grabación digital de audio debe ser capaz, de
sincronizar una frecuencia de muestreo de una señal de entrada para poder grabar
las muestras. Normalmente es necesario que dicho equipo de grabación pueda
reproducir enganchado a una frecuencia de muestreo de referencia externa si, por
ejemplo, se desea conectar a un mezclador digital. Este proceso ya es bastante

común en los sistemas de video y se está extendiendo al audio digital.
En los equipos de grabación multipista las distintas pistas pueden sincronizarse con
la precisión de la muestra de modo que no se presenten errores de temporización
entre las pistas. Otros transportes adicionales pueden actuar como esclavos del
primero con el mismo grado de precisión en caso que se necesiten más pistas. En
los equipos estéreos de grabación, son eliminados los desplazamientos de imagen
provocados por errores de fase.
Lección 11: Corrección.
El grado de percepción de un error de bit depende del bit afectado de una muestra.
Si estuviera defectuoso el LSB de una muestra perteneciente a un pasaje musical
cuyo volumen es elevado, el efecto pasaría totalmente enmascarado y sería difícil
detectarlo. Por el contrario, si el MSB de una determinada muestra resultara erróneo
en un pasaje tranquilo, sería imposible no percatarse del transitorio de gran magnitud
resultante. Evidentemente, es necesario algún medio para conseguir que los errores
provocados por el soporte sean imperceptibles. Esta es la finalidad de la corrección
de errores.
En el sistema binario, un bit presenta sólo 2 estados. Si uno de ellos es incorrecto,

tan sólo hará falta invertirlo para que sea el correcto. Así, el proceso de corrección es
simple y perfecto. La principal dificultad se encuentra en identificar los bits que están
defectuosos. Esto se consigue añadiendo bits redundantes para la codificación de los
datos. La redundancia no está confinada a la tecnología digital, por ejemplo los
aviones dispones de varios motores y los vehículos llevan dos sistemas de frenado,
así cuantos más fallos haya que tratar, más redundancia será necesaria.
En el audio digital el grado de error que puede conseguirse es proporcional al grado

de redundancia dentro de este límite, las muestras vuelven a adoptar su valor exacto
original. Por consiguiente, las muestras corregidas resultan imperceptibles. Si el gado
de error excede el de redundancia, la corrección no es posible y, con el fin de q se

reduzca una degradación gradual se ha de emplear la técnica de ocultación. La
ocultación es un proceso mediante el cual puede calcularse el valor de una muestra
que se ha perdido a partir de las que la rodean. El valor de la muestra calculado no
tiene por qué ser exactamente igual que el original y por tanto, bajo ciertas
circunstancias, la ocultación puede ser percibida especialmente si es frecuente, no
obstante, es un sistema bien diseñado, las ocultaciones se producen con una
frecuencia despreciable a no ser que se produzca un fallo o un problema
propiamente dicho.
CAPITULO 3: CODIFICACIÓN.
Lección 12: Codificación de canal.
En la mayoría de los equipos de grabación utilizados para almacenar información

digital, el soporte lleva una pista que reproduce una sola forma de onda.
Evidentemente las palabras de datos que representan las muestras de audio
contienen muchos bits y por tanto, han de grabarse en serie, bit a bit. Algunos
soportes como el CD, tienen una sola pista, por lo que debe ser totalmente
independiente.
En el audio digital, un valor común de muestra es todo cero, que se corresponde con
el silencio. Si se carga un registro de desplazamiento con todo en ceros y se sacan
en serie, la salida se mantiene a un nivel bajo constante, y no se grabara nada en la
pista.
El proceso de modulación de los datos en serie para que se auto-sincronicen con la

frecuencia del reloj se denomina codificación del canal. La codificación del canal
también modela el espectro de la forma de onda serializada con el fin de hacer que
sea más eficaz. Con un buen código de canal, se pueden almacenar mayor cantidad
de datos en un determinado soporte. El modelado del espectro se utiliza en los CDs
para evitar que los datos interfieran en los servos de enfoque y de seguimiento de
pista. La codificación del canal también es necesaria para la radiodifusión de sonido

digital DAB (Digital Audio Broadcasting), donde el modelado del espectro es un
requisito evidente a fin de evitar interferencias con otros servicios.
Lección 13: Reducción de datos.
El enmascaramiento auditivo es un proceso que selecciona solo las frecuencias

dominantes del espectro aplicado en el odio. La reducción de datos se aprovecha de
este proceso a fin de reducir la cantidad de datos necesarios para llevar sonido con
una determinada calidad sonora, imitando así el funcionamiento del mecanismo
auditivo.
La reducción de datos es esencial en servicios tales como la DAB, donde el ancho

de banda necesario para emitir la PCM regular, Modulación por impulsos codificados
(del inglés Pulse-Code Modulation), sería excesivo. Puede utilizarse para reducir el
consumo exagerado del soporte en equipos de grabación comerciales. Una
reducción de aproximadamente un cuarto o quinto de la velocidad de transferencia
de datos en PCM puede resultar prácticamente imperceptible en sistemas de
reducción de datos de alta calidad, ya que el error existente entre la forma de onda
original y la reproducida, de hecho, puede ser enmascarado. Otros factores de
reducción mayores pueden tener como resultado una pérdida de calidad
inevitablemente, que puede ser aceptable para ciertas aplicaciones, como son las
comunicaciones pero no para la reproducción musical de alta calidad.
La salida de una unidad de reducción de datos sigue siendo datos binarios, pero ya
no están en PCM regular, por lo que no puede introducirse en un DAC normal sin
pasar antes por un decodificador de adaptación cuya salida sea un PCM
convencional. La combinación de una unidad de reducción de datos y un
decodificador tiene el nombre de códec. El funcionamiento de un códec se
comprueba de una sola pasada como si se utilizara en DAB o en una grabación de
una sola generación. No tiene por qué obtenerse el mismo funcionamiento si se
conectan en cascada varios códecs, sobre todo si son de diferentes tipos. Si se
ecualiza una señal de audio que ha pasado por un códec de reducción de datos, el
nivel de anomalías puede elevarse por encima del nivel umbral de enmascaramiento.
Como resultado la reducción de datos puede no ser adecuada para grabar material
original antes de la fase de post-producción.
Lección 14: Adaptador PCM.
El adaptador PCM fue una de las primeras soluciones para grabar el gran ancho de
banda de las señales de audio PCM antes de que se ideara la grabación digital de
alta densidad. La Figura 9 muestra los componentes esenciales de un equipo digital
de grabación de audio que utiliza esta técnica. Las señales de audio analógicas son
convertidas en digital y comprimidas en el tiempo con el fin de que se ajusten a las
partes de la forma de onda de video que no están en blanco.
Figura 9. Componentes esenciales en equipo digital de grabación audio PCM.

Las muestras comprimidas en el tiempo pasan por el proceso de redistribución de

pares e impares con el fin de poder utilizar la técnica de la ocultación. Seguidamente,
se añade redundancia y los datos para ser grabados. Los datos se mandan en serie
y se colocan en la línea activa de la señal de video como niveles de blanco y negro,
sistema que se denomina modulación por desplazamiento de frecuencia (FSK). Esto
hace el papel del codificador de canales de un grabador digital convencional.
Con el objeto de sincronizar la reproducción con la frecuencia de referencia y

simplificar la circuitería, se graba un número entero de muestras en cada línea que
no esté en blanco. La frecuencia de muestreo normal de 44,1 kHz se obtiene
grabando tres muestras por la línea sobre 245 líneas activas a 60 Hz. De este modo,
la frecuencia de muestreo se engancha con las frecuencias de sincronización de
video y se consigue que la cinta se mueva a la velocidad correcta, enviando las
señales de sincronización del grabador de video generadas en el adaptador PCM.
Lección 15: Radiodifusión digital de audio.
La radiodifusión digital de audio funciona mediante la modulación del transmisor con

datos de audio en lugar de una forma de onda analógica. La FM analógica funciona
razonablemente bien para recepción, donde puede mantenerse una antena
direccional decente en un lugar seleccionado, pero presenta muchos problemas
cuando la recepción es móvil, donde no existe ningún control sobre la localización y
donde no cabe plantearse el tema de una gran antena direccionable. El mayor
inconveniente de la radiodifusión es la recepción por trayectoria múltiple, donde la
señal directa se recibe junto con ecos retardados procedentes de grandes cuerpos
reflectores tales como edificios de gran altura. A ciertas longitudes de onda, la
reflexión se recibe en antifaces con respecto a la señal directa y se produce una
atenuación que provoca un vacío en el espectro de repetición. En un sistema
analógico, las pérdidas de señal son inevitables.
POSIBILIDADES
Aunque la calidad del audio digital es innegable sus posibilidades pueden resultar
más importantes a largo plazo. Una vez que el audio se convierte en datos, hay gran
libertad para almacenarlos y procesarlos en equipos computarizados. Las
restricciones innecesarias en los equipos haciendo una implementación digital a
partir de un sistema analógico. El sistema analógico evoluciono para funcionar dentro
de las restricciones impuestas por la tecnología. Coger ese mismo sistema y
digitalizarlo sería un error.
Parte del problema se encuentra en el hecho de que, tradicionalmente, los

fabricantes de equipos de audio profesionales se han especializado en un área,
dejando a los usuarios que acoplen los sistemas procedentes de distintos
suministradores. Es probable q los fabricantes de mezcladores no tengan un
conocimiento experto de los procesos de grabación y los fabricantes de equipos de
grabación de cintas no sepan mucho de unidades y sistemas digitales.
Por el contrario, la industria informática ha tenido siempre una visión de sistemas y

configuran los discos, las RAM, los procesadores y los enlaces de comunicaciones
para cumplir un determinado requisito, según lo estimen necesario. Ahora que las
señales de audio se han convertido en una forma de datos, este enfoque es el que
se está utilizando para resolver los problemas del audio.
Fuentes Documentales de la Unidad 1
Watkinson, John. (1994). An Introduction to Digital Audio. Woburn, MA.
Audio Digital, Wikipedia, http://es.wikipedia.org/wiki/Audio_digital

UNIDAD 2: TRANSDUCCIÓN A/D, D/A.
Introducción
Una vez consolidado el audio digital en un mundo completamente tecnológico y

automatizado, se genera la necesidad de hacer una transducción de orden digital a
todas las señales sonoras posibles, con las que podamos trabajar y manipular de
forma fácil y abierta. Para llegar a esto, existen procesos específicos que, diseñados
y perfeccionados por años, nos dan las herramientas para convertir señales sonoras
a impulsos digitales con calidad y características determinadas y, de igual forma,
archivos y muestras de audio digitales a formas de onda y señales perceptibles al
oído humano por medio de transductores mecánico-electro-acústicos. Siendo ésta
una industria a la vanguardia de la modernidad, sus investigaciones e innovaciones
estarán siempre “a la orden del día”.
CAPITULO 4: PROCESOS DE CONVERSIÓN
Lección 16. Rango auditivo.
La agudeza del oído humano es capaz de detectar cantidades minúsculas de

distorsión y aceptar un enorme rango dinámico. El único criterio de calidad del que se
dispone consiste en el hecho de que si el oído es incapaz de detectar deformación
alguna, diremos que el sonido reproducido es perfecto por tanto, el criterio de calidad
es completamente subjetivo y solo puede comprobarse mediante pruebas de
audición. No obstante, cualquier característica de una señal que pueda escucharse
también puede medirse con un instrumento apropiado. Las pruebas subjetivas nos
pueden indicar el grado de sensibilidad que debe tener el instrumento.
Imagen 2. Estructura del Oído.
El sentido al que denominamos oído, es el resultado de una serie de procesos

acústicos, mecánicos, nerviosos y mentales dentro de la combinación oído/cerebro,
lo que nos lleva al término de psicoacústica.
Imagen 3. Rango Auditivo.
Normalmente el grado de sensibilidad del oído humano es mayor entre los 2 kHz y
los 5 kHz aproximadamente y, aunque algunas personas pueden detectar 20 kHz a
un nivel considerable, existen varias pruebas que sugieren que la mayoría de los
oyentes no pueden distinguir si el límite superior de frecuencias del sonido se
encuentra en los 20 kHz o los 16 kHz. Recientemente se ha comprobado que la
reproducción de frecuencias por debajo de los 20 kHz mejora las cualidades de
realidad y ambiente sonoro. El rango dinámico del oído tiene una respuesta
logarítmica que sobrepasa claramente los 100 dB.
Lección 17. Capacidad del audio análogo.
Cualquier fuente de audio análogo puede ser caracterizada por un determinado

ancho de banda y una relación señal-ruido dada. Si se pone en serie con dicha
fuente un canal digital bien diseñado con un ancho de banda superior y una relación
señal-ruido también mayor, sólo sería necesario ajustar los niveles correctamente y
la señal analógica no estaría sujeta a ninguna pérdida de información en absoluto. El
nivel de recorte digital se encuentra por encima de la señal analógica de mayor
amplitud, el nivel mínimo de ruido digital se encuentra por debajo del ruido inherente
de la señal y la respuesta de alta y baja frecuencia del canal digital va más allá de las
frecuencias de la señal análoga. El canal digital tiene una ventana más ancha de lo
que necesita la señal analógica y sus extremos no pueden ser explorados por dicha
señal.
El efecto de ventana ancha es evidente en determinados discos compactos que han

sido fabricados a partir de cintas maestras. Cuando se realiza con esta técnica el
reproductor digital o CD reproduce fielmente el siseo o hiss producido por la cinta.
Las pérdidas de señal y los aplastamientos de HF de la copia maestra analógica, lo
cual, por comparación, refleja el grado de transparencia de todo el sistema digital de
grabación maestra y de reproducción.
El sonido transmitido por un sistema digital fluye en forma de cadena de bits. Debido
a que los bits son discretos, es fácil cuantificar el flujo con un solo contar el numero
por segundo. Es más difícil cuantificar la cantidad de información de una señal
analógica (por ejem. un micrófono) pero, si se hiciera utilizando las mismas unidades,
sería posible determinar qué régimen de bits sería necesario para transmitir dicha
señal sin pérdida de información, es decir, ensanchar la ventana lo suficiente. Si se
puede enviar una señal sin pérdida de información y sin captar señales no deseadas
a lo largo del recorrido, habrá sido transmitida perfectamente. La conexión entre las
señales analógicas y la capacidad de información fue hecha por Shannon. Los
principios son sencillos y ofrecen una idea inmediata del funcionamiento y de las
posibilidades relativas y de los distintos métodos de modulación, incluida la
digitalización.
Figura 10. Señal analógica con ruido sobrepuesto.

La Figura 10 muestra una señal analógica con cierto grado de ruido sobrepuesto,
como ocurre con todas las señales de audio reales. El ruido se define como una
señal aleatoria sobrepuesta que nos se correlaciona con la señal deseada. El ruido
es aleatorio y, por tanto, la tención real de la señal deseada resulta incierta. Puede
encontrarse en cualquier punto dentro del rango de amplitud del ruido. Ejemplo, si la
amplitud de la señal es 16 veces la del ruido solo será posible transmitir 16 niveles
de señal diferentes sin ambigüedad, puesto que los niveles deben ser los bastante
diferentes como para que el ruido no haga que uno se asemeje a otro. Es posible
transmitir 16 niveles distintos mediante el número total de combinaciones de 4 bits de
datos, quedando establecida así la conexión entre los dominios analógico y
cuantificado.
La elección de la frecuencia de muestreo, o la velocidad a la que la tención de la

señal ha de ser examinada para transmitir la información de una señal variable, es
importante para cualquier sistema, si es demasiado baja, la señal se verá degradada
y, si es demasiado alta, aumentara innecesariamente el numero de muestras que se
han de grabar, y lo mismo ocurrirá con el costo del sistema. Si se multiplica el
número de bits necesarios para expresar la tensión de la señal por la velocidad a la
que debe actualizarse el proceso, se podrá determinar la velocidad de transferencia
de bits del flujo de datos digitales resultante de una señal analógica concreta.
Lección 18. Descripción del proceso de conversión.
La entrada de un conversor es una forma de onda de tiempo y tensión continuos, que

se convierte en un formato de tiempo y tensión discretos mediante la combinación de
los procesos de muestreo y cuantificación. Estos dos procesos son totalmente
independientes y pueden llevarse a cabo en cualquier orden y tratarse por separado
con cierto detalle. La Figura 11(a) ofrece un muestreador analógico que precede a un
cuantificador, mientras que en (b) se muestra un cuantificador asíncrono que precede
a un muestreador digital. Idealmente, ambos darán los mismos resultados, en la
práctica, cada uno presenta ventajas diferentes así como deficiencias. Ambas
configuraciones pueden encontrarse en equipos reales.
Figura 11. Muestreador analógico y muestreador digital.
Dado que el muestreo y la cuantificación son ortogonales, el orden en que tienen

lugar no es relevante. En (a) el muestreo se realiza primero y las muestras son
cuantificadas. Esto es normal en los conversores de audio. En (b) la señal de entrada
analógica es cuantificada en un código binario asíncrono. El muestreo tiene lugar
cuando este código es retenido en los flancos de la señal de reloj de muestreo. Esta
configuración es universal para los conversores de video.
CAPITULO 5: MUESTREO Y ALIASING
Lección 19. Descripción.
El muestreo de audio debe ser regular debido a que el proceso de corrección de la

base de tiempos que tiene lugar antes de la conversión de nuevo a forma analógica
requiere un proceso original regular. El proceso de muestreo se origina con un tren
de impulsos como el que se muestra en la Figura 12(a) con una amplitud y un
periodo constante, la amplitud de la forma de onda de audio modula el tren de
impulsos de forma muy similar a como la portadora es modulada en un radio
transmisor de AM. Debe tenerse cuidado para evitar sobremodular el tren de
impulsos como ocurre en (b). Esto se consigue aplicando un offset de CC a la forma
de onda analógica, de manera que el silencio se corresponda con un nivel que
alcance la mitad de los impulsos, como se indica en (c). Los recortes producidos por
cualquier nivel de entrada excesivo serán entonces simétricos.
Figura 12. Proceso de muestreo.
Del mismo modo que la radio de AM produce bandas laterales o imágenes por
encima y por debajo de la portadora, el muestreo también produce bandas laterales
aunque la portadora es ahora un tren de impulsos y tiene una serie infinita de
armónicos, como se ve en la Figura 13(a). Las bandas laterales se repiten por

encima y por debajo de cada armónico de la frecuencia de muestreo como se
muestra en (b).
Figura 13. Espectro de los impulsos de muestreo.
La señal muestreada puede volver a convertirse al dominio de tiempo continuo con

solo hacerla pasar por un filtro pasa-bajo. Este filtro tiene una respuesta en
frecuencia que impide el paso de las imágenes y solo deja pasar la señal de la banda
de base, totalmente inalterada. Si se considera en el dominio de la frecuencia, ese
filtro se denomina filtro anti-imágenes o filtro de reconstrucción.
Si se suministra una entrada con un ancho de banda excesivo para la frecuencia de

muestreo en uso, las bandas laterales se solaparán, como en la Figura 13(c) y el
resultado es el efecto de aliasing, donde ciertas frecuencias de salida no son iguales
que sus frecuencias de entrada, si no que se convierten en frecuencias de diferencia
como en la Figura 13(d). Como se indica en la Figura 13 el efecto de aliasing no se
produce cuando la frecuencia de entrada es igual o inferior a la mitad de la
frecuencia de muestreo de donde se deriva la regla más fundamental del muestreo,
que consiste en que la frecuencia de muestreo debe ser al menos el doble de la

frecuencia de entrada más alta. La teoría sobre el muestreo se suele atribuir a
Shannon, que la aplicó a la teoría de la información. Aun así suele denominarse
teorema de Nyquist.
Figura 14. Efecto Aliasing.
Aunque el efecto de aliasing ha sido descrito anteriormente en el dominio de la

frecuencia, se puede describir de igual modo en el dominio temporal. En la Figura
14(a), es evidente que la frecuencia de muestreo es adecuada para describir la forma
de onda, pero en (b) no lo es, por lo que se produce el efecto de aliasing.
En la práctica se necesita además un filtro pasa-bajo o anti-aliasing en la entrada

para impedir que las frecuencias superiores a la mitad de la frecuencia de muestreo
pasen a la etapa de muestreo.
Lección 20. Reconstrucción.
Si se utilizan filtros ideales pasa-bajo, anti-aliasing y anti-imágenes y con una

pendiente de corte vertical a la mitad de la frecuencia de muestreo, se obtiene el
espectro ideal que aparece en la Figura 15(a). La respuesta a los impulsos de un
filtro pasa-bajo ideal de fase lineal es una forma de onda sinodal x/x en el dominio
temporal, que se muestra en la Figura 15(b). Dicha forma de onda pasa a través de
cero voltios periódicamente. Si la frecuencia de corte del filtro es la mitad de la
frecuencia de muestreo, el impulso pasa a través de cero en los puntos de toda las
demás muestras. Puede verse en la Figura 15(c) que, en la salida de dicho filtro, la
tensión en el centro de la muestra se debe solo a esa muestra, puesto que el valor
de toda las demás muestras es cero en ese instante. Dicho de otro modo, la forma
de onda de salida de tiempo constante debe unir los picos de las muestras de
entrada.
Figura 15. Reconstrucción de la señal original.
Entre los instantes de las muestras, la salida del filtro es la suma de muchos
impulsos, y la forma de onda une de manera uniforme los picos de las muestras.
Como consecuencia de la limitación de banda del filtro original anti-aliasing, la forma
de onda analógica filtrada sólo puede viajar entre los puntos de la muestra de una
sola manera. Como el filtro de reconstrucción tiene la misma respuesta en
frecuencia, la forma de onda de salida reconstruida debe ser idéntica a la forma de
onda original de banda limitada, anterior al proceso de muestreo. Se deduce que el
muestreo no tiene que ser audible.
Figura 16. Filtro con pendiente finita.
El filtro ideal con una pendiente de corte vertical brickwall o “muro de ladrillo” es difícil
de implementar. A medida que la pendiente tiende a la vertical el retardo provocado
por el filtro tiende al infinito. En la práctica se ha de aceptar un filtro con una
pendiente finita, como muestra la Figura 16. La pendiente de corte comienza en el
borde de la banda requerida, y, en consecuencia la frecuencia de muestreo ha de
incrementarse un poco para llevar los productos de aliasing a un nivel
aceptablemente bajo. No hay un factor absoluto por el que deba elevarse la
frecuencia de muestreo, depende de los filtros disponibles y del nivel de los
productos de aliasing que son aceptables. Estos últimos dependen de la longitud de
palabra a la que se cuantificara la señal.
Lección 21. Diseño de Filtros.
Hasta este punto se han descrito filtros perfectos y de reconstrucción, pero estos no
existen. Los diseñadores utilizan dispositivos con pendientes y rechazo finitos, lo que
produce todavía efectos de aliasing. No es fácil especificar los filtros anti-aliasing,
sobre toda la cantidad de rechazo necesaria en la banda de bloqueo. El grado de
aliasing resultante dependerá, entre otras cosas de la cantidad de energía fuera de

banda contenida en la señal de entrada. Se sabe muy poco acerca de la energía
existente en el material típico de fuente fuera del rango audible. Como complicación
adicional, una señal fuera de banda es atenuada por la respuesta del filtro anti-
aliasing a dicha frecuencia, pero la señal residual sufrirá el efecto de aliasing y el
filtro de reconstrucción la rechazara de acuerdo con su atenuación a la nueva
frecuencia a la que ha sufrido dicho efecto de aliasing.
Toda señal que haya pasado por el dominio digital habrá tenido que pasar por un
filtro anti-aliasing y otro de reconstrucción. Estos filtros deben diseñarse cuidadosa
mente para evitar anomalías audibles, particularmente aquellos provocados por falta
de linealidad de fase, puesto que pueden llegar a ser audibles. La naturaleza de los
filtros empleados está muy relacionada con la calidad subjetiva del sistema.
Figura 17. Filtro Pasa-Bajo.
Las Figuras 17 y 18 muestran la terminología empleada para describir el conocido

filtro pasa-bajo elíptico. Estos filtros son populares porque pueden fabricarse con
menos componentes que otros filtros de respuesta similar. Es característico de estos
filtros elípticos que presenten rizados en la banda de paso y en la banda de bloqueo.
Figura 18. Descripción de funcionamiento filtro Pasa-Bajo.
Es posible construir filtros de fase lineal libre de rizados con el rechazo en la banda
de paso requerido, pero resulta caro en términos de diseño y complejidad de los
componentes que podrían perder sus especificaciones, dado que estos se deterioran
con el tiempo. Es posible evitar la necesidad de dicho filtro, ahorrando esfuerzo en el
diseño de filtros analógicos utilizando las técnicas de sobremuestreo. Estrictamente
hablando, el sobremuestreo no significa otra cosa que utilizar una frecuencia de
muestreo mayor que la requerida en la teoría de muestreo. En sentido general, “un
conversor de sobremuestreo” implica la utilización de una frecuencia de muestreo
mayor y otra serie de técnicas distintas. La superioridad sonora y la economía que
presentan los conversores de sobremuestreo les han llevado a convertirse en
dispositivos casi universales.
Lección 22. Frecuencia de Muestreo.
La teoría sobre muestreo es solo el comienzo del proceso que se ha de seguir para
llegar a una frecuencia de muestreo adecuada. La pendiente finita de los filtros reales
obliga a los diseñadores a incrementar la frecuencia de muestreo. Para equipos
comerciales, cuanto menor sea la frecuencia de muestreo, mejor, puesto que el costo
del medio es directamente proporcional a la frecuencia de muestreo, por esto es de
esperar frecuencias cercanas al doble de 20 kHz. En equipos profesionales, se
necesita funcionar a una velocidad variable para realizar correcciones de tono.
Cuando se reduce la velocidad de un dispositivo de grabación digital, disminuye la
frecuencia de muestreo de la señal de la cinta. La Figura 19 muestra que con una
frecuencia de muestreo mínima, la primera frecuencia imagen puede ser lo bastante
baja para pasar el filtro de reconstrucción. Si se eleva la frecuencia de muestreo sin
variar la respuesta de los filtros se puede reducir la velocidad sin que surja este
problema.
Figura 19. Descripción de frecuencia de muestreo.

Es posible deducir las frecuencias de muestreo permisibles en un sistema pseudo-

video multiplicando la frecuencia de campo por el número de líneas activas de un
campo y después por el número de muestras de una línea. Si se eligen con cuidado
los parámetros, es posibles utilizar los sistemas de video tanto de 526-60 625-50 con
una frecuencia de muestro de 44,1 kHz.
En el sistema de video de 60 Hz, existen 35 líneas de supresión quedando 490

líneas por cuadro o 245 líneas por campo para las muestras. Si se almacenan 3
muestras por línea, la frecuencia de muestreo es la siguiente:
Ecuación 1. Deducción de frecuencia de muestreo (60 Hz).
Para el sistema de video de 50 Hz, hay 37 líneas de supresión, quedando 588 líneas
activas por cuadro o 294 por campo, así que la misma frecuencia de muestreo viene
expresada por:
Ecuación 2. Deducción de frecuencia de muestreo (50 Hz).
La frecuencia de muestreo de 44,1 kHz fue la que se adopto para el CD. A pesar de
que el CD no tiene una circuitería de video, el equipo empleado para ser el máster
del CD está basado en el video y determina la frecuencia de muestreo.
Para las líneas de conexión con transmisores de radio difusión FM estéreo con un
ancho de banda de 15 kHz, la frecuencia de muestreo de 32 kHz es adecuada, y es
la que se utiliza desde hace bastante tiempo en el Reino Unido, Japón y América.
Esta frecuencia también se utiliza en el sistema de sonido estéreo de televisión. Se
propuso la frecuencia de muestreo profesional de 48 kHz por tener una simple
relación con la 32 kHz siendo además un valor que está suficientemente por encima
de los 40 kHz para permitir el funcionamiento de velocidad variable.
Aunque que, en un mundo perfecto, la adopción de una sola frecuencia de muestreo,

podría presentar ventajas por múltiples razones, el audio digital tiene hoy 3
frecuencias principales: 32 kHz para la radio difusión, 44,1 kHz para CD y los
equipos de grabación digital y 48 kHz en adelante para uso profesional. El éxito del
audio digital ha significado que muchos equipos funcionen a 44,1 kHz para adaptarse
al este incluyendo el CD. Con la llegada de los filtros digitales, podemos hacer un
seguimiento de la frecuencia de muestreo, sin ser necesaria una frecuencia de
muestreo mayor para los cambios de tono. Los 48 kHz se utilizan principalmente en
televisión o estudios de grabación donde puede sincronizarse con ambos estándares
de líneas de manera fácil. La mayoría de los equipos de grabación digital con discos
duros, funcionan a varias frecuencias.
Lección 23. Reloj de muestreo.
En la Figura 20 se muestra el efecto provocado por el jitter del reloj sobre una forma
de onda con pendiente. Las muestras son tomadas en tiempos incorrectos. Una vez
que estas muestras hayan pasado por un sistema la etapa de corrección de la base
de tiempos anterior al DA Chara desaparecer dicha fluctuación, y el resultado es el
que aparece en (b). La magnitud de la señal no deseada es proporcional a la
pendiente de la forma de onda de audio, así l cantidad de jitter que puede tolerarse
cae a 6 dB por octava. A medida que aumente la resolución del sistema por el uso de
una mayor longitud de palabra de las muestras, se reduce más el grado de
tolerancia al jitter. La naturaleza de la señal no deseada, depende del espectro del
jitter. Si este es aleatorio, el efecto se asemeja al ruido y es relativamente benigno a
menos que la amplitud sea excesiva. La Figura 21 muestra el efecto de distintas
cantidades de jitter aleatorio con respecto a la base del ruido de distinta longitudes
de palabra. Obsérvese que incluso pequeñas cantidades de jitter pueden degradar
un conversor de 20 bits hasta llegar a funcionar como un buen dispositivo de 16 bits.
Figura 20. Nivel de jitter permisible en picosegundos.
El jitter del reloj no tiene que ser necesariamente aleatorio. Una fuente de dicho jitter
es la diafonía o la interferencia en la señal de reloj. Una línea de reloj equilibrada
será más inmune a tales diafonías, pero el interfaz eléctrico del audio digital
comercial no está equilibrado y está sujeto a interferencias externas. No hay ninguna
razón por las que estas interferencias tengas que ser de carácter aleatorio, pueden
ser periódicas y potencialmente audibles.
Figura 21. Efecto de distintas cantidades de jitter.
La cantidad de jitter permisible se mide en picosegundos, como refleja la Figura 21 y

es evidente que se han de adaptar medidas en los diseños para eliminarlo. Las
señales de reloj de los conversores deben generarse con fuentes de alimentación
limpias que estén bien desacopladas de la alimentación utilizada por la lógica ya que
la señal del reloj de un converso debe tener una relación señal ruido del mismo orden
que la del audio. De lo contrario, el ruido existente en la señal de reloj provoca jitter
que a su vez introduce ruido en la señales de audio.
Un conversor bien diseñado debe rechazar gran parte del jitter de una señal de reloj
externa y ha de sonar igual cuando reproduzca los mismos datos
independientemente de cuál sea la fuente de los datos. Un conversor remoto que
suene diferente cuando reproduzca, ejemplo, el mismo disco compacto a través de
las salidas digitales de varios reproductores de CD significara que no ha sido bien
diseñado y debe rechazarse. De igual modo si es posible oír el efecto que produce el
cambiar el tipo de cable que alimenta el conversor, dicha unidad será de mala
calidad.
CAPITULO 6: CUANTIFICACIÓN Y DITHER.
Lección 24: Descripción.
La cuantificación es el proceso por el cual se expresa una cantidad infinitamente

variable mediante valores discretos y definidos. La cuantificación se presenta en una
gran variedad de aplicaciones comunes. Un reloj digital cuantifica el tiempo, pero la
pantalla no indica el tiempo transcurrido entre los instantes en que cambian los
dígitos.
Imagen 4. Conversor A/D.
En audio, los valores que se han de cuantificar son tensiones infinitamente variables
procedentes de una fuente analógica. La cuantificación propiamente dicha es un
proceso que funciona únicamente en el dominio de la tensión. Con el propósito de
estudiar la cuantificación de una sola muestra, podemos suponer que el tiempo
permanece inamovible.
Figura 22. Proceso de cuantificación.
La Figura 22(a) muestra que el proceso de cuantificación divide el rango de tensión

en intervalos de cuantificación Q, denominados también escalones S. en
aplicaciones tales como la telefonía, puede resultar ventajoso que sean de diferentes
tamaños, pero para el audio digital, los intervalos de cuantificación deben ser lo más
idénticos posibles. Si se hace así, los números binarios resultantes son totalmente
proporcionales a la tensión analógica original, y los equivalentes digitales de mezcla
y variación de ganancia pueden realizarse sumando y multiplicando valores de la
muestra. Eso no es posible si los intervalos de cuantificación no son iguales. Cuando
todos los intervalos de cuantificación son iguales, se emplea el término de

cuantificación uniforme.
Sea cual sea el valor exacto de tensión de la señal de entrada, el cuantificador

localizara el intervalo de cuantificación en el que se encuentra. En lo que puede
considerarse un escalón diferente al intervalo de cuantificación se le asigna un valor
codificado que, normalmente, se trata de un número binario. La información enviada
es el número de intervalos de cuantificación en el que se encuentra la tensión de
entrada. El lugar exacto dentro del intervalo en el que se encuentra dicha tensión no
es transmitido, este mecanismo pone un límite a la precisión del cuantificador.
Cuando el número de intervalo de cuantificación vuelve a convertirse en el dominio
analógico, se obtendrá una tensión que se encuentra en el centro de intervalo de
cuantificación, ya que esto minimiza la magnitud de error entre la entrada y la salida.
El rango número está limitado por la longitud de palabra de los números binarios
utilizados. En un sistema de 16 bits existen 65536 intervalos de cuantificaciones
diferentes, aunque los que se encuentran en los extremos del rango no tienen
ningún límite externo.
Lección 25. Error de cuantificación
Es posible obtener una función de transferencia para dicho cuantificador ideal

seguido de un DAC ideal. Una función de transferencia es simplemente una grafica
de la salida con respecto a la entrada. En audio, cuando se emplea el término de
linealidad, generalmente significa la rectitud de trasferencia. La linealidad constituye
un objetivo en un audio, sin embargo, se observara que un cuantificador ideal es
cualquier otra cosa menos lineal.
Figura 23. Técnica de re-muestreo.
La Figura 23(b) muestra quela señal de transferencia es algo parecido a una

escalera, y que los 0 voltios analógicos, que se corresponden con todo cero en
digital, se encuentra a mitad de camino de la vertical de un intervalo de
cuantificación, o bien en el centro de un escalón horizontal. Este es el denominado
cuantificador de escalón intermedio horizontal que se utiliza de forma universal en
audio.
Como la función de transferencia no es lineal una cuantificación ideal puede producir

distorsión. Por esto los dispositivos de audio digital prácticos utilizan deliberadamente
cuantificadores no ideales para conseguir la linealidad. El error de cuantificación de
un cuantificador ideal es una función muy compleja que ha sido investigada con gran
detalle.
A medida que se limita la magnitud del error de cuantificación, su efecto puede

minimizarse aumentado la amplitud de la señal. Esto requiere más intervalos de
cuantificación y mayor numero de bits para expresarlos. El número de intervalos de
cuantificación multiplicados por su tamaño da el rango de cuantificación del
conversor. Una señal que se encuentra fuera de dicho rango sufrirá un recorte. Si
evitamos el recorte de la señal, cuanto mayor sea esta, menor será el efecto del error
de cuantificación.
Figura 24. Comparación, impulsos DAC y forma de onda analógica original.

Cuando la señal de entrada ejercita todo el rango de cuantificación y presenta una

forma de honda compleja, como ocurre con la música de orquesta, las muestras
sucesivas tendrán valores numéricos ampliamente variables y el error de
cuantificación de una determinada muestra se verá independiente del resto. En este
caso, la magnitud del error de la cuantificación será distribuida con igual probabilidad
entre los límites. La Figura 24(c) muestra la densidad de probabilidad uniforme
resultante. Aquí, la señal no deseada añadida por la cuantificación constituye un
ruido de banda ancha adicional que nos e correlación con la señal y en este caso, es
apropiado denominarlo ruido de cuantificación. En estas condiciones, es posible
calcular una relación señal-ruido significativa de la manera que se indica a
continuación.
En un sistema que utiliza palabras de n bits, habrá 2n intervalos de cuantificación. La

mayor onda senoidal que pueda encajar sin recortes tendrá esta amplitud pico a pico.
La amplitud de pico será la mitad de grande, esto es, 2n-1Q y la amplitud RMS tendrá
este valor dividido por √2. El error de cuantificación tiene una amplitud de pico 1/2Q
que es el equivalente a Q/√ RMS. La relación señal-ruido para el caso de la señal de
mayor amplitud viene dada por:
Ecuación 3. Relación Señal-Ruido.
Así, por ejemplo, un sistema de 16 bits presenta una SNR de 98,1 dB.
Aunque el resultado anterior es válido para una forma de onda compleja de entrada
de gran amplitud, en tratamientos en los que se presupone que el error de
cuantificación es siempre ruido, se obtienen resultados incorrectos. La expresión
anterior sólo es válida si es uniforme la densidad de probabilidad del error de
cuantificación. Desafortunadamente, a niveles bajos y, en particular, con formas de
onda puras o simples, no sucede así.
A niveles bajos de audio, el error de cuantificación deja de ser aleatorio y pasa a ser
una función de la forma de onda de entrada y de la estructura de cuantificación, tal
como indica la Figura 24. Una vez que una señal no deseada se convierte en una
función determinante de la señal deseada, debe clasificarse como distorsión y no
como ruido. También es posible predecir la distorsión a partir de la falta de linealidad,
o naturaleza escalonada, de la función de transferencia. En una señal de gran
amplitud, hay tantos escalones implicados que debemos mirarla desde cierta
distancia, ya que una escalera de 65.000 escalones adopta el aspecto de una
pendiente. Con señales pequeñas, hay pocos escalones y, por tanto, no pueden
ignorarse.
La ausencia de linealidad de la función de transferencia tiene como resultado la

distorsión, que produce armónicos. Desafortunadamente, estos armónicos se
generan después del filtro anti-aliasing y, por tanto, cualquiera que sobrepase la
mitad de la frecuencia de muestreo producirá el efecto de aliasing. La Figura 25
muestra que todo esto da lugar a una distorsión anarmónica dentro de la banda de
audio. Estos anarmónicos producen tonos no puros conocidos como «gorjeos» o
«canto de pájaros». Cuando la frecuencia de muestreo es múltiplo de la frecuencia
de entrada, el resultado es la distorsión armónica. Cuando hay presente más de una
frecuencia en la entrada, se produce la distorsión de intermodulación, que se conoce
como granulación.
Figura 25. Distorsión después del filtro anti-aliasing.
Huelga decir que cualquiera de los efectos anteriormente mencionados descarta la

utilización de un cuantificador ideal para trabajos de alta calidad. Tiene poco sentido
seguir viendo los efectos adversos ya que deben y pueden eliminarse
completamente en equipos prácticos mediante el empleo del dither. Se ha de hacer
hincapié en la importancia que tiene el uso correcto del dither en un cuantificador, ya
que, de no ser así, se distorsiona irrevocablemente la señal convertida: no hay
proceso alguno que pueda eliminar después dicha distorsión.
La relación señal-ruido derivada anteriormente no es de gran relevancia para las

aplicaciones prácticas de audio, ya que se verá modificada por el dither y por
cualquier proceso de modelado del ruido que se utilice.
Lección 26. El Dither.
A niveles altos de señal, el error de cuantificación se convierte de hecho en ruido. A

medida que disminuye el nivel de audio, el error de cuantificación de un cuantificador
ideal se correlaciona más con la señal y el resultado es la distorsión. Si el error de
cuantificación se puede decorrelacionar de la señal de entrada de alguna manera, el
sistema podrá mantenerse lineal pero con ruido. El dither realiza la función de
decorrelación, haciendo que la acción del cuantificador sea imprevisible y le da al
sistema una base de ruido similar a la de un sistema analógico.
Todos los sistemas prácticos de audio digital utilizan un dither no sustractivo, en el

que la señal de dither es introducida antes del proceso de cuantificación y no se
intenta eliminarla en el DAC. La aplicación de dither con anterioridad a un
cuantificador convencional provoca inevitablemente una ligera reducción en la
relación señal-ruido alcanzable, pero esta reducción es un pequeño precio que hay
que pagar para eliminar las no linealidades. Se verá cómo la técnica de modelado del
ruido junto con el dither, superan esta restricción, obteniéndose un rendimiento por
encima del dither sustractivo del ejemplo anterior.
Figura 26. Dither aplicado a un cuantificador ideal.
El cuantificador ideal (desprovisto de ruido) de la Figura 22 tiene intervalos fijos de

cuantificación y debe producir siempre el mismo error de cuantificación con una
misma señal. En la Figura 26 puede verse que un cuantificador ideal al que puede
aplicarse dither introduciendo Linealmente un nivel controlado de ruido ya sea en la
señal de entrada o bien en la tensión de referencia empleada para derivar los
intervalos de cuantificación. Hay varias formas de considerar el funcionamiento del

dither, y todas ellas son válidas.
La aplicación del dither significa que las muestras sucesivas encuentran los
intervalos de cuantificación en diferentes lugares en la escala de tensión. El error de
cuantificación se convierte en una función del dither, en vez de una función previsible
de la señal de entrada. El error de cuantificación no se elimina, pero la distorsión
subjetivamente inaceptable se convierte en un ruido de banda ancha que es más
aceptable por el oído.
Figura 27. Formas alternativas de ver el dither.
En la Figura 27 se ofrecen formas alternativas de ver el dither. Considérese una

situación en la que una señal de entrada de nivel bajo varia lentamente dentro de un
intervalo de cuantificación. Sin el dither, se obtiene el mismo código numérico para
una serie de períodos de muestra, perdiéndose las variaciones que se producen en
el interior del intervalo. El dither obliga al cuantificador a conmutar entre dos o más
estados. Cuanto mayor es la tensión de la señal de entrada dentro de un
determinado intervalo, más probabilidades hay de que el código de salida tome el

siguiente valor mayor. Cuanto menor es la tensión de entrada dentro del intervalo,
mayor probabilidad hay de que el código de salida adopte el siguiente valor inferior.
El dither ha resultado ser una forma de modulación del factor de trabajo y la
resolución del sistema se ha visto mejorada indefinidamente en lugar de estar
limitada por la magnitud de los escalones. Puede entenderse el dither si
consideramos cómo afecta a la función de transferencia del cuantificador.
Normalmente, ésta es una escalera perfecta, pero con la presencia del dither, se ve
afectada horizontalmente hasta que, con una cierta amplitud, la función de
transferencia media se hace recta.
Lección 27. Dither Digital.
La tecnología avanzada ADC, de la que se habla con más detalle posteriormente en

este capítulo, permite obtener una resolución de IX y 20 bits, y quizá más en el
futuro. Surge entonces el problema cuando hay que conectar un dispositivo de 16
bits ya existente, como puede ser un grabador digital, con la salida de un ADC cuya
longitud de palabra es mayor. Las palabras necesitan ser recortadas de alguna
manera.
Cuando se atenúa el valor de una muestra, los bits extra de orden inferior que
aparecen por debajo de la coma decimal mantienen la resolución de la señal y del
dither en el bit o los bits menos significativos que linealiza el sistema. La misma
extensión de palabra tendrá lugar en cualquier proceso en el que se vea implicada la
multiplicación, como puede ser el filtrado digital. Por tanto, será necesario acortar la
longitud de palabra eliminando los bits de orden inferior.
Aun cuando en la conversión original se hubiese aplicado correctamente el dither, el

elemento aleatorio de los bits de orden inferior se encontrará ahora en algún lugar
por debajo del extremo de la palabra deseada. Si simplemente se trunca la Palabra
deshaciéndose de los bits de menor orden no deseados o se redondea al número
entero más próximo, se perderá el efecto de linealización del dither original.
El recorte de la longitud de palabra de una muestra reduce el número de intervalos

de cuantificación disponible sin que cambie la amplitud de la señal. Como indica la
Figura 28, los intervalos de cuantificación se hacen cada vez mayores y la señal
original es recuantificada con una nueva estructura de intervalos. Esto introduce una
distorsión de cuantificación con las mismas características que la distorsión de re-
cuantificación de un ADC. Por tanto, es obvio que, cuando se acorta una longitud de
palabra de un conversor de, digamos, 20 bits a 16 bits, los cuatro bits de orden
inferior deben eliminarse de tal forma que se represente la misma estructura global
de cuantificación como si el conversor original hubiese tenido una longitud de palabra
de sólo 16 bits. Se observa en la Figura 28 que el truncamiento no puede utilizarse
porque no cumple los requisitos mencionados anteriormente, pero tiene como
resultado un offset dependiente de la señal debido a que siempre redondea en la
misma dirección. Un sistema adecuado de redondeo numérico es esencial en las
aplicaciones de audio.
Figura 28. Uso adecuado del nivel de dither.
La recuantificación mediante el redondeo numérico simula con precisión la

cuantificación analógica con el nuevo tamaño de los intervalos. Desafortunadamente,
el conversor de 20 bits tiene una amplitud de dither adecuada para cuantificar
intervalos de un sexto del tamaño de una unidad de 16 bits y el resultado es una gran
pérdida de linealidad.
En la práctica, la longitud de palabra de las muestras debe ser acortada de forma

que el error de cuantificación se convierta en ruido en lugar de distorsión. Una
técnica que cumple este requisito consiste en utilizar dither digital antes de realizar el
redondeo. Esto equivale directamente a la aplicación de dither analógico en un ADC.
Más tarde se verá en este mismo capítulo que, en sistemas más complejos, puede
utilizarse el modelado del ruido para el proceso de recuantificación tal y como se
utiliza para el de cuantificación.
El dither digital consiste en una secuencia numérica pseudo-aleatoria. Si se requiere

para simular la señal de dither analógica de las Figuras 26 y 27, entonces resulta
evidente que el ruido debe ser bipolar con el fin de que tenga una tensión media de
cero. Debe utilizarse un sistema de codificación con complemento a dos para los
valores de dither como ocurre con las muestras de audio.
Figura 29. Sencillo sistema de dither digital.
La Figura 29 muestra un sencillo sistema de dither digital (esto es, sin modelado de
ruido) para acortar la longitud de la muestra. La salida de un generador de
secuencias pseudo-aleatorias con complemento a dos con una longitud de palabra
apropiada es añadida a las muestras de entrada antes de realizar el redondeo. El bit
más significativo de los que se han de eliminar es examinado con el fin de determinar
si los bits que se van a eliminar suman más o menos de la mitad de un intervalo de
cuantificación. La muestra con dither es redondeada por defecto, esto es, los bits no
deseados son descartados, o bien es redondeada por exceso, es decir, los bits no
deseados se descartan pero se añade un 1 al valor de la nueva palabra acortada. El
proceso de redondeo ya no es determinante debido al dither añadido, que
proporciona una componente aleatoria de linealización.
Si se compara este proceso con el de la Figura 26, se verá que los principios del
dither analógico y digital son idénticos; simplemente, los procesos tienen lugar en
diferentes dominios y utilizan números con complemento a dos que son redondeados
o tensiones que son cuantificadas según sea apropiado. De hecho, la cuantificación
de una forma de onda con dither analógico es idéntica al caso hipotético del
redondeo después del dither digital bipolar, donde el número de bits que se han de
eliminar es infinito y permanece idéntico con fines prácticos cuando hay que eliminar
tan sólo 8 bits. En realidad, el dither analógico puede generarse a partir del dither
digital bipolar (que no es otra cosa que números aleatorios con ciertas propiedades)
mediante un DAC.
La forma más simple de dither (y, por tanto, la más fácil de general digitalmente)
consiste en una sola secuencia de números aleatorios que presentan una
probabilidad uniforme o rectangular. La amplitud del dither es crítica. La Figura 30(a)
muestra la función de transferencia en tiempo medio de un intervalo de cuantificación
en presencia de varias amplitudes de dither rectangular. La linealidad es perfecta con
una amplitud de 1Q pico a pico y se deteriora para amplitudes mayores o menores.
Lo mismo ocurre con todos los niveles que sean múltiplos enteros de Q. Por tanto, no
existe libertad para la elección de la amplitud.
Figura 30. Formas distintas de usar dither digital.
Con la utilización de dicho dither, el ruido de cuantificación no es constante. La

Figura 30(b) muestra que cuando la entrada analógica se centra exactamente en un
intervalo de cuantificación (de modo que no se produce ningún error de
cuantificación), el dither no tiene ningún efecto y el código de salida es constante. No
se Produce ninguna conmutación entre los códigos y, por tanto, no hay ruido. Por
otra parte, cuando la entrada analógica se encuentra situada exactamente en el
escalón vertical o en el límite entre los dos intervalos, se producen gran cantidad de
conmutación entre los códigos y se genera el mayor ruido posible.
La modulación de ruido ocasionada por el uso de dither de probabilidad rectangular

no es deseable. Aparece porque el proceso es demasiado simple. El error de
cuantificación sin dither depende de la señal y el dither representa un solo proceso
aleatorio de probabilidad uniforme. Esto es sólo capaz de decorrelacionar el error de
cuantificación hasta el punto de que su valor medio sea igual a cero, haciendo que el
sistema sea lineal. La dependencia de la señal no queda eliminada, pero es
desplazada al siguiente momento estadístico. Esto constituye la varianza y el
resultado es la modulación de ruido. Si se introduce en el sistema un nuevo proceso
aleatorio de probabilidad uniforme, la dependencia de la señal es desplazada al
siguiente momento y el segundo momento o varianza se hace constante.
Si se suman dos funciones de probabilidad rectangular estadísticamente

independientes, se obtiene una función de probabilidad rectangular. Una señal con
estas características puede utilizarse como la fuente de dither.
La Figura 30(c) muestra el valor medio de la función de transferencia de una serie de

amplitudes de dither. La linealidad se alcanza con una amplitud pico a pico de 2Q y,
a este nivel, no hay modulación de ruido. La ausencia de modulación de ruido es otra
forma de establecer que el ruido sea constante. La p.d.f. triangular del dither coincide
con la forma triangular de la función de error de cuantificación.
Si se añaden más fuentes de probabilidad uniforme al dither, se consigue que la

función de probabilidad global se asemeje progresivamente a la distribución
gaussiana del ruido analógico. La Figura 30(d) muestra la media de la función de
transferencia de un cuantificador con distintos niveles de dither gaussiano aplicados.
La linealidad se alcanza con 1/2Q r.m.s. y, a este nivel, la modulación de ruido es
despreciable. La potencia de ruido total viene expresada por:
Ecuación 4. Potencia de ruido total.

Y, por tanto, el nivel de ruido será r.m.s. El nivel de ruido de un cuantificador

sin dither en el caso de una señal de gran amplitud es y, por tanto, el ruido es
mayor por un factor de:
Ecuación 5. Calculo de factor de ruido.
Por tanto, la SNR viene dada por:
Ecuación 6. Relación señal ruido.
Un sistema de 16 bits con un dither gaussiano correcto tendrá una SNR de 92,1 dB.
En aplicaciones con dither digital, el dither de probabilidad triangular de 2Q pico a
pico es el óptimo ya que ofrece la mejor combinación posible de distorsión cero, sin
modulación de ruido y SNR. Aunque este resultado también es válido para el dither
analógico, no es práctico aplicarlo en un ADC real, ya que todas las señales
analógicas reales contienen ruido térmico, el cual es gaussiano.
Lección 28. Conversión Digital-Analógica.
Nos ocupamos primero de la conversión en esta dirección ya que los ADC suelen
utilizar DAC incluidos en los bucles de realimentación.
La finalidad de un conversor digital-analógico es tomar valores numéricos y

reproducir la forma de onda continua que representan. La Figura 31 muestra los
elementos principales que componen un subsistema de conversión convencional, es
decir, que no utiliza el sobremuestreo. El jitter de la señal de reloj necesita ser
eliminado mediante un VCO o un VCXO. Los valores de las muestras almacenan en
un latch y se introducen en el dispositivo conversor que funciona con cada ciclo de la
señal de reloj limpia. La salida es una tensión proporcional al número durante al
menos parte del período de la muestra. Seguidamente, puede encontrarse una
etapa; de remuestreo con el objeto de eliminar los transitorios de conmutación, de
reducir la relación de apertura o de permitir la utilización de un conversor que tome

una parte sustancial del período de muestra para funcionar. La forma de onda
remuestreada pasa entonces a un filtro de reconstrucción que rechaza las
frecuencias que si encuentren por encima de la banda de audio.
Figura 31. Sistema de conversión convencional.
En este apartado, nos ocuparemos principalmente de la implementación del

dispositivo conversor. Existen dos formas principales de obtener una señal analógica
a partir de datos PCM. Una consiste en controlar las corrientes ponderadas en
binario y sumarlas; la oirá se basa en controlar la cantidad de tiempo que tarda una
corriente fija en fluir hasta un integrador. Ambos métodos quedan contrastados en la
Figura 32. Parecen sencillos, pero no tienen utilidad en audio de esta forma, debido a
una serie de limitaciones prácticas. En la Figura 32(c) el código binario está a punto
de tener un desbordamiento importante y todas las corrientes de orden inferior se
encuentran fluyendo. En la Figura 32(d) la entrada binaria ha incrementado en uno y
sólo fluyen las corrientes más significativas. Esta corriente debe ser igual a la suma
de todas las demás más una. La precisión ha de ser tal que la magnitud de los
escalones se encuentre dentro de los límites requeridos. En este ejemplo de 4 bits
tan simple, si el tamaño de los escalones ha de tener una precisión bastante casual
del 10%, la precisión necesaria es sólo una parte de 160, pero para un sistema de 16
bits sería una parte de 655.360 o, aproximadamente, 2 ppm. Este grado de precisión
es casi imposible de conseguir y. aún menos, de mantener debido al deterioro por el

paso del tiempo y los cambios de temperatura.
Figura 32. Formas de obtener una señal analógica a partir de datos PCM.
El conversor de tipo integrador en este ejemplo de 4 bits es el que aparece en la

Figura 32(e), requiere una señal de reloj para el contador, que le permite contar
ascendentemente hasta llegar al máximo en menos del período de una muestra. Esto
Será más de 16 veces la frecuencia de muestreo. Sin embargo, en un sistema de 16
bits, la frecuencia de reloj necesitaría ser 65.536 veces la frecuencia de muestreo o,

aproximadamente, 3 GHz. Evidentemente, se necesitan algunos refinamientos para
Poder utilizar cualquiera de estos dos conversores en aplicaciones de audio.
Lección 29. Conversión Analógico-Digital.
En la Figura 33 se muestra un subsistema convencional analógico-digital. Pasado el

filtro anti-aliasing, habrá un proceso de muestreo. Muchos de los ADC aquí descritos
necesitan un tiempo finito para funcionar, mientras que una muestra debe tomarse de
la entrada de manera instantánea. La solución está en utilizar un circuito de muestreo
y retención. Después del proceso de muestreo, la tensión de la muestra es
cuantificada. El número del nivel cuantificado se convierte en código binario,
normalmente con complemento a dos. Este apartado se ocupa principalmente de la
implementación del escalón de cuantificación.
Figura 33. Sistema convencional análogo-digita.
El principio general de un cuantificador consiste en que las distintas tensiones

cuantificadas son comparadas con la entrada analógica desconocida hasta encontrar
la tensión cuantificada más aproximada. El código correspondiente de ésta pasa a
ser la salida. Pueden hacerse las comparaciones, una a una, con la mínima cantidad
de hardware, o bien de forma simultánea.
Figura 34. Conversor flash.
Probablemente sea el conversor flash la técnica existente más simple para la

conversión PCM y DPCM. El principio se muestra en la Figura 34. La tensión umbral
de cada intervalo de cuantificación es suministrada por una cadena de resistencias
que es alimentada por una tensión de referencia. Esta tensión de referencia puede
variarse para determinar la sensibilidad de la entrada. Hay un comparador de tensión
conectado con cada tensión de referencia y la otra entrada de todos ellos está
conectada con la entrada analógica. Puede considerarse un comparador como un
ADC de bit. La tensión de entrada determina el número de comparadores que
tendrán una salida verdadera. Dado que se necesita un comparador para cada
intervalo de cuantificación, así, por ejemplo, en un sistema de 8 bits habrá 255
salidas binarias de los comparadores, por lo que es necesario utilizar un codificador
de prioridad para poder convertirlas en código binario. Obsérvese que la etapa de
cuantificación es asíncrona; los comparadores cambian de estado siempre que las
variaciones en la forma de onda de entrada resulten en un cruce de la tensión de
referencia. El proceso de muestreo tiene lugar cuando las salidas del comparador
pasan con la señal de reloj a un latch subsiguiente. Esto es un ejemplo de
cuantificación antes del proceso de muestreo, como se ilustra en la Figura 11.
Aunque, en principio, el dispositivo es sencillo, contiene gran cantidad de circuitería y

la única forma práctica de poder implementarse es en un chip.
Figura 35. Conversor flash típico de 8 bits para video.
Un dispositivo de 16 bits necesitará la absurda cifra de 65.535 comparadores, por lo

que estos conversores no son viables para la conversión directa de audio, aunque se
utilizan con grandes ventajas en conversores DPCM y de sobre-muestreo que se
describen más adelante en este capítulo. La velocidad límite de un conversor flash

constituye una ventaja singular en el proceso de sobremuestreo. Debido a que la
computación de todos los bits se lleva a cabo simultáneamente, no se requiere
ningún circuito de muestreo y retención, y el droop queda eliminado. La Figura 34
muestra un chip conversor flash. Obsérvese la escalera de resistencias los
comparadores seguidos del codificador de prioridad. El MSB puede invertirse
selectivamente de modo que el dispositivo pueda usarse o bien en modo offset
binario o bien en modo de complemento a dos.
Puede conseguirse una reducción en la complejidad de los componentes siguiendo

un proceso de cuantificación serie. El método más primitivo de generar diferentes
tensiones cuantificadas consiste en conectar un contador y un DAC. La tensión en
escalera resultante se compara con la entrada y se utiliza para detener la señal del
reloj con dirección al contador cuando la salida del DAC sobrepasa la entrada. Este
método es extremadamente lento, por lo que no se utiliza, ya que existe otro método
más rápido que tan sólo es un poco más complejo. Mediante la aproximación
sucesiva, se comprueba uno a uno cada bit, comenzando por el MSB. Si la entrada
es mayor que la mitad del rango, el MSB es retenido y utilizado como base para
comprobar el siguiente bit, que será también retenido si la entrada excede tres
cuartos del rango, y así sucesivamente. El número de decisiones es igual al número
de bits de la palabra, en contraposición al número de intervalos de cuantificación que
ocurría en el ejemplo anterior. Un inconveniente del conversor de aproximación
sucesiva es que los bits menos significativos son los últimos en calcularse, justo
cuando el droop en la etapa de muestreo y retención se encuentra en su momento
más crítico. También es posible realizar la conversión analógico-digital utilizando el
principio en el que se basa el DAC con doble fuente de corriente en un sistema de
realimentación; la principal diferencia es que las dos fuentes de corriente deben
funcionar secuencialmente en lugar de hacerlo simultáneamente.
Lección 30. El Sobremuestreo.
El sobremuestreo consiste en utilizar una frecuencia de muestreo mayor

(generalmente sustancialmente mayor) que la frecuencia de Nyquist. Ni la teoría
sobre el muestreo ni la de cuantificación requieren la utilización del sobremuestreo
para obtener una determinada calidad de señal, pero la conversión de la frecuencia
de Nyquist exige una gran eficacia por parte de los componentes cuando se
implementa un conversor. El proceso de sobremuestreo permite alcanzar una
determinada calidad de señal sin necesidad de una tolerancia muy precisa de los
componentes y, por tanto, que éstos sean muy caros. Aunque puede utilizarse por sí
solo, el sobremuestreo presenta mayores ventajas si se emplea junto con el
modelado del ruido. Así, en la práctica, se suelen emplear estos dos procesos
conjuntamente, por lo que ambos términos se utilizan vagamente como sinónimos. Si
se desea un análisis detallado y cuantitativo sobre el proceso de sobremuestreo con
extensas referencias, se remite al lector a la obra de Hauser.
La Figura 36 muestra las principales ventajas del sobremuestreo. En (a) se observa

que la utilización de una frecuencia de muestreo considerablemente por encima de la
frecuencia de Nyquist permite la realización de filtros anti-aliasing y de reconstrucción
con pendientes de corte mucho más suaves. Por tanto, hay menos probabilidad de
que se produzcan problemas de linealidad de fase y de rizado en la pasa-banda de
audio.
La Figura 36(b) muestra que la información contenida en una señal analógica es

bidimensional y puede representarse como un área que resulta del producto entre el
ancho de banda y la relación señal-ruido linealmente expresada. La figura también
indica que la misma cantidad de información puede transmitirse a través de un canal
con una SNR de la mitad de valor (6 dB menos) si el ancho de banda utilizado es si
doble, con una SNR de 12 dí3 menos si es ancho de banda es cuádruple, y así
sucesivamente, siempre y cuando el sistema de modulación sea perfecto.
Figura 36. Sobremuestreo.
La información de una señal analógica puede transmitirse mediante algún sistema de

modulación analógico con cualquier combinación entre el ancho de banda y la SNR
que proporcione la capacidad de canal apropiada. Si se sustituye el ancho de banda
por la frecuencia de muestreo y la SNR por una función de la longitud de palabra,
también debe ser válido para una señal digital puesto que no se trata más que de un
valor numérico análogo. Por tanto, el aumentar la frecuencia de muestreo
potencialmente permite la reducción de la longitud de palabra de cada muestra sin
que se produzca pérdida de información.
Figura 37. Estructuras alternativas de conversión en PCM.
El proceso de sobremuestreo permite la utilización de un dispositivo conversor de

menor longitud de palabra, siendo posible utilizar un conversor flash. El conversor
flash es capaz de funcionar a muy alta frecuencia, por lo que es posible obtener
grandes factores de sobremuestreo. Si la estructura de un conversor sigma DPCM
de la Figura 37 se realiza con un dispositivo conversor flash, es posible utilizarla con
un alto factor de sobremuestreo. La Figura 36(c) muestra que esta clase de
conversor presenta una base de ruido ascendente. Si la salida sobremuestreada con
un alto factor se introduce en un filtro anti-aliasing analógico empleado para el
muestro de frecuencia de Nyquist, el resultado es una reducción desproporcionada
de ruido, por encontrarse la mayoría de éste fuera de la banda de audio. Puede
obtenerse un conversor de alta resolución utilizando esta tecnología sin necesidad de
tolerancias inalcanzables en los componentes.
Figura 38. Teoría de la información SNR.
La teoría de la información establece que si una señal de audio se propaga por un

ancho de banda mucho mayor a causa de utilizar, por ejemplo, un transmisor de
radiodifusión FM, la SNR de la señal demodulada puede ser mayor que la del canal
por la que tenga que pasar, y lo mismo ocurre en los sistemas digitales. El concepto
se ilustra en la Figura 38. En (a) las muestras de 4 bits se transmiten a una
frecuencia de muestreo F. Dado que 4 bits tienen 16 combinaciones, la velocidad de
información es de 16F. En (b) se obtiene la misma velocidad de información con
muestras de 3 bits elevando la frecuencia de muestreo a 2F y, en (c), las muestras
de 2 bits que tienen cuatro combinaciones requieren ser enviadas a una velocidad de
4F. Aunque se ha mantenido la velocidad de información, se observa que el régimen
de bits en (c) es el doble que en (a). La razón de todo esto se muestra en la Figura
39. Un solo dígito binario puede tener únicamente dos estados, por lo que sólo puede
llevar dos informaciones, por ejemplo, «sí» o «no». Dos dígitos binarios pueden tener
cuatro estados y, por tanto, transmitir cuatro informaciones, por ejemplo «primavera,
verano, otoño o invierno», que son dos informaciones por bit. Tres dígitos binarios
agrupados entre sí pueden tener ocho combinaciones y transmitir ocho
informaciones, por ejemplo, «do, re, mi, fa, so, la, si o do», que es casi tres
informaciones por dígito. Resulta evidente que cuanto más lejos se lleva este
principio, mayores ventajas ofrece. En un sistema de 16 bits, cada bit tiene un valor
de 4K de información. Siempre resulta más eficaz, en términos de capacidad de
información, utilizar combinaciones de palabras binarias de gran longitud en lugar de

enviar bits individuales para cada información. Se alcanza el mayor grado de eficacia
cuando se envían las palabras de mayor longitud a la frecuencia más lenta, que debe
ser la frecuencia de Nyquist. Ésta es una de las razones por las que la grabación
PCM es más común que la modulación delta, a pesar de la simplicidad de
implementación que presenta este último tipo de conversón La PCM hace un uso
más eficaz de la capacidad del canal binario.
Figura 39. Información por bit, longitud de palabra.
Como resultado, el sobremuestreo se encuentra confinado a la tecnología de los

conversores, donde ofrece ventajas específicas en implementación. Los sistemas de
almacenamiento o de transmisión emplean normalmente la PCM, donde la
frecuencia de muestreo es un poco superior que el doble del ancho de banda de
audio.
Los filtros digitales presentan la característica de que su respuesta en frecuencia es

proporcional a la frecuencia de muestreo. Si se hace funcionar un grabador digital a
una velocidad reducida, la respuesta del filtro digital se reducirá automáticamente e
impedirá el paso de imágenes al proceso de reconstrucción. De hacerse universal la
técnica del sobremuestreo, no habría necesidad entonces de utilizar frecuencias de

muestreo de 48 kHz.
El sobremuestreo es un modo de resolver los problemas prácticos de

implementación sustituyendo un solo elemento crítico o cuello de botella por una
serie de elementos cuyo rendimiento global sea lo único que cuente. Como bien
indicó Hauser, el sobremuestreo tiende a solapar las operaciones que están bastante
bien determinadas en un conversor convencional. La Figura 41(a) muestra que es
posible construir un ADC cuyo funcionamiento sea previsible a partir de un filtro anti-
aliasing adecuado, un muestreador, una fuente de dither y un cuantificador,
montándolos como si se tratara de ladrillos de construcción. Los ladrillos se
encuentran en serie, por lo que el funcionamiento de cada etapa sólo puede limitar el
funcionamiento global. Por el contrario, la Figura 41(b) muestra que, con el
sobremuestreo, el solapamiento de las operaciones permite el incremento de varios
procesos entre sí dando lugar a una sinergia que no aparece en un sistema
convencional.
Si el factor de sobremuestreo es n, la entrada analógica debe estar limitada en el

ancho de banda a n.Fs/2 por el filtro analógico anti-aliasing. Esta unidad sólo necesita
tener una respuesta en frecuencia plana y una linealidad de fase dentro de la banda
de audio. Antes del proceso de muestreo a n.Fs y del de cuantificación, se añade
dither analógico de una amplitud compatible con el tamaño del intervalo de
cuantificación.
Figura 40. Un ADC convencional.
Seguidamente, la función de anti-aliasing se completa en el dominio digital mediante

un filtro paso-bajo que corta a Fs/2. Mediante una arquitectura apropiada, este filtro
puede tener una fase lineal absoluta y puede ser implementado con una precisión
arbitraria. Estos filtros se estudian en el Capítulo 4. Puede considerarse al filtro como
el demodulador de la Figura 36, donde la SNR mejora a medida que se reduce el
ancho de banda. Es de esperar que la longitud de onda aumente. Las
multiplicaciones que tienen lugar dentro del filtro aumentan la longitud de palabra
considerablemente más de lo que supondría sólo la reducción del ancho de banda.
El filtro analógico sólo sirve para impedir el paso de aliasing en la banda de audio a
la frecuencia de sobremuestreo; el espectro de audio está determinado con mayor
precisión por el filtro digital.
Con el espectro de información de audio ahora limitado por la frecuencia de Nyquist,

el proceso de muestreo se completa cuando se reduce la frecuencia en el diez-
mador. Se retiene una de cada n muestras.
Debe eliminarse el exceso en la longitud de palabra provocado por las operaciones

aritméticas del filtro anti-aliasing. Se añade dither, completándose así el proceso de
cuantificación se completa recuantificando las muestras con dither hasta alcanzar la
longitud de palabra adecuada, que será mayor que la longitud de palabra del primer
cuantificador. Puede utilizarse de manera alternativa el proceso de modelado de
ruido.
La Figura 42(a) muestra el sistema de ladrillos de construcción de un DAC

convencional. Las muestras con frecuencia de Nyquist son convertidas en tensiones
analógicas y, luego, se necesita un filtro analógico paso-bajo de corte rápido para
rechazar las bandas laterales del espectro muestreado.
Figura 41. Comparación de DAC (a) con implementación de sobremuestreo (b).
La Figura 42(b) muestra el sistema de sobremuestreo. La frecuencia de muestreo se

eleva en un interpolador que contiene un filtro paso-bajo que restringe el espectro de
la banda base al ancho de banda mostrado en la figura. Existe un gran intervalo de
frecuencia entre la banda base y la banda lateral menor. Las multiplicaciones que
tienen lugar en el interpolador incrementan considerablemente la longitud de palabra,
que debe reducirse según la capacidad del dispositivo DAC con la introducción de
dither digital antes del proceso de recuantificación. De nuevo, puede Utilizarse el
modelado de ruido como alternativa.
http://www.scientificpsychic.com/workbook/sentidos-humanos.html
UNIDAD 3. SOFTWARE Y HARDWARE
Introducción
El audio digital se ve marcado por aspectos claves para su operación y aplicación,

estos a su vez, se hacen más familiares a los ojos de comunidades específicas. Es el
caso de los sistemas informáticos y componentes o hardware, que corresponde a
todas las partes físicas y tangibles de una computadora: sus componentes eléctricos,
electrónicos, electromecánicos y mecánicos, sus cables, gabinetes o cajas,
periféricos de todo tipo y cualquier otro elemento físico involucrado. Las estaciones
de trabajo para audio digital o software, son el equipamiento o soporte lógico de una
computadora digital y comprende el conjunto de los componentes lógicos necesarios
que hacen posible la realización de tareas específicas.
CAPITULO 7: SOFTWARE.
Existen diversos programas para crear, editar y reproducir audio digital. Los
programas más simples muestran una función principal como reproducir o grabar
audio por medio de su carta de sonido, pero muchos programas que trabajan con
audio digital presentan diversas funciones claves. Por ejemplo, los programan que
ofrecen grabar el audio tienen la capacidad de editarlo, y los programas que

reproducen audio son naturalmente capaces de crear y organizar archivos en mp3.
Imagen 5. Software de Mezcla y Edición de Audio.
Imagen 6. Software de Mezcla y Masterización de Audio.

Los programas específicos, la mayoría de las veces, necesitan trabajar con unos
servicio específicos, como iTunes Music Store o Rhapsody Music Service, o radio
servicios de internet como Live 365. Algunas veces, programas son instalados para
aspectos como crossfading automático, mientras que otros programas han de ser
instalados porque son requeridos para algún específico formato de audio.
Lección 32: ¿Que es software?
Para la mayoría de usuarios, software es el mismo computador. Sin este software, un

computador es una recolección de partes, esperando a que le den instrucciones.
Como un newborn, todas las bases están ahí mostrando poder, sin tener algún tipo
de conocimiento de cómo interactuar con el mundo. Así como los padres enseñan a
sus hijos a caminar y hablar, los programadores escriben el software, quien informa
al hardware que hacer. Se puede pensar que software es la mente del computador
así como tenemos diferentes niveles de conciencia hay diferentes niveles de
software, el nivel más bajo en el sistema operativo, que maneja funciones básicas
como cargar archivos y mostrar graficas. El OS es como la respiración, siempre está
ahí, es esencialmente involuntaria, y es fácil darla por sentada hasta que algo salga
mal. Se trataran programas de aplicación, como procesadores de palabras y
reproductores de audio. Estos manejan funciones de alto nivel, como “corregir
ortografía” o “reproducir un canción”. También se hablara de la interfaz de audio, en
donde se puede interactuar con el computador. Cuando se presiona un botón,
cuando se digita una dirección en la web, o se mueve la flecha del mouse, se está
usando la interface para informarle a el programa que hacer. El programa de
aplicaciones, en cambio, le dice al sistema operativo como hacer el trabajo – mover
información de su disco duro a su carta de sonido, por ejemplo.
Lección 33: Programas de reproducción.
Para reproducir música en el computador se necesita un programa que soporte el

formato de audio (MP3, Real Audio, WMA, etc.).
Imagen 7. Reproductores de Audio Digital.
Las últimas versiones de Windows y Mac OS vienen con reproductores incorporados

para varios formatos populares que pueden reproducir toda la música. El termino
programa de reproducción es usado en este caso para referirse a cualquier programa
usado para reproducir audio, sea un programa de uso único o un programa de tipo
Jukebox (Rockola) que hace muchas cosas además de reproducir audio. Un sistema
típico de Windows debe incluir Windows Media Player para reproducir estaciones de
radio en internet que usan el formato WMA, o Real Player para reproducir estaciones
de radio en internet que usan el formato Real Audio, y Media Jukebox como el
programa principal.
Lección 34: Software profesional.
Resulta indispensable, para el conocedor de audio digital con tratamiento de calidad,

el conocer, distinguir y operar software especifico de procesos de pre-producción y
post-producción de audio.
Hoy en día, sin contar que ya son varios, estos programas tienen características
específicas y detalladas, que se diferencian del resto y entre ellos mismos, a
continuación se exponen, si no los más usados, los programas que cumple con las
características necesarias y de punta para trabajar muestras digitales de audio, en
algunos casos combinados con video.
Pro Tools: es una estación de trabajo de audio digital (Digital Audio Workstation o
DAW, en inglés), una multiplataforma de grabación multipista de audio y MIDI, que
integra hardware y software. Actualmente, por sus altas prestaciones, es el estándar
de grabación en estudios profesionales, usado mundialmente.
Imagen 8. Aplicaciones para Pro Tools 9.

La empresa Digidesign, que desarrolla el programa Pro Tools, elabora algunos de los
mejores softwares de audio del mercado, por lo que su calidad y sólida fiabilidad son
ampliamente reconocidas. Esto ha llevado a este potente software de producción
musical y postproducción audiovisual a convertirse en uno de los referentes de esta
industria.
El estigma de Pro Tools, lo que lo hace exclusivo, es que sólo puede usarse con un
hardware específico, y no admite otras marcas.
LOGIC PRO (anteriormente, Logic Audio) es un programa de edición de audio en

pistas de audio y MIDI que funciona en la plataforma Mac OS X. Creado
originalmente por el C-Lab, se convirtió en un producto de Apple cuando la compró
en el 2002. Una versión reducida, Logic Express, está también disponible en Apple.
Logic Pro proporciona los instrumentos, los sintetizadores, los efectos audio y los
grabadores de voz para la síntesis de la música. Los efectos de audio incluyen las
distorsiones, procesadores dinámicos y ecualizadores. El diseño del espacio, por
ejemplo, simula la acústica del audio en diversos ambientes, tales como producir
ecos. Logic Pro puede trabajar con los teclados MIDI y las superficies de control para
la entrada de sonido. También ofrece editar en tiempo real la música, el soporte de la
guitarra, abreviaturas del acorde y la notación del tambor.
Imagen 9. Logic Platinum.
Logic Pro y Express tienen mucha funcionalidad y virtualmente la misma interfaz.

Logic Express se limita al sonido, mientras que Logic Pro maneja varios canales,
rodeando el sonido y creándolo envolvente. Ambos pueden manejar hasta 255 pistas
de audio, dependiendo del funcionamiento del sistema (tiempo de la CPU, del
rendimiento de procesamiento del disco duro y de la búsqueda).
El uso de Logic Pro también ofrece capacidades adicionales, que pueden funcionar a
través de una LAN de Internet. Si la red es bastante rápida, se puede trabajar
repartiendo el trabajo entre varias CPUs. Esto permite que los usuarios combinen la
energía de varias computadoras de Macintosh de procesar los instrumentos y plug-
ins incorporados del software.
CUBASE es una serie de aplicaciones informáticas para editar audio digital, MIDI y
un secuenciador de música, (comúnmente conocidas como DAW - Digital Audio
Workstation), creadas originalmente por la firma alemana Steinberg en 1989.
Cubase inició su vida a finales de los 80 como un secuenciador y editor MIDI. El

programa fue originalmente desarrollado para el Atari ST, más tarde se hizo la
versión para Apple Macintosh y a mediados de los 90 para Microsoft Windows.
Imagen 10. Cubase.
El Cubase original usaba un sistema operativo llamado MROS (MIDI Real-time

Operating System) que corría bajo el propio sistema operativo nativo. Permitía
ejecutar varias aplicaciones MIDI en el ordenador y pasar los datos entre ellas a
tiempo real. El MROS no trabajaba bien en Windows 3.0, pues este no fue previsto
para aplicaciones en tiempo real.
Sin embargo, los sistemas operativos modernos están diseñados para soportar
aplicaciones multimedia, así que las versiones actuales de Cubase no usan MROS.
El lanzamiento de Cubase Audio en 1991 para el Atari Falcon abrió una brecha en la
tecnología de programas DSP poniendo al alcance domestico la manipulación de
audio en tiempo real. Esto era posible sin la necesidad de costosas tarjetas
adicionales, como era el caso con el costoso Pro Tools y otros sistemas similares.
Cubase crea proyectos que permiten al operador editar archivos MIDI, pistas de
audio crudo, y otras informaciones asociadas como las letras de la canción, y
presentarlos en un rango de formatos incluyendo calificación musical, consola de
edición, lista de eventos, etc. El operador también puede mezclar varias pistas en
formato estéreo .wav o .mp3 listas para grabarlas en un CD.
NUENDO incorpora todas las características de Cubase 3 más otras orientadas

especificadamente para la postproducción o trabajo con imagen. Es el producto
estrella creado por la compañía Steinberg que desarrolla hardware y software
musical. Principalmente produce software de edición, secuenciación y
postproducción de audio y sintetizadores y efectos virtuales.
La compañía fue fundada en 1984 por Karl Steinberg y Manfred Rürup. Su primer
producto fue el secuenciador MIDI Steinberg Pro 16 para el Commodore 64. En
enero de de 2003, la compañía fue adquirida por la firma estadounidense Pinnacle
Systems, dentro de la cual operaba de forma independiente desarrollando sus
productos. Posteriormente fue vendida a Yamaha en diciembre de 2004.
Imagen 11. Nuendo.
También han especificado el protocolo ASIO Audio Stream Input Output que provee
un enlace (driver) de baja latencia entre el software de audio y las tarjetas de sonido,
la Virtual Studio Technology (VST, Tecnología de Estudio Virtual), un estándar
industrial para la programación de efectos e instrumentos virtuales, el protocolo
Linear Time Base (LTB) y el protocolo VST System Link (VSL), que comparte los
recursos de varios ordenadores a través de una red creada sobre un cable de audio
digital (SPDIF, ADAT, AES/EBU, etc.).
CAPITULO 8: HARDWARE.
La historia del hardware se puede clasificar en cuatro generaciones, cada una

caracterizada por un cambio tecnológico de importancia. Este hardware se puede
clasificar en: básico, el estrictamente necesario para el funcionamiento normal del
equipo; y complementario, el que realiza funciones específicas.
Un sistema informático se compone de una unidad central de procesamiento (CPU),

encargada de procesar los datos, uno o varios periféricos de entrada, los que
permiten el ingreso de la información y uno o varios periféricos de salida, los que
posibilitan dar salida (normalmente en forma visual o auditiva) a los datos
procesados.
El término es propio del idioma inglés (traducido: partes duras), su traducción al

español no tiene un significado acorde, por tal motivo se la ha adoptado tal cual es y
suena; la Real Academia Española lo define como «Conjunto de los componentes
que integran la parte material de una computadora». El término, aunque es lo más
común, no necesariamente se aplica a una computadora tal como se la conoce, así
por ejemplo, un robot también posee hardware (y software).
Todo sistema informático tiene, al menos, componentes y dispositivos hardware

dedicados a alguna de las funciones a saber:
Procesamiento: Unidad Central de Proceso o CPU
Almacenamiento: Memorias
Entrada: Periféricos de Entrada (E)
Salida: Periféricos de salida (S)
Entrada/Salida: Periféricos mixtos (E/S)

Lección 36: Discos ópticos (CD y DVD)
Las unidades ópticas, que la mayoría de nosotros conocemos como las unidades de
CD o DVD, son estándar en casi todas las computadoras personales nuevas. Las
tecnologías de CD y DVD se basan en principios similares, aunque DVD es una
nueva tecnología que ofrece una capacidad muy superior de audio y video integrada.
Lección 37: Especificaciones de los reproductores.
El CD de accionamiento utilizado en computadoras personales vienen en varios

tipos: CD-ROM, CD-R, y CD-RW. Todos los CD-R y CD-RW también pueden
funcionar como unidades CD-ROM, y prácticamente todas las unidades CD-RW
puede grabar discos CD-R. Vamos a cubrir los medios de comunicación en formato
CD y en profundidad en el capítulo 15, pero por ahora, he aquí una breve reseña de
los fundamentos.CD-ROM: se encuentra en CD-ROM para Compact Disc-Read Only
Memory. Las unidades de CD-ROM puede leer varios tipos de CD de datos
(incluyendo, a menudo, los discos CD-RW) y CD de audio estándar de juego. Las
unidades de CD-ROM también puede "extraer" canciones de los CD de audio al
disco duro de su ordenador (véase el Capítulo 11). CD-R, CD-R son las siglas de CD
grabable. Una vez que algo grabar en un disco CD-R, no se puede borrar o editar la
información. CD-R son buenos para la fabricación de CDs de audio, el envío de
archivos grandes con otras personas, y hacer copias de seguridad permanente de
los datos informáticos. CD-RW: CD-RW significa CD regrabable. Los discos CD-RW
se pueden borrar y volver a grabar cientos de veces. CD-RW funcionan bien para
copias de seguridad a corto plazo, pero no son una buena opción para la grabación
de CDs de audio estándar, ya que los CD-RW no funciona en muchos reproductores
de CD estándar.
Imagen 12. Reproductor de CD Audio Profesional.
Los DVD son del mismo tamaño físico como CD, pero con capacidad para casi 18
GB de información, en comparación con la capacidad de un CD de 650 o 700
MB. DVD grabables son de una sola cara y una capacidad aproximada de 4,38 GB
en una sola capa o 8.5 GB en dos capas. DVD pregrabado, como los que contienen
películas, mantenga casi 9 GB de datos mediante el uso de una segunda
capa. Pregrabado DVD también vienen en una doble cara la versión 15.9-GB que
debe dar la vuelta como un disco para tener acceso al otro lado.
DVD-ROM: Una unidad de DVD-ROM es similar a una unidad de CD-ROM en el que
se puede leer la información de los DVDs, pero no puede grabarlos. Con el software
adecuado, las unidades de DVD-ROM pueden reproducir vídeos DVD (incluyendo
películas en DVD comerciales).
Imagen 13. Reproductor de DVD-ROM.
La mayoría de las unidades de DVD-ROM también puede leer CDs. DVD grabable:
Una unidad de DVD grabable puede registrar uno o más tipos de DVD y también
realizar las funciones de una unidad de DVD-ROM. Muchas unidades de DVD
grabable también puede grabar la mayoría de los CDs. Grabables DVD vienen en
cinco formatos distintos: DVD-R, DVD-RW, DVD + R, DVD + RW, y DVD-RAM. El +
/-R formatos se escribe una vez, no a diferencia de los CD-R, y el + /-RW en formato
son regrabables. DVD-RAM es regrabable, pero no es compatible con la mayoría de
reproductores de vídeo DVD y unidades DVD-ROM. Véase el Capítulo 15 para más
información sobre los diferentes formatos de DVD.
Lección 38: Interfaces Externas
Los computadores modernos usan un número variado de propósitos generales de las

interfaces para comunicarse con aparatos externos, como por ejemplo, los discos
duros, CD/DVD, impresoras, scanners, y cámaras digitales. Las siguientes son
descripciones de algunas interfaces comunes, y la Tabla 2-4 que se rompe de un
solo vistazo. Serie (RS-232) y paralelo (Centronics) que hacen interfaces son que
van rápidamente desapareciendo y se están sustituyendo por el más rápido y más

flexible USB y FireWire.
Velocidad de
Interface transferencia Usualmente usada por
máxima
Serie
115 Kbps Módems externos, el mouse.
(RS232)
Paralelo
1 Mbps Antiguas impresoras y aparatos externos.
(ECP)
USB
11 Mbps Cámaras digitales, discos duros externos, y CD.
1.0/1.1
Unidad DVD, impresoras y scanners,

USB 2.0 480 Mbps reproductores de audio digital portátiles,
dispositivos de audio externo.
FireWire 400 Mbps Video cámaras digitales, discos duros externos.
FireWire Dispositivos de CD/DVD, reproductores de iPod,

800 Mbps
800 dispositivos de audio externo.
Tabla 1. Descripción de Interfaces.
Lección 39: Interface y conexión USB
USB o Universal Serial Bus es una interface de uso general diseñada para superar
las limitaciones de los puertos, serie y paralelo, que eran estándar en los
ordenadores desde hace muchos años.
Los puertos USB funcionan a velocidades mucho más altas que los puertos serie o
paralelo y el apoyo de múltiples dispositivos en un solo canal. La Versión 1.1 de los
puertos USB puede transferir datos a 11 megabits por segundo. Eso es mucho más
rápido que los puertos paralelos, pero no lo suficientemente rápido como para
transferir tu colección de música a un reproductor de disco duro como el iPod.
Puertos USB 2.0 puede transferir datos a una dinámica de 480 megabits por
segundo y son compatibles con dispositivos USB 1.1.
Imagen 14. Puertos USB.
La mayoría de los nuevos equipos incluyen varios puertos USB 2.0. Puede utilizar los
centros de bajo costo para añadir puertos adicionales. Productos USB disponibles en
la actualidad incluyen unidades de CD y DVD, impresoras, scanners, tarjetas de
sonido. USB es compatible con las versiones actuales de Mac OS y Windows.
Lección 40: Interface y conexión FireWire.
El FireWire, también conocido como IEEE 1394, es similar al USB y ofrece una
velocidad de transferencia de 400 megabits por segundo. FireWire es estándar en los
nuevos ordenadores Mac y en muchas cámaras de vídeo digital gracias a su
velocidad de vértigo. Los puertos FireWire del Mac y los nuevos PC utilizan un
conector de seis pines, mientras que las antiguas tarjetas FireWire para PC utilizan el
conector más pequeño de cuatro pines. Los dos pines extra en el conector de seis
pines pueden proporcionar energía, por ejemplo, para cargar la batería de un iPod.
Existe una versión más rápida de FireWire llamado FireWire 800 (IEEE 1394b) puede
mover los datos al doble de la tasa de la versión original.
Imagen 15. Puertos Firewire.
Todo lo demás es igual, la calidad de la tarjeta de sonido y altavoces tendrán el

mayor efecto sobre la calidad de audio de cualquier jugador, a través de su
ordenador.
Lección 41: Tarjetas de Sonido.
Imagen 16. Tarjeta de Audio EDIROL modelo UA-25.

Una tarjeta de sonido realiza muchas funciones, incluidas las de analógico a digital
(A / D) y digital analógico (D / A), conversión, mezcla de audio síntesis, la música, la
generación de efectos de sonido y amplificación. Durante la reproducción, la señal
digital debe ser convertida a una señal analógica, para conducir los auriculares o un
amplificador para alimentar los altavoces. Esto sucede en un dispositivo llamado
convertidor analógico digital. Los componentes dentro de una computadora generan
una enorme cantidad de ruido eléctrico. Este ruido puede ser introducido en la señal
de audio cada vez que está en un formato analógico. Pobre blindaje permite que el
ruido se filtre en la señal, y de baja calidad convertidores D/A añadir distorsión y el
ruido aún más.
Lección 42: Dispositivos externos de audio.
Una forma de evitar la captación de ruido eléctrico desde el interior del equipo es
utilizar un dispositivo externo para la conversión de digital a analógico. Estos
dispositivos son esencialmente motor fuera de borda tarjetas de sonido que se
conectan a los ordenadores a través de puertos USB o FireWire. Modelos de gama
alta puede tener muchas más entradas y salidas y otras características añadidas que
la mayoría de las tarjetas de sonido interno. Interfaces de audio USB es el tipo más
común, que van desde simples convertidores de digital a analógico a los
mezcladores de varios canales en toda regla.
Imagen 17. Interface AVID M-Box III.
Una tarjeta de sonido USB mueve la conversión de digital a analógico exterior del
equipo y por lo tanto menos susceptible al ruido de una tarjeta de sonido interna. La
AVID M-Box III, es un buen ejemplo de una interfaz de audio USB que también
funciona como un mezclador simple. Se utiliza 24 bits convertidores A/D y es
compatible con Mac y PC. El UA-3FX ha óptico y S / PDIF (coaxial) de entrada y
salidas para las conexiones digitales y estéreo RCA para conexiones analógicas.
También incluye un conector para auriculares y dos entradas conmutables para
conectar una guitarra o un micrófono.
Imagen 18. Interface, controles para entradas de Micrófonos o Guitarras.

Los controles con indicadores de pico se utilizan para la línea y la guitarra entradas
de micrófono. El volumen principal tiene un indicador de nivel y es controlado por una
rueda, lo que proporciona un control más preciso que un regulador de software de
control de volumen. Las funciones como un mezclador de dos canales, que le
permite hacer la voz en off y hace que sea una buena opción para los DJs que
utilizan los ordenadores.
CAPITULO 9: ESPECIFICACIONES Y FORMATOS DE AUDIO.
Lección 43: Formatos de Audio Digital.
Como se ha descrito en capítulos anteriores, al ser transformada la señal análoga a

datos y muestras de audio, se emplean distintos formatos digitales para la posterior
reproducción de los mismos. A continuación se describen las diferencias entre los
distintos formatos de audio digital y tipos de archivos.
MP3: Es un formato de audio comprimido que hace parte de la familia de estándares

MPEG. Este es actualmente el formato más utilizado para comprimir y compartir
archivos de audio.
AAC: Es un comprimido de muy alta calidad en formato de audio, que hace parte de
la familia de estándares MPEG.
M4A: Es una extensión de archivo para la protección contra copias AAC de los
archivos cargados desde o hacia la plataforma desarrolladla por la compañía Apple
Inc. llamada iTunes & iTunes Music Store.
M4P: Es la extensión de archivo AAC sin protección para los archivos creados bajo la
plataforma iTunes.
Real Audio: Es un formato propietario de audio comprimido, utilizado

específicamente por diversas estaciones de radio de transmisión on-line bajo
plataforma streaming.
WMA: Es una propiedad de formato de audio comprimido, desarrollado por la

compañía Microsoft.
AIFF: Es un formato de archivo de audio común para los ordenadores Mac

desarrollados por la compañía Apple Inc. (por lo general sin comprimir).
WAV: Es un formato de archivo de audio común a los ordenadores PC con OS

Windows, desarrollados por la compañía Microsoft. (Por lo general sin comprimir).
Lección 44: Comparación de formatos de Audio Digital.
En la siguiente tabla se enumeran las características de compatibilidad de cuatro

formatos comunes. La combinación de formato de archivo y el sistema de DRM
determina lo que la música de hardware y software descargado va a trabajar. Varias
normas también se puede definir dentro de la DRM para controlar las cosas tales
como el número de ordenadores, una canción se puede reproducir, y si se puede o
no grabar en un CD.
Formato Estándar DRM Plataformas Portabilidad
Linux, Mac OS,

AAC MPEG Si Favorable
Windows
Linux, Mac OS,

MP3 MPEG No Universal
Windows
WMA Propietario Si Windows Limitado
Únicamente productos
ATRAC3 Propietario Si Windows
SONY
Tabla 2. Formatos de Audio.

Lección 45: Guerra de formatos.
Imagínese si compra un CD en alguna tienda de música específica y sólo se pudiera

escuchar en reproductores de CD vendidos en el lugar de compra. Además, los CD
de cualquiera de las fuentes no funcionaria en el reproductor de CD en el tablero de
su auto. Esta situación sería totalmente inaceptable para la mayoría de la gente, pero
en el mundo de la música descargable, compañías discográficas y las tiendas de
música en línea han desarrollado tecnologías y formatos para enfrentar la realidad
misma.
Los formatos de la competencia en sí, no son el problema, muchos software y

reproductores portátiles pueden reproducir formatos múltiples. Más bien, es
incompatible la gestión de derechos digitales DRM o Digital Rights Management, que
resulta un desastre para los consumidores. Por ejemplo, si compra digitalmente una
canción en un portal especifico en internet, esta se puede reproducir con el
Reproductor de Windows Media, pero no con la plataforma iTunes. Por el contrario,
si usted compra una canción de la tienda especifica de iTunes, se puede reproducir
con iTunes, pero no con el Reproductor de Windows Media. Y si se adquiere un
reproductor portátil iPod, puede reproducir canciones compradas en iTunes pero no
se puede reproducir archivos WMA.
Esto es debido a la competencia directa entre desarrolladores y casas disqueras por

acaparar el mercado y la industria musical. Los sistemas de DRM incompatibles y
formatos propietarios no están en el mejor interés de los consumidores y, peor aún,
están limitando el crecimiento de la industria y de la música en línea. Hasta entonces,
los consumidores de música digital descargable tendrán que salir del paso a estos
inconvenientes.
Bruce Fries, Marty Fries (2005) Digital Audio Essentials: Safari Tech Books
(Audio Video).
Watkinson, John. (2002). An Introduction to Digital Audio. Woburn, MA. Third

Edition.
http://www.steinberg.net/en/404.html
http://www.saloaudio.com/SONIDO.HTML
http://es.wikipedia.org/wiki/Hardware
http://es.wikipedia.org/wiki/Software

Universidad Nacional Abierta Y A Distancia: Escuela de Ciencias Básicas Tecnología E Ingeniería

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Universidad Nacional Abierta Y A Distancia: Escuela de Ciencias Básicas Tecnología E Ingeniería

Transféré par

Droits d'auteur :

Formats disponibles

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD

ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA

208035 - AUDIO DIGITAL (e-Learning)

JUAN DAVID MEJÍA LOZANO

MILTON EDUARDO SALGADO

UNIDAD 1. ANÁLOGO VS. DIGITAL. .......................................................................11

CAPITULO 1: INTRODUCCIÓN AL AUDIO DIGITAL ............................................11

Lección 1: Audio análogo. ..................................................................................11

Lección 2: Audio digital. ......................................................................................12

Lección 3: Propiedades. .....................................................................................15

Lección 4: Sistema binario. .................................................................................16

Lección 5: Características Digitales. ...................................................................19

CAPITULO 2: PROCESOS DE AUDIO DIGITAL. ..................................................20

Lección 6: Estructura general. ............................................................................20

Lección 7: El muestreador. .................................................................................22

Lección 8: Delay programable. ...........................................................................23

Lección 9: Compresión de tiempo.......................................................................24

Lección 10: Sincronización. ................................................................................25

Lección 11: Corrección. ......................................................................................26

CAPITULO 3: CODIFICACIÓN. .............................................................................27

Lección 12: Codificación de canal. .....................................................................27

Lección 13: Reducción de datos. ........................................................................28

Lección 14: Adaptador PCM. ..............................................................................29

Lección 15: Radiodifusión digital de audio. .........................................................30

UNIDAD 2: TRANSDUCCIÓN A/D, D/A. ...................................................................32

CAPITULO 4: PROCESOS DE CONVERSIÓN .....................................................32

Lección 16. Rango auditivo. ...............................................................................32

Lección 17. Capacidad del audio análogo. .........................................................34

Lección 18. Descripción del proceso de conversión. ..........................................36

CAPITULO 5: MUESTREO Y ALIASING ...............................................................38

Lección 19. Descripción. .....................................................................................38

Lección 20. Reconstrucción. ...............................................................................40

Lección 21. Diseño de Filtros. .............................................................................42

Lección 22. Frecuencia de Muestreo. .................................................................45

Lección 23. Reloj de muestreo. ..........................................................................47

CAPITULO 6: CUANTIFICACIÓN Y DITHER. .......................................................50

Lección 24: Descripción. .....................................................................................50

Lección 25. Error de cuantificación .....................................................................52

Lección 26. El Dither...........................................................................................57

Lección 27. Dither Digital. ...................................................................................61

Lección 28. Conversión Digital-Analógica. ..........................................................67

Lección 29. Conversión Analógico-Digital. ..........................................................70

Lección 30. El Sobremuestreo. ...........................................................................74

UNIDAD 3. SOFTWARE Y HARDWARE ..................................................................83

CAPITULO 7: SOFTWARE. ...................................................................................83

Lección 31: Descripción. .....................................................................................83

Lección 32: ¿Que es software? ..........................................................................85

Lección 33: Programas de reproducción.............................................................85

Lección 34: Software profesional. .......................................................................87

CAPITULO 8: HARDWARE. ..................................................................................93

Lección 35: Descripción. .....................................................................................93

Lección 36: Discos ópticos (CD y DVD) ..............................................................94

Lección 37: Especificaciones de los reproductores. ............................................94

Lección 38: Interfaces Externas ..........................................................................96

Lección 39: Interface y conexión USB ................................................................97

Lección 40: Interface y conexión FireWire. .........................................................98

Lección 41: Tarjetas de Sonido. .........................................................................99

Lección 42: Dispositivos externos de audio. ..................................................... 100

CAPITULO 9: ESPECIFICACIONES Y FORMATOS DE AUDIO. ........................ 102

Lección 43: Formatos de Audio Digital. ............................................................ 102

Lección 44: Comparación de formatos de Audio Digital. ................................... 103