Académique Documents
Professionnel Documents
Culture Documents
(Director Nacional)
Acreditador
Bogotá – Colombia
Diciembre de 2010
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
INDICE DE CONTENIDO
INTRODUCCIÓN ......................................................................................................10
Introducción ...........................................................................................................11
Introducción ...........................................................................................................32
Introducción ...........................................................................................................83
INDICE DE TABLAS
INDICE DE ECUACIONES
INDICE DE FIGURAS
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
Figura 24. Comparación, impulsos DAC y forma de onda analógica original. ...........54
Figura 32. Formas de obtener una señal analógica a partir de datos PCM. ..............69
Figura 41. Comparación de DAC (a) con implementación de sobremuestreo (b). .....81
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
INDICE DE IMÁGENES
El presente módulo fue diseñado en el año 2010 por el Ingeniero de Sonido Juan
David Mejía Lozano, docente de la UNAD ubicado en la Sede Nacional José
Celestino Mutis, Bogotá, y se ha desempeñado como tutor desde el año 2010.
INTRODUCCIÓN
Introducción
Muchos años atrás el mundo conoce el audio como elemento clave para
reproducciones sonoras y audiovisuales de todo tipo. De éste se crean tecnologías
que manipulan de manera profesional y con alta calidad los patrones y
características propias del mundo análogo. Pero desde que se conoce y trabaja
digitalmente la señal sonora, el panorama ha cambiado significativamente al punto
de desplazar a la ya consolidada maquinaria analógica.
A pesar que los equipos analógicos modernos puedan parecer más sofisticados los
principios empleados siguen siendo los mismos, tan solo ocurre que la tecnología es
ahora más avanzada.
Un equipo ideal de grabación de audio digital tiene las mismas características que
uno de características analógicas, ambos son totalmente transparentes y reproducen
la forma de onda introducida originalmente sin error alguno. No hay más que
comparar equipos analógicos y digitales de alta calidad y utilizar las mismas señales
para darse cuenta del grado de transparencia que tienen los equipos modernos. No
hace falta decir que, en el mundo real, rara vez se dan las condiciones ideales, por lo
que tanto los equipos analógicos como los digitales se quedan cortos con respecto a
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
lo que sería lo ideal. Ocurre simplemente que el audio digital se acerca algo más al
ideal que el analógico a un costo más reducido, o bien, si así lo decide el diseñador,
puede tener el mismo rendimiento que el analógico, pero con un coste mucho más
reducido.
Para los que no conocen el audio digital a fondo les preocupa el hecho de que el
muestreo se lleve parte de una señal debido a que no se da cuenta de todo lo que
ocurre entre las muestras. Así seria en un sistema con un ancho de banda infinito,
pero ninguna señal de audio analógica tiene un ancho de banda infinito. Todas las
fuentes de señales analógicas procedentes de micrófonos, reproductores de cintas o
capsulas fonocaptoras tienen un límite de respuesta en frecuencia, como ocurre con
nuestro oído. Cuando una señal tiene un ancho de banda finito, la frecuencia a la que
puede variar es limitada y es posible predecir el modo en que cambiará. Cuando una
forma de onda sólo puede cambiar entre muestras de una sola manera, únicamente
hace falta transmitir las muestras y, a partir de ellas, poder reconstruir la forma de
onda original.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
Lección 3: Propiedades.
En pocas palabras el Audio Digital lleva la forma de onda original de forma numérica.
El número de la muestra es el valor proporcional al tiempo y la magnitud de la
muestra es la variable proporcional a la presión en el micrófono.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
Puesto que ambos ejes de la forma de onda representada digitalmente son discretos,
la forma de onda puede reconstruirse con precisión a partir de números como si se
estuviera representando sobre papel milimetrado. Si deseamos mayor precisión, tan
solo necesitaremos papel cuyos cuadrados sean de menor tamaño. Evidentemente,
se necesitaran entonces más números y cada uno de ellos podría variar a lo largo de
un rango mayor.
En los sistemas decimales, los dígitos que componen un número, representan las
unidades, las decenas, las centenas, los millares, etc. La Figura 2 muestra que, en el
sistema binario, los bits representan al 1, 2, 4, 8, 16, etc. Un número binario
compuesto por múltiples dígitos suele denominarse palabra y al número de bits de
dicha palabra se le denomina longitud de palabra. Al bit de la derecha se le
denomina bit menos significativo o LSB (least significant bit), mientras que al bit del
extremo izquierdo se le llama bit más significativo o MSB (most significant bit). Para
el sistema binario se necesitan un mayor número de dígitos que para sistema
decimal, pero son más fáciles de manejar. Una palabra de 8 bits se denomina byte
que proviene de la expresión inglesa by eigth, o por ocho. La capacidad de las
memorias y de los sistemas digitales de almacenamiento se miden en bytes, pero
con el fin d evitar números muy extensos, se suelen utilizar otros múltiplos como el
kilobyte (KB), el megabyte (MB), el gigabyte (GB), y por nuestros días, cada vez más
el terabyte (TB). Dado que las direcciones de memoria sin en sí mismas números
binarios, la longitud de palabra limita el valor de dirección. Este valor se calcula
elevando dos a la potencia de la longitud de palabra. Así una palabra de 4 bits tiene
16 combinaciones diferentes y puede direccionar una memoria compuesta de 16
posiciones. Una palabra de 10 bits tiene 1.024 combinaciones, lo que se aproxima a
1.000. En terminología digital 1K = 1.024, por tanto, una memoria de un kilobyte
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
contiene 1.024 bytes. Un megabyte (1MB) contiene 1.024 kilobytes y una gigabyte
contiene 1.024 megabytes.
Existen dos formas de poder utilizar las señales binarias con el objeto de transportar
muestras de audio, como muestra la Figura 4. Cuando cada uno de los dígitos de un
número binario es transportado a través de un hilo diferente, se habla de transmisión
en paralelo. El estado de los hilos cambia de acuerdo con la frecuencia de muestreo.
La utilización de múltiples hilos resulta incomoda, especialmente si la longitud de
palabra es extensa, por lo que es posible utilizar un solo hilo en el que los dígitos
sucesivos de cada muestra son enviados en serie. Esta es la modulación por
codificación de impulsos. Es evidente que la frecuencia de reloj debe ser ahora
mayor que la frecuencia de muestreo. Aunque la transmisión digital de audio elimina
los errores de ruido y de base de tiempos, tiene la desventaja que solo un canal de
audio de alta calidad requiere aproximadamente 1 millón de bits por segundo. El
audio digital solo puede utilizarse cuando dicha cantidad de datos pueda manejarse
de forma económica. Son posibles otros tipos de aplicaciones cuando los medios de
reducción de tal cantidad de datos sean económicos.
La fusión del audio digital y la informática tienen dos caras. Mientras el audio puede
aprovecharse de la tecnología de la RAM y del disco duro pertenecientes a la
industria informática, el Disco Compacto y semejantes ha sido utilizado en la
fabricación del CD ROM y de la RDAT para conseguir el proceso DDS digital data
storage o almacenamiento digital de datos.
Aunque el campo del audio digital es muy amplio, no debe ser necesariamente difícil.
Todo proceso debe subdividirse en pasos más pequeños y fáciles de seguir, como se
verá en los capítulos y unidades siguientes. Una vez esté comprendida la estructura
general de los dispositivos digitales, se podrá tener una perspectiva mejor de los
temas siguientes.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
La Figura 5(a) muestra un sistema digital básico de audio. Se trata de una conexión
punto a punto capaz de transmitir señales de audio analógicas de un lugar a otro. Se
compone de un par de conversores y de hardware para codificar y decodificar las
muestras. Se necesita cierta estandarización en la transmisión en serie de modo que
sea posible conectar entre sí varios dispositivos.
Las señales analógicas que entran en el sistema son convertidas por el conversor
análogo-digital ADC en muestras expresadas en números binarios. Una muestra
típica tendría una longitud de palabra de 16 bits. La muestra se introduce en paralelo
en un registro de desplazamiento el cual se desplaza con una señal de reloj que va a
16 veces la frecuencia de muestreo. Los datos se envían en serie al otro extremo de
la línea en donde un fragmentador (slaicing) rechaza el ruido captado en la señal.
Los datos que han sido fragmentados son trasladados al registro de desplazamiento
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
receptor con una señal de reloj de bits. Una vez cada 16 bits el registro de
desplazamiento contiene una muestra completa que es leída por el reloj de
frecuencia de muestreo, o reloj de palabras y es enviada al conversor digital-análogo
DAC, que a su vez convierte la muestra de nuevo en un valor de tensión analógico.
Lección 7: El muestreador.
Si se utiliza la RAM de una forma diferente, es posible escribir y leer en ella al mismo
tiempo. El dispositivo se convierte así en un retardador de audio. Controlando la
relación entre las direcciones se varía el retardo. Las direcciones son generadas por
contadores que vuelven a 0 (cero) una vez alcanzado el punto máximo de conteo.
Como resultado, el espacio de la memoria adopta un aspecto circular, tal como
muestra la Figura 7. Las direcciones de lectura y escritura son controladas por un
reloj común y se persiguen una a la otra en sentido. Si la dirección de lectura sigue
muy de cerca a la de escritura el retardo será breve, si se sitúa justo delante de la
dirección de escritura se alcanzara el valor máximo de retardo.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
Los retardos programables son de gran utilidad para los estudios de televisión ya que
permite la alineación de las señales de audio con las de video que hayan sido
retardadas en varios procesos. También pueden utilizarse en auditorios con el fin de
alinear el sonido procedente de distintos altavoces.
Cuando las muestras son convertidas, el ADC debe funcionar a una frecuencia de
reloj constante y lleva a la salida una cadena continua de muestras. La compresión
de tiempo permite dividir la cadena de muestras en bloques con el fin de poder
manejarlos mejor.
En los equipos de grabación multipista las distintas pistas pueden sincronizarse con
la precisión de la muestra de modo que no se presenten errores de temporización
entre las pistas. Otros transportes adicionales pueden actuar como esclavos del
primero con el mismo grado de precisión en caso que se necesiten más pistas. En
los equipos estéreos de grabación, son eliminados los desplazamientos de imagen
provocados por errores de fase.
El grado de percepción de un error de bit depende del bit afectado de una muestra.
Si estuviera defectuoso el LSB de una muestra perteneciente a un pasaje musical
cuyo volumen es elevado, el efecto pasaría totalmente enmascarado y sería difícil
detectarlo. Por el contrario, si el MSB de una determinada muestra resultara erróneo
en un pasaje tranquilo, sería imposible no percatarse del transitorio de gran magnitud
resultante. Evidentemente, es necesario algún medio para conseguir que los errores
provocados por el soporte sean imperceptibles. Esta es la finalidad de la corrección
de errores.
CAPITULO 3: CODIFICACIÓN.
En el audio digital, un valor común de muestra es todo cero, que se corresponde con
el silencio. Si se carga un registro de desplazamiento con todo en ceros y se sacan
en serie, la salida se mantiene a un nivel bajo constante, y no se grabara nada en la
pista.
La salida de una unidad de reducción de datos sigue siendo datos binarios, pero ya
no están en PCM regular, por lo que no puede introducirse en un DAC normal sin
pasar antes por un decodificador de adaptación cuya salida sea un PCM
convencional. La combinación de una unidad de reducción de datos y un
decodificador tiene el nombre de códec. El funcionamiento de un códec se
comprueba de una sola pasada como si se utilizara en DAB o en una grabación de
una sola generación. No tiene por qué obtenerse el mismo funcionamiento si se
conectan en cascada varios códecs, sobre todo si son de diferentes tipos. Si se
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
ecualiza una señal de audio que ha pasado por un códec de reducción de datos, el
nivel de anomalías puede elevarse por encima del nivel umbral de enmascaramiento.
Como resultado la reducción de datos puede no ser adecuada para grabar material
original antes de la fase de post-producción.
El adaptador PCM fue una de las primeras soluciones para grabar el gran ancho de
banda de las señales de audio PCM antes de que se ideara la grabación digital de
alta densidad. La Figura 9 muestra los componentes esenciales de un equipo digital
de grabación de audio que utiliza esta técnica. Las señales de audio analógicas son
convertidas en digital y comprimidas en el tiempo con el fin de que se ajusten a las
partes de la forma de onda de video que no están en blanco.
POSIBILIDADES
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
Aunque la calidad del audio digital es innegable sus posibilidades pueden resultar
más importantes a largo plazo. Una vez que el audio se convierte en datos, hay gran
libertad para almacenarlos y procesarlos en equipos computarizados. Las
restricciones innecesarias en los equipos haciendo una implementación digital a
partir de un sistema analógico. El sistema analógico evoluciono para funcionar dentro
de las restricciones impuestas por la tecnología. Coger ese mismo sistema y
digitalizarlo sería un error.
Introducción
alguna, diremos que el sonido reproducido es perfecto por tanto, el criterio de calidad
es completamente subjetivo y solo puede comprobarse mediante pruebas de
audición. No obstante, cualquier característica de una señal que pueda escucharse
también puede medirse con un instrumento apropiado. Las pruebas subjetivas nos
pueden indicar el grado de sensibilidad que debe tener el instrumento.
Normalmente el grado de sensibilidad del oído humano es mayor entre los 2 kHz y
los 5 kHz aproximadamente y, aunque algunas personas pueden detectar 20 kHz a
un nivel considerable, existen varias pruebas que sugieren que la mayoría de los
oyentes no pueden distinguir si el límite superior de frecuencias del sonido se
encuentra en los 20 kHz o los 16 kHz. Recientemente se ha comprobado que la
reproducción de frecuencias por debajo de los 20 kHz mejora las cualidades de
realidad y ambiente sonoro. El rango dinámico del oído tiene una respuesta
logarítmica que sobrepasa claramente los 100 dB.
que necesita la señal analógica y sus extremos no pueden ser explorados por dicha
señal.
El sonido transmitido por un sistema digital fluye en forma de cadena de bits. Debido
a que los bits son discretos, es fácil cuantificar el flujo con un solo contar el numero
por segundo. Es más difícil cuantificar la cantidad de información de una señal
analógica (por ejem. un micrófono) pero, si se hiciera utilizando las mismas unidades,
sería posible determinar qué régimen de bits sería necesario para transmitir dicha
señal sin pérdida de información, es decir, ensanchar la ventana lo suficiente. Si se
puede enviar una señal sin pérdida de información y sin captar señales no deseadas
a lo largo del recorrido, habrá sido transmitida perfectamente. La conexión entre las
señales analógicas y la capacidad de información fue hecha por Shannon. Los
principios son sencillos y ofrecen una idea inmediata del funcionamiento y de las
posibilidades relativas y de los distintos métodos de modulación, incluida la
digitalización.
La Figura 10 muestra una señal analógica con cierto grado de ruido sobrepuesto,
como ocurre con todas las señales de audio reales. El ruido se define como una
señal aleatoria sobrepuesta que nos se correlaciona con la señal deseada. El ruido
es aleatorio y, por tanto, la tención real de la señal deseada resulta incierta. Puede
encontrarse en cualquier punto dentro del rango de amplitud del ruido. Ejemplo, si la
amplitud de la señal es 16 veces la del ruido solo será posible transmitir 16 niveles
de señal diferentes sin ambigüedad, puesto que los niveles deben ser los bastante
diferentes como para que el ruido no haga que uno se asemeje a otro. Es posible
transmitir 16 niveles distintos mediante el número total de combinaciones de 4 bits de
datos, quedando establecida así la conexión entre los dominios analógico y
cuantificado.
práctica, cada uno presenta ventajas diferentes así como deficiencias. Ambas
configuraciones pueden encontrarse en equipos reales.
Del mismo modo que la radio de AM produce bandas laterales o imágenes por
encima y por debajo de la portadora, el muestreo también produce bandas laterales
aunque la portadora es ahora un tren de impulsos y tiene una serie infinita de
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
tensión en el centro de la muestra se debe solo a esa muestra, puesto que el valor
de toda las demás muestras es cero en ese instante. Dicho de otro modo, la forma
de onda de salida de tiempo constante debe unir los picos de las muestras de
entrada.
Entre los instantes de las muestras, la salida del filtro es la suma de muchos
impulsos, y la forma de onda une de manera uniforme los picos de las muestras.
Como consecuencia de la limitación de banda del filtro original anti-aliasing, la forma
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
de onda analógica filtrada sólo puede viajar entre los puntos de la muestra de una
sola manera. Como el filtro de reconstrucción tiene la misma respuesta en
frecuencia, la forma de onda de salida reconstruida debe ser idéntica a la forma de
onda original de banda limitada, anterior al proceso de muestreo. Se deduce que el
muestreo no tiene que ser audible.
El filtro ideal con una pendiente de corte vertical brickwall o “muro de ladrillo” es difícil
de implementar. A medida que la pendiente tiende a la vertical el retardo provocado
por el filtro tiende al infinito. En la práctica se ha de aceptar un filtro con una
pendiente finita, como muestra la Figura 16. La pendiente de corte comienza en el
borde de la banda requerida, y, en consecuencia la frecuencia de muestreo ha de
incrementarse un poco para llevar los productos de aliasing a un nivel
aceptablemente bajo. No hay un factor absoluto por el que deba elevarse la
frecuencia de muestreo, depende de los filtros disponibles y del nivel de los
productos de aliasing que son aceptables. Estos últimos dependen de la longitud de
palabra a la que se cuantificara la señal.
Hasta este punto se han descrito filtros perfectos y de reconstrucción, pero estos no
existen. Los diseñadores utilizan dispositivos con pendientes y rechazo finitos, lo que
produce todavía efectos de aliasing. No es fácil especificar los filtros anti-aliasing,
sobre toda la cantidad de rechazo necesaria en la banda de bloqueo. El grado de
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
Toda señal que haya pasado por el dominio digital habrá tenido que pasar por un
filtro anti-aliasing y otro de reconstrucción. Estos filtros deben diseñarse cuidadosa
mente para evitar anomalías audibles, particularmente aquellos provocados por falta
de linealidad de fase, puesto que pueden llegar a ser audibles. La naturaleza de los
filtros empleados está muy relacionada con la calidad subjetiva del sistema.
Es posible construir filtros de fase lineal libre de rizados con el rechazo en la banda
de paso requerido, pero resulta caro en términos de diseño y complejidad de los
componentes que podrían perder sus especificaciones, dado que estos se deterioran
con el tiempo. Es posible evitar la necesidad de dicho filtro, ahorrando esfuerzo en el
diseño de filtros analógicos utilizando las técnicas de sobremuestreo. Estrictamente
hablando, el sobremuestreo no significa otra cosa que utilizar una frecuencia de
muestreo mayor que la requerida en la teoría de muestreo. En sentido general, “un
conversor de sobremuestreo” implica la utilización de una frecuencia de muestreo
mayor y otra serie de técnicas distintas. La superioridad sonora y la economía que
presentan los conversores de sobremuestreo les han llevado a convertirse en
dispositivos casi universales.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
La teoría sobre muestreo es solo el comienzo del proceso que se ha de seguir para
llegar a una frecuencia de muestreo adecuada. La pendiente finita de los filtros reales
obliga a los diseñadores a incrementar la frecuencia de muestreo. Para equipos
comerciales, cuanto menor sea la frecuencia de muestreo, mejor, puesto que el costo
del medio es directamente proporcional a la frecuencia de muestreo, por esto es de
esperar frecuencias cercanas al doble de 20 kHz. En equipos profesionales, se
necesita funcionar a una velocidad variable para realizar correcciones de tono.
Cuando se reduce la velocidad de un dispositivo de grabación digital, disminuye la
frecuencia de muestreo de la señal de la cinta. La Figura 19 muestra que con una
frecuencia de muestreo mínima, la primera frecuencia imagen puede ser lo bastante
baja para pasar el filtro de reconstrucción. Si se eleva la frecuencia de muestreo sin
variar la respuesta de los filtros se puede reducir la velocidad sin que surja este
problema.
Para el sistema de video de 50 Hz, hay 37 líneas de supresión, quedando 588 líneas
activas por cuadro o 294 por campo, así que la misma frecuencia de muestreo viene
expresada por:
La frecuencia de muestreo de 44,1 kHz fue la que se adopto para el CD. A pesar de
que el CD no tiene una circuitería de video, el equipo empleado para ser el máster
del CD está basado en el video y determina la frecuencia de muestreo.
Para las líneas de conexión con transmisores de radio difusión FM estéreo con un
ancho de banda de 15 kHz, la frecuencia de muestreo de 32 kHz es adecuada, y es
la que se utiliza desde hace bastante tiempo en el Reino Unido, Japón y América.
Esta frecuencia también se utiliza en el sistema de sonido estéreo de televisión. Se
propuso la frecuencia de muestreo profesional de 48 kHz por tener una simple
relación con la 32 kHz siendo además un valor que está suficientemente por encima
de los 40 kHz para permitir el funcionamiento de velocidad variable.
equipos de grabación digital y 48 kHz en adelante para uso profesional. El éxito del
audio digital ha significado que muchos equipos funcionen a 44,1 kHz para adaptarse
al este incluyendo el CD. Con la llegada de los filtros digitales, podemos hacer un
seguimiento de la frecuencia de muestreo, sin ser necesaria una frecuencia de
muestreo mayor para los cambios de tono. Los 48 kHz se utilizan principalmente en
televisión o estudios de grabación donde puede sincronizarse con ambos estándares
de líneas de manera fácil. La mayoría de los equipos de grabación digital con discos
duros, funcionan a varias frecuencias.
En la Figura 20 se muestra el efecto provocado por el jitter del reloj sobre una forma
de onda con pendiente. Las muestras son tomadas en tiempos incorrectos. Una vez
que estas muestras hayan pasado por un sistema la etapa de corrección de la base
de tiempos anterior al DA Chara desaparecer dicha fluctuación, y el resultado es el
que aparece en (b). La magnitud de la señal no deseada es proporcional a la
pendiente de la forma de onda de audio, así l cantidad de jitter que puede tolerarse
cae a 6 dB por octava. A medida que aumente la resolución del sistema por el uso de
una mayor longitud de palabra de las muestras, se reduce más el grado de
tolerancia al jitter. La naturaleza de la señal no deseada, depende del espectro del
jitter. Si este es aleatorio, el efecto se asemeja al ruido y es relativamente benigno a
menos que la amplitud sea excesiva. La Figura 21 muestra el efecto de distintas
cantidades de jitter aleatorio con respecto a la base del ruido de distinta longitudes
de palabra. Obsérvese que incluso pequeñas cantidades de jitter pueden degradar
un conversor de 20 bits hasta llegar a funcionar como un buen dispositivo de 16 bits.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
El jitter del reloj no tiene que ser necesariamente aleatorio. Una fuente de dicho jitter
es la diafonía o la interferencia en la señal de reloj. Una línea de reloj equilibrada
será más inmune a tales diafonías, pero el interfaz eléctrico del audio digital
comercial no está equilibrado y está sujeto a interferencias externas. No hay ninguna
razón por las que estas interferencias tengas que ser de carácter aleatorio, pueden
ser periódicas y potencialmente audibles.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
Un conversor bien diseñado debe rechazar gran parte del jitter de una señal de reloj
externa y ha de sonar igual cuando reproduzca los mismos datos
independientemente de cuál sea la fuente de los datos. Un conversor remoto que
suene diferente cuando reproduzca, ejemplo, el mismo disco compacto a través de
las salidas digitales de varios reproductores de CD significara que no ha sido bien
diseñado y debe rechazarse. De igual modo si es posible oír el efecto que produce el
cambiar el tipo de cable que alimenta el conversor, dicha unidad será de mala
calidad.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
En audio, los valores que se han de cuantificar son tensiones infinitamente variables
procedentes de una fuente analógica. La cuantificación propiamente dicha es un
proceso que funciona únicamente en el dominio de la tensión. Con el propósito de
estudiar la cuantificación de una sola muestra, podemos suponer que el tiempo
permanece inamovible.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
Así, por ejemplo, un sistema de 16 bits presenta una SNR de 98,1 dB.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
Aunque el resultado anterior es válido para una forma de onda compleja de entrada
de gran amplitud, en tratamientos en los que se presupone que el error de
cuantificación es siempre ruido, se obtienen resultados incorrectos. La expresión
anterior sólo es válida si es uniforme la densidad de probabilidad del error de
cuantificación. Desafortunadamente, a niveles bajos y, en particular, con formas de
onda puras o simples, no sucede así.
A niveles bajos de audio, el error de cuantificación deja de ser aleatorio y pasa a ser
una función de la forma de onda de entrada y de la estructura de cuantificación, tal
como indica la Figura 24. Una vez que una señal no deseada se convierte en una
función determinante de la señal deseada, debe clasificarse como distorsión y no
como ruido. También es posible predecir la distorsión a partir de la falta de linealidad,
o naturaleza escalonada, de la función de transferencia. En una señal de gran
amplitud, hay tantos escalones implicados que debemos mirarla desde cierta
distancia, ya que una escalera de 65.000 escalones adopta el aspecto de una
pendiente. Con señales pequeñas, hay pocos escalones y, por tanto, no pueden
ignorarse.
La aplicación del dither significa que las muestras sucesivas encuentran los
intervalos de cuantificación en diferentes lugares en la escala de tensión. El error de
cuantificación se convierte en una función del dither, en vez de una función previsible
de la señal de entrada. El error de cuantificación no se elimina, pero la distorsión
subjetivamente inaceptable se convierte en un ruido de banda ancha que es más
aceptable por el oído.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
Cuando se atenúa el valor de una muestra, los bits extra de orden inferior que
aparecen por debajo de la coma decimal mantienen la resolución de la señal y del
dither en el bit o los bits menos significativos que linealiza el sistema. La misma
extensión de palabra tendrá lugar en cualquier proceso en el que se vea implicada la
multiplicación, como puede ser el filtrado digital. Por tanto, será necesario acortar la
longitud de palabra eliminando los bits de orden inferior.
intervalos de un sexto del tamaño de una unidad de 16 bits y el resultado es una gran
pérdida de linealidad.
La Figura 29 muestra un sencillo sistema de dither digital (esto es, sin modelado de
ruido) para acortar la longitud de la muestra. La salida de un generador de
secuencias pseudo-aleatorias con complemento a dos con una longitud de palabra
apropiada es añadida a las muestras de entrada antes de realizar el redondeo. El bit
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
más significativo de los que se han de eliminar es examinado con el fin de determinar
si los bits que se van a eliminar suman más o menos de la mitad de un intervalo de
cuantificación. La muestra con dither es redondeada por defecto, esto es, los bits no
deseados son descartados, o bien es redondeada por exceso, es decir, los bits no
deseados se descartan pero se añade un 1 al valor de la nueva palabra acortada. El
proceso de redondeo ya no es determinante debido al dither añadido, que
proporciona una componente aleatoria de linealización.
Si se compara este proceso con el de la Figura 26, se verá que los principios del
dither analógico y digital son idénticos; simplemente, los procesos tienen lugar en
diferentes dominios y utilizan números con complemento a dos que son redondeados
o tensiones que son cuantificadas según sea apropiado. De hecho, la cuantificación
de una forma de onda con dither analógico es idéntica al caso hipotético del
redondeo después del dither digital bipolar, donde el número de bits que se han de
eliminar es infinito y permanece idéntico con fines prácticos cuando hay que eliminar
tan sólo 8 bits. En realidad, el dither analógico puede generarse a partir del dither
digital bipolar (que no es otra cosa que números aleatorios con ciertas propiedades)
mediante un DAC.
La forma más simple de dither (y, por tanto, la más fácil de general digitalmente)
consiste en una sola secuencia de números aleatorios que presentan una
probabilidad uniforme o rectangular. La amplitud del dither es crítica. La Figura 30(a)
muestra la función de transferencia en tiempo medio de un intervalo de cuantificación
en presencia de varias amplitudes de dither rectangular. La linealidad es perfecta con
una amplitud de 1Q pico a pico y se deteriora para amplitudes mayores o menores.
Lo mismo ocurre con todos los niveles que sean múltiplos enteros de Q. Por tanto, no
existe libertad para la elección de la amplitud.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
escalón vertical o en el límite entre los dos intervalos, se producen gran cantidad de
conmutación entre los códigos y se genera el mayor ruido posible.
Un sistema de 16 bits con un dither gaussiano correcto tendrá una SNR de 92,1 dB.
En aplicaciones con dither digital, el dither de probabilidad triangular de 2Q pico a
pico es el óptimo ya que ofrece la mejor combinación posible de distorsión cero, sin
modulación de ruido y SNR. Aunque este resultado también es válido para el dither
analógico, no es práctico aplicarlo en un ADC real, ya que todas las señales
analógicas reales contienen ruido térmico, el cual es gaussiano.
Nos ocupamos primero de la conversión en esta dirección ya que los ADC suelen
utilizar DAC incluidos en los bucles de realimentación.
Figura 32. Formas de obtener una señal analógica a partir de datos PCM.
longitud de palabra adecuada, que será mayor que la longitud de palabra del primer
cuantificador. Puede utilizarse de manera alternativa el proceso de modelado de
ruido.
http://www.scientificpsychic.com/workbook/sentidos-humanos.html
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
Introducción
CAPITULO 7: SOFTWARE.
Existen diversos programas para crear, editar y reproducir audio digital. Los
programas más simples muestran una función principal como reproducir o grabar
audio por medio de su carta de sonido, pero muchos programas que trabajan con
audio digital presentan diversas funciones claves. Por ejemplo, los programan que
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
Los programas específicos, la mayoría de las veces, necesitan trabajar con unos
servicio específicos, como iTunes Music Store o Rhapsody Music Service, o radio
servicios de internet como Live 365. Algunas veces, programas son instalados para
aspectos como crossfading automático, mientras que otros programas han de ser
instalados porque son requeridos para algún específico formato de audio.
Hoy en día, sin contar que ya son varios, estos programas tienen características
específicas y detalladas, que se diferencian del resto y entre ellos mismos, a
continuación se exponen, si no los más usados, los programas que cumple con las
características necesarias y de punta para trabajar muestras digitales de audio, en
algunos casos combinados con video.
Pro Tools: es una estación de trabajo de audio digital (Digital Audio Workstation o
DAW, en inglés), una multiplataforma de grabación multipista de audio y MIDI, que
integra hardware y software. Actualmente, por sus altas prestaciones, es el estándar
de grabación en estudios profesionales, usado mundialmente.
La empresa Digidesign, que desarrolla el programa Pro Tools, elabora algunos de los
mejores softwares de audio del mercado, por lo que su calidad y sólida fiabilidad son
ampliamente reconocidas. Esto ha llevado a este potente software de producción
musical y postproducción audiovisual a convertirse en uno de los referentes de esta
industria.
El estigma de Pro Tools, lo que lo hace exclusivo, es que sólo puede usarse con un
hardware específico, y no admite otras marcas.
Logic Pro proporciona los instrumentos, los sintetizadores, los efectos audio y los
grabadores de voz para la síntesis de la música. Los efectos de audio incluyen las
distorsiones, procesadores dinámicos y ecualizadores. El diseño del espacio, por
ejemplo, simula la acústica del audio en diversos ambientes, tales como producir
ecos. Logic Pro puede trabajar con los teclados MIDI y las superficies de control para
la entrada de sonido. También ofrece editar en tiempo real la música, el soporte de la
guitarra, abreviaturas del acorde y la notación del tambor.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
El uso de Logic Pro también ofrece capacidades adicionales, que pueden funcionar a
través de una LAN de Internet. Si la red es bastante rápida, se puede trabajar
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
repartiendo el trabajo entre varias CPUs. Esto permite que los usuarios combinen la
energía de varias computadoras de Macintosh de procesar los instrumentos y plug-
ins incorporados del software.
CUBASE es una serie de aplicaciones informáticas para editar audio digital, MIDI y
un secuenciador de música, (comúnmente conocidas como DAW - Digital Audio
Workstation), creadas originalmente por la firma alemana Steinberg en 1989.
ejecutar varias aplicaciones MIDI en el ordenador y pasar los datos entre ellas a
tiempo real. El MROS no trabajaba bien en Windows 3.0, pues este no fue previsto
para aplicaciones en tiempo real.
Sin embargo, los sistemas operativos modernos están diseñados para soportar
aplicaciones multimedia, así que las versiones actuales de Cubase no usan MROS.
El lanzamiento de Cubase Audio en 1991 para el Atari Falcon abrió una brecha en la
tecnología de programas DSP poniendo al alcance domestico la manipulación de
audio en tiempo real. Esto era posible sin la necesidad de costosas tarjetas
adicionales, como era el caso con el costoso Pro Tools y otros sistemas similares.
Cubase crea proyectos que permiten al operador editar archivos MIDI, pistas de
audio crudo, y otras informaciones asociadas como las letras de la canción, y
presentarlos en un rango de formatos incluyendo calificación musical, consola de
edición, lista de eventos, etc. El operador también puede mezclar varias pistas en
formato estéreo .wav o .mp3 listas para grabarlas en un CD.
La compañía fue fundada en 1984 por Karl Steinberg y Manfred Rürup. Su primer
producto fue el secuenciador MIDI Steinberg Pro 16 para el Commodore 64. En
enero de de 2003, la compañía fue adquirida por la firma estadounidense Pinnacle
Systems, dentro de la cual operaba de forma independiente desarrollando sus
productos. Posteriormente fue vendida a Yamaha en diciembre de 2004.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
También han especificado el protocolo ASIO Audio Stream Input Output que provee
un enlace (driver) de baja latencia entre el software de audio y las tarjetas de sonido,
la Virtual Studio Technology (VST, Tecnología de Estudio Virtual), un estándar
industrial para la programación de efectos e instrumentos virtuales, el protocolo
Linear Time Base (LTB) y el protocolo VST System Link (VSL), que comparte los
recursos de varios ordenadores a través de una red creada sobre un cable de audio
digital (SPDIF, ADAT, AES/EBU, etc.).
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
CAPITULO 8: HARDWARE.
Almacenamiento: Memorias
Las unidades ópticas, que la mayoría de nosotros conocemos como las unidades de
CD o DVD, son estándar en casi todas las computadoras personales nuevas. Las
tecnologías de CD y DVD se basan en principios similares, aunque DVD es una
nueva tecnología que ofrece una capacidad muy superior de audio y video integrada.
Los DVD son del mismo tamaño físico como CD, pero con capacidad para casi 18
GB de información, en comparación con la capacidad de un CD de 650 o 700
MB. DVD grabables son de una sola cara y una capacidad aproximada de 4,38 GB
en una sola capa o 8.5 GB en dos capas. DVD pregrabado, como los que contienen
películas, mantenga casi 9 GB de datos mediante el uso de una segunda
capa. Pregrabado DVD también vienen en una doble cara la versión 15.9-GB que
debe dar la vuelta como un disco para tener acceso al otro lado.
DVD-ROM: Una unidad de DVD-ROM es similar a una unidad de CD-ROM en el que
se puede leer la información de los DVDs, pero no puede grabarlos. Con el software
adecuado, las unidades de DVD-ROM pueden reproducir vídeos DVD (incluyendo
películas en DVD comerciales).
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
La mayoría de las unidades de DVD-ROM también puede leer CDs. DVD grabable:
Una unidad de DVD grabable puede registrar uno o más tipos de DVD y también
realizar las funciones de una unidad de DVD-ROM. Muchas unidades de DVD
grabable también puede grabar la mayoría de los CDs. Grabables DVD vienen en
cinco formatos distintos: DVD-R, DVD-RW, DVD + R, DVD + RW, y DVD-RAM. El +
/-R formatos se escribe una vez, no a diferencia de los CD-R, y el + /-RW en formato
son regrabables. DVD-RAM es regrabable, pero no es compatible con la mayoría de
reproductores de vídeo DVD y unidades DVD-ROM. Véase el Capítulo 15 para más
información sobre los diferentes formatos de DVD.
Velocidad de
Interface transferencia Usualmente usada por
máxima
Serie
115 Kbps Módems externos, el mouse.
(RS232)
Paralelo
1 Mbps Antiguas impresoras y aparatos externos.
(ECP)
USB
11 Mbps Cámaras digitales, discos duros externos, y CD.
1.0/1.1
USB o Universal Serial Bus es una interface de uso general diseñada para superar
las limitaciones de los puertos, serie y paralelo, que eran estándar en los
ordenadores desde hace muchos años.
Los puertos USB funcionan a velocidades mucho más altas que los puertos serie o
paralelo y el apoyo de múltiples dispositivos en un solo canal. La Versión 1.1 de los
puertos USB puede transferir datos a 11 megabits por segundo. Eso es mucho más
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
rápido que los puertos paralelos, pero no lo suficientemente rápido como para
transferir tu colección de música a un reproductor de disco duro como el iPod.
Puertos USB 2.0 puede transferir datos a una dinámica de 480 megabits por
segundo y son compatibles con dispositivos USB 1.1.
La mayoría de los nuevos equipos incluyen varios puertos USB 2.0. Puede utilizar los
centros de bajo costo para añadir puertos adicionales. Productos USB disponibles en
la actualidad incluyen unidades de CD y DVD, impresoras, scanners, tarjetas de
sonido. USB es compatible con las versiones actuales de Mac OS y Windows.
El FireWire, también conocido como IEEE 1394, es similar al USB y ofrece una
velocidad de transferencia de 400 megabits por segundo. FireWire es estándar en los
nuevos ordenadores Mac y en muchas cámaras de vídeo digital gracias a su
velocidad de vértigo. Los puertos FireWire del Mac y los nuevos PC utilizan un
conector de seis pines, mientras que las antiguas tarjetas FireWire para PC utilizan el
conector más pequeño de cuatro pines. Los dos pines extra en el conector de seis
pines pueden proporcionar energía, por ejemplo, para cargar la batería de un iPod.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
Existe una versión más rápida de FireWire llamado FireWire 800 (IEEE 1394b) puede
mover los datos al doble de la tasa de la versión original.
Una tarjeta de sonido realiza muchas funciones, incluidas las de analógico a digital
(A / D) y digital analógico (D / A), conversión, mezcla de audio síntesis, la música, la
generación de efectos de sonido y amplificación. Durante la reproducción, la señal
digital debe ser convertida a una señal analógica, para conducir los auriculares o un
amplificador para alimentar los altavoces. Esto sucede en un dispositivo llamado
convertidor analógico digital. Los componentes dentro de una computadora generan
una enorme cantidad de ruido eléctrico. Este ruido puede ser introducido en la señal
de audio cada vez que está en un formato analógico. Pobre blindaje permite que el
ruido se filtre en la señal, y de baja calidad convertidores D/A añadir distorsión y el
ruido aún más.
Una forma de evitar la captación de ruido eléctrico desde el interior del equipo es
utilizar un dispositivo externo para la conversión de digital a analógico. Estos
dispositivos son esencialmente motor fuera de borda tarjetas de sonido que se
conectan a los ordenadores a través de puertos USB o FireWire. Modelos de gama
alta puede tener muchas más entradas y salidas y otras características añadidas que
la mayoría de las tarjetas de sonido interno. Interfaces de audio USB es el tipo más
común, que van desde simples convertidores de digital a analógico a los
mezcladores de varios canales en toda regla.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Contenido didáctico del curso Audio Digital
Una tarjeta de sonido USB mueve la conversión de digital a analógico exterior del
equipo y por lo tanto menos susceptible al ruido de una tarjeta de sonido interna. La
AVID M-Box III, es un buen ejemplo de una interfaz de audio USB que también
funciona como un mezclador simple. Se utiliza 24 bits convertidores A/D y es
compatible con Mac y PC. El UA-3FX ha óptico y S / PDIF (coaxial) de entrada y
salidas para las conexiones digitales y estéreo RCA para conexiones analógicas.
También incluye un conector para auriculares y dos entradas conmutables para
conectar una guitarra o un micrófono.
Los controles con indicadores de pico se utilizan para la línea y la guitarra entradas
de micrófono. El volumen principal tiene un indicador de nivel y es controlado por una
rueda, lo que proporciona un control más preciso que un regulador de software de
control de volumen. Las funciones como un mezclador de dos canales, que le
permite hacer la voz en off y hace que sea una buena opción para los DJs que
utilizan los ordenadores.
AAC: Es un comprimido de muy alta calidad en formato de audio, que hace parte de
la familia de estándares MPEG.
M4A: Es una extensión de archivo para la protección contra copias AAC de los
archivos cargados desde o hacia la plataforma desarrolladla por la compañía Apple
Inc. llamada iTunes & iTunes Music Store.
M4P: Es la extensión de archivo AAC sin protección para los archivos creados bajo la
plataforma iTunes.
Únicamente productos
ATRAC3 Propietario Si Windows
SONY
Bruce Fries, Marty Fries (2005) Digital Audio Essentials: Safari Tech Books
(Audio Video).
http://www.steinberg.net/en/404.html
http://www.saloaudio.com/SONIDO.HTML
http://es.wikipedia.org/wiki/Hardware
http://es.wikipedia.org/wiki/Software