Académique Documents
Professionnel Documents
Culture Documents
TRABAJO INVESTIGACIÓN
MPEG-2
2.2. MPEG.-
2.3.1. SDTV.-
Otros métodos de compresión que se han establecido
como estándar por sus prestaciones y su amplia
La definición estándar (en inglés SDTV, standard
aplicación son los métodos denominados MPEG. Las
definition television) es el acrónimo que reciben las
siglas MPEG vienen de (Motion Pictures Expert
señales de televisión que no se pueden considerar
Group) nombre de un grupo de expertos común entre
señales de alta definición (HDTV) ni de señal de
la ISO (International Standards Organization) y la IEC
televisión de definición mejorada (EDTV).
(International Electrotechnical committe). El
fundamento básico de la compresión MPEG es el
siguiente: Es la resolución de vídeo dominante desde el origen de
● Se busca una representación válida de la la televisión hasta la aparición de la alta definición. El
imagen que concentre la información en una sistema está alrededor de una resolución de 500 líneas
pequeña parte de la descripción. horizontales PAL funciona con una resolución de
720×576, mientras que NTSC proporciona 720×486.
● Se cuantifican los elementos de dicha Utiliza una velocidad entre 25 hasta los 29.97 cuadros
representación de modo que se discretizan sus por segundo en NTSC, y de 25 para formato PAL.
posibles valores. Hasta la aparición de los sistemas digitales, SDTV
sólo tenía un significado, pero actualmente se usa para
● A cada nivel de cuantificación se le asigna un referirse a dos sistemas de codificación digital y envío
de señales de vídeo: Por un lado SDTV se usa por
código de bits. denominar las señales analógicas de 480 líneas
UNIVERSIDAD CATOLICA BOLIVIANA “SAN PABLO” Ingeniería en Telecomunicaciones
Telecomunicaciones III – TEL 218 Semestre: II-2018
2.3.2. HDTV.-
2.3.6.1. Notacion
El patrón de submuestreo normalmente se indica con
una notación de tres dígitos separados por dos
puntos j:a:b (como, por ejemplo, 4:2:2) o, a veces,
cuatro dígitos (por ejemplo, 4:2:2:4) que describe el
número de muestras de luminancia y crominancia en
una región de “j” pixeles. El significado de esta
notación, de izquierda a derecha es el siguiente:
Fig3.- Frecuencias para formatos de muestreo
UNIVERSIDAD CATOLICA BOLIVIANA “SAN PABLO” Ingeniería en Telecomunicaciones
Telecomunicaciones III – TEL 218 Semestre: II-2018
compresión, es el que se utiliza en vídeo digital, y es el descompresión. Por ello esta compresión se denomina
que más nos interesa por su mantenimiento de la con pérdidas, o degradante.
calidad, consiguiendo factores de compresión Otros métodos de compresión que se han establecido
interesantes. como estándar por sus prestaciones y su amplia
Finalmente, en la compresión subjetivamente con aplicación son los métodos denominados MPEG. Las
pérdidas, durante el proceso de compresión- siglas MPEG vienen de (Motion Pictures Expert
descompresión se degrada significativamente la Group) nombre de un grupo de expertos común entre
calidad de la información, pero el usuario lo tolera en la ISO (International Standards Organization) y la IEC
beneficio del servicio recibido. Este tipo de (International Electrotechnical committee). El
compresión, lleva asociados grandes factores de fundamento básico de la compresión MPEG es el
compresión y se utiliza generalmente en multimedia; siguiente:
en los sistemas de videoconferencia como se dijo a) Se busca una representación válida de la imagen
anteriormente; en sistemas de vigilancia y seguridad; que concentre la información en una pequeña parte de
en consultas de video y en edición fuera de línea; es la descripción.
decir, procesos todos ellos en los que la calidad no es b) Se cuantifican los elementos de dicha
un factor importante, sino el mantenimiento del representación de modo que se discretizan sus posibles
servicio con un coste razonable. valores.
Dentro de todas estas categorías existen gran cantidad c) A cada nivel de cuantificación se le asigna un
de técnicas de compresión dependiendo de la código de bits.
aplicación para la que se utilizan. En el caso del vídeo, Concretamente el método MPEG-2 se utiliza en todos
el número de métodos se dispara; y actualmente, es los ámbitos de la televisión digital.
uno de los campos de mayor investigación dentro del Este método, que será el que estudiemos más
mundo del tratamiento digital de las imágenes. profundamente en este tema, tiene dos características
Algunas técnicas de compresión se han conseguido, muy importantes para su aplicación en video digital.
simplemente atendiendo a las diferentes sensibilidades La primera es que permite utilizar múltiples factores
que tiene el ojo humano frente al brillo y a los colores. de compresión en función de las necesidades de la
Esta posibilidad de compresión, viene expresada en la aplicación. La segunda es que las pérdidas de calidad
recomendación ITU-R BT.601 cuando habla de las al comprimir son relativamente bajas. Incluso se ha
distintas familias que se desarrollan bajo esta norma demostrado que la compresión MPEG-2 con factor
(4:4:4, 4:2:2, 4:1:1, 4:2:0, …), cada una de ellas, con 1:3,3 puede considerarse como subjetivamente sin
diferentes flujos binarios. pérdidas. Esto la hace apropiada para aplicaciones en
El conocido formato de video 4:4:4 utiliza la misma las que se quiera mantener la posibilidad de
frecuencia de muestreo para las señales de color que multigeneración, es decir, efectuar sucesivamente
para la de luminancia. En el formato 4:2:2, en cambio, procesos de compresión y descompresión sin la
la frecuencia de muestreo de las señales de color pasa aparición de defectos de imagen, o artefactos.
a ser la mitad. Sin embargo, esta forma de compresión A continuación pueden verse algunos ejemplos de
no degrada subjetivamente la calidad, sino que este utilización de la compresión, referidos a las
formato se ajusta más a las distintas sensibilidades del velocidades binarias utilizadas en algunos modos de
ojo. transmisión:
El sistema 4:4:4 se utiliza, no porque ofrezca una - Para comunicaciones dentro de un estudio se utilizan
mayor calidad subjetiva, sino porque las operaciones enlaces a 50Mb/s. En este punto debemos observar
de tratamiento digital de imágenes, u otras operaciones que el flujo binario resultante de la parte activa del
como el croma-key (llave de color), en el que se formato 4:2:2 es de 165,9 Mb/s.; y si se aplica el factor
conmuta de imagen a partir de la información del color 1:3,3 a este flujo obtenemos 50,3 Mb/s, con lo que las
de los píxeles, se realiza con mucha más precisión. transmisiones a 50 Mb/s podemos considerarlas sin
pérdidas.
El paso del formato 4:2:2 al 4:1:1 o al 4:2:0 sí supone - También se utilizan 50Mb/s para comunicaciones
eliminar información sensible al ojo. Esta información mediante fibra óptica.
que se elimina, no es en este caso redundante, y no
puede recuperarse en un hipotético proceso de
UNIVERSIDAD CATOLICA BOLIVIANA “SAN PABLO” Ingeniería en Telecomunicaciones
Telecomunicaciones III – TEL 218 Semestre: II-2018
- Para comunicaciones vía satélite es común utilizar asocian diferentes procedimientos mediante los cuales
enlaces a 34 Mb/s, aunque a veces también se utilizan se minimiza dicha redundancia aumentando la
50Mb/s. compresión.
necesario avanzar varios fotogramas para apreciar a) Se estudia el número de apariciones de cada
diferencias. símbolo, o su probabilidad de aparición y se
Una técnica de compresión que se puede usar, tanto confecciona una tabla con todos ellos.
para eliminar la redundancia temporal, como la b) Se escogen los dos códigos (o grupos) que tengan
espacial, es la codificación diferencial de pulsos menor número de apariciones, y se les asigna a cada
modulados (DPCM). uno de ellos el bit 0 o 1, y se asocian como si fueran
La DPCM codifica el valor de diferencia de una las ramas de un árbol.
muestra con respecto a la anterior. Si codificásemos el c) Se quitan los dos códigos (o grupos) anteriores y se
valor absoluto de cada muestra necesitaríamos abre un nuevo grupo cuyo valor de apariciones sea la
palabras binarias más largas, ya que los valores suma de estos.
absolutos de las muestras serán mucho mayores que la d) Se repiten los pasos b, c, y d hasta que sólo quede
diferencia entre una muestra y la anterior. un grupo.
Los histogramas de la figura 3 muestran el número de f) Para asignar a cada símbolo un código, se recorre el
ocurrencias para cada valor de los píxeles en una árbol desde el tronco principal hasta las ramas en las
imagen con codificaciones PCM y DPCM. Con que está cada símbolo, obteniendo su código Huffman
codificación PCM, imagen izquierda, se deben para la aplicación concreta que se ha estudiado.
procesar todos los valores comprendidos entre 10 y Es obvio que los mismos símbolos pueden tener
200; mientras que en distintos códigos Huffman dependiendo de la
DPCM, imagen derecha, sólo tiene que codificar aplicación que se trate; ya que en distintas
valores comprendidos entre +20 y -20, consiguiendo aplicaciones, las probabilidades de aparición de los
por tanto una reducción importante de bits. símbolos pueden ser diferentes.
Existen variantes de este método, que tratan de reducir
al máximo los errores a transmitir, efectuando las 2.6 Métodos de compresión por
predicciones en base a un conjunto de píxeles transformación: la DTC
significativos.
Existe una gran variedad de métodos de compresión
2.5.3 Redundancia estadística que se basan en la detección de la redundancia en un
dominio transformado. Esto se realiza transformando
La redundancia estadística, se basa en que en algunas la señal desde el ámbito temporal o espacial al ámbito
aplicaciones, determinados valores tienden a repetirse de las frecuencias.
más que otros. Una de las técnicas de compresión En el dominio espacio-temporal, la probabilidad de
basada en la detección de redundancia estadística es la aparición de todos los valores de los píxeles es
codificación de longitud variable (VLC – Variable constante, y por tanto es difícil reducir el número de
Lenght Code). datos, en base a una redundancia estadística. En
Este modo de compresión consiste en asignar códigos cambio, en el dominio de la frecuencia no se tiene una
más largos en bits a los valores de muestra que distribución uniforme del espectro. En general, las
aparecen menor número de veces, y códigos más altas frecuencias aparecen menos veces, ya que es más
cortos a los que aparecen más a menudo. habitual encontrar cambios suaves y grandes
En este método, antes de aplicar los códigos de superficies monocolor que grandes contrastes. Los
longitud variable, el codificador deberá analizar contrastes grandes se sitúan en los contornos de los
estadísticamente los datos que le llegan, para aplicar objetos, que en general son menos abundantes. Por eso
después la codificación óptima a cada valor. podemos decir que existe mucho más contenido en las
bajas frecuencias que en las altas.
El ejemplo de compresión VLC más utilizado es quizá Otro aspecto que hemos de tener en cuenta, es que
el código Huffman. Su ejecución es un poco compleja, nuestro ojo atiende más a las grandes superficies, por
pero la idea es la misma: asignar cadenas de bits más tanto a las bajas frecuencias, que a los detalles
cortas a los códigos más frecuentes y más largos a los pequeños que generarán valores de alta frecuencia.
menos frecuentes. Los métodos de compresión por transformación se
El método de ejecución es el siguiente: aprovechan de esta circunstancia para reducir el
número de datos a codificar.
UNIVERSIDAD CATOLICA BOLIVIANA “SAN PABLO” Ingeniería en Telecomunicaciones
Telecomunicaciones III – TEL 218 Semestre: II-2018
La transformada discreta del coseno es la herramienta ellos, aquí se va a presentar el llamado “método de las
de transformación más utilizada por los métodos de funciones base” porque nos permite extraer
compresión intracuadro. Esta transformada, que conclusiones importantes de esta transformación. El
aprovecha la existencia de redundancia espacial en las método de las funciones base tiene su fundamento en
imágenes y la encontraremos en los estándares JPEG, el hecho que, de la expresión de la DCT vista
MJPEG y sus derivados, y en la familia MPEG. anteriormente, una vez definido el tamaño N de la
secuencia a transformar, la función coseno tiene
2.6.1 Cálculo de la DTC unidimensional valores fijos. A dicha función coseno se le denomina
“función base”, y para cada valor de “u” se calcula de
La DCT es una transformación matemática que esta forma.
convierte una secuencia de muestras de N valores, en
otra secuencia del mismo tamaño N cuyos valores,
como ahora veremos, representan una distribución de
En esta expresión, el valor de N es, en general,
frecuencias La expresión de la transformada discreta
conocido para cada aplicación. Por ejemplo, para
del coseno (DCT) unidimensional correspondiente a
aplicaciones de video, el valor más usual es N=8. A
una secuencia de números x[n] de tamaño N es la
partir de estas funciones base, el valor de cada C[ui] se
siguiente.
calcularía según la siguiente expresión
propia naturaleza de las imágenes, tendrán una transformada inversa, se obtiene una muy buena
tendencia muy clara, como vamos a ver. aproximación de la imagen inicial.
De forma general, en las imágenes con poco detalle o 2.6.4. Utilización de la DCT para compresión
normales en detalle, casi todos los coeficientes que son de vídeo
distintos de cero se agruparán en la esquina superior La transformada discreta del coseno se considera la
izquierda de la matriz de coeficientes. Esta base en la mayoría de los algoritmos de compresión de
característica de la DCT la trataremos en las video, tanto intracuadro (redundancia espacial) como
propiedades que se detallan en el siguiente apartado. intercuadro (redundancia temporal). Esta transformada
2.6.3. Propiedades de la DCT se suele aplicar dividiendo las 720x576 muestras
La DCT por sí misma, al pasar de una matriz a otra del activas de una imagen en bloques de 8x8 píxeles.
mismo tamaño no implica compresión alguna, pero 2.6.4.1. Lectura en zig-zag
tiene algunas características importantes que la hacen La DCT por sí sola, como se ha visto en el apartado de
muy útil para nuestro propósito. Sin llegar a hacer un propiedades, no comprime. Ésta, al transformar la
estudio exhaustivo, nos vamos a centrar en aquellas información del dominio espacial al dominio de la
propiedades que nos van a ser útiles en los procesos de frecuencia, recoloca la información de tal manera que
compresión de imágenes. es más fácil eliminar la parte redundante,
a) Una de las propiedades más importantes y que se consiguiendo reducir el flujo binario. A continuación,
puede comprobar directamente de la definición es la se presenta un ejemplo de matriz 8x8 y su
de “separabilidad”. En este caso, la separabilidad correspondiente DCT bidimensional.
quiere decir que una DCT bidimensional se puede
expresar como un conjunto de varias DCTs
unidimensionales.
Si x[m,n] = x1[m] · x2[n], C[u,v] = C1[u] · C2[v].
b) La DCT presenta también la propiedad de una gran
compactación de la información en los coeficientes de
menor orden, de tal manera que los de orden superior
tienen un valor nulo o caso nulo, salvo en el caso de
imágenes que presenten una anormalmente alta
variación espacial.
c) Los coeficientes resultantes de la DCT presentan
Si observamos detenidamente la distribución de los
entre sí una muy pequeña correlación. Esta propiedad
coeficientes frecuenciales en los bloques
es especialmente importante en aplicaciones de
transformados, podemos ver que los más significativos
compresión de imágenes, ya que de esta forma será
se encuentran en el cuadrante superior izquierdo, que
posible dar a los coeficientes tratamientos totalmente
corresponde a las bajas frecuencias. Conforme nos
diferentes dependiendo del lugar que ocupen dentro de
vamos alejando de este cuadrante hacia la derecha y
la matriz de coeficientes.
hacia abajo, el valor de los coeficientes disminuye
d) La transformada de Fourier es una transformada
drásticamente.
compleja, con parte real y parte imaginaria, lo que
Este hecho, surge por la propia información contenida
complicado el trabajo con ella. Sin embargo la DCT es
en las imágenes, pero existe otra razón por la que
una transformada real; sus resultados son muestras de
podemos decir que la información de alta frecuencia,
la función coseno, y esto simplifica mucho su manejo.
que de por sí es poca, puede despreciarse. Esta razón
e) Si en la transformada de una imagen se suprimen
aparece por la forma en que el sistema visual humano
los coeficientes de mayor orden, al volver a calcular la
atiende a las imágenes. De toda una imagen, el sistema
UNIVERSIDAD CATOLICA BOLIVIANA “SAN PABLO” Ingeniería en Telecomunicaciones
Telecomunicaciones III – TEL 218 Semestre: II-2018