Informe MPEG2

UNIVERSIDAD CATOLICA BOLIVIANA “SAN PABLO” Ingeniería en Telecomunicaciones
Telecomunicaciones III – TEL 218 Semestre: II-2018
TRABAJO INVESTIGACIÓN
MPEG-2
Oscar Edwin Bustamante Ferrel

Gabriel Carlos Díaz Echeverría
Rodrigo Gonzalo Muñoz García
Grupo 1: El Machete Asciende
Ing. Juan Carlos Machicao Aparicio
Paralelo 1 Martes de 18:45-21:15
22 de Septiembre de 2018
Resumen.- En el presente trabajo de investigación, se mostrarán los conceptos generales y

debidas consideraciones de una codificación de video MPEG-2. Se realizará la correspondiente
investigación para conocer más respecto al tema.
Índice de Términos.- Vídeo, Codificación, Frecuencia, Ancho de Banda

En la televisión digital, los parámetros para señal de
vídeo digital con compresión y sin compresión
se dan en la Recomendación UIT-R BT.601. En la
1. Objetivo
radiodifusión, la transmisión con menor velocidad
1.1. Objetivo General requiere menos ancho de banda y un transmisor con
menor potencia.
Investigar conceptos importantes de MPEG-
2. Las técnicas para lograr una reducción en el tamaño
del video se limitan principalmente a comprimir
1.2. Objetivos Específicos
marcos individuales de contenido y técnicas de
● Establecer la definición de MPEG-2. escritura de cambios y diferencias entre marcos. Los
● Verificar las características generales de la videos suelen estar compuestos por tres tipos de
marcos: marcos-I (intra-marcos), marcos-P (cuadros
codificación.
predichos) y cuadros-B (cuadros bidireccionales). La
diferencia entre los diferentes tipos de marcos es sólo
2. Fundamento Teórico en el modo de escritura y modo de lectura (la
2.1. Introducción.- interpretación). Durante la reproducción
(visualización), cada fotograma se muestra como una
La tecnología de compresión de vídeo es la tecnología imagen normal independientemente de la técnica de
que permite grabar vídeo de tal manera que ocupan grabación del formato de vídeo. La compresión intra-
menos espacio de memoria y permite que el video sea trama o espacial es técnica en la compresión de vídeo
un poco diferente del original, cuando se reproduce. para reducir el tamaño de las tramas individuales.
La reducción de datos (compresión de datos) es Interframe o compresión temporal es una técnica de
posible porque la imagen contiene información (igual) compresión de vídeo que logra una reducción en el
redundante. La compresión es el proceso de reducir el tamaño de series similares de marcos.
número
de bits que se utilizan para codificar elementos de El desarrollo de las telecomunicaciones digitales
imagen individuales. permite el uso de la televisión de alta definición
(HDTV) además de la televisión de definición
estándar (SDTV). HDTV es una tecnología que ofrece
una calidad significativamente mayor de imagen y

sonido que la tecnología de pantalla tradicional hizo 2.3. MPEG-2.-
(PAL analógico, NTSC, SECAM, SDTV y digital).
Dado que la resolución es más alta, la imagen es más Concretamente el método MPEG-2 se utiliza en todos
nítida, menos borrosa y el contenido está más cerca de los ámbitos de la televisión digital. Este método tiene
la realidad. HDTV ofrece un movimiento más suave, dos características muy importantes para su aplicación
colores detallados y vibrantes, y hay un sonido en video digital. La primera es que permite utilizar
multicanal de muy alta calidad que hace que la múltiples factores de compresión en función de las
experiencia visual sea aún mejor. La Tabla 1 muestra necesidades de la aplicación. La segunda es que las
las características básicas de los estándares de TV pérdidas de calidad al comprimir son relativamente
digital primaria.
bajas. Incluso se ha demostrado que la compresión
MPEG-2 con factor 1:3,3 puede considerarse como
El sistema de televisión digital consta de tres subjetivamente sin pérdidas. Esto la hace apropiada
componentes: vídeo, audio y datos de servicio, como para aplicaciones en las que se quiera mantener la
se muestra en la Figura 1. posibilidad de multi generación, es decir, efectuar
sucesivamente procesos de compresión y
descompresión sin la aparición de defectos de imagen,
o artefactos.
TABLA 1. FLUJO COMPRIMIDO DE

SEÑALES DE AUDIO/VIDEO
Fig 1. Componentes de la Televisión Digital.
2.2. MPEG.-
2.3.1. SDTV.-
Otros métodos de compresión que se han establecido
como estándar por sus prestaciones y su amplia
La definición estándar (en inglés SDTV, standard
aplicación son los métodos denominados MPEG. Las
definition television) es el acrónimo que reciben las
siglas MPEG vienen de (Motion Pictures Expert
señales de televisión que no se pueden considerar
Group) nombre de un grupo de expertos común entre
señales de alta definición (HDTV) ni de señal de
la ISO (International Standards Organization) y la IEC
televisión de definición mejorada (EDTV).
(International Electrotechnical committe). El
fundamento básico de la compresión MPEG es el
siguiente: Es la resolución de vídeo dominante desde el origen de
● Se busca una representación válida de la la televisión hasta la aparición de la alta definición. El
imagen que concentre la información en una sistema está alrededor de una resolución de 500 líneas
pequeña parte de la descripción. horizontales PAL funciona con una resolución de
720×576, mientras que NTSC proporciona 720×486.
● Se cuantifican los elementos de dicha Utiliza una velocidad entre 25 hasta los 29.97 cuadros
representación de modo que se discretizan sus por segundo en NTSC, y de 25 para formato PAL.
posibles valores. Hasta la aparición de los sistemas digitales, SDTV
sólo tenía un significado, pero actualmente se usa para
● A cada nivel de cuantificación se le asigna un referirse a dos sistemas de codificación digital y envío
de señales de vídeo: Por un lado SDTV se usa por
código de bits. denominar las señales analógicas de 480 líneas
(NTSC) o 576 (PAL y SECAM) y que han sido los

estándares mayoritarios en los últimos 50 años. Su HDTV tiene por lo menos el doble de resolución que
relación de aspecto siempre es de 4:3, mientras que la el SDTV, razón por la cual se puede mostrar mucho
exploración es entrelazada. más detalle en comparación a un televisor analógico o
un DVD normal. Además, los estándares técnicos para
Por otro lado, SDTV también se usa genéricamente transmitir HDTV permiten que se proyecte utilizando
por referirse a señales de televisión, analógicas o una relación de aspecto de 16:9 sin utilizar franjas de
digitales, que tienen una calidad equivalente a la colores y por lo tanto se puede incrementar la
SDTV analógica. Así de los formatos como VCD, resolución del contenido.
VHS, Beta o SVCD con calidades parecidas a la
televisión analógica, también a menudo se dice que 2.3.4. Captura de video analógico
tienen una calidad SDTV. En este caso, la exploración
puede ser progresiva en sistemas de poca resolución o Las imágenes (dos dimensiones) son convertidas en
entrelazada si llega a las 480 o 576 líneas. La relación una señal analógica.
de aspecto habitualmente es de 4:3 aun cuando - Se capturan las imágenes a intervalos
también puede ser de 16:9. - Cada imagen (cuadro o frame) es barrida
calculando la intensidad de cada punto
Debido a la utilización del acrónimo SDTV para (B&W).
referirse a todo tipo de sistemas que no son HDTV, es Para reproducir la imagen se realiza el proceso
habitual la confusión de los términos y clasificar inverso.
sistemas EDTV como el DVD en el grupo de SDTV.
2.3.2. HDTV.-
La televisión de alta definición o HDTV (siglas en

inglés de high definition television) es uno de los
formatos que, junto a la televisión digital (DTV), se
caracterizan por emitir señales televisivas en una
calidad digital superior a los sistemas tradicionales Fig 2. Captura de video analogico.
analógicos de televisión en color (NTSC, SECAM,
PAL).
2.3.5. Tipos de video según su calidad
Los términos HD ready ("listo para alta definición") y
compatible HD ("compatible con alta definición") Televisión de alta definición (HDTV).
están siendo usados con propósitos publicitarios. Estos
términos indican que el dispositivo electrónico que lo - Existen diferentes variantes acerca HDTV.
posee, ya sea un televisor o un proyector de imágenes, 1920x1080/60, 1920x1080/30-24,
es capaz de reproducir señales en Alta Definición; 1280x720/30-24
aunque el hecho de que sea compatible con contenidos - Relación de aspecto 16:9 Relación de aspecto
en esta norma no implica que el dispositivo sea de alta 16:9 ‰
definición o tenga la resolución necesaria, tal y como
pasa con algunos televisores basados en tecnología de Vídeo digital profesional (studio-quality).
plasma con menos definición vertical que televisores
de años atrás (833x480 en vez de los 720x576 píxeles - Estándar ITU-R (CCIR-601) de vídeo digital.
-anamórficos equivalen a 940x576-), los cuales son
compatibles con señales en alta definición porque Vídeo de difusión (TV broadcast).
reducen la resolución de la imagen para adaptarse a la
resolución real de la pantalla. - Difusión de señales de televisión analógicas.
- Estándares NTSC y PAL/SECAM.
2.3.3. Comparación.-
Reproductor de Vídeo (VCR quality)
● j: Referencia de muestreo de luminancia

- Grabación de vídeo analógico (en VHS) horizontal (ancho de la región conceptual) y que
- Menor resolución de imagen (la mitad de usualmente tiene un valor de 4, en referencia a
PAL/SECAM). que la frecuencia de muestreo era
aproximadamente cuatro veces la frecuencia
Videoconferencia (Low-speed). subportadora de color de los
estándares PAL o NTSC. La relación con el
- Tasas de bits pequeñas (alrededor de 128 muestreo de la componente de vídeo actual, en
Kbps) 13.5 MHz, es de 13,5/4 (3,375) MHz.
- Resolución de imagen 4 veces inferior al
vídeo digital. ● a: Factor horizontal de Cr (en relación con el
- La secuencia de cuadros/s se reduce entre 5 y primer dígito).
10.
● b: Factor de Cb horizontal (con respecto al primer
TABLA 2. PARÁMETROS ESPECÍFICOS DE dígito), a menos que se ajuste a cero. En este caso,
RED un cero indica que el factor Cb horizontal es
idéntico al segundo dígito y, además, que Cr y Cb
son submuestreadas en relación 2:1 en la
dirección vertical. Se elige el cero de modo que la
fórmula para calcular el ancho de banda sigue
siendo correcta.
● Factor Horizontal Alfa: Si es incluido, debe ser

idéntico al primer dígito e indica la presencia de
un cuarto canal de la señal que contiene la
información de la transparencia (canal alfa),
muestreado de forma idéntica a la componente de
luma.
2.3.6. Submuestreo de crominancia Para calcular el ancho de banda requerido con respecto
a una señal con submuestreo 4:4:4 (o 4:4:4:4), se
El submuestreo de crominancia es la práctica de suman todos los factores y se divide el resultado por
codificar el componente de crominancia de la señal de 12, o 16 si hay un factor Alfa.
video, mediante su muestreo a menor frecuencia que
para el componente de luminancia, aprovechando la
inferior agudeza del sistema visual humano para
diferencias de color que para la luminancia. Se utiliza
en muchos esquemas de codificación de vídeo, tanto
analógicos como digitales, y también en la
codificación JPEG.
2.3.6.1. Notacion
El patrón de submuestreo normalmente se indica con
una notación de tres dígitos separados por dos
puntos j:a:b (como, por ejemplo, 4:2:2) o, a veces,
cuatro dígitos (por ejemplo, 4:2:2:4) que describe el
número de muestras de luminancia y crominancia en
una región de “j” pixeles. El significado de esta
notación, de izquierda a derecha es el siguiente:
Fig3.- Frecuencias para formatos de muestreo
2.3.6.2. Esquemas de submuestreo comunes
A continuación, se explican las diferentes clases de

submuestreo que podemos encontrar. La figura
muestra de forma gráfica los casos más comunes. La
segunda fila de la figura representa la componente de
luminancia, para cada esquema, en cuadros de color
gris, la inferior representa los componentes de
crominancia (Cb y Cr) y la fila superior, la
combinación resultante, a nivel de píxel.
Fig5.- Frecuencias de muestreo para SD, HD, 3G
Cuando la televisión digital arranca a especificarse en

fuerza, el sistema de componentes se predecía que iba
Fig4.- Esquemas de submuestreo comunes a ser el más usado. Uno de los objetivos de la
televisión digital era que la frecuencia de muestreo
2.3.6.3. Frecuencias de muestreo debe ser común entre los formatos de 525 y 625. Aún
cuando se sabía que los requerimientos de ancho de
Para procesar vídeo en el dominio digital, se necesita banda eran diferentes entre los dos formatos. Teniendo
un muestreo de dos-dimensiones (array) que forma las una común frecuencia de muestreo simplifica el diseño
líneas horizontales y columnas verticales. Esto dicta de equipos para el sistema digital. Por ejemplo, los
que la frecuencia de muestreo (sampling rate) tiene convertidores de formatos se pueden usar en sistemas
que ser un múltiple de la frecuencia de líneas. de 525 ó de 625 sin ningún cambio. Todas las
frecuencias usadas en el sistema de televisión se
originan de un master reloj de 108 Mhz, como
Para digitalizar la señal en el sistema compuesto sea
podemos observar en el diagrama de frecuencias para
NTSC ó PAL, era muy común usar una frecuencia de
SD, HD y 3G. Así llegan a establecerse la frecuencias
muestreo que era múltiple de la subportadora de color
de 13.5 Mhz y 6.75 Mhz para muestrear las señales Y,
(fsc). La nomenclatura usada era de 4fsc ó de 2fsc. ( 4
R-Y y B-Y usados en el formato 4:2:2 de
x fsc ó 2 x fsc). Como la frecuencia de la subportadora
componentes para SD-SDI.
en NTSC era de 3.58 Mhz, 4fsc llega a ser 14.3 Mhz
para NTSC y siguiendo la lógica, 2fsc llega a ser 7.15
Mhz. Entonces, el componente de luminancia que Se puede observar que 13.5 Mhz y 6.75 Mhz se
incluye las más altas frecuencias, era muestreada a derivan de la frecuencia de 2.25 Mhz. Pero no se
4fsc y los dos componentes de color que contienen establece el x4 ni el x2 para el formato 4:2:2. Pero se
más bajas frecuencias eran muestreadas solamente a continúa usando esta nomenclatura que en práctica
2fsc. Simplemente se identificaba como un formato de indica que el componente (Y) se muestrea con una
4fsc: 2fsc:2fsc que luego se simplifica a 4:2:2 como frecuencia al doble de la frecuencia para los
una manera de escribir en corto. componentes de colores (R-Y y B-Y).
Usando esta nomenclatura de 4:2:2, se puede deducir

que el componente de luminancia (Y) es muestreado a 2.4 La compresión de la señal de video
13.5 Mhz, y los componentes de color (R-Y) y (G-Y)
son muestreados a 6.75 Mhz. Para entender la En el ámbito digital, para almacenar o transmitir
diferencia entre 4:4:4 y 4:2:2, lo mejor es observar en información se utiliza un tren de datos.
el siguiente cuadro, como se muestran los píxeles en Para que sea posible la compresión de este tren de
cada componente (Y, R-Y y B-Y) de acuerdo a las datos, es necesario que en él exista, además de
frecuencias de muestreo. información real, información redundante. Esta
información redundante podremos eliminarla durante
2.3.7 Velocidad de transmisión el proceso de compresión, y posteriormente
reconstruirla en el proceso de descompresión a partir
Continuando, vamos a ver cómo se calcula las de la información real. La información real en cambio,
velocidades de transmisión para SD and HD utilizando será imprescindible para recuperar los datos originales
las frecuencias de muestreo indicado arriba para el de forma correcta, de modo que no es posible obviarla.
formato 4:2:2: La misión de un sistema de compresión consiste en
detectar y eliminar la información redundante,
Para SD: codificando solamente la información útil. Por lo
Frecuencia de muestreo (Y) = 13.5 Mhz tanto, podemos considerar la compresión digital como
Número de filas ó líneas = 525 un procedimiento, matemático en general, que rebaja
Frecuencia de cuadro = 29.97 Hz ( 30 Hz is not el flujo binario de un tren de datos, en base a la
directly compatible with SD-SDI) eliminación de información redundante y a una
codificación inteligente de la información real. La
Para HD: compresión, a partir de ciertos valores influye
La frecuencia de muestreo en HD es 74.25 Mhz y negativamente en la calidad del vídeo.
74.25/1.001 para todos los formatos, 1080i ó 720p. Por eso, debe utilizarse un algoritmo y un factor de
Verifiquemos esto usando la tabla de abajo y calcular compresión que minimicen dicha degradación. Según
para el formato 1080i/29.97: estas consideraciones, podemos clasificar la
compresión en tres tipos diferentes: compresión sin
Frecuencia de muestreo (Y)= 2200x1125x29.97= pérdidas, compresión subjetivamente sin pérdidas y
74.175 Mhz compresión subjetivamente con pérdidas.
Frecuencia de muestreo (R-Y, B-Y)=74.175
Mhz/2=37.087 Mhz En la compresión sin pérdidas, la información original
se recupera en su integridad después del proceso de
Velocidad de transmisión (4:2:2)= compresión-descompresión. Este tipo es muy utilizado
(74.175+37.087+37.087) x 10 bits = 1.483 Gbps para la compresión de datos informáticos.
Dependiendo del tipo de archivo, este modo tiene
niveles de compresión variables. Con algunos archivos
TABLA 3. Velocidades de transmisión y puede llegar a compresiones de 70:1, pero en otros
frecuencias para HD casos, no es posible comprimir ya que el archivo
comprimido podría ser incluso de mayor tamaño que
el original.
Por otra parte, con la compresión subjetivamente sin

pérdidas, en el proceso de compresión-descompresión,
no se recupera absolutamente toda la información
original, pero el sistema receptor, como por ejemplo el
sistema visual humano, no detecta las diferencias. En
el ámbito de la compresión digital de sonido e imagen,
existe una norma general y es que “lo que el ojo no ve,
o lo que el oído no oye, no se codifica”. Este tipo de
compresión, es el que se utiliza en vídeo digital, y es el descompresión. Por ello esta compresión se denomina
que más nos interesa por su mantenimiento de la con pérdidas, o degradante.
calidad, consiguiendo factores de compresión Otros métodos de compresión que se han establecido
interesantes. como estándar por sus prestaciones y su amplia
Finalmente, en la compresión subjetivamente con aplicación son los métodos denominados MPEG. Las
pérdidas, durante el proceso de compresión- siglas MPEG vienen de (Motion Pictures Expert
descompresión se degrada significativamente la Group) nombre de un grupo de expertos común entre
calidad de la información, pero el usuario lo tolera en la ISO (International Standards Organization) y la IEC
beneficio del servicio recibido. Este tipo de (International Electrotechnical committee). El
compresión, lleva asociados grandes factores de fundamento básico de la compresión MPEG es el
compresión y se utiliza generalmente en multimedia; siguiente:
en los sistemas de videoconferencia como se dijo a) Se busca una representación válida de la imagen
anteriormente; en sistemas de vigilancia y seguridad; que concentre la información en una pequeña parte de
en consultas de video y en edición fuera de línea; es la descripción.
decir, procesos todos ellos en los que la calidad no es b) Se cuantifican los elementos de dicha
un factor importante, sino el mantenimiento del representación de modo que se discretizan sus posibles
servicio con un coste razonable. valores.
Dentro de todas estas categorías existen gran cantidad c) A cada nivel de cuantificación se le asigna un
de técnicas de compresión dependiendo de la código de bits.
aplicación para la que se utilizan. En el caso del vídeo, Concretamente el método MPEG-2 se utiliza en todos
el número de métodos se dispara; y actualmente, es los ámbitos de la televisión digital.
uno de los campos de mayor investigación dentro del Este método, que será el que estudiemos más
mundo del tratamiento digital de las imágenes. profundamente en este tema, tiene dos características
Algunas técnicas de compresión se han conseguido, muy importantes para su aplicación en video digital.
simplemente atendiendo a las diferentes sensibilidades La primera es que permite utilizar múltiples factores
que tiene el ojo humano frente al brillo y a los colores. de compresión en función de las necesidades de la
Esta posibilidad de compresión, viene expresada en la aplicación. La segunda es que las pérdidas de calidad
recomendación ITU-R BT.601 cuando habla de las al comprimir son relativamente bajas. Incluso se ha
distintas familias que se desarrollan bajo esta norma demostrado que la compresión MPEG-2 con factor
(4:4:4, 4:2:2, 4:1:1, 4:2:0, …), cada una de ellas, con 1:3,3 puede considerarse como subjetivamente sin
diferentes flujos binarios. pérdidas. Esto la hace apropiada para aplicaciones en
El conocido formato de video 4:4:4 utiliza la misma las que se quiera mantener la posibilidad de
frecuencia de muestreo para las señales de color que multigeneración, es decir, efectuar sucesivamente
para la de luminancia. En el formato 4:2:2, en cambio, procesos de compresión y descompresión sin la
la frecuencia de muestreo de las señales de color pasa aparición de defectos de imagen, o artefactos.
a ser la mitad. Sin embargo, esta forma de compresión A continuación pueden verse algunos ejemplos de
no degrada subjetivamente la calidad, sino que este utilización de la compresión, referidos a las
formato se ajusta más a las distintas sensibilidades del velocidades binarias utilizadas en algunos modos de
ojo. transmisión:
El sistema 4:4:4 se utiliza, no porque ofrezca una - Para comunicaciones dentro de un estudio se utilizan
mayor calidad subjetiva, sino porque las operaciones enlaces a 50Mb/s. En este punto debemos observar
de tratamiento digital de imágenes, u otras operaciones que el flujo binario resultante de la parte activa del
como el croma-key (llave de color), en el que se formato 4:2:2 es de 165,9 Mb/s.; y si se aplica el factor
conmuta de imagen a partir de la información del color 1:3,3 a este flujo obtenemos 50,3 Mb/s, con lo que las
de los píxeles, se realiza con mucha más precisión. transmisiones a 50 Mb/s podemos considerarlas sin
pérdidas.
El paso del formato 4:2:2 al 4:1:1 o al 4:2:0 sí supone - También se utilizan 50Mb/s para comunicaciones
eliminar información sensible al ojo. Esta información mediante fibra óptica.
que se elimina, no es en este caso redundante, y no
puede recuperarse en un hipotético proceso de
- Para comunicaciones vía satélite es común utilizar asocian diferentes procedimientos mediante los cuales
enlaces a 34 Mb/s, aunque a veces también se utilizan se minimiza dicha redundancia aumentando la
50Mb/s. compresión.
- En los casos de distribución de la señal vía radio, se 2.5.1 Redundancia espacial

aplican factores de compresión más grandes según el
canal disponible. Por ejemplo, en los satélites de La redundancia espacial tiene lugar dentro de cada
distribución lo normal es utilizar un factor de fotograma. Ésta, viene asociada al hecho de que la
compresión que permite enviar de 4 a 7 canales naturaleza está llena de objetos sólidos con superficies
digitales en el mismo ancho de banda que ocuparía y texturas uniformes; los decorados, los paisajes, e
uno analógico. incluso los rostros no varían significativamente la
- En la difusión de televisión digital, el flujo binario es información de pixel a pixel, sino que encontraremos
diferente, según la calidad requerida. generalmente grandes superficies sin variación.
El hecho de que varios píxeles adyacentes sean
TABLA 4. Niveles de calidad y sus flujos prácticamente iguales nos va a permitir, en vez de
binarios recomendados transmitirlos todos o almacenarlos todos, transmitir un
píxel representativo del conjunto, y las diferencias de
cada uno respecto a éste. Dichas diferencias, por ser
generalmente pequeñas, pueden codificarse con menos
bits.
Uno de los ejemplos de compresión aprovechando la
redundancia espacial son la codificación de cadenas
largas de datos iguales (RLC – Run Lenght Code,
2.5 La redundancia en la información de codificación de longitudes de recorrido). En el caso de
que se detecte en el tren binario una cadena larga de
video.-
dígitos que se repiten, en lugar de codificar cada
dígito, parece una buena técnica codificar cuál es el
Los algoritmos de compresión en vídeo digital se
dígito de que se trata, y cuantas veces se repite. Un
basan, como hemos visto en los apartados anteriores,
ejemplo de dispositivo que utiliza esta técnica es el
en la existencia de información redundante a lo largo fax. Esta técnica se utiliza habitualmente en lo que
de cualquier secuencia. Dentro de la corriente de datos llamaremos codificación “intracuadro”, es decir dentro
que supone una comunicación de vídeo digital de cada fotograma.
podemos detectar una parte de los datos que
corresponden a información real, que será necesaria
para reproducir dicha secuencia; e información 2.5.2 Redundancia temporal
redundante, que no proporcionará información al
decodificador y que por tanto podemos eliminar. La redundancia temporal viene dada por la relación
entre los píxeles homólogos de imágenes sucesivas.
En términos de compresión, sería muy beneficioso Esta redundancia aparece porque la vida no cambia
minimizar al máximo la información redundante de significativamente de fotograma a fotograma.
forma que reduzcamos el flujo binario sin perder la Evidentemente, en 40ms. Suponiendo una frecuencia
información necesaria para recuperar una secuencia. de cuadro de 25 f/s. no ocurren grandes cosas desde el
Sin embargo, en términos de seguridad en la punto de vista del espectador. Lo que el espectador
transmisión, hemos de decir que la redundancia es espera al contemplar una secuencia de vídeo, es una
positiva, ya que proporciona cierta protección ante continuidad en la acción, y no un cambio continuo en
cortes de la información que se está transmitiendo. los planos.
Así, en la mayoría de los casos podemos afirmar que
La información redundante que aparece en una un fotograma va a ser similar al siguiente o al anterior.
secuencia de vídeo digital podemos considerarla de Si comparamos los fotogramas de un trozo de película
tres tipos: redundancia espacial, redundancia temporal observaremos que, en general, son similares. Es
y redundancia estadística. A cada una de ellas se les
necesario avanzar varios fotogramas para apreciar a) Se estudia el número de apariciones de cada
diferencias. símbolo, o su probabilidad de aparición y se
Una técnica de compresión que se puede usar, tanto confecciona una tabla con todos ellos.
para eliminar la redundancia temporal, como la b) Se escogen los dos códigos (o grupos) que tengan
espacial, es la codificación diferencial de pulsos menor número de apariciones, y se les asigna a cada
modulados (DPCM). uno de ellos el bit 0 o 1, y se asocian como si fueran
La DPCM codifica el valor de diferencia de una las ramas de un árbol.
muestra con respecto a la anterior. Si codificásemos el c) Se quitan los dos códigos (o grupos) anteriores y se
valor absoluto de cada muestra necesitaríamos abre un nuevo grupo cuyo valor de apariciones sea la
palabras binarias más largas, ya que los valores suma de estos.
absolutos de las muestras serán mucho mayores que la d) Se repiten los pasos b, c, y d hasta que sólo quede
diferencia entre una muestra y la anterior. un grupo.
Los histogramas de la figura 3 muestran el número de f) Para asignar a cada símbolo un código, se recorre el
ocurrencias para cada valor de los píxeles en una árbol desde el tronco principal hasta las ramas en las
imagen con codificaciones PCM y DPCM. Con que está cada símbolo, obteniendo su código Huffman
codificación PCM, imagen izquierda, se deben para la aplicación concreta que se ha estudiado.
procesar todos los valores comprendidos entre 10 y Es obvio que los mismos símbolos pueden tener
200; mientras que en distintos códigos Huffman dependiendo de la
DPCM, imagen derecha, sólo tiene que codificar aplicación que se trate; ya que en distintas
valores comprendidos entre +20 y -20, consiguiendo aplicaciones, las probabilidades de aparición de los
por tanto una reducción importante de bits. símbolos pueden ser diferentes.
Existen variantes de este método, que tratan de reducir
al máximo los errores a transmitir, efectuando las 2.6 Métodos de compresión por
predicciones en base a un conjunto de píxeles transformación: la DTC
significativos.
Existe una gran variedad de métodos de compresión
2.5.3 Redundancia estadística que se basan en la detección de la redundancia en un
dominio transformado. Esto se realiza transformando
La redundancia estadística, se basa en que en algunas la señal desde el ámbito temporal o espacial al ámbito
aplicaciones, determinados valores tienden a repetirse de las frecuencias.
más que otros. Una de las técnicas de compresión En el dominio espacio-temporal, la probabilidad de
basada en la detección de redundancia estadística es la aparición de todos los valores de los píxeles es
codificación de longitud variable (VLC – Variable constante, y por tanto es difícil reducir el número de
Lenght Code). datos, en base a una redundancia estadística. En
Este modo de compresión consiste en asignar códigos cambio, en el dominio de la frecuencia no se tiene una
más largos en bits a los valores de muestra que distribución uniforme del espectro. En general, las
aparecen menor número de veces, y códigos más altas frecuencias aparecen menos veces, ya que es más
cortos a los que aparecen más a menudo. habitual encontrar cambios suaves y grandes
En este método, antes de aplicar los códigos de superficies monocolor que grandes contrastes. Los
longitud variable, el codificador deberá analizar contrastes grandes se sitúan en los contornos de los
estadísticamente los datos que le llegan, para aplicar objetos, que en general son menos abundantes. Por eso
después la codificación óptima a cada valor. podemos decir que existe mucho más contenido en las
bajas frecuencias que en las altas.
El ejemplo de compresión VLC más utilizado es quizá Otro aspecto que hemos de tener en cuenta, es que
el código Huffman. Su ejecución es un poco compleja, nuestro ojo atiende más a las grandes superficies, por
pero la idea es la misma: asignar cadenas de bits más tanto a las bajas frecuencias, que a los detalles
cortas a los códigos más frecuentes y más largos a los pequeños que generarán valores de alta frecuencia.
menos frecuentes. Los métodos de compresión por transformación se
El método de ejecución es el siguiente: aprovechan de esta circunstancia para reducir el
número de datos a codificar.
La transformada discreta del coseno es la herramienta ellos, aquí se va a presentar el llamado “método de las
de transformación más utilizada por los métodos de funciones base” porque nos permite extraer
compresión intracuadro. Esta transformada, que conclusiones importantes de esta transformación. El
aprovecha la existencia de redundancia espacial en las método de las funciones base tiene su fundamento en
imágenes y la encontraremos en los estándares JPEG, el hecho que, de la expresión de la DCT vista
MJPEG y sus derivados, y en la familia MPEG. anteriormente, una vez definido el tamaño N de la
secuencia a transformar, la función coseno tiene
2.6.1 Cálculo de la DTC unidimensional valores fijos. A dicha función coseno se le denomina
“función base”, y para cada valor de “u” se calcula de
La DCT es una transformación matemática que esta forma.
convierte una secuencia de muestras de N valores, en
otra secuencia del mismo tamaño N cuyos valores,
como ahora veremos, representan una distribución de
En esta expresión, el valor de N es, en general,
frecuencias La expresión de la transformada discreta
conocido para cada aplicación. Por ejemplo, para
del coseno (DCT) unidimensional correspondiente a
aplicaciones de video, el valor más usual es N=8. A
una secuencia de números x[n] de tamaño N es la
partir de estas funciones base, el valor de cada C[ui] se
siguiente.
calcularía según la siguiente expresión
Considerando la secuencia a transformar x[n] y la

En esta expresión, la variable “u” de salida, que función base f[n] |u como vectores de N dimensiones,
representa el índice del coeficiente que se está los C[u] resultado de la DCT resultan ser el producto
calculando, adopta los valores comprendidos entre 0 y escalar de estos dos vectores, afectado por el factor
N-1, de manera que la DCT resulta ser una secuencia constante α(u). Es conocido, que el resultado del
también de tamaño N. Asimismo, el valor de “n” producto escalar de dos vectores depende de los
representa a los índices de cada elemento de la módulos de ambos, y del coseno del ángulo que
secuencia que se quiere transformar. forman, que será máximo en el caso en que ambos
El parámetro α(u) tiene dos valores posibles, que son vectores tengan la misma dirección y sentido.
estos: Si se representan gráficamente los valores resultantes
de calcular las funciones base para cada valor de “u”
con un tamaño de secuencia de N=8.
Existen otras formas de escribir esta expresión con

valores derivados de este α(u), pero llevan a resultados
equivalentes. Los N valores C[u], obtenidos al aplicar
esta transformada a la secuencia de N valores x[n], se
denominan “coeficientes” de dicha transformada.
La transformada inversa (IDCT ó DCT-1) permitirá
obtener la secuencia x[n] a partir de los coeficientes
transformados, y se define así.
El cálculo de la DCT que se desprende directamente

de las fórmulas anteriores resulta engorroso, y cuando
el número de elementos de la secuencia es alto, se
impone la utilización del ordenador. No obstante
existen métodos de cálculo más sencillos. De todos
2.6.2. Generalización de la DCT bidimensional
La DCT bidimensional es una transformación

matemática que convierte una matriz genérica de MxN
valores, que en el caso de las imágenes corresponden a
niveles de brillo o color, en otra matriz del mismo
tamaño (MxN), cuyos valores representan la
distribución de las frecuencias. Una vez visto por
encima el desarrollo de la DCT unidimensional
podemos ver de la misma manera la DCT
bidimensional que es la que se aplica a las imágenes,
considerando cada muestra x[m,n] como el valor del
nivel de gris de un píxel. Dada una secuencia
bidimensional x[m, n] formada por una matriz de
valores en la que “m” adopta los valores del conjunto
(0, … M-1) y n adopta los valores entre 0 y N-1, su
DCT se define como sigue.
De la misma manera que antes, las variables “u” y “v”

de salida adoptan los valores comprendidos entre 0 y
Fig6. Funciones base de la DCT unidimensional. M-1, y entre 0 y N-1 respectivamente; de manera que
la DCT resulta ser también una matriz de tamaño
A partir de esta figura podemos observar que para MxN.
cualquier secuencia x[n] de tamaño N=8, los C[u] se
calcularán a partir del producto escalar de dicha Los parámetros α(u) y β(v) tiene dos valores posibles,
secuencia con cada una de estas funciones base f[n] que son estos:
aquí representadas. En un producto escalar entre dos
vectores, si fijamos uno de ellos, como es el caso de
cada función base, el producto escalar con cualquier
vector x[n], nos da un resultado proporcional a la
componente que tiene el vector x[n] en la dirección de
cada función base f[n]. Así pues, este producto será
Vídeo Digital
mayor cuanto más paralelos sean ambos vectores.
Según esto anterior, el coeficiente C[0] dará una
referencia del nivel de continua (frecuencia f=0) de
x[n]. Asimismo, el producto escalar de dicha
secuencia x[n] por la función base f[n]|1 resultará un
C[1] mayor, cuanto más se parezcan la secuencia x[n] Los M x N valores C[u, v], obtenidos al aplicar esta
al vector f[n]|1; es decir, C[1] será proporcional al transformada a la secuencia de MxN valores x[m, n],
contenido de frecuencia f=1/16 de la secuencia. se denominan “coeficientes” de dicha secuencia.
Sucesivamente, C[2] será proporcional al contenido de
la secuencia en la frecuencia f=2/16, etc. La transformada inversa, IDCT ó DCT-1, permitirá
Así pues, mediante la DCT se consigue transformar obtener la secuencia x[n, m] a partir de los coeficientes
una secuencia x[n] en otra, C[u] que indica su transformados. Esta transformada inversa se define
distribución espectral. como sigue:
Atendiendo a la figura, cada coeficiente de la

transformada representará la cantidad de información
que contiene el bloque 8x8 original en su conjunto,
entorno a las frecuencias verticales y horizontales
Para el cálculo de la DCT bidimensional existe
representadas por los valores u y v. Estas componentes
también el método basado en las funciones base. En
frecuenciales comprenden desde la frecuencia cero
este caso, las funciones base estarán compuestas por
(DC) cuyo coeficiente vendrá representado en la parte
los dos cosenos que se muestran en la expresión de la
superior izquierda, hasta la máxima frecuencia
DCT, uno en la dirección m y otro en la n.
espacial horizontal posible, representada en la parte
superior derecha, o la máxima frecuencia espacial
vertical posible representada en la parte inferior
izquierda, pasando por todas las posibles
En las aplicaciones de compresión de imágenes combinaciones de frecuencias espaciales horizontales
digitales, los valores de M y N son siempre 8. A partir y verticales.
de estas funciones base, el valor de cada C[u, v] se Si el bloque 8x8 a transformar corresponde a un trozo
calcularía como si se tratara del producto escalar de de decorado completamente uniforme, y
dos vectores: mediante la suma de los productos entre completamente blanco, todos los coeficientes
elementos homólogos de la función base, y de la frecuenciales serían cero excepto el correspondiente a
matriz a transformar, afectado por los factores α(u) y la DC (parte superior izquierda).
β(v). El valor de los coeficientes más a la derecha
Si se representan con niveles de gris los valores aumentará a medida que aparezcan en él más
resultantes de calcular las funciones base para cada par contenidos de altas frecuencias horizontales
de valores (u, v) con un tamaño de secuencia de (incremento de perfiles verticales abruptos). En
M=N=8, los resultados pueden verse en la figura 3. sentido vertical, los coeficientes se comportan de
manera similar.
Si el bloque original correspondiere a un área de la
imagen que tuviera un dibujo en forma de rayas
verticales alternativamente blancas y negras y cada
raya coincidiese con la anchura de un píxel, el
coeficiente frecuencial correspondiente al bloque
situado arriba a la derecha tomaría el valor máximo, y
el resto serían cero, excepto el correspondiente a la
DC que siempre indicará el valor medio de la DC de
todo el bloque.
Si un bloque de la imagen contiene una gradación de
brillo en cualquier dirección, su DCT tiene únicamente
el coeficiente de frecuencia cero (el primero) y sus tres
Fig7. Representación gráfica de las funciones coeficientes periféricos distintos de cero. El resto de
base de la DCT bidimensional. los 60 coeficientes serán cercanos o iguales a cero.
Es evidente, que estas situaciones extremas no serán
Los cuadros en blanco representan corresponden a habituales, sino que los coeficientes frecuenciales
valores de coeficientes igual a 1, y los cuadros negros estarán distribuidos en función del contenido de la
corresponden a coeficientes de valor -1. imagen, si bien es cierto que estos coeficientes, por la
propia naturaleza de las imágenes, tendrán una transformada inversa, se obtiene una muy buena
tendencia muy clara, como vamos a ver. aproximación de la imagen inicial.
De forma general, en las imágenes con poco detalle o 2.6.4. Utilización de la DCT para compresión
normales en detalle, casi todos los coeficientes que son de vídeo
distintos de cero se agruparán en la esquina superior La transformada discreta del coseno se considera la
izquierda de la matriz de coeficientes. Esta base en la mayoría de los algoritmos de compresión de
característica de la DCT la trataremos en las video, tanto intracuadro (redundancia espacial) como
propiedades que se detallan en el siguiente apartado. intercuadro (redundancia temporal). Esta transformada
2.6.3. Propiedades de la DCT se suele aplicar dividiendo las 720x576 muestras
La DCT por sí misma, al pasar de una matriz a otra del activas de una imagen en bloques de 8x8 píxeles.
mismo tamaño no implica compresión alguna, pero 2.6.4.1. Lectura en zig-zag
tiene algunas características importantes que la hacen La DCT por sí sola, como se ha visto en el apartado de
muy útil para nuestro propósito. Sin llegar a hacer un propiedades, no comprime. Ésta, al transformar la
estudio exhaustivo, nos vamos a centrar en aquellas información del dominio espacial al dominio de la
propiedades que nos van a ser útiles en los procesos de frecuencia, recoloca la información de tal manera que
compresión de imágenes. es más fácil eliminar la parte redundante,
a) Una de las propiedades más importantes y que se consiguiendo reducir el flujo binario. A continuación,
puede comprobar directamente de la definición es la se presenta un ejemplo de matriz 8x8 y su
de “separabilidad”. En este caso, la separabilidad correspondiente DCT bidimensional.
quiere decir que una DCT bidimensional se puede
expresar como un conjunto de varias DCTs
unidimensionales.
Si x[m,n] = x1[m] · x2[n], C[u,v] = C1[u] · C2[v].
b) La DCT presenta también la propiedad de una gran
compactación de la información en los coeficientes de
menor orden, de tal manera que los de orden superior
tienen un valor nulo o caso nulo, salvo en el caso de
imágenes que presenten una anormalmente alta
variación espacial.
c) Los coeficientes resultantes de la DCT presentan
Si observamos detenidamente la distribución de los
entre sí una muy pequeña correlación. Esta propiedad
coeficientes frecuenciales en los bloques
es especialmente importante en aplicaciones de
transformados, podemos ver que los más significativos
compresión de imágenes, ya que de esta forma será
se encuentran en el cuadrante superior izquierdo, que
posible dar a los coeficientes tratamientos totalmente
corresponde a las bajas frecuencias. Conforme nos
diferentes dependiendo del lugar que ocupen dentro de
vamos alejando de este cuadrante hacia la derecha y
la matriz de coeficientes.
hacia abajo, el valor de los coeficientes disminuye
d) La transformada de Fourier es una transformada
drásticamente.
compleja, con parte real y parte imaginaria, lo que
Este hecho, surge por la propia información contenida
complicado el trabajo con ella. Sin embargo la DCT es
en las imágenes, pero existe otra razón por la que
una transformada real; sus resultados son muestras de
podemos decir que la información de alta frecuencia,
la función coseno, y esto simplifica mucho su manejo.
que de por sí es poca, puede despreciarse. Esta razón
e) Si en la transformada de una imagen se suprimen
aparece por la forma en que el sistema visual humano
los coeficientes de mayor orden, al volver a calcular la
atiende a las imágenes. De toda una imagen, el sistema
visual presta atención a un objeto o conjunto de

objetos concretos, considerando lo demás como fondo Para conseguir una mayor compresión, podemos
que carece de importancia. Por lo general, los objetos aplicar otra herramienta al resultado de la DCT. Esta
a los que hay que atender se representan en primer herramienta va a ser una cuantificación ponderada de
los coeficientes. Esta cuantificación ponderada se
plano, con lo que el contenido de bajas frecuencias es
basa, como es lógico, en la mayor o menor
todavía más importante que el de altas frecuencias. La importancia de cada coeficiente respecto de la calidad
mayor parte de los contenidos de alta frecuencia subjetiva final, es decir en el contenido frecuencial de
quedan en el fondo, y su eliminación apenas resta cada coeficiente.
información real a la imagen. Considerando estas A cada coeficiente de la DCT se le aplica una
características, a la hora de serializar los coeficientes cuantificación definida por un determinado tamaño de
de la DCT para almacenarlos o transmitirlos, se hace escalón de cuantificación. En aquellos coeficientes
donde su redondeo afecte más a la calidad, el escalón
conveniente una lectura de las matrices de coeficientes
de cuantificación será menor, y aquellos coeficientes
de manera que los de menor peso queden agrupados, y menos importantes se cuantificarán con escalones más
así se puedan eliminar o codificar más fácilmente grandes. Esta cuantificación queda definida por una
mediante un código de longitud de recorrido (RLC) matriz de valores que representarán los tamaños de los
que signifique “los siguientes ‘n’ coeficientes son escalones, y que se llama matriz de cuantificación.
nulos”. Según esto, la lectura de los coeficientes se Esta cuantificación va a hacer que algunos coeficientes
que antes eran cercanos a cero, al redondear se vayan a
realiza en zig-zag comenzando desde el coeficiente
cero, y otros que no se vayan a cero, puede hacerse
DC, y terminando en su lado opuesto. Esto permite que se codifiquen con menor número de bits, y así se
procesar en primer lugar las bajas frecuencias consigue un mayor nivel de compresión. De esta
espaciales y decidir posteriormente si se procesan o se manera se consigue un mayor nivel de compresión.
eliminan los coeficientes correspondientes a las altas Existe toda un colección de matrices de cuantificación
frecuencias. establecidas que minimizan la degradación subjetiva
Realizando la lectura de esta manera, se pueden de la calidad. La matriz de cuantificación por defecto
aplicada a los algoritmos JPEG aparece en la siguiente
procesar los coeficientes de más nivel, y eliminar el
expresión.
resto consiguiendo factores de compresión, aunque
modestos, sin que la calidad subjetiva de la imagen
quede afectada. En este caso se tratará de una
compresión subjetivamente sin pérdidas, consiguiendo
una compresión 2:1 directamente al aplicar la DCT sin
efectuar redondeos.
como se observa gran parte de los coeficientes se van a

cero. En la actualidad se considera que una
compresión 3,3:1, que provoca un redondeo moderado
Fig8.- Lectura de la matriz de coeficientes en de los coeficientes, tampoco provoca prácticamente
exploración progresiva y entrelazada degradación subjetiva de la calidad. Esta no
degradación subjetiva viene marcada por la posibilidad
2.6.4.2. Cuantificación de los coeficientes de multigeneración vista en apartados anteriores.
Todos los factores de compresión mayores que 3,3:1

necesitarán un mayor redondeo de coeficientes, y por
lo tanto mayor pérdida de información. Obviamente,
esta mayor cuantificación sí merma la calidad de la
imagen. Estamos entrando entonces en el terreno de la
2.7.3 Codificación Huffman
compresión con pérdidas subjetivas, y dependiendo de
En ciencias de la computación y teoría de la
los valores de la cuantificación tendremos una pérdida información, la codificación Huffman es
de calidad mayor o menor, y a costa de ello una mayor un algoritmo usado para compresión de datos. El
o menor compresión. término se refiere al uso de una tabla de códigos de
longitud variable para codificar un determinado
2.7 Codificación símbolo (como puede ser un carácter en un archivo),
donde la tabla ha sido rellenada de una manera
El último paso de la codificación de las imágenes a específica basándose en la probabilidad estimada de
través de dos pasos: aparición de cada posible valor de dicho símbolo. Fue
1. Codificación del elemento DC como un valor desarrollado por David A. Huffman mientras era
relativo respecto a valores anteriores, ya que este valor estudiante de doctorado en el MIT, y publicado en “A
tiene altos grados de correlación. Method for the Construction of Minimum-
2. Reordenación de los valores DCT en zig-zag ya que Redundancy Codes”.
hay tantos de estos elementos cuyo valor es cero que
deben ser codificados de forma diferente que los que 2.7 Perfiles y niveles MPEG-2 estándar.-
no son cero. Se usa RLE (run-length encoding) que no Puesto que la sintaxis completa del estándar MPEG-2
hace sino contar el número de ceros en la imagen.
es compleja y difícil para la implementación práctica
en un solo chip de silicio, el estándar MPEG-2 define
2.7.1 Codificación entrópica cinco subconjuntos de la sintaxis completa,
denominados perfiles, diseñados para una variedad de
En teoría de la información, “’codificación entrópica”’ aplicaciones. Estos son perfil simple (simple), perfil
es un método de codificación sin pérdidas que es principal (principal), perfil escalable de relación de
independiente de las características específicas del señal a ruido (SNR), escalabilidad espacial (escalable
medio. Este método se basa en un conocimiento previo espacial) y perfil alto (alto). Más adelante, se crea otro
sobre los símbolos que surgirían en una trama binaria. perfil, 4: 2: 2, y la definición de otro perfil (multiview)
La entropía es un factor para evaluar los codificadores. está en progreso.
Se calcula con los nombres de bits por símbolo
usados. El perfil se define por cuatro niveles, que regulan la
Existen tres tipos de códigos: Codificación por elección de los parámetros disponibles durante la
longitud de series”(Run Length Encoding – RLE)”, implementación del hardware. Los niveles determinan
DPCM “(Differential PCM)” y Códigos de longitud la velocidad de bits máxima y, según la velocidad de
variable “(Variable Length Coding – VLC)” bits, se seleccionan la velocidad de transmisión de
programas de televisión y resoluciones del sistema y,
2.7.2 Codificación VLC por otra parte, están determinadas por el número de
muestras por línea, el número de líneas por imagen y
Se trata de un caso particular de codificación el número de fotogramas por segundo. Hay cuatro
aritmética. La idea básica de los códigos de longitud niveles: nivel alto (HL) H14L (nivel H 1440), nivel
variable es asignar códigos de palabras de longitudes principal (ML) y nivel bajo (LL).
diferentes en función de la probabilidad de los
mensajes. Los mensajes menos probables se TABLA 5. LÍMITES DE PARÁMETROS EN
codificarán con un mayor nombre de bits que no los LOS NIVELES DEL ESTÁNDAR MPEG-2
mensajes más probables.
extremadamente alta (HDTV-TV de alta definición)

en el formato de muestreo 4: 2: 2 o 4: 2: 0. Alto perfil
soporta los principales, altos 1440 y 1920 de alto
nivel, con un flujo máximo de 20, 80 y 100 Mb / s,
respectivamente. El flujo de la capa base es de 4, 20 y
25 Mb / s, respectivamente.
Se ha introducido el perfil 4: 2: 2 para permitir trabajar
con imágenes en color en formato 4: 2: 2, que es
necesario para el equipo de estudio. Aunque, durante
El perfil simple está diseñado para simplificar el
el desarrollo del estándar MPEG-2, no se han tenido
codificador del transmisor y el decodificador del
en cuenta los usos del estudio, mostró que el estándar
receptor, con reducciones en la velocidad binaria
MPEG-2 es adecuado para este propósito. 4: 2: 2 perfil
(velocidad de transferencia) y la predicción
ha permitido el uso de herramientas existentes para la
bidireccional de incapacidad (imágenes B no existen)
codificación y en aplicaciones de estudio, que requiere
sólo soporta predicciones I y P. Como tal, es adecuado
una mayor velocidad de bits.
sólo para televisión terrestre de baja resolución. La
velocidad de bits máxima es de 15 Mb / s.
El perfil multivista (MVP) es introducido para
permitir la codificación eficiente de dos secuencias de
El perfil principal es el compromiso óptimo entre la
vídeo derivadas de dos cámaras que están grabando la
relación de compresión y el precio. Soporta los tres
misma escena, y que se fijan en un ángulo leve
tipos de predicción I, P, B, que conduce
(estereovisión). Este perfil también utiliza
automáticamente a la complejidad del codificador y
herramientas existentes para la codificación, pero con
decodificador. El perfil principal admite los cuatro
un nuevo propósito. Hay también el decodificador
niveles, con velocidades de bits máximas de 4, 15, 60
compatible reverso que significa que un nivel más alto
y 80 Mb / s, para niveles alto, alto, alto y alto de 1440,
todavía puede jugar el perfil bajo del nivel, mientras
respectivamente. La mayoría de las aplicaciones de
que la compatibilidad en la dirección opuesta no es
difusión están programadas para operar en el perfil
posible. La etapa actual de desarrollo utiliza un perfil
principal. La televisión digital terrestre utiliza el perfil
combinado y un nivel de perfil principal en el nivel
principal y el nivel principal (MP y ML). SNR
principal. El número máximo de píxeles que
escalable soporta el perfil sólo para niveles bajos y
teóricamente se pueden transmitir por el codificador
principales con una velocidad de bits máxima de 4 y
MPEG-2 es 16.383 × 16.383 = 22.657.689.
15 Mb / s, respectivamente.
El perfil ampliable desde el punto de vista espacial 3. Conclusiones y Recomendaciones

admite sólo un nivel alto de 1440 con un caudal
máximo de 60 Mb / s, de los cuales 15 Mb/s forman Se cumplieron con los objetivos de esta investigación,
parte de la capa base. Permite la transferencia de la pues se investigaron y analizaron conceptos
calidad básica de la imagen dependiendo de la importantes de MPEG-2, se investigaron temas como,
resolución espacial (espacial) o de la exactitud de la la compresión, la codificación, la digitalización,
cuantización, con la adición de la información de cuantificación y la transformada discreta de coseno
apoyo (capa realzada). Esto permite la emisión
entre otros. Esto con el fin de entender un componente
simultánea de un programa en la resolución elemental
y superior, de modo que en caso de condiciones de muy importante para un sistema de televisión digital,
recepción difíciles la señal de calidad inferior se puede el cual mejora significativamente la calidad de audio y
recibir (resolución más baja) en lugar de más alto. video, con el cual tenemos un gran sistema de
Están diseñados para televisión de definición extensa televisión para nuestros hogares.
(EDTV).
El perfil alto (también conocido como profesional) 4. Referencia Bibliográfica

está diseñado para su uso posterior con la codificación
jerárquica para aplicaciones con definición
[1] J. Genevray, MPEG 2. Paris: Micro Application,

2002.
[2] C. Pérez, Introducción a la compresión de imagen,

2010

Informe MPEG2

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Informe MPEG2

Transféré par

Droits d'auteur :

Formats disponibles

UNIVERSIDAD CATOLICA BOLIVIANA “SAN PABLO” Ingeniería en Telecomunicaciones

Telecomunicaciones III – TEL 218 Semestre: II-2018

Oscar Edwin Bustamante Ferrel

Resumen.- En el presente trabajo de investigación, se mostrarán los conceptos generales y

Índice de Términos.- Vídeo, Codificación, Frecuencia, Ancho de Banda

una calidad significativamente mayor de imagen y

TABLA 1. FLUJO COMPRIMIDO DE

Fig 1. Componentes de la Televisión Digital.

(NTSC) o 576 (PAL y SECAM) y que han sido los

La televisión de alta definición o HDTV (siglas en

● j: Referencia de muestreo de luminancia

● Factor Horizontal Alfa: Si es incluido, debe ser

2.3.6.2. Esquemas de submuestreo comunes

A continuación, se explican las diferentes clases de

Fig5.- Frecuencias de muestreo para SD, HD, 3G

Cuando la televisión digital arranca a especificarse en

Usando esta nomenclatura de 4:2:2, se puede deducir

Por otra parte, con la compresión subjetivamente sin

- En los casos de distribución de la señal vía radio, se 2.5.1 Redundancia espacial

Considerando la secuencia a transformar x[n] y la

Existen otras formas de escribir esta expresión con

El cálculo de la DCT que se desprende directamente

2.6.2. Generalización de la DCT bidimensional

La DCT bidimensional es una transformación

De la misma manera que antes, las variables “u” y “v”

Atendiendo a la figura, cada coeficiente de la

visual presta atención a un objeto o conjunto de

como se observa gran parte de los coeficientes se van a

Todos los factores de compresión mayores que 3,3:1

extremadamente alta (HDTV-TV de alta definición)

El perfil ampliable desde el punto de vista espacial 3. Conclusiones y Recomendaciones

El perfil alto (también conocido como profesional) 4. Referencia Bibliográfica

[1] J. Genevray, MPEG 2. Paris: Micro Application,

[2] C. Pérez, Introducción a la compresión de imagen,

Vous aimerez peut-être aussi