Académique Documents
Professionnel Documents
Culture Documents
ALGORITMO MPEG-4
Andres Onofrio Muasqui Paredes
andy2004forever@hotmail.com
1
FIEE UNMSM. Muasqui. Radiodifusin Algoritmo MPEG-4
.
de la transmisin son limitaciones que van siendo de las ms importantes novedades que
superadas a grandes pasos, ya que hablamos de un aporta el estndar. Basado en una
estndar que tiene una mejor eficiencia de codificacin y representacin eficiente de objetos, como
una gran flexibilidad en la asignacin de recursos su manipulacin, edicin en flujo de bits, y
computacionales. escalabilidad basada en objetos permite
nuevos niveles de interactividad de
2.2.3 PRODUCCIN DE TV contenido.
2.2.4 JUEGOS
2
FIEE UNMSM. Muasqui. Radiodifusin Algoritmo MPEG-4
.
de flujo de bits para los disponibles en las tasas correspondiente a otro objeto o fondo de la
de bits ms bajas. escena
MPEG-4 provee soporte para material Capa de objeto de video (VOL): Cada
objeto de video puede ser codificado en
entrelazado y progresivo. El formato de
forma escalable (multicapa), o no escalable
crominancia que es soportado es 4:2:0. En este (capa nica), dependiendo de la aplicacin,
formato el nmero muestras de Cb y Cr son la representado por el VOL. Provee soporte
mitad del nmero de muestras de las de la para codificacin escalable. Un objeto de
luminancia tanto en horizontal como en vertical. video puede ser codificado usando
Cada componente puede ser representada por escalabilidad temporal o espacial, yendo
un nmero de bits variante de 4 a 12. desde grandes a finas resoluciones.
Dependiendo de parmetros como ancho
de banda disponible, potencia
2.4 ESTRUCTURA Y SINTAXIS
computacional, y preferencias de usuario, la
resolucin deseada puede ser hecha
El concepto central definido por el estndar MPEG-
disponible para el decodificador
4 es el objeto audiovisual, el cual es el fundamento de la
representacin basada en objeto. Tal representacin est
acondicionada para aplicaciones interactivas y da acceso
directo a los contenidos de le escena. Nos limitaremos
principalmente a objetos de video natural. Un objeto de
video puede consistir de una o ms capas para soportar
la codificacin escalable. Esta sintaxis escalable permite
la reconstruccin del video en forma de capas partiendo
de una capa base autnoma, y agregando una serie de
capas de mejora. Esto permite a las aplicaciones generar
un nico flujo de bits de video MPEG-4 para una variedad
de requisitos de ancho de banda y/o computacionales. Un
caso especial es donde un alto grado de escalabilidad es
requerida, y ocurre cuando una imagen esttica es
mapeada en 2 o 3 objetos dimensionales. Para manejar
esta funcionalidad, el estndar provee un modo especial
para codificar texturas estticas usando una
transformacin ondcula.
Figura 2. Ejemplo de una estructura lgica de flujo de
Una escena visual MPEG-4 puede consistir de uno bits de video en MPEG-4
o ms objetos de video, cada uno de ellos es
caracterizado por informacin espacial y temporal en los
aspectos de su forma, movimiento, y textura. Para ciertas Hay 2 tipos de capas de objetos de video, la capa de
aplicaciones, los objetos de video pueden no ser objeto de video que provee funcionalidad completa
deseables, debido a posible dificultad de generarlos. Para MPEG-4, y una capa de funcionalidad reducida, la capa
esas aplicaciones, el estndar permite las codificaciones de objeto de video con cabeceras cortas. El ltimo provee
de cuadros rectangulares los cuales representan un caso compatibilidad de flujo de bits con la lnea base H.263. [5]
degenerado de un objeto formado arbitrariamente.
Cada objeto de video es muestreado en tiempo,
Un flujo de bits visual en MPEG-4 provee una cada muestra de tiempo de un objeto de video es un plano
descripcin jerrquica de una escena visual como se de objeto de video. Estos puedes ser agrupador para
muestra en la Figura 2. Cada nivel de la jerarqua puede formar un conjunto de planos de objetos:
ser accedido in el flujo de bits por cdigos especiales
llamados cdigos de inicio. Los niveles jerrquicos que Grupo de planos de objetos de video
describen la escena ms directamente son: (GOV): Proveen puntos en el flujo de bits
donde los planos de objetos de video son
codificados independientemente de cada
Secuencia de objeto visual (VS): La
otro, y por tanto proveer puntos de acceso
escena completa MPEG-4 que puede
aleatorio dentro del flujo de bits. Los GOV
contener cualquier objeto natural o sinttico
son opcionales.
2D o 3D y sus correspondientes capas de
mejora.
Plano de objeto de video (VOP): Es la
muestra en tiempo de un objeto de video.
Objeto de video (VO): Un objeto de video
Pueden ser codificados
corresponde a un objeto 2D en particular en
independientemente de cada otro, o
la escena. En el caso ms simple, esto
dependiente de otro por el uso de
puede ser un cuadro rectangular, o un
compensacin de movimiento. Un cuadro
objeto formado arbitrariamente
3
FIEE UNMSM. Muasqui. Radiodifusin Algoritmo MPEG-4
.
Un plano de objeto de video puede ser usado en En el estndar visual MPEG-4, 2 clases de
muchas maneras. La ms comn es en la que el vop informacin de forma son considerados como inherentes
contiene la informacin de video codificada de una caractersticas de un objeto de video. Estos estn
muestra de tiempo de un objeto de video. En ese caso referidos como la informacin de forma de escala de
contiene parmetros de movimientos, informacin de grises, y la binaria. Por esta ltima, se quiere decir de una
forma e informacin sobre la textura. Puede tambin informacin de etiqueta que define qu porciones
codificarse un sprite. Un sprite es un objeto de video que (pxeles) del soporte del objeto pertenece al objeto de
es usualmente ms grande que el video mostrado, y video en un tiempo determinado. La informacin de forma
persiste en el tiempo. Hay maneras de modificar binaria es mejor representada como una matriz con el
ligeramente un sprite, cambiando su brillo o mismo tamao que la de la VOP. Cada elemento de la
transformndolo en una deformacin espacial. Es usado matriz puede tomar uno de dos posibles valores
para representar, ms o menos reas estticas, como dependiendo de si el pxel est dentro o fuera del objeto
fondos. Los sprites son codificados usando macro de video. La forma en escala de grises es una
bloques. generalizacin del concepto de forma binaria, proveyendo
una posibilidad de representar objetos transparentes, y
Un macro bloque contienen una seccin de la reducir los efectos de aliasing. Aqu, la informacin de
componente de luminancia y los componentes sub forma es representada en 8 bits, en vez de un valor
muestreados espacialmente de la crominancia. En el binario.
estndar MPEG-4 hay soporte para slo un formato de
crominancia para un macro bloque, el formato 4:2:0. En 3.1 CODIFICACIN DE FORMA BINARIA
este formato, cada macro bloque contiene 4 bloques de
luminancia y 2 de crominancia. Cada bloque contiene 8x8
La informacin de forma binaria es codificada por
pixeles, y es codificado usando la transformada DCT. Un
una tcnica de bloque compensado de movimiento
macro bloque lleva la informacin de forma, movimiento y
permitiendo codificacin con o sin prdidas de tal
textura.
informacin. En MPEG-4, la forma de cada VOP es
codificada junto con sus otras propiedades (textura y
La Figura 3 muestra el diagrama de bloques general movimiento). Para este fin, la forma de un VOP es limitada
de la codificacin y decodificacin de MPEG-4 basado en por una ventana rectangular con un tamao de mltiplos
la nocin de los objetos de video. Cada uno de estos es de 16 pxeles en direcciones vertical y horizontal. La
codificado separadamente. Por razones de eficiencia y posicin del rectngulo limitante puede ser elegida de tal
retro compatibilidad, los objetos de video son codificados manera que contenga en mnimo nmero de bloques de
por medio de sus correspondientes planos de objetos de 16x16 sin pxeles transparentes. Las muestras en la caja
video en un esquema hbrido de alguna manera similar a limitante son luego particionadas en bloque de 16x16
los anteriores estndares MPEG. La Figura 4 muestra un muestras y el proceso de codificacin/decodificacin se
ejemplo de decodificacin de un VOP. realiza bloque por bloque.
4
FIEE UNMSM. Muasqui. Radiodifusin Algoritmo MPEG-4
.
5
FIEE UNMSM. Muasqui. Radiodifusin Algoritmo MPEG-4
.
6 RESILIENCIA A ERRORES
Esta funcionalidad es importante para acceso
universal a travs de ambientes propensos a errores,
Figura 8. Herramientas de resiliencia de errores en
como las comunicaciones mviles.
MPEG-4
MPEG-4 provee varios mecanismos para permitir
resiliencia a errores con diferente grado de robustez y
complejidad. Estos mecanismos son ofrecidos por
herramientas que proveen medios para resincronizacin, 7 CODIFICACIN DE SPRITE
deteccin de errores, recuperacin de informacin y
ocultacin de errores. Hay 4 herramientas y son: Un sprite consiste de aquellas regiones de un VO
que estn presentes en la escena, a lo largo del segmento
Resincronizacin Es la manera ms de video. Esencialmente es una imagen esttica que
frecuente de traer resiliencia a errores a un puede ser trasmitida solo una vez, al inicio de la
flujo de bits. Consiste en insertar transmisin. Sprites han sido incluidos en MPEG-4
marcadores nicos en el flujo de bits de principalmente porque proveen alta eficiencia de
modo que en caso de un error, el compresin en tales casos. La codificacin basada en
decodificador pueda saltar los bits restantes sprite es muy adecuada para objetos sintticos, aunque
hasta el siguiente marcador y volver a tambin puede ser usado para objetos en escenas
decodificar desde ese punto en adelante. naturales que van en movimiento rgido.
6
FIEE UNMSM. Muasqui. Radiodifusin Algoritmo MPEG-4
.
8 CONCLUSIONES
MPEG-4 ha sido desarrollado para soportar un
amplio rango de aplicaciones multimedia. Los anteriores
estndares principalmente se concentraron en compactar
tanto video como audio, mientras que ahora MPEG-4
habilita funcionalidades que son requeridas por muchas
aplicaciones.
9 REFERENCIAS