Académique Documents
Professionnel Documents
Culture Documents
sur IP et le H.264
H.264, le tout dernier standard de
compression, est une importante
évolution pour les systèmes vidéos IP.
Mike Smart, Codec Manager
d'IndigoVision, propose un éclairage sur
les apports et les bénéfices de ce
nouveau standard.
Définition du H.264
L’H.264 est un standard d’encodage v idéo. L’encodage v idéo ou codec (compression et décompression) est utilisé pour
compresser ou décompresser une v idéo numérique, ce qui permet de réduire la bande passante requise dans la
transmission et le stockage des données v idéo. Ceci parce que le taux des données originelles non comprimées d’une
v idéo 4 :2 :2 numérique activ e CCIR601 à 720x480 pixel et à 30f ps dépasse les 158Mbps- plus de 300 fois la capacité
d’une connexion ADSL à 512 kbps et un peu plus d’une heure d’enregistrement sur un disque dur 80GB.
Im plém entation du Standard H.261/H.263. Mais alors, qu’est ce qui correspond à quoi ?
Av ant d’analy ser le H.264 en détail, il est important de dif f érencier entre CIF et SIF sont une mesure de résolution vidéo.
f aire une comparaison entre standards et f aire une comparaison Pratiquement, la résolution CIF mesure 352x288pixels,
d’implémentation entre standards. Ce sont deux choses complètement que la vidéo soit NTSC ou PAL. La résolution SIF, par
dif f érentes. C’est pourquoi quand on entend dire : « le H.264 fournit une contre, mesure 352x288 pixels pour les caméras PAL,
vidéo de meilleure qualité que le MPEG-2 », ce n’est pas tout à f ait juste. mais 352x240 pour les caméras NTSC. Cette résolution
s’exprime aussi en 320x240 pixels - c’est une résolution
Le H.264 est un standard de compression v idéo. Le standard H.264 définit SIF tout aussi valide. Même si les chiffres parlent
la sy ntaxe d’un f lux de données conf orme, pour lequel il doit y av oir un autrement, il n’y en fait aucun avantage dans l’utilisation de
encodeur exactement compatible, tout en implémentant les outils CIF plutôt que de SIF.
nécessaires et déf inis par le standard pour pouv oir ensuite décoder le flux
de données. CIF est généralement associé au standard H.261/H.263 et
SIF au standard MPEG. Malheureusement, à cause de
Un encodeur H.264, inv ersement, peut implémenter des sous-ensembles leur phonétique similaire et compte-tenu du fait qu’ils
de la sy ntaxe déf inis par le standard, f ournissant ainsi un f lux de données soient identiques pour les sources PAL, les deux termes
conf orme. De plus, les dif f érentes implémentations et algorithmes d’un sont souvent utilisés l’un à la place de l’autre, même si à
décodeur ne sont pas déf inis par le standard, mais sont créées par le proprement parler ce sont deux termes tout à fait distincts.
créateur de l’encodeur. C’est pourquoi les encodeurs H.264 prov enant de C’est pourquoi quand on entend parfois parler de CIF,
dif f érents v endeurs produiront des f lux de dif f érente qualité, pour la même c’est en fait au SIF qu’on se réfère.
débit.
Par conséquent, si votre système est CIF (ou 2CIF ou
Il est donc plus correct d’af f irmer que « l’ H.264 fournit une syntaxe et une 4CIF), vous êtes en train d’utiliser un ancien codec basé
série d’ outils plus riche que le MPEG-2, et par conséquent permet sur H.261/H.263, et votre système ne sera pas compatible
l’ implémentation d’ un encodeur vidéo de qualité supérieure, pouvant avec MPEG-4 ou H.264. Tous les systèmes MPEG-4 et
générer une vidéo de meilleure qualité pour le même débit, et pouvant H.264 sont basés sur SIF. Donc, si vous voulez un vrai
aussi générer une vidéo de même qualité pour un débit inférieur ». MPEG-4, que ce soit Part 2 ou Part 10, vous devez l’épeler
avec un « S » !
Ceci peut être démontré en utilisant l’encodeur de logiciel de réf érence
JM11, disponible gratuitement chez ISO (International Standards
Organization). L’encodeur H.264 de réf érence permet à l’utilisateur de
choisir les outils pour encoder une séquence v idéo en particulier. Le tableau ci-dessous montre le résultat de l’encodage
d’une séquence v idéo identique en utilisant l’encodeur de réf érence H.264 av ec dif f érents outils. Tous les f lux de
données produits par chaque conf iguration sont des f lux de données conf ormes et chaque f lux de données a la même
qualité v idéo.
Ce tableau démontre clairement que plus on utilise d’outils, meilleure est la compression réalisée pour la même qualité
v idéo. Mais il est aussi év ident que l’ajout de nouv eaux outils en accroît la complexité - mesurée dans ce cas par le
temps d’exécution du processus d’encodage. Cet accroît de complexité est souv ent la cause d’omission de certains
outils et algorithmes dans la création d’un encodeur H.264.
Le standard de compression v idéo H.264 a été incorporé dans le standard MPEG-4, sous le nom de MPEG-4 Part 10
(ISO/IEC 14496-10). Cela signif ie que le standard MPEG-4 consiste à présent en deux standards de compression.
Pourtant, ces deux standards de compression ne sont pas interchangeables, car un des standards utilise une méthode
dif f érente de compression et de représentation des données. Par exemple, un décodeur MPEG-4 Part 10 (H.264) ne
peut pas décoder un f lux de données MPEG-4 Part 2, et v ice v ersa.
Dans un émetteur de la gamme 9000, les images v idéos sont capturées par la caméra, et env oy ées v ers un encodeur
interne H.264 pour être compressées. Chaque image est ensuite compressée de deux f açons : comme I-Frame ou
comme P-Frame.
Les P-f rames sont des images à compensation de mouvement : c’est à dire que l’encodeur utilise la dif f érence entre
l’image qu’il est en train de traiter et l’image précédente, pour ne pas retransmettre des inf ormations inchangées à
répétition, par exemple dans le cas d’un arrière-plan. A la dif f érence d’encodeurs basés seulement sur les différences,
tels que delta-MPEG, H.264 recherche non seulement les dif f érences mais aussi les mouv ements qui ont eu lieu dans la
séquence v idéo. Ceci signif ie que les encodeurs à compensation de mouv ement sont plus perf ormants que les
encodeurs basés seulement sur les dif f érences lorsqu’il y a du mouv ement. Ce processus de recherche de mouvements
est appelé estimation de mouvement.
L’unité d’estimation de mouv ement est une des parties les plus
chères d’un encodeur, mais aussi la plus importante pour la
perf ormance de l’encodeur H.264. L’estimation de mouvement est
une procédure complexe, et souv ent les encodeurs, surtout les
encodeurs basés sur DPS ou sur logiciel Real Time, utilisent des
aires de recherche réduites ou des algorithmes de restriction de
recherche pour réaliser une prestation en temps réel. Mais ceci
résulte souv ent en une v idéo de basse qualité et une compression
substantiellement réduite.
Le graphique montre comment, comparé au MPEG-4, le H.264 réalise entre 20 à 25% d’économie, permettant non
seulement de réduire la bande passante requise pour le sy stème v idéo sur IP, mais plus essentiellement, permettant
aussi de réduire signif icativ ement la quantité de stockage requise pour l’enregistrement v idéo, une des parts les plus
chères dans un sy stème de v idéosurv eillance.
Il est clair qu’en observ ant l’implémentation du H.264, la demande au niv eau de puissance de l’encodeur est
signif icativ e si on v eut utiliser toute la gamme d’outils et bénéf ices disponibles de cette technologie. Le H.264 est un
standard de compression v idéo à utilisation générale qui n’a pas été spécif iquement créé pour la v idéosurveillance. Mais
en utilisant un design basé sur mesure sur FPGA, comme dans la gamme 9000 d’IndigoVision, la puissance nécessaire
est ainsi disponible et le design peut être conçu sur mesure pour les utilisations de v idéosurv eillance. Par exemple, une
compression ultérieure peut être réalisée en cas de basse activ ité dans la séquence v idéo - une situation courante dans
la v idéosurv eillance. L’approche sur mesure FPGA a plusieurs av antages :
• Les techniques de codages av ancées permettent de garder une v idéo de haute qualité même durant des
activ ités rapides sans pertes d’images, sans considération pour le débit et le mouv ement. Ceci est essentiel
pour des utilisations telles que dans la surv eillance des tables de casinos.
• Encodage perf ormant et économique d’une v idéo 4SIF 30f ps totalement conf orme au H.264.
• Amélioration des installations sur le site au f ur et à mesure que de meilleurs standards de compressions sont
disponibles.
• Les algorithmes de l’analy tique en temps réel peuv ent être utilisés au niv eau du matériel hardware à haute
perf ormance plutôt qu’au niv eau du logiciel. L’analy tique étant ainsi présente aux marges du réseau, par
exemple dans les caméras, permet d’av oir une solution v idéo IP complètement extensible.
Résum é
L’H.264 of f re de nombreux av antages pour l’utilisateur et pour les créateurs de sy stèmes, même si la complexité du
sy stème engendre des coûts supplémentaires. C’est pourquoi l’H.264 ne remplacera pas le MPEG-4 du jour au
lendemain, mais les deux standards seront plutôt utilisés côte à côte, pour of f rir à l’utilisateur plus de choix dans les
solutions de v idéosurv eillance. IndigoVision f ournira les produits de la gamme actuelle MPEG-4 8000 pendant plusieures
années, à coté de sa nouv elle gamme 9000 H.264. Même si les standards de compression MPEG-4 et H.264 ne sont
pas compatibles, les réseaux IP permettent aux deux sy stèmes de co-exister, et comme le logiciel de gestion des vidéos
et des enregistrements d’IndigoVision est capable de gérer les f lux de données des deux ty pes, les systèmes MPEG-4
peuv ent être progressiv ement mis à jour et améliorés av ec des produits H.264.
L'auteur