Conception Et Implementation Du Systeme

CONCEPTION ET IMPLÉMENTATION DU
SYSTÈME MULTIMÉDIA EMBARQUÉ
ECOLE NATIONALE DES SCIENCES APPLIQUEED DE KHOURIBGA

2émé Année cycle ingénieur : Génie Electrique
Encadré par :Mr. Ismail Laghrat
Siham Darif Rabiaa Manar Sliman Ennayri Omar Barmaki

Yacine a.Amkassou
Remerciements
Nous tenons à remercier dans un premier temps, toute l’équipe pédagogique de l’Ecole
Nationale des Sciences Appliquées de Khouribga , pour avoir assuré la partie théorique de notre
formation.
Nous remercions également M. Ismail Laghrat pour l’aide et les conseils qu’il nous a
apporté lors des différentes étapes de l’élaboration de notre projet. Nous tenons à vous remercier
du fond du cœur également pour chaque minute passée avec nous ; pour chaque information et
pour chaque nouvelle leçon que vous avez enseignée.
On sait bien que n’a pas été du facile de nous enseigner ; parfois dû à notre manque de base
d’autre fois à notre surcharge, merci de ne pas avoir baissé les bras quand même ; de nous avoir
tant soutenu et encourager pour arriver au bout, que Dieu vous bénisse.
1
Table des matières
1 LA CONCEPTION DES SYSTÈMES EMBARQUÉES NUMÉRIQUES 1

1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Méthodologies de Conception des systèmes numériques . . . . . . . . . . . . . . 1
1.2.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2.2 Réalisation d’un système sur puce SoC ou SoPC . . . . . . . . . . . . . 3
1.2.3 Les différentes familles de blocs IP . . . . . . . . . . . . . . . . . . . . . 3
1.3 Les circuits à logique programmable . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3.1 Types d’architectures et éléments des circuits FPGA . . . . . . . . . . . 4
1.3.2 Exemple de circuit FPGA : la famille Altera cyclone II . . . . . . . . . . 4
1.4 Le processeur embarqué NIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4.1 Processeur NIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4.2 Bus Avalon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2 CONCEPTION DU SYSTÈME MULTIMÉDIA EMBARQUÉ 11

2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2 Plateforme matérielle de traitement vidéo . . . . . . . . . . . . . . . . . . . . . . 12
2.2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2.2 Conception d’un système SoPC . . . . . . . . . . . . . . . . . . . . . . . 12
2.3 Platforme de développement : CycloneII FPGA Multimedia board . . . . . . . . 15
2.3.1 Caractéristique générale . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.4 Système d’acquisition et de traitement vidéo . . . . . . . . . . . . . . . . . . . . 17
2.5 Principe de base de traitement d’image . . . . . . . . . . . . . . . . . . . . . . . 17
2.5.1 Définition d’une image et des types d’images . . . . . . . . . . . . . . . . 17
2.5.2 Changement d’espace de couleur . . . . . . . . . . . . . . . . . . . . . . . 18
2.5.3 Définition de la vidéo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3 RÉALISATION DU SYSTÈME 20
3.1 Configuration de capteur CMOS . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.2 Notre Système . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.3 création de système sur quartus II et SoPC builder . . . . . . . . . . . . . . . . 23
3.4 Le premier test : Hello World ! . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.5 Programme de traitement d’image . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.5.1 L’algorithme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.5.2 les fonctions de altera avalon pio regs.h . . . . . . . . . . . . . . . . . . . 26
3.6 L’implémentation du programme . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Conclusion 28
2
Table des figures
1.1 Evolution de la conception numérique . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2 SoC basé coeurs de processeurs . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Niveau supérieur de la hiérarchie de l’architecture du circuit Stratix II . . . . . 5
1.4 Système Altera NIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.5 CPU NIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.6 Instruction personnalisée du processeur NIOS II . . . . . . . . . . . . . . . . . . 7
1.7 Implantation du processeur NIOS II sur différents circuits FPGA d’Altera . . . 8
1.8 Bus Avalon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.9 Cycle de lecture . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.10 Cycle d’écriture . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.1 Conception traditionnelle et codesign . . . . . . . . . . . . . . . . . . . . . . . . 11

2.2 Quartus II 11.0 SP1 interface . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.3 Flot de conception . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.4 SOPC Builder et mapping mémoire . . . . . . . . . . . . . . . . . . . . . . . . 14
2.5 CycloneII FPGA Multimedia board . . . . . . . . . . . . . . . . . . . . . . . . 15
2.6 CycloneII FPGA Multimédia board multimédia composantes . . . . . . . . . . 16
2.7 Notre système d’acquisition, traitement et restitution vidéo . . . . . . . . . . . 17
2.8 Elément d’une image : le pixel . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.9 Superposition des trois couleurs : rouge, vert et bleu . . . . . . . . . . . . . . . 18
2.10 Principe de balayage utilisé pour la vidéo et la télévision . . . . . . . . . . . . . 19
3.1 inputs/ouputs de capteur CMOS . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3.2 registres d’instructions de capteur CMOS . . . . . . . . . . . . . . . . . . . . . . 21
3.3 configuration du camera . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.4 notre système NIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.5 vue d’ensemble de notre système NIOS . . . . . . . . . . . . . . . . . . . . . . . 23
3.6 le processeur NIOS et leurs périphériques . . . . . . . . . . . . . . . . . . . . . 24
3.7 le schéma block de notre système . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.8 Hello world . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3
Résumé
Le sujet de ce projet est la contribution au développement et à la conception d’un système

multimédia embarqué en utilisant la méthodologie de conception conjointe logicielle/matérielle
(codesign). Il en a découlé la constitution d’une bibliothèque des modules IP (Intellectual Pro-
perty) pour les applications vidéo. Dans ce contexte, une plateforme matérielle d’acquisition
et de restitution vidéo a été réalisée servant de préalable à l’évaluation de la méthodologie de
conception en codesign et à toute étude d’algorithme de traitement vidéo. On s’est intéressé en
particulier à l’étude et à l’implantation de la . La fréquence de fonctionnement de la plateforme
est de 25 MHz. L’ensemble du développement est exécuté par le processeur NIOS II sous un
application développer a l aide de NIOS IDE .
Chapitre 1
LA CONCEPTION DES SYSTÈMES

EMBARQUÉES NUMÉRIQUES
1.1 Introduction
Les avancées actuelles dans la technologie des semi-conducteurs et des méthodologies de
conception permettent le développement de systèmes numériques complexes sur puce SoPC,
des dispositifs pouvant contenir des millions de transistors. Les derniers circuits FPGA (Field
Programmable Gate Array) permettent également le développement de systèmes complets.
Ainsi, un système qui était auparavant implanté sur une carte, peut dorénavant être conçu sur
une puce unique offrant l’avantage d’être compact et de supporter un très grand nombre de
traitements arithmétiques. La tendance actuelle est donc à l’assemblage dans une même puce
de plusieurs composants éventuellement hétérogènes pour répondre au mieux aux exigences
des systèmes multimédia embarqués. Ces composants peuvent être aussi bien des coeurs de
processeurs, des coeurs de DSP, des accélérateurs matériels... La réalisation de ces systèmes
a nécessité la mise en place d’une méthodologie de conception logicielle/matérielle (codesign)
prenant en compte les contraintes de l’embarqué.
1.2 Méthodologies de Conception des systèmes numériques

1.2.1 Généralités
Dans l’approche traditionnelle, un système numérique est un assemblage sur une carte de
différents composants discrets représentant chacun une fonction particulière plus ou moins
complexe telle qu’additionneur, mémoire, composant d’interface, gestionnaire d’interruption,
processeur... Si une erreur de conception était faite, il était au minimum nécessaire d’ajouter
des fils entre les composants, ou au pire, de refaire une carte pour régler le problème, c’est-
àdire reprendre complètement son routage. Plus le système numérique est complexe, plus ces
composants sont nombreux, plus la carte est chère, et plus les perturbations électromagnétiques
sont importantes. Un besoin existait donc de pouvoir modifier la logique sans modifier les cartes
et aussi de diminuer le nombre de composants sur une carte numérique. En effet, moins il y
a de composants remplissant un même cahier des charges, moins la carte est chère, et plus
les fonctions sont intégrées, plus il est possible de proposer une carte moins encombrante. Les
améliorations des processus de fabrication des composants électroniques ont permis de répondre
de mieux en mieux à ces besoins.
Dans ce contexte, l’International Technology Roadmap for Semiconductors affirme que les
1
processeurs contiennent en moyenne près de 100 millions de transistors en 2007 et en prévoit
près de 1.5 milliard pour 2013. L’évolution des technologies de fabrication de circuits permettent
l’intégration d’un système numérique sur un même composant : c’est le concept du single chip.
Ceci est en fait lié à la loi empirique de Moore qui stipule que pour une surface de silicium
donnée, on double le nombre de transistors intégrés tous les 18 mois . La loi de Moore a
radicalement changé la façon de concevoir les systèmes numériques aujourd’hui puisque l’on
peut procéder à l’implantation d’algorithmes complexes pour les systèmes numériques de futures
générations. On travaille maintenant au niveau système (ou fonctionnalité) et non au niveau
porte logique. Cette évolution de la conception peut être résumée sur la figure
Figure 1.1 – Evolution de la conception numérique
L’approche “schématique” au niveau portes logiques et fonctions de base RTL (Register

Transfer Logic) semble aujourd’hui délaissée pour la conception des systèmes complexes au
profit d’une approche “textuelle”. L’approche schématique reste cependant toujours valable et
est plutôt réservée à la conception des petits systèmes...
L’approche textuelle, on utilise des langages de description de matériel comme VHDL (Very
high speed integrated circuit Hardware Description Language) ou Verilog pour synthétiser une
fonction numérique. Ces langages de description de matériel sont en fait des langages de pro-
grammation qui sont utilisés conjointement avec un compilateur ou un simulateur. Ces langages
deviennent un standard et leur choix participe ainsi à la pérennité du produit. Il existe à l’heure
actuelle d’excellents synthétiseurs mixtes et multi-technologiques (par exemple Precision de
Mentor Graphics). Les fabricants de FPGA proposent maintenant leur propre synthétiseur.
Dans le développement des systèmes numériques complexes, il existe des besoins qui re-
viennent fréquemment. Certaines sociétés ont développé ou rassemblé des modules répondant
à ces besoins et les mettent sur le marché sous le nom de blocs IP (Intellectual Property)
(fonctions mathématiques : FFT, DCT, FIR, interfaces bus : PCI, RapidIO, coupleurs divers :
UART, HDLC. . . ). Ces modules IP peuvent être achetés ou téléchargés librement sur Internet.
On peut ainsi voir la conception d’un système numérique complexe comme un assemblage de
modules IP
Les langages de description de matériel sont aussi intéressants pour la facilité de modification
et de réutilisation d’un design précédent pour un nouveau design : c’est le design reuse.
2
1.2.2 Réalisation d’un système sur puce SoC ou SoPC
Un SoC est un ensemble de blocs fonctionnels intégrés dans un composant électronique avec
au moins un processeur comme élément de traitement. La figure représente un SoC qui est basé
sur des coeurs de processeurs. A partir de cette figure, on constate que seuls les L’approche
Figure 1.2 – SoC basé coeurs de processeurs
SoC a été créée dans un premier temps pour le développement d’ASIC mais a été étendue pour
le développement de FPGA. On parle alors de SoPC pour System on Programmable Chip. Le
SoC peut être retenu pour les applications destinées au grand public. Il permet des meilleures
performances en termes de consommation, de vitesse et de surface. Mais, la fabrication et le
test sont des étapes longues et coûteuses . De plus, un SoC est figé et n’est donc pas réutilisable
pour une autre application. Par contre, le SoPC est un composant reconfigurable à volonté. Il
permet donc un développement et prototypage rapide du système. Mais, en contrepartie, on
peut avoir une consommation d’énergie plus grande avec une performance plus faible que celle
du SoC.
1.2.3 Les différentes familles de blocs IP

Un bloc ou un composant IP est un composant virtuel qui peut apparaı̂tre sous différentes
formes
IP Logiciel
softcore : le composant est livré sous sa forme HDL (Hardware Design Language) synthétisable,
c’est à dire flexible. Son principal avantage est sa portabilité. La propriété du fichier source est
en soi la meilleure documentation. On peut ainsi maintenir le produit pendant des années et
éventuellement modifier la source et même changer de technologie cible. L’inconvénient ma-
jeur est qu’il ne peut être prédictif en termes de superficie, puissance et temps. Le travail
d’optimisation du circuit final est à la charge de l’intégrateur du système.
IP Matériel
hardcore : Dans ce cas, le bloc IP est ciblé sur une technologie particulière et le travail d’opti-
misation est garanti. Cela englobe la netlist entière, le routage et l’optimisation pour une librai-
rie technologique spécifique, un layout personnalisé. L’inconvénient est qu’il est moins flexible
car le processus est dépendant de la technologie. Par contre il a l’avantage d’être prédictif.
3
IP Firm
firmcore : Le bloc IP firmcore offre un compromis entre le softcore et le hardcore, plus
flexible que le hardcore, plus prédictif en termes de performance et de surface que le softcore.
En général, le travail de synthèse HDL est déjà réalisé pour une technologie cible donnant lieu
à une description par netlist (format EDIF par exemple).
1.3 Les circuits à logique programmable

Actuellement, on trouve différentes familles de circuits programmables tels que les CPLDs
(Complex Logic Programmable Device) et les FPGAs. La différence entre ces deux types de
composants est structurelle. Les CPLDs sont des composants pour la plupart reprogrammables
électriquement ou à fusibles, peu chers et très rapides (fréquence de fonctionnement élevée) mais
avec une capacité fonctionnelle moindre que les FPGA. Par contre, ceux-ci sont des composants
VLSI constitués de blocs mémoires vives, entièrement reconfigurables. Ces blocs sont structurés
en LUT (Look Up Table), flip-flop, RAM et l’ensemble dispose d’un vaste système d’intercon-
nexions. Le progrès de la conception des circuits électroniques permet d’avoir des composants
toujours plus rapides et à plus haute densité d’intégration, ce qui permet de programmer des ap-
plications importantes comme par exemple les applications vidéo. À l’heure actuelle, on compte
une dizaine de fabricants, le marché étant nettement dominé par les sociétés Altera et Xilinx
1.3.1 Types d’architectures et éléments des circuits FPGA

Classiquement pour les architectures des circuits FPGA, on peut rencontrer trois topologies
différentes :
Architecture de type ı̂lots de calcul

Dès le départ, Xilinx a choisi ce type d’architecture. Cette architecture FPGA est constituée
d’une matrice plane d’éléments. Ces éléments constituent les ressources logiques et de routages
programmables du FPGA.
Architecture de type hiérarchique

Dans cette architecture, il existe plusieurs plans dans le FPGA. Mais, ces plans ne sont
pas physiques, ils correspondent aux niveaux de hiérarchie logique. C’est à dire qu’un élément
d’un niveau logique peut contenir des éléments de niveau logique inférieur, d’où la notion de
hiérarchie. Chaque niveau logique reprend la topologie d’une architecture du type ı̂lots de
calcul avec un routage dédié pour chaque niveau. Cette architecture se trouve dans les FPGAs
d’Altera.
1.3.2 Exemple de circuit FPGA : la famille Altera cyclone II

Altera a lancé au début de l’année 2004 un nouveau composant le Stratix II. Ce composant
est marqué par un certain nombre de changements par rapport aux architectures classiques
des premiers FPGA Altera (Flex et Apex) à trois niveaux de hiérarchie. Le circuit Stratix II
comme le circuit Stratix dont il a hérité de nombreuses caractéristiques, est moins hiérarchique
et n’a plus que deux niveaux de hiérarchie. Le niveau le plus haut (figure 27) consiste en un
ensemble d’éléments configurables LAB (Logic Array Bloc) qui sont répartis en matrice. A ce
4
même niveau, des mémoires de différentes densités (512 bits M512, 4 Kbits M4K et 512 Kbits
MegaRAM) sont réparties sur la matrice, ainsi que des blocs dits ”blocs DSP” apparaissant
sur la figure 28. Ces derniers intègrent des fonctions matérielles telles que multiplieurs, ac-
cumulateurs, additionneurs, multiplexeurs et registres et permettent, entre autre, de réaliser
des multiplieurs 36 bits ou des opérateurs MAC de 18 bits. Au niveau inférieur, les LABs sont
constitués de 8 ALM (Adaptive Logic Module) et d’un réseau de connexions locales. Les ALMs,
schématisés à la figure 29, sont réalisés autour d’un bloc de logique combinatoire à 8 entrées,
de deux additionneurs et des registres de sortie. Le bloc combinatoire est en fait réalisé avec
deux LUTs à quatre entrées et de quatre LUTs à trois entrées.
Figure 1.3 – Niveau supérieur de la hiérarchie de l’architecture du circuit Stratix II
1.4 Le processeur embarqué NIOS

Le processeur embarqué NIOS est un processeur à coeur logiciel de type firmcore , c’est
à dire exclusivement dédié à la famille d’Altera. Le processeur NIOS peut être associé à une
large gamme de périphériques, des instructions personnalisées et des accélérateurs pour créer
un SoPC . Le coeur logiciel de processeur embarqué NIOS est configurable et évolutif, pour
permettre aux intégrateurs systèmes de disposer d’une solution SoPC souple et très robuste. Ce
processeur peut être facilement combiné avec la logique d’utilisateur et être programmé dans
un FPGA.
5
Figure 1.4 – Système Altera NIOS
La figure décrit le système NIOS. Il est constitué du processeur NIOS, du bus Avalon et
des périphériques (contrôleur mémoire, UART, timer. . . ). Le processeur NIOS est le coeur du
système, il est connecté aux différents périphériques à travers le bus Avalon. Ce bus doit être
configuré en maı̂tre/esclave. L’interface du bus Avalon est générée automatiquement par l’outil
de génération d’Altera NIOS (SOPC Builder).
1.4.1 Processeur NIOS

Le processeur NIOS est un processeur RISC entièrement synchrone, son architecture interne
de type Harvard. Il possède au maximum 6 niveaux de pipeline 1 cadencé à 50 MHz avec une
largeur de bus de 32 bits. Ses performances sont de 30 à 80 MIPS (Million Instructions per
Second). Il est possible d’accélérer certains traitements, en ajoutant des instructions person-
nelles (décrites en VHDL) au processeur NIOS. De cette manière, il est possible de réaliser de
la surcharge d’operateurs ou simplement d’étendre les jeux d’instruction. D’après la figure 34,
on voit bien qu’on peut ajouter à l’Unité Arithmétique et Logique (UAL) du processeur NIOS
essentiellement deux types d’instruction : combinatoire (un seul cycle) ou séquentiel (multi
cycle) .
1. selon versions du NIOS II
6
Figure 1.5 – CPU NIOS
Figure 1.6 – Instruction personnalisée du processeur NIOS II
La société Altera propose trois versions pour le processeur NIOS II. La table illustre ces
trois versions. Une première version Economy qui utilise moins de surface, une deuxième version
Standard qui permet un compromis entre surface et rapidité, une dernière version Fast qui
est plus rapide que les deux autres.
NIOS II /f NIOS II /s NIOS II /e

Pipeline 6 niveaux 5 niveaux Non
Multiplication Matériel 1 Cycle 3 Cycle Par logiciel
Branch Prediction Dynamic Static Non
Cache d’Instructions Configurable Configurable Non
Cache de données Configurable Non Non
Instructions Personnalisés Supérieur à 256 Supérieur à 256 Supérieur à 256
7
Figure 1.7 – Implantation du processeur NIOS II sur différents circuits FPGA d’Altera
La figure ci-dessus représente les performances en DMIPS (Dhrystons Million Instructions

per second, unité issue du benchmark dit de Dhrystons) et la surface occupée des différentes
versions du NIOS II sur différentes familles de FPGA d’Altera (Stratix II, Stratix, Cyclone).
D’après cette figure, on constate que l’implantation du processeur NIOS II (version Fast,
Standard et Economy) sur circuit FPGA Stratix II donne de meilleures performances (225
DMIPS@205 MHz, 133 DMIPS@180 MHz et 31 DMIPS @209 MHz respectivement) et une
occupation de surface la plus faible (1319 ALUTs, 1029 ALUTs et 483 ALUTs respectivement)
par rapport à un autre FPGA.
1.4.2 Bus Avalon

Le bus Avalon peut être vu comme un ensemble de signaux prédéfinis permettant de connec-
ter un ou plusieurs IP. La figure 36 présente le bus Avalon. Ce bus comprend un décodeur
d’adresse, un multiplexeur de données, un générateur de cycles d’attente et un contrôleur d’in-
terruption. Les utilisateurs peuvent facilement intégrer leurs propres périphériques avec le reste
du système basé sur le processeur NIOS.
8
Figure 1.8 – Bus Avalon
Le bus Avalon permet la connexion entre des composants maı̂tres ou esclaves. Il supporte
plusieurs maı̂tres sur le bus. Un arbitrage est nécessaire au partage d’une même ressource
partagée par les circuits maı̂tres. Cette architecture multi maı̂tre fournit la grande flexibilité
dans la conception des systèmes.
Les figures représentent un exemple de déroulement des cycles de lecture et d’écriture (res-
pectivement) sur le bus Avalon du système.
Figure 1.9 – Cycle de lecture
(A) : Le cycle de lecture commence par un front montant de clk.

(B) : Le port maı̂tre fournit les signaux read(n) et address.
(C) : Le bus Avalon présente les données à lire readdata si le signal wait request est à “0 “.
(D) : Le port maı̂tre capture les données readdata sur le prochain front montant. Puis le
transfert se termine et un autre cycle peut recommencer.
Figure 1.10 – Cycle d’écriture
9
(A) : Le cycle d’écriture commence par un front montant de clk.
(B) : Le maı̂tre fournit les signaux address, write n et writedata.
(C) : si le signal wait request est à “0” sur le front montant de clk, alors le transfert se
termine et un autre cycle de lecture ou écriture peut recommencer.
10
Chapitre 2
CONCEPTION DU SYSTÈME
MULTIMÉDIA EMBARQUÉ
2.1 Introduction
Durant la conception d’un SoC, le concepteur aura à choisir le composant programmable
qui sera le coeur du système, la plupart des architectures sont basées sur des processeurs à
usage général. Ces processeurs sont extensibles du fait que beaucoup d’applications peuvent
y être implantées, tandis que les performances obtenues peuvent être inférieures à celles obte-
nues avec des processeurs dédiées à des applications spécifiques. Mais l’approche de conception
mixte logicielle/matérielle permet à l’application d’atteindre des performances inaccessibles aux
approches de conception classiques. Les réalisations logicielles sont préférées pour des raisons
d’évolution et de coût. Par contre, les réalisations matérielles sont dédiées aux fonctionnalités
nécessitant des circuits spécialisés ou des performances élevées.
Figure 2.1 – Conception traditionnelle et codesign
Le codesign implique donc une conception en même temps du matériel et du logiciel. La

figure 41 illustre la différence entre la méthodologie de conception traditionnelle et le code-
sign. En fait, dans la conception traditionnelle, la définition de l’architecture est suivie par le
découpage des tâches qui vont être réalisées par les équipes du matériel et du logiciel. L’équipe
du matériel réalise une description du système en utilisant un langage de description matériel
tel que le VHDL ou le Verilog. Puis elle réalise la synthèse et la génération des circuits intégrés
en utilisant des outils de CAO. L’équipe du logiciel est responsable de l’écriture du code qui
11
va être compilé et exécuté sur des processeurs d’usage général. Ensuite, les équipes réalisent
l’intégration physique des deux parties.
Mais, on constate que le manque d’interaction entre ces deux équipes pendant les étapes de
développement peut générer plusieurs problèmes d’intégration. Dans , il est rapporté que 71.5%
des projets système embarqué n’atteignent pas 30 % des performances attendues durant la
phase de conception.
Ces problèmes peuvent être évités par l’utilisation d’une méthodologie de conception conjointe
logicielle/matérielle. En effet, les équipes du logiciel et du matériel travaillent ensemble et
à chaque étape de conception, elles réalisent l’intégration et le test des spécifications. Les
opérations de test et d’intégration génèrent une augmentation du temps de conception. L’intégration
finale lors du prototypage est réalisée sans difficulté. On constate que la méthodologie de concep-
tion conjointe réduit le temps total de conception puisqu’elle réduit le nombre de retours à des
étapes antérieures de conception provoqués par la détection d’erreur.
2.2 Plateforme matérielle de traitement vidéo

2.2.1 Introduction
Cette partie est consacré à l’étude et à la conception d’une plateforme matérielle d’acqui-
sition, de traitement et de restitution vidéo servant de préalable à toute étude d’algorithme
de traitement vidéo. La plateforme matérielle s’articule autour de la carte Cyclone II d’Al-
tera complétée d’une interface caméra et d’une interface LCD 2”2. Le coeur du système met
en oeuvre le module IP NIOS II d’Altera dans l’environnement de développement Quartus II
d’Altera. Les modules IPs d’acquisition, restitution vidéo ainsi que des modules IPs de base
nécessaires (module PIO, I2C) ont été développés. des application en C ont été utilisé pour le
contrôle logiciel de la plateforme matérielle. Enfin, l’ensemble des blocs IPs a servi à constituer
une bibliothèque.
2.2.2 Conception d’un système SoPC

Quartus II est un logiciel proposé par la société Altera permettant la gestion complète d’un
flot de conception FPGA. La figure présente l’interface graphique de Quartus II.
12
Figure 2.2 – Quartus II 11.0 SP1 interface
Ce logiciel permet de faire une saisie graphique ou une description VHDL/Verilog d’archi-
tecture numérique, d’en réaliser une simulation en utilisant le simulateur ModelSim de Mentor
Graphics, une synthèse et une implantation sur FPGA. Il comprend une suite de fonctions de
conception au niveau système permettant d’accéder à la large bibliothèque d’IPs d’Altera et
un moteur de placement/routage intégrant la technologie d’optimisation et des solutions de
vérification. D’une manière générale, un flot de conception ayant pour but la configuration de
composants programmables se déroulent de la manière suivante
Figure 2.3 – Flot de conception
13
L’IDE (Integrated Design Entry) Quartus II intègre l’outil SOPC Builder qui permet de
construire un système SoPC intégrant divers périphériques d’E/S tels que le processeur NIOS
II, les contrôleurs de SRAM et de SDRAM, un contrôleur DMA (Direct Memory Access). . . De
même, on peut intégrer son propre composant dans le design sous forme d’un bloc IP externe
(Interface caméra, LCD ,VGA. . . ). On peut ainsi intégrer autant de périphériques que l’on
veut, n’étant limité que par le nombre de broches et de cellules logiques du circuit FPGA. Le
mapping mémoire et le niveau des interruptions du design sont fixés durant cette phase. La
figure montre la mise en oeuvre de l’outil SOPC Builder. C’est en fait la première passerelle
avec le logiciel embarqué.
Figure 2.4 – SOPC Builder et mapping mémoire
A l’issue de la phase de construction du système SoPC, Quartus II génère le projet en

intégrant tous les modules IPs. Après synthèse, on a le fichier de programmation du circuit
FPGA correspondant au design SoPC mais aussi un kit de développement logiciel qui comprend
tous les fichiers en langage C (.h et .c) pour piloter les périphériques d’E/S d’Altera. C’est
en fait la deuxième passerelle avec le logiciel embarqué. L’offre de codesign apparaı̂t ici avec la
possibilité de développer une partie de l’application par matériel ou de le faire en logiciel par
langage C.
14
2.3 Platforme de développement : CycloneII FPGA Mul-
timedia board
Plate-forme Cyclone II multimédia est un outil pour tout ce qu’il couches : Débutant, pré-
intermédiaire et avancé. Ses modules complémentaires fournissent la conjonction de l’école et
les concepteurs de l’entreprise. L’utilisateur peut mettre en œuvre VLSI (Very Large Scale
Intégration) ... avec DHL, la conception de circuit logique numérique et de réaliser davantage
l’ les médias numériques et le processeur d’image
Figure 2.5 – CycloneII FPGA Multimedia board
2.3.1 Caractéristique générale

1. high porte comptage EP2C35 FBGA 672 Cyclone II FPGA puce
- 90 processus de nm, est une puce de la force de FPGA Altera
- Fournir 70 dix mille le nombre de portes. (Tout Xilinx FPGA 140 dix mille espace de
niveau)
- circuit de distribution d’horloge fourni, jusqu’à la performance de la conception du
système, de réduire Clock Skew
- Provid DSP Block, jusqu’à exécution de l’opération
2. Quatre séries 384K byte Frame Buffer mémoire
- Il peut données d’image provisoires à 2,0 Panel ”LCD ou VGA
3. Deux séries 1M octets de SRAM Meomory
- Il peut stocker l’image du capteur image CMOS capture
4. Un ensemble LPTS 2,0 pouces haute de pixels du panneau LCD
- haute résolution (dot) : 320 (W) x240 (H)
5. Capteur d’image CMOS
- 30ten milliers de pixels à la capture d’iamge actif / statique (fonction de mise au point)
6. Deux séries de ports de sortie PS2
- Contrôle du clavier et de la souris
15
7. Deux ensembles de ports de sortie audio
- design audio numérique
8. A 24 bits mis DAC vidéo, support 80MSPS opération, avec un port de sortie
VGA
9. Six séries 7 LEDs segment
- chronomètre, compteur de la fin, compteur, alarme
10. 24 ensembles d’auto-définition LED
- Mettre en œuvre le ticker LED
11. 16 séries de boutons-poussoirs auto-définition
12. séries de commutateurs DIP
13. 8 paires de cristaux pour les utilisateurs : mettre en œuvre la conception du
système de l’horloge multiple avec la variété de users’demands
14. PLL (Phase Lock Loop) sortie d’horloge
- concevoir l’horloge de sortie du système avec le logiciel “Quartus II”
15. Fournir mode USB ByteBlaster JTAG et AS (Active Serial)
Figure 2.6 – CycloneII FPGA Multimédia board multimédia composantes
16
2.4 Système d’acquisition et de traitement vidéo
Nous avons conçu et réalisé une plateforme matérielle d’acquisition de traitement et de
restitution vidéo servant à l’évaluation de notre méthodologie de conception logicielle/matérielle
pour les systèmes multimédia embarqués . La figure représente notre plateforme.
Figure 2.7 – Notre système d’acquisition, traitement et restitution vidéo
2.5 Principe de base de traitement d’image

2.5.1 Définition d’une image et des types d’images
Une image est stockée en mémoire sous forme de collection de points élémentaires appelés
pixels. Nous pouvons considérer une image numérique comme une page de nombres organisés
en tableau ou en matrice. Chaque nombre représente les caractéristiques du pixel. La position
de chaque pixel peut être exprimée par deux coordonnées sur l’axe horizontal X et l’axe vertical
Y comme le montre la figure ci-dessous.
Figure 2.8 – Elément d’une image : le pixel
Le codage d’un pixel dépend du type d’image et nous en recensons trois types :
1. Les images à deux niveaux : une image en noir et blanc est l’exemple le plus courant.
Toute image décrite avec deux valeurs correspond à ce type. Un bit suffira pour coder la
valeur d’un pixel.
2. Les images à plusieurs niveaux de gris : les images de nos téléviseurs en noir et blanc
sont de ce type. La plupart des systèmes définissent 256 niveaux de gris. Mais, seuls 128
niveaux de gris sont détectables par l’oeil.
17
3. Les images couleurs : la couleur peut être codée, soit par composition de couleurs pri-
maires, soit par composition d’informations de luminance et de chrominance. En fait, une
couleur peut être représentée par un ensemble de trois coordonnées, c’est-àdire qu’une cou-
leur peut être reproduite par la superposition de trois couleurs primaires comme montre
la figure 4. Le système RVB (Rouge-Vert-Bleu ou ≪ RGB ≫) utilise les couleurs primaires :
rouge, vert et bleu. La valeur du pixel doit représenter les composantes trichromatiques
de la couleur. En général, nous disposons de huit bits pour coder une composante, soit 24
bits pour coder la valeur d’un pixel. Ce système RVB peut donc définir plus de 16 millions
de couleurs. Des résultats expérimentaux ont prouvé que l’oeil est beaucoup plus sensible
aux variations fines d’intensité lumineuse (luminance) qu’à celles de la couleur (chromi-
nance). Il en résulte que nous pouvons nous contenter de transmettre l’information de
couleur avec moins de détails que l’information de luminance.
Figure 2.9 – Superposition des trois couleurs : rouge, vert et bleu
2.5.2 Changement d’espace de couleur

Toute longueur d’onde visible peut être visuellement simulée en convoluant le signal avec les
fonctions de sensibilité des trois différents capteurs rétiniens du système visuel humain dit LMS
(Large=565nm dit rouge, Medium=535nm dit vert, Short=430nm dit bleu). Dans le cas d’une
compression avec perte, la reconstruction de chaque bande (RVB) risque de ne pas appréhender
les structures de l’image de la même façon, engendrant différentes erreurs de reconstruction et
par la même, de fausses couleurs visuellement choquantes. On préféra donc un espace de lumi-
nance et chrominance rouge et bleu YCrCb (ou YUV) où les primaires sont décorrélées, ce qui
offre l’avantage de séparer les informations d’intensité lumineuse et de couleur. Un tel espace
permet de gérer les premières avec plus de soin. A titre d’exemple, voici la matrice de passage
de l’espace RVB à l’espace YUV :
2.5.3 Définition de la vidéo

La vidéo est une succession d’images animées. Le principe fondamental de la vidéo est que
l’oeil humain a la possibilité de retenir pendant un certain temps (de l’ordre du dixième de
seconde) toute image imprimée sur la rétine. Il suffit donc de faire défiler un nombre suffisant
18
d’images par seconde, pour que l’oeil ne se rende pas compte qu’il s’agit d’images distinctes. Il
existe deux grandes familles de systèmes vidéo : les systèmes vidéo analogiques et les systèmes
vidéo numériques.
La vidéo analogique
La caméra balaye l’image bidimensionnelle qu’elle a devant elle par un faisceau d’électrons
qui se déplace très rapidement de gauche à droite et plus lentement de haut en bas et produit
une tension en fonction du temps. Elle enregistre ainsi l’intensité lumineuse, et à la fin du
balayage, on a alors une trame. Le faisceau revient à l’origine pour recommencer. Le récepteur
va recevoir cette intensité en fonction du temps, et pour reconstruire l’image, va répéter le
processus de balayage.
Les paramètres précis de ce balayage varient d’un pays à l’autre mais deux grandes familles
existent :
En Europe (système PAL/SECAM, pour Phase Alternating Line / SEquentiel Couleur Avec
Mémoire) ce système utilise 625 lignes (seulement 576 sont affichées), un rapport vertical/ho-
rizontal de 4/3 et un débit de 25 images par seconde.
En Amérique et au Japon (système NTSC, pour National Television Standards Committee),
on a seulement 525 lignes (483 affichées) et un débit de 30 images par seconde
Figure 2.10 – Principe de balayage utilisé pour la vidéo et la télévision
La vidéo numérique
La vidéo numérique est tout simplement une suite d’images formées d’une matrice de pixels.
Pour obtenir des images en couleur, il faut utiliser au moins 8 bits par pixel, ce qui correspond
à 256 couleurs. En fait, avec 8 bits par pixel, on obtient de la vidéo numérique noir et blanc
de haute qualité. Pour la vidéo numérique couleur, on utilise 8 bits pour chaque couleur RVB,
soit donc 24 bits par pixel, ce qui correspond à environ 16,8 millions de couleurs. Le principe
de balayage utilisé est similaire à celui de la vidéo analogique.
19
Chapitre 3
RÉALISATION DU SYSTÈME
Pour réalisé notre système multimédia embarquée on se basons sur les fichiers HDL fournit
par le constructeur de notre carte cible .
Ces fichier HDL sont écrit en Verilog est ont décrit les deux interface de capteurs CMOS
pour l’utilisé comme un slave de I2C : CMOS2BUFFER.v , et CMOSI2C.v et un troisième fichier
de contrôler l affichage de l’LCD DispCntl.v .
3.1 Configuration de capteur CMOS

Le capteur CMOS est camera de mille pixels 640x480 , qui peut effectuer 644x484 au format
de données brutes peut être manuelle ciblée.
Figure 3.1 – inputs/ouputs de capteur CMOS
afin d’avoir démarrer le capteur camera il faut le configuré pour obtenir la sortie désiré .
le processeur de camera contienne un jeu d’instruction qui assure la configuration de ce
dernier :
20
Figure 3.2 – registres d’instructions de capteur CMOS
Alors in faut toujours inclue dans notre système une ROM de 16x32 pour assurer notre
configuration d’image et de communication I2C ,pour cela on utilise MegaFunctionCore pour
fournir la ROM et un fichier .mif pour l’inutilisé
La caméra sera chargée bien entendu de capturer un flux d’image et devra être configurée
pour fournir les données sur 8 bits sous le format RGB qui est le plus facile à gérer.
Figure 3.3 – configuration du camera
21
3.2 Notre Système
pou mieux optimisé notre système on a choisit cette architecture dans la quelle le processeur
NIOS II communique avec la camera (SDRAM) et l’LCD par l’intermédiaire des IP de PIO :
parllele input output
Figure 3.4 – notre système NIOS
les information image sont enregistré dans les SRAM de 1Mo par les les entités de CMOS
et le sortie de notre système fournie l’image traité a l’interface de l’LCD
22
Figure 3.5 – vue d’ensemble de notre système NIOS
3.3 création de système sur quartus II et SoPC builder

afin de satisfait notre vision on utilisons SoPC builder pour crée le processeur NIOS et leurs
périphériques :
23
Figure 3.6 – le processeur NIOS et leurs périphériques
Après avoir généré les IP on s’intéresse a établir la connexion entre les différentes compo-
santes du système et les association des PIN avec les PIN réel de la pus cyclne II on utilisons
le guide de la carte , et en plus des PIN de capteur CMOS et l’LCD on utilise aussi le PIN N26
pour la clock de système et U24 pour la reset globale.
Figure 3.7 – le schéma block de notre système
3.4 Le premier test : Hello World !

après avoir téléchargé le fichier .sof généré par la compilation de notre système , on passe
a NIOS IDE pour commencé à programmer le NIOS II .
24
pour notre premier test on va seulement affiché “Hello world ! “ dans le consol NIOS , pour
sela on créé un nouveau BSP projet dans NIOS IDE avec le fichier de configuration de notre
SoPC .
Deux projet sont crée le premier sé’est le projet qu’on va modifier le deuxième est le projet
contienne les fichier de drivers des différent composantes du SoPC ( PIO , RAM , JTAG ...)
1 #include <stdio.h>
2
3 int main()
4 {
5 while(1)
6 printf("Hello from ENSAK !\n");
7
9 return 0;
10 }
11
12 }
Figure 3.8 – Hello world
dans le cadre de debuggé ce programme on rencontre plusieurs problème :

1. le NIOS fast est nécessite un licence pour l’utiliser un message d’erreur s’affiche si on essai
de l’implémenté sur la carte ,alors on se limite par NIOS/e
2. la mémoire ram de 40K peut être saturé par des grand code , et les deux SDRAM dans
la carte est déjà utilisé comme un buffer de camera
25
3.5 Programme de traitement d’image
3.5.1 L’algorithme
Seul un type de traitement a été étudié et appliqué sur l’image fournie par la caméra.
Ce traitement consiste simplement à faire un seuillage sur une des 3 composantes d’un
pixel. Pour ce faire, l’idée est la suivante : on regarde si la somme des 3 composantes est
inférieure à 3 fois la composante que l’on veut garder. Si c’est le cas, on place la valeur
de 255 sur la composante que l’on veut faire ressortir et on met à 0 les autres.
Exemple : On souhaite faire ressortir le bleu dans l’image.
Si :
3.B > R + G + B
alorsB = 255; R = G = 0
Sinon on ne touche pas aux composantes du pixel.
3.5.2 les fonctions de altera avalon pio regs.h

le fichier altera avalon pio regs.h contienne le fonction de manipulation du PIO soit
écrire dans un PIO ou lire d’apré un autre
IOWR ALTERA AVALON PIO DATA(x,BASE) cette fonction faire l’écriture de x sur le PIO de
l’dresse de base de BASE .
IORD ALTERA AVALON PIO DATA(BASE) cette fonction faire lire de PIO de l’dresse de base
de BASE .
3.6 L’implémentation du programme

cette algorithme simple , fait un bon choix pour mieux comprendre les outils de program-
mation de NIOS sans effort plus sur la complexité de l’algorithme .
1 /*
2 * FORCAGEb.c
3 *
4 * Created on: 17 juin 2013
5 * Author: yAcine
6 */
7 #include <stdio.h>
8 #include"system.h"
9 #include "altera avalon pio regs.h"
10
11 #define WRITE(x) (IOWR ALTERA AVALON PIO DATA(x,CAMERA BASE))

12 #define READ (IORD ALTERA AVALON PIO DATA(LCD BASE))
13
14 int main()
15 {
16 //RGB 8 bit
17 unsigned char Color;
18 unsigned char R;
19 unsigned char G;
20 unsigned char B;
26
21 //printf("Hello from Nios II!\n");
22 while(1)
23 {
24 if(READ=0x0)
25 WRITE(0xFFFF);
26 else
27 {
28 R=READ;
29 delay ms(D);
30 G=READ;
31 delay ms(D);
32 B=READ;
33 delay ms(D);
34 }
35
36 if(3*B>R+G+B)
37 {
38 R=0; //0x0000
39 G=0; //0x0000
40 B=255; //0xFFFF
41 }
42
43 WRITE(R);
44 delay ms(D);
45 WRITE(G);
46 delay ms(D);
47 WRITE(B);
48 delay ms(D);
49
50
51 }
52 return 0;
53 }
27
Conclusion
Au cours de cette étude, on a présenté le développement d’une plateforme matérielle d’ac-

quisition et de restitution vidéo en Temps Réel en utilisant la conception mixte logicielle
matérielle. Cette plateforme se base sur la carte de développement Cyclone II d’Altera qui est
connectée à la carte d’interface caméra et à celle de l’interface LCD. Le cœur du système est le
processeur embarqué NIOS II d’Altera. Les modules IPs d’acquisition et de restitution vidéo
ont été développés afin d’interfacer les deux modules externes avec la carte de développement.
On a pu voir en outre que la mise en oeuvre d’un application avec NIOS IDE sur le pro-
cesseur NIOS II pour assuré le traitemet d’image mais cette application reste insuffisant pour
des application avancé en terme de complexité et en terme d’ordonnancement . Alors il est
important d’implémenter un système d’exploitation comme uClunix ,RT Linux,RTOS ou RTEMS
28

Conception Et Implementation Du Systeme

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Conception Et Implementation Du Systeme

Transféré par

Droits d'auteur :

Formats disponibles

CONCEPTION ET IMPLÉMENTATION DU

SYSTÈME MULTIMÉDIA EMBARQUÉ

ECOLE NATIONALE DES SCIENCES APPLIQUEED DE KHOURIBGA

Siham Darif Rabiaa Manar Sliman Ennayri Omar Barmaki

1 LA CONCEPTION DES SYSTÈMES EMBARQUÉES NUMÉRIQUES 1

2 CONCEPTION DU SYSTÈME MULTIMÉDIA EMBARQUÉ 11

1.1 Evolution de la conception numérique . . . . . . . . . . . . . . . . . . . . . . . . 2

2.1 Conception traditionnelle et codesign . . . . . . . . . . . . . . . . . . . . . . . . 11

3.1 inputs/ouputs de capteur CMOS . . . . . . . . . . . . . . . . . . . . . . . . . . 20

Le sujet de ce projet est la contribution au développement et à la conception d’un système

LA CONCEPTION DES SYSTÈMES

1.2 Méthodologies de Conception des systèmes numériques

Figure 1.1 – Evolution de la conception numérique

L’approche “schématique” au niveau portes logiques et fonctions de base RTL (Register

Figure 1.2 – SoC basé coeurs de processeurs

1.2.3 Les différentes familles de blocs IP

1.3 Les circuits à logique programmable

1.3.1 Types d’architectures et éléments des circuits FPGA

Architecture de type ı̂lots de calcul

Architecture de type hiérarchique

1.3.2 Exemple de circuit FPGA : la famille Altera cyclone II

Figure 1.3 – Niveau supérieur de la hiérarchie de l’architecture du circuit Stratix II

1.4 Le processeur embarqué NIOS

1.4.1 Processeur NIOS

Figure 1.6 – Instruction personnalisée du processeur NIOS II

NIOS II /f NIOS II /s NIOS II /e

La figure ci-dessus représente les performances en DMIPS (Dhrystons Million Instructions

1.4.2 Bus Avalon

Figure 1.9 – Cycle de lecture

(A) : Le cycle de lecture commence par un front montant de clk.

Figure 1.10 – Cycle d’écriture

Figure 2.1 – Conception traditionnelle et codesign

Le codesign implique donc une conception en même temps du matériel et du logiciel. La

2.2 Plateforme matérielle de traitement vidéo

2.2.2 Conception d’un système SoPC

Figure 2.3 – Flot de conception

Figure 2.4 – SOPC Builder et mapping mémoire

A l’issue de la phase de construction du système SoPC, Quartus II génère le projet en

Figure 2.5 – CycloneII FPGA Multimedia board

2.3.1 Caractéristique générale

Figure 2.6 – CycloneII FPGA Multimédia board multimédia composantes

Figure 2.7 – Notre système d’acquisition, traitement et restitution vidéo

2.5 Principe de base de traitement d’image

Figure 2.8 – Elément d’une image : le pixel

Figure 2.9 – Superposition des trois couleurs : rouge, vert et bleu

2.5.2 Changement d’espace de couleur

2.5.3 Définition de la vidéo

Figure 2.10 – Principe de balayage utilisé pour la vidéo et la télévision

3.1 Configuration de capteur CMOS

Figure 3.1 – inputs/ouputs de capteur CMOS

Figure 3.3 – configuration du camera

Figure 3.4 – notre système NIOS

3.3 création de système sur quartus II et SoPC builder

Figure 3.7 – le schéma block de notre système

3.4 Le premier test : Hello World !

Figure 3.8 – Hello world

dans le cadre de debuggé ce programme on rencontre plusieurs problème :

3.5.2 les fonctions de altera avalon pio regs.h

3.6 L’implémentation du programme

11 #define WRITE(x) (IOWR ALTERA AVALON PIO DATA(x,CAMERA BASE))

Au cours de cette étude, on a présenté le développement d’une plateforme matérielle d’ac-

Vous aimerez peut-être aussi