Vous êtes sur la page 1sur 12

Université Mohammed-V de Rabat

École Nationale supérieure d’Arts et


Métiers de Rabat

Département génie électrique

Rapport de mini projet


Sous le thème

Suivi de rééducation des membres inférieurs

Réalisé par : Encadre par :

Nouhaila aithssain

CHAPITRE
1 Traitement d’image :

1.1 Définition

Le traitement d'image est une discipline passionnante qui s'attache à améliorer,


analyser ou modifier des images numériques. Comparable à la manière dont nous
ajustons nos propres photos pour les rendre plus attrayantes, le traitement d'image
utilise des algorithmes et des techniques pour effectuer ces transformations de
manière automatique ou semi-automatique.

C'est un domaine vaste et multidisciplinaire, englobant des aspects de l'informatique,


des mathématiques, de la physique et de la perception visuelle. Du filtrage et de la
restauration d'images à la reconnaissance d'objets et à la réalité augmentée, le
traitement d'image trouve des applications dans de nombreux domaines, de la
médecine à l'industrie du divertissement.

1.2 Utilisation du Traitement d’image :

Médecine : L'imagerie médicale, telle que la tomodensitométrie (TDM) et l'imagerie


par résonance magnétique (IRM), utilise le traitement d'image pour diagnostiquer des
conditions médicales en analysant des images du corps humain.

Sécurité : Les systèmes de vidéosurveillance utilisent le traitement d'image pour


détecter des comportements suspects, identifier des visages et analyser des schémas
de mouvement.

Industrie : Dans la fabrication, le contrôle de qualité repose souvent sur l'analyse


d'images pour détecter les défauts ou vérifier la conformité des produits.

Divertissement : Les effets spéciaux dans le cinéma, les jeux vidéo et la réalité
virtuelle dépendent du traitement d'image pour créer des mondes visuellement
captivants et réalistes.

Automobile : Les véhicules autonomes utilisent des caméras et des capteurs pour
percevoir leur environnement, avec des algorithmes de traitement d'image pour
interpréter et réagir aux informations visuelles.
2 Traitement de vidéo :

2.1 Introduction :

Le traitement des vidéos, un domaine crucial et diversifié, englobe un ensemble


d'opérations visant à manipuler, améliorer et analyser des séquences visuelles. Dès
l'acquisition initiale de la vidéo à travers des caméras ou d'autres sources, le
prétraitement intervient pour améliorer la qualité brute en ajustant des paramètres tels
que la couleur et le bruit. Le traitement d'image intervient ensuite, appliquant des
techniques pour optimiser la netteté et le contraste de chaque image. La compression
vidéo permet de réduire la taille des fichiers tout en maintenant la qualité. L'analyse
de mouvement, la reconnaissance faciale et le suivi d'objet ajoutent des dimensions de
compréhension et de suivi du contenu vidéo. L'édition vidéo permet de créer des
histoires cohérentes, tandis que les effets spéciaux et la post-production ajoutent des
éléments visuels et sonores pour finaliser la production. Ce domaine en constante
évolution offre des applications diverses, de la création artistique à la surveillance de
la sécurité, façonnant ainsi notre expérience quotidienne des médias visuels.

2.2 Utilisation du Traitement Vidéo :

Divertissement et Médias : Le traitement vidéo est au cœur de l'industrie du


divertissement, offrant des effets spéciaux, des montages sophistiqués et des
expériences immersives dans le cinéma, la télévision et les plateformes de streaming.

Communication en Ligne : Des applications de visioconférence aux réseaux


sociaux, le traitement vidéo facilite la communication visuelle en temps réel,
renforçant les interactions personnelles et professionnelles.

Vidéosurveillance : Utilisé pour la sécurité et la surveillance, le traitement vidéo


alimente les systèmes de vidéosurveillance, permettant la détection d'intrusions, la
reconnaissance faciale et la gestion des foules.

Éducation en Ligne : Dans l'éducation, le traitement vidéo facilite la création de


contenus pédagogiques interactifs, améliorant l'apprentissage à distance et la
compréhension des concepts complexes.
2.3 Médecine et Recherche :

Imagerie Médicale : En médecine, le traitement vidéo joue un rôle crucial dans


l'imagerie médicale, permettant la visualisation et l'analyse détaillée d'organes et de
tissus.

Recherche Scientifique : Les chercheurs utilisent le traitement vidéo pour analyser des
données complexes, que ce soit dans le domaine de la biologie, de la physique ou de
la psychologie.

2.4 Avantages du Traitement Vidéo :

Amélioration de la Qualité Visuelle : Le traitement vidéo permet d'optimiser la


qualité visuelle des séquences, en corrigeant les défauts, en ajustant les couleurs et en
réduisant le bruit, offrant ainsi des expériences visuelles plus agréables.

Compression Efficace : Les algorithmes de compression vidéo facilitent le stockage,


le partage et la diffusion de vidéos en réduisant leur taille sans compromettre de
manière significative leur qualité, améliorant ainsi l'efficacité de la gestion des
fichiers vidéo.

Créativité et Effets Spéciaux : Le traitement vidéo permet la création d'effets


spéciaux, de transitions fluides et d'autres éléments créatifs, enrichissant ainsi la
production cinématographique, les vidéos amateurs et les contenus en ligne.

Analyse et Extraction d'Informations : Dans des domaines tels que la


vidéosurveillance, le traitement vidéo facilite l'analyse automatisée, l'extraction
d'informations et la détection d'événements spécifiques, renforçant ainsi les
applications de sécurité et de surveillance.

Communication Visuelle Améliorée : Des visioconférences professionnelles aux


appels vidéo personnels, le traitement vidéo renforce la communication en ligne en
offrant une expérience visuelle en temps réel, renforçant les interactions à distance .

3 La marche :

3.1 Définition de la marche :


La marche humaine, de manière concise, est le mode de déplacement caractéristique des êtres
humains, impliquant une séquence régulière et coordonnée de mouvements bipèdes des
membres inférieurs. Elle est marquée par une alternance rythmique de levée, roulement et
mise en contact des pieds avec le sol, avec la participation coordonnée des bras. Ce processus
automatique et quasi-inconscient démontre une capacité d'équilibre dynamique, contribuant à
la bipédie distinctive des humains.

3.2 Cycle de la marche :


La marche humaine peut être divisée en deux grandes phases principales : la phase d'appui et
la phase oscillante.

1. Phase d’appui : est le temps écoulé entre le premier contact et le dernier contact
appuis consécutifs sur le même pied. Il est également présenté comme un pourcentage
du cycle de marche du même pied (60 %) :
 Contact Initial (Initial Contact) : La phase de soutien commence lorsque le
talon d'un pied touche le sol pour la première fois, marquant le début du cycle de
marche. C'est également appelé "contact initial".
 Phase de Soutien Initial (Loading Response) : Pendant cette phase, le poids du
corps est transféré sur le pied en contact avec le sol. Le genou fléchit légèrement
pour absorber le choc initial.
 Phase Médiane de Soutien (Midstance) : Le poids du corps est directement au
dessus du pied en contact avec le sol. Le genou est généralement étendu à ce
stade.
Phase de Propulsion (Terminal Stance) : Le poids du corps se déplace vers
l’avant, et le pied arrière assure la poussée finale avant de quitter le sol.

2. Phase oscillante : La phase oscillante est le temps écoulé entre le dernier contact
de l’appui gauche et du prochain contact du pied gauche. Il est également présenté
comme un pourcentage du cycle de marche du même pied (40 %) :
 Détachement du Pied (Pre-Swing) : Le talon du pied arrière se soulève du sol,
marquant le début de la phase oscillante.
 Phase Oscillante Initial (Initial Swing) : Le pied se déplace vers l'avant, passant
au-dessus du sol.
 Phase Médiane de l'Oscillation (Midswing) : Le pied continue de se déplacer
vers l'avant.
 Phase Finale de l'Oscillation (Terminal Swing) : Le pied atteint son point le
plus avant et s'apprête à effectuer à nouveau le contact initial avec le sol.
Figure 1 : Cycle de marche

3.3 Les angles de la marche :

La phase d’appui :

La réception (0-15%) :

-le talon attaque le sol

-l’angle d’attaque de la jambe est de 25° avec la verticale

-La hanche en légère flexion réalise une rotation externe de 25° à 30°

-le genou réalise une flexion de 10° à 20°

-la cheville passe de 5°FD à 10°FP

La phase intermédiaire (15-40%) :

-le pied entre en plein contact avec le sol

-la hanche passe de 30° de flexion à 0°

-la flexion du genou passe de 20° à 5°


-la cheville réalise une flexion dorsale et passe de 10° de FP à 20° FD

La phase de fin d’appui (40-50%)

-le talon se décolle du sol

-la hanche réalise une rotation de 0° à 15°

-le genou passe de 5° à 30°

-la cheville revient neutre, elle passe de 20° FD à 0°

La phase de fin d’appui (50-60%)

-Décollement des orteils du 5e vers le 1 er

-la cheville passe en flexion plantaire de 0° à 5° FP

La phase oscillante :

Avancée du membre oscillant (60-75%) :

-La hanche passe de 15° à 30° de flexion

-le genou augmente sa flexion, il passe de 30° à 60°

-le cheville revient en position neutre, elle passe de 5°FP à 0°

Avancée du membre oscillant (75-100%) :

-la hanche passe de 30° à 25° de flexion

-la cheville passe de 0° à 5° FD

Figure 2 : Les angles de chevi


4 Le Deep Learning définition et fonctionnement :

4.1 Définition

Deep Learning ou apprentissage automatique. À la différence des approches de


programmation traditionnelles, le Deep Learning confère à la machine la capacité
d'acquérir des connaissances de manière autonome, évoluant au-delà de l'exécution
stricte de règles prédéterminées. L'essence même du Deep Learning réside dans sa
capacité à traiter des volumes massifs de données. Cette méthode vise à améliorer les
performances d'un algorithme en permettant à la machine d'assimiler des modèles
complexes et abstraits à partir de ces données. Contrairement aux approches
conventionnelles, où les règles sont explicitement spécifiées, le Deep Learning
autorise la machine à extraire des motifs et des caractéristiques de manière autonome,
offrant ainsi une flexibilité et une adaptabilité considérables.

4.2 Fonctionnement de Deep Learning


4.2.1 Principe fondamental du Deep Learning
Le principe fondamental du Deep Learning repose sur la capacité du système à s'auto-
entraîner pour reconnaître des motifs spécifiques, qu'ils soient visuels, audio, textuels,
ou d'autres natures. Au cœur de ce processus, l'objectif est de permettre au système
d'acquérir une compréhension autonome d'un certain type d'élément. Pour illustrer ce
processus, prenons l'exemple de la reconnaissance visuelle d'un dauphin. Initialement,
le système est exposé à une vaste collection d'images de dauphins prises sous
différents angles, conditions d'éclairage, et contextes. Cette diversité vise à fournir au
système une variété de caractéristiques visuelles associées à un dauphin, lui
permettant de généraliser sa compréhension. Au cours de l'entraînement, le système
ajuste ses paramètres internes de manière itérative pour maximiser sa capacité à
discerner les traits distinctifs d'un dauphin dans une image. Si le système parvient à
identifier correctement un dauphin, il intègre cette information dans ses calculs futurs.
En d'autres termes, chaque succès dans la reconnaissance d'un dauphin améliore la
performance globale de l'algorithme. Ce processus itératif d'ajustement continu des
paramètres internes du modèle conduit à une amélioration progressive de sa capacité à
identifier des dauphins dans des images. Ainsi, plus le système est exposé à des
données variées et plus il réussit à généraliser ces connaissances, plus il devient
performant au fil du temps.

4.2.2 Fonctionnement technogique de Deep Learning


Deep Learning repose sur l'utilisation d'un réseau de neurones artificiels, conçu pour
émuler le fonctionnement du cerveau humain. Ce réseau est organisé en plusieurs
couches, formant une structure interconnectée où chaque couche joue un rôle
spécifique dans le traitement de l'information. La première couche du réseau
correspond aux neurones d'entrée, où les données initiales sont introduites. La
dernière couche, quant à elle, transmet les résultats de sortie ou les conclusions
obtenues après le traitement de l'information. Entre ces deux extrémités, plusieurs
couches intermédiaires, également appelées couches cachées, sont positionnées. Ces
couches intermédiaires sont cruciales pour la capacité du Deep Learning à analyser de
manière progressive et de plus en plus précise les données d'entrée. L'architecture en
couches multiples est caractéristique du Deep Learning, permettant à chaque strate du
réseau de neurones d'effectuer une transformation spécifique des données. Cette
disposition hiérarchique facilite la capture de caractéristiques complexes et abstraites
à partir des informations brutes. Plus le réseau de neurones est profond, c'est-à-dire
plus il comporte de couches, plus il est en mesure d'accomplir des tâches complexes
en termes de reconnaissance, de classification, ou d'autres opérations liées à
l'intelligence artificielle. Lorsque le réseau de neurones artificiels est exposé à des
données, que ce soit des images, du texte, ou d'autres types d'informations, il apprend
à représenter ces données de manière interne. À chaque itération d'apprentissage, les
connexions entre les neurones s'ajustent et se modifient, formant ainsi des
représentations de plus en plus sophistiquées. C'est cette capacité à s'auto-ajuster qui
confère au Deep Learning son caractère d'apprentissage profond. L'une des
particularités marquantes du Deep Learning est sa capacité à apprendre de manière
autonome. En intégrant de nouvelles informations, le système modifie ses connexions
internes, améliorant ainsi ses performances au fil du temps. Il a la faculté d'itérer sur
ses propres erreurs, conduisant à une amélioration continue sans nécessiter une
intervention humaine constante. En résumé, le Deep Learning est une approche
puissante qui tire profit de l'architecture en réseau de neurones pour autonomiser
l'apprentissage et l'adaptation des machines à partir des données fournies.
Figure 3 : couche du réseau Nuerons

5 MediaPipe : définition et ces applications en Deep


Learning.

5.1 Définition :

MediaPipe est une bibliothèque logicielle open-source développée par Google qui se
concentre sur le traitement multimédia en temps réel. Elle offre un ensemble de
modèles pré entraînés basés sur des techniques de Deep Learning pour résoudre
diverses tâches liées à l'analyse de vidéos et d'images.

MediaPipe offre un ensemble complet d'outils et de modèles pour le traitement


multimédia en temps réel, couvrant un large éventail d'applications allant de la vision
par ordinateur à la réalité augmentée en passant par l'interaction homme-machine. Son
approche modulaire et son intégration avec TensorFlow Lite en font un choix
attrayant pour les développeurs cherchant à incorporer des fonctionnalités de Deep
Learning dans leurs projets multimédias.

5.2 Applications de MediaPipe en Deep Learning :

MediaPipe propose des modèles avancés pour la détection de visages et le suivi de


points clés faciaux. Ces fonctionnalités sont essentielles pour plusieurs applications,
notamment :

 Traitement en Temps Réel :

L'une des caractéristiques principales de MediaPipe est sa capacité à effectuer un


traitement en temps réel, permettant aux développeurs d'intégrer des
fonctionnalités d'analyse multimédia directement dans des applications qui
nécessitent des réponses rapides, comme des applications de réalité augmentée, de
jeux ou de surveillance.

 Détection d'Objets et Suivi :

MediaPipe propose des modèles de détection d'objets qui peuvent localiser et


identifier différents types d'objets dans une scène. De plus, le suivi d'objets en
temps réel est pris en charge, ce qui est essentiel pour des applications telles que la
réalité augmentée et la surveillance vidéo.

 Reconnaissance de Gestes et de Postures :

Les modèles de MediaPipe permettent la reconnaissance de gestes et de postures,


ce qui signifie qu'ils peuvent interpréter les mouvements des mains, du corps ou
d'autres parties. Cette fonctionnalité est utilisée dans des applications interactives,
comme des commandes gestuelles pour des dispositifs sans contact ou des jeux
vidéo.

 Détection de Visages et de Points Clés :


La bibliothèque propose des modèles de détection de visages et de suivi de points
clés faciaux. Cela est particulièrement utile pour des applications telles que la
réalité virtuelle, l'analyse d'émotions faciales et la création d'effets spéciaux.

 Traitement d'Images et Analyse de Profondeur :

MediaPipe prend également en charge des fonctionnalités telles que la


segmentation sémantique, la détection d'objets et la classification d'images.
Certains modules peuvent également estimer la profondeur à partir d'une seule
caméra, élargissant ainsi la gamme d'applications possibles.

 Intégration avec TensorFlow Lite :

MediaPipe est intégré avec TensorFlow Lite, la version allégée de la populaire


bibliothèque de machine learning TensorFlow. Cela facilite le déploiement des
modèles MediaPipe sur des dispositifs embarqués et des appareils mobiles,
élargissant ainsi la portée d'utilisation de la bibliothèque.

 Communauté Active et Documentation Complète :

En tant que projet open-source soutenu par Google, MediaPipe bénéficie d'une
communauté active. La documentation complète, les exemples de code et les
tutoriels rendent la bibliothèque accessible aux développeurs de différents niveaux
de compétence.

Vous aimerez peut-être aussi