Vous êtes sur la page 1sur 2

Act. 2/ Sem.

2 C106
Intitulé : Analyse et fouille de données
Responsable : Jérôme BOSCHE - UPJV - France
Préambule :
Dans le cadre de ce devoir, le logiciel Scilab sera utilisé pour répondre aux différentes questions de l’énoncé.
Scilab est un logiciel open source de calcul numérique possédant de nombreuses fonctionnalités adaptées à ce
type de problèmes.

Contexte
Le contexte est le même que celui de l’activité 1, à savoir l’expérimentation du groupe de chercheurs
de l’université de Florence [1]. Il s’agit donc toujours des 2 mêmes personnes et des 2 mêmes
mouvements:
1. boire à la bouteille
2. répondre au téléphone
Les données de mesure sont contenues dans le fichier act1.sod:

load("act1.sod");

Pour rappel, les 4 matrices M ij ∈ R45×450 résultantes correspondent aux mesures propres au patient
i et au mouvement j avec (i, j) ∈ {1, 2} × {1, 2}. Les lignes sont donc associées aux mesures
délivrées par chaque capteur et correspondent finalement aux fonctions fk générées par les différents
capteurs (k ∈ {1, .., 45}). Les colonnes sont associées au temps.

Questions
T , MT , MT
1. Créer la matrices M ∈ R450×180 correspondant à la concaténation des matrices M11 12 21
T
et M22 et faisant apparaître les différents signaux fk sur ces colonnes.

2. Générer la matrice centrée réduite notée X ∈ R450×180 à partir de la matrice M .

3. Calculer la matrice de corrélation notée COR ∈ R180×180 de la matrice M .

4. A partir de la question précédente, déduire les 10 couples de variables (v1 ; v2 ) présentant les plus
fortes coefficients de corrélation. Remplir le tableau ci-dessous. (Remarque : la fonction gsort
de Scilab pourra être utilisée pour répondre à la question).

Q jerome.bosche@u-picardie.fr
variable v1 variable v2 Coefficient de corrélation

Tab. 1. : Les 10 variables les plus corrélées


5. Effectuer, sur le même graphe, le tracé des variable v101 et v104 . Conclusion.

6. Effectuer, sur le même graphe, le tracé des variable v100 et v103 . Conclusion.

7. D’après le tableau 1, combien de variables sont concernées par ces 10 premières lignes ?

8. Toujours d’après le tableau 1, combien de variables peuvent être directement déduites des autres?

9. Faire une analyse en composantes principales et déduire combien d’axes sont nécessaires pour
restituer au moins 80% de l’inertie du nuage des 450 individus en précisant la qualité de la
représentation ainsi obtenue (en %) .

10. Calculer le tableau Tx comprenant les coordonnées des points individus dans le repère formé par
les axes factoriels principaux et donner, à partir de Tx , les coordonnées de l’individu 1.

Publications
L. Seidenari and V. Varano and S. Berretti and A. Del Bimbo, Pietro Pala, «
Recognizing Actions from Depth Cameras as Weakly Aligned Multi-PartBag-of-
Poses, »Proceedings of the IEEE Conference on Computer Vision and Pattern
Recognition Workshops, pp. 479-485, 2013.

Q jerome.bosche@u-picardie.fr