Vous êtes sur la page 1sur 40

République Algérienne Démocratique et Populaire

Ministère de l’Enseignement Supérieur et de la Recherche Scientifique


Université A/MIRA de Bejaia

Faculté des Sciences de la Nature et de la Vie

Département des Sciences Biologiques de l’Environnement

Master II : Biologie Animale

Module : Biostatistique appliquée

Compte rendu
« Analyses et gestion de données avec le
logiciel STATISTICA »
STATISTICA VERSION 8.0

Réalisé par : IDJERAOUI Dalila


Dirigé par : Mr SAHNOUNE

2021 – 2022
Table des matières

INTRODUCTION : ......................................................................................................................... 1
I. MATERIEL .............................................................................................................................. 2
I.1. Présentation du logiciel utilisé : ............................................................................................ 2
I.2. Les étapes pour l’installation du logiciel statistica 8.0 .......................................................... 2
II. METHODES, RESULTATS ET DISCUSSIONS: ............................................................. 11
II.1. Présentation d’un fichier de données statistiques ................................................................ 11
II.2. Création d’un fichier statistique avec le logiciel statistica 08 à partir d’un fichier Excel ... 11
II.3. Analyse mon variée ............................................................................................................. 14
II.4. Le test de Student ou bien test T ......................................................................................... 17
II.5. Anova .................................................................................................................................. 17
II.6. Matrice de corrélation : ....................................................................................................... 19
II.7. Régression linéaire .............................................................................................................. 20
II.8. Analyse en composante principale (ACP ).......................................................................... 22
Régression multiple........................................................................................................................ 25
II.9. la classification ascendante hiérarchique (CAH) ................................................................ 30
CONCLUSION : ............................................................................................................................ 36
PERSPECTIVES : ......................................................................................................................... 36
Table des figures

FIGURE 1: LES STATISTIQUES VUES DE LOIN .......................................................................................... 1


FIGURE 2 ET 3 : 1ER ETAPES D’INSTALLATION :OUVERTURE DU FICHIER D’INSTALLATION ..................... 2
FIGURE 4: FICHIER D’INSTRUCTION POUR L’INSTALLATION DE SATISTICA 8.0 ................................... 2
FIGURE 5: CLE D’INSTALLATION FIGURE 6:CONTRAT DE LICENCE STATISTICA 8.0 .......... 3
FIGURE 7: TYPE DE CONFIGURATION ..................................................................................................... 3
FIGURE 8:FORMULAIRE D’INFORMATION (INTRODUIRE LE NUMERO DE SERIE) ...................................... 4
FIGURE 9:CONFIRMATION DES INFORMATIONS SAISI ............................................................................. 4
FIGURE 10: DOSSIER POUR LES FICHIER D’INSTALLATION DU PROGRAMME STATISTICA ................... 4
FIGURE 11:SAISIR LES INFORMATIONS PROFESSIONNELLES POUR ENREGISTRER LA LICENCE ................ 5
FIGURE 12: CHOISIR LE MODE D’INSCRIPTION SUR STATISTICA ( MANUELLEMENT OU
AUTOMATIQUEMENT) .................................................................................................................... 5
FIGURE 13:SAUVGARDER LES INFORMATIONS D'ENREGISTREMENT DE LA LICENCE ............................... 6
FIGURE 14:DEMANDE D’ACTIVATION D’UN ADAPTATEUR RESEAU SANS FIL POUR UN ENREGISTREMENT
PLUS CORRECT DES FICHIERS D’INSTALLATION ............................................................................. 6
FIGURE 15: BOITE DE DIALOGUE « SELECTIONNER LES FONCTIONNALITES » ........................................ 7
FIGURE 16: BOITE DE DIALOGUE « SELECTIONNER PROGRAMME »........................................................ 7
FIGURE 17: CONFIRMATION D’INSTALLATION DU LOGICIEL SUR BUREAU .............................................. 8
FIGURE 18:DEBUTER L’INSTALLATION .................................................................................................. 8
FIGURE 19:INSTALATION TERMINER ...................................................................................................... 8
FIGURE 20:EMPLACEMENT DU FICHIER STATSOFTREGISTRATION.TXT .................................................. 9
FIGURE 21:EMPLACEMENT DU FICHIER « STAT.LIC » ............................................................................. 9
FIGURE 22:INTERFACE DU LOGICIEL STATISTICA APRES LE 1ER DEMARRAGE ....................................... 10
FIGURE 24: LES DONNEES A ANALYSER DANS UN TABLEAU FORMAT EXCEL ....................................... 11
FIGURE 25: CREATION D’UN NOUVEAU FICHIER STATISTIQUE ............................................................. 12
FIGURE 26: NOUVEAU FICHIER STATISTIQUE VIERGE ........................................................................... 12
FIGURE 27: FICHIER STATISTIQUE CREE A PARTIR D’UN FICHIER EXCEL .............................................. 13
FIGURE 28:CALCUL DES PARAMETRES STATISTIQUES DE LA VARIABLE NFB ...................................... 14
FIGURE 29 HISTOGRAMME DE LA VARIABLE NFB ................................................................. 16
FIGURE 30 : REGRESSION LINEAIRE POUR LES VARIABLES LFA1 ET LFA2 ........................................ 21
FIGURE 31 REGRESSION LINEAIRE DES VARIABLES LDB ET LFA1 .................................................... 22
FIGURE 32 REPRESENTATION GRAPHIQUE DE L’ACP ......................................................................... 23
FIGURE 33 CERCLE DE CORRELATIONS................................................................................................ 27
FIGURE 34 NUAGE DE POINTS : REPARTITION DES GROUPES PAR RAPPORT AUX FACTEURS 1 ET 2 ....... 29
FIGURE 35 DENDROGRAMME (CAH) AVEC LES VALEURS ABSOLUES ................................................. 35
FIGURE 36 DISTANCE RELATIVE EN POURCENTAGE ............................................................................. 35
Liste des tableaux :

TABLEAU 1 PARAMETRES STATISTIQUES DE LA VARIABLE NFB .................................... 15


TABLEAU 2 TEST DE STUDENT POUR LA VARIABLE NFB POUR LES GROUPES 1 ET 2 .......................... 17
TABLEAU 3: ANOVA POUR LA VARIABLE NFB .................................................................................... 17
TABLEAU 4:TEST LSD DIFFERENCE SIGNIFICATIVE POUR LA VARIABLE NFB ..................................... 18
TABLEAU 5: TEST LSD GROUPE HOMOGENE POUR LA VARIABLE NFB ............................................... 18
TABLEAU 6: MATRICE DES CORRELATIONS ENTRE LES VARIABLES ................................................... 19
TABLEAU 7:MATRICE DE CORRELATION AVEC PROBABILITES ............................................................. 20
TABLEAU 8: ANALYSE EN COMPOSANTE PRINCIPALE ACP ................................................................. 23
TABLEAU 9:CORRELATIONS FACTEURS-VARIABLES ............................................................................ 24
TABLEAU 10: MATRICE DES VECTEURS PROPRES DE CORRELATION .................................................... 25
TABLEAU 11:COORDONNEES DES INDIVIDUS PAR RAPPORT AUX FACTEURS ........................................ 26
TABLEAU 12:ACP FACTORIEL ........................................................................................................ 28
TABLEAU 13: DONNEES DU GROUPE 1 ............................................................................................... 30
TABLEAU 14:MOYENNES DES VARIABLES DU GROUPE 1 ..................................................................... 30
TABLEAU 15:DONNEES DU GROUPE 2 ................................................................................................ 31
TABLEAU 16:MOYENNES DES VARIABLES DU GROUPE 2 ..................................................................... 31
TABLEAU 17:DONNEES DU GROUPE 3 ................................................................................................ 32
TABLEAU 18:MOYENNES DES VARIABLES DU GROUPE 3 ..................................................................... 32
TABLEAU 19 :DONNEES DU GROUPE 4 ................................................................................................ 33
TABLEAU 20:MOYENNES DES VARIABLES DU GROUPE 4 ..................................................................... 33
TABLEAU 21 : MOYENNES DES VARIABLES DES 4 GROUPES ................................................................ 34
TABLEAU 22:MATRICE DE DISTANCE EUCLIDIENNE POUR LE GROUPE MOYEN .................................... 34
INTRODUCTION :

La bio statistique s’intéresse à la mise au point et à l’application de méthodes statistiques dans


divers domaines liés à la santé comme la médecine et les autres sciences biomédicales. Dans tous ces
secteurs, l’analyse de problèmes ou d’enjeux à partir de données numériques est fréquente et nécessite
l’application d’un raisonnement statistique rigoureux.
Les domaines de développement en biostatistique incluent l’inférence bayésienne, l’analyse des
données de survie, l’analyse de données provenant d’essais cliniques et d’études épidémiologiques,
la statistique spatiale, la statistique génétique, les analyses de données longitudinales et l’analyse des
mégadonnées.1

Figure 1: les statistiques vues de loin


Utilité de la statistique :
Extraire des informations pertinentes d'une liste de nombres difficile à interpréter par une simple
lecture. Les statistiques procurent des outils essentiels pour répondre de manière quantifiée aux
questions biologiques posées dans les domaines de la biologie au sens large.

Utilité de la biostatistique :2
Traiter les problèmes de variabilité dans les données
Variabilité : Une expérience en biologie donne rarement un résultat tranché ou parfaitement
reproductible.
o Variabilité inter-individuelle : caractéristiques qui diffèrent d’un individu a l’autre
o Variabilité intra-individuelle : caractéristiques évoluant dans le temps chez un même
individu
• Quantité : Les nouvelles technologies biologiques permettent de recueillir des quantités
pharamineuses de données. (Erreurs de mesure)

Intérêt du travail : Le traitement et l’interprétation des données

1
https://espum.umontreal.ca/etudes/domaines-detudes/biostatistique/
2
http://homepages.ulb.ac.be/~cverhoev/STAT-I301/slides_intro_handout.pdf
1
I. MATERIEL
I.1. Présentation du logiciel utilisé :
STATISTICA est un système complet et intégré d'analyse des données, de représentation
graphique, de gestion de bases de données et de développement d'applications personnalisées,
offrant une large gamme de procédures élémentaires ou avancées pour les sciences, le data mining
et toutes les applications industrielles ou commerciales3
I.2. Les étapes pour l’installation du logiciel statistica 8.0
Bien que sur la licence du logiciel statistica 8.0 on trouve 8 taches dans les instructions
primordiales
; l’installation se fait en vérité en plus plusieurs étapes successives que je vais essayer de
vous énumérer
J’accompagne chaque étape d’une capture d’écran afin de les illustrés

1) Tout d’abord ouvrir le fichier « english» puis cliquer sur « setup.exe» application
2) Une boîte de dialogue apparait « welcomme to the instalation wizard for statistica » puis
cliquer sur « next »

Figure 2 et 3 : 1er étapes d’installation :ouverture du fichier d’installation

3) Ouvrir le fichier licence


4) Ouvrir le fichier statistica8 instruction .txt et laisser cette fenêtre ouverte car dedans se
trouvent les instructions à suivre pour effectuer l’installation

Figure 4: fichier d’instruction pour l’installation de SATISTICA 8.0

3
https://www.statsoft.fr/pdf/STATISTICA-prise-en-main.pdf
2
5) Saisir la clé du CD et l’identifiant dans le champ respectif. Puis cliquez sur suivant «
next »
6) Lire attentivement le contrat de licence du logiciel, puis cliquez sur « accepter les termes du
contrat » ensuite sur « suivant »

Figure 5: clé d’installation Figure 6:contrat de licence STATISTICA 8.0

7) Choisir un type de configuration : Sélectionnez Installation « custom » conformément aux


instructions puis cliquez sur «Next »

Figure 7: type de configuration

3
8) Introduire le numéro de série STA862D17537Q conformément aux instructions ainsi qu’un
nom puis cliquez sur le bouton Suivant. Puis cliquez sur le bouton Suivant « Next ».
9) Une boite de dialogue s’affiche : pour demander si les informations enregistrées sont bien
correctes , cliquez sur le bouton oui « yes »

Figure 8:formulaire d’information (introduire le numéro de série)

Figure 9:confirmation des informations saisi

10) Sélectionnez le dossier où le programme d'installation enregistrera ces fichiers (ou valider le
choix automatique ) puis cliquer sur suivant « Next »

Figure 10: dossier pour les fichier d’installation du programme STATISTICA

4
11) Remplir nos informations professionnelles requises, puis cliquer sur « Next »

Figure 11:saisir les informations professionnelles pour enregistrer la licence

12) Choisir le mode manuel conformément aux instructions, puis cliquer sur « Next »

Figure 12: choisir le mode d’inscription sur statistica ( manuellement ou automatiquement)

5
13) Choisir le dossier de destination des informations d'enregistrement de la licence, puis cliquer
sur « Next »

Figure 13:sauvgarder les informations d'enregistrement de la licence

14) La boîte de dialogue apparait il est demandé d’activer un adaptateur réseau sans fil :
- Soit cliquer sur « ok» puis activé cet adaptateur s’il existe
- Ou suivre les instructions de « statistica8 instruction .txt» et se déconnecter d’internet,
puis cliquer sur « Next »

Figure 14:demande d’activation d’un adaptateur réseau sans fil pour un enregistrement plus correct des fichiers d’installation

6
15) Une boîte de dialogue « Sélectionner les fonctionnalités » apparait, décocher « Mises à jour
système (system up dates) », puis cliquer sur « Next »

Figure 15: boîte de dialogue « Sélectionner les fonctionnalités »

16) Dans la boite de dialogue sélectionner un programme nous remarquons qu’automatiquement


au-dessus de program Folder est écrit « STATISTICA8 » , donc juste cliquer sur « Next »

Figure 16: boîte de dialogue « Sélectionner programme »

7
17) Il nous est demandé si on veut installer le logiciel sur le bureau, cliquer sur « yes »
18) Cliquer sur installer pour continuer l’installation.

Figure 17: confirmation d’installation du logiciel sur bureau Figure 18:débuter l’installation

19) Une fois l’installation terminé cliquer sur « finich » puis sur la petite boite de dialogue
cliquer sur « ok »

Figure 19:instalation terminer

8
20) À la fin de l'installation, fermez le navigateur puis ouvrir le dossier « programmes » du
disque local C , Puis dossier « programmes (x86), puis le dossier « stat soft » enfin le
dossier statistica 8 et supprimez le fichier « StatSoftRegistration.txt »

Figure 20:emplacement du fichier statsoftRegistration.txt

21) Aller au dossier « Statistica8 », puis dans le dossier « Statistica8_license » et copier le


fichier « stat.lic » enfin allez le coller à la place du fichier du fichier supprimer
« StatSoftRegistration.txt »

Figure 21:emplacement du fichier « stat.lic »

9
22) Le logiciel STATISTICA est installé est prêt à l’emploi.

Après avoir installé STATISTICA, démarrer le programme, une feuille de données vierge apparaît
ainsi que la boîte de dialogue Bienvenue dans STATISTICA08.

Figure 22:interface du logiciel statistica après le 1er démarrage

10
II. METHODES, RESULTATS ET DISCUSSIONS:

II.1.Présentation d’un fichier de données statistiques


• Les données sont saisies sous la forme d’un tableau.
• En colonnes, des variables (soit le nombre d’information que nous avons pour chaque
individu).
• En lignes, des individus (cela peut-être des personnes physiques, des ménages, des
institutions, etc.).

4 groupes de 20
individus chacun
10 Variables

G1

80 Lignes
=
80 individus
Réparti en
4 groupes

Figure 23: les données à analyser dans un tableau format Excel

II.2.Création d’un fichier statistique avec le logiciel statistica 08 à partir d’un


fichier Excel
• Il est préférable de créer un dossier spécial pour les taches que nous allons appliquer sur le
logiciel statistica et le nommer par exemple DATA BIOSTAT.
• Copier le fichier Excel original contenant toutes les données qui nous concerne dans le
fichier DATA BIOSTAT.
• Ouvrir le fichier de données et copier tout le tableau
• Sur le logiciel statistica8 cliquer sur « file » ;
• Puis cliquer sur « new » ; une boite de dialogue s’ouvre remplir cette dernière en fonction de
notre fichier Excel puis cliquer sur « ok ».

11
Figure 24: Création d’un nouveau fichier statistique

• On obtient alors le fichier suivant

Figure 25: nouveau fichier statistique vierge

12
• Cliquer sur « édit » puis sur « select all » tout sélectionner ensuite cliquer une deuxième fois
sur « édit » puis sur « paste with headers » et choisir « paste with both ».

• On obtient notre fichier statistica

figure 26: fichier statistique crée à partir d’un fichier Excel

• Enregistrer ce fichier dans le dossier DATA BIOSTAT qu’on a créé précédemment pour cela
on clique sur « file » puis sur « save as ».

13
II.3. Analyse mon variée
Calcule des paramètres statistiques d’une variable
J’ai choisi de travailler sur « la variable NFB »
Méthode
Cliquer dans l’ordre sur :
➢ « Statistics »
➢ « Basic statistics /tables »
➢ « Discreptive statistics »
➢ « Ok »
➢ « Advanced statistics »
➢ Cocher tous les paramètres qu’on veut calculer et choisir une variable

Figure 27:calcul des paramètres statistiques de la variable NFB

➢ Cliquer sur « summury »


➢ On obtient le tableau n 1

14
TABLEAU 1 PARAMETRES STATISTIQUES DE LA VARIABLE NFB

% Valid Confidence Confidence Frequency – Lower - Upper -


Valid N Mean Median Mode Sum Minimum Maximum
obs. - -95,000% - 95,000 of Mode Quartile Quartile
NFB 80 98,76543 19,15000 17,65314 20,64686 18,00000 18,00000 11 1532,000 10,00000 36,00000 13,00000 23,00000

Percentile - Percentile - Confidence Confidence SD Standard Std.Err. Std.Err.


10,00000 90,00000
Range Variance Std.Dev. Coef.Var. Skewness Kurtosis
SD --95,000% - +95,000% - Error - Skewness - Kurtosis

NFB 11,00000 29,50000 26,00000 45,24304 6,726295 5,821291 7,967111 35,12425 0,752023 0,664730 0,268909 -0,323792 0,531786

Création de l’histogramme de la variable NFB avec test de normalité


Méthode :
➢ Cliquer sur « quik »
➢ Puis cliquer sur « histograms »
➢ On obtient la figure n29

15
Histogram: NFB
K-S d=,14288, p<,10 ; Lilliefors p<,01
Expected Normal
30

25

20

15

10

0
5 10 15 20 25 30 35 40
X <= Category Boundary

Figure 28 HISTOGRAMME DE LA VARIABLE NFB

Observations et interprétations
Bien que l’observation générale de de la répartition de l’histogramme par rapport à la ligne rouge (qui
représente la loi normale) nous indique que les colonnes sont majoritairement inclues dedans néanmoins
certaines valeurs dépassent exemple dans la colonne entre 10et 15.
L’histogramme est presque symétrique
Ainsi donc c’est la valeur d p pour les tests KSD et LILIFORS qui nous permettras de faire notre conclusion
finale
Dans ce cas-ci, P KSD >0.05
P LILIEFORS <0.05
Donc la variable NFB ne suit pas la loi normale car la condition pour suivre la loi normale est que la valeur de p
pour les deux tests soit supérieure à 0.05

16
II.4.Le test de Student ou bien test T
Méthode : cliquer dans l’ordre sur
➢ « Statistics »
➢ « Basic statistis »
➢ « Test t indipendent by groups »
➢ « Variable » ; dans mon cas j’ai choisi la variable NFB
➢ « Groups » ; dans mon cas j’ai choisi le groupe 1 et le groupe 2
➢ On obtient le tableau n 2
Tableau 2 Test de Student pour la variable NFB pour les groupes 1 et 2

Std.Dev. - F-ratio -
Mean - 1 Mean - 2 t-value df p Valid N - 1 Valid N - 2 Std.Dev. - 2 p – Variances
1 Variances
NFB 26,30000 21,95000 2,593354 38 0,013423 20 20 6,829503 3,103055 4,843946 0,001192
Observations et interprétations :
Nous observons que la valeur de p =0,013423 donc p <0.05 par conséquent nous concluons que les moyennes pour les deux
groupes choisis (1 et 2) sont différentes.

II.5. Anova
L'analyse de la variance (ANOVA) univariée est une méthode statistique permettant de comparer des moyennes
de trois groupes ou plus.
Méthode : cliquer dans l’ordre sur
➢ « Statistics »
➢ « Anova »
➢ « One way anova »
➢ « Ok »
➢ « Variable » (dans mon cas j’ai choisis la variable NFB)
➢ « Groupes » (on choisit les 4 groupes)
➢ « Ok »
➢ « All effects »
➢ Résultat dans le tableau n 3
Tableau 3: Anova pour la variable NFB

SS Degr. of - Freedom MS F p
Intercept 29337,80 1 29337,80 1906,192 0,00
GR 2404,50 3 801,50 52,077 0,00
Error 1169,70 76 15,39
Observations et interprétation
Nous observons que la valeur de p est inferieure a 0.05.
P<0.05 donc nous déduisons que les moyennes pour les quatre groupes ne sont pas égales ;il y a au moins une
moyenne parmi les quatre groupes qui diffère des autres .

17
• Puisque les 4 moyennes sont différentes nous allons procédera de nouveaux tests
Tout d’abord on va cliquer sur
➢ « More results »
➢ « Puis sur posthoc »
➢ « Significant difference »
➢ « Ficher LSD »
➢ Resultat dans le tableau n 4
Tableau 4:Test LSD différence significative pour la variable NFB

LSD test; variable NFB (BA 34 IDJERAOUI.sta) Probabilities for Post Hoc Tests Error: Between MS = 15,391, df = 76,000
GR {1} - 26,300 {2} - 21,950 {3} - 16,600 {4} - 11,750
1 1 0,000766 0,000000 0,000000
2 2 0,000766 0,000048 0,000000
3 3 0,000000 0,000048 0,000199
4 4 0,000000 0,000000 0,000199

Observations et interprétations :
P<0.05 dans toutes les cases ce qui confirme notre hypothèse précédente les moyennes pour les 4 groupes sont
différentes.
• Nous allons procéder à un autre test
➢ « Homogeneous groups »
➢ « FICHER LSD »
➢ Résultat dans le tableau n 5
Tableau 5: Test LSD groupe homogène pour la variable NFB

GR NFB - Mean 1 2 3 4
4 4 11,75000 ****
3 3 16,60000 ****
2 2 21,95000 ****
1 1 26,30000 ****

Observations et interprétations :
Nous obtenons 4 groupes homogènes
Les moyennes sont classées par ordre croissant ; la moyenne du groupe 4 étant la plus petite et celle du groupe 1
est la plus grande.

18
II.6.Matrice de corrélation :
La matrice de corrélation permet d'étudier l'association (ou dépendance) entre deux ou plusieurs variables.
Méthode : on clique dans l’ordre sur
➢ « Statistics »
➢ « Basics statistics »
➢ « Correlation matrice »
➢ « Ok »
➢ « Two variable lists »
➢ « Summury »
➢ Resultat tableau n6
Tableau 6: Matrice des corrélations entre les variables

NFB NDB LSB LDB LFA1 LFA2 PDA NFA NDA LSA
NFB 1,00 0,81 0,61 0,74 0,53 0,57 0,79 0,87 0,77 0,63
NDB 0,81 1,00 0,60 0,51 0,64 0,71 0,72 0,81 0,85 0,57
LSB 0,61 0,60 1,00 0,66 0,68 0,70 0,65 0,53 0,66 0,50
LDB 0,74 0,51 0,66 1,00 0,26 0,33 0,72 0,75 0,50 0,72
LFA1 0,53 0,64 0,68 0,26 1,00 0,91 0,73 0,49 0,71 0,46
LFA2 0,57 0,71 0,70 0,33 0,91 1,00 0,72 0,53 0,81 0,51
PDA 0,79 0,72 0,65 0,72 0,73 0,72 1,00 0,85 0,71 0,80
NFA 0,87 0,81 0,53 0,75 0,49 0,53 0,85 1,00 0,76 0,73
NDA 0,77 0,85 0,66 0,50 0,71 0,81 0,71 0,76 1,00 0,52
LSA 0,63 0,57 0,50 0,72 0,46 0,51 0,80 0,73 0,52 1,00

Observations et interprétations :
r = coefficient de corrélation
-1<r <1 ;plus la valeur de r se rapproche de 1 plus les variables sont fortement corrélées .
Dans ce cas de figure toutes les valeurs sont significativement différentes de 0; les valeurs de r sont comprises
entre 0 et 1 ; c’est à dire 0<r<1
• Pour une meilleure interprétation de la matrice de corrélation nous allons étudier les probabilités
Pour cela il faut cliquer sur
➢ « Option »
➢ « Display rp levels »
➢ « Display long variables names »
➢ « Summurry »
➢ Nous obtenons le tableau n°7

19
Tableau 7:Matrice de corrélation avec probabilités

NFB NDB LSB LDB LFA1 LFA2 PDA NFA NDA LSA
NFB 1,0000 ,8129 ,6105 ,7378 ,5308 ,5704 ,7929 ,8684 ,7728 ,6291
p= --- p=0,00 p=,000 p=,000 p=,000 p=,000 p=,000 p=0,00 p=,000 p=,000
NDB ,8129 1,0000 ,6007 ,5067 ,6419 ,7062 ,7209 ,8127 ,8487 ,5683
p=0,00 p= --- p=,000 p=,000 p=,000 p=,000 p=,000 p=0,00 p=0,00 p=,000
LSB ,6105 ,6007 1,0000 ,6571 ,6800 ,6980 ,6521 ,5344 ,6566 ,5005
p=,000 p=,000 p= --- p=,000 p=,000 p=,000 p=,000 p=,000 p=,000 p=,000
LDB ,7378 ,5067 ,6571 1,0000 ,2615 ,3315 ,7234 ,7460 ,4982 ,7225
p=,000 p=,000 p=,000 p= --- p=,019 p=,003 p=,000 p=,000 p=,000 p=,000
LFA1 ,5308 ,6419 ,6800 ,2615 1,0000 ,9095 ,7314 ,4918 ,7067 ,4559
p=,000 p=,000 p=,000 p=,019 p= --- p=0,00 p=,000 p=,000 p=,000 p=,000
LFA2 ,5704 ,7062 ,6980 ,3315 ,9095 1,0000 ,7184 ,5305 ,8112 ,5143
p=,000 p=,000 p=,000 p=,003 p=0,00 p= --- p=,000 p=,000 p=0,00 p=,000
PDA ,7929 ,7209 ,6521 ,7234 ,7314 ,7184 1,0000 ,8452 ,7144 ,7962
p=,000 p=,000 p=,000 p=,000 p=,000 p=,000 p= --- p=0,00 p=,000 p=,000
NFA ,8684 ,8127 ,5344 ,7460 ,4918 ,5305 ,8452 1,0000 ,7553 ,7264
p=0,00 p=0,00 p=,000 p=,000 p=,000 p=,000 p=0,00 p= --- p=,000 p=,000
NDA ,7728 ,8487 ,6566 ,4982 ,7067 ,8112 ,7144 ,7553 1,0000 ,5247
p=,000 p=0,00 p=,000 p=,000 p=,000 p=0,00 p=,000 p=,000 p= --- p=,000
LSA ,6291 ,5683 ,5005 ,7225 ,4559 ,5143 ,7962 ,7264 ,5247 1,0000
p=,000 p=,000 p=,000 p=,000 p=,000 p=,000 p=,000 p=,000 p=,000 p= ---

Observations et interprétations :
Nous observons que les valeurs de p sont significativement différentes de 0
p<0.05 Nous pouvons donc conclure que toutes ces variables sont significativement corrélées.

II.7. Régression linéaire


Méthode :on clique dans l’ordre sur
➢ « Statistics »
➢ « Advanced linear »
➢ « General regression model »
➢ « Simple regression »
➢ « Ok
➢ « Quick »
➢ « Choisir la variable »
➢ « More result »
➢ « Assumption »
➢ « Scater plot »

20
En nous basons sur le tableau n6 ; Nous allons prendre comme exemple
• Les variables LFA1 et LFA2 r=0.91
• Les variables LFA1 et NDB r=0.26
A-Régression linéaire des variables LFA1 et LFA2

Nuage de point : LFA1 et LFA2


LFA2 = -5,8998+1,3578*x; 0,95 Conf.Int.
18

16

14

12

10
LFA1

0
4 6 8 10 12 14 16 18
LFA2 95% confidence

Figure 29 : Régression linéaire pour les variables LFA1 ET LFA2

Observations et interprétations :
Nous observons que le nuage de point est serré autour de la droite formant presque une droite parallèle
LFA2= -5.8998+1.3578* X
Plus la valeur de x augmente plus la valeur de y augmente aussi donc les deux variables sont positivement
corrélées.
L’intervalle de confiance est étroit donc nous déduisons que les variables sont fortement corrélées

21
B-Régression linéaire des variables LDB et LFA1 figure 3

NUAGE DE POINTS : LDB by LFA1


LDB = 0,6941+0,0766*x; 0,95 Conf.Int.
3,5

3,0

2,5

2,0
LDB

1,5

1,0

0,5

0,0
4 6 8 10 12 14 16 18
LFA2 95% confidence

Figure 30 Régression linéaire des variables LDB ET LFA1

Observations et interprétations :
LDB=0.6941+0.0766*X
Plus la valeur de x augmente plus la valeur de y augmente aussi donc les variables LDB et LFA1 sont positivent
corrélées
Nous observons que dans ce deuxième exemple que le nuage de point est plutôt dispersé et éparpillé autour de
la droite contrairement au premier cas de figure
L’intervalle de confiance est grand donc nous concluons que les variables sont faiblement corrélées
En effet r=0.26

II.8.Analyse en composante principale (ACP )


L’ACP va réduire le nombre de variables en définissants des groupes en corrélations entre les variables.
Méthode : on clique dans l’ordre sur
22
➢ « Multivariate exploratory technique »
➢ « Principal componant ;classification analysis »
➢ « Advanced »
➢ « Choisir toutes les variables »
➢ « Eigen values »
➢ Resultat tableau n8
Tableau 8: Analyse en composante principale ACP

Valeurs propres de la matrice de corrélation et statistiques associées


Eigenvalue % Total - variance Cumulative - Eigenvalue Cumulative - %
1 6,960124 69,60124 6,96012 69,6012
2 1,249176 12,49176 8,20930 82,0930
3 0,639834 6,39834 8,84913 88,4913
4 0,496725 4,96725 9,34586 93,4586
5 0,222052 2,22052 9,56791 95,6791
6 0,155660 1,55660 9,72357 97,2357
7 0,118883 1,18883 9,84245 98,4245
8 0,072971 0,72971 9,91542 99,1542
9 0,047639 0,47639 9,96306 99,6306
10 0,036937 0,36937 10,00000 100,0000
Nous allons représenter ces valeurs sur un graphe pour cela nous devons cliquer sur Scree plot.

valeurs propres de la matrice de correlation


8

69,60%
7

5
Eigenvalue

2
12,49%
1 6,40% 4,97%
2,22% 1,56% 1,19% ,73%
,48% ,37%
0

-1
-1 0 1 2 3 4 5 6 7 8 9 10 11 12
Eigenvalue number

Figure 31 Représentation graphique de L’ACP

23
Observations et interprétations :
A partir du tableau n 8 et de la figure n32 nous allons retenir les valeurs propres qui sont supérieures à 1
Nous retenons deux grandes valeurs donc deux grands axes
Axe 1 =69.60% Axe2=12.49%
Nous allons procéder au calcul des corrélations entres les facteurs et les variables pour ce faire :
➢ Cliquer sur « factor ans variables correlation »
Tableau 9:Corrélations facteurs-variables

Factor 1 Factor 2 Factor 3 Factor 4 Factor 5 Factor 6 Factor 7 Factor 8 Factor 9 Fact.10
NFB -0,884241 -0,218826 -0,235131 -0,140303 -0,165524 0,007684 0,253543 -0,049410 -0,025230 -0,021032
NDB -0,872679 0,085658 -0,368145 -0,058393 0,132926 -0,248540 -0,017570 0,100810 0,046087 0,010803
LSB -0,784938 0,144259 0,401076 -0,417887 0,064319 -0,107948 -0,041038 -0,080999 -0,015397 -0,057432
LDB -0,738776 -0,565754 0,249490 -0,200927 -0,013787 0,088426 -0,013106 0,120729 0,020802 0,091252
LFA1 -0,768506 0,560450 0,153157 0,139736 -0,175720 -0,059031 0,004344 -0,062204 0,035319 0,113199
LFA2 -0,814479 0,518896 0,093042 0,090620 0,075542 0,104055 0,050758 0,128562 -0,119439 -0,024464
PDA -0,924666 -0,091696 0,113412 0,223121 -0,214964 0,019380 -0,078090 0,058582 0,082397 -0,105047
NFA -0,882994 -0,308573 -0,245383 0,062682 -0,074058 -0,005638 -0,186907 -0,075385 -0,120528 0,017370
NDA -0,879615 0,218472 -0,260183 -0,116699 0,161087 0,240162 -0,043608 -0,065947 0,085768 0,000101
LSA -0,769656 -0,344024 0,230272 0,404426 0,241723 -0,044267 0,083099 -0,073280 0,004857 0,001916

Observations et interprétations :
Pour chaque variable on aura une corrélation avec la nouvelle variable (facteur 1 ; facteur 2 ; …)
Les corrélations nous permettent de sélectionner les variables qui définissent les axes ; plus elles seront fortes
plus elles contribueront à la définition des axes.
Nous allons retenir allons retenir les corrélations qui ont une valeur supérieure ou égale à 0 .7.
Dans ce cas de figure nous allons retenir les deux premiers axes (facteur1 et facteur 2).

24
Régression multiple
➢ Cliquer sur « eagenvalues »
Tableau 10: Matrice des vecteurs propres de corrélation

Factor 1 Factor 2 Factor 3 Factor 4 Factor 5 Factor 6 Factor 7 Factor 8 Factor 9 Fact.10
NFB -0,335168 -0,195788 -0,293952 -0,199072 -0,351263 0,019476 0,735345 -0,182911 -0,115595 -0,109434
NDB -0,330785 0,076640 -0,460241 -0,082852 0,282086 -0,629952 -0,050957 0,373187 0,211151 0,056209
LSB -0,297527 0,129071 0,501411 -0,592927 0,136494 -0,273607 -0,119023 -0,299849 -0,070545 -0,298831
LDB -0,280030 -0,506193 0,311903 -0,285089 -0,029258 0,224125 -0,038010 0,446926 0,095308 0,474799
LFA1 -0,291299 0,501447 0,191471 0,198267 -0,372902 -0,149620 0,012600 -0,230272 0,161818 0,588995
LFA2 -0,308725 0,464268 0,116317 0,128578 0,160310 0,263739 0,147211 0,475921 -0,547220 -0,127292
PDA -0,350491 -0,082043 0,141783 0,316580 -0,456183 0,049122 -0,226482 0,216864 0,377512 -0,546576
NFA -0,334695 -0,276087 -0,306768 0,088937 -0,157162 -0,014291 -0,542082 -0,279067 -0,552209 0,090379
NDA -0,333414 0,195472 -0,325271 -0,165580 0,341848 0,608719 -0,126477 -0,244128 0,392955 0,000526
LSA -0,291735 -0,307806 0,287877 0,573827 0,512969 -0,112200 0,241011 -0,271273 0,022251 0,009968

Observations et interprétations :
La formule des axes ; chaque axe est défini en fonctions de toutes les variables.
Ce sont les vecteurs propres
Afin de définir les coordonnées des individus par rapport aux facteurs nous allons procéder comme suit
➢ Cliquer sur « cases »
➢ « Factor cordinate of cases »

25
Tableau 11:Coordonnées des individus par rapport aux facteurs

Groupe 1 Groupe 2 Groupe 3 Groupe 4


Factor1 - Factor2 - Factor1 - Factor2 - Factor1 - Factor2 - Factor1 - Factor2 -
G Factor Factor G Factor Factor G Factor Factor G Factor Factor
R scores for scores for R scores for scores for R scores for scores for R scores for scores for
factor 1 factor 2 factor 1 factor 2 factor 1 factor 2 factor 1 factor 2
I01 1 -4,90648297 -1,17290425 M01 2 -2,46912827 1,09061215 N01 3 1,95423494 -1,1496272 P01 4 3,41940458 0,87556687
I02 1 -0,40992697 -0,63158872 M02 2 -2,31113437 1,19288889 N02 3 2,59260604 -1,28682825 P02 4 3,686603 0,54271454
I03 1 -5,27497165 -0,935346285 M03 2 -2,05868557 1,23913027 N03 3 0,63777322 -1,81318808 P03 4 3,32587427 0,7574762
I04 1 -4,25110816 -1,73287391 M04 2 -3,01652056 1,32140648 N04 3 1,41769253 -1,32799587 P04 4 3,04622478 0,91026524
I05 1 -4,77235973 -0,534168155 M05 2 -2,9185426 1,17186459 N05 3 2,45923141 -0,898536351 P05 4 3,01131118 1,18259249
I06 1 -2,58255399 -1,06012783 M06 2 -0,90763448 1,19247343 N06 3 2,51652913 -1,33200106 P06 4 3,43183675 0,99953448
I07 1 -1,61466242 -1,35602785 M07 2 -3,0353567 1,7966451 N07 3 2,28190559 -1,07662389 P07 4 3,59000043 1,11645229
I08 1 0,10453422 0,166616684 M08 2 -1,91296978 0,72393022 N08 3 2,58250071 -1,35906477 P08 4 3,4980505 0,72377715
I09 1 -5,66095385 0,000677281 M09 2 -2,84645601 1,16584222 N09 3 1,84002469 -1,18035472 P09 4 3,88661998 0,4326589
I10 1 -2,77920731 -0,948076281 M10 2 -3,25406287 1,28285177 N10 3 0,44467106 -1,6544082 P10 4 3,08629678 0,73709556
I11 1 1,05549875 -0,219125818 M11 2 -1,92851212 1,28174153 N11 3 0,8031938 -1,7253045 P11 4 3,11516994 1,02067248
I12 1 -0,47914508 -0,392120842 M12 2 -1,80278252 1,06098357 N12 3 -0,0468703 -1,66912848 P12 4 3,05651649 1,06818752
I13 1 0,51921734 -0,388439977 M13 2 -3,3109572 0,42195841 N13 3 -0,08604694 -1,26699848 P13 4 3,39200726 1,00224001
I14 1 0,27302199 -0,725008047 M14 2 -3,009302 0,7503615 N14 3 1,86724763 -1,36380359 P14 4 2,7857745 0,96262408
I15 1 -1,20264101 -0,213190961 M15 2 -1,01537487 1,55835429 N15 3 0,80467729 -1,15369297 P15 4 2,94912056 0,95951161
I16 1 -0,55576225 -0,464217932 M16 2 -3,56878783 1,34399987 N16 3 1,47456635 -1,41213948 P16 4 2,86585468 0,78732842
I17 1 -2,005008 -0,34769629 M17 2 -2,20271269 1,11493502 N17 3 0,85772187 -1,60474181 P17 4 2,98181618 0,53327308
I18 1 -1,82205119 -1,39435542 M18 2 -2,29358445 1,32113394 N18 3 0,909392 -1,25276604 P18 4 2,90851271 1,05981248
I19 1 -3,73711012 -0,659843905 M19 2 -0,95183396 1,4571488 N19 3 0,59684084 -1,4155074 P19 4 2,82150883 0,68957551
I20 1 -2,90044903 -0,074653131 M20 2 -1,92851212 1,28174153 N20 3 0,33467755 -1,83914126 P20 4 2,64389957 0,73296157

26
Cercle de corrélations
Méthode : suivre la procédure suivante
➢ A partir de l ACP
➢ Cliquer sur « variables »
➢ Cliquer sur « plot var factors coordinated 2D »

Projection of the variables on the factor-plane ( 1 x 2)

1,0

LFA1
LFA2
0,5

NDA
Factor 2 : 12,49%

LSB
NDB
0,0 PDA
NFB
NFALSA

-0,5 LDB

-1,0

-1,0 -0,5 0,0 0,5 1,0 Active


Factor 1 : 69,60%

Figure 32 Cercle de corrélations

Observations et interprétations :
Le cercle de corrélation est la représentation graphique des corrélations par rapport aux valeurs des axes .
Nous observons que les variables LFA1 ;LFA2 ; NDA ; LEB et NDB sont positivement corrélées par
rapport à l’axe 1 mais quelles sont négativement corrélées par rapport à l’axe 2 .
Les variables PDA ; NFB ; NFA ;LSA et LDB sont négativement corrélées par rapport aux deux axes.

27
Tableau 12:ACP FACTORIEL

BA 34 IDJERAOUI.sta

Factor1 - Factor2 - Factor3 - Factor4 - Factor5 - Factor6 - Factor7 - Factor8 - Factor9 - Factor10 -

LFA1

LFA2

NDA
NDB

NFA
LDB

PDA
NFB

LSA
LSB
GR

Factor Factor Factor Factor Factor Factor Factor Factor Factor Factor
scores for scores for scores for scores for scores for scores for scores for scores for scores for scores for
factor 1 factor 2 factor 3 factor 4 factor 5 factor 6 factor 7 factor 8 factor 9 factor 10

I01 1 33 18 5,5 3 14,5 8,8 10,6 30 11 4 -4,90648297 -1,17290425 -0,247064599 -0,244289302 -1,30869154 -0,524766744 -0,515840461 -0,26120865 0,397987229 0,075257294
I02 1 21 13 3,2 1,2 8,8 6,5 6 23 9 3,2 -0,409926974 -0,63158872 -1,45182931 0,388964175 0,180431589 -0,096097384 -0,451389253 -0,185500608 0,04325845 -0,300633869
I03 1 30 17 6 2,9 13,9 12 10,4 30 12 4,9 -5,27497165 -0,935346285 0,349593068 0,106522662 -0,362142183 -0,285689173 -0,575814188 -0,329546968 -0,006725476 -0,243390456
I04 1 33 18 5,2 3 11,9 7,9 8,9 32 11 3,7 -4,25110816 -1,73287391 -0,90232289 -0,683579199 -0,871175634 -0,381346947 -0,625731757 -0,273695217 -0,14083182 0,101850156
I05 1 36 18 5 2,5 14,4 11,1 8,3 29 14 4,2 -4,77235973 -0,534168155 -1,02132856 -0,205351622 -0,523260979 0,007055604 0,272668011 -0,628473858 0,006285698 0,354602095
I06 1 33 18 4,1 2,1 9,9 8,5 6,5 26 11 3,3 -2,58255399 -1,06012783 -1,7746874 -0,591429891 -0,174483535 -0,210971315 0,344039286 -0,056007374 -0,165439408 -0,063847606
I07 1 26 13 3,9 2 8,8 7,9 6 20 10 5 -1,61466242 -1,35602785 -0,418490605 0,523963568 1,08815344 0,026296721 0,731631197 -0,271157728 0,281324073 -0,179478508
I08 1 18 13 3,2 1,1 9,9 7,5 6 18 8 2,8 0,104534221 0,166616684 -0,984380534 0,358934257 0,102803277 -0,224313014 -0,266502569 0,301123455 0,445297987 -0,199063681
I09 1 25 18 5 2 17,5 16,5 12 28 8 7,2 -5,66095385 0,000677281 1,25521489 3,11339213 0,045209408 -1,13590556 -0,110828353 -0,214794929 -0,15773058 -0,212221362
I10 1 29 17 5 2,5 11,5 9 6 27 9 3,5 -2,77920731 -0,948076281 -0,713599003 -0,810717678 -0,111866236 -0,619384861 -0,116235551 -0,142718358 -0,505698222 0,458675322
I11 1 13 13 3,2 1,2 8 6,1 3,9 18 7 2,8 1,05549875 -0,219125818 -0,957282846 0,019384581 0,929066574 -0,399593636 -0,619569451 0,334943647 0,143543201 0,122511132
I12 1 15 13 3 1,5 10,6 7,1 6,9 22 8 3,5 -0,479145079 -0,392120842 -0,738405312 1,03781114 0,136667456 -0,202095065 -0,960712212 0,246230154 0,395787923 0,142722549
I13 1 20 15 3 1,2 7 6,1 4 20 10 2,2 0,519217338 -0,388439977 -2,10380595 -0,585606751 0,652890205 0,025510078 -0,310229252 0,28315095 0,136828768 -0,127202641
I14 1 20 15 3,2 1,3 7,8 6 4,5 20 7 3,1 0,273021993 -0,725008047 -1,39751304 0,019589892 0,63662444 -0,588946279 -0,08749776 0,209177196 0,008064514 -0,06995142
I15 1 22 17 4 2,1 10,9 8,5 4,5 18 10 3,6 -1,20264101 -0,213190961 -0,682232369 -0,35922268 0,941426323 -0,372713336 0,324735521 0,335468882 0,462402895 0,723762332
I16 1 25 15 3,1 1,1 8 7,8 5 19 11 3,7 -0,555762248 -0,464217932 -1,7422399 0,284494969 0,973192892 0,060880413 0,606838182 -0,114529029 0,282906978 -0,395112881
I17 1 29 15 4,2 2,2 10,9 10 7 19 10 3,2 -2,005008 -0,34769629 -0,660564184 -0,459332398 -0,208404939 0,038016285 0,6698493 0,495723498 0,400025568 -0,083129233
I18 1 34 11 4,5 2,7 9 7,8 5,1 22 11 3 -1,82205119 -1,39435542 -0,870577003 -1,47255127 -0,169359289 0,637331508 0,918600131 -0,166251026 -0,179288187 0,214863209
I19 1 33 11 4,8 2,7 13,5 12 11 23 9 3,8 -3,73711012 -0,659843905 0,4557939 0,272594457 -1,60781148 0,328674471 0,457268792 0,356503948 0,291426792 -0,521418553
I20 1 31 15 5 2 12,5 10 7 23 12 3,4 -2,90044903 -0,074653131 -0,703364947 -0,661983598 -0,276314087 -0,019976177 0,380320552 -0,407888521 0,156958327 -0,033364557

M01 2 25 13 6 2 13,2 14,2 6,6 18 10 3 -2,46912827 1,09061215 0,658055654 -1,08674525 0,001799733 -0,092242775 0,330616255 0,240380085 -0,130884038 -0,191209223
M02 2 22 15 5 1,7 13,1 14,4 6,6 20 11 3,1 -2,31113437 1,19288889 -0,108305292 -0,344790738 0,239788334 -0,002434633 -0,107827863 0,3891839 -0,124949684 -0,022669559
M03 2 23 15 4 1,3 13 14 6,5 22 12 2,9 -2,05868557 1,23913027 -1,03460135 0,144808397 0,026485827 0,280778718 -0,166251359 0,243296499 -0,217354449 0,044316884
M04 2 25 15 5 1,7 15,4 14,3 7,7 20 11 3,6 -3,01652056 1,32140648 0,127804406 0,166239674 -0,223277144 -0,152328518 0,22411051 0,088342405 0,178144286 0,141193094
M05 2 23 15 6,3 2,1 13 14 6,5 22 13 2,5 -2,9185426 1,17186459 0,111508622 -1,61487761 0,168363651 0,135318822 -0,571960416 0,109879544 -0,17808136 -0,105306759
M06 2 22 8 3,2 1,1 13 14 6,5 19 9 3 -0,907634478 1,19247343 -0,416930208 0,89631048 -0,470230916 0,719718899 0,31550077 0,243927597 -0,40053167 0,03684017
M07 2 23 13 4,5 1,5 16,1 15 8,1 22 14 3,1 -3,0353567 1,7966451 -0,333370667 0,357210092 -0,471611285 0,649778055 -0,350438082 -0,062589788 0,237784954 0,225519456
M08 2 23 12 3,9 1,3 13 14,1 6,5 21 9 4,2 -1,91296978 0,723930221 -0,175971054 1,06262661 0,280446799 0,04330993 0,373998043 -0,009917875 -0,495036339 0,033125059
M09 2 25 8 5,1 1,8 14,6 14,6 7,3 19 14 4 -2,84645601 1,16584222 0,618920743 0,147320662 0,133351383 1,0856464 0,422487435 -0,508414245 0,182276906 0,01554952
M10 2 25 15 5,8 1,9 13,9 14,5 7 22 14 3 -3,25406287 1,28285177 -0,111394639 -0,952193568 0,130922701 0,302459477 -0,239336166 -0,077381845 -0,019385685 -0,069717579
M11 2 17 8 5,1 1,7 13 14 6,5 19 14 3,5 -1,92851212 1,28174153 0,611713104 -0,107335152 0,674999327 1,11793965 -0,505263571 -0,234694474 0,140492006 -0,032580305
M12 2 21 15 5,1 1,7 13 14 6,5 19 7 3 -1,80278252 1,06098357 0,314562571 -0,308313386 -0,038209718 -0,650630441 -0,02207303 0,667203403 -0,374439924 -0,035271869
M13 2 25 15 6 2 13 14 6,5 21 11 4,8 -3,3109572 0,421958412 0,705786724 -0,155813097 1,01459556 -0,362389912 0,380879833 -0,337049211 -0,246491937 -0,112265725
M14 2 23 15 5,8 1,9 13,2 14,2 6,6 21 11 4,2 -3,009302 0,750361501 0,526658848 -0,248307274 0,764061929 -0,278453547 0,047628943 -0,11232814 -0,220920125 -0,080012211
M15 2 19 11 3,9 1,3 13,5 14,6 6,8 15 8 3,1 -1,01537487 1,55835429 0,285387677 0,627524588 -0,112434038 0,133942603 0,345711612 0,752893859 0,076751442 -0,014281941
M16 2 24 14 5,2 1,8 17 16,2 8,5 19 9 4,9 -3,56878783 1,34399987 1,17688722 1,13967662 -0,018885568 -0,45640495 0,554721436 0,061014199 0,080372728 0,222352427
M17 2 23 15 5,2 1,7 13,2 14,3 6,6 18 9 3,4 -2,20271269 1,11493502 0,3069512 -0,263547566 0,230708385 -0,392682133 0,320706518 0,442367283 -0,111779362 -0,100584146
M18 2 20 12 6,2 2 13,3 14 6,7 19 11 2,7 -2,29358445 1,32113394 0,829947806 -1,20287752 0,104291991 0,119816911 -0,452089983 0,199045587 -0,059036678 -0,156520517
M19 2 14 8 3,1 1 14 14 7 20 10 3,6 -0,951833962 1,4571488 -0,024650925 1,67159776 0,045174351 0,736975139 -0,592236349 0,130456375 -0,116807165 0,242060217
M20 2 17 8 5,1 1,7 13 14 6,5 19 14 3,5 -1,92851212 1,28174153 0,611713104 -0,107335152 0,674999327 1,11793965 -0,505263571 -0,234694474 0,140492006 -0,032580305

N01 3 14 4 3 1,5 7 4,7 4,1 18 3 2,9 1,95423494 -1,1496272 0,000562925 0,255291224 0,14496401 0,062557276 -0,349406229 0,107562618 -0,384849187 0,026755149
N02 3 13 3 1,5 0,8 6,7 3,8 3,9 17 3 4 2,59260604 -1,28682825 -0,5148385 1,84467509 0,607960691 0,181203741 0,088666202 -0,242837343 -0,195134338 0,032664911
N03 3 18 4 3,9 2,2 7,9 4 5,5 18 4 3,9 0,637773218 -1,81318808 0,827032744 0,172100164 0,145156927 0,032720627 -0,013381286 -0,18861658 0,087080653 -0,008357333
N04 3 17 3 3,2 1,8 8 4 4,9 17 4 3,2 1,41769253 -1,32799587 0,317366263 0,24433666 -0,118113251 0,257746123 -0,011315435 -0,093233591 0,056251738 0,103169203
N05 3 16 4 2,3 1,1 6,8 4 4,7 15 3 2,5 2,45923141 -0,898536351 -0,478002145 0,490334062 -0,263914259 0,1602011 0,096995976 0,28444203 0,080060482 -0,285614898
N06 3 17 3 2,2 1,3 6 3,5 4,2 18 3 2,2 2,51652913 -1,33200106 -0,774444376 0,197903762 -0,426631878 0,375198313 -0,137034936 0,201889836 -0,342598475 -0,143478995
N07 3 18 3 1,8 1 7,1 4,1 4,1 18 4 2,8 2,28190559 -1,07662389 -0,943432095 0,854645452 -0,240744185 0,458322795 0,172036733 -0,132556345 -0,29132051 0,018701114
N08 3 16 3 2,5 1,5 5,9 2,5 4 16 4 2,2 2,58250071 -1,35906477 -0,530261799 -0,146101809 -0,180094202 0,449711798 -0,122970075 0,178859045 0,083751178 -0,064125004
N09 3 14 3 2,6 1,5 7,8 3,8 5 18 4 3 1,84002469 -1,18035472 -0,062935157 0,658631576 -0,154600456 0,331843619 -0,431681857 -0,014885006 0,031276729 0,090100055
N10 3 17 4 4,4 2,6 8,6 4,9 5,1 16 4 4 0,444671057 -1,6544082 1,44220934 -0,165346809 0,380966655 0,023248422 0,117534139 0,012091327 0,187229168 0,298789796
N11 3 18 4 4,2 2,4 7 5 4,9 18 4 3,2 0,803193796 -1,7253045 0,771811157 -0,563196434 0,121601719 0,187991755 -0,119710266 0,150625185 -0,215274226 -0,045199139
N12 3 18 4 5 2,8 8,9 5,7 5,5 16 4 4,2 -0,046870298 -1,66912848 1,86908344 -0,367320917 0,396825841 -0,042547733 0,186658483 -0,009230229 0,143022275 0,177031141
N13 3 18 4 4,9 2,2 9,4 6 6,3 17 4 4,2 -0,086046938 -1,26699848 1,63064026 0,078638391 0,147359559 -0,175872411 0,047115921 -0,292171446 0,103702677 -0,239390674
N14 3 11 3 4,1 2,1 6,5 4,5 4 14 3 3,4 1,86724763 -1,36380359 1,26379969 -0,287682595 0,813407314 0,029258587 -0,275258703 0,25666104 0,051369014 -0,016755659
N15 3 18 3 3,5 2 8,7 5,9 6,1 17 4 3,2 0,804677289 -1,15369297 0,667227475 0,274476705 -0,420465931 0,353816568 -0,000956759 0,192951804 0,047321253 -0,096006765
N16 3 18 3 3,5 2 7 5,1 4,9 16 3 2,9 1,47456635 -1,41213948 0,505831864 -0,191631545 -0,165683889 0,248652623 0,159750977 0,31241223 -0,157995031 -0,143324632
N17 3 18 4 3,3 2 7,8 5 5,5 18 4 3,7 0,857721869 -1,60474181 0,44775252 0,474672373 0,033636851 0,21472935 0,04897569 0,037120854 -0,04104604 -0,019155738
N18 3 18 3 3,6 2,1 8,5 5,9 5,9 17 3 3,1 0,909392 -1,25276604 0,777505057 0,129019261 -0,476610008 0,220872567 0,013047115 0,304566435 -0,095508129 -0,056118473
N19 3 17 4 4,6 2,8 8,9 5,5 5 16 3 3,1 0,596840843 -1,4155074 1,47429391 -0,7671426 -0,123489782 -0,007357554 -0,054677408 0,396647944 0,00052409 0,42490613
N20 3 18 3 4,6 2,7 8 5 5,5 18 4 3,6 0,334677549 -1,83914126 1,36504967 -0,485834113 0,042273676 0,199166272 -0,135282059 0,019062719 -0,067725966 0,075198113

P01 4 12 2 2,6 0,3 9,9 4,9 3,2 11 2 1,6 3,41940458 0,875566874 -0,104338238 0,264811959 -0,549797998 -0,118181469 0,136861601 -0,053376577 0,069288474 0,152264081
P02 4 11 2 2,8 0,3 8,1 4 2,5 10 3 1,9 3,686603 0,542714544 -0,107453786 0,031999237 0,1485636 -0,022717259 0,183707686 -0,1900894 0,175455757 -0,073653306
P03 4 12 2 2,8 0,3 9,4 4,5 3,1 11 3 1,8 3,32587427 0,757476199 -0,094137626 0,163475508 -0,268292006 -0,036309355 0,123963028 -0,234752343 0,165553111 0,032726703
P04 4 10 3 3,8 0,4 9,8 4,3 2,9 11 3 1,9 3,04622478 0,910265241 0,436056333 -0,309269486 0,033714011 -0,417585744 -0,175405881 -0,431258747 0,20143462 0,010436553
P05 4 11 3 3,9 0,4 9,9 5,3 3,2 10 3 1,5 3,01131118 1,18259249 0,442250576 -0,54480535 -0,21076467 -0,328198418 -0,059162148 -0,189877662 0,204016034 -0,140998908
P06 4 11 2 3,3 0,4 9,5 5,2 3 9 2 1,6 3,43183675 0,999534478 0,378152405 -0,195366907 -0,245984268 -0,222881755 0,189790646 -0,002665746 0,170331435 -0,037630543
P07 4 10 2 2,9 0,3 9,9 5 3,2 9 2 1,5 3,59000043 1,11645229 0,212255038 0,078875847 -0,392608114 -0,174654899 0,07797562 0,066693058 0,284416245 0,065498625
P08 4 11 3 3,4 0,5 8,7 4,3 2,8 9 2 1,6 3,4980505 0,72377715 0,287710349 -0,4130079 -0,072616579 -0,347517863 0,151396337 0,03257752 0,248968589 -0,086843626
P09 4 12 2 2,8 0,4 7,4 4,4 2 11 2 1,4 3,88661998 0,432658898 -0,298616368 -0,359889893 -0,050654139 -0,042754058 0,164319435 0,027094232 -0,229981589 -0,05065681
P10 4 12 3 3,6 0,4 8,7 5,3 2,4 12 3 1,8 3,08629678 0,737095564 0,090446765 -0,422446439 0,120162071 -0,243385544 0,020152225 -0,305238473 -0,215882524 -0,087569055
P11 4 10 3 4 0,4 9,2 5 2,9 11 3 1,5 3,11516994 1,02067248 0,39405959 -0,655228361 -0,02958899 -0,346604248 -0,266388699 -0,250898938 0,052629196 -0,195925386
P12 4 11 3 3,8 0,4 9,9 5,3 3,2 11 2 1,5 3,05651649 1,06818752 0,419477509 -0,43291266 -0,339464459 -0,459514585 -0,122283685 -0,156072891 0,004055498 -0,096840736
P13 4 12 2 2,8 0,3 9,9 5,3 3,2 11 2 1,4 3,39200726 1,00224001 -0,058395802 0,061900938 -0,607716271 -0,120151431 0,083883291 -0,009172851 -0,000503576 0,08465832
P14 4 13 4 2,5 0,3 10,8 6,5 3,5 12 2 2,2 2,7857745 0,962624076 -0,119743046 0,764210384 -0,377653795 -0,315344353 0,300453241 0,005934267 -0,068949366 0,270043852
P15 4 13 4 2,8 0,3 10 5,1 3 12 4 1,7 2,94912056 0,95951161 -0,414323508 0,072855343 -0,252472012 -0,086935086 0,090162818 -0,213731668 0,148328977 0,187677114
P16 4 13 3 2,9 0,4 9,8 5,2 3 13 4 1,8 2,86585468 0,787328418 -0,294779397 0,059909868 -0,243561635 0,028918375 0,003752922 -0,302058049 -0,013067667 0,182689387
P17 4 13 4 3,1 0,5 9 5,3 2,9 13 2 1,8 2,98181618 0,533273081 -0,142103762 -0,081400057 -0,212618183 -0,359991592 0,043191479 -0,045522828 -0,252746044 0,049876246
P18 4 12 3 2,5 0,3 10 6,9 3 13 4 1,8 2,90851271 1,05981248 -0,407013396 0,403688411 -0,197518563 0,193816762 0,003085498 -0,043721387 -0,195750267 0,237430861
P19 4 13 4 3,6 0,4 8,2 5,9 2,5 13 4 1,8 2,82150883 0,689575505 -0,185323284 -0,492835946 0,241068641 -0,13165513 -0,008283345 -0,262652862 -0,296080393 -0,227061076
P20 4 13 3 3,9 0,5 9 5,5 2,9 13 4 1,8 2,64389957 0,73296157 0,13798045 -0,567798396 0,015701633 -0,127839126 -0,089499424 -0,424041331 -0,168654486 -0,179296605

28
A partie de ce tableau on va faire le nuage de points
Méthodes
➢ « Graph »
➢ « Scater plot »
➢ « Advanced »
➢ Choisir les variables (facteur 1 première case et facteur 2 deuxième case)
➢ «Mark selected subsets (GR=1 ;GR=2 ;GR=3 ET GR4) »
➢ « Save as »
➢ « Ok »
➢ On obtient la représentation graphique des 4 groupes
2,0

1,5
GROUPE 4

1,0 GROUPE 2

0,5
Factor2= (12,49%)

0,0

-0,5 GROUPE 1

-1,0

-1,5
GROUPE 3

-2,0
-8 -6 -4 -2 0 2 4 6
Factor1= (69,60 %)

Figure 33 nuage de points : répartition des groupes par rapport aux facteurs 1 et 2

Observations et interprétations :
Sur cette représentation graphique nous observons que
Le nuage de point représentant le groupe 1 est plutôt dispersé, les valeurs des variables sont
moyennement corrélées par rapport aux facteur 1 et facteur 2
Le nuage de point représentant le groupe 2 est plutôt serré, les valeurs des variables sont fortement
corrélées par rapport au facteur 2 mais faiblement corrélées par rapport au facteur 1
Le nuage de point représentant le groupe 3 est serré les valeurs des variables sont fortement
corrélées par rapport au facteur 1 mais faiblement corrélées par rapport au facteur 2

29
Le nuage de point représentant le groupe 4 est très serré, les valeurs sont fortement corrélées par
rapport aux deux facteurs

II.9. la classification ascendante hiérarchique (CAH)


La classification ascendante hiérarchique (CAH) est une méthode de classification itérative dont le
principe est simple. Objectif c’est d’obtenir une représentation schématique simple d'un tableau de
données complexe à partir d’une typologie (segmentation), c’est à dire d’une partition des n
individus dans des classes, définies par l’observations de p variables.
Méthode :
A partir du fichier de données original nous allons créer 5 autres fichiers
Fichier groupe 1 ; fichier groupe 2 ; fichier groupe 3 ; fichier groupe 4 et fichier groupe moyen
Nous allons calculer les moyennes de chaque groupe puis reporter les résultats obtenus sur le fichier
groupe moyen
Voici ce que nous obtenons
Tableau 13: Données du Groupe 1

NFB NDB LSB LDB LFA1 LFA2 PDA NFA NDA LSA
I01 33 18 5,5 3 14,5 8,8 10,6 30 11 4
I02 21 13 3,2 1,2 8,8 6,5 6 23 9 3,2
I03 30 17 6 2,9 13,9 12 10,4 30 12 4,9
I04 33 18 5,2 3 11,9 7,9 8,9 32 11 3,7
I05 36 18 5 2,5 14,4 11,1 8,3 29 14 4,2
I06 33 18 4,1 2,1 9,9 8,5 6,5 26 11 3,3
I07 26 13 3,9 2 8,8 7,9 6 20 10 5
I08 18 13 3,2 1,1 9,9 7,5 6 18 8 2,8
I09 25 18 5 2 17,5 16,5 12 28 8 7,2
I10 29 17 5 2,5 11,5 9 6 27 9 3,5
I11 13 13 3,2 1,2 8 6,1 3,9 18 7 2,8
I12 15 13 3 1,5 10,6 7,1 6,9 22 8 3,5
I13 20 15 3 1,2 7 6,1 4 20 10 2,2
I14 20 15 3,2 1,3 7,8 6 4,5 20 7 3,1
I15 22 17 4 2,1 10,9 8,5 4,5 18 10 3,6
I16 25 15 3,1 1,1 8 7,8 5 19 11 3,7
I17 29 15 4,2 2,2 10,9 10 7 19 10 3,2
I18 34 11 4,5 2,7 9 7,8 5,1 22 11 3
I19 33 11 4,8 2,7 13,5 12 11 23 9 3,8
I20 31 15 5 2 12,5 10 7 23 12 3,4

Tableau 14:Moyennes des variables du groupe 1

NFB NDB LSB LDB LFA1 LFA2 PDA NFA NDA LSA
Mean 26,3 15,15 4,205 2,015 10,965 8,855 6,98 23,35 9,9 3,705

30
Tableau 15:Données du Groupe 2

NFB NDB LSB LDB LFA1 LFA2 PDA NFA NDA LSA
M01 25 13 6 2 13,2 14,2 6,6 18 10 3
M02 22 15 5 1,7 13,1 14,4 6,6 20 11 3,1
M03 23 15 4 1,3 13 14 6,5 22 12 2,9
M04 25 15 5 1,7 15,4 14,3 7,7 20 11 3,6
M05 23 15 6,3 2,1 13 14 6,5 22 13 2,5
M06 22 8 3,2 1,1 13 14 6,5 19 9 3
M07 23 13 4,5 1,5 16,1 15 8,1 22 14 3,1
M08 23 12 3,9 1,3 13 14,1 6,5 21 9 4,2
M09 25 8 5,1 1,8 14,6 14,6 7,3 19 14 4
M10 25 15 5,8 1,9 13,9 14,5 7 22 14 3
M11 17 8 5,1 1,7 13 14 6,5 19 14 3,5
M12 21 15 5,1 1,7 13 14 6,5 19 7 3
M13 25 15 6 2 13 14 6,5 21 11 4,8
M14 23 15 5,8 1,9 13,2 14,2 6,6 21 11 4,2
M15 19 11 3,9 1,3 13,5 14,6 6,8 15 8 3,1
M16 24 14 5,2 1,8 17 16,2 8,5 19 9 4,9
M17 23 15 5,2 1,7 13,2 14,3 6,6 18 9 3,4
M18 20 12 6,2 2 13,3 14 6,7 19 11 2,7
M19 14 8 3,1 1 14 14 7 20 10 3,6
M20 17 8 5,1 1,7 13 14 6,5 19 14 3,5

Tableau 16:Moyennes des variables du groupe 2

NFB NDB LSB LDB LFA1 LFA2 PDA NFA NDA LSA
Mean 21,95 12,5 4,975 1,66 13,725 14,32 6,875 19,75 11,05 3,455

31
Tableau 17:Données du Groupe 3

NFB NDB LSB LDB LFA1 LFA2 PDA NFA NDA LSA
N01 14 4 3 1,5 7 4,7 4,1 18 3 2,9
N02 13 3 1,5 0,8 6,7 3,8 3,9 17 3 4
N03 18 4 3,9 2,2 7,9 4 5,5 18 4 3,9
N04 17 3 3,2 1,8 8 4 4,9 17 4 3,2
N05 16 4 2,3 1,1 6,8 4 4,7 15 3 2,5
N06 17 3 2,2 1,3 6 3,5 4,2 18 3 2,2
N07 18 3 1,8 1 7,1 4,1 4,1 18 4 2,8
N08 16 3 2,5 1,5 5,9 2,5 4 16 4 2,2
N09 14 3 2,6 1,5 7,8 3,8 5 18 4 3
N10 17 4 4,4 2,6 8,6 4,9 5,1 16 4 4
N11 18 4 4,2 2,4 7 5 4,9 18 4 3,2
N12 18 4 5 2,8 8,9 5,7 5,5 16 4 4,2
N13 18 4 4,9 2,2 9,4 6 6,3 17 4 4,2
N14 11 3 4,1 2,1 6,5 4,5 4 14 3 3,4
N15 18 3 3,5 2 8,7 5,9 6,1 17 4 3,2
N16 18 3 3,5 2 7 5,1 4,9 16 3 2,9
N17 18 4 3,3 2 7,8 5 5,5 18 4 3,7
N18 18 3 3,6 2,1 8,5 5,9 5,9 17 3 3,1
N19 17 4 4,6 2,8 8,9 5,5 5 16 3 3,1
N20 18 3 4,6 2,7 8 5 5,5 18 4 3,6

Tableau 18:Moyennes des variables du groupe 3

Descriptive Statistics (groupe 3.sta)


NFB NDB LSB LDB LFA1 LFA2 PDA NFA NDA LSA
Mean 16,6 3,45 3,435 1,92 7,625 4,645 4,955 16,9 3,6 3,265

32
Tableau 19 :Données du Groupe 4

NFB NDB LSB LDB LFA1 LFA2 PDA NFA NDA LSA
P01 12 2 2,6 0,3 9,9 4,9 3,2 11 2 1,6
P02 11 2 2,8 0,3 8,1 4 2,5 10 3 1,9
P03 12 2 2,8 0,3 9,4 4,5 3,1 11 3 1,8
P04 10 3 3,8 0,4 9,8 4,3 2,9 11 3 1,9
P05 11 3 3,9 0,4 9,9 5,3 3,2 10 3 1,5
P06 11 2 3,3 0,4 9,5 5,2 3 9 2 1,6
P07 10 2 2,9 0,3 9,9 5 3,2 9 2 1,5
P08 11 3 3,4 0,5 8,7 4,3 2,8 9 2 1,6
P09 12 2 2,8 0,4 7,4 4,4 2 11 2 1,4
P10 12 3 3,6 0,4 8,7 5,3 2,4 12 3 1,8
P11 10 3 4 0,4 9,2 5 2,9 11 3 1,5
P12 11 3 3,8 0,4 9,9 5,3 3,2 11 2 1,5
P13 12 2 2,8 0,3 9,9 5,3 3,2 11 2 1,4
P14 13 4 2,5 0,3 10,8 6,5 3,5 12 2 2,2
P15 13 4 2,8 0,3 10 5,1 3 12 4 1,7
P16 13 3 2,9 0,4 9,8 5,2 3 13 4 1,8
P17 13 4 3,1 0,5 9 5,3 2,9 13 2 1,8
P18 12 3 2,5 0,3 10 6,9 3 13 4 1,8
P19 13 4 3,6 0,4 8,2 5,9 2,5 13 4 1,8
P20 13 3 3,9 0,5 9 5,5 2,9 13 4 1,8

Tableau 20:Moyennes des variables du groupe 4

NFB NDB LSB LDB LFA1 LFA2 PDA NFA NDA LSA
Mean 11,75 2,85 3,19 0,375 9,355 5,16 2,92 11,25 2,8 1,695

33
Tableau 21 : Moyennes des variables des 4 groupes

NFB NDB LSB LDB LFA1 LFA2 PDA NFA NDA LSA
GR1 26,3 15,15 4,205 2,015 10,965 8,855 6,98 23,35 9,9 3,705
GR2 21,95 12,5 4,975 1,66 13,725 14,32 6,875 19,75 11,05 3,455
GR3 16,6 3,45 3,435 1,92 7,625 4,645 4,955 16,9 3,6 3,265
GR4 11,75 2,85 3,19 0,375 9,355 5,16 2,92 11,25 2,8 1,695

Calcule de la distance euclidienne à partir du tableau 21


Distance Euclidienne : le type de distance le plus couramment utilisé. Il s'agit d'une distance
géométrique dans un espace multidimensionnel. distance(x,y) = {∑ i (xi - yi ) 2 } ½
Méthode : suivre la procédure suivante
➢ « Statistics »
➢ « Multivariate exploratory techniques »
➢ « Cluster analysis »
➢ « Advanced »
➢ « Cases raw »
➢ « Unweight pair groups average »
➢ « Advanced »
➢ Resultat tableau 22

Tableau 22:Matrice de distance euclidienne pour le groupe moyen

GR1 GR2 GR3 GR4

GR1 0,0 8,9 18,6 24,5

GR2 8,9 0,0 17,6 21,5

GR3 18,6 17,6 0,0 8,3

GR4 24,5 21,5 8,3 0,0

Classification hiérarchique ascendante


Méthode : cliquer dans l’ordre sur
➢ « Stistics »
➢ « Multivariate exploratory techniques »
➢ « Cluster analysis »
➢ « Joining tree clustering »
➢ « Advances »
➢ « Cases raw »
➢ « Unweight pair group average »
➢ « Advanced »
➢ « Horizontal hierachical tre plot »
➢ Nous obtenons la figure 35

34
GR1

GR2

GR3

GR4

6 8 10 12 14 16 18 20 22
Distance Euclidienne

Figure 34 Dendrogramme (CAH) avec les valeurs absolues

Pour avoir les distances en pourcentage on clique sur « scale to dink /dmax *100 »

Tree Diagram for 4 Cases


Unweighted pair-group average
Euclidean distances

GR1

GR2

GR3

GR4

30 40 50 60 70 80 90 100 110
(Dlink/Dmax)*100

Figure 35 Distance relative en pourcentage

35
Observations et interprétations :
Les figures n35 et 36 représentent respectivement la classification hiérarchique ascendante avec
valeur de distance euclidienne absolue et les valeurs de distance euclidiennes relative en
pourcentage
Nous observons deux classes comportant deux groupes ayant des similitudes chacune
Classe n1 = groupe 1 +groupe 2
Classe n2 = groupe 3 +groupe 4
On calcule le degré de différence entre le groupe en calculant la longueur des branches ; ainsi donc
nous pouvons conclure que
Les groupe 1et 2 ont environ 43 % de différence
Les groupes 3et 4 ont 40 % de différence

CONCLUSION :

Nous concluons que la bio statistique nous a permis de déchiffrer et d’interpréter un ensemble de
données comportant plusieurs variables (10) et nombre défini d’individus (80) qui n’avaient pas au
premier abord de relation entre elles ; grâce aux différentes analyses (ANOVA ; ACP ;CAH) nous
avons pu établir les relations existent entre les groupes et comment ils évoluent les uns par rapport
aux autres .
De de fait nous constatons l’importance des statistiques en biologie afin de faire évoluer la recherche
et les méthodes d’analyses

PERSPECTIVES :

• Approfondir mes connaissances dans ce domaine en participant à des webinaires ou en assistant à


des formations portantes sur le domaine.
• Utiliser le logiciel plus souvent pour maitriser les différentes fonctionnalités
• Analyser des cas concrets en utilisant logiciel

36

Vous aimerez peut-être aussi