Biostat 2

INTRODUCTION
La biostatistique est une branche de la statistique appliquée à la biologie

et à la médecine. Elle utilise des méthodes statistiques pour analyser des
données biologiques et médicales afin d'obtenir des informations
significatives et des conclusions scientifiques.
La biostatistique joue un rôle essentiel dans la conception d'expériences,
la collecte de données, l'analyse statistique et l'interprétation des
résultats dans le domaine de la santé et des sciences de la vie.
La biostatistique est largement utilisée dans des domaines tels que
l'épidémiologie, la recherche médicale, la pharmacologie, la génétique,
l'écologie et d'autres disciplines liées à la biologie et à la santé. Elle
contribue à prendre des décisions éclairées dans le domaine médical et à
améliorer la compréhension des processus biologiques.
INTERETS DE LA BIOSTATISTIQUE :
La biostatistique présente de nombreux intérêts dans le domaine de la
biologie, de la médecine et des sciences de la vie. Voici quelques-uns des
principaux avantages et intérêts de la biostatistique :
1. Planification des études : La biostatistique aide à concevoir des études
et des expériences de manière rigoureuse, en déterminant la taille
d'échantillon appropriée, en définissant des protocoles expérimentaux et
en minimisant les biais potentiels.
2. Collecte de données : Elle propose des méthodes pour collecter des
données de manière systématique et précise, en minimisant les erreurs
expérimentales et en garantissant la qualité des informations recueillies.
3. Analyse statistique : La biostatistique offre un large éventail de
techniques pour analyser les données, que ce soit pour tester des
hypothèses, estimer des paramètres, comparer des groupes ou identifier
des tendances. Cela permet d'obtenir des conclusions fiables et
significatives.
4. Interprétation des résultats : Elle contribue à interpréter les résultats
de manière appropriée, en mettant en évidence les associations
significatives et en évaluant la validité des conclusions. Cela permet
d'éviter des interprétations erronées ou biaisées.
5.Décisions éclairées : La biostatistique fournit des outils pour prendre
des décisions éclairées dans le domaine médical, que ce soit dans le choix
de traitements, l'évaluation de l'efficacité d'une intervention ou la gestion
des risques.
6. Épidémiologie : En épidémiologie, la biostatistique est essentielle pour
étudier la répartition des maladies dans les populations, évaluer les
facteurs de risque, estimer les taux d'incidence et de prévalence, et
contribuer à la prévention et à la gestion des maladies.
7. Recherche médicale : Elle joue un rôle crucial dans la recherche
médicale en aidant à identifier des associations entre variables, à évaluer
l'efficacité des médicaments et des traitements, et à contribuer au
développement de nouvelles thérapies.
8. Optimisation des ressources : En optimisant la conception des études
et en maximisant l'utilisation des ressources disponibles, la biostatistique
permet une utilisation plus efficace du temps, des budgets de recherche
et des efforts déployés dans le cadre des investigations scientifiques.
INTERETS DU COURS
Le cours sur l'utilisation de Statistica, un logiciel de statistiques et
d'analyse de données, présente plusieurs avantages et intérêts. Voici
quelques raisons pour lesquelles ce cours peut être bénéfique :
1. Maîtrise de l'outil : Apprendre à utiliser Statistica permet de maîtriser
un outil puissant pour l'analyse statistique et la visualisation des
données. Cela peut être utile dans divers domaines tels que la recherche,
la médecine, la finance, l'industrie, etc.
2. Conception d'études : Le cours peut enseigner comment utiliser
Statistica pour concevoir des études et des expériences, en planifiant des
enquêtes, en définissant des protocoles expérimentaux, et en prenant des
décisions éclairées sur la collecte de données.
3. Analyse des données : Statistica offre une variété de techniques
statistiques. Apprendre à les utiliser permet d'analyser efficacement des
ensembles de données, de tester des hypothèses, d'identifier des
tendances et de dériver des conclusions significatives.
4. Visualisation des données : Le cours peut inclure des compétences
pour créer des graphiques et des visualisations à partir des données, ce
qui facilite la communication des résultats de manière claire et
compréhensible.
5. Interprétation des résultats : Comprendre comment interpréter les
résultats générés par Statistica est essentiel. Cela inclut la capacité à
évaluer la signification statistique, à interpréter les intervalles de
confiance et à tirer des conclusions pertinentes à partir des analyses
effectuées.
6. Optimisation des workflows : Apprendre à utiliser Statistica
efficacement peut améliorer la productivité en optimisant les flux de
travail d'analyse des données, en automatisant des tâches répétitives et
en réduisant le temps nécessaire pour obtenir des résultats.
7. Application pratique : Le cours peut fournir des exemples pratiques et
des cas d'utilisation concrets, permettant aux apprenants d'appliquer
leurs connaissances de manière concrète dans des contextes réels.
8. Adaptabilité : En maîtrisant Statistica, les apprenants peuvent être plus

flexibles et adaptables dans leur approche de l'analyse de données, en
fonction des besoins spécifiques de leurs projets ou de leurs domaines
d'application.
PROBLEMATIQUE DU TRAVAIL
On doit faire des analyses sur logiciel statistica 8.0 des données :
-Une démonstration de l’installation du logiciel
- Analyse mono variée d’une variable quantitative
- Analyse bi variée
- Analyse multivariée
Selon la méthode donnée.
OBJECTIF DU TRAVAIL
D’effectuer des analyses statistiques approfondies sur des ensembles de
données. Cela peut inclure des analyses descriptives, des tests
d'hypothèses, des modélisations statistiques, des analyses de régression,
etc.
Utiliser Statistica pour créer des graphiques et des visualisations efficaces
afin de présenter les résultats de manière claire et compréhensible. Cela
peut inclure des histogrammes, des diagrammes en boîte, des graphiques
linéaires, des cartes thermiques, etc.
I/ MATERIEL ET METHODES :
INSTALLATION DE STATISTICA 8.0 :
Pour installer statistica 8.0 on doit tout d’abord recevoir un CD qui
contient le dossier du logiciel (statistca 8.0)
Puis une fenêtre d’installation est ouverte
Insérez la clé CD à 20 chiffres et le code Cliquez sur J'accepte les termes du

temporel alloués, puis cliquez sur Suivant contrat de licence et cliquez sur suivant
Sélectionnez Installation typique puis

Écrivez votre nom, le nom de votre
Il vous demandera la confirmation de
entreprise et le numéro de série
attribué pour Statistica et cliquez sur l'inscription, si les informations sont
suivant. correctes, cliquez sur « OUI »
Dans cette étape il faut bien éteindre tout source de réseaux internet
Remplissez le formulaire d'inscription avec
sélectionnez l'enregistrement manuel et
votre identifiant de messagerie et cliquez
cliquez sur Suivant.
sur suivant
13. Sélectionnez l'emplacement par Vous êtes maintenant prêt à installer

défaut pour installer le logiciel : « C:\ ». Statistica AGA 8.0, cliquez sur Installer.
Et cliquez sur Suivant.
Un écran apparaîtra comme sur l’image,

veuillez ne pas cliquer sur Annuler. L'installation de Statistica est terminée,
L'installation de Statistica prendra quelques cliquez sur le bouton Terminer.
minutes.
Avant de lancer statistica il est bien noté que il faut cracker logiciel en
suivant les etape suivant :
Aller sur le dossier statistica 8.0 puis licences puis statistica8_licences
Puis on met copier pour ce fichier puis on trouve la
cible du logiciel (le dossier où il a était installer)
"C:\Program Files (x86)\StatSoft\STATISTICA 8\statist.exe"
On surprime le fichier ( StatSoftRegistration.txt ) on le remplace par le
fichier copier précédemment
Voilà on a fini l’installation maintenant on lance statistica8.0
Création d’un nouveau fichier (Fichier > Nouveau)

Présentation d’un fichier de données statistiques
-Les données sont saisies sous la forme d’un tableau.
-En colonnes, des variables (soit le nombre d’information que nous avons
pour chaque individu).
-En lignes, des individus (cela peut-être des personnes physiques, des
ménages, des institutions, etc.).
De l’Excel a statistica :
On ouvre une nouvelle fenêtre sur FILE puis on mentionne le nombre de
CASSES and VARIABLE
Puis on va sur l’Excel on va copier tout en sélectionne tout ce qu’il y a
dans l’Excel
Puis dans statistica on va vers l’onglet EDITE puis sur PAST WITH
HEADLS
II/ Résultats et discussions
ANALYSE MONO VARIEE :
Calcule des paramètres statistiques d’une variable
J’ai choisi de travailler sur « la variable LT »
Méthode :
- Cliquer dans l’ordre sur :
- « Statistics ».
- « Basic statistics /tables ».
- « Descriptive statistics », ➢ « Ok ».
- « Advanced statistics », puis cocher tous les paramètres qu’on veut

calculer et choisir une variable.
Calcul des paramètres statistiques de la variable LT

- Cliquer sur « summury »,
- Cliquer sur « edit » puis sur « select all » tout sélectionner ensuite
- cliquer une deuxième fois sur « edit » puis sur « copy with
headers», puis dans le word on colle.
On obtient le tableau suivant :
TABLEAU 1: PARAMETRES STATISTIQUES DE LA VARIABLE LT
Descriptive Statistics (Spreadsheet1)

Val
% Valid Confidence - - Confidence - Geometric - Harmonic - Media Mod
id Mean
obs. 95,000% 95,000 Mean Mean n e
N
Var 100,000 31,27 31,00 Multi
73 26,85307 35,68939 25,59340 20,24213
3 0 123 000 ple

Frequency - Mini Maxi Lower - Upper - Percentile - Percentile - Varia Std.
Sum
of Mode mum mum Quartile Quartile 10,00000 90,00000 nce Dev.
Va 2282 5,300 101,0 358, 18,9
2 14,00000 42,00000 9,900000 53,50000
r3 ,800 000 000 5826 3628

Confidence SD - - Confidence SD - Coef.V Standard - Skewn Std.Err. - Kurto
95,000% +95,000% ar. Error ess Skewness sis
Va 60,554 0,9849 1,538
16,28494 22,62692 2,216324 0,281029
r3 95 06 269
Création de l’histogramme de la variable LT avec test de normalité

- Méthode :
Cliquer dans l’ordre sur :
➢ « Graphs », ➢ Puis cliquer sur « histogrammes »,
➢ puis on doit choisir la variable (LT),
➢catégories (7), puis ok.
➢ Cliquer sur « édit » puis sur « select all » tout sélectionner ensuite
cliquer une deuxième fois sur « édit » puis sur « copy with headers », puis
dans le Word on colle.
Histogram of Var3
Spreadsheet1 12v*73c
Var3 = 73*13,6714*normal(x; 31,2712; 18,9363)
26
24
22
20
18
16
No of obs
14
12
10
0
5,3000 18,9714 32,6429 46,3143 59,9857 73,6571 87,3286 LT
Var3
Figure : HISTOGRAMME DE LA VARIABLE VAR3
Observations et interprétations
Bien que l’observation générale de de la répartition de l’histogramme par
rapport à la ligne rouge (qui représente la loi normale) nous indique que
les colonnes sont majoritairement inclues dedans néanmoins
L’histogramme est presque symétrique.
Ainsi donc c’est la valeur de p pour les tests KSD et LILIFORS qui nous
permettras de faire notre conclusion finale Dans ce cas-ci, P KSD >0.05
P LILIEFORS <0.05
Donc la variable VAR3 ne suit pas la loi normale car la condition pour
suivre la loi normale est que la valeur de p pour les deux tests soit
supérieure à 0.05.
Test T méthode par groupe :
Méthode :
- cliquer dans l’ordre sur :
➢ « Statistics », ➢ « Basic statistis », ➢ « Test t Independent by groups »
➢ « Variable » ; dans mon cas j’ai choisi la variable VAR 3, ➢ « Groups » ;
dans mon cas j’ai choisi le groupe 1(LT«21») et le groupe 2(NFA«32»);
➢ Cliquer sur « édit » puis sur « select all » tout sélectionner ensuite
cliquer une deuxième fois sur « édit » puis sur « copy with headers », puis
➢ On obtient le tableau suivant
T-tests; Grouping: Var9 (Spreadsheet1) Group 1: 21 Group 2: 32
p-
Mean Mean t- d Valid N Valid N Std.Dev. Std.Dev. F-ratio -
p Variance
- 21 - 32 value f - 21 - 32 - 21 - 32 Variances
s
-
Va 39,400 54,650 0,478 9,87724 33,0218
0,807 3 3 2 11,17717 0,158020
r3 00 00 714 7 9
001
Tableau 2 : Test de Student par groupe.
Test t par variable :

Méthode :
➢ « Statistics », ➢ « Basic statistis », ➢ « Test t Independent by variables »
➢ « Variable » ; dans mon cas j’ai choisi dans la case dependent la
variable LT «21» et dans grouping variable (NFA«32»);
➢ Cliquer sur « edit » puis sur « select all » tout sélectionner ensuite cliquer
une deuxième fois sur « edit » puis sur « copy with headers », puis dans le
word on colle.
➢ On obtient le tableau n 3
T-test for Independent Samples (Spreadsheet1) Note: Variables were treated as independent samples
t p - Valid N Valid N
Mean - Mean - t- Std.Dev Std.Dev F-ratio - p -
d separ. 2- - -
Group Group val p df .- .- Varianc Varia
f - side Group Group
1 2 ue Group 1 Group 2 es nces
var.est. d 1 2
Var3 3,9 1 0,0 119
31,271 20,917 3,9737 0,00 18,9362 11,7032 2,61805 0,000
vs. 737 4 001 ,99 73 73
23 81 69 0121 8 2 3 065
Var9 69 4 11 97
Tableau 3: Test de Student par variables
Observations et interprétations :
Nous observons que la valeur de p = 0,158020 donc p >0.05 (non-
significative), par conséquent nous concluons que les moyennes pour les
deux groupes choisis (1 et 2) sont différentes.
df = (valid N21 + valid N32) -2 = (3+2) -2 = 3.
Anova
L'analyse de la variance (ANOVA) uni variée est une méthode statistique
permettant de comparer des moyennes de trois groupes ou plus.
• Méthode des différences significatives :
➢ « Statistics ».
➢ « Anova », ➢ « One way anova », ➢ « Ok ».
➢ « Variable » (dans mon cas j’ai choisis la variable LT dans la case

« Dépendent variable liste »et GR dans la case « categorical predictor »),
➢ « Ok ».
➢ « All affects ».
➢ Cliquer sur « edit » puis sur « select all » tout sélectionner ensuite
cliquer une deuxième fois sur « edit » puis sur « copy with headers », puis
dans le word on colle.
Résultat dans le tableau n 4.
Univariate Tests of Significance for Var3 (Spreadsheet1) Sigma-restricted parameterization Effective

hypothesis decomposition
SS Degr. of - Freedom MS F p
Intercept 40400,00 1 40400,00 232,9126 0,000000
"Var2" 14022,97 4 3505,74 20,2112 0,000000
Error 11794,98 68 173,46
Tableau 4 : Anova pour la variable LT
Observations et interprétation
Nous observons que la valeur de p est inferieure a 0.05.
P<0.05 donc nous déduisons que la moyenne pour le groupe GR n’est pas
égales ; il y a au moins une moyenne parmi les quatre groupes qui diffère
des autres.
• Puisque les 4 moyennes sont différentes nous allons procédera de
nouveaux tests
Tout d’abord on va cliquer sur :
➢ « Anova ».
➢ « One way anova »,
➢ « Ok ».

« Dépendent variable liste »et GR dans la case « categorical predictor »),
➢ « Ok ».
➢ « More results ».
➢ Puis sur « posthoc ».
➢ « Significant difference ».
➢ « Ficher LSD ».
LSD test; variable Var3 (Spreadsheet1) Probabilities for Post Hoc Tests Error: Between MS = 173,46,
df = 68,000
Var2 {1} - 42,278 {2} - 38,072 {3} - 27,728 {4} - 13,133 {5} - 101,00
1 1 0,341473 0,001476 0,000000 0,000049
2 2 0,341473 0,021346 0,000000 0,000016
3 3 0,001476 0,021346 0,001430 0,000001
4 4 0,000000 0,000000 0,001430 0,000000
5 GR 0,000049 0,000016 0,000001 0,000000
Tableau 5: Test LSD différence significative pour la variable VAR3
Observations et interprétations:
P<0.05 dans toutes les cases ce qui confirme notre hypothèse précédente
les moyennes pour les 4 groupes sont différentes.
• Nous allons procéder à un autre test ( méthode des groupe homogénes):
➢ « Anova ».
➢ « One way anova », ➢ « Ok ».

«dependent variable list »et GR dans la case « categorical predictor »), ➢ «
Ok ».
➢ More results.
➢ post-hoc.
➢ « Homogeneous groups », ➢ « FICHER LSD ».
LSD test; variable Var3 (Spreadsheet1) Homogenous Groups, alpha = ,05000 Error: Between MS =
173,46, df = 68,000
Var2 Var3 - Mean 1 2 3 4
4 4 13,1333 ****
3 3 27,7278 ****
2 2 38,0722 ****
1 1 42,2778 ****
5 GR 101,0000 ****
Tableau 6: Test LSD groupe homogène pour la variable LT.
Nous obtenons 4 groupes homogènes
Les moyennes sont classées par ordre croissant ; la moyenne du groupe 4
étant la plus petite et celle du groupe 2 est la plus grande.
Les moyennes de groupe 1, 2 et 3 ne sont pas différentes, seront pas sur
la même colonne.
. Analyse bivariée
Matrice de correlation avec R et P :
La matrice de corrélation permet d'étudier l'association (ou dépendance)
entre deux ou plusieurs variables.
Méthode:
on clique dans l’ordre sur
➢ « Basics statistics ».
➢ « Correlation matrice », ➢ « Ok ».
➢ « Two variable lists ».
➢ « Variable » (choisir toute les variables sauf GR dans les deux cases);
➢ « Summury ».
Resultat tableau n7.
Correlations (Spreadsheet1) Marked correlations are significant at p < ,05000 N=73 (Casewise
deletion of missing data)
Var2 Var3 Var4 Var5 Var6 Var7 Var8 Var9 Var10 NewVar1 NewVar2
Var2 1,00 0,38 0,85 0,78 0,91 0,83 0,92 0,76 0,87 0,98 0,99
Var3 0,38 1,00 0,68 0,65 0,64 0,70 0,60 0,66 0,63 0,50 0,48
Var4 0,85 0,68 1,00 0,97 0,97 0,96 0,95 0,90 0,97 0,91 0,90
Var5 0,78 0,65 0,97 1,00 0,92 0,93 0,90 0,86 0,94 0,85 0,83
Var6 0,91 0,64 0,97 0,92 1,00 0,97 0,99 0,92 0,97 0,97 0,96
Var7 0,83 0,70 0,96 0,93 0,97 1,00 0,96 0,94 0,96 0,90 0,89
Var8 0,92 0,60 0,95 0,90 0,99 0,96 1,00 0,95 0,97 0,97 0,96
Var9 0,76 0,66 0,90 0,86 0,92 0,94 0,95 1,00 0,94 0,86 0,84
Var10 0,87 0,63 0,97 0,94 0,97 0,96 0,97 0,94 1,00 0,94 0,92
NewVar1 0,98 0,50 0,91 0,85 0,97 0,90 0,97 0,86 0,94 1,00 1,00
NewVar2 0,99 0,48 0,90 0,83 0,96 0,89 0,96 0,84 0,92 1,00 1,00
Tableau 7: Matrice des corrélations entre les variables
R = coefficient de corrélation
-1<R <1; plus la valeur de R se rapproche de 1 plus les variables sont
fortement corrélées, et a partir de 0,7 jusqu’a 1, R est significatif.
Dans ce cas de figure toutes les valeurs sont significativement différentes
de 0; les valeurs de R sont comprises entre 0 et 1; c’est à dire 0<R<1.
• Pour une meilleure interprétation de la matrice de corrélation nous

allons étudier les probabilités.
Pour cela il faut cliquer sur:
➢ « Statistics », puis ➢ « Basics statistics », ➢ Continue the current

analysis ➢ « Option », ➢ « Display r,p-levels, and N’s », ➢ « Display long
variables names », ➢ « Summurry ». ➢ Cliquer sur « edit » puis sur «
select all » tout sélectionner ensuite cliquer une deuxième fois sur « edit »
puis sur « copy with headers », puis dans le word on colle.
Nous obtenons le tableau n8.
Correlations (Spreadsheet1) Marked correlations are significant at p < ,05000 N=73 (Casewise
deletion of missing data)
NewVar NewVar
Var2 Var3 Var4 Var5 Var6 Var7 Var8 Var9 Var10
1 2
1,000
Var2 ,3792 ,8527 ,7849 ,9145 ,8253 ,9178 ,7567 ,8734 ,9816 ,9869
0
p=,00 p=0,0 p=,00 p=0,0 p=0,0 p=0,0 p=,00 p=0,0
p= --- p=0,00 p=0,00
1 0 0 0 0 0 0 0
1,000
Var3 ,3792 ,6783 ,6508 ,6375 ,6989 ,6042 ,6557 ,6269 ,5029 ,4760
0
p=,00 p=,00 p=,00 p=,00 p=,00 p=,00 p=,00 p=,00
p= --- p=,000 p=,000
1 0 0 0 0 0 0 0
1,000
Var4 ,8527 ,6783 ,9745 ,9739 ,9616 ,9508 ,8988 ,9674 ,9129 ,8987
0
p=0,0 p=,00 p=0,0 p=0,0 p=0,0 p=0,0 p=0,0 p=0,0
p= --- p=0,00 p=0,00
0 0 0 0 0 0 0 0
1,000
Var5 ,7849 ,6508 ,9745 ,9243 ,9302 ,8960 ,8556 ,9441 ,8514 ,8345
0
p=,00 p=,00 p=0,0 p=0,0 p=0,0 p=0,0 p=0,0 p=0,0
p= --- p=0,00 p=0,00
0 0 0 0 0 0 0 0
1,000
Var6 ,9145 ,6375 ,9739 ,9243 ,9695 ,9871 ,9214 ,9742 ,9665 ,9582
0
p=0,0 p=,00 p=0,0 p=0,0 p=0,0 p=0,0 p=0,0 p=0,0
p= --- p=0,00 p=0,00
0 0 0 0 0 0 0 0
1,000
Var7 ,8253 ,6989 ,9616 ,9302 ,9695 ,9552 ,9354 ,9617 ,9026 ,8877
0
p=0,0 p=,00 p=0,0 p=0,0 p=0,0 p=0,0 p=0,0 p=0,0
p= --- p=0,00 p=0,00
0 0 0 0 0 0 0 0
1,000
Var8 ,9178 ,6042 ,9508 ,8960 ,9871 ,9552 ,9453 ,9742 ,9712 ,9646
0
p=0,0 p=,00 p=0,0 p=0,0 p=0,0 p=0,0 p=0,0 p=0,0
p= --- p=0,00 p=0,00
0 0 0 0 0 0 0 0
1,000
Var9 ,7567 ,6557 ,8988 ,8556 ,9214 ,9354 ,9453 ,9442 ,8569 ,8435
0
p=,00 p=,00 p=0,0 p=0,0 p=0,0 p=0,0 p=0,0 p=0,0
p= --- p=0,00 p=0,00
0 0 0 0 0 0 0 0
1,000
Var10 ,8734 ,6269 ,9674 ,9441 ,9742 ,9617 ,9742 ,9442 ,9364 ,9247
0
p=0,0 p=,00 p=0,0 p=0,0 p=0,0 p=0,0 p=0,0 p=0,0
p= --- p=0,00 p=0,00
0 0 0 0 0 0 0 0
NewVar
,9816 ,5029 ,9129 ,8514 ,9665 ,9026 ,9712 ,8569 ,9364 1,0000 ,9986
1
p=0,0 p=,00 p=0,0 p=0,0 p=0,0 p=0,0 p=0,0 p=0,0 p=0,0
p= --- p=0,00
0 0 0 0 0 0 0 0 0
NewVar
,9869 ,4760 ,8987 ,8345 ,9582 ,8877 ,9646 ,8435 ,9247 ,9986 1,0000
2
p=0,0 p=,00 p=0,0 p=0,0 p=0,0 p=0,0 p=0,0 p=0,0 p=0,0
p=0,00 p= ---
0 0 0 0 0 0 0 0 0
Tableau 8: Matrice de corrélation avec probabilités
Nous observons que les valeurs de p sont significativement différentes de
0
p<0.05 Nous pouvons donc conclure que toutes ces variables sont
significativement corrélées.
P = -1 (les variables sont fortement négative corrélées).
P = 1 (les variables ont fortement positive corrélées).
-Régression linéaire
Méthode :
- On clique dans l’ordre sur:
➢ « Statistics »
➢ « Advanced linear »
➢ « General regression model »
➢ « Simple regression », ➢ « Ok »
➢ « Quick »
➢ « Choisir la variable (LFB1 et NDB )

➢ « More result »
➢ « Assumption »
➢ « Scater plot ».
En nous basons sur le tableau N 6 :
Scatterplot: Var6 by Var4

Var6 = -5,5259+0,9775*x; 0,95 Conf.Int.
120
100
80
60
Var6
40
20
-20
0 20 40 60 80 100 120
Var4 95% confidence
Figure11 : Régression linéaire pour les variables var6 et var4.
Y = ax + b
Nous observons que le nuage de point est éparpillé et dispersé autour de
la droite, ne formant pas une droite parallèle.
Var 6= -5,5259+0,9775*x
Plus la valeur de x augmente plus la valeur de y augmente aussi donc les
deux variables sont positivement corrélées.
L’intervalle de confiance est grand donc nous concluons que les variables
sont faiblement corrélées
Régression linéaire des variables LDB et LFA1 figure 11
Scatterplot: Var5 by Var4

Var5 = -0,6622+1,0468*x; 0,95 Conf.Int.
120
100
80
60
Var5
40
20
-20
0 20 40 60 80 100 120
Var4 95% confidence
Figure 12: Régression linéaire des variables LFB2 et LFB1
LFB2 = -0,6622+1,0468*x.
Plus la valeur de x augmente plus la valeur de y augmente aussi donc les
variables
LFB2 et LFB1 sont positivent corrélées
Nous observons que le nuage de point est serré autour de la droite
formant presque une droite parallèle contrairement au premier cas de
figure
L’intervalle de confiance est étroit donc nous déduisons que les variables
sont fortement corrélées.
. Analyse en composante principale (ACP )
L’ACP va réduire le nombre de variables en définissants des groupes en
corrélations entre les variables.
Méthode :
on clique dans l’ordre sur:
➢ « Statistics », ➢ « Multivariate exploratory technique »;
➢ « Principal componant ; classification analysis »;
➢ « Advanced », ➢ « Choisir toutes les variables sauf GR », puis OK et OK;
➢ « Eigenvalues ».
➢ Resultat tableau n9.
Eigenvalues of correlation matrix, and related statistics (Spreadsheet1) Active variables only
Eigenvalue % Total - variance Cumulative - Eigenvalue Cumulative - %
1 9,698676 88,16978 9,69868 88,1698
2 0,815803 7,41639 10,51448 95,5862
3 0,224312 2,03920 10,73879 97,6254
4 0,177176 1,61069 10,91597 99,2361
5 0,040267 0,36607 10,95623 99,6021
6 0,020413 0,18557 10,97665 99,7877
7 0,010856 0,09869 10,98750 99,8864
8 0,005748 0,05225 10,99325 99,9386
9 0,004582 0,04166 10,99783 99,9803
10 0,001648 0,01498 10,99948 99,9953
11 0,000519 0,00472 11,00000 100,0000
Tableau 9: Analyse en composante principale ACP
Nous allons représenter ces valeurs sur un graphe pour cela nous devons
cliquer sur Screen plot.
➢ « Continue corrent analysis »;
➢ « Screeplot »;
Eigenvalues of correlation matrix

Active variables only
11
10 88,17%
6
Eigenvalue
1 7,42%
2,04%1,61% ,37% ,19% ,10%
,05% ,04% ,01% ,00%
0
-1
-2 0 2 4 6 8 10 12 14
Eigenvalue number
Figure 13 : Représentation graphique de L’ACP

A partir du tableau n9 et de la figure n13, nous allons retenir les valeurs
propres qui sont supérieures à 1.
Nous retenons deux grandes valeurs donc deux grands axes.
Axe 1 = 88.17%, Axe2=7.42%.
Et une petite valeurs qu’est de 0,00%.
Se commence à se stabiliser jusqu’elle arrive à 0,1 %
Corrélation des facleurs avec les variables:

Nous allons procéder au calcul des corrélations entres les facteurs et les
variables pour ce fair:
➢ Cliquer sur « factor ans variables correlation ».

On vas lisser 5 factor comme exemple, les autres est éliminer afin de
suivi ces étapes:
- Sélectionner les facteurs á supprimer
- Edit, puis cliquer sur delet, puis sur variable, OK.
cliquer une
deuxième fois sur « edit » puis sur « copy with headers », puis dans le
word on colle.
Factor coordinates of the variables, based on correlations (Spreadsheet1)
Factor 1 Factor 2 Factor 3 Factor 4 Factor 5
Var2 -0,908120 0,373872 0,171567 -0,066490 0,007687
Var3 -0,655525 -0,705339 0,267718 -0,019768 0,024759
Var4 -0,978604 -0,081849 -0,085659 -0,137517 0,003579
Var5 -0,937497 -0,122850 -0,210719 -0,237935 0,041103
Var6 -0,995404 0,025181 0,016037 -0,003903 -0,042403
Var7 -0,973967 -0,119080 -0,071906 0,026875 -0,171007
Var8 -0,990331 0,064456 0,008791 0,099977 0,014685
Var9 -0,934189 -0,125341 -0,150341 0,292433 0,043195
Var10 -0,985849 -0,010652 -0,107442 0,020946 0,067027
NewVar1 -0,964858 0,229693 0,120124 0,005586 0,010840
NewVar2 -0,954967 0,263015 0,131844 0,010944 0,012653
Tableau 10: Corrélations facteurs-variables.
Pour chaque variable on aura une corrélation avec la nouvelle variable
(facteur 1, facteur 2…).
Les corrélations nous permettent de sélectionner les variables qui
définissent les axes, plus elles seront fortes plus elles contribueront à la
définition des axes.
Nous allons retenir allons retenir les corrélations qui ont une valeur
supérieure ou égale à 0 .9.
Dans ce cas de figure nous allons retenir les deux premiers axes (facteur1
et facteur 2).
Cercle de correlations
➢ Cliquer sur « plot var factors coordinated 2D »;
➢ Cliquer sur « edit » puis sur « select all » tout sélectionner ensuite cliquer
une deuxième fois sur « edit » puis sur « copy with headers », puis dans le
word on colle.
Projection of the variables on the factor-plane ( 1 x 2)
1,0
0,5
Var2
NewVar2
NewVar1
Factor 2 : 7,42%
Var8
Var6
Var10
0,0 Var4
Var7
Var5
Var9
-0,5
Var3
-1,0
-1,0 -0,5 0,0 0,5 1,0 Active

Factor 1 : 88,17%
Figure 13: Cercle de correlations.

OBSERVATIONS ET INTERPRETATIONS :
Nous observons que les variables LDA, LDB, LSA, NKA, LT, RDA, PDB et
NFB sont positivement corrélées par rapport à l’axe 1 mais quelles sont
négativement corrélées par rapport à l’axe 2 .
Le cercle de corrélation est la représentation graphique des corrélations
par rapport aux valeurs des axes .
Nuage de points transformé et complété

Méthode : on clique dans l’ordre sur:
➢ « Advanced », ➢ « Choisir toutes les variables sauf GR dans la case
variables of analysis, et on choisir GR dans la case grouping variable »,
puis OK;
➢ Cases; save cases statistics ( choisir GR); puis cliquer sur ok.
On obtient le tableau n11.
Var1 Factor1 Factor2 Factor3 Factor4 Factor5 Factor6 Factor7 Factor8 Factor9 Factor10 Factor11
-24,7100031 2,33522058 0,51951222 -0,12618832 0,02583392 0,01702647 0,00832922 0,00727005 0,00042045 -0,00604942 -0,00114024
C01 -0,55864683 -0,2852351 -0,494158 0,79945378 -0,08855249 -0,28149489 0,11925995 0,07210157 -0,1201343 -0,02757485 0,01922108
C02 -1,21767534 -0,6120776 -0,68552932 0,60234018 -0,4329248 -0,24076515 -0,06419309 -0,00637135 0,00249539 -0,05307875 -0,0284045
C03 -0,19864593 -0,33788339 -0,23116807 0,11632862 0,27210483 -0,07643753 0,10731587 -0,04925064 -0,17592868 0,05629554 -0,05985837
C04 0,00508499 -0,13947735 -0,31695799 0,63950724 0,63055739 -0,13239572 0,13459259 0,02891384 0,06142907 -0,03562648 0,00986914
C05 -0,28832637 -0,6588236 0,02578101 0,16624529 0,25515417 0,11566959 0,05872031 -0,05314116 0,1191074 0,0428823 -0,00185082
C06 -0,60481089 -1,05584523 0,1966777 0,3814075 0,5702054 0,1909776 0,03800578 0,01302691 -0,03535484 0,06050121 0,00918085
C07 -0,23929259 -0,39167398 -0,14347242 0,25442197 -0,12758287 -0,06179824 -0,03575135 0,05215155 0,11736642 0,08201323 -0,06112313
C08 0,3738047 0,26237073 -0,29836722 0,73055529 0,50910266 0,08430635 0,26724833 -0,03433107 0,06419668 0,00525051 0,00060584
C09 -0,54394718 -0,64002464 -0,21881592 0,27013555 0,1908282 -0,18518822 0,079726 -0,04550976 0,0436518 -0,03536854 -0,02382431
C10 -0,48510101 -0,24105783 -0,47965413 0,57464109 -0,01033838 -0,19628914 0,20281384 0,02943326 -0,06600843 0,00061945 0,00778479
C11 -1,62291144 -1,25360136 -0,19315084 0,36792274 -0,10576366 0,02847848 -0,07232322 -0,11305146 -0,11572985 0,06097683 -0,0413306
C12 -1,13629063 -1,27631428 -0,0460829 0,11734529 -0,19877464 0,25482801 -0,07570977 -0,3440262 -0,14112112 -0,09684238 0,04722997
C13 -0,143451 0,42679294 -1,10715073 0,74834889 0,32122878 0,29224302 -0,20788904 -0,06284508 0,06163103 -0,03698083 -0,01021888
C14 -1,37238093 -0,83137173 -0,55764518 0,90073173 -0,17941576 0,17716121 -0,15251507 0,11553602 0,10431253 0,03245206 0,02709328
C15 -1,88100653 -2,38371764 0,38827277 0,23538843 0,05227628 -0,09681507 -0,12732577 0,13430424 -0,09868951 -0,04716228 -0,00418657
C16 -1,16519689 -0,75561923 -0,62773795 0,53987612 0,05604784 -0,0940589 0,06191564 0,04564753 -0,15908278 -0,03455913 0,01999135
C17 -2,34629941 -2,26969651 0,03571712 0,31964005 0,10629986 -0,29068495 -0,21488101 0,1941927 -0,01209194 0,037142 -0,00124874
C18 -1,96002145 -1,06009473 -0,68590062 0,33949601 -0,25513756 -0,19770428 -0,23260443 -0,16918973 0,08846945 0,0515473 0,08289495
M01 -0,35324845 -0,77690859 -0,12838033 -0,64511398 -0,24473297 0,10558228 0,07828351 0,03362676 -0,01734631 -0,00982159 -0,02503358
M02 -0,36687454 -0,60826558 -0,33547187 -0,60467794 0,03478188 -0,01131015 0,03965713 -0,00974732 0,05574328 -0,03643366 -0,00435091
M03 -0,24377153 -0,64401035 -0,22250212 -0,22937692 0,00871122 0,26238457 0,08489864 0,0509708 0,04348193 -0,08660025 -0,00451445
M04 -0,85082919 -1,02511832 -0,31474432 -0,8780134 -0,09921392 -0,13939097 0,06537994 0,02857592 0,04414643 -0,01385132 -0,00586651
M05 -0,00491877 -0,43818399 -0,15942702 0,06825964 -0,0543512 0,39655686 -0,07731406 0,07493958 -0,01543312 -0,04756407 -0,02673033
M06 -0,04176483 0,15089611 -0,77942032 -0,58741857 -0,15934868 -0,12405985 0,09576106 -0,02837988 0,0375097 0,00669441 -0,00792425
M07 -0,49608012 -0,71478773 -0,27203906 -0,29999435 0,07041693 0,16387788 -0,10036463 0,03313206 -0,04290291 -0,00902471 -0,01763987
M08 -0,05837427 -0,09116534 -0,45831283 -0,26838513 -0,17067235 0,06367546 0,19349337 0,04127929 0,08413224 0,01393714 0,0342427
M09 -0,9426637 -1,16556625 -0,26604512 -0,98077971 0,02191007 0,12941814 0,03813195 -0,02454312 0,0194993 0,01192452 -0,00295431
M10 -0,47783439 -0,58373497 -0,42644093 -0,30564562 -0,11555841 0,22615481 -0,11113575 0,06689925 0,0288028 -0,0140354 -0,03055859
M11 -0,08353733 -0,05596897 -0,52403922 -0,53847839 0,39198287 0,03562229 -0,18650288 -0,13464895 0,0198158 0,0740637 -0,00512284
M12 0,06791031 -0,26129416 -0,25983366 -0,4444352 -0,09176678 -0,10445211 0,1946279 0,00491685 0,02434299 -0,03763512 0,00828737
M13 -0,55692031 -0,86376837 -0,12114777 -0,49012598 -0,12664804 0,14579354 0,14287523 0,07045611 0,1208482 0,02021394 0,03344909
M14 -0,30880766 -0,77472507 0,04907521 -0,25681159 -0,041607 0,13985647 0,00412689 0,06743885 0,07559911 0,02798701 0,01386752
M15 -0,10377552 -0,56775834 -0,06034197 -0,93470823 0,09749 -0,20048308 0,07952303 -0,11036464 -0,06018263 0,03795326 -0,00933687
M16 -0,14170506 -1,23339935 0,7987794 -0,03004196 -0,12763912 0,40984037 0,24103504 0,0983909 -0,16577278 0,06347049 0,0439732
M17 0,02772108 -0,01338775 -0,47375687 -0,47348994 -0,24506856 0,04286088 0,09982124 -0,0082742 -0,02059562 0,04739425 -0,00397776
M18 -0,28664674 -0,09362891 -0,8149622 -0,8363573 0,11697226 -0,21092956 0,00161193 -0,09084976 0,04702505 -0,01450116 -0,01798137
N01 1,28098987 0,61111394 0,24481266 0,32902916 0,04466548 -0,04599368 0,08623164 -0,01450894 0,08732781 -0,04524856 0,01800145
N02 1,55212937 1,00248034 0,30340051 0,51344499 0,03616102 0,07812395 0,08700192 -0,04054735 0,07839133 0,06840726 -0,00301717
N03 1,02559411 0,71097501 0,12719052 0,36498083 -0,25257546 0,01073652 0,05111583 -0,00677083 0,02537769 0,05874419 -0,00681583
N04 1,23218362 0,92851997 0,04048166 0,36636224 -0,24972843 0,02191796 -0,01450261 -0,04890074 0,00990642 0,04501225 -0,01518697
N05 1,51652227 1,16999771 -0,04794896 0,28045117 -0,24457528 0,09077774 0,09952167 -0,06732201 -0,07817917 0,02754462 -0,02508644
N06 1,34450352 0,9624636 -0,076518 0,40513186 -0,26116636 0,01019219 0,06558893 0,01267103 0,04786485 -0,04992472 -0,01858567
N07 1,30780566 1,04323488 -0,10674893 0,45889794 -0,33403404 0,08198859 -0,00368963 0,02003341 0,06208538 0,00941891 -0,01636887
N08 1,36234501 0,87451047 0,03918053 0,25633383 -0,17215561 0,08476374 0,01179877 -0,0653843 0,00139712 -0,02478716 -0,01860472
N09 1,23366161 0,89082699 -0,01718769 0,2994297 0,04489957 -0,05316535 0,08343591 -0,09839272 0,03444803 -0,02620656 0,00834911
N10 0,31280281 -1,34777592 1,58158526 -0,07989646 0,08310134 -0,08515336 -0,06316496 -0,06186641 0,08807159 -0,02686555 -0,01516564
N11 0,43910032 -0,99697684 1,19791463 0,09225319 -0,01344945 -0,04828711 -0,01592778 0,00684518 0,10537126 -0,0920868 -0,01287338
N12 0,57122749 -0,39422702 0,87449077 0,01052401 -0,13667008 -0,10740875 -0,06901589 -0,05578579 0,04006715 0,05302269 0,01091869
N13 0,82495898 0,17533432 0,55444651 0,26794039 -0,19717884 -0,02730329 -0,0011704 -0,02047244 -0,03402232 0,08117185 0,00745637
N14 1,12496635 -0,23274463 1,08386736 -0,02181344 0,34184164 -0,06960611 0,01277288 -0,1241976 0,03906489 0,00748981 -0,00846133
N15 0,8016329 -0,04955824 0,62994288 0,21574891 -0,15912606 0,00353568 0,0268264 -0,0205572 -0,0507561 -0,00343797 -0,01285323
N16 0,8128457 -0,23736469 0,76974819 0,08692315 -0,19706047 -0,0512378 0,00212386 -0,03616295 0,01982043 -0,03761029 -0,00650571
N17 0,7143436 -0,25025115 0,79749038 0,27796732 -0,12678787 -0,0149323 -0,00800921 0,01175988 0,0455791 0,00020385 -0,00943776
N18 0,79096095 0,07217725 0,4883361 0,13577898 -0,21386589 -0,13785725 0,03072297 -0,053057 -0,00732012 -0,02053228 -0,00346213
Q01 1,38971676 0,73189166 0,13569903 -0,18357752 0,08937991 -0,02289241 -0,06160833 0,0422397 -0,03983755 -0,01113588 0,02170592
Q02 1,568685 0,95580285 0,05872927 -0,15733825 0,07216447 -0,14483071 0,00892805 0,04686415 -0,00815552 -0,02515592 0,02833568
Q03 1,46526134 1,02647947 -0,09032737 -0,18670339 0,04117475 -0,07326196 -0,10697233 0,06692083 -0,01484282 0,02360067 0,01102597
Q04 1,48670396 0,92729226 0,01387602 -0,25144797 0,03532585 -0,0222925 -0,10522936 0,03047019 -0,02038407 0,00862726 0,00271286
Q05 1,46104979 0,73537158 0,22094586 -0,35263732 0,00221957 -0,12441951 -0,00832831 0,03391452 -0,04482937 0,0158742 0,01618264
Q06 1,42228727 0,88265552 -0,03313778 -0,23308154 0,07248894 -0,05654695 -0,07487834 0,06443303 -0,01371577 -0,01293028 0,00138803
Q07 1,52688881 1,03048477 -0,01329988 -0,18998282 0,01479598 -0,01770707 -0,10805521 0,01929425 -0,06040276 0,02668595 0,00819307
Q08 1,44341731 0,79322504 0,16142991 -0,22444632 0,05948493 0,00711945 -0,08228402 0,02934243 -0,03270379 0,02736336 0,0218151
Q09 1,32690433 0,50433286 0,32992388 -0,28459934 0,10730527 -0,01474147 -0,08642946 0,04333153 -0,03156806 0,00959354 0,01602829
Q10 1,36919955 0,71926257 0,10995326 -0,22503319 0,09089106 -0,04841824 -0,07815056 0,04910256 -0,01285345 -0,01632085 0,01444956
Q11 1,44934352 0,79413921 0,09966601 -0,32231628 0,01791779 -0,15669651 0,00661379 0,07120465 -0,02300139 -0,00586322 0,0151244
Q12 1,57712834 1,07134194 -0,0220574 -0,07342494 0,02957562 0,05787203 -0,04192522 0,02380416 -0,02336797 -0,00074903 0,0236951
Q13 1,52007505 0,85694857 0,10725526 -0,09921424 0,05984436 0,05624682 -0,05010818 0,03480205 -0,02856003 -0,02759698 0,01606719
Q14 1,51109769 0,91720427 0,03087168 -0,17176894 0,14591893 -0,00968727 -0,04568362 0,03964545 -0,01303943 -0,00984149 0,02380024
Q15 1,67509135 1,2072266 -0,14507742 -0,05292022 -0,00115451 0,05227174 -0,07946654 0,05057714 -0,03148094 -0,02864411 -0,01853544
Q16 1,69032076 1,19170996 -0,09119603 -0,14894353 0,06530116 0,02598847 -0,09582802 0,00654221 -0,03738175 -0,00717192 -0,00980574
Q17 1,56728446 0,59503892 0,3699281 -0,27488183 0,22455292 0,05307899 -0,08511213 -0,00876595 -0,06288972 -0,04237999 -0,01702587
Q18 1,61820941 1,05576184 -0,03882529 -0,06917299 0,02371045 0,05976925 -0,06578688 0,04021414 -0,03313317 -0,03888007 -0,00997106
Tableau 11: ACP FACTORIEL.

A partie de ce tableau N 11, on va faire le nuage de points.
Méthodes:
- On clique dans l’ordre sur:
➢ « Graph »;
➢ « Scater plot »;
➢ « Advanced »;
➢ Choisir les variables (factor 1 première case et factor 2 deuxième case);
➢ « Ok »;
➢ «Mark selected subsets (GR=1; GR=2; GR=3 ET GR=4) », ➢ « Ok ».
Scatterplot of Factor2 against Factor1

Spreadsheet30 12v*73c
Factor2 = 6,6613E-16-4,6743E-17*x
3
1
Factor2
-1
-2
GR=1
GR=2
GR=3
-3 GR=4
-26 -24 -22 -20 -18 -16 -14 -12 -10 -8 -6 -4 -2 0 2 4 Other
2
Factor1:Factor2: r = -0,0000; p = ---; r = 0,0000
Factor1
Figure 14 nuage de points: répartition des groupes par rapport aux

facteurs 1 et 2
Cluster analysis [La classification ascendante
hiérarchique (CAH)] :
La classification ascendante hiérarchique (CAH) est une méthode de
classification itérative dont le principe est simple. Objectif c’est d’obtenir
une représentation schématique simple d'un tableau de données
complexe à partir d’une typologie (segmentation), c’est à dire d’une
partition des n individus dans des classes, définies par l’observations de
p variables. Cet analyse complète l’ACP.
Méthode :
A partir du fichier de données original nous allons créer 4 autres fichiers
Fichier groupe 1, fichier groupe 2, fichier groupe 3, fichier groupe 4 et
fichier groupe moyen;
Nous allons calculer les moyennes de chaque groupe puis reporter les
résultats obtenus sur le fichier groupe moyen. On a suivi cette méthode
pour calculer la moyenne de chaque groupe :
- Cliquer dans l’ordre sur :
➢ « Statistics », ➢ « Basic statistics /tables ».
➢ « Discreptive statistics », ➢ «Ok».
➢ « Advanced statistics », puis cocher juste nean tous les paramètres

qu’on veut calculer et choisir une variable;
➢ Cliquer sur « summury ».
➢Data
➢transpose
➢file
On obtient les tableaux suivant :
Descriptive Statistics (GROUPE 1)
G
LT LFB1 LFB2 PDB NFB PDA NFA NDA LSA LDA
R
Me 42,4736 17,5842 17,5368 11,4789 24,3684 12,1157 30,3157 14,0526 4,75789 2,45789
1
an 842 105 421 474 211 895 895 316 474 474
Tableau 12: Moyennes des variables du groupe 1.
Descriptive Statistics (GROUPE2)
G
R
Me 38,0722 17,5055 21,3222 8,76111 22,6666 6,88888 19,7777 10,9444 3,44444 1,13333
2
an 222 556 222 111 667 889 778 444 444 333
Tableau 13: Moyennes des variables du groupe 2
G NF
LT LFB1 LFB2 PDB PDA NFA NDA LSA LDA
R B
Me 27,7277 8,09444 5,48333 5,40555 16, 4,92222 16,8888 3,61111 3,25555 1,80555
3
an 778 444 333 556 5 222 889 111 556 556
G
R
Me 13,1333 8,92222 7,67222 2,79444 12,7222 2,83888 12,4444 3,66666 1,81666 0,22222
4
an 333 222 222 444 222 889 444 667 667 2222
Tableau des moyennes par groupe :

Coupiez les tableaux des moyennes des groups par ordre a l’Excel pour
formuler un seul tableau, et on obtient le tableaux :
GR LT LFB1 LFB2 PDB NFB PDA NFA NDA LSA LDA
Mean 1 42,4736842 17,5842105 17,5368421 11,4789474 24,3684211 12,1157895 30,3157895 14,0526316 4,75789474 2,45789474
Mean 2 38,0722222 17,5055556 21,3222222 8,76111111 22,6666667 6,88888889 19,7777778 10,9444444 3,44444444 1,13333333
Mean 3 27,7277778 8,09444444 5,48333333 5,40555556 16,5 4,92222222 16,8888889 3,61111111 3,25555556 1,80555556
Mean 4 13,1333333 8,92222222 7,67222222 2,79444444 12,7222222 2,83888889 12,4444444 3,66666667 1,81666667 0,22222222
Tableau 16 : Moyennes des variables des 4 groupes

Distance Euclidienne : le type de distance le plus couramment utilisé. Il
s'agit d'une distance géométrique dans un espace multidimensionnel.
Distance(x,y) = {∑ i (xi - yi ) 2 } ½.
Méthode : suivre la procédure suivante:
➢ « Statistics »;
➢ « Multivariate exploratory techniques »;
➢ « Cluster analysis»;
➢ « Advanced »;
➢ « Cluster », choisir caser rows;
➢ « Amalgamation », choisir unweight pair groups average;

➢ « Advanced »;
➢ « Distance matrix ».
On obtient le tableau suivant :
Euclidean distances (Spreadsheet14)
GR1 GR2 GR3 GR4
GR1 0,0 14,0 30,0 42,2
GR2 14,0 0,0 23,7 33,9
GR3 30,0 23,7 0,0 16,4
GR4 42,2 33,9 16,4 0,0
Tableau 17: Matrice de distance euclidienne pour le groupe moyen
Dendrogramme avec distance absolues:
Méthode : cliquer dans l’ordre sur :
➢ « Stistics »;
➢ « Multivariate exploratory techniques »;
➢ « Cluster analysis »;
➢ « Continue current analysis ;
➢ « Horizontal hierachical tree plot ».
- Sur le dendrogramme obtenue, cliquer sur le bouton droit de la souris,

puis sur copy.
Tree Diagram for 4 Cases
Weighted pair-group average
Euclidean distances
C_1
C_2
C_3
C_4
10 15 20 25 30 35
Linkage Distance
Figure 15: Dendrogramme (CAH) avec les valeurs de distances absolues.

LA figure n15 représent respectivement le dendrogramme avec les
valeurs de distances
Nous observons deux classes comportant deux groupes ayant des
similitudes chacune;
- Classe n1 = groupe 1 +groupe 2
On calcule le degré de différence entre le groupe en calculant la longueur
des
branches ; ainsi donc nous pouvons conclure que :
Les groupe 1et 2 ont environ 14 DISTANCE de différence
Les groupes 3et 4 ont 16 DISTANCE de difference.
Dendrogramme avec distance absolues:
Pour avoir les distances en pourcentage on clique sur « scale tree to dink
/dmax*100 ».
- Sur le dendrogramme obtenue, cliquer sur le bouton droit de la
souris,puis sur copy.
Tree Diagram for 4 Cases

Weighted pair-group average
Euclidean distances
C_1
C_2
C_3
C_4
30 40 50 60 70 80 90 100 110
(Dlink/Dmax)*100
Figure 16 : Dendrogramme (CAH) avec distances relatives

LA figure 16 représent respectivement le dendrogramme avec et les
valeurs de distance relatives en pourcentage;
Nous observons deux classes comportant deux groupes ayant des
similitudes chacune;
On calcule le degré de différence entre le groupe en calculant la longueur
des branches ; ainsi donc nous pouvons conclure que :
Les groupe 1et 2 ont environ 43% de différence
Les groupes 3et 4 ont 61% de différence.
Conclusion
En conclusion, le travail d'analyses monovariée, bivariée et multivariée

réalisé avec le logiciel Statistica a fourni des insights significatifs. Les
analyses monovariées ont permis une compréhension approfondie des
caractéristiques individuelles des variables. Les analyses bivariées ont
révélé des relations et des associations spécifiques entre deux variables,
tandis que les analyses multivariées ont exploré des relations complexes
entre plusieurs variables simultanément.
Les résultats ont contribué à répondre aux objectifs de l'étude, mettant en

lumière des tendances, des moyennes, des écarts-types et des relations
cruciales. Cependant, il est important de noter les limitations
méthodologiques et les pistes pour des recherches futures. En résumé,
cette étude a enrichi notre compréhension du sujet, offrant des bases
solides pour des analyses plus approfondies et des implications
potentielles dans le domaine d'application.

Biostat 2

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Biostat 2

Transféré par

Droits d'auteur :

Formats disponibles

INTRODUCTION

La biostatistique est une branche de la statistique appliquée à la biologie

8. Adaptabilité : En maîtrisant Statistica, les apprenants peuvent être plus

Puis une fenêtre d’installation est ouverte

Insérez la clé CD à 20 chiffres et le code Cliquez sur J'accepte les termes du

Sélectionnez Installation typique puis

13. Sélectionnez l'emplacement par Vous êtes maintenant prêt à installer

Un écran apparaîtra comme sur l’image,

Création d’un nouveau fichier (Fichier > Nouveau)

- « Advanced statistics », puis cocher tous les paramètres qu’on veut

Calcul des paramètres statistiques de la variable LT

Descriptive Statistics (Spreadsheet1)

Descriptive Statistics (Spreadsheet1)

Descriptive Statistics (Spreadsheet1)

Création de l’histogramme de la variable LT avec test de normalité

➢ « Graphs », ➢ Puis cliquer sur « histogrammes »,

➢ puis on doit choisir la variable (LT),

➢catégories (7), puis ok.

Figure : HISTOGRAMME DE LA VARIABLE VAR3

Test t par variable :

➢ « Anova », ➢ « One way anova », ➢ « Ok ».

➢ « Variable » (dans mon cas j’ai choisis la variable LT dans la case

Univariate Tests of Significance for Var3 (Spreadsheet1) Sigma-restricted parameterization Effective

➢ « One way anova »,

➢ « Variable » (dans mon cas j’ai choisis la variable LT dans la case

➢ Puis sur « posthoc ».

➢ « One way anova », ➢ « Ok ».

➢ « Variable » (dans mon cas j’ai choisis la variable LT dans la case

➢ « Homogeneous groups », ➢ « FICHER LSD ».

Tableau 6: Test LSD groupe homogène pour la variable LT.

➢ « Two variable lists ».

• Pour une meilleure interprétation de la matrice de corrélation nous

➢ « Statistics », puis ➢ « Basics statistics », ➢ Continue the current

➢ « General regression model »

➢ « Choisir la variable (LFB1 et NDB )

Scatterplot: Var6 by Var4

Figure11 : Régression linéaire pour les variables var6 et var4.

Scatterplot: Var5 by Var4

Figure 12: Régression linéaire des variables LFB2 et LFB1

➢ « Statistics », ➢ « Multivariate exploratory technique »;

➢ « Principal componant ; classification analysis »;

➢ « Advanced », ➢ « Choisir toutes les variables sauf GR », puis OK et OK;

➢ Resultat tableau n9.

➢ « Statistics », ➢ « Multivariate exploratory technique »;

➢ « Principal componant ; classification analysis »;

➢ « Continue corrent analysis »;

Eigenvalues of correlation matrix

Figure 13 : Représentation graphique de L’ACP

Corrélation des facleurs avec les variables:

➢ Cliquer sur « factor ans variables correlation ».

Projection of the variables on the factor-plane ( 1 x 2)

-1,0 -0,5 0,0 0,5 1,0 Active

Figure 13: Cercle de correlations.

Nuage de points transformé et complété

Tableau 11: ACP FACTORIEL.

➢ Choisir les variables (factor 1 première case et factor 2 deuxième case);

➢ «Mark selected subsets (GR=1; GR=2; GR=3 ET GR=4) », ➢ « Ok ».

Scatterplot of Factor2 against Factor1

Figure 14 nuage de points: répartition des groupes par rapport aux

➢ « Statistics », ➢ « Basic statistics /tables ».

➢ « Discreptive statistics », ➢ «Ok».

➢ « Advanced statistics », puis cocher juste nean tous les paramètres

➢ Cliquer sur « summury ».