Vous êtes sur la page 1sur 74

Logiciel XLSTAT version 7.

Contact : Addinsoft
40 rue Damrmont
75018 PARIS

2005 - 2006
Logiciels spcialiss en Statistiques

Plan
Prsentation gnrale du logiciel
Statistiques descriptives
Histogramme Discrtisation
Tableau de contingence et Khi deux
Rgression linaire
Codage
Quelques autres fonctionnalits
Sources
Florence Nicolau 2
Prsentation gnrale du logiciel
Logiciels spcialiss en Statistiques

Caractristiques du logiciel
XLSTAT permet dutiliser les techniques
de statistique
danalyse de donnes
de modlisation sans quitter Microsoft Excel

Sa particularit = tre parfaitement intgr Excel.

On lance XLSTAT barre doutils et menu apparaissent

Florence Nicolau 4
Logiciels spcialiss en Statistiques

Caractristiques du logiciel

Une interface intuitive

XLSTAT utilise Excel comme une interface


de rcupration des donnes
et daffichage des rsultats.

Tous les calculs sont raliss en dehors dExcel.

Florence Nicolau 5
Logiciels spcialiss en Statistiques

Quelques applications
Marketing quantitatif
Analyse denqutes
Analyse de portefeuille
Modlisation de risques
Analyse de donnes de survie
Contrle qualit
Analyse sensorielle

Florence Nicolau 6
Logiciels spcialiss en Statistiques

Modules complmentaires XLSTAT Pro


XLSTAT-3DPlot : pour la visualisation de donnes en 3 dimensions.

XLSTAT-Time : pour lanalyse des sries chronologiques

XLSTAT-SPC : pour le contrle statistique des procds

XLSTAT-Life : pour lanalyse de donnes de survie

XLSTAT-Pivot : pour crer des tableaux croiss intelligents

XLSTAT-MX : pour lanalyse sensorielle

XLSTAT-Dose : pour lanalyse des effets de dose

Florence Nicolau 7
Logiciels spcialiss en Statistiques

La barre doutils principale de XLSTAT Pro

Prparation des donnes Description des donnes Analyse des donnes

Visualisation des donnes Modlisation des donnes Tests de corrlation /


association

Tests paramtriques Tests non paramtriques Utilitaires Options

Aide

Florence Nicolau 8
Logiciels spcialiss en Statistiques

Slection des donnes


Slection rapide par colonnes :
Possible seulement si les donnes commence la ligne 1.
Pour slectionner une colonne, on clique sur la lettre de la
colonne. XLSTAT dtecte automatiquement la fin du tableau de
donnes par la prsence d'une ligne vide.
L'option "Libells des colonnes" permet de prciser XLSTAT
si la 1re ligne contient des donnes ou des libells.

Slection multiple possible : on laisse la touche Ctrl enfonce


pendant la slection des colonnes non adjacentes.
Florence Nicolau 9
Logiciels spcialiss en Statistiques

Slection des donnes

Slection par plages


A utiliser quand le tableau de donnes ne
commence pas ds 1re ligne de la feuille Excel.

La plage de donnes est slectionne avec la


souris.

Slection multiple possible : on laisse la touche


Ctrl enfonce pendant la slection de plages de
donnes non adjacentes.
Florence Nicolau 10
Logiciels spcialiss en Statistiques

Slection des donnes

Raccourcis clavier :
On peut slectionner des donnes en
utilisant les touches Ctrl, Shift,
dplacement haut, bas, gauche, droite.

On peut utiliser la touche Tab pour passer


d'un lment au suivant dans la bote de
dialogue.
Florence Nicolau 11
Logiciels spcialiss en Statistiques

Affichage des rsultats dans Excel

Dans chaque bote de dialogue,


XLSTAT propose 3 modes d'affichage des rsultats :

Florence Nicolau 12
Logiciels spcialiss en Statistiques

Affichage des rsultats dans Excel

Plage : les rsultats sont affichs dans la feuille


active, partir d'une cellule ( slectionner)
qui sera le coin suprieur gauche de la plage

Feuille : les rsultats sont affichs dans une nouvelle


feuille Excel cre par XLSTAT

Classeur : les rsultats sont affichs dans un


nouveau classeur Excel.
Florence Nicolau 13
Logiciels spcialiss en Statistiques

Affichage des rsultats dans Excel

A propos de l'option "Feuille" : On peut choisir


parmi diffrentes options d'affichage des rsultats.
Cliquer sur le bouton Options

Puis sur l'onglet "Sortie"

Florence Nicolau 14
Logiciels spcialiss en Statistiques

Affichage des rsultats dans Excel

Remarques :

Option "Feuille" :
XLSTAT donne la feuille de rsultats le nom
de la mthode employe (suivi si besoin est dun
numro).

Option "Classeur" :
conseille pour de gros volumes de donnes.

Florence Nicolau 15
Statistiques descriptives
Logiciels spcialiss en Statistiques

Statistiques descriptives
Ouverture par le menu XLSTAT :

Ouverture par la barre


doutils XLSTAT :

Florence Nicolau 17
Logiciels spcialiss en Statistiques

Statistiques descriptives La fentre :

Aprs un clic sur le


bouton Plus, la fentre
complte saffiche

Florence Nicolau 18
Logiciels spcialiss en Statistiques

Statistiques descriptives Ce quil faut complter :

Donnes : slectionner la plage des variables dcrire.


Sil y a des valeurs manquantes dans une colonne,
XLSTAT propose de les ignorer. En cas de refus, le
traitement est abandonn.

" quantitatives " / " qualitatives " :


choisir le type des variables

Libells des colonnes :


cocher si la 1re ligne contient le nom des variables

Florence Nicolau 19
Logiciels spcialiss en Statistiques

Statistiques descriptives Donnes pondres

Poids :
case cocher si on veut pondrer les donnes
puis slectionner la colonne des poids
Les valeurs manquantes dans la colonne Poids sont remplaces
par 0 et impliquent la non prise en compte de la ligne concerne.

Cette fentre Statistiques Descriptives permet ainsi de


faire des calculs que Excel ne sait pas faire.

Exemple : calcul de moyenne, cart type en tenant


compte du poids de chaque observation
Florence Nicolau 20
Logiciels spcialiss en Statistiques

Statistiques descriptives Dfinition de groupes

Descripteur de groupe :
case cocher si une variable doit dfinir des
sous populations (groupes)
puis slectionner la colonne correspondante

Comparer :
case cocher pour comparer les rsultats obtenus
pour chaque groupe avec ceux obtenus pour la
totalit des valeurs.

Florence Nicolau 21
Logiciels spcialiss en Statistiques

Statistiques descriptives Liste des statistiques


calcules dans le cas des donnes quantitatives

Nbr de valeurs utilises : nombre de valeurs


effectivement utilises dans les calculs (les valeurs
manquantes ou poids nul sont exclues)
Nbr de valeurs ignores : nombre de valeurs
manquantes ou de poids nul
Nbr de val. min. : nombre de valeurs gales la valeur
minimale
% de val. min. : pourcentage du nombre de valeurs
gales la valeur minimale
Minimum : valeur minimale

Florence Nicolau 22
Logiciels spcialiss en Statistiques

Statistiques descriptives Liste des statistiques


calcules dans le cas des donnes quantitatives

1er quartile

Mdiane

3me quartile

Maximum : valeur maximale

tendue = maximum - minimum

Florence Nicolau 23
Logiciels spcialiss en Statistiques

Statistiques descriptives Liste des statistiques


calcules dans le cas des donnes quantitatives

Somme des poids des valeurs utilises dans le cas de


donnes pondres
Total : somme des valeurs, ventuellement pondre

Moyenne : ventuellement pondre

Moyenne gomtrique : Elle n'est pas dfinie sil y a


des valeurs ngatives ou nulles.

Moyenne harmonique : Elle n'est pas dfinie sil y a des


valeurs nulles.
Florence Nicolau 24
Logiciels spcialiss en Statistiques

Statistiques descriptives Liste des statistiques


calcules dans le cas des donnes quantitatives

Aplatissement (Pearson) :
valeur ngative distribution plus plate que la loi normale
valeur positive distribution plus pointue que la loi normale

Asymtrie (Pearson) : par rapport sa moyenne.


valeur ngative distribution tale vers la gauche
valeur positive distribution tale vers la droite

Aplatissement = le coefficient d'aplatissement calcul


par Excel

Asymtrie = le coefficient d'asymtrie calcul par Excel

Florence Nicolau 25
Logiciels spcialiss en Statistiques

Statistiques descriptives Liste des statistiques


calcules dans le cas des donnes quantitatives

CV : coefficient de variation (cart-type/moyenne)


Variance d'chantillon : variance des donnes
Variance estime : estimation de la variance d'une population
dont les donnes constituent un chantillon (dnominateur = n -1)
cart type d'chantillon
cart type estim
cart absolu moyen = la moyenne des valeurs absolues des
carts de chaque valeur par rapport la moyenne
cart type de la moyenne
cart absolu mdian = la mdiane des carts la mdiane
Florence Nicolau 26
Logiciels spcialiss en Statistiques

Statistiques descriptives Liste des statistiques


calcules dans le cas des donnes qualitatives

Nbr de modalits : nombre de modalits de la variable

Mode

Effectif mode (dans le cas de donnes non pondres)

Poids mode (dans le cas de donnes pondres)

% mode : frquence relative du mode exprime en %

Frq. rel. mode : frquence relative du mode.

Florence Nicolau 27
Logiciels spcialiss en Statistiques

Statistiques descriptives Liste des statistiques


calcules dans le cas des donnes qualitatives

Pour chaque modalit :


Effectif : dans le cas de donnes non pondres

Poids : dans le cas de donnes pondres

% : frquence relative de la modalit exprime en %

Frq. rel. : frquence relative de la modalit

Florence Nicolau 28
Logiciels spcialiss en Statistiques

Statistiques descriptives Liste des statistiques


calcules dans le cas des donnes qualitatives

Exemple de variable qualitative : variable Parcours


Synthse :
Nbr. De Nbr. de Nombre Frq.
Frquence %
Variable donnes donnes de Mode rel.
mode mode
utilises ignores modalits mode
Parcours 64 0 6 SSS 33 51,56 0,516

Parcours / 6 Modalits : Modalit Effectif % Frq. rel.


EEE 12 18,75 0,188
EES 4 6,25 0,063
ESS 13 20,31 0,203
SRR 1 1,56 0,016
SRS 1 1,56 0,016
Florence Nicolau 29
SSS 33 51,56 0,516
Logiciels spcialiss en Statistiques

Statistiques descriptives Graphiques dans le cas des


variables quantitatives
Afficher les graphes X/Y :
Tous les nuages bivaris obtenus
en croisant 2 2
toutes les variables quantitatives

" X/Y et X/X " " X/Y et Q-Q " " X/Y et p-p " : pour
choisir les nuages bivaris afficher
graphiques " Quantile-Quantile " ou Q-Q plots
graphiques " probabilit- probabilit " ou p-p plots
Ils ne peuvent pas tre affichs s'il y a plus de 6 variables ou
plus de 30 000 points.

Florence Nicolau 30
Logiciels spcialiss en Statistiques

Statistiques descriptives Graphiques dans le cas des


variables quantitatives

Exemple de graphe " X/Y et X/X " :


2500
2500
2000
2000
1500 1500

1000 1000

500 500

0 0

6 6
Nombre d'emplois

5 5
4 4
3 3
2 2
1
1
0
0

Nombre d'emplois Salaire net mensuel


Florence Nicolau 31
Logiciels spcialiss en Statistiques

Statistiques descriptives Graphiques dans le cas des


variables quantitatives

Box plots :
graphiques " bote moustaches ".
Non affichs s'il y a plus de 16 variables ou plus de
30 000 points.

Scattergrams : nuages de points univaris.


Non affichs s'il y a plus de 24 variables ou plus de
30 000 points.

Florence Nicolau 32
Logiciels spcialiss en Statistiques

Statistiques descriptives Graphiques dans le cas des


variables quantitatives

Les options pour les box plots et scattergrams

Moyenne, mdiane : pour afficher ces valeurs sur le graphique

Minimum, maximum : pour afficher ces valeurs sur le graphique

" Botes verticales " / " Botes horizontales " :


pour choisir l'orientation des box plots et des scattergrams.

Standardisation : pour supprimer les diffrences d'ordre de


grandeur entre les variables dans les box plots et scattergrams,
(On divise les valeurs de chaque variable par l'cart type)

Florence Nicolau 33
Logiciels spcialiss en Statistiques

Statistiques descriptives Graphiques dans le cas des


variables quantitatives
Exemple de variable quantitative : variable Salaire net mensuel
La variable sexe dfinit 2 groupes.
Box plot 2500
Salaire net mensuel -
total
Box plots

Salaire net mensuel - Salaire net mensuel -


Un homme Une femme

2000

1500

1000

500

Scattergrams Salaire net mensuel -


Scattergrams

Salaire net mensuel - Salaire net mensuel -


2500 total
Un homme Une femme

2000

1500

1000

500

Florence Nicolau 0 34
Logiciels spcialiss en Statistiques

Statistiques descriptives Graphiques dans le cas des


variables quantitatives

Stem and leaf plots :


diagrammes " tige et feuille "

Remarque : Les graphiques gnrs par XLSTAT


peuvent tre modifis comme n'importe quel
autre graphique Excel.

Florence Nicolau 35
Logiciels spcialiss en Statistiques

Statistiques descriptives Graphiques dans le cas des


variables qualitatives

Histogramme
pour le graphique en
tuyaux dorgue

Secteurs
pour le graphique en
secteurs circulaires

Regrouper graphes
pour afficher tous les graphiques sur une feuille part

Florence Nicolau 36
Logiciels spcialiss en Statistiques

Statistiques descriptives Graphiques dans le cas des


variables qualitatives

Exemple de variable qualitative : variable Parcours

Tuyaux dorgue : Secteurs circulaires :


Parcours
Parcours

0,6
EEE
0,5 19%

0,4
EES
0,3 6%
SSS
51%
0,2
ESS
0,1 20%
SRR
0,0 2%
EEE

EES

SRR
ESS

SRS

SSS

SRS
2%

Florence Nicolau 37
Histogramme Discrtisation
Logiciels spcialiss en Statistiques

Histogramme
Ouverture par le
menu XLSTAT

Ouverture par la barre


doutils XLSTAT

Florence Nicolau 39
Logiciels spcialiss en Statistiques

Histogramme La fentre :

Aprs un clic sur le


bouton Plus, la fentre
complte saffiche

Florence Nicolau 40
Logiciels spcialiss en Statistiques

Histogramme Ce quil faut complter :

Il faut slectionner les donnes.

Il faut choisir le type de la variable : discrtes


ou continues

Il faut choisir le type de graphique :


histogramme
polygones de frquences
distribution cumule (courbe cumulative)

Florence Nicolau 41
Logiciels spcialiss en Statistiques

Histogramme Ce quil faut complter :

Et ventuellement, choisir
Le nombre dintervalles pour une variable continue

Le poids pour des donnes pondres

Afficher le tableau avec les rsultats

Florence Nicolau 42
Logiciels spcialiss en Statistiques

Histogramme Les diffrents graphiques :


Histogramme Histogram m e

Pour une variable 14

quantitative continue :
12

10

Courbe cumulative 4

Distribution cum ule 2

1,000 0
480,000 680,000 880,000 1080,000 1280,000 1480,000 1680,000 1880,000
0,900

0,800

0,700
Polygone des Histogram m e

0,600 frquences 14
0,500

12
0,400

0,300
10
0,200
8
0,100

0,000 6
363,000 863,000 1363,000 1863,000

Variable
Florence Nicolau Revenu mensuel net 43
480,000 680,000 880,000 1080,000 1280,000 1480,000 1680,000 1880,000
Logiciels spcialiss en Statistiques

Histogramme Les diffrents graphiques :


Diagramme Histogram m e

Pour une variable en btons 35,000

discrte :
30,000

25,000

20,000

15,000

Courbe cumulative 10,000

5,000

Distribution cum ule 0,000

1,000

0,900 Polygone des


frquences
0,800
Histogram m e

0,700
35,000

0,600
30,000
0,500

0,400 25,000

0,300
20,000
0,200

0,100 15,000

0,000
10,000

5,000

Variable
Florence Nicolau Nombre demplois 0,000 44
Logiciels spcialiss en Statistiques

Discrtisation et histogramme
Cas dune variable continue : L'outil "Discrtisation et
histogramme" permet de crer librement des classes.

Ouverture par le menu XLSTAT

Ouverture par la barre


doutils XLSTAT

Florence Nicolau 45
Logiciels spcialiss en Statistiques

Histogramme La fentre :

Aprs un clic sur le


bouton Plus, la fentre
complte saffiche

Florence Nicolau 46
Logiciels spcialiss en Statistiques

Discrtisation et histogramme La fentre :

On coche Dfinie par


lutilisateur .
L'option Liste des
bornes est active.
On slectionne la liste de
bornes.
On clique Importer .
Florence Nicolau 47
Logiciels spcialiss en Statistiques

Discrtisation et histogramme La fentre :

Les bornes et les


frquences apparaissent
dans la partie infrieure
de la bote.

On peut ventuellement
modifier les bornes.

Florence Nicolau 48
Logiciels spcialiss en Statistiques

Discrtisation et histogramme Graphique obtenu :

On clique sur Ok et on obtient un histogramme


selon les classes choisies.

Florence Nicolau 49
Tableau de contingence et Khi
deux
Logiciels spcialiss en Statistiques

Tableau de contingence ( Tableau crois) et


Khi deux
Ouverture par le menu XLSTAT

Ouverture par la barre doutils XLSTAT

Florence Nicolau 51
Logiciels spcialiss en Statistiques

Tableau de contingence La fentre :

Aprs un clic sur le


bouton Plus, la fentre
complte saffiche

Florence Nicolau 52
Logiciels spcialiss en Statistiques

Tableau de contingence La fentre :


On slectionne la variable mettre en ligne et celle
mettre en colonne.
On slectionne
ventuellement le poids
des donnes
On choisit les effectifs,
les frquences totales ou
conditionnelles
On peut calculer un test
du Khi et afficher les
effectifs thoriques, les
contributions au Khi.
Florence Nicolau 53
Logiciels spcialiss en Statistiques

Tableau de contingence Les rsultats :

Tableau des nij et fj/i :

Khi deux :

Florence Nicolau 54
Rgression linaire
Logiciels spcialiss en Statistiques

Rgression linaire
Ouverture par le
menu XLSTAT

Ouverture par la barre


doutils XLSTAT

Florence Nicolau 56
Logiciels spcialiss en Statistiques

Rgression linaire La fentre :

La Variable
dpendante est la
variable explique
(variable modliser)

La Variable
quantitative est la
variable explicative.

Exemple : On veut expliquer le poids par la taille .


La variable dpendante est le poids .
La variable quantitative est la taille .
Florence Nicolau 57
Logiciels spcialiss en Statistiques

Rgression linaire Les rsultats :

Florence Nicolau 58
Logiciels spcialiss en Statistiques

Rgression linaire Le 1er graphique :

Ce graphique permet de visualiser :


les donnes,
la droite de rgression,
les deux intervalles de
confiance.

Florence Nicolau 59
Codage
Logiciels spcialiss en Statistiques

Codage
Ouverture par le
menu XLSTAT

Ouverture par la barre


doutils XLSTAT

Florence Nicolau 61
Logiciels spcialiss en Statistiques

Modalits -> Codes numriques


Cela permet de remplacer les modalits d'une variable
qualitative par des codes numriques.
Apparat une zone de commentaire sur la cellule
contenant le libell de la variable :
La 1re ligne contient le libell de la variable tel qu'il figure
dans la 1re cellule de la colonne slectionne
La 2e ligne contient par dfaut le libell de la variable : on
peut le remplacer par un libell dtaill
Les autres lignes correspondent aux diffrentes modalits de
la variable, codes partir de 1.

Cette procdure peut tre excute sur plusieurs


colonnes la fois, places n'importe o dans la feuille.

Florence Nicolau 62
Logiciels spcialiss en Statistiques

Codes numriques -> Modalits


Cela permet de remplacer les codes numriques d'une
variable qualitative par les libells des modalits figurant
dans la zone de commentaire de la cellule contenant le
libell de la variable.

Typiquement,
la 1re ligne du commentaire contient le libell abrg de
la variable (ex. " Q9 "),
la 2e contient le libell dtaill de la variable (ex.
" Satisfaction globale "),
les lignes suivantes correspondent aux diffrentes
modalits de la variable, codes partir de 1.
Florence Nicolau 63
Logiciels spcialiss en Statistiques

Codes numriques -> Modalits

Remarques :
Le 0 est considr comme la valeur codant une
valeur manquante.
A l'issue de cette procdure, la zone de commentaire
est supprime.
Si une seule ligne prcde la liste des codes, alors le
contenu de la 1re ligne est considr comme le libell
dtaill de la variable.
Cette procdure peut tre excute sur plusieurs
colonnes la fois.
Florence Nicolau 64
Quelques autres fonctionnalits
Logiciels spcialiss en Statistiques

Scatter plots
Ouverture par le
menu XLSTAT

Ouverture par la barre


doutils XLSTAT

Florence Nicolau 66
Logiciels spcialiss en Statistiques

Scatter plots La fentre :

Aprs un clic sur le


bouton Plus, la fentre
complte saffiche

Florence Nicolau 67
Logiciels spcialiss en Statistiques

Scatter plots Un exemple :

Exemple : pour un groupe de patients qui ont suivi un


rgime, on a relev
leur poids avant le rgime (kg),
le poids qu'ils ont perdu,
leur satisfaction quant aux rsultats du rgime
leur ge.
Libells des Taille des
En X En Y Groupes
individus cercles
Poids Poids perdu Age Satisfaction
Patient1 86 3 39 Non
Patient2 91 11 42 Oui
Patient3 91 8 57 Oui
Florence Nicolau 68
Logiciels spcialiss en Statistiques

Scatter plots Le graphique :

Florence Nicolau 69
Logiciels spcialiss en Statistiques

Scatter plots Le graphique :

Pour amliorer la lisibilit


du graphique, modifier
lchelle de laxe des
abscisses :
Visualisation des donnes
AxesZoomer

Ltiquette "2" signifie que deux observations sont superposes.


Florence Nicolau 70
Logiciels spcialiss en Statistiques

Analyse de donnes
Analyse en Composantes Principales (ACP),

Analyse Factorielle Discriminante (AFD),

Analyse Factorielle des Correspondances (AFC),

Analyse des Correspondances Multiples (ACM ou AFCM),

Classification Ascendante Hirarchique (CAH),

Nues dynamiques (k-means),

Florence Nicolau 71
Logiciels spcialiss en Statistiques

Modlisation
Ajustement d'une loi de probabilit,

Rgression,

ANOVA / ANCOVA (tests de comparaisons multiples),

Rgression logistique,

Rgression non-linaire,

Florence Nicolau 72
Logiciels spcialiss en Statistiques

Tests dhypothses
Tests sur les tableaux de contingence,

Tests de corrlation,

Tests paramtriques pour la comparaison de


deux chantillons

Tests non-paramtriques

Florence Nicolau 73
Logiciels spcialiss en Statistiques

Sources
Brochure Xlstat

Tutoriels de Xlstat

Rubriques daide de Xlstat

Site web : http://www.xlstat.com

Florence Nicolau 74