Académique Documents
Professionnel Documents
Culture Documents
STATISTICA Quick Reference
STATISTICA Quick Reference
STATISTICA Quick Reference
STATISTICA est un systme complet et intgr d'analyse des donnes, de reprsentation graphique, de gestion de bases de donnes et de dveloppement d'applications personnalises,
offrant une large gamme de procdures lmentaires ou avances pour les sciences, le data
mining et toutes les applications industrielles ou commerciales
STATISTICA offre non seulement des procdures gnralistes pour les statistiques, les
graphiques et la gestion analytique des donnes, mais galement un ensemble complet de
mthodes spcialises pour l'analyse des donnes (par exemple, le data mining, les sciences
sociales, la recherche biomdicale ou les applications industrielles et commerciales). Tous les
outils analytiques de la gamme STATISTICA sont des composantes intgres du logiciel. Ces
outils peuvent tre pilots par diverses interfaces-utilisateur, notamment :
Une interface-utilisateur interactive et intuitive (avec la possibilit d'excuter STATISTICA
depuis Microsoft Office ou d'autres applications),
Une interface-utilisateur en client lger, base sur votre navigateur Internet (au travers de
WebSTATISTICA) qui vous permet d'accder STATISTICA depuis tout ordinateur au
monde, pourvu qu'il soit reli Internet, et
Une interface de programmation complte, compatible avec le langage universel .NET
(notamment le langage intgr Visual Basic compatible avec .NET), donnant accs plus
de 14.000 fonctions externes.
CHAPITRE 1 : FONCTIONNALITS
Vous pouvez aisment automatiser et personnaliser l'interface-utilisateur interactive l'aide de
macros ou d'autres mthodes ; les macros sont enregistres sous forme de scripts VB.
L'environnement de dveloppement intgr permet d'interfacer STATISTICA avec d'autres
applications ou avec votre infrastructure informatique ; vous pouvez construire vos propres
extensions personnalises, allant des raccourcis les plus simples des projets de dveloppement avancs grande chelle.
CHAPITRE 1 : FONCTIONNALITS
CHAPITRE 1 : FONCTIONNALITS
proposer, mais rarement les applications de traitement de grosses volumtries de donnes
comme les programmes statistiques ou de data mining.
C'est la raison pour laquelle STATISTICA offre une rapidit, une prcision et un temps de
rponse incomparables, facilits par des fonctions de traitement multiple (ainsi que l'architecture avance de traitement parallle/distribu de type super-ordinateur propose dans la
version Client-Serveur de WebSTATISTICA et disponible directement au travers d'Internet).
L'accs aux donnes utilise une technologie permettant STATISTICA de travailler aussi bien
sur des fichiers de donnes plats stocks en local, qu'en requtant des bases de donnes
multidimensionnelles contenant des Traoctets de donnes stockes dans des entrepts de donnes externes, les calculs tant raliss directement sur le serveur (c'est--dire, sans avoir
importer pralablement les donnes en local ; cette possibilit est offerte dans les versions
entreprise de STATISTICA).
Par exemple, vous pouvez ouvrir simultanment plusieurs instances STATISTICA, chacune
excutant diverses analyses et requtes sur plusieurs fichiers ou bases de donnes et les
rsultats peuvent tre organiss dans des projets distincts. Les fichiers d'entre et de sortie,
ainsi que les graphiques STATISTICA peuvent tre de taille quasi-illimite, y compris des
documents hirarchiques de diffrent type. Les sorties peuvent tre envoyes vers des canaux
de sortie diffrents comme des tableaux multimdia, des classeurs optimiss, des rapports (y
compris sous forme de fichiers .pdf ou de documents Microsoft Office, Internet, ou encore
l'application complmentaire et totalement intgre STATISTICA Gestion Documentaire).
L'une des fonctionnalits majeures de la famille de produits STATISTICA est qu'elle est totalement intgre avec le Web, et sous rserve que le serveur STATISTICA soit install, vous
pouvez accder l'ensemble des fonctionnalits de STATISTICA depuis tout ordinateur connect Internet dans le monde. Vous avez non seulement la possibilit d'excuter des scripts
au travers d'Internet, mais galement une plthore de fonctionnalits interactives, comme des
oprations interactives de construction de modles prdictifs de data mining en glissant simplement des flches dans l'espace de travail de STATISTICA Data Miner (depuis votre navigateur internet, sans aucun logiciel client install). Pour plus d'informations, voir l'Annexe B
WebSTATISTICA, page 297.
Remarque : la plupart des fonctionnalits dcrites dans ce manuel sont disponibles dans tous
les produits de la gamme STATISTICA, mme si certaines sections de cet ouvrage font rfrence certains produits spcifiques comme les fonctionnalits des produits WebSTATISTICA
Server ou STATISTICA Data Miner.
CHAPITRE 1 : FONCTIONNALITS
Nous sommes heureux de vous annoncer qu' ce jour, STATISTICA a reu les meilleures
valuations dans toutes les tudes comparatives indpendantes qui l'ont cit. Dans l'industrie
du logiciel, peu de produits ont reu une reconnaissance aussi unanime.
Pour plus d'informations sur StatSoft et sur cette reconnaissance ingale de STATISTICA,
visitez notre site Internet : http://www.statsoft.fr.
CHAPITRE 1 : FONCTIONNALITS
12/11/09
Lors de l'ouverture initiale de STATISTICA, une feuille de donnes vierge apparat ainsi que la
bote de dialogue Bienvenue dans STATISTICA. La bote de dialogue Bienvenue dans STATISTICA contient un certain nombre d'options permettant d'accder aisment et rapidement aux
fonctions les plus courantes de STATISTICA.
Vous pouvez cocher l'option Ne plus afficher cette bote de dialogue dans la partie infrieure
de la bote de dialogue si vous ne souhaitez plus voir apparatre cette bote de dialogue
l'ouverture de STATISTICA.
La plupart des aspects de STATISTICA, tant au
niveau de l'apparence que des fonctionnalits (notamment les fonctionnalits lmentaires
illustres dans cet exemple comme le canal de sortie vers lequel sont orients les rsultats)
peuvent tre modifis de faon permanente pour rpondre vos prfrences. Par exemple,
mme la premire tape (l'ouverture de STATISTICA) peut tre personnalise ; vous pouvez
modifier le mode d'ouverture en plein-cran, l'apparence de la feuille de donnes, les barres
d'outils, etc...
Dans cet exemple, nous utiliserons le fichier de
donnes Adstudy.sta ; dans le menu Fichier, slectionnez la commande Ouvrir des Exemples
afin d'accder la bote de dialogue Ouvrir un Fichier de Donnes STATISTICA. Double-cliquez sur le rpertoire Fichiers de donnes, puis sur le fichier Adstudy. Vous pouvez galement
ouvrir des fichiers de donnes en utilisant le menu Fichier - Ouvrir qui vous permet de choisir
le lecteur et le rpertoire spcifique contenant le fichier de donnes, en cliquant sur l'un des
boutons
du Panneau de Dmarrage d'une analyse (la premire bote de dialogue qui
menu du bouton
ce stade, assurez-vous qu'aucun bloc (groupe de cellules) n'est en surbrillance dans la feuille
de donnes (pour dslectionner un bloc, cliquez simplement avec le curseur sur une cellule de
la feuille de donnes). Si un bloc est slectionn, STATISTICA considrera que les variables du
bloc ont t intentionnellement prslectionnes pour l'analyse, et produira automatiquement
les rsultats (corrlations) pour les variables slectionnes lorsque vous cliquerez sur les boutons OK ou Synthse, sans vous demander de slectionner les variables.
Dans le Panneau de Dmarrage du module Statistiques lmentaires ci-dessous,
L'onglet Avanc comporte, outre les options disponibles dans l'onglet Base, diverses options
plus spcialises (par exemple, dans notre cas, des options pour enregistrer les matrices,
Dans certains cas, seul l'onglet Base est disponible. Comme pour toutes les botes de dialogue
de STATISTICA, vous pouvez appuyer sur la touche F1 ou cliquer sur le bouton
situ dans
l'angle suprieur droit de la bote de dialogue pour accder l'Aide dans laquelle vous trouverez un descriptif des options de l'onglet respectif.
Les botes de dialogue de STATISTICA sont
des botes de dialogue intelligentes. En effet, lorsque vous n'tes pas sr(e) de l'opration
raliser, il vous suffit de cliquer sur le bouton OK ou sur le bouton Synthse pour laisser STATISTICA vous amener automatiquement l'tape logique suivante (par exemple, la slection
des variables analyser).
Chaque bote de dfinition d'une analyse STATISTICA comporte au
moins un bouton Variables, permettant de spcifier les variables analyser.
Dans notre exemple, cliquons sur le bouton 1 liste
de variables (vous pouvez galement appuyer sur la touche 1). Aprs avoir cliqu sur le bouton
1 liste de variables (ou sur le bouton Synthse si vous n'avez pralablement slectionn aucune
variable dans votre feuille de donnes), une bote de slection des variables apparat. Comme
nous l'avons dj mentionn, si vous avez prcdemment slectionn un bloc de cellules dans
la feuille de donnes, les variables du bloc en surbrillance seront automatiquement slectionnes ; si vous cliquez ensuite sur le bouton Synthse, la matrice de corrlations sera automatiquement produite pour les variables du bloc slectionn.
La bote de dialogue de slection des variables offre diverses possibilits pour slectionner les
variables (vous pouvez notamment utiliser les conventions standard de Windows, MAJ+clic et
CTRL+clic pour slectionner respectivement des listes continues et discontinues de variables).
Cette bote de dialogue offre galement divers raccourcis et options pour examiner le contenu
du fichier de donnes. Par exemple, vous pouvez visualiser la description dtaille ou les formules des variables (en cliquant sur le bouton Rsum/Dtail) ; vous pouvez galement accder la liste des valeurs/modalits d'une variable particulire ainsi qu' diffrentes statistiques
descriptives lmentaires en cliquant sur le bouton Zoom, comme illustr ci-dessous.
Pour cet exemple, cliquez sur le bouton Tout, puis sur le bouton OK pour revenir la bote de
dialogue Matrices de Corrlations. Cliquez ensuite sur le bouton Synthse pour produire la matrice de corrlations par dfaut des variables slectionnes.
Ces graphiques reprsentent non seulement les nuages de points de chaque corrlation, mais
galement la distribution (histogramme) de chaque variable, ainsi que l'quation de la rgression et le coefficient de corrlation respectif.
STATISTICA intgre de nombreux graphiques de ce type afin de synthtiser les statistiques
descriptives, les corrlations, les rsultats des analyses de capabilit, ou encore d'autres types
d'analyses.
STATISTICA Prise en Main 21
Copyright StatSoft, 2010
Pour modifier les options de sortie de l'ensemble des analyses, utilisez l'option (globale) Gestionnaire de Sorties (le volet d'options Analyses/Graphiques : Gestionnaire de Sorties de la
bote de dialogue Options est accessible par le menu Fichier - Gestionnaire de Sorties ou par le
menu Outils - Options), ou slectionnez le bouton d'option Utiliser les paramtres de sortie globaux (toute modification ici va affecter les paramtres globaux) dans la bote de dialogue Gestionnaire de Sorties de l'Analyse/Graphique.
Comme pour tous les classeurs, vous pouvez imprimer, extraire, copier et supprimer les documents individuels (par exemple, feuilles de donnes, graphiques) ou des groupes de documents
STATISTICA Prise en Main 23
Copyright StatSoft, 2010
Pour accder au Manuel lectronique, slectionnez l'option Index dans le menu Aide. Saisissez
ensuite le terme respectif (par exemple, Corrlations) dans le champ Entrez le(s) mot(s)
rechercher de l'onglet Rechercher du Manuel lectronique, puis cliquez sur le bouton Rechercher. Slectionnez enfin la rubrique qui vous intresse dans la liste des rubriques disponibles
(dans notre cas Corrlations Introduction).
Un point important (mme s'il est souvent ignor) sur lequel nous insistons dans le Manuel
lectronique est l'tude des nuages de points dans l'analyse des corrlations. Des coefficients
de corrlations importants et trs significatifs statistiquement peuvent parfois tre entirement
imputables un point particulier (atypique). Si tel est le cas, les coefficients de corrlations
(mme s'ils sont statistiquement significatifs) ne devront pas tre interprts (car ils n'ont
aucun pouvoir prdictif). Dans cette optique, et comme le recommande le Manuel lectronique de Statistiques, penchons-nous un instant sur le nuage de points qui reprsente la relation
entre des variables (mesure par un coefficient de corrlations particulier du tableau).
Lors de l'analyse
d'une feuille de donnes, vous pouvez reprsenter graphiquement les corrlations, par exemple, pour visualiser la corrlation entre les variables Mesure9 et Mesure5.
Pour tracer le nuage de points de ces deux variables, cliquez avec le bouton droit de la souris
sur le coefficient de corrlation correspondant (-0,467199). Dans le menu contextuel qui apparat, slectionnez l'option Graphiques des Donnes d'Entre, puis choisissez l'un des graphiques proposs dans le sous-menu, comme indiqu ci-aprs.
Le graphique nous indique que les donnes n'ont pas une structure atypique et nous n'avons
donc aucune raison de nous proccuper des points atypiques (voir la section sur les points
atypiques page 27 ; voir galement la rubrique sur les points atypiques dans le Manuel lectronique).
Vous noterez au passage que la barre d'outils est
diffrente, maintenant qu'un graphique est actif. La barre d'outils des Outils Graphiques (qui
accompagne les fentres graphiques) offre d'autres options que celle des feuilles de donnes :
Vous trouverez davantage d'informations sur la personnalisation des graphiques, page 202 et
dans le Manuel lectronique.
Retournons prsent notre feuille de donnes.
Vous pouvez partager les feuilles
de donnes en plusieurs volets (jusqu' quatre sections) en dplaant la bote de partage (le
petit rectangle situ en haut de la barre de dfilement verticale ou gauche de la barre de dfilement horizontale). Cette fonction permet de naviguer aisment dans des feuilles de donnes
volumineuses et de comparer des rsultats situs en diffrents endroits. Lorsque vous placez le
curseur de la souris sur la bote de partage, le curseur se transforme en ou en . Pour partager l'cran, maintenez le bouton gauche de la souris enfonc et faites glisser le curseur la
position dsire.
Vous pouvez modifier la position du partage d'cran en dplaant la bote de contrle (maintenant situe entre les deux volets) vers le nouvel emplacement.
Remarque : les volets partags verticalement se dplacent solidairement lorsque vous vous dplacez horizontalement, et les volets partags horizontalement se dplacent ensemble lorsque
vous vous dplacez verticalement. Pour plus d'informations sur la mise en surbrillance de
blocs de donnes couvrant plusieurs volets et sur la slection rapide de cellules, voir la rubrique Comment tendre un Bloc de la Feuille de Donnes en Dehors de l'cran ? dans le Manuel lectronique.
Vous pouvez naturellement utiliser dans STATISTICA l'ensemble des
fonctionnalits Glisser-Dplacer proposes dans les tableurs standard (de type Microsoft
Excel). Par exemple, pour dplacer un bloc, placez le curseur au bord de la slection (le
pointeur de la souris se transforme en flche) puis faites-le glisser jusqu' son nouvel emplacement.
Pour copier un bloc de donnes, placez le curseur au bord du bloc slectionn (le pointeur de
la souris se transforme en flche) puis dplacez la slection un nouvel endroit en appuyant
sur la touche CTRL. Remarque : lorsque vous dplacez la slection, le signe plus (+) apparat
ct du pointeur de la souris pour indiquer que vous copiez le texte et que vous n'effectuez pas
un simple dplacement (voir l'illustration ci-dessous).
Pour insrer un bloc entre des colonnes ou des lignes, placez le curseur au bord du bloc slectionn (le pointeur de la souris se transforme alors en flche) puis dplacez la slection en appuyant sur la touche MAJ.
Si vous placez le curseur entre deux lignes, la barre d'insertion apparatra entre ces deux
lignes ; aprs avoir relch le bouton de la souris, le bloc sera insr entre ces lignes [en crant
autant de nouvelles observations que ncessaire]. De la mme manire, si vous placez le curseur entre deux colonnes, la barre d'insertion apparatra entre ces deux colonnes et le bloc sera
insr entre ces colonnes lorsque vous relcherez le bouton de la souris [en crant autant de
nouvelles variables que ncessaire].
Si vous appuyez galement sur la touche CTRL tout en dplaant la slection (vous verrez alors
un signe plus (+) apparatre ct du pointeur de la souris ; voir l'illustration de la page
suivante), le bloc sera copi et insr, et non pas dplac et insr.
Vous pouvez galement extrapoler une srie de valeurs dans un bloc (Remplissage Automatique) en dplaant la Poigne de Recopie (petit carr noir situ dans l'angle infrieur droit du
bloc).
STATISTICA contient, dans son Manuel lectronique, un descriptif de toutes les procdures et options disponibles dans le programme. Pour accder au Manuel
lectronique de STATISTICA, slectionnez la commande Aide STATISTICA dans le menu Aide
ou cliquez sur le bouton
de la barre d'outils. Pour plus d'informations sur une commande
d'un menu ou sur un onglet particulier, appuyez sur la touche d'aide (F1) lorsque l'lment correspondant est slectionn. Vous pouvez galement accder cette aide contextuelle en appuyant sur la touche F1 ou en cliquant sur le bouton d'aide
dans la barre de titre de toutes les
botes de dialogue (le Manuel lectronique contient plus de 100 Mgaoctets de documentation
compresse).
Grce son organisation dynamique sous forme de liens hypertexte et ses onglets ( Sommaire, Index, Rechercher et Favoris), ainsi qu'aux diverses fonctionnalits permettant de personnaliser le systme d'aide, il est souvent plus rapide d'utiliser le Manuel lectronique que de
rechercher l'information dans les manuels imprims traditionnels.
Les diverses rubriques du Conseiller Statistique contiennent des liens hypertexte qui vous
renvoient directement aux Introductions correspondantes du Manuel lectronique de STATISTICA, prsentant en dtail les mthodes statistiques respectives et leurs procdures.
Pour commencer une analyse ANOVA/MANOVA, slectionnez la commande ANOVA dans le menu Statistiques afin de faire apparatre la bote de dialogue ANOVA/MANOVA Gnrale (Panneau de Dmarrage).
Cette bote de dialogue permet de spcifier des analyses trs simples (par exemple, une ANOVA un Facteur pour un modle avec un seul facteur inter-groupes) ou plus complexes (par
exemple, une ANOVA Mesures rptes pour un modle comportant plusieurs facteurs intergroupes et un facteur intra-groupes).
Pour ce plan 2 x 2 (inter) x 3 (mesures rptes), ouvrez le fichier Adstudy.sta.
Slectionnez l'option ANOVA Mesures rptes en Type d'analyse et les Spcifications rapides
en Mthode de spcification puis cliquez sur le bouton OK dans la bote de dialogue ANOVA/
MANOVA Gnrale afin d'accder la bote de dialogue ANOVA/MANOVA Mesures Rptes.
Sujet 1
Sujet 2
Sujet 3
Niveau #2 :
Mesure2
1
7
8
.
.
.
Niveau #3 :
Mesure3
6
1
2
.
.
.
Nous avons maintenant spcifi le minimum requis par STATISTICA pour effectuer l'analyse, et si nous n'avions pas de facteur de
mesures rptes, nous pourrions simplement appuyer sur le bouton OK pour faire apparatre
les rsultats de l'analyse. Toutefois, dans notre exemple, nous devons indiquer que les trois
variables dpendantes slectionnes doivent tre interprtes comme les trois niveaux d'un
facteur de mesures rptes (facteur intra), sans quoi, STATISTICA considrera que les trois
Remarque : STATISTICA propose ici un facteur de mesures rptes 3 niveaux (avec le nom
par dfaut R1). Vous ne pouvez spcifier qu'un seul facteur intra (mesures rptes) dans cette
bote de dialogue, mais vous pouvez en spcifier davantage dans le module Modle Linaire
Gnral (disponible dans le produit complmentaire Modles Linaires/Non-linaires Avancs).
Appuyez sur la touche F1 (ou cliquez sur le bouton ) dans cette bote de dialogue pour une
prsentation dtaille des plans de mesures rptes avec des exemples dans le Manuel lectronique. Vous pouvez modifier le nom des facteurs (par exemple, changer R1 en RPONSE),
puis cliquer sur le bouton OK pour quitter cette bote de dialogue.
Vous n'avez pas
spcifier manuellement les codes des facteurs inter-groupes [par exemple, pour indiquer
explicitement que la variable Sexe possde deux niveaux : 1 et 2 (ou Homme et Femme)] sauf
si vous ne souhaitez pas que STATISTICA utilise par dfaut tous les codes des variables de
classement slectionnes dans le fichier de donnes. Pour dfinir des codes spcifiques, cliquez sur le bouton Codes facteurs pour accder la bote de dialogue Codes des vars indpendantes (facteurs).
Cette bote de dialogue comporte diverses options. Par exemple, vous pouvez visualiser la liste
des modalits des variables individuelles en cliquant sur le bouton Zoom, puis remplir les
champs des codes (ici, Sexe et Pub) de certaines variables individuelles ou de toutes les variables, etc... Pour le moment, contentons-nous de cliquer sur le bouton OK et laissons STATISTICA remplir automatiquement les champs des codes avec toutes les valeurs distinctes rencontres dans les variables slectionnes,
Cette bote de dialogue se prsente sous forme d'onglets, ce qui permet de localiser rapidement
les options de rsultats. Par exemple, si vous souhaitez raliser des comparaisons planifies,
cliquez sur l'onglet Comps. Pour l'analyse des statistiques sur les rsidus, cliquez sur l'onglet
Rsidus. Pour cet exemple introductif, nous allons nous contenter des rsultats disponibles
dans l'onglet Base.
Pour commencer, examinons le tableau de synthse
de tous les effets de l'ANOVA, en cliquant sur le bouton Tous les effets (ce bouton est
reprsent par une icne reprsentant un tableau et portant la mention SUMM : ).
Le seul effet statistiquement significatif dans cette analyse (si nous ne tenons pas compte de
l'Ordonne l'origine) est l'effet RPONSE (p = 0,007). Ce rsultat peut tre imputable des
moyennes structurellement diffrentes pour l'effet RPONSE (pour plus d'informations, voir la
rubrique ANOVA - Introduction du Manuel lectronique). Examinons prsent le graphique
des moyennes marginales de cet effet pour tenter de trouver une explication.
Pour rappeler la bote de dialogue Rsultats ANOVA (c'est--dire, reprendre l'analyse),
appuyez sur les touches CTRL+R, slectionnez l'option Reprendre l'Analyse dans le menu
Statistiques, ou cliquez sur le bouton Rsultats ANOVA dans la Barre d'Analyse. Lorsque la
bote de dialogue Rsultats ANOVA apparat, cliquez sur le bouton Tous effets/Graphs pour
tudier les moyennes des effets individuels.
Cette bote de dialogue contient une Table de tous les effets (avec la plupart des informations
que vous avez pu voir dans la feuille de donnes Tous les effets) qui permet de reprsenter les
effets individuels sous forme de tracs de moyennes (ou ventuellement, sous forme de feuilles de donnes contenant les valeurs des moyennes respectives).
Le graphique rvle une nette tendance dcroissante : les moyennes des 3 questions successives sont de plus en plus faibles. Bien qu'il n'existe pas d'interaction significative dans ce modle (voir la Table de Tous les Effets, ci-contre), examinons l'interaction de l'ordre le plus
lev pour vrifier la cohrence de cette tendance dcroissante sur les facteurs inter-groupes.
Pour afficher le trac de
l'interaction de l'ordre le plus lev, double-cliquez sur la ligne RPONSE*SEXE*PUB qui
reprsente l'interaction entre les facteurs 1 (Sexe), 2 (Pub) et 3 (Rponse), dans la bote de
dialogue Table de tous les Effets. La bote de dialogue Spcifiez l'organisation des facteurs
dans le trac permet de personnaliser la prsentation par dfaut des facteurs dans le graphique
(contrairement au trac prcdent, le rsultat peut tre reprsent de diffrentes manires).
Cliquez sur le bouton OK pour accepter l'organisation par dfaut et produire le trac des
moyennes.
Comme vous pouvez le constater, cette structure de moyennes (rparties selon les modalits
des facteurs inter-groupes) ne rvle aucun cart significatif par rapport la structure gnrale
du premier trac (pour l'effet principal, RPONSE). Vous pouvez poursuivre l'analyse des
autres effets de manire interactive, en ralisant des comparaisons post-hoc, des comparaisons
planifies, des diagnostiques tendus,
Cet exemple illustre la
manire dont STATISTICA permet d'explorer les donnes de faon interactive : l'utilisateur
n'est pas oblig de dfinir les rsultats produire a priori. Les modles les plus simples
pouvant produire de nombreux tableaux et graphiques, il est souvent difficile de connatre les
rsultats potentiellement intressants sans les visualiser. STATISTICA permet de slectionner
diffrents types de rsultats spcifiques et d'approfondir de faon interactive les tests, puis
d'excuter des analyses conditionnelles complmentaires, une fois les donnes traites et les
sorties initiales produites. Les procdures de calcul de STATISTICA ainsi qu'une large gamme
d'options pour reprsenter toute combinaison arbitraire de rsultats numriques, constituent
autant d'outils pour explorer vos donnes et vrifier vos hypothses.
Toutes les slections ralises au cours d'une analyse interactive (notamment la spcification
du modle et le choix des rsultats produire) sont automatiquement enregistres dans le code
standard en Visual Basic. Vous pouvez sauvegarder ces macros pour une utilisation rpte
(vous pouvez galement les affecter des boutons dans les barres d'outils, les modifier
volont, les combiner d'autres programmes, etc...). Pour plus d'informations, voir le Chapitre
9 - STATISTICA Visual Basic, page 231 ou le Manuel lectronique.
STATISTICA offre une fonctionnalit trs intressante les groupes de variables pour slectionner facilement et rapidement un sous-ensemble de donnes dans des fichiers de donnes
volumineux. Vous pouvez crer des ensembles de variables afin de simplifier l'utilisation rpte des mme groupes de variables, en particulier sur de grosses volumtries.
Ouvrez le fichier de donnes EnginePerformance.sta. Ce fichier contient des donnes relatives
la performance de trs gros moteurs, avec diffrents paramtres process enregistrs lors de
leur fabrication. Nous disposons de donnes collectes lors de la phase de test sur l'Efficacit,
l'conomie en Carburant et la Puissance de 128 moteurs, ainsi que 74 paramtres process collects au moment de la fabrication de chaque moteur.
Pour cet exemple, supposons que nous allons devoir utiliser frquemment le mme ensemble
de variables pour nos diffrentes analyses.
Dans le menu Donnes, slectionnez la commande Gestionnaire de Groupes de Vars afin
d'accder la bote de dialogue Gestionnaire de Groupes Logiques (Personnaliss) de
Variables.
Cliquez sur le bouton Nouveau afin d'accder la bote de dialogue Nouveau Groupe Logique
de Variables.
Saisissez ensuite le nom Production dans le champ Nom du groupe de variables puis cliquez
sur le bouton OK. La bote de dialogue Variables du groupe logique apparat, avec toutes les
variables du fichier de donnes EnginePerformance.sta.
Pour les besoins de nos diffrentes analyses, nous allons slectionner les variables Entre01Entre05, Entre20, Entre30-Entre35 et Entre70. Vous pouvez slectionner ces variables
en utilisant les conventions standard de Windows MAJ+clic et CTRL+clic pour slectionner respectivement des listes continues et discontinues de variables.
Cliquez sur OK pour fermer la bote de dialogue Variables du groupe logique et retourner la
bote de dialogue Gestionnaire de Groupes Logiques (Personnaliss) de Variables.
Si vous souhaitez vrifier les variables dfinies dans un groupe de variables, dplacez le pointeur de la souris sur le nom du groupe dans une bote de dialogue de slection de variables :
une InfoBulle va alors rappeler le numro des variables.
Vous pouvez galement visualiser la liste des variables (avec leur nom) dans la bote de dialogue Gestionnaire de Groupes Logiques (Personnaliss) de Variables en cliquant sur le bouton
[Groupes]. Remarque : les groupes de variables sont associs une feuille de donnes particulire et ne servent qu' slectionner les variables. Vous ne les verrez donc jamais apparatre
dans les rapports ou les rsultats.
Comme vous pouvez le constater, nous avons conomis normment de temps en slectionnant un groupe logique de variables plutt que les variables individuelles qui le composent, et
vit tout risque d'erreur dans le choix des variables de ce fichier de donnes volumineux.
Cet outil puissant d'analyse interactive et exploratoire des donnes, vous permet d'examiner
rapidement s'il existe une structure particulire dans les diffrents groupes, chantillons ou
strates de vos donnes.
Par exemple, vous pouvez raliser une analyse de rgression multiple, et dcider de vous intresser a posteriori, sans quitter la bote de dialogue l'cran, aux rsultats dcomposs en
fonction du Sexe et ventuellement d'autres variables de classement dans vos donnes.
Si vous activez cette option (en cliquant sur le bouton
Par Groupes), tous les rsultats
seront dornavant calculs pour l'ensemble des groupes (option facultative), mais galement
pour chaque combinaison distincte des modalits des variables de classement spcifies (par
exemple, selon le Sexe et d'autres variables de classement), chaque fois que vous cliquerez
sur un bouton de rsultats (par exemple, pour produire une feuille de rsultats ou un graphique
de synthse),
Les rsultats de l'analyse Par Groupes peuvent tre envoys dans des dossiers distincts du
classeur par dfaut, libells selon la condition respective de l'analyse par groupes (par
exemple, Sexe=Femme ; Priode=Aprs1), ou tre envoys dans un dossier commun avec
l'ensemble des autres rsultats.
Par exemple, vous pouvez produire des tracs curvilignes multiples pour dcrire un processus
multidimensionnel par batch, en crant un graphique distinct (trajectoire) pour chaque batch.
Cet exemple utilise le fichier de donnes Tomatoes.sta, dcrit en dtail dans la section Plans
d'Expriences du Manuel lectronique de STATISTICA (voir notamment l'exemple Cration
et Analyse d'un Plan 2332). Connor et Young (dans l'ouvrage de McLean et Anderson, 1984)
rapportent une exprience (tire de Youden et Zimmerman, 1936) sur diverses mthodes de
culture de plants de tomates avant de les repiquer en plein champ.
Commenons par ouvrir le fichier de donnes Tomatoes.sta. Slectionnez pour ce faire la commande Ouvrir des Exemples du menu Fichier afin d'accder la bote de dialogue Ouvrir un
Fichier de Donnes STATISTICA. Double-cliquez sur le dossier Fichiers de donnes, puis
slectionnez et ouvrez le fichier de donnes Tomatoes.sta de STATISTICA.
Cet exemple illustre un cheminement analytique frquent dans l'analyse de donnes de production par batch, c'est--dire lorsque l'objectif de l'analyse consiste vrifier (graphiquement
ou par des calculs) qu'un modle donn ou une certaine distribution s'appliquent tous les
chantillons, gammes ou batches considrs.
Nous allons nous intresser l'impact de la Mthode de Production, de la Condition du Sol et
de la Taille du Pot sur le rendement (Poids), et tester si nous pouvons identifier un modle
spcifique pour chaque Varit de l'tude. Plutt que de raliser une analyse de variance complte (comme dans l'exemple de Plans d'Expriences du Manuel lectronique), nous utiliserons plutt ici une approche graphique et des mthodes visuelles d'inspection.
Dans le menu Graphiques Graphiques en
2D, slectionnez la commande Tracs de Dispersion afin d'accder la bote de dialogue Trac
de Dispersion. Cliquez sur le bouton Variables et dans la bote de dialogue Variables du Trac
de Dispersion, slectionnez la variable Poids comme Variable dpendante et les variables Condition du Sol, Taille du Pot et Mthode de Production comme Variables de classement pour ce
graphique.
Nous allons poursuivre cet exemple en crant un graphique par Variet afin d'illustrer les fonctionnalits Par Groupes. Cliquez pour le moment sur le bouton OK dans la bote de dialogue
de slection des variables.
Pour produire un trac aussi
informatif que possible, rorganisons les variables de telle sorte que la Mthode de Production
devienne le premier facteur dans la liste des Facteurs. Cliquez sur cette variable dans la liste
Facteurs, puis, tout en maintenant le bouton gauche de la souris enfonc, dplacez-la en haut
de la liste.
Cliquez sur le bouton Variable(s) de Classement afin d'accder la bote de dialogue Slectionnez les Variables Par Groupes et spcifiez la Varit comme variable Par Groupes.
Remarque : vous pouvez spcifier plusieurs variables Par Groupes ; dans ce cas, les analyses
ultrieures seront ralises pour chaque combinaison distincte des modalits rencontres dans
les variables Par Groupes que vous aurez spcifies.
Cliquez prsent sur le bouton OK pour fermer la
bote de dialogue Slectionnez les Variables Par Groupes, puis cliquez sur le bouton OK pour
fermer la bote de dialogue Analyses Par Groupes. Enfin, dans la bote de dialogue Trac de
Dispersion, cliquez sur le bouton OK pour produire les graphiques.
Vous remarquerez que le Trac de Dispersion est cr 1) pour l'Ensemble des Groupes, et 2)
pour chaque Varit (Bonny et Marglobe). L'examen de ces graphiques rvle que la Mthode
de Production conduit une lgre diffrence (sur les valeurs observes du Poids) pour la
Varit=Bonny, tandis que pour la Varit=Marglobe, la mthode FibrePl produit une moindre dispersion des valeurs qui tendent se situer dans la moiti suprieure de la distribution de
l'ensemble des valeurs de la variable Poids.
Utilisons prsent les options Statistiques Descriptives pour poursuivre notre analyse. Dans le
menu Statistiques, slectionnez la commande Statistiques lmentaires pour accder la bote
de dialogue Statistiques lmentaires (Panneau de Dmarrage). Slectionnez l'option Dcompositions & ANOVA 1 Facteur, puis cliquez sur le bouton OK afin d'ouvrir la bote de dialogue
Statistiques par Groupe (Dcompositions). Cliquez sur le bouton Variables et dans la bote de
dialogue Slectionnez les variables dpendantes et les variables de classement , spcifiez la
variable Poids comme Variable dpendante, et la variable Mthode de Production comme
Variable de classement. Cliquez ensuite sur le bouton OK pour fermer la bote de slection des
variables, puis sur le bouton OK dans la bote de dialogue Statistiques par Groupe (Dcompositions) afin d'accder la bote de dialogue Statistiques par Groupe - Rsultats.
Nous souhaitons par ailleurs calculer des Statistiques par Groupes en fonction de la Varit de
tomates. Pour ce faire, cliquez sur le bouton Par Groupes, et dans la bote de dialogue Par
Groupes, cliquez sur le bouton Variable(s) de Classement. Dans la bote de dialogue Slectionnez les Variables Par Groupes, slectionnez la Varit comme Variable Par Groupes.
Cliquez sur le bouton OK dans cette bote de dialogue puis sur le bouton OK dans la bote de
dialogue Analyses Par Groupes. Dans la bote de dialogue Statistiques par Groupes Rsultats, cliquez dans l'ordre sur les boutons 1) Synthse, 2) Analyse de Variance et 3) Tracs
d'Interactions.
Tous les rsultats sont envoys dans les dossiers respectifs, c'est--dire dans le dossier Ensemble des Groupes, Varit=Bonny, ou encore Varit=Marglobe.
Vous pouvez maintenant tudier ces rsultats pour tous les groupes ensemble ou en fonction
de la Varit ; comme vous pouvez le constater, la Mthode de Production semble avoir un
Dans STATISTICA, vous pouvez raliser des analyses par groupes ad-hoc depuis la plupart des
botes de dialogue de rsultats, et analyser les rsultats pour l'ensemble des groupes ou pour
des groupes particuliers, que vous dfinissez par une ou plusieurs variables de classement.
Cette fonctionnalit prsente un intrt majeur lors de la phase exploratoire de l'analyse des
donnes, et permet de comparer des groupes et vrifier la cohrence des rsultats selon les
groupes pour tout type d'analyse.
Avant de conclure cette section, penchons-nous un instant sur les aspects techniques de l'implmentation de cette fonctionnalit. Lorsque vous ralisez une analyse par groupes, comme
dans cet exemple, le programme va en fait r-excuter l'analyse pour chaque groupe, grce au
code STATISTICA Visual Basic qui est enregistr automatiquement lors des analyses interactives, et que vous pouvez enregistrer par ailleurs sous forme de macros comme indiqu plus
loin dans ce manuel (voir Chapitre 9 - STATISTICA Visual Basic, page 233). Lorsque vous
analysez de grosses volumtries (par exemple, de trs gros plans d'expriences dsquilibrs
ou des analyses complexes ncessitant des calculs itratifs), les analyses individuelles peuvent
prendre un certain temps, notamment en prsence de nombreux groupes distincts (par
exemple, imaginez un modle linaire gnralis complexe qui devrait tre estim pour une
centaine de groupes).
Il est donc fortement conseill de dmarrer la phase exploratoire de l'analyse des donnes en
calculant des statistiques descriptives lmentaires, des tables de frquences et des graphiques
pour bien comprendre la structure des donnes et identifier le nombre de groupes distincts
(combinaison des modalits des variables de classement) dans les donnes.
Cette bote de dialogue apparat ds que vous slectionnez une option dans le menu Statistiques, Data-Mining ou Graphiques et qu'une feuille de calcul Excel est ouverte dans STATISTICA. Remarque : STATISTICA dtermine les spcifications logiques, mais vous pouvez modifier ces options si besoin. Si la feuille de calcul Excel ne contient aucun nom de variables,
STATISTICA va affecter automatiquement des noms de variables, c'est--dire, Var1, Var2,
STATISTICA vous permet de dfinir le type de donnes des diffrentes colonnes individuelles.
Il peut s'agir de valeurs numriques, textuelles, de valeurs numriques associes des valeurs
texte, ou de valeurs manquantes. Les cellules vierges d'une feuille de calcul Excel sont systmatiquement considres comme des valeurs manquantes, et lorsqu'une colonne dfinie comme une colonne numrique comporte des valeurs-texte, ces valeurs sont galement considres
comme des valeurs manquantes. STATISTICA propose des types de donnes par dfaut pour
toutes les colonnes sur la base des premires lignes de donnes rencontres (en fait, vous
pouvez dslectionner l'option Visualiser/Modifier le type des colonnes avant de procder
l'importation dans la bote de dialogue Fichier Excel avant de cliquer sur le bouton OK afin de
ne pas voir apparatre la bote de dialogue Visualiser/Modifier les Types de Colonnes). Vous
pouvez videmment modifier les types par dfaut si ncessaire : pour ce faire, slectionnez le
nom d'une colonne modifier, puis cliquez sur le bouton dition (ou double-cliquez sur le
nom de la colonne) afin d'accder la bote de dialogue Modifier le Type de la Colonne
Importer qui vous permet de spcifier le type de donnes contenues dans la colonne respective.
Pour cet exemple, acceptons les options par dfaut et cliquons sur le bouton Annuler dans la
bote de dialogue Modifier le Type de la Colonne Importer. Cliquez ensuite sur le bouton OK
STATISTICA Prise en Main 57
Copyright StatSoft, 2010
STATISTICA vous permet d'accder la plupart des bases de donnes (notamment les systmes de gestion de bases de donnes les plus courants comme Oracle, SQL Server, Sybase,
etc...) grce STATISTICA Query, accessible par le menu Fichier - Donnes Externes ou par le
menu Donnes - Donnes Externes. Pour importer des donnes d'une base de donnes directement dans une feuille de donnes STATISTICA que vous pourrez ensuite enregistrer, utilisez
STATISTICA Query.
STATISTICA Query vous permet d'accder aisment vos donnes en utilisant les conventions
OLE DB. OLE DB est une architecture de base de donnes [base sur la technologie COM
(Component Object Model)] qui permet une intgration universelle des donnes au travers du
rseau de l'entreprise, des gros systmes vers les PC, quel que soit le type de donnes.
STATISTICA Query permet de requter plusieurs tables d'une base de donnes ; vous slectionnez les enregistrements (lignes) en spcifiant des instructions SQL. STATISTICA Query va
alors construire automatiquement l'instruction SQL mesure que vous slectionnez les composantes de la requte au moyen d'une interface graphique simple et/ou des options intuitives
dans les menus et botes de dialogue. Une connaissance approfondie du langage SQL n'est
donc pas ncessaire pour crer des requtes avances et puissantes, simplement et efficacement. Vous pouvez crer une ou plusieurs requtes sur diffrentes bases de donnes et rcuprer les donnes dans une mme feuille de donnes individuelle ; de cette manire, vous pouvez
tablir des connexions avec plusieurs bases de donnes externes simultanment.
Dans cet exemple, crons une nouvelle requte : dans le menu Fichier - Donnes Externes,
slectionnez la commande Crer une Requte. STATISTICA Query apparat et vous donne
accs la bote de dialogue Connexion une Base de Donnes.
Dans cette bote de dialogue, vous pouvez choisir des connexions existantes des bases de
donnes ou en dfinir de nouvelles. Dans cet exemple, crons une nouvelle connexion une
base de donnes ; pour ce faire, cliquons sur le bouton Nouvelle afin d'accder la bote de
dialogue Proprits des Liaisons de Donnes.
Vous pouvez choisir l'un des fournisseurs OLE DB mis disposition par votre vendeur de base
de donnes, ou l'un des fournisseurs OLE DB installs par dfaut par Microsoft et compatible
avec votre systme de base de donnes. Dans cet exemple, nous utiliserons un fournisseur Jet
database install avec STATISTICA ; pour ce faire, slectionnez le fournisseur Microsoft Jet 4.0
OLE DB Provider puis cliquez sur le bouton Suivant >>. La bote de dialogue Proprits des
Liaisons de Donnes - onglet Connexion apparat.
Cliquez avec le bouton droit de la souris sur la table RAWMAT, et dans le menu contextuel,
slectionnez la commande Ajouter afin d'ajouter la table correspondante dans le volet suprieur
droit de la fentre STATISTICA Query. Cliquez ensuite sur la table PERSONNEL, et faites la
mme opration.
Pour slectionner les champs intgrer dans la requte, cliquez avec le bouton droit de la
souris sur la table RAWMAT dans le volet suprieur droit, et slectionnez la commande Slectionner Tous les Champs dans le menu contextuel ; faites de mme pour la table PERSONNEL.
STATISTICA Prise en Main 61
Copyright StatSoft, 2010
Vous pouvez prsent analyser ces donnes l'aide des diffrents outils proposs dans STATISTICA. Remarque : la feuille de donnes conserve une connexion avec la base de donnes ;
vous pouvez donc r-excuter la requte tout moment en slectionnant la commande Actualiser les Donnes du menu Fichier - Donnes Externes ou en apputyant sur la touche F5 du clavier lorsque la feuille de donnes est active.
Dans la pratique, l'essentiel du temps ncessaire pour mener bien un projet d'analyse de
donnes ou de data mining est consacr la prparation des donnes. Il n'est pas rare d'allouer
jusqu' 90% du temps et des efforts ncessaires l'aboutissement d'un projet, au nettoyage et
la prparation des donnes.
Lorsque vous construisez des modles de prvision l'aide d'outils de data mining, ou mme
que vous calculez de simples statistiques descriptives (moyennes, tables de frquences), les
Vous pouvez utiliser cette option lorsque vous pensez que votre fichier de donnes comporte
des doublons (c'est--dire, des enregistrements identiques/dupliqus).
Par exemple, supposons que dans une analyse visant identifier des comportements dmographiques de vos clients (profils), vous souhaitez comptabiliser chaque client individuellement ; mais votre base de donnes transactionnelle peut tre organise de telle sorte que chaque client apparat plusieurs fois. Dans ce cas, l'option Filtrage des Doublons va vous permettre de crer un fichier de donnes pour vos analyses, dans lequel chaque enregistrement sera
unique (c'est--dire, o chaque identifiant-client sera distinct, et n'apparatra qu'une seule fois).
Ouvrez le fichier de donnes Duplicates.sta.
Dans le menu Donnes - Filtrage/Recodification des Donnes, slectionnez la commande Filtrage des Doublons afin d'accder la bote de dialogue Filtrage des Doublons. Dans le cadre
Entre, le bouton Variables permet de spcifier les critres utiliser pour dterminer les doublons ; par exemple, cliquez sur le bouton Variables et dans la bote de dialogue de slection
des variables, slectionnez la variable Personne interroge de sorte rechercher les doublons
parmi toutes les personnes interroges. Cliquez sur le bouton OK dans la bote de dialogue de
slection des variables afin de revenir la bote de dialogue Filtrage des Doublons.
Dans le cadre Entre, cliquez sur le bouton Observations afin d'accder la bote de dialogue
Filtres de Slection de la Feuille de Donnes qui offre un certain nombre d'options pour ne
slectionner que certaines observations spcifiques pour vos oprations de ddoublonnage.
Dans cet exemple, nous allons filtrer toutes les observations. Cliquez par consquent sur le
bouton Annuler dans la bote de dialogue Filtres de Slection de la Feuille de Donnes.
L'option Utiliser les noms d'observations n'est pas coche par dfaut ; nous allons conserver
cette option en l'tat ici. Lorsque cette option est coche, le ddoublonnage s'effectue galement sur les noms d'observations, c'est--dire que STATISTICA va considrer toutes les observations qui possdent le mme nom d'observation comme des doublons (sous rserve que ces
observations possdent galement des valeurs identiques sur les autres variables spcifies). Si
cette option n'est pas coche, les doublons sur les noms d'observations seront ignors.
Dslectionnez l'option Donnes dj tries (puisque notre fichier de donnes n'a pas t tri
sur de trs gros fichiers de donnes, il est plus efficace de trier pralablement vos donnes).
Dans le cadre Sortie, vrifiez que toutes les variables sont slectionnes (la mention TOUT
doit apparatre ct du bouton Variables). Cette option permet de spcifier les variables de la
feuille de donnes d'entre intgrer dans la feuille de donnes de sortie (filtre) ; l'option par
dfaut est TOUT.
Vrifiez que l'option Crer une nouvelle feuille de donnes est coche (par dfaut), et cochez
l'option Crer une feuille de donnes avec les doublons . Conservez les deux autres options
leur statut par dfaut : l'option Conserver l'ordre initial n'est pas coche [les nouvelles feuilles
de donnes seront tries selon la ou les variables slectionnes comme critres de ddoublonnage, c'est--dire dans cet exemple, selon la variable Personne interroge], et l'option Copier
la mise en forme est coche. Cliquez sur le bouton OK.
Deux nouvelles feuilles de donnes vont tre produites. L'une avec 10 variables et 51 observations qui contient les personnes interroges de la feuille de donnes originale sans doublons.
Il n'est pas rare de rencontrer des variables (paramtres ou champs de donnes), notamment
dans le cadre de la modlisation prdictive, avec trs peu de donnes valides. Par exemple,
dans une base de donnes dclarative (o les rponses des clients sont facultatives) vous
pouvez demander le Revenu, mais il est trs probable que la majorit des clients ne vont pas
accepter de divulguer leur revenu, et la plupart des donnes de ce champ seront vierges (ou
manquantes) dans la base de donnes. Dans les donnes de production, vous pouvez enregistrer un paramtre spcifique dans un champ, mais le capteur peut tre dfectueux pendant un
certain temps et ce champ ne contiendra que des donnes manquantes (incorrectes).
L'utilisation de ce type de variables clairsemes dans une analyse, peut conduire des rsultats errons, ou mme vous empcher de construire des modles prdictifs (selon la manire
dont les valeurs manquantes seront gres dans les analyses). Par consquent, il est conseill
d'identifier ces variables parses en amont grce aux options de Filtrage des Donnes parses
(accessibles par le menu Donnes - Filtrage/Recodification des Donnes), et de les liminer
dans la perspective des analyses ultrieures.
Nous sommes galement parfois confronts un problme similaire ( celui des donnes parses) qui affecte frquemment la qualit des donnes, notamment sur des donnes (process) en
production industrielle, lorsque certaines variables (paramtres) enregistres et utilises dans
les analyses sont constantes, c'est--dire que toutes les valeurs sont identiques (invariantes).
Ces variables sont sans intrt pour la modlisation prdictive et les options Traitement des
Variables Invariantes (accessibles par le menu Donnes - Filtrage/ Recodification des Donnes)
vous permettent d'identifier automatiquement ces variables, et de les exclure des analyses.
Les valeurs extrmes ou points atypiques (galement appels points aberrants) peuvent
fortement influencer certaines analyses et altrer la prcision des modles de prvision (en
data mining). Il n'existe pas de dfinition universelle de ce qui rend un point atypique ou une
valeur extrme mais les outils graphiques de STATISTICA constituent une excellente manire d'identifier ce type d'observations inhabituelles (par exemple, vous pouvez crer des botes
moustaches des variables afin de reprer les observations extrmes sur les graphiques et les
identifier dans les donnes grce aux outils de balayage afin de les liminer de vos analyses).
Pour traiter automatiquement des listes entires de variables afin d'identifier et supprimer ces
points atypiques, les options de Recodification des Points Atypiques (accessibles par le menu
Donnes - Filtrage/Recodification des Donnes) vous donnent accs diffrents tests pour
identifier et remplacer les points aberrants (diverses approches permettent d'identifier les
valeurs extrmes).
Vous pouvez remplacer les points aberrants par des valeurs manquantes ou des valeurs valides
(par exemple, remplacer par la borne du centile correspondant, etc...).
Il est ncessaire de traiter les valeurs manquantes ou incorrectes d'une manire cohrente avec
les objectifs des analyses. Dans certains cas, les valeurs manquantes ou incorrectes peuvent
renfermer une information utile concernant un processus ou une variable particulire. Ainsi, en
recherche marketing, il est courant que les personnes interroges refusent de communiquer des
informations personnelles relatives leur sant, leur patrimoine (par exemple, leur pargne),
etc..., et ces absences de rponse peuvent tre troitement corrles d'autres variables importantes de l'analyse (par exemple, le refus de rpondre des questions relatives au revenu peut,
en soi, tre un bon indicateur d'un revenu lev, si effectivement les individus en meilleure
sant dans l'tude tendent ne pas rpondre ces questions).
Les options de Traitement des Valeurs Manquantes accessibles par le menu Donnes Filtrage/
Recodification des Donnes vous permettent de recodifier vos valeurs manquantes de diverses
manires, de dfinir plusieurs codes de valeurs manquantes dans une mme variable (ces
valeurs peuvent alors tre recodifies selon le code des valeurs manquantes de la variable), ou
d'liminer les variables dpassant un certain pourcentage de valeurs manquantes.
Il n'existe pas de recette universelle pour remplacer les valeurs manquantes, et parfois, en
recodifiant les valeurs manquantes d'une variable particulire en une certaine valeur (par
exemple, la moyenne), les rsultats finaux peuvent se trouver biaiss. Par exemple, supposons
que dans une tude, les personnes ayant refus de communiquer leur revenu tendent plutt se
situer dans une tranche de revenus suprieure. Dans ce cas, le fait de remplacer les valeurs
manquantes par le revenu moyen pour ces individus (c'est--dire, remplacer les valeurs manquantes de la variable Revenu par la moyenne du revenu de l'chantillon tout entier) peut
conduire des conclusions errones.
STATISTICA propose une mthode trs efficace (applicable de trs gros fichiers de donnes
et de trs grosses bases de donnes) pour remplacer les valeurs manquantes par des valeurs
valides et cohrentes avec les autres observations de l'chantillon. Pour plus d'informations
L'algorithme des k plus proches voisins est un algorithme rapide et efficace, qui constitue une
excellente mthode pour remplacer les valeurs manquantes dans le fichier d'entre avec des
hypothses raisonnables reposant sur les donnes similaires de l'chantillon. Cette approche
ne fait aucune hypothse particulire quant la nature des relations entre les variables (c'est-dire qu'il n'est pas ncessaire d'estimer un modle pour chaque variable afin de prvoir les
valeurs manquantes), mais se contente d'utiliser les valeurs observes comme modle.
Vous pouvez dfinir de nouvelles variables dans vos feuilles de donnes STATISTICA en fonction d'autres variables, c'est--dire comme des transformations d'autres variables. Vous pouvez
galement vrifier, transformer et recodifier vos donnes dans une mme variable (par opposition un ensemble de formules de transformation qui sont appeles "Formules par Lot").
Toutes ces oprations sont possibles grce aux Formules de la Feuille de Donnes.
Pour accder aux Formules de la Feuille de Donnes, double-cliquez sur le nom d'une variable
dans une feuille de donnes STATISTICA afin d'accder la bote de dialogue des spcifications de la Variable. Vous pouvez saisir une formule dans le champ Description dtaille (tiquette ou formule avec Fonction), galement appel diteur de formules, situ en bas de la
bote de dialogue. Lorsque vous saisissez la description dtaille d'une variable dans l'diteur
de formules en la faisant commencer par le signe gal, STATISTICA va l'interprter comme
une formule et vrifier sa syntaxe.
Vous pouvez utiliser dans vos formules le nom des autres variables (MESURE1, PRIODE),
ou leur numro au moyen de la syntaxe Vx, o x reprsente le numro absolu de la variable.
Par exemple, V3 reprsente la variable numro 3. V0 a une signification particulire et reprsente les numros d'observations.
Les Formules de la Feuille de Donnes sont calcules ligne par ligne (observation par observation). Pour chaque observation de la feuille de donnes, la formule est calcule et les rfrences aux autres variables sont remplaces par les valeurs de l'observation correspondante.
Dans STATISTICA, l'accs alatoire des fonctions de la feuille de donnes permet aux formules
d'accder aux valeurs des variables depuis d'autres observations. Par exemple, la fonction
Dcalage va rfrencer une variable et la dcaler vers l'avant ou vers l'arrire selon un nombre
d'observations spcifique.
Le tableau ci-contre donne la liste de diverses Formules de la Feuille de Donnes avec leurs
rsultats.
Rsultat
Produit la valeur 1 si le texte B12C
apparat dans la variable 1 pour l'observation
=contains(v1, "B12C")
correspondante.
Produit la valeur 0 dans le cas contraire.
Calcule la moyenne des trois premires
=(v1+v2+v3)/3
variables.
Recodifie les observations 1-10 en 1. Toutes
=(v0<=10)*1+(v0>10)*2
les autres observations prennent la valeur 2.
=((v1=1) AND (v2=5))*5
Produit la valeur 5 si v1=1 et v2=5, sinon 0.
Produit les valeurs de la densit de
probabilit pour la distribution du t de
=student(v4,15)
Student sur la base des valeurs de la variable
v4 avec 15 degrs de libert.
=iif(V0 <= 1, V3, V3+LAG(VCUR, 1)) Effectue la somme cumule de la variable 3.
Remarque : cliquez sur le bouton
dans la bote de dialogue des spcifications de la
Variable pour accder la bote de dialogue Explorateur de Fonctions qui permet d'afficher la
liste complte des Formules et Oprateurs (=, +, >, and, or).
Ouvrez le fichier de donnes Adstudy.sta. Nous allons crer une nouvelle variable qui sera la
moyenne des variables 3 25 (c'est--dire, MESURE1 MESURE23).
Double-cliquez sur le premier intitul de variable vierge (aprs la variable 25). La bote de
dialogue Ajouter des Observations et/ou des Variables apparat. Cliquez sur le bouton OK afin
d'accepter les valeurs par dfaut, c'est--dire ajouter une variable.
La bote de dialogue des spcifications de la Variable apparat. Dans le groupe Format d'affichage, slectionnez le format Nombre. Dans le champ Description dtaille, situ en bas de la
bote de dialogue, saisissez la formule suivante :
=mean(v3:v25)
Cliquez ensuite sur le bouton OK. Une bote de dialogue va vous indiquer si la syntaxe est
correcte. Cliquez sur le bouton Oui pour poursuivre. La nouvelle variable va maintenant contenir la moyenne des variables 3 25, pour chacune des observations.
Dans la mesure o nous pouvons utiliser aussi bien des numros de variables que leur nom,
nous aurions galement pu crire la formule sous la forme suivante :
=mean(MESURE1:MESURE23)
Les formules de la feuille de donnes permettent de dfinir une formule pour une variable la
fois. Mais il existe des situations o nous devons calculer plusieurs formules pour diffrentes
variables simultanment. C'est ce que permettent de faire les formules par lot dans STATISTICA.
Ouvrez le fichier de donnes Characteristics.sta. Ce fichier contient diverses informations
relatives aux patients d'une tude. Dans cet exemple, nous allons 1) calculer l'Indice de Masse
Corporelle (IMC) et 2) convertir la taille en pouces (in), puis ajouter ces deux variables notre
fichier de donnes.
Dans le menu Donnes, slectionnez la commande Formules de Transformation par Lot afin
d'accder la bote de dialogue Formules de Transformation par Lot.
La seule diffrence de syntaxe entre les Formules de transformation par lot et les Formules de
la feuille de donnes concerne, d'une part, la possibilit de spcifier plusieurs formules simultanment dans l'option par lot, et, d'autre part, le fait de ne pas devoir commencer la formule
par un signe gal dans les formules par lot puisque les formules par lot ne sont associes
aucune variable spcifique (en fait, vous pouvez copier librement ces formules d'un fichier de
donnes l'autre) et vous devez par consquent dfinir explicitement la variable cible (par
exemple, v1=... ou Mesure3=...) afin que STATISTICA puisse identifier quelle variable chaque formule doit s'appliquer. Une option vous permet de ventiler les diffrentes formules par
lot dans les variables respectives de la feuille de donnes et de les enregistrer avec le fichier de
donnes, en remplaant les ventuelles Formules de la feuille de donnes qui pouvaient exister
jusqu'alors.
Ci-dessous les calculs utiliss pour calculer l'IMC et convertir la Taille (cm) en pouces, ainsi
que les formules saisir dans la bote de dialogue Formules de Transformation par Lot :
Calculs
Les options de la bote de dialogue Formules de Transformation par Lot sont particulirement
bien adaptes (optimises) pour transformer de gros fichiers de donnes. Les formules sont
calcules les unes la suite des autres, de faon squentielle, ce qui permet d'utiliser les
STATISTICA offre de nombreux graphiques de ce type pour synthtiser rapidement et efficacement les statistiques descriptives lmentaires, corrlations, rsultats des analyses de capabilit
du processus ou de l'appareil de mesure, ou d'autres types d'analyses de donnes, comme
illustr ci-aprs.
Au cours des dernires annes, les industriels europens notamment ont dvelopp des normes
spcifiques pour calculer des indices de capabilit du processus permettant de tenir compte
explicitement de la variation alatoire et de la variation systmatique d'un processus au cours
du temps, ainsi que de distributions non-normales. Ces indices ont t par exemple largement
adopts dans l'industrie automobile et ses sous-traitants, et STATISTICA intgre ces nouvelles
normes.
Les indices de Capabilit du processus mesurent le nombre de fois o une distribution de
valeurs observes (normales) se situe entre les limites de spcification de la pice produite.
Ainsi, ces indices permettent de synthtiser la qualit d'un processus pour fabriquer des produits ou des pices conformes aux spcifications. Sans entrer dans le dtail, les normes DIN
(Deutsche Industrie Norm) 55319 et ISO 21747 dcrivent les rgles appliquer pour choisir
entre diffrents modles de distributions et la manire d'expliquer les variations du processus
au cours du temps.
Par exemple, si la distribution des points dans chaque chantillon est Normale, mais qu'il
existe une variation systmatique ou alatoire dans le temps mesure que nous tirons les
chantillons successifs, la distribution rsultante des valeurs ne sera pas Normale. Par consquent, dans de nombreux cas, les calculs de capabilit du processus reposant sur la loi normale
ne sont pas applicables. En outre, il est gnralement intressant d'identifier la dispersion ou
78 STATISTICA Prise en Main
Copyright StatSoft, 2010
Cette bote de dialogue offre de nombreuses options permettant de modifier les rgles qui
s'appliquent pour slectionner la distribution la mieux adapte et le modle de rpartition
temporel des donnes en vue de calculer les indices de capabilit du processus appropris. Le
bouton
situ dans l'angle suprieur droit de la bote de dialogue ou la touche F1 vous
permettent d'afficher une rubrique du Manuel lectronique de STATISTICA contenant un
certain nombre d'informations relatives aux options de cette bote de dialogue. Par exemple,
cette rubrique dtaille les diffrences (mineures) entre les spcifications DIN et ISO.
Cliquez sur le bouton OK dans la bote de dialogue ISO 21747 - Capabilit du Processus
Configuration afin de raliser l'analyse sur la variable Taille.
Rsultats,
Dans la bote de dialogue ISO 21747 - Capabilit du Processus cliquez sur le bouton Synthse afin de produire les rsultats.
Nous allons produire un autre exemple de ce type de synthse graphique multiple dans
STATISTICA en ralisant l'analyse d'un systme de mesure aux attributs.
D'une manire gnrale, tous les systmes de mesure utiliss en production doivent tre valids afin de garantir que nous mesurons les caractristiques de qualit avec une prcision et une
fiabilit suffisantes. Il est important de dterminer si une pice produite est de qualit suffisante pour tre accepte, ou si elle doit tre rejete ; en d'autres termes, notre systme de mesure doit nous permettre d'tablir un attribut simple du type acceptation/rejet.
Pour dterminer la qualit d'un systme de mesure, nous devons raliser priodiquement une
tude o nous appliquons notre systme de mesure (dcision d'acceptation/rejet) des pices
de rfrence possdant des carts connus aux spcifications souhaites. Ce processus est dcrit
dans la section correspondante du Manuel lectronique de STATISTICA ainsi que dans le
manuel de l'AIAG (Automotive Industry Action Group) Analyse du Systme de Mesure
(2000).
Cet exemple illustre l'analyse dcrite dans le manuel Analyse du Systme de Mesure, pages 8186.
Dans le menu Fichier, slectionnez la commande Ouvrir des
Exemples afin d'ouvrir le dossier contenant les fichiers de donnes d'exemple ; ouvrez ensuite
le rpertoire Fichiers de donnes et double-cliquez sur le fichier AttributeGageStudy.sta ou
slectionnez-le et cliquez sur le bouton Ouvrir. Ce fichier contient les donnes, dj synthtises en donnes d'acceptation, de l'tude du systme de mesure aux attributs telle qu'elle est
dcrite dans le manuel Analyse du Systme de Mesure (page 84)
Dans le menu Statistiques - Statistiques Industrielles & Six Sigma,
slectionnez la commande Analyse de Processus. Dans la bote de dialogue Procdures
d'Analyse de Processus, slectionnez l'option tude du systme de mesure aux attributs
(Mthode analytique) puis cliquez sur le bouton OK. Dans la bote de dialogue tude du
systme de mesure aux attributs (Mthode analytique), cliquez sur le bouton Variables.
Slectionnez la variable Pice dans la liste Numros de pices, la variable Rfrence dans la
liste Valeurs de rfrence et la variable Acceptation dans la liste Acceptation/Rponse puis
cliquez sur le bouton OK afin de fermer cette bote de dialogue et revenir la bote de dialogue
82 STATISTICA Prise en Main
Copyright StatSoft, 2010
Tous les rsultats importants pour dterminer le biais et la rptabilit des mesures de notre
systme de mesure aux attributs sont rassembls sur une mme page. Pour plus d'informations
sur l'interprtation des statistiques et graphiques produits, voir le Manuel lectronique.
Il est de plus en plus courant en data mining de recourir des solutions reposant sur des processus analytiques simples, plutt que de crer des outils gnralistes toujours plus complexes.
L'approche propose dans STATISTICA Data Miner Plus vous permet, au travers d'une interface graphique intuitive, de mettre en uvre ces techniques, mme pour les novices en data
mining, puisqu'il s'agit simplement de suivre un processus analytique pas--pas. Grce des
botes de dialogue intuitives, vous pouvez raliser diffrentes tches de data mining, comme
de la rgression, de la classification ou du clustering. Vous pouvez galement construire
rapidement votre propre mthodologie pas--pas comme solution personnalise. Vous sauvegardez ensuite ces assistants pour les dployer sous forme de projets afin d'effectuer du
scoring sur de nouvelles donnes.
Pour utiliser STATISTICA Data Miner Plus pour cette application, suivez les instructions ciaprs. Ouvrez STATISTICA, puis dans le menu Data Mining, slectionnez la commande Data
Miner Plus - Mthodologie Pas--Pas afin d'accder la bote de dialogue Data Miner Plus.
Cliquez sur le bouton Nouveau afin de construire un nouveau projet.
Lorsque la phase de Prparation des donnes est termine, celle des Donnes de lanalyse apparat automatiquement. Dans longlet Donnes de lanalyse, cliquez sur le bouton chantillon
de validation, puis dans la bote de dialogue Spcifications de lchantillon de validation,
activez le bouton d'option Variable. Vrifiez que la catgorie Apprentissage apparat dans le
champ Code de lchantillon dapprentissage et que la catgorie Test apparat dans le champ
Code de lchantillon de validation.
Cliquez ensuite sur le bouton OK. Les modles vont tre ajusts sur la base de lchantillon
dapprentissage, puis tests laide des observations de lchantillon de validation. Nous pouvons tester la validit prdictive de chaque modle, et donc comparer les modles entre eux en
calculant des statistiques de qualit dajustement partir des observations nayant pas t
utilises dans les calculs dajustement des modles, pour les diffrents modles (algorithmes)
de data mining.
La phase de Redondance des donnes apparat. Lobjectif de cette tape de Redondance des
donnes consiste liminer les prdicteurs fortement redondants. Par exemple, si nos donnes
contenaient deux mesures de poids, lune exprime en kilogrammes et lautre exprime en
livres, ces deux mesures seraient totalement redondantes.
Dans longlet Redondance des donnes, slectionnez le bouton d'option Coefficient de corrlation et spcifiez la Valeur du critre 0,8. Cliquez sur le bouton Appliquer le critre de redondance afin dliminer les prdicteurs redondants fortement corrls (r0,8). Dans la mesure o
il nexiste pas de redondance dans notre fichier de donnes, le message suivant va apparatre.
Cliquez sur le bouton OK puis cliquez sur le bouton tape suivante ; la phase de nettoyage et
de prparation des donnes dans la perspective de la construction des modles est prsent
termine.
Nous devons maintenant construire des modles prdictifs pour la variable de sortie de cet
exemple. Dans le champ des diffrentes tapes, le nud Variable de sortie possde une structure arborescente dont les nuds enfants sont les suivants : Variables influentes, Construction
des modles, valuation et Dploiement.
Cliquez sur le bouton OK dans cette bote de dialogue puis cliquez sur le bouton tape suivante pour terminer cette tape. Pour accder une synthse de lanalyse ralise jusqu prsent,
cliquez sur le bouton Rapport dans longlet tapes, puis slectionnez la commande Rapport de
synthse afin de produire le classeur des Rsultats.
Nous allons nous pencher prsent sur ces prdicteurs laide des diffrents algorithmes de
data mining et de machine learning proposs dans STATISTICA Data Miner Plus.
La bote de dialogue Data Miner Plus a t rduite pour
vous permettre de visualiser le classeur des Rsultats. Cliquez sur le bouton Data Miner Plus
situ dans la Barre dAnalyse afin de restaurer cette bote de dialogue. Le nud Construction
des modles est slectionn. Au cours de cette tape, vous pouvez construire un certain nombre de modles pour les entres slectionnes. Dans longlet Construction des modles, les
options C&RT, Forts alatoires, Boosting darbres, Rseaux de neurones et SVM vous permettent dessayer diffrents modles ou algorithmes sur vos donnes.
Vous pouvez raliser les calculs ncessaires la construction des modles prdictifs soit en
local (sur votre ordinateur) soit au moyen de WebSTATISTICA Server. Cette dernire option
La feuille de donnes ci-dessus nous donne la performance de classification du meilleur modle sur lensemble de validation. Les colonnes reprsentent les effectifs prvus des classes,
tels quils sont prvus par le modle de Forts Alatoires, et les lignes reprsentent les classes
observes dans lchantillon de validation. Ce tableau rvle que 80 des 103 prts risques
ont t correctement classs, mais que 23 dentre eux ont t mal classs. Cette information est
gnralement beaucoup plus pertinente quun taux global derreur de classement, qui nous
indique simplement que la prcision globale est de 68,66%.
Cliquez sur le bouton tape suivante pour calculer les scores de ce fichier de donnes en
utilisant le meilleur modle. Le fichier avec les probabilits de classifications et de prvision
(intitul Synthse du Dploiement) se situe dans le rpertoire Dploiement du classeur du
projet illustr ci-aprs.
STATISTICA Prise en Main 93
Copyright StatSoft, 2010
WebSTATISTICA Server tend les fonctionnalits de la plate-forme STATISTICA, en transformant plusieurs stations de travail individuelles en un systme collaboratif et puissant dintelligence. Lune des fonctionnalits majeures de larchitecture client-serveur de WebSTATISTICA
rside dans la possibilit dutiliser les ressources du serveur pour raliser diffrentes analyses
statistiques rptitives et potentiellement gourmandes en ressources (dlguer les tches
au serveur) tout en librant vos ressources en local pour dautres tches ncessitant une attention plus immdiate. Vous pouvez le faire au travers dun navigateur Internet (un client
lger) ou de la version bureautique de STATISTICA (client lourd, client WebSTATISTICA). La premire option vous permet dexcuter WebSTATISTICA Server depuis pratiquement
tout ordinateur au monde connect Internet, tandis que la seconde option ncessite linstallation de STATISTICA sur votre ordinateur. Ltroite intgration de WebSTATISTICA avec
lapplication STATISTICA vous permet de travailler dans une interface identique et sans rien
changer vos habitudes, que vous ralisiez vos oprations sur le client ou sur le serveur, en
combinant une interface-utilisateur plus rapide et plus riche, et toutes les composantes et outils
de la version bureautique de STATISTICA.
Tout dabord, assurez-vous davoir activ lintgration avec WebSTATISTICA. Dans
le menu Outils de STATISTICA, slectionnez la commande Options afin d'accder la bote de
dialogue Options. Cliquez sur le volet d'options Serveur / Web. Cochez loption Permettre une
Authentification Intgre. Le seul paramtre requis est le chemin vers le serveur WebSTATISTICA (ainsi que les paramtres de connexion, sils sont diffrents de ceux par dfaut). Contactez votre administrateur rseau pour obtenir ces paramtres. Vous pouvez Permettre une
Authentification Intgre si elle est autorise et active sur le serveur ; dans le cas contraire,
vous devrez saisir votre nom dutilisateur et votre mot de passe pour vous connecter au serveur
WebSTATISTICA.
Aprs avoir spcifi les paramtres dans ce volet d'options, cliquez sur le bouton OK.
Le menu Serveur apparat dans votre barre doutils STATISTCA. Dans le menu Serveur, slectionnez la commande Connexion et saisissez votre nom dutilisateur ainsi que votre mot de
passe si ncessaire. Si la connexion est russie, les commandes suivantes vont apparatre.
Les commandes Ouvrir, Enregistrer et Enregistrer Sous de ce menu vous permettent denregistrer le fichier actif sur le serveur ou de rapatrier un fichier pour louvrir en local. Les commandes explicites Envoyer un Fichier et Rapatrier un Fichier permettent de choisir les dossiers
souhaits sur le serveur ou sur le client.
96 STATISTICA Prise en Main
Copyright StatSoft, 2010
Vous pouvez mettre jour la liste des tches manuellement en cliquant sur le bouton Actualiser ou automatiquement en cochant loption Automatique dans la partie infrieure droite de
la bote de dialogue Statut des Tches. Les tches passent du statut En attente et En cours au
statut Termin ou Erreur.
Si votre tche choue, double-cliquez sur la ligne correspondante pour accder des informations complmentaires relatives cet chec. Une fois lerreur corrige (par exemple, aprs
mise jour du script SVB ou de lespace de travail du Data Miner), slectionnez la tche
ayant produit lerreur et cliquez sur le bouton Soumettre Nouveau.
lissue de lexcution russie de la tche, vous pouvez rcuprer les rsultats.
Remarque : dans la mesure o les rsultats sont stocks sur le serveur, ils sont accessibles
depuis toute station de travail STATISTICA, sous rserve de disposer des autorisations daccs
ncessaires. Le cadre Rsultats contient une option Tche et une autre option Donnes qui permettent respectivement de rapatrier la source de la tche et le fichier de donnes (ventuel) sur
le client. Si loption Navigateur est coche, les rsultats seront envoys dans votre navigateur,
et vous passerez en client lger. Cette option prsente un grand intrt lorsque vous attendez
de nombreux rsultats ; par exemple, si lanalyse produit de nombreux tableaux de donnes
Dans les environnements rglements, les analyses ralises pour les applications de BPx
(Bonnes Pratiques de Fabrication, Bonnes Pratiques Cliniques, Bonnes Pratiques de Laboratoire) sont celles qui ont un impact direct sur la scurit des consommateurs, par exemple dans
les essais cliniques, la production ou le contrle qualit. Lorsquune entreprise ralise des
analyses pour une application de BPx, les agents en charge de la rglementation demandent
aux socits de prouver que les rsultats du systme danalyses valid (par exemple,
Ouvrez une feuille de donnes STATISTICA. Dans le menu Outils - Journal des vnements,
slectionnez la commande Paramtres pour accder la bote de dialogue Paramtres du Journal des vnements de la Feuille de Donnes. Cochez loption Autoriser lenregistrement des
vnements dans le Journal des vnements afin de dmarrer lenregistrement des vnements de la feuille de donnes actuelle dans le Journal des vnements.
Remarque : lorsque vous activez le Journal des vnements sur une feuille de donnes, cette
dernire passe automatiquement en mode direct, cest--dire que chaque modification de la
feuille de donnes est immdiatement crite sur le disque. Ainsi, lorsque vous activez le
Journal des vnements, vous ne pouvez plus annuler les modifications du fichier de donnes.
Cochez loption Exiger un commentaire de la part des utilisateurs pour chaque modification
afin de demander aux utilisateurs de justifier les modifications quils apportent la feuille de
donnes.
Le bouton Rinitialiser le Journal des vnements nest accessible que si vous avez dj activ
le Journal des vnements et que ce dernier comporte des informations. Si vous cliquez sur ce
STATISTICA Prise en Main 101
Copyright StatSoft, 2010
Le Journal des vnements se prsente sous la forme dun tableau dinformations relatif aux
actions que vous suivez, avec notamment un numro squentiel, la date et lheure de la
modification, lordinateur partir duquel la modification a t ralise, le nom de lutilisateur,
la nature ainsi que la raison de la modification. Vous pouvez augmenter ou rduire la taille des
colonnes en utilisant les conventions Windows standard. Le Journal des vnements dune
feuille de donnes particulire est intgr et enregistr avec cette feuille de donnes.
Ouvrez une feuille de donnes STATISTICA. Dans le menu Fichier, slectionnez la commande
Proprits afin d'accder la bote de dialogue Proprits du Document. Slectionnez longlet
Mot de passe.
Saisissez un mot de passe dans le champ Mot de Passe du Document, puis cliquez sur le bouton OK. La bote de dialogue Mot de Passe apparat et vous permet de confirmer le mot de
passe ; les mots de passe sont sensibles la casse et il est donc important de respecter les
majuscules et les minuscules.
Cette bote de dialogue vous permet de spcifier les aspects de la feuille de donnes que vous
souhaitez verrouiller. Si un utilisateur cherche modifier un aspect verrouill, un message va
lui indiquer que la feuille de donnes est verrouille.
Cochez loption Donnes de la feuille de donnes afin dinterdire toute modification des valeurs contenues dans la feuille de donnes. De cette manire, personne ne pourra modifier les
donnes, ni le code des valeurs manquantes. Personne ne pourra non plus effectuer dopration
de gestion des donnes susceptible daltrer la feuille de donnes (par exemple, changer le
104 STATISTICA Prise en Main
Copyright StatSoft, 2010
Pour respecter les exigences rglementaires, il est galement ncessaire de garantir que les
rsultats reports sont sous contrle. STATISTICA offre diffrentes options pour crer des rapports BPx. En mode BPx, tous les rsultats sont envoys dans un rapport et la fentre est verrouille. Toutes les options permettant de supprimer (Couper, Extraire - Original, Effacer, etc...)
ou dajouter des rsultats (Coller, Insrer) sont inactives. STATISTICA permet galement de
reporter la date de cration dans tous les rapports ainsi que lheure laquelle les diffrents
rsultats ont t produits partir des botes de dialogue de rsultats. Laspect et le contenu des
indicateurs de date et dheure de cration sont entirement paramtrables et vous pouvez ajouter le nom de lutilisateur et de lordinateur en plus de la date et de lheure. Par consquent, en
mode BPx, vous savez quand les rsultats ont t produits et par qui. Vous avez galement
lassurance quaucun rsultat na t supprim.
Le mode GxP offre galement une option de traabilit. Lorsque vous excutez STATISTICA
en mode BPx, le programme va vrifier automatiquement si le Journal des vnements de la
feuille de donnes est activ. Si tel est le cas, STATISTICA va inclure le nom ainsi que le
numro de version de la feuille de donnes dans le rapport. Les numros de version ne sont
pas systmatiquement disponibles, par exemple, si Journal des vnements nest pas activ ou
si les rsultats ont t produits partir dune Interface Directe avec une Base de Donnes.
Dans ce cas, STATISTICA indiquera la raison pour laquelle un numro de version nest pas
disponible.
Dans le menu Outils, slectionnez la commande Options afin d'accder la bote de dialogue
Options. Slectionnez le volet d'options Analyses/Graphiques - Gestionnaire de Sorties. Dans
la liste droulante Rapport STATISTICA, slectionnez lune des options Envoyer dans Diffrents Rapports (un par Analyse/Graphique) ou Rapport Commun (identique pour toutes les
Analyses/Graphiques). Les options du cadre Verrouillage du rapport (Options des BPx, Bonnes
Pratiques) deviennent alors accessibles.
Cochez loption Verrouillage afin de garantir que les documents ne pourront pas tre supprims du rapport. Les commandes Couper, Coller, Effacer, Renommer et Proprits de lObjet
Pour intgrer un indicateur de cration en haut du rapport, vous pouvez accepter le format par
dfaut dans le champ Indicateur de Cration ou crer votre propre indicateur. Vous pouvez utiliser les codes suivants dans ce champ : &[Date], &[Heure], &[Utilisateur] et &[Ordinateur].
Vous pouvez galement saisir du texte librement pour le faire apparatre en tte du rapport.
Pour reporter lheure de cration au dessus de chaque objet que vous ajoutez dans le rapport,
vous pouvez accepter le format par dfaut dans le champ Indicateur horaire, ou crer votre propre indicateur. Vous pouvez utiliser les codes suivants dans ce champ : &[Date], &[Heure],
&[Utilisateur] et &[Ordinateur].
Cliquez sur le bouton OK dans la bote de dialogue Options, puis excutez lanalyse de votre
choix, par exemple, utilisez le module Statistiques lmentaires pour crer une feuille de donnes de synthse des Statistiques Descriptives. Aprs avoir cliqu sur le bouton Synthse, les
rsultats seront envoys dans un rapport verrouill qui indiquera lauteur, ainsi que la date et
lheure de cration, etc..., des analyses.
La gamme Entreprise de STATISTICA ajoute un certain nombre de fonctionnalits intressantes pour le travail collaboratif, ladministration centralise, les personnalisations du systme, et
dune manire gnrale, toutes les fonctionnalits ncessaires ds que vous utilisez STATISTICA grande chelle dans lentreprise.
Le Gestionnaire STATISTICA Entreprise est une composante du systme STATISTICA Entreprise qui permet aux utilisateurs de paramtrer diffrents aspects du systme Entreprise, notamment ladministration des utilisateurs, larborescence, la maintenance des connexions avec
les bases de donnes, la configuration des donnes et la configuration des analyses.
Dans cet exemple, nous allons :
1. Crer un nouvel utilisateur
2. Crer un nouveau groupe
a. Attribuer des autorisations ce groupe
b. Ajouter lutilisateur (voir le point n1) ce groupe
Avant de dmarrer cet exemple, vous devez savoir une chose. Dans le menu Affichage du Gestionnaire STATISTICA Entreprise, vous pouvez afficher lArborescence ou au contraire Afficher les Objets. Dans lArborescence, tous les objets, par exemple, Donnes Source et Analyses, sont attachs des dossiers. Si vous choisissez dAfficher les Objets, ces derniers seront
regroups dans des dossiers en fonction de leur catgorie respective. Dans cet exemple, nous
utiliserons un affichage sous forme dArborescence.
Dmarrez le Gestionnaire STATISTICA Entreprise et connectez-vous avec le nom dun utilisateur appartenant au groupe par dfaut des Administrateurs. Dans lArborescence, cliquez sur le
signe situ ct du rpertoire Administration des Utilisateurs afin de le dvelopper, puis
slectionnez le dossier Utilisateurs.
Dans la page des proprits (le volet de droite), cliquez sur le bouton Nouvel Utilisateur afin
daccder aux options permettant de crer le nouvel utilisateur. Dans le champ Nom, saisissez
le nom Nouvel Utilisateur 1 puis dfinissez un mot de passe et confirmez ce mot de passe.
Nous allons maintenant crer un nouveau groupe, attribuer des droits daccs ce groupe et lui
affecter notre nouvel utilisateur pour lui permettre de se connecter au Gestionnaire STATISTICA Entreprise. De cette manire, nous pourrons raliser nos futures modifications des droits
daccs sur le groupe et non sur les utilisateurs individuels, ce qui va simplifier la maintenance
de STATISTICA Entreprise.
Dans le rpertoire Administration des Utilisateurs, slectionnez le dossier Groupes, puis dans
la page des proprits, droite, cliquez sur le bouton Nouveau Groupe afin d'accder aux
options permettant de crer le nouveau groupe. Dans le champ Nom, saisissez l'intitul
Nouveau Groupe 1. Dans le cadre Membres du Groupe, cochez la case situe ct du Nouvel
Utilisateur 1. Nous allons ainsi affecter lutilisateur prcdemment cr notre nouveau groupe. Dans le cadre Droits dAccs du Groupe, cochez les cases situes ct des autorisations
Administrateur Analyses et Utilisateur Web. Dans lArborescence, cliquez sur le signe plus
110 STATISTICA Prise en Main
Copyright StatSoft, 2010
Nous avons maintenant cr les stratgies de scurit ncessaires pour cet utilisateur et ce
groupe afin de leur permettre dexcuter leurs analyses et leurs rapports. Lorsque nous serons
amens crer nos diffrents objets de configuration (donnes source, analyses et rapports) au
cours des diffrentes tapes successives, nous pourrons associer ces objets de configuration
ce groupe afin de permettre aux seuls utilisateurs de ce groupe de les excuter.
Nous allons prsent crer un dossier dans lArborescence pour contenir les diffrents objets
de configuration de cet exemple (donnes source, analyses et rapports). Dans lArborescence,
cliquez sur le signe plus
situ ct du rpertoire Arborescence afin de le dvelopper.
Cliquez avec le bouton droit de la souris sur le dossier STATISTICA Entreprise puis dans le
menu contextuel, slectionnez la commande Nouveau Dossier. Dans le champ ddition Nom
du dossier de la page des proprits, saisissez Nouveau Dossier 1 comme nom du nouveau
dossier.
Cliquez avec le bouton droit de la souris sur le rpertoire Connexions aux Bases de Donnes
dans larborescence, puis slectionnez la commande Nouvelle Connexion une Base de Donnes dans le menu contextuel afin d'accder la bote de dialogue Proprits des Liaisons de
Donnes.
Slectionnez loption Microsoft Jet 4.0 OLE DB Provider puis cliquez sur le bouton Suivant (si
ce fournisseur nest pas accessible dans la liste, rendez-vous sur le site Web de Microsoft
l'adresse http://msdn2.microsoft.com/en-us/data/aa937712.aspx#MDAC pour installer le fournisseur MDAC ou Jet le plus jour avant de recommencer cette tape). Dans longlet Connexion, cliquez sur le bouton situ ct du champ Slectionnez ou tapez un nom de base de
donnes, puis recherchez le dossier dinstallation de STATISTICA (par dfaut C:\Program
Files\StatSoft\STATISTICA). Double-cliquez sur le dossier Exemples puis sur le dossier Bases
de Donnes, et slectionnez le fichier Donnes Process.mdb puis cliquez sur le bouton Ouvrir.
Dans longlet Connexion, cliquez sur le bouton Tester la Connexion. Le message Test de
connexion russi devrait alors apparatre (si ce nest pas le cas, vrifiez vos droits daccs sur
le fichier ainsi que votre installation MDAC).
Cliquez sur le bouton OK dans cette bote de dialogue, puis nouveau sur le bouton OK dans la
bote de dialogue Proprits des Liaisons de Donnes. Dans la page des proprits, saisissez le
libell Nouvelle Connexion 1 dans le champ Nom.
Puisque la connexion avec la base de donnes Donnes Process est cre, nous pouvons maintenant crer la configuration des donnes sources afin de rapatrier les donnes depuis la base
de donnes.
Cliquez avec le bouton droit de la souris sur le rpertoire Nouveau Dossier 1 dans larborescence, et slectionnez la commande Nouvelles Donnes Source dans le menu contextuel. Dans
la page des proprits, saisissez Nouvelles Donnes 1 dans le champ Nom. Cliquez sur la
flche de la liste droulante Connexion, et slectionnez la connexion Nouvelle Connexion 1.
Cliquez sur le bouton tape Suivante dans langle infrieur droit de la page des proprits afin
d'accder aux options de la nouvelle requte.
Remarque : si le bouton tape Suivante napparat pas dans votre installation, cochez la commande Afficher le Bouton tape Suivante dans le menu Affichage du Gestionnaire STATISTICA Entreprise.
Cliquez sur le bouton Assistant SQL afin d'accder la bote de dialogue Nouvelle Requte qui
va apparatre dans STATISTICA.
Glissez la table RAWMAT, depuis le volet de gauche, vers le volet suprieur droit de visualisation, puis slectionnez dans cet ordre les champs ID, OPRATEUR, SITE et HAUTEUR.
Slectionnez longlet Aperu des Donnes dans laffichage des proprits de la requte (le
volet infrieur droit) puis cliquez sur le bouton Actualiser de la barre doutils (matrialis
par un point dexclamation rouge). Le programme va alors tester la requte pour vrifier que
des valeurs sont bien rcupres par la requte que nous venons de dfinir.
Aprs avoir mis la ligne ID en surbrillance, cliquez sur le bouton dition afin daccder aux
options ddition de la colonne ID. Cliquez sur la liste droulante situe ct du champ Mise
Jour Automatique et slectionnez loption Premire colonne de mise jour. De cette manire,
toute modification dans la colonne ID sera dtecte, et cette colonne fera office de premire
cl de tri du fichier de donnes.
Cliquez sur le bouton tape Suivante afin de modifier la colonne OPRATEUR. Cliquez sur le
bouton Filtrage afin daccder aux options de filtrage et cochez loption Permettre le filtrage
sur ce champ afin dautoriser le filtrage sur la colonne OPRATEUR.
Le bouton tape Suivante vous permet de revenir aux options ddition de la colonne OPRATEUR. Cliquez sur le bouton tape Suivante afin daccder aux options ddition de la colonne SITE. Cliquez sur le bouton Filtrage et cochez nouveau loption Permettre le filtrage sur
ce champ afin dautoriser le filtrage sur la colonne SITE. Cliquez sur le bouton tape Suivante
afin de revenir aux options ddition de la colonne SITE, puis cliquez sur le bouton tape
Suivante afin de modifier la colonne HAUTEUR. Cliquez sur la liste droulante Type de Cible,
et slectionnez loption Caractristique aux Mesures. De cette manire, nous indiquons au programme que cette colonne sera disponible pour les analyses de MSP (c'est--dire que cette
colonne contient les donnes que nous souhaitons analyser, par exemple, sous forme de carte
de contrle en temps rel).
Cliquez ensuite sur le bouton tape Suivante afin daccder aux options des Droits dAccs de
cet objet. Dans la liste Groupes et Utilisateurs Disponibles, slectionnez le Nouveau Groupe 1,
puis cliquez sur le bouton suprieur en forme de flche
afin de dplacer le Nouveau Groupe
1 dans la liste Droits dAccs. De cette manire, cette configuration de donnes source pourra
tre excute (mais pas modifie) par tous les utilisateurs du groupe Nouveau Groupe 1.
Cliquez sur le bouton Enregistrer les Modifications de la barre doutils afin de valider notre
nouvelle configuration de donnes source dans le Gestionnaire STATISTICA Entreprise.
prsent que nos donnes source sont configures pour extraire les donnes de la base de
donnes Donnes Process.mdb, nous allons devoir configurer une analyse afin de pouvoir analyser ces donnes.
Cliquez avec le bouton droit de la souris sur le rpertoire Nouveau Dossier 1 dans larborescence, et slectionnez la commande Nouvelle Analyse dans le menu contextuel afin d'accder
la bote de dialogue Slectionnez les Donnes Source. Slectionnez ensuite lobjet Nouvelles
122 STATISTICA Prise en Main
Copyright StatSoft, 2010
Cliquez sur le bouton tape Suivante afin daccder la page des proprits des Caractristiques MSP, puis nouveau sur le bouton tape Suivante afin d'accder la page des proprits
de la Caractristique MSP qui nous intresse, HAUTEUR.
Dans la page des proprits de la Caractristique MSP - HAUTEUR, changez le Type de Carte
en Carte Individuelle & tendues Mobiles (comme illustr ci-dessus).
Dans la mesure o nous navons besoin de paramtrer aucune autre option ici, nous pouvons
accder directement au dossier Options dexcution dans larborescence, et cocher loption Afficher la bote de dialogue des Critres SQL lors de lexcution dans la page des proprits.
Au moment de lexcution de lanalyse, STATISTICA va vous demander de filtrer sur les colonnes contenant des options de Filtrage dans les donnes sources (si nous avions coch loption Ncessaire pour filtrer lorsque nous avons dfini les options de Filtrage, nous naurions
pas eu besoin de cocher loption Afficher la bote de dialogue des Critres SQL lors de lexcution dans la page des proprits ci-dessus puisquune bote de dialogue de filtrage aurait
automatiquement t appele lors de lexcution dans notre exemple, nous avons dfini le
filtrage selon les colonnes SITE et OPRATEUR possible, mais facultatif).
Cliquez sur le bouton Enregistrer les Modifications de la barre doutils afin de valider cette
configuration danalyse dans STATISTICA Entreprise.
Cliquez sur la liste droulante Colonne et slectionnez la variable SITE dans la liste. Le bouton
permet daccder la bote de dialogue Valeur de SITE, qui contient la liste des modalits
disponibles de la variable SITE. Slectionnez le site de Lyon puis cliquez sur le bouton OK.
Cliquez sur le bouton Terminer afin de finir ltape de filtrage, extraire les donnes, et raliser
lanalyse de la colonne HAUTEUR.
Cet exemple simple illustre la manire de configurer et dexcuter une analyse dans linterface-utilisateur classique de STATISTICA, avec les composantes traditionnelles.
Toutefois, lun des atouts de STATISTICA Entreprise est la possibilit de crer simplement des
interfaces-utilisateur personnalises (par exemple, pour diffrentes catgories dutilisateurs
selon le rle quils jouent dans lorganisation, leur expertise, ou les autorisations daccs aux
donnes).
Vous pouvez crer des interfaces personnalises, quel qu'en soit le degr de complexit, depuis
de simples interfaces ultra-dpouilles avec, par exemple, seulement trois options :
Veuillez vous reporter la documentation relative STATISTICA Entreprise pour plus d'informations et dexemples.
Le systme STATISTICA peut tre contrl de diverses manires. Les sections suivantes prsentent les caractristiques des diffrents types dinterfaces-utilisateur de STATISTICA :
1. Interface interactive (voir page 134)
2. STATISTICA Visual Basic (voir page 146)
3. Interfaces bases sur le navigateur Internet (voir page 147), et
4. Intgration avec Microsoft Office (voir page 149)
Notez toutefois que :
La plupart des aspects de ces interfaces-utilisateur ne sont pas mutuellement exclusifs ;
vous pouvez les combiner selon vos applications et prfrences ;
Les menus personnalisables et les barres doutils permettent dintgrer dautres types dinterfaces-utilisateur, par exemple, pour accder rapidement aux macros (Visual Basic) ou
des fichiers que vous utilisez le plus frquemment.
Vous pouvez personnaliser la plupart des fonctionnalits de ces diverses interfaces-utilisateur (avec une multitude daspects et de comportements possibles de STATISTICA) ; nous
vous recommandons de personnaliser votre systme afin de tirer le meilleur parti des possibilits offertes par STATISTICA pour rpondre vos exigences et besoins dans les tches
que vous avez accomplir (voir la section Personnalisation de lInterface-Utilisateur
Interactive, page 225).
CHAPITRE 4 : INTERFACE-UTILISATEUR
Mme sans aucune personnalisation, les paramtres par dfaut de STATISTICA offrent diverses interfaces-utilisateur et solutions pour obtenir les mmes rsultats. Ce principe daccs
alternatif, prsent tout niveau de linterface-utilisateur, permet STATISTICA de sadapter
la manire de travailler de chacun. Par exemple, les outils les plus courants sont accessibles :
partir des menus traditionnels,
Par des raccourcis au clavier (touches de raccourci),
Depuis la barre doutils et les champs cliquables de la barre dtat,
Grce aux barres doutils personnalises (avec des boutons et autres contrles spciaux,
pouvant contenir des macros et des commandes), et
Par les menus contextuels associs des objets particuliers (cellules, lments dun graphique), en cliquant avec le bouton droit de la souris sur llment respectif.
Il est conseill dexplorer les diffrentes interfaces-utlilisateur possibles de STATISTICA avant
de sattacher un style particulier.
CHAPITRE 4 : INTERFACE-UTILISATEUR
dmarrez une nouvelle analyse. Diverses options permettent de contrler (et/ou de configurer
de faon permanente) cet aspect de STATISTICA.
Par dfaut, lorsque vous produisez une sortie partir dune bote de dialogue de rsultats, les
rsultats (tableaux ou graphiques) apparaissent et la bote de dialogue est automatiquement rduite en bouton danalyse, en bas de lcran. Cliquez sur ce bouton (ou appuyez sur les touches CTRL+R) pour restaurer la bote de dialogue et reprendre lanalyse.
Diverses options de gestion des analyses sont proposes dans le menu contextuel des boutons
danalyse respectifs, comme illustr ci-dessus (pour y accder, cliquez avec le bouton droit de
la souris sur un bouton danalyse dans la barre danalyse).
Les utilisateurs
disposant de grands crans peuvent inactiver la rduction automatique des botes danalyse et
profiter du fait que la plupart de ces botes de dialogue sont petites pour les conserver en permanence lcran comme de simili-barres doutils et y slectionner les rsultats produire.
Cette option peut tre modifie pour une analyse particulire (dslectionnez loption Rduction Automatique dans le menu contextuel du bouton danalyse respectif, comme illustr cidessus), ou globalement, pour lensemble du programme (utilisez alors le volet d'options Analyses/Graphiques - Affichage de la bote de dialogue Options, accessible par le menu Outils Options).
STATISTICA Prise en Main 133
Copyright StatSoft, 2010
CHAPITRE 4 : INTERFACE-UTILISATEUR
Lorsque vous ralisez plusieurs analyses et que lespace de travail de STATISTICA devient
encombr, vous pouvez masquer toutes les fentres dune analyse particulire (ou les fermer
simultanment grce la commande Fermer Toutes les Analyses du menu contextuel du bouton danalyse) ; vous pouvez galement ouvrir dautres instances de STATISTICA, ce qui constitue une autre manire simple de grer et dorganiser votre travail.
CHAPITRE 4 : INTERFACE-UTILISATEUR
STATISTICA contient de nombreuses procdures statistiques et graphiques, et chaque procdure peut tre ralise dans une mme application de STATISTICA. Il est ainsi tout
fait possible de calculer des statistiques sur les rsidus dans le module de Rgression Multiple,
puis dutiliser instantanment ces rsultats dans le module dAnalyse Factorielle ou dans un
autre module exploratoire sans avoir ouvrir pralablement une autre application de STATISTICA. Pour plus dinformations sur lutilisation des rsultats en entre dune autre analyse,
voir la rubrique Comment Utiliser les Rsultats dune Analyse en Entre dune Autre Analyse
dans le Manuel lectronique.
CHAPITRE 4 : INTERFACE-UTILISATEUR
slectionnant la commande Statistiques dans le menu contextuel. Vous pouvez aussi slectionner loption Statistiques dans le menu Affichage - Barres doutils. Ou encore crer votre
propre barre doutils avec les analyses que vous utilisez le plus souvent (voir page 145). Pour
plus dinformations sur les barres doutils voir le Manuel lectronique.
Lorsque vous appelez une analyse particulire dans le Panneau de Dmarrage,
la bote de dfinition de lanalyse apparat, vous permettant de slectionner les variables
analyser ainsi que dautres options sur la tche raliser. Ces botes de dialogue comportent
souvent plusieurs onglets qui regroupent en catgories logiques, les options, analyses et/ou
rsultats, afin de faciliter laccs aux fonctionnalits correspondantes.
Dans certaines analyses simples (comme les statistiques descriptives ; voir lillustration cidessus), la bote de dfinition de lanalyse permet galement de slectionner le type et le format des rsultats produire (par exemple, certaines feuilles de donnes ou graphiques spcifiques. La plupart des analyses proposent toutefois des botes de dialogue distinctes pour la
spcification des analyses et des rsultats.
STATISTICA vous permet
dajouter un certain nombre dinformations complmentaires concernant le type de mesure des
variables et le statut des observations dans vos feuilles de donnes. Ces mtadonnes permettent une meilleure description de vos jeux de donnes, mais galement de raliser des analyses exploratoires conditionnelles et de personnaliser laspect des observations dans les graphiques.
CHAPITRE 4 : INTERFACE-UTILISATEUR
Vous pouvez utiliser le statut des
observations pour personnaliser lapparence des points dans les graphiques et permettre une
identification simple et rapide des points intressants ou influents. Vous disposez dune large
gamme de symboles et couleurs pour personnaliser laspect des points slectionns. Vous pouvez affecter des statuts dobservations dans la feuille de donnes avant de produire un graphique, mais galement les dfinir de faon interactive dans les graphiques grce aux outils de
Balayage/Habillage (accessibles par la commande Balayage/Habillage du menu Affichage si le
graphique est ouvert). Le statut des observations que vous dfinissez dans un graphique est
rpercut dans la feuille de donnes et rciproquement. Vous pouvez ainsi raliser des analyses exploratoires visuelles de vos donnes.
Vous pouvez dfinir
explicitement le type de mesure dune variable afin de dterminer les analyses et graphiques
adapts pour cette variable. Ces types de mesures sont ensuite utiliss dans les analyses et graphiques qui vont identifier les variables appropries (par exemple, les variables catgorielles
apparaissent dans la liste des prdicteurs catgoriels disponibles pour une ANOVA Factorielle).
Dans toutes les botes de dialogue de slection de variables (comme celle illustre ci-dessus),
loption Nafficher que les variables appropries vous permet de filtrer les variables en fonction du Type de Mesure (que vous dfinissez dans la bote de dialogue des spcifications de la
Variable accessible en double-cliquant sur lintitul de la variable respective) ; si ce type est
dfini en Automatique, ce sont les options de Classification et filtrage automatique de la
variable qui sappliqueront (telles quelles sont spcifies dans le volet d'options Analyse/Graphique - Affichage de la bote de dialogue Options, accessible en slectionnant la commande
Options dans le menu Outils) et qui vont dterminer la manire dont STATISTICA va dfinir
automatiquement le Type de Mesure.
CHAPITRE 4 : INTERFACE-UTILISATEUR
Le filtrage
(accessible par le menu Donnes - Filtre Automatique) constitue une manire simple et rapide
dafficher une section spcifique des donnes dans votre feuille de donnes sans avoir trier
les donnes ou crer un sous-ensemble. Lorsque vous filtrez une variable, seules les valeurs
correspondant certains critres dfinis sont affiches dans la feuille de donnes. Les observations ne correspondant pas ces critres sont masques laffichage, mais ne sont pas supprimes de la feuille de donnes (par exemple, dans la feuille de donnes ci-dessous, seules les
observations correspondant au filtre SEXE = Homme apparaissent).
Bien que masques dans la feuille de donnes, ces observations restent disponibles pour les
analyses statistiques et graphiques.
Comme indiqu dans le Chapitre 5 Cinq Canaux de Sortie pour les Rsultats
de vos Analyses (page 151) et illustr diverses reprises dans lExemple 1 : Corrlations (page
11) ou dans lExemple 2 : ANOVA (page 34), les feuilles de rsultats et graphiques successifs
sont envoys par dfaut dans des classeurs. Vous pouvez enregistrer et ouvrir ces classeurs
volont, ce qui permet daccder rapidement aux rsultats souhaits.
Vous pouvez galement envoyer tous vos rsultats dans un rapport danalyse (voir page 157),
organis simplement (sous forme darborescence), et facile mettre en forme et imprimer.
Vous pouvez aussi envoyer tous vos rsultats dans des fentres distinctes (indpendantes). Il
est galement possible denvoyer tous vos rsultats, quelle que soit lanalyse dont ils sont issus, dans un rapport commun ou dans des fentres spares (indpendantes).
Dans tous les cas, vous pouvez dfinir les options de sortie dune analyse ou dune session, en
cliquant sur le bouton
dans la bote de dfinition de lanalyse ou du graphique, puis
en slectionnant loption Gestionnaire de Sorties. Vous pouvez paramtrer les options globales
de sortie dans le volet d'options Analyses/Graphiques - Gestionnaire de Sorties de la bote de
dialogue Options (accessible par le menu Outils - Options) ou en slectionnant loption
Gestionnaire de Sorties dans le menu Fichier.
138 STATISTICA Prise en Main
Copyright StatSoft, 2010
CHAPITRE 4 : INTERFACE-UTILISATEUR
STATISTICA permet daccder directement toutes les botes de dfinition des analyses statistiques par le menu Statistiques :
CHAPITRE 4 : INTERFACE-UTILISATEUR
et toutes les botes de dfinition des graphiques par le menu Graphiques :
(ou par les barres doutils Statistiques, Data Mining et Graphiques). Ces menus restent toujours
accessibles, cest--dire quils sont toujours disponibles, quel que soit le type de document
ouvert lcran. Les menus Statistiques et Data Mining donnent accs tous les types danalyses
disponibles dans STATISTICA. Le menu Graphiques fournit un accs direct aux graphiques les
plus courants (par exemple, nuages de points, histogrammes, tracs de moyennes avec barres
derreur, ...) et un accs hirarchique tous les types de graphiques de STATISTICA,
notamment les Graphiques en 2D, les Graphiques Squentiels et Graphiques XYZ en 3D, les
Tracs Matriciels, les Tracs de Figures, les Graphiques Catgoriss, les Graphiques Personnaliss, les Graphiques de Blocs et les Graphiques de Donnes dEntre. Il donne galement
accs aux Graphiques Composs. Vous trouverez une prsentation dtaille des diffrents
types de statistiques et de graphiques de STATISTICA dans le glossaire du Manuel lectronique de STATISTICA. Voir aussi lAnnexe C : Ligne de Produits STATISTICA (page 307) pour
plus d'informations sur les diffrentes composantes de la ligne de produits STATISTICA pour
lanalyse des donnes.
Pour tirer parti de la fonctionnalit multitches
de STATISTICA (voir Excuter Plusieurs Analyses, page 132), les analyses de STATISTICA
sont organises en units fonctionnelles, reprsentes par des boutons dans la barre danalyse ,
en bas de la fentre de lapplication (au-dessus de la barre dtat, voir lillustration ci-aprs, o
les modules de Statistiques lmentaires, Classifications et Analyse Canonique sont lancs
simultanment). Dune manire gnrale, un nouveau bouton danalyse est cr chaque fois
que vous dmarrez une nouvelle analyse.
CHAPITRE 4 : INTERFACE-UTILISATEUR
CHAPITRE 4 : INTERFACE-UTILISATEUR
CHAPITRE 4 : INTERFACE-UTILISATEUR
Par dfaut, certaines botes de dialogue de rsultats
(comme la bote de dialogue Rgression Multiple - Rsultats) contiennent une bote de synthse avec les principaux rsultats de lanalyse. Vous pouvez masquer cette bote de synthse
en cliquant sur le bouton
situ en bas droite de la bote de synthse. Vous pouvez galement supprimer laffichage de toutes les botes de synthse de faon permanente (cest--dire,
dfinir le nouveau paramtre par dfaut de STATISTICA) en cochant loption Masquer la Bote
de Synthse dans le menu Outils - Barre dAnalyse - Options.
CHAPITRE 4 : INTERFACE-UTILISATEUR
Le volet d'options Gnralits de la bote de dialogue Options (accessible par le menu Outils Options), permet de spcifier le nombre de documents rcents afficher (par dfaut 16).
Pour plus dinformations sur les diffrents types de documents, voir lintroduction sur les
classeurs, feuilles de donnes, rapports, graphiques et macros, page 181 ; pour des informations dtailles, veuillez vous reporter au Manuel lectronique.
Chacun des principaux types de documents STATISTICA (voir ci-dessus) gre les donnes de manire diffrente,
et offre donc des options de personnalisation et de gestion diffrentes. Ces diffrences sont
refltes dans les barres doutils associes chaque type de fentre. Les commandes des diffrents menus ainsi que les boutons des barres doutils de chacun des grands types de documents
sont dcrits en dtail dans le Manuel lectronique.
Les classeurs ne possdent pas leur propre barre doutils spcialise (bien que la barre doutils
Standard soit toujours disponible) puisque les barres doutils disponibles dpendent du type de
document actif dans le classeur. Ainsi, lorsque vous modifiez une feuille de donnes, un graphique, un rapport, une macro ou un document externe (par exemple, une feuille de calcul
Excel) dans un classeur, ce sont les barres doutils et les menus correspondants ce type de
document qui sont disponibles.
144 STATISTICA Prise en Main
Copyright StatSoft, 2010
CHAPITRE 4 : INTERFACE-UTILISATEUR
Si vous slectionnez un rpertoire vide dans larborescence du classeur, cest la barre
doutils Statistiques qui apparat par dfaut (et non la barre doutils dun type de document
particulier) afin de prserver la taille et les proportions de lespace de travail de lapplication.
Outre les barres doutils par dfaut de STATISTICA,
vous pouvez crer vos propres barres doutils. Ces barres doutils peuvent intgrer toutes les
commandes disponibles dans STATISTICA, ainsi que des contrles spciaux (par exemple,
police de caractres, taille de police, styles de graphiques, ...). Vous pouvez donner nimporte
quel nom vos barres doutils et les associer des types de documents particuliers (elles
napparatront alors que si le type de document choisi est actif).
Vous pouvez galement personnaliser toutes les barres doutils prdfinies en y ajoutant des
commandes et des contrles spciaux.
Pour crer une barre doutils (ou en modifier une existante) utilisez longlet Barres doutils de
la bote de dialogue Personnaliser, accessible par le menu Outils Personnaliser. Pour personnaliser une barre doutils, faites simplement glisser les commandes depuis cette bote de dialogue vers la barre doutils, comme illustr ci-dessous.
CHAPITRE 4 : INTERFACE-UTILISATEUR
Vous pouvez facilement modifier la forme et la position des barres doutils (par exemple,
toutes les barres doutils peuvent tre ancres un bord de lcran ou au contraire, tre flottantes). Toutes ces options vous permettent de crer des barres doutils individualises, avec
une interface-utilisateur ultra-spcialise. Le Manuel lectronique contient des instructions
pas--pas sur la manire deffectuer ces personnalisations. Voir en particulier la rubrique
Crer une Nouvelle Barre dOutils dans le Manuel lectronique.
La personnalisation des menus est tout aussi simple et peut tre
ralise grce longlet Menu de la bote de dialogue Personnaliser illustre la page
prcdente (voir le Manuel lectronique pour plus dinformations).
Le langage universel STATISTICA Visual Basic (largement utilis dans le monde industriel et
intgr STATISTICA) offre une interface-utilisateur alternative toutes les fonctionnalits de
STATISTICA et constitue bien plus quune nouvelle application de programmation permettant dcrire des extensions personnalises. STATISTICA Visual Basic tire pleinement parti de
larchitecture du modle-objet de STATISTICA et permet daccder, par programmation, tous
les aspects et la plupart des fonctionnalits de STATISTICA. Mme les analyses et les
graphiques les plus complexes peuvent tre enregistrs dans des macros Visual Basic que vous
pouvez ensuite excuter de faon rptitive ou modifier et utiliser comme des blocs de construction dans dautres applications. STATISTICA Visual Basic ajoute un arsenal de plus de
14.000 nouvelles fonctions la syntaxe complte de Microsoft Visual Basic, devenant lun des
environnements de dveloppement les plus riches et complets actuellement disponibles. Pour
plus dinformations sur STATISTICA Visual Basic, voir le Chapitre 9 (page 231).
Si lenvironnement de
STATISTICA Visual Basic est aussi puissant, cest parce quil est capable dintgrer et de
manipuler diverses applications et leurs environnements respectifs dans un mme programme.
Vous pouvez ainsi enregistrer ou crire un programme STATISTICA Visual Basic pour
calculer des prvisions dans le module Sries Chronologiques de STATISTICA et excuter ce
programme depuis une feuille de calcul Excel ou un document Microsoft Word. Lchange
dinformations entre les diffrentes applications sopre en exposant ces applications aux programmes Visual Basic sous forme dObjets. Vous pouvez par exemple raliser des analyses
CHAPITRE 4 : INTERFACE-UTILISATEUR
statistiques dans le module Statistiques lmentaires de STATISTICA grce un programme
Visual Basic excut dans Excel, en dclarant dans votre programme un objet du type
Statistica.Application.
Une fois lobjet cr, le programme Visual Basic peut alors accder aux proprits et mthodes contenues dans cet objet. Les proprits peuvent sapprhender comme des variables, et
les mthodes peuvent tre considres comme des sous-routines ou des fonctions ralisant
certaines oprations ou calculs lintrieur de lapplication-objet respective. Vous pouvez
appeler directement les procdures STATISTICA depuis de nombreuses applications externes
et langages de programmation (par exemple, C++, Java, ).
Outre les deux grands types dinterfaces-utilisateur dcrites dans les deux sections prcdentes, toute la gamme de produits STATISTICA peut galement se prsenter dans linterface dun navigateur Internet,
o les interactions avec lapplication, notamment le requtage des bases de donnes mais aussi les oprations de gestion des donnes, les tches danalyse des donnes et de data
mining, ou encore les rapports et autres aspects de travail
collaboratif, peuvent seffectuer sans que lapplication STATISTICA ne soit installe en local sur lordinateur, et depuis
nimporte quel ordinateur, pourvu quil dispose dune
connexion Internet. Cette interface-utilisateur alternative
ncessite linstallation dune version Client-Serveur de lapplication STATISTICA correspondante.
WebSTATISTICA Server est une application permettant
dintgrer STATISTICA avec Internet et en particulier d'excuter STATISTICA de faon interactive depuis un simple navigateur Web. Il permet aux utilisateurs d'accder rapidement et
facilement aux bases de donnes et aux puissants outils analytiques depuis tout ordinateur
connect Internet, n'importe o dans le monde. Le produit est propos avec une slection
d'interfaces-utilisateur bases sur le navigateur Internet (avec des botes de dialogue intuitives
et une navigation extrmement simplifie) permettant aux utilisateurs de spcifier leurs
CHAPITRE 4 : INTERFACE-UTILISATEUR
analyses et d'accder aux rsultats respectifs depuis un simple navigateur Internet. En outre, le
programme met votre disposition un certain nombre d'outils destins personnaliser ou dfinir de nouvelles interfaces-utilisateur ou de nouvelles fonctions. Vous pouvez, par exemple,
faire apparatre dans votre navigateur une simple bote de dialogue constitue de trois boutons
uniquement, chacun excutant sur une srie d'analyses venant complter un rapport dtaill.
Les applications WebSTATISTICA Server ajoutent une nouvelle dimension et une infinit de
possibilits et d'applications l'ensemble des produits d'analyse de donnes, de data mining et
de contrle qualit/six sigma de la gamme STATISTICA.
WebSTATISTICA Server est un systme entreprise entirement personnalisable permettant d'accder des bases de donnes et d'analyser
des donnes au travers du web. Construit sur la technologie du traitement distribu, il est totalement compatible avec l'architecture Client/Serveur multi-tiers. WebSTATISTICA Server
expose les fonctionnalits analytiques, graphiques, de requte et de reporting de STATISTICA
au travers d'interfaces Web classiques, interactives et simples utiliser. Le programme se prsente sous la forme d'une application complte, cl-en-mains, avec une interface-utilisateur
base sur le navigateur Internet, permettant aux utilisateurs distants de crer leurs propres
fichiers de donnes, d'effectuer leurs propres analyses et d'accder aux rsultats de faon interactive. Toutefois, en raison de son architecture ouverte, WebSTATISTICA Server comprend
galement des outils de dveloppement (totalement compatibles avec les conventions de
syntaxe universelles utilises dans le milieu industriel comme le langage Visual Basic, C++,
HTML, XML), et qui permettent aux dpartements informatiques de personnaliser les principales composantes du systme, ou d'tendre le systme en utilisant ses fondations et en ajoutant, par exemple, de nouvelles composantes et/ou fonctionnalits analytiques trs spcifiques
ou relatives aux bases de donnes. Le systme est compatible avec la plupart des plates-formes
de serveurs Web (par exemple, UNIX Apache, Microsoft IIS), et fonctionne aussi bien dans
les environnements Microsoft .net que Sun/Java ; aucune modification du pare-feu en place ni
des paramtres de scurit Internet/Intranet n'est ncessaire.
Pour plus d'informations, voir l'Annexe B WebSTATISTICA, page 295.
CHAPITRE 4 : INTERFACE-UTILISATEUR
Si Microsoft Office est install sur la mme machine que STATISTICA, vous aurez la possibilit d'ouvrir directement des feuilles de calcul Excel dans STATISTICA et les utiliser comme
source de donnes pour vos analyses (pour un exemple, voir page 55). De la mme manire,
vous pourrez utiliser des documents Word comme destination pour vos rapports (pour un
exemple, voir page 161).
Vous pouvez ouvrir des documents Excel dans l'espace
de travail STATISTICA l'aide de la bote de dialogue Ouvrir classique. Lorsque vous slectionnez un classeur Excel, une bote de dialogue vous demande si vous souhaitez importer le
fichier dans une feuille de donnes STATISTICA ou si vous prfrez conserver le document
sous sa forme Excel, c'est--dire, sous forme d'une fentre Excel dans l'application STATISTICA.
Aprs avoir ouvert le document Excel, vous avez accs tous les menus et barres d'outils
d'Excel. Vous pouvez ainsi modifier et mettre jour les formules, changer la mise en forme,
copier/coller, glisser-dplacer et d'une manire gnrale, utiliser tous les outils habituellement disponibles dans l'application Excel.
Le principal avantage de l'intgration avec Excel rside dans le fait que vous pouvez utiliser
des documents Excel en source de donnes de vos analyses. Il vous suffit de slectionner la
fentre du document Excel lorsque vous dmarrez une analyse, afin que l'analyse utilise automatiquement le document Excel en entre. Lorsque vous excutez l'analyse, STATISTICA
affiche une bote de dialogue vous permettant de spcifier le champ du document Excel
utiliser comme source de donnes et si une ligne ou une colonne particulire sont considrer
comme noms de variables ou d'observations. Ces paramtres sont alors associs au document
Excel et il n'est pas ncessaire de les spcifier nouveau.
Vous pouvez non seulement utiliser des documents Excel comme source de donnes dans
STATISTICA, mais vous pouvez galement activer la mise jour automatique. Si vous crez
un graphique avec mise jour automatique partir du menu Graphiques et que vous changez
les donnes dans le fichier Excel en saisissant de nouvelles donnes ou en recalculant les
formules, le graphique se mettra jour galement.
CHAPITRE 4 : INTERFACE-UTILISATEUR
Vous pouvez galement ouvrir et modifier vos documents Word dans l'espace de travail STATISTICA l'aide de la bote de dialogue
Ouvrir classique ; lorsque vous ralisez des analyses statistiques ou que vous crez des
graphiques, vous pouvez envoyer les rsultats dans un document Word. Tous les lments que
vous pouvez envoyer dans un rapport STATISTICA peuvent galement tre envoys dans un
document Word.
Comme pour les fentres Excel, les fentres Word contiennent toutes les barres d'outils et
menus disponibles dans l'application Word. Vous pouvez effectuer toutes les oprations de
mise en forme et d'dition habituellement disponibles dans l'application Word.
Lorsque vous envoyez une feuille de donnes dans Word, STATISTICA utilise les fonctionnalits d'dition des tableaux de Word et convertit la feuille de donnes en tableau. Pour les
grosses feuilles de donnes qui ne peuvent pas tenir sur une seule page, c'est vous qui dfinissez les sauts de lignes et de colonnes. La largeur de page dtermine le nombre de colonnes
affiches pour la feuille de donnes. Toutes les lignes d'un ensemble dfini de colonnes sont
affiches avant les colonnes suivantes dans le document Word. Cette solution permet d'afficher les feuilles de donnes dans Word o elles peuvent tre modifies de faon native dans
Word, mais galement d'afficher l'intgralit de la feuille de donnes, et de la mettre en page
correctement avant impression.
Lorsque vous ralisez une analyse, STATISTICA produit des rsultats sous forme de tableaux
multimdia (feuilles de donnes) et de graphiques. Il existe cinq canaux de sortie vers lesquels
vous pouvez envoyer tous vos rsultats :
1. Les Classeurs STATISTICA (page 154)
2. Des fentres indpendantes (page 156)
3. Les Rapports (page 157)
4. Microsoft Word (page 161)
5. Le Web (page 163)
Les quatre premiers sont contrls par le Gestionnaire de Sorties (accessible par la commande
Gestionnaire de Sorties du menu Fichier, voir page 23 pour plus d'informations sur le Gestionnaire de Sorties global de la bote de dialogue Options et sur le Gestionnaire de Sorties de
l'Analyse/Graphique). Vous pouvez envoyer vos rsultats sur le Web de diverses manires
selon la version de STATISTICA dont vous disposez.
Vous pouvez utiliser diffrentes combinaisons de ces canaux de sortie (par exemple, un classeur et un rapport simultanment) et personnaliser chacun des canaux de sortie de diverses
manires. En outre, tous les rsultats (feuilles de donnes et graphiques) qui sont envoys vers
ces canaux de sortie peuvent contenir d'autres objets et documents incorpors ou lis, ce qui
vous permet d'organiser les rsultats STATISTICA de diverses manires. Chacun des canaux de
STATISTICA Prise en Main 153
Copyright StatSoft, 2010
Les classeurs constituent l'option de gestion par dfaut des sorties (pour plus d'informations,
voir page 181). Ils conservent chaque document de sortie (par exemple, une feuille de donnes
ou un graphique STATISTICA ou des documents Microsoft Word ou Excel) sous forme d'onglets dans le classeur.
Les documents peuvent tre organiss sous une forme hirarchique de dossiers ou de groupes
de documents (par dfaut, un par analyse) dans une arborescence, o les documents individuels, dossiers ou rpertoires entiers de l'arborescence peuvent tre manipuls de faon flexible.
Par exemple, vous pouvez extraire des documents (par exemple, en utilisant les fonctionnalits
Glisser-Copier ou Glisser-Dplacer) vers un rapport ou vers l'espace de travail de l'application
(c'est--dire, vers l'arrire-plan de l'application STATISTICA o ils apparaissent sous forme
La page Web de sortie contient une arborescence avec des liens hypertexte qui vous permet de
naviguer entre les diffrentes images du classeur, comme vous le feriez dans le classeur.
Les documents de sortie STATISTICA peuvent galement tre dirigs vers une file de fentres
indpendantes ; la Taille de la File peut tre modifie dans le volet d'options Analyses/Graphiques - Gestionnaire de Sorties de la bote de dialogue Options (accessible par le menu Fichier Gestionnaire de Sorties).
L'inconvnient majeur de ce mode de sortie est son manque total d'organisation et sa tendance
naturelle encombrer l'espace de travail de l'application (notez que certaines procdures peuvent gnrer des centaines de tableaux ou graphiques avec un seul clic).
L'un des avantages de cette faon de procder est la possibilit de personnaliser facilement
l'organisation de ces objets dans l'espace de travail (par exemple, pour crer des documents
de rfrence, qu'il est alors facile de comparer d'autres rsultats). Pour ce faire, il n'est
cependant pas ncessaire de paramtrer par dfaut les sorties sous forme de fentres individuelles, avec le risque de produire un nombre important (et souvent inutile) de fentres distinctes
risquant de saturer l'espace de travail. En revanche, il est possible tout moment d'extraire des
fentres individuelles, pralablement envoyes vers les deux autres canaux de sortie (classeurs,
rapports), en les glissant de l'arborescence respective vers l'espace de travail de l'application si
ncessaire.
Lorsque vous ralisez une analyse, le but ultime consiste produire des rsultats clairs qui
vont permettre d'amliorer la comprhension des donnes. La manire dont les rsultats sont
produits est galement importante. STATISTICA propose diverses mthodes pour produire des
rapports en fonction des diffrents besoins des utilisateurs.
Les rapports STATISTICA (pour plus d'informations, voir page 189) permettent de manipuler
les sorties de faon plus traditionnelle puisque les objets (par exemple, une feuille de donnes,
STATISTICA Prise en Main 157
Copyright StatSoft, 2010
Toutefois, la technologie cache derrire ce simple rapport vous permet d'accder de riches
fonctionnalits. Par exemple, comme pour les classeurs, chaque rapport STATISTICA est aussi
un container ActiveX (pour plus d'informations sur la technologie ActiveX, voir page 248
ou le Manuel lectronique) o chaque objet (non seulement les feuilles de donnes et les graphiques STATISTICA mais aussi tout autre document compatible ActiveX, comme une feuille
de donnes Microsoft Excel) est actif, personnalisable et ditable directement.
Cette manire de procder offre des avantages vidents dans la mesure o il est facile d'insrer
des notes et commentaires entre les objets et que cette manire plus traditionnelle correspond
ce que certains utilisateurs ont l'habitude d'utiliser (notez que l'diteur supporte le dfilement
vitesse variable et les autres fonctionnalits de la souris IntelliMouse).
En outre, seul le rapport contient et prserve l'enregistrement des informations complmentaires, c'est--dire un journal des options spcifies au cours des analyses (par exemple, les
variables slectionnes et leur description dtaille, etc...) selon le niveau d'information complmentaire demand dans le volet d'options Analyses/Graphiques - Gestionnaire de Sorties de
la bote de dialogue Options (accessible par le menu Fichier - Gestionnaire de Sorties), voir
page 23. L'inconvnient vident de ces rapports traditionnels demeure toutefois la structure
plate inhrente impose par leur format de style traitement de texte, bien que certains utilisateurs ou applications prfrent cette organisation.
Lorsqu'un classeur STATISTICA contient les rsultats de vos analyses, vous pouvez les transfrer dans un rapport.
En procdant de cette manire, vous pouvez ajouter vos propres commentaires entre les objets
et utiliser une mthode plus classique de navigation entre les rsultats laquelle certains utilisateurs sont plus habitus. En outre, seuls les rapports permettent de stocker des informations
complmentaires, comme le dtail des options spcifies pour l'analyse (par exemple, les variables slectionnes, leur description dtaille, etc...) selon le niveau d'information complmentaire demand dans le volet d'options Analyses/Graphiques - Gestionnaire de Sorties de la
bote de dialogue Options accessible par la commande Options du menu Outils. Voir page 23.
Ouvrez un classeur STATISTICA. Si vous n'en avez aucun d'enregistr, crez-en un nouveau :
vrifiez tout d'abord que le bouton d'option Classeur est slectionn dans le Gestionnaire de
Sorties (accessible en slectionnant la commande Gestionnaire de Sorties dans le menu
Fichier). Puis crez un classeur en suivant l'Exemple 1 : Corrlations (page 11) ou l'Exemple
2 : ANOVA (page 34).
Dans un classeur ouvert, slectionnez tous les fichiers en cliquant sur le premier fichier, puis,
tout en appuyant sur la touche MAJ de votre clavier, en cliquant sur le dernier fichier. Cliquez
ensuite sur le bouton Ajouter au Rapport dans la barre d'outils. Tous les fichiers contenus dans
le classeur seront alors copis dans un Rapport STATISTICA.
Le format RTF est une mthode de codification standard de Microsoft permettant l'change
ais de graphiques et de texte mis en forme avec d'autres applications. Lorsque vous enregistrez des rapports au format *.rtf (Rich Text Format), toute la mise en forme du fichier est
prserve et le fichier peut tre lu et correctement interprt par toutes les applications compatibles avec RTF (par exemple, Word).
Le format des Rapports STATISTICA (.str) respecte les conventions RTF ; toutefois, si vous
enregistrez vos rapports au format natif des Rapports STATISTICA (par dfaut), vous avez l'assurance que vos rapports seront ouverts dans STATISTICA, et que vous pourrez accder
l'arborescence du rapport.
Afin d'ouvrir un rapport STATISTICA dans une application compatible RTF, ouvrez le rapport
et slectionnez la commande Enregistrer Sous dans le menu Fichier afin d'accder la bote de
STATISTICA Prise en Main 159
Copyright StatSoft, 2010
Les lettres PDF sont les initiales de Portable Document Format ; il s'agit d'un format universel
de stockage de donnes graphiques et de texte. Le format PDF possde une structure et un
aspect graphique volus qui en font un outil idal pour des prsentations. En outre, vous
pouvez visualiser vos documents PDF en mode graphique ou en mode texte, c'est--dire que
vous pouvez slectionner les donnes soit sous forme d'image mise en forme, soit de texte
traditionnel.
Le format PDF n'est pas li un systme d'exploitation particulier et il existe des utilitaires de
visualisation de documents PDF gratuits pour chacun d'eux (par exemple, Adobe Acrobat pour
Windows ou Ghostscript pour Linux).
Le format PDF a t reconnu comme un format de stockage de documents acceptable dans les
environnements rglements par la norme 21 CFR Part 11 de la FDA.
Pour enregistrer un Rapport STATISTICA au format PDF, ouvrez le rapport et slectionnez la
commande Enregistrer au Format PDF dans le menu Fichier. La bote de dialogue Options de
Sortie va alors vous permettre de choisir de crer les feuilles de donnes sous forme d'Objets
(telles qu'elles apparaissent dans la fentre du Rapport) ou de Feuilles de Donnes de Taille
Complte (pages distinctes). Si vous souhaitez produire vos feuilles de donnes toujours de la
mme manire, cochez l'option Utiliser le paramtrage courant et ne plus afficher cette bote de
dialogue. Cliquez sur le bouton OK pour fermer la bote de dialogue Options de Sortie et afficher la bote de dialogue Enregistrer le Rapport au Format PDF. Le champ Enregistrer dans
vous permet de slectionner le dossier dans lequel vous souhaitez enregistrer le document ;
saisissez un nom dans le champ Nom du fichier puis cliquez sur le bouton Enregistrer. Vous
pouvez sauvegarder vos Rapports, Feuilles de Donnes et Graphiques STATISTICA au format
PDF.
Remarque : il ne s'agit pas de pseudo fichiers PDF (avec un bitmap compress des images
respectives des pages de documents) mais bien de vritables fichiers PDF permettant la copie
slective des informations textuelles.
STATISTICA vous permet galement d'envoyer vos rsultats directement dans Word grce aux
fonctionnalits d'intgration avec Office. Lorsque vous ouvrez Word depuis STATISTICA, les
barres d'outils et menus de Word deviennent accessibles grce la technologie d'interface avec
les Documents ActiveX. Dans STATISTICA, vous pouvez effectuer toute opration de mise en
forme et d'dition reconnue par Word.
Lorsque vous envoyez une feuille de donnes dans Word, STATISTICA utilise les fonctionnalits d'dition de tableaux de Word et convertit la feuille de donnes en tableau. Pour les grosses
feuilles de donnes qui ne peuvent pas tenir sur une seule page, c'est vous qui dfinissez les
sauts de lignes et de colonnes. La largeur de page dtermine le nombre de colonnes affiches
pour la feuille de donnes. Toutes les lignes d'un ensemble dfini de colonnes sont affiches
avant les colonnes suivantes dans le document Word. Cette solution vous permet d'afficher les
feuilles de donnes dans Word o elles peuvent tre modifies de faon native dans Word,
mais galement d'afficher l'intgralit de la feuille de donnes et de la mettre en page correctement avant impression.
Comme pour les Rapports STATISTICA classiques (voir page 157), les documents Word peuvent contenir diverses informations supplmentaires (par exemple, variables slectionnes,
description dtaille des variables, etc...).
Pour envoyer vos rsultats dans un document Word, utilisez les options du Gestionnaire de
Sorties (accessible par la commande Gestionnaire de Sorties du menu Fichier, ou slectionnez
la commande Options du menu Outils puis slectionnez le volet d'options Analyses/Graphiques - Gestionnaire de Sorties dans la bote de dialogue Options). Dans la liste droulante Rapport Microsoft Word, slectionnez l'une des options Envoyer dans diffrents documents Word
(un par analyse/ graphique), Document Word commun (identique pour toutes les analyses/graphiques), ou [Slectionnez un Fichier] pour spcifier un document Word existant.
Si les documents Word, contrairement aux Rapports ou Classeurs STATISTICA, n'offrent pas
d'arborescence, il existe de nombreux avantages envoyer vos rsultats dans des documents
Word. En effet, lorsque vous envoyez vos rsultats dans des rapports Word, vous bnficiez de
toutes les fonctionnalits de traitement de texte disponibles dans Word. Par exemple, vous
pouvez utiliser des modles pour crer des documents ultra-personnaliss, ajouter une table
des matires et des index, suivre les modifications, etc...
Vous pouvez avoir besoin d'envoyer un Rapport ou un Classeur STATISTICA sur Internet pour
permettre d'autres de le consulter. STATISTICA vous permet d'enregistrer vos rapports et
classeurs au format HTML. Les lettres HTML sont les initiales de HyperText Markup Language. Le langage HTML utilise des balises pour identifier les diffrents lments du document, comme le texte ou les graphiques.
Aprs avoir ouvert un Rapport ou un Classeur STATISTICA, slectionnez la commande Enregistrer Sous du menu Fichier afin d'accder la bote de dialogue Enregistrer Sous. Dans la
liste droulante Type, slectionnez l'option Fichiers HTML (*.html; *.htm) afin d'enregistrer le
fichier avec l'extension *.htm.
Tous les graphiques contenus dans le rapport ou dans le classeur sont enregistrs au format
*.png dans le mme dossier que le fichier HTM en utilisant les conventions d'appellation
suivantes : nom_du_rapport_image0001.png, nom_du_rapport_image0002.png, etc... Vous
pouvez aussi enregistrer les graphiques au format JPG si vous prfrez. Pour ce faire, slectionnez la commande Options du menu Outils afin d'accder la bote de dialogue Options.
Slectionnez le volet d'options Documents - Rapports ou Documents - Classeurs, selon le type
de document enregistrer au format .htm, puis slectionnez le bouton d'option Format JPEG
dans le groupe Format d'exportation des images HTML avant de cliquer sur le bouton OK.
WebSTATISTICA offre une manire alternative de diffuser les rapports au travers de son Portail Interactif. Ce Portail Interactif vous permet de publier des documents STATISTICA (feuilles de donnes, graphiques, rapports ou classeurs) sur Internet. Les utilisateurs disposant de
droits limits sur le Portail Interactif peuvent seulement consulter ces documents. Vous pouvez
contrler l'accs ces documents en dfinissant des autorisations d'accs sur les documents et
les dossiers grce aux outils standard fournis avec WebSTATISTICA.
Pour publier des informations sur le Portail Interactif, vous devez pralablement crer un
dossier dans le dossier Portail de l'entrept WebSTATISTICA : connectez-vous tout d'abord
WebSTATISTICA en tant qu'utilisateur disposant de droits d'Administration, puis dans le menu
Fichier, slectionnez Oprations sur Mes Rpertoires pour accder la bote de dialogue Mes
Rpertoires de WebSTATISTICA ; une bote de dialogue similaire celle-ci va alors apparatre.
Pour crer un dossier dans le rpertoire Portail afin d'y enregistrer vos rapports, slectionnez
le rpertoire Portail, puis cliquez sur le bouton Crer afin d'accder la bote de dialogue
Invite Utilisateur de Internet Explorer. Dans le champ d'dition, saisissez le nom du nouveau
dossier, Exemples, puis cliquez sur le bouton OK. Une bote de dialogue va apparatre pour
STATISTICA Prise en Main 163
Copyright StatSoft, 2010
Remarque : vous pouvez dterminer les individus habilits lire et crire dans ce dossier en
mettant le dossier Exemples en surbrillance, puis en cliquant sur le bouton Scurit et en
utilisant les options de WebSTATISTICA pour dterminer les droits d'accs au niveau des utilisateurs et des groupes pour ce rpertoire.
prsent que notre rpertoire est cr, nous allons pouvoir ajouter nos rsultats d'analyse afin
de permettre aux utilisateurs du Portail d'y accder depuis WebSTATISTICA ou depuis STATISTICA.
Dmarrons une analyse dans WebSTATISTICA. Dans le menu Fichier de WebSTATISTICA,
slectionnez la commande Ouvrir une Feuille de Donnes. Dans la bote de dialogue Slectionnez une Source des Donnes, slectionnez le rpertoire Fichiers de donnes dans le volet de
gauche, puis le fichier de donnes Adstudy.sta dans le volet de droite et cliquez sur le bouton
OK.
Fermez la fentre de l'diteur de Feuilles de Donnes de WebSTATISTICA (nous ne l'utiliserons pas dans cet exemple) et conservez simplement la fentre du navigateur reportant l'information de synthse de la Source de Donnes Active pour le fichier de donnes Adstudy.sta.
Dans le menu Statistiques - Statistiques lmentaires de WebSTATISTICA, slectionnez la
commande Statistiques Descriptives afin d'accder la bote de slection des variables et la
bote de dialogue des paramtres des Statistiques Descriptives. Dans la bote de dialogue de
slection des variables, slectionnez les variables MESURE1 et MESURE2 dans la liste des
Variables continues. Puis, dans la bote de dialogue des paramtres des Statistiques Descriptives, slectionnez Tous les rsultats dans la liste des Rsultats produire.
Cliquez sur le bouton OK afin d'accder aux rsultats de cette analyse, constitus de diffrentes
feuilles de donnes et graphiques.
Avant de publier cette page sur le Portail, vous avez la possibilit de rorganiser les objets ou
d'ajouter des commentaires. Cliquez sur le bouton Modifier la Page dans la partie suprieure de
la page. La bote de dialogue Portail Interactif - dition des Rsultats apparat.
La liste des objets prsents sur la page apparat dans le volet gauche de l'diteur ; dans le cas
prsent, nous avons trois feuilles de donnes et quatre graphiques. Le volet droit de la page
reprsente le contenu de la page. L'objet initial de la page porte l'intitul Espace Rserv pour
les lments Restants, ce qui signifie que tous les objets qui n'auront pas t spcifiquement
slectionns seront insrs cet endroit de la page. Dans la mesure o il s'agit du seul lment
prsent sur cette page, nos trois feuilles de donnes et nos quatre graphiques seront donc
reports dans la page de rsultats, comme c'tait le cas sur la page originale.
Dans cet exemple, nous allons inclure uniquement le second graphique (Graph2) et la troisime feuille de donnes (Spreadsheet3) dans les rsultats. Slectionnez tout d'abord l'objet Espace Rserv pour les lments Restants dans le volet de droite, et supprimez-le. La page est
prsent totalement vierge. Slectionnez l'objet Graph2 dans la liste gauche, puis cliquez sur
le bouton Insrer l'lment afin d'insrer le graphique sur la page. Pour insrer la feuille de
donnes la suite, cliquez tout d'abord en dessous du graphique pour dplacer le pointeur d'insertion sous le graphique que nous venons d'ajouter. Puis slectionnez l'objet Spreadsheet3
dans le volet de gauche et cliquez sur le bouton Insrer l'lment. La feuille de donnes va
alors s'insrer automatiquement en dessous du graphique.
168 STATISTICA Prise en Main
Copyright StatSoft, 2010
Insrons prsent un commentaire entre les deux objets. Pour ce faire, nous devons pralablement positionner le curseur entre les deux objets dans l'aperu de la page. Saisissons le texte
Table de Frquences de MESURE2 issue de. Pour modifier la police et sa taille, mettez en
surbrillance le texte que vous venez de saisir puis cliquez sur le bouton A de la barre d'outils.
Nous avons ici spcifi un style Gras et une taille de police de 24 points avant de cliquer sur le
bouton OK pour valider notre choix.
Outre les objets que vous pouvez intgrer, il est galement possible d'insrer des paramtres
prdfinis pour cette analyse. Il s'agit notamment de tous les paramtres issus de la bote de
dialogue initiale des paramtres, mais galement de paramtres tels que la date et l'heure d'excution, le nom de l'utilisateur ou encore le nom de la source de donnes. Pour accder ces
paramtres, cliquez sur le bouton Variables, situ dans la partie suprieure gauche de la fentre
Portail Interactif - dition des Rsultats. Cette liste reporte tous les paramtres que vous pouvez insrer.
Placez votre curseur la fin du texte que vous venez de saisir et cliquez sur le paramtre DataSource, puis cliquez sur le bouton Insrer la Variable. Le nom de la source de donnes utilise
va alors s'insrer la position du curseur.
Remarque : le paramtre que nous venons d'ajouter est un simple marqueur et ce n'est pas le
nom de la source de donnes qui apparat dans l'diteur ; en revanche, lorsque la page sera affiche en dehors de l'diteur, le nom qui apparatra la place du marqueur sera bien celui de la
source de donnes. Pour un aperu de la page, cliquez sur le bouton Aperu. Pour enregistrer
la page modifie, cliquez sur le bouton Enregistrer. Un message vous indiquera que la page a
t correctement enregistre.
Cliquez sur le bouton OK de ce message, puis fermez la fentre Portail Interactif - dition des
Rsultats. Vous pourrez constater que notre page originale a t mise jour, et qu'elle intgre
bien les modifications que nous venons d'apporter.
STATISTICA Prise en Main 171
Copyright StatSoft, 2010
Nous allons prsent publier cette page afin que les autres utilisateurs puissent la consulter sur
le Portail. Cliquez sur le bouton Publier dans la partie suprieure droite de la fentre pour faire
apparatre la bote de dialogue Rpertoire de Publication. Slectionnez le rpertoire Exemples
cr prcdemment. Vous pouvez galement dterminer les utilisateurs habilits consulter
cette page spcifique en cochant l'option Dfinir les autorisations d'accs sur cette page de
sortie ; dans cet exemple, gardons cette option dslectionne afin de permettre tous les utilisateurs ayant accs au dossier Exemples de visualiser ce document.
Cliquez sur le bouton Suivant afin d'enregistrer la page dans le rpertoire slectionn.
Dornavant, si un utilisateur se connecte au Portail, il verra le nouveau dossier Exemples, avec
la page que nous venons de crer pour les Statistiques Descriptives.
Grce la fonctionnalit d'intgration des versions bureautiques de STATISTICA avec WebSTATISTICA, vous pouvez galement publier des documents STATISTICA (feuilles de donnes, graphiques, rapports et classeurs) directement sur le Portail depuis l'application STATISTICA.
La premire tape consiste activer l'intgration avec WebSTATISTICA. Dans le menu Outils
de STATISTICA, slectionnez la commande Options afin d'accder la bote de dialogue
Options. Slectionnez le volet d'options Serveur / Web, afin de spcifier l'URL du Serveur
WebSTATISTICA ainsi que tout autre paramtre de configuration dfini par votre administrateur systme lors de l'installation de WebSTATISTICA.
Cliquez ensuite sur le bouton OK afin d'accder la bote de dialogue Statistiques Descriptives.
Assurons-nous tout d'abord que tous les rsultats de cette analyse vont bien tre envoys dans
un classeur. Pour ce faire, cliquez sur le bouton Options dans la partie droite de la bote de dialogue, et dans la liste droulante, slectionnez la commande Gestionnaire de Sorties. Dans la
bote de dialogue Gestionnaire de Sorties de l'Analyse/Graphique, vrifiez que le bouton d'option Classeur est bien slectionn dans le cadre Placer tous les rsultats (Feuilles de donnes,
Graphiques) dans. Cliquez sur le bouton OK afin de revenir la bote de dialogue Statistiques
Descriptives.
Cliquez sur le bouton Variables afin d'accder une bote de dialogue de slection de variables, slectionnez les variables MESURE1 et MESURE2, puis cliquez sur le bouton OK afin
de revenir la bote de dialogue Statistiques Descriptives. Dans l'onglet Base, cliquez sur le
bouton Statistiques : Synthse afin d'envoyer les rsultats dans un classeur. La bote de dialogue Statistiques Descriptives va alors se rduire automatiquement pour vous permettre de
visualiser les rsultats ; restaurez la bote de dialogue en cliquant sur le bouton Statistiques
Descriptives dans la Barre d'Analyse, dans l'angle infrieur gauche de l'cran. Cliquez maintenant sur le bouton Histogrammes afin de produire un histogramme de chacune des variables
slectionnes. La bote de dialogue de l'analyse va nouveau se rduire, et le classeur devrait
prsent avoir l'aspect illustr ci-contre.
Il s'agit du document que nous souhaitons publier sur le Portail. Dans le menu Serveur, slectionnez la commande Enregistrer Sous. La bote de dialogue Entrept de WebSTATISTICA
apparat avec une liste de dossiers de WebSTATISTICA. Ouvrez le dossier Portail, puis slectionnez le rpertoire Exemples, et cliquez sur le bouton OK afin d'enregistrer le classeur dans
ce dossier du Portail.
Vous pouvez visualiser ce document dans STATISTICA en ouvrant une fentre du navigateur
dans l'espace de travail STATISTICA. Dans le menu Serveur, slectionnez la commande Ouvrir
dans le Navigateur afin d'ouvrir une fentre du navigateur et vous connecter WebSTATISTICA. Dans le menu Fichier de WebSTATISTICA, choisissez l'option Oprations sur Mes Rpertoires ; dans la bote de dialogue Mes Rpertoires, vous pouvez ouvrir le dossier Exemples et
accder au fichier Classeur1.stw que nous avons enregistr. Slectionnez ce fichier et cliquez
sur le bouton Visualiser afin d'ouvrir le classeur dans le navigateur.
Les classeurs (prsents brivement page 154) constituent l'option de gestion par dfaut des
rsultats et conservent chaque document de sortie (par exemple, une feuille de donnes ou un
graphique STATISTICA, mais aussi un document Microsoft Word ou Excel) sous forme d'onglets.
D'un point de vue technique, les classeurs STATISTICA sont des containers ActiveX optimiss (pouvant stocker efficacement de grandes quantits de documents ; voir page 248 pour
plus d'informations). Les documents peuvent tre organiss sous forme hirarchique de dossiers ou de groupes de documents (par dfaut, un par analyse) en utilisant une arborescence,
dans laquelle les documents individuels, dossiers ou rpertoires entiers de l'arborescence peuvent tre manipuls de faon flexible.
Vous pouvez galement supprimer l'affichage des onglets pour gagner de la place. Contrairement la plupart des applications d'organisation ou de navigation de type Explorateur qui ne
permettent d'attacher les diffrents lments qu' des dossiers, le classeur STATISTICA permet
chaque lment de l'arborescence d'avoir ses propres sous-dossiers (dpendances). Par
exemple, vous pouvez ajouter une feuille de donnes votre classeur, puis ajouter les graphiques produits partir de ces donnes comme des sous-dossiers de la feuille de donnes.
L'arborescence du classeur affiche l'organisation des fichiers et dossiers dans le classeur. Les
fichiers et dossiers sont affichs dans un format de type Explorateur. Le signe plus (+) situ
ct des diffrents lments indique la prsence de sous-dossiers ou sous-fichiers. Pour dvelopper l'arborescence d'un dossier ou d'un fichier particulier, cliquez sur le signe plus situ
ct de l'lment. Le classeur peut contenir un nombre illimit de niveaux et vous pouvez
manipuler les lments individuels ou des branches entires de l'arborescence de manire
flexible et interactive (par exemple, vous pouvez dplacer ou copier des lments issus d'un
classeur ou d'un rapport grce au menu contextuel, comme illustr sur la seconde image).
Pour analyser ou modifier un lment du classeur, pointez simplement le fichier dans l'arborescence et cliquez sur l'icne associe. Le document va alors apparatre dans le volet de visuSTATISTICA Prise en Main 183
Copyright StatSoft, 2010
L'arborescence du classeur peut tre organise et modifie en utilisant les fonctionnalits Glisser-Dplacer et les oprations du Presse-papiers. Veuillez vous reporter aux rubriques Fonctions Glisser-Dplacer du Classeur et Oprations du Presse-papiers du Classeur dans le
Manuel lectronique. Les commandes Insrer, Extraire, Supprimer et Dplacer sont accessibles par le menu contextuel de l'arborescence (en cliquant avec le bouton droit de la souris
sur l'arborescence). Ces commandes sont galement accessibles partir du menu Classeur.
184 STATISTICA Prise en Main
Copyright StatSoft, 2010
Les feuilles de donnes STATISTICA utilisent la technologie des tableaux multimdia brevete
par StatSoft ; elles permettent de manipuler la fois les donnes d'entre et les sorties numriques ou du texte (et d'autres types de sorties). Les feuilles de donnes se prsentent sous forme
de tableaux en deux dimensions, pouvant stocker un nombre pratiquement illimit d'observations (lignes) et de variables (colonnes), et chaque cellule peut comporter un nombre de caractres quasi-illimit. Il est galement possible d'attacher des sons, vidos, graphiques, animations, rapports avec des objets incorpors ou tout document compatible ActiveX.
Parce que les feuilles de donnes STATISTICA peuvent galement comporter des macros et
toute interface-utilisateur personnalise, ces tableaux multimdia peuvent servir de cadre pour
dvelopper vos propres applications personnalises (par exemple, avec une liste d'options ou
une srie de boutons placs dans l'angle suprieur gauche ; voir ci-aprs), des prsentations
auto-excutables, des animations, des simulations, etc
Les donnes STATISTICA sont organises sous forme d'observations et de variables. Si ce concept ne vous est pas
familier, vous pouvez considrer les observations comme des enregistrements dans une base
de donnes (ou comme les lignes d'une feuille de donnes), et les variables comme des champs
(ou comme les colonnes d'une feuille de donnes). Chaque observation est constitue d'un
ensemble de valeurs (des diffrentes variables) et la premire colonne du fichier peut ventuellement contenir le nom des observations.
Les feuilles de donnes comprennent diverses composantes (voir ci-dessous).
Juste au-dessus du nom des variables, en haut de la fentre, vous pouvez saisir
ou modifier une ligne de texte pour dcrire vos donnes en double-cliquant dans la zone Descriptif. Pour ne slectionner que le Descriptif (afin d'en modifier la mise en forme), cliquez une
fois dans l'angle suprieur gauche (le pointeur de la souris transforme alors en ). Pour ajouter de nouvelles lignes, appuyez sur CTRL+ENTRE ou sur ALT+ENTRE. Dans l'illustration cicontre, le Descriptif contient le texte Enqute amricaine sur l'efficacit d'une pub.
Ces cellules, situes l'extrme gauche de la fentre, contiennent le nom des observations. Double-cliquez sur un Nom d'Observation pour saisir ou modifier le nom de l'observation correspondante. Pour slectionner uniquement le Nom d'Observation (mise en forme), cliquez une fois gauche du Nom d'Observation (le pointeur de la souris
se transforme alors en ). Pour slectionner toute la ligne respective (dition), cliquez une
fois droite du Nom d'Observation (le pointeur de la souris se transforme alors en
). Pour
slectionner un bloc de Noms d'Observations (sans slectionner les lignes respectives), utilisez
l'option Slectionner les Noms d'Observations du menu contextuel de la feuille de donnes.
Pour ajuster automatiquement la taille des Noms d'Observations, double-cliquez entre les
Noms d'Observations et la premire colonne du fichier (le pointeur de la souris se transforme
alors en
). Dans l'illustration ci-contre, les Noms d'Observations contiennent l'initiale du
prnom et le nom des personnes interroges dans l'tude. Remarque : les Noms d'Observations
sont facultatifs et vous pouvez afficher les numros correspondants en dslectionnant l'option
Noms d'Observations dans le menu Affichage.
Ces cellules situes en haut de chaque colonne, contiennent le nom
des variables respectives. Pour afficher le dtail d'une variable, double-cliquez sur le Nom de la
Variable respective. Pour slectionner le Nom de Variable (mise en forme) cliquez une fois
STATISTICA Prise en Main 187
Copyright StatSoft, 2010
STATISTICA permet d'ouvrir et de travailler sur plusieurs feuilles de donnes en mme temps.
Les feuilles de donnes de STATISTICA stockent les donnes mais servent galement afficher les rsultats numriques des analyses. Puisque STATISTICA offre les mmes fonctionnalits pour les feuilles de donnes d'entre (dont sont issues les donnes analyses) et les feuilles
de donnes de sortie (o sont envoys les rsultats de l'analyse), il est facile d'utiliser les
rsultats d'une analyse en entre d'une autre analyse.
Une feuille de donnes pralablement enregistre est automatiquement traite comme une
feuille de donnes d'entre et vous pouvez ouvrir simultanment autant de feuilles de donnes
d'entre que vous le souhaitez. En revanche, afin d'viter toute confusion, les feuilles de donnes de sortie (avec les rsultats des analyses) ne sont pas considres automatiquement comme des donnes d'entre. Vous devez le spcifier explicitement avant de pouvoir les utiliser en
entre d'une autre analyse. En outre, les feuilles de donnes d'entre indiquent le nombre de
variables et d'observations de la feuille de donnes dans la barre de titre. Par exemple, Exp.sta
(88 var. et 48 obs.) est une feuille de donnes d'entre, contrairement Exp.sta.
Pour transformer une feuille de donnes de sortie en feuille de donnes d'entre, slectionnez
la feuille de donnes respective puis cochez l'option Feuille de Donnes Active dans le menu
188 STATISTICA Prise en Main
Copyright StatSoft, 2010
STATISTICA va alors utiliser cette feuille de donnes pour l'analyse. Si vous revenez
une autre feuille de donnes prcdemment dfinie comme feuille de donnes d'entre, elle
pourra, elle aussi, tre utilise pour l'analyse.
Dans un classeur, vous ne pouvez utiliser qu'une seule feuille de donnes d'entre la fois
pour vos analyses, mme si le classeur en comporte plusieurs. Cette feuille de donnes est
appele feuille de donnes active et son icne (dans l'arborescence) est encadre en rouge.
Par dfaut, lorsque vous dfinissez une feuille de donnes de sortie en feuille de donnes
d'entre, STATISTICA la considre automatiquement comme feuille de donnes active. Pour
slectionner une autre feuille de donnes d'entre comme feuille de donnes active, slectionnez la feuille de donnes respective dans l'arborescence puis cochez l'option Feuille de Donnes Active dans le menu Classeur ou dans le menu contextuel de l'arborescence du classeur.
Vous pouvez galement conserver une feuille de donne ouverte l'cran, tout en la rendant
indisponible pour les analyses. Pour ce faire, slectionnez tout d'abord la feuille de donnes,
puis dslectionnez l'option Feuille de donnes active dans le menu Donnes. STATISTICA va
alors automatiquement utiliser la dernire feuille de donnes active utilise pour une analyse.
Les rapports STATISTICA (brivement dcrits page 157) permettent de manipuler les sorties
de faon plus traditionnelle (par rapport aux classeurs) puisque les objets (par exemple, une
feuille de donnes ou un graphique STATISTICA ou encore une feuille de calcul Microsoft
Cependant, la technologie derrire ce simple rapport vous offre de riches fonctionnalits. Par
exemple, comme pour le classeur, chaque rapport STATISTICA est aussi un container ActiveX (voir page 248), o chaque objet (non seulement les feuilles de donnes et les graphiques STATISTICA mais aussi tout document compatible ActiveX, comme un document Word
ou une image Bitmap) est actif, personnalisable, et ditable directement. Les rapports sont
enregistrs au format STR, qui est l'extension StatSoft du format RTF (Rich Text Format,
*.rtf) de Microsoft. Les fichiers STR stockent la mme information que les fichiers RTF, mais
prservent en plus l'information sur l'arborescence (qui ne peut pas tre stocke dans les
fichiers RTF standard). Dans STATISTICA, les fichiers de rapport sont enregistrs par dfaut
avec l'extension *.str, mais peuvent aussi tre enregistrs au format standard RTF (dans ce cas,
l'information sur l'arborescence n'est pas conserve).
Cette manire de procder offre des avantages vidents dans la mesure o il est facile d'insrer
des notes et commentaires entre les objets et que cette manire plus traditionnelle (par rapport
aux classeurs) correspond ce que certains utilisateurs ont l'habitude de manipuler avec des
rsultats les uns suite des autres. En outre, le rapport de sortie contient des informations
comme les options spcifies pour l'analyse (par exemple, les variables slectionnes, leur description dtaille, etc...) ; vous pouvez demander des informations complmentaires plus ou
moins dtailles dans le volet d'options Analyses/Graphiques - Gestionnaire de Sorties de la
bote de dialogue Options (accessible par le menu Fichier - Gestionnaire de Sorties).
L'arborescence du rapport affiche l'organisation des fichiers et dossiers dans le rapport. Les
fichiers et dossiers sont affichs dans un format de type Explorateur. Toutefois, contrairement
aux classeurs qui permettent de dfinir une hirarchie quasi-illimite de dossiers, sous-dossiers
et fichiers, vous ne pouvez dfinir qu'un seul niveau de fichiers dans les rapports.
Vous pouvez incorporer tout type de document STATISTICA dans un rapport, notamment des
feuilles de donnes, graphiques et analyses. Vous pouvez insrer d'autres objets ActiveX/OLE,
comme des feuilles Excel, des documents Word, des images bitmap, etc... Pour diter un
document insr, il suffit de double-cliquer dessus. Le fichier apparat alors dans un diteur et
la barre d'outils du Rapport fusionne avec la barre d'outils de l'application native du fichier
insr, vous permettant ainsi d'accder toutes les fonctions d'dition ncessaires.
Les lments de l'arborescence sont reprsents par une icne. Les icnes des feuilles de donnes ( ), rapports ( ), macros ( ) et graphiques ( ) reprsentent respectivement des feuilles de donnes, des rapports, des macros et des graphiques STATISTICA. L'icne du Data
Miner ( ) reprsente des espaces de travail du Data Miner.
Tous les documents externes STATISTICA sont reprsents par l'icne associe leur application. Par exemple, les documents Word sont reprsents par l'icne Word ( ), et les feuilles
de calcul Excel sont reprsentes par l'icne Excel ( ).
Le langage standard STATISTICA Visual Basic (largement utilis dans le monde industriel et
intgr STATISTICA) offre une interface-utilisateur alternative toutes les fonctionnalits de
STATISTICA et constitue bien plus qu'une nouvelle application de programmation permettant d'crire des extensions personnalises. STATISTICA Visual Basic tire pleinement parti de
l'architecture du modle-objet de STATISTICA et permet d'accder par programmation tous
les aspects et la plupart des fonctionnalits de STATISTICA. Mme les analyses et les graphiques les plus complexes peuvent tre enregistrs dans des macros Visual Basic que vous pouvez ensuite excuter de faon rptitive ou modifier et utiliser comme des blocs de construction dans d'autres applications. STATISTICA Visual Basic ajoute un arsenal de plus de 14.000
nouvelles fonctions la syntaxe complte de Microsoft Visual Basic, devenant l'un des environnements de dveloppement les plus riches et complets actuellement disponibles.
Vous pouvez enregistrer les macros STATISTICA dans diffrents formats, selon la manire
dont vous souhaitez les utiliser (voir aussi le Manuel lectronique pour plus d'informations).
Vous pouvez galement les copier dans le Presse-papiers et les coller dans d'autres programmes ou documents.
Vous trouverez une prsentation plus approfondie de STATISTICA Visual Basic dans le
Chapitre 9 (page 231).
Lorsque vous ralisez des analyses et que vous travaillez avec des documents STATISTICA,
vous avez gnralement un certain nombre de fentres l'cran et diverses analyses des
stades d'avancement diffrents. STATISTICA vous permet d'enregistrer votre espace de travail,
y compris les analyses en cours. Vous pouvez fermer STATISTICA tout moment et l'ouverture du projet, les fichiers prcdemment ouverts et toute analyse en cours seront automatiquement restaurs.
Pour enregistrer un Projet STATISTICA, slectionnez la commande Enregistrer le Projet Sous
du menu Fichier afin d'accder la bote de dialogue Enregistrer un Projet STATISTICA.
Cette bote de dialogue vous permet de spcifier le nom de fichier et le chemin du Projet STATISTICA (avec l'extension .spf). Vous pouvez dfinir les lments spcifiques intgrer dans le
Projet. Vous pouvez slectionner tous les types de documents STATISTICA (Feuilles de donnes,
Graphiques, Classeurs, Macros, Rapports, Projets du Data Miner, Connexions d'Interface Directe
avec les Bases de Donnes, Analyses et Rsultats des analyses). Pour les documents STATISTICA
enregistrs sur disque, vous pouvez tablir une Liaison avec le fichier existant du document ou au
contraire, enregistrer une copie du document tel qu'il apparaissait l'cran au moment de son enregistrement dans le fichier du Projet STATISTICA (Intgrer le document dans le projet).
Outre les documents STATISTICA, les fichiers des Projets peuvent galement enregistrer
toutes les analyses en cours. Le Projet va alors stocker les scripts crs automatiquement lors
de l'excution des diffrentes analyses. l'ouverture du Projet, les scripts des analyses sont
nouveau excuts sur les donnes originales et les botes de dialogue des analyses sont restaures exactement comme elles l'taient au moment de l'enregistrement du fichier du Projet.
Les Projets constituent une manire efficace de partager les diffrentes tapes des analyses en
cours et leurs rsultats entre diffrents utilisateurs si vous intgrez les documents enregistrs
dans le Projet. Un utilisateur peut excuter des analyses jusqu' un stade particulier, puis enregistrer le Projet avant de le transmettre un autre utilisateur, qui sera alors en mesure d'ouvrir
le fichier du Projet et poursuivre l'analyse exactement o le premier utilisateur s'est arrt.
Sauf si vous avez paramtr STATISTICA diffremment, vous recevrez automatiquement un
message vous proposant d'enregistrer un Projet en quittant STATISTICA et le dernier Projet
194 STATISTICA Prise en Main
Copyright StatSoft, 2010
L'interface du Data Miner Plus constitue une solution qui dcompose toutes les phases d'une
dmarche de data mining jusqu'aux rsultats. Depuis la phase de prparation des donnes
jusqu' la validation du modle, Data Miner Plus vous guide du dbut la fin de votre analyse
de manire obtenir des rponses et des rsultats que vous pouvez mettre en uvre rapidement. STATISTICA Data Miner Plus applique la gamme la plus complte d'algorithmes de
data mining, sans que l'utilisateur n'ait connatre le dtail de ces algorithmes.
STATISTICA Data Miner offre une large gamme de mthodes et algorithmes de data mining.
En termes trs gnraux, ces algorithmes empruntent l'approche et la mthodologie de diffrents domaines comme les statistiques, l'ingnierie, l'intelligence artificielle, les sciences
cognitives, etc..., afin de mettre en vidence des phnomnes partir des donnes pour en
tirer des prvisions (dans le domaine des assurances ou des crdits risques, de la qualit d'un
produit ou d'un processus, des dfaillances matrielles, des diagnostics mdicaux, etc). Le
Manuel lectronique de STATISTICA et sa version anglaise en ligne (le Manuel lectronique
de Statistiques) proposent une introduction dtaille aux principales mthodes et techniques
habituellement regroupes sous la terminologie du data mining.
Dans la pratique, certains types de mthodes et d'algorithmes se rvlent plus efficaces pour
certains domaines ou certains types de donnes spcifiques. Par exemple, les techniques de data
mining les plus efficaces pour modliser les donnes des indemnisations d'assurance sont gnralement diffrentes de celles qui permettent d'obtenir les meilleurs rsultats pour prvoir les
rejets mis par un haut fourneau. Ceci tant dit, il existe une dmarche type qui va de la dfinition des donnes et du problme analytique l'chantillonnage, la construction du modle et
l'valuation qui peut s'appliquer toutes les tches de data mining prdictif.
L'interface-utilisateur du Data Miner Plus permet des utilisateurs ne disposant pas d'une
grande exprience des outils du data mining, de passer rapidement de la dfinition d'une problmatique des rsultats tangibles et directement actionnables.
Avec cette approche, vous n'avez qu' vous laisser guider dans une interface-utilisateur de type
Assistant pour complter les tapes ncessaires jusqu' la solution. En fait, la plupart de ces
tapes sont entirement automatises et vous ne devez spcifier en entre que les donnes et
les variables analyser : le programme s'occupe automatiquement du reste dterminer les
chantillons d'apprentissage et de test, slectionner les meilleurs prdicteurs, essayer diffrents
algorithmes et mthodes de data mining, et tester automatiquement les rsultats afin de choisir
le meilleur modle de data mining. Vous pouvez raliser ces calculs et analyses dans la version bureautique de STATISTICA Data Miner ou dans la version Client-Serveur, WebSTATISTICA Data Miner si vous disposez de la licence ncessaire.
Lorsque vous enregistrez un projet du data miner (Data Miner Plus) en cours de ralisation,
deux fichiers distincts sont en fait crs :
Un fichier Data Miner Plus portant l'extension .dmrproj
Un fichier de Classeur STATISTICA portant le mme nom avec l'extension .stw, et contenant les rsultats et informations de chaque phase de l'Assistant
Il est important que les deux fichiers soient situs dans le mme dossier. Ainsi, pour copier un
projet du Data Miner Plus, disons MonProjetDataMiner vers un nouveau rpertoire, l'envoyer
un collgue par messagerie lectronique, ou l'intgrer dans le systme STATISTICA Gestion
Documentaire, vous devrez copier les deux fichiers MonProjetDataMiner.dmrproj et
MonProjetDataMiner.stw vers le nouvel emplacement.
Ci-aprs, diverses informations concernant ces deux fichiers.
Les fichiers Data Miner Plus sont des fichiers
stocks au format XML (extensible markup language) et contenant toutes les informations relatives aux choix de l'utilisateur (ou aux choix effectus automatiquement par le programme),
notamment :
L'information relative au fichier de donnes (ou la connexion aux donnes)
La slection des variables et les mtadonnes relatives ces variables (par exemple, la dfinition des variables de sortie et des prdicteurs catgoriels et continus)
Les choix concernant les phases de prparation des donnes (par exemple, la gestion des
valeurs manquantes, le filtrage des doublons, les transformations, etc...)
La slection finale des variables retenus par les algorithmes de slection des meilleurs prdicteurs
Les rsultats de la construction du modle, les tests finaux de comparaison des modles
ainsi que le choix des modles
Toutes les informations ncessaires au dploiement des modles prdictifs et la prvision
des nouvelles observations (par exemple, pour rintgrer des scores dans des bases de donnes, tablir des valeurs sensorielles, calculer des probabilits prvues de dfaillance ou de
risque, etc)
Par consquent, lorsque vous dployez des solutions Data Miner Plus dans la version STATISTICA Entreprise afin de calculer automatiquement des valeurs prvues dans une application
STATISTICA Prise en Main 197
Copyright StatSoft, 2010
Les rsultats stocks dans ce classeur fournissent une information complte sur les calculs et
les analyses raliss par le Data Miner Plus. Ainsi, lorsque des analyses de data mining sont
menes dans des environnements rglements (par exemple, FDA, ISO, etc...), ou si le data
mining intervient dans une organisation au niveau d'activits sensibles qui sont encadres et
rglementes par certaines procdures techniques, ou autres procdures normalises d'exploitation (SOP - Standard Operating Procedures en anglais), il est gnralement conseill de
stocker ce fichier dans le systme STATISTICA Gestion Documentaire avec le fichier du projet
Data Miner Plus (.dmrproj).
Les graphiques ont vocation reprsenter et communiquer de faon efficace des informations
(habituellement, des donnes numriques). Toutefois, les techniques graphiques constituent
galement des outils analytiques puissants pour explorer les donnes et vrifier des hypothses.
STATISTICA offre une large gamme de
mthodes graphiques pour analyser des donnes et reprsenter les rsultats. Tous les graphiques de STATISTICA comportent une vaste slection de techniques analytiques intgres et
interactives ainsi que de nombreux outils de personnalisation pour contrler de faon interactive la plupart des aspects de l'affichage. En outre, vous disposez de fonctionnalits de gestion multi-graphiques pour intgrer divers graphiques et construire des liens dynamiques entre
des applications (par exemple, par la technologie OLE de Liaison et Incorporation d'Objets).
Vous pouvez
accder aux options graphiques de STATISTICA par programmation (grce au langage intgr
STATISTICA Visual Basic ou d'autres langages compatibles), ce qui ouvre des possibilits
quasi-infinies pour produire des graphiques ultra-personnalisables. Vous pouvez alors ajouter
ces graphiques personnaliss de faon permanente l'interface-utilisateur de STATISTICA (par
exemple, en les affectant des boutons des barres d'outils ou en les ajoutant des menus).
STATISTICA offre diverses mthodes pour raliser des graphiques. Ces mthodes sont dcrites dans la section Grandes Catgories de Graphiques, page 207. Elles sont complmentaires et fournissent un haut niveau d'intgration
entre les donnes numriques (donnes brutes, rsultats intermdiaires ou rsultats finaux) et
leur reprsentation graphique. Vous pouvez ainsi produire automatiquement des graphiques
CHAPITRE 7 : GRAPHIQUES
spcialiss en sortie de vos procdures statistiques ou grce aux outils intgrs pour visualiser
toute combinaison numrique (et/ou de valeurs-texte) produite par STATISTICA.
CHAPITRE 7 : GRAPHIQUES
systmes de styles pour diffrents projets). Pour plus d'informations, voir le descriptif du volet
d'options Configurations de la bote de dialogue Options dans le Manuel lectronique.
Vous pouvez dfinir de nouveaux types de graphiques
de diverses manires et les ajouter aux menus, botes de dialogue ou barres d'outils. Si
vous souhaitez utiliser un graphique personnalis de faon rptitive (non pas un graphique construit de toutes pices, par exemple, l'aide des outils lmentaires de dessin, mais
au contraire, en personnalisant un graphique existant du menu Graphiques), vous pouvez
l'ajouter au menu Graphiques comme nouveau type de graphique en cliquant sur le bouton
Ajouter au Menu des Graphiques Personnaliss dans l'onglet Options 2 de la bote de
dialogue de dfinition du graphique. Toutes les spcifications du graphique personnalis
seront alors enregistres automatiquement dans le fichier de configuration de STATISTICA
(par exemple, vous pouvez dfinir diffrents groupes de graphiques personnaliss selon
vos diffrents projets). Pour plus d'informations, voir le descriptif du volet d'options Configurations de la bote de dialogue Options dans le Manuel lectronique.
Notez enfin qu'il n'existe aucune limite quant au degr
de personnalisation des graphiques STATISTICA parce que STATISTICA Visual Basic
(avec ses puissants outils de dessin et bibliothques de procdures graphiques bases sur
STATISTICA) permet de produire la plupart des graphiques ou sorties multimdia compatibles avec le matriel informatique actuel. Ces affichages personnaliss ou sorties multimdia peuvent alors tre affects aux barres d'outils STATISTICA, aux menus ou aux
botes de dialogue et devenir partie intgrante de votre application STATISTICA.
Voir le Manuel lectronique pour plus d'informations sur ces diffrentes mthodes de personnalisation des graphiques. Le Manuel lectronique contient diffrentes rubriques consacres
aux diffrentes catgories de graphiques, avec des introductions conceptuelles et des exemples
d'applications courantes, et aborde les proprits fonctionnelles qui caractrisent ces diffrents
types de graphiques.
Les paramtres par dfaut de la plupart des graphiques STATISTICA respectent les conventions explicitement dcrites dans les ouvrages de statistique ou de reprsentation graphique, ou
qui constituent des normes communment acceptes par les principaux journaux scientifiques
(par exemple, SCIENCE). Toutefois, vous avez la possibilit de personnaliser quasiment tous
les paramtres par dfaut de STATISTICA afin de rpondre des besoins spcifiques pour des
applications particulires (voir page 202). Les fonctionnalits graphiques de STATISTICA
constituent une bote outils modulable, en mesure de produire des effets ultra-professionnels.
En outre, vous pouvez personnaliser ces outils ou crer vos propres outils, et les intgrer aux
barres d'outils et aux menus pour une utilisation rpte (voir page 202).
CHAPITRE 7 : GRAPHIQUES
Outre une gamme complte de graphiques statistiques et techniques standard, STATISTICA offre de nombreux types de graphiques et fonctionnalits de personnalisation indits. Si les statisticiens de StatSoft en ont conu la grande majorit, il faut souligner le rle important que les
utilisateurs de STATISTICA ont pu jouer dans leur cration. En fait, la gamme actuelle d'options graphiques proposes dans STATISTICA est la rsultante des commentaires de milliers
d'utilisateurs qui ont rpondu aux sollicitations de StatSoft. De nombreuses fonctionnalits
spcifiques aux Graphiques STATISTICA (par exemple, les sous-ensembles multiples ou les
options de catgorisation interactives) ont t introduites en rponse aux suggestions et prconisations des utilisateurs. StatSoft tient ici remercier ses utilisateurs pour toutes leurs
suggestions.
Comme nous l'avons dj mentionn prcdemment (voir aussi page 207), il existe de nombreuses manires de faire appel des graphiques STATISTICA. Vous pouvez considrer que
ces mthodes constituent autant d'interfaces diffrentes entre des valeurs numriques et des
graphiques.
Par exemple, les valeurs d'un camembert (diagramme circulaire) peuvent simplement reprsenter les valeurs des observations successives (par exemple, les observations libelles Anne
2008, Anne 2009, Anne 2010,...) d'une colonne de la feuille de donnes (par exemple, la
variable Ventes). Les valeurs reprsentes sur un autre camembert du mme type, peuvent en
revanche reprsenter les rsultats d'un calcul particulier. Par exemple, les secteurs du camembert peuvent reprsenter le pourcentage d'observations appartenant diverses catgories calcules par une procdure de catgorisation d'histogramme ou d'effectifs (par exemple, le nombre
d'annes o les Ventes ont t infrieures 10 millions d'Euros, comprises entre 10 et 20
millions d'Euros et enfin, suprieures 20 millions d'Euros).
Quelle que soit la mthode utilise pour crer le graphique (c'est--dire, indpendamment de
l'origine des nombres reprsents dans le graphique ou de la manire dont ils ont t calculs),
toutes les fonctionnalits de personnalisation et de gestion multigraphique des graphiques
STATISTICA peuvent tre utilises pour modifier l'apparence du graphique ou l'intgrer d'autres graphiques ou documents.
CHAPITRE 7 : GRAPHIQUES
En outre, toutes les fonctionnalits analytiques intgres qui sont accessibles depuis les graphiques STATISTICA (ajustement d'une fonction, lissage, rotation, balayage et zoom analytique, etc...) peuvent tre appliques au graphique, quelle que soit la source des valeurs ou la
mthode utilise pour crer le graphique.
Les fonctions d'dition graphique offertes dans STATISTICA vous permettent de crer des publications scientifiques et techniques ultra-personnalises :
CHAPITRE 7 : GRAPHIQUES
mais galement des tracs prcis :
CHAPITRE 7 : GRAPHIQUES
Les graphiques enregistrs dans des fichiers ou temporairement dtachs de l'application STATISTICA (par exemple, copis dans le Presse-papiers ou lis un document d'une autre application) sont des objets complets (d'un point de vue technique, ce sont des objets ActiveX,
voir page 248) qui contiennent, outre les fonctionnalits de personnalisation et des objets
incorpors, toutes les donnes ncessaires la poursuite de l'dition des diffrents aspects de
l'affichage et l'analyse de son contenu (ajustement, lissage, etc...).
Comme les graphiques STATISTICA sont des objets ActiveX, ils peuvent aisment tre lis ou
incorpors dans d'autres documents compatibles (par exemple, des feuilles de calcul Excel ou
des documents Word) dans lesquels ils peuvent tre modifis directement en double-cliquant
dessus. Les graphiques STATISTICA sont galement des containers ActiveX et peuvent par
consquent comporter une large gamme de documents incorpors ou lis comme des dessins
Visio, des illustrations Adobe, des feuilles de calcul Excel ou des documents Word. En outre,
STATISTICA permet d'tablir des hirarchies d'objets incorpors jusqu' quatre niveaux, ce qui
signifie qu'il est possible de crer des documents, contenant des documents, contenant des
documents, contenant eux-mmes des documents.
Outre les graphiques statistiques spcialiss disponibles partir des botes de dialogue de
rsultats de toutes les procdures statistiques (voir page 219), il existe deux grandes catgories
de graphiques accessibles par le menu Graphiques, la barre d'outils Graphiques, les menus
contextuels et le bouton Dmarrer de STATISTICA ) :
Les graphiques des donnes d'entre (qu'il s'agisse des Graphiques des Donnes d'Entre,
voir page 208, ou des graphiques du menu Graphiques, voir page 213)
Les Graphiques de Blocs (voir page 211).
La principale diffrence entre ces deux grandes catgories rside dans les donnes que le graphique utilise pour produire le trac.
Les Graphiques des Donnes d'Entre et leur
version tendue du menu Graphiques, produisent une synthse statistique ou graphique des
donnes brutes de la feuille de donnes d'entre (d'une manire gnrale, une ou plusieurs variables, ou un sous-ensemble, si vous utilisez les filtres de slection). Si vous crez un graphique
de ce type par un menu contextuel dans une feuille de donnes ne contenant pas des donnes
CHAPITRE 7 : GRAPHIQUES
brutes (par exemple, une matrice de corrlation), STATISTICA va utiliser les donnes brutes
pour produire le graphique (par exemple, le nuage de points des variables identifies par la cellule de la matrice de corrlations ayant servi appeler le menu contextuel).
Les Graphiques de Blocs sont indpendants du concept de donnes d'entre ou de fichier de donnes. Il s'agit d'un outil gnraliste pour reprsenter des
valeurs numriques d'un bloc de donnes slectionn dans une feuille de donnes (il peut s'agir
de rsultats numriques spcifiques ou d'une slection arbitraire de donnes brutes).
Ces deux
grandes catgories de graphiques offrent les mmes types de graphiques et options de personnalisation. Vous pouvez ainsi produire un graphique ternaire catgoris ultra-spcialis partir
du fichier de donnes d'entre (donnes brutes) ou d'un bloc de valeurs particulires slectionnes pour un test particulier (rsultats).
Ces deux grandes catgories de graphiques seront prsentes dans les deux sections suivantes,
puis dans la section sur le menu Graphiques, qui dcrit les autres graphiques de la premire
catgorie (graphiques des donnes d'entre), souvent appele graphiques du menu Graphiques,
bien qu'ils permettent galement d'accder aux Graphiques de Blocs ainsi qu' d'autres options.
La commande Graphiques des Donnes d'Entre du menu contextuel de toutes les feuilles de
donnes offre un accs rapide aux types de graphiques les plus courants.
CHAPITRE 7 : GRAPHIQUES
Tous ces graphiques sont galement accessibles par le menu Graphiques, le bouton Dmarrer
de STATISTICA ( ), ou en cliquant sur le bouton Galerie Graphique ( ) d'une bote de spcification d'un graphique. Les Graphiques des Donnes d'Entre offrent moins d'options que les
graphiques correspondants du menu Graphiques mais sont en revanche plus rapides slectionner puisque, contrairement aux graphiques du menu Graphiques :
les Graphiques des Donnes d'Entre peuvent tre appels directement depuis le menu
contextuel de la feuille de donnes,
les Graphiques des Donnes d'Entre ne ncessitent pas la slection d'options dans les
botes de dialogue (les graphiques sont produits avec les paramtres par dfaut), et
les Graphiques des Donnes d'Entre ne ncessitent pas la slection pralable des variables
(le choix des variables est fonction de la position du curseur dans la feuille de donnes).
Les Graphiques des Donnes d'Entre traitent les donnes directement depuis le fichier de
donnes ouvert et se servent de la position du curseur pour dterminer les variables utiliser
(quel que soit le type de feuille de donnes).
Ainsi, si vous cliquez avec le bouton droit de la souris sur une corrlation dans une feuille de
donnes et que vous crez un graphique du type Nuage de Points par, STATISTICA va produire le nuage en 2D partir des valeurs originales brutes des deux variables reprsentes par
cette corrlation (voir l'Exemple Introductif, page 11 pour plus de dtails).
Bien qu'il soit plus pratique (et sans doute plus logique) de slectionner les Graphiques des
Donnes d'Entre dans le menu contextuel de la feuille de donnes, vous pouvez galement les
slectionner partir du menu Graphiques ou partir du bouton Dmarrer
de STATISTICA.
Un sous-menu va alors apparatre, vous permettant de choisir un graphique statistique applicable la variable courante (identifie par la position du curseur dans la feuille de donnes).
Si la feuille de donnes est une matrice ou si elle possde un format dans lequel la position du
curseur fait rfrence, non pas une, mais deux variables (comme dans la matrice de corrlation illustre ci-aprs), le menu Graphiques des Donnes d'Entre va proposer des graphiques
bivaris prdfinis pour la paire de variables spcifie.
CHAPITRE 7 : GRAPHIQUES
Dans les autres cas (c'est--dire lorsque la position courante du curseur ne fait rfrence qu'
une seule variable, comme illustr dans le tableau de statistiques descriptives ci-dessous), et
que vous slectionnez un graphique bivari dans le menu, STATISTICA va vous demander de
slectionner une seconde variable. Dans l'illustration suivante, si vous slectionnez l'option
Nuage de Points par, STATISTICA va vous demander la variable selon laquelle vous souhaitez reprsenter la variable Mesure5.
Si plusieurs variables sont en surbrillance (c'est--dire, lorsque le bloc slectionn s'tale sur
plusieurs variables), le menu Graphiques des Donnes d'Entre s'applique uniquement la
premire variable slectionne.
210 STATISTICA Prise en Main
Copyright StatSoft, 2010
CHAPITRE 7 : GRAPHIQUES
Lorsque vous produisez un Graphique des Donnes d'Entre, STATISTICA tient compte des
filtres de slection et des pondrations qui sont dfinis pour reprsenter les variables. Notez
toutefois que les filtres de slection et/ou les pondrations doivent s'appliquer la feuille de
donnes courante (c'est--dire, en utilisant les commandes des menus Outils - Filtres de Slection - dition et Outils - Pondrations) et non pas seulement localement pour une analyse
particulire (c'est--dire, en utilisant les boutons
et
de la bote de spcification de
l'analyse ou du graphique respectif). Pour plus d'informations sur les diffrents types de Graphiques des Donnes d'Entre, voir le Manuel lectronique.
Contrairement aux Graphiques des Donnes d'Entre, les Graphiques de Blocs utilisent le bloc
de donnes en surbrillance dans la feuille de donnes active pour spcifier les donnes reprsenter dans le graphique.
Ces graphiques sont totalement indpendants du concept de donnes d'entre. Ils traitent les
valeurs numriques du bloc slectionn sans se proccuper de la signification de ces valeurs
(par exemple, il peut s'agir de donnes brutes ou de coefficients de corrlation). Ils permettent
de visualiser, explorer et synthtiser efficacement les rsultats numriques des analyses contenus dans les feuilles de donnes (par exemple, un histogramme des rsultats d'une simulation
de Monte Carlo dans le module SEPATH, ou une bote moustaches des moyennes agrges
issues d'un tableau de classification multiple dans le module ANOVA).
CHAPITRE 7 : GRAPHIQUES
Bien qu'il soit plus pratique et sans doute plus logique de slectionner les Graphiques des Donnes d'Entre dans le menu contextuel de la feuille de donnes, vous pouvez aussi les slectionner partir du menu Graphiques ou du bouton Dmarrer
de STATISTICA. Lorsque vous
crez un Graphique de Bloc, vous pouvez produire un graphique par dfaut (par exemple,
Histogramme : Colonnes du Bloc ou Trac Curviligne : Lignes du Bloc), ou crer votre propre
graphique personnalis, soit pour les cellules slectionnes des lignes ou colonnes respectives,
soit pour l'ensemble des cellules des lignes ou des colonnes slectionnes (c'est--dire, mme
pour les valeurs qui ne sont pas slectionnes dans le bloc).
Les graphiques par dfaut (les six premires commandes de
l'illustration prcdente) permettent de crer les graphiques spcifis d'un simple clic. Pour une
information plus prcise sur ces graphiques par dfaut, reportez-vous au Manuel lectronique.
Slectionnez l'une des quatre commandes de Graphiques
pour accder la bote de dialogue Slection du Graphique, dans laquelle vous
trouverez diverses options pour crer vos graphiques personnaliss.
Personnaliss
Pour plus d'informations sur les graphiques personnaliss, voir aussi le Manuel lectronique.
Comme la plupart des fonctionnalits de STATISTICA, les Graphiques de Blocs sont entirement personnalisables. L'option Personnaliser la
Liste du menu Graphiques de Blocs permet d'accder la bote de dialogue Personnaliser le
Menu Graphique, et de supprimer, renommer ou modifier les graphiques lists ou d'en ajouter
de nouveaux (personnaliss) au menu Graphiques de Blocs.
Par exemple, si vous souhaitez ajouter un ajustement normal aux histogrammes crs par la
commande Histogramme : Colonnes du Bloc, slectionnez l'option Histogramme : Colonnes du
Bloc dans la bote de dialogue Personnaliser le Menu Graphique, cliquez sur le bouton dition,
et cochez l'option Ajustement Normal dans le cadre Type de Reprsentation. Tous les tracs
produits par la commande Histogramme : Colonnes du Bloc incluront dsormais un ajustement
normal.
212 STATISTICA Prise en Main
Copyright StatSoft, 2010
CHAPITRE 7 : GRAPHIQUES
CHAPITRE 7 : GRAPHIQUES
Le menu Graphiques propose des Graphiques en 2D, des Graphiques Squentiels en 3D, des
Graphiques XYZ en 3D, des Tracs Matriciels, des Tracs de Figures, des Graphiques Catgoriss et des Graphiques Personnaliss. Notez que la partie suprieure de ce menu vous donne
accs aux graphiques les plus courants (Histogrammes, Nuages de Points, Tracs de Moyennes
avec Barres d'Erreur, etc...).
Comme tous les menus de STATISTICA, vous pouvez aisment personnaliser ce menu (dans
l'onglet Menu de la bote de dialogue Personnaliser, accessible par le menu Outils Personnaliser) pour placer les options les plus frquemment utilises l'endroit qui vous convient le
mieux. Voir la rubrique Menu Graphiques - Types de Graphiques dans le Manuel lectronique.
CHAPITRE 7 : GRAPHIQUES
Les graphiques crs partir du menu Graphiques sont troitement lis la feuille de donnes
dont ils sont issus. Vous avez la possibilit d'identifier et de slectionner des points dans le
graphique et de demander les mettre en surbrillance dans la feuille de donnes source, et
rciproquement. Outre la possibilit de slectionner des points dans les graphiques et les
feuilles de donnes, vous pouvez galement dfinir les proprits d'une observation dans une
feuille de donnes et utiliser ces proprits lorsque vous crez un graphique partir des
donnes. Parmi ces proprits, vous pouvez dfinir un symbole de point et sa couleur, indiquer
si le point doit tre exclu des graphiques et/ou des calculs d'ajustement, etc...
Pour dmarrer l'habillage/balayage d'un graphique, cliquez sur le bouton d'habillage/balayage
de la barre d'outils ou cliquez avec le bouton droit de la souris sur l'arrire-plan d'un graphique puis slectionnez
la commande Afficher l'Outil de Balayage/Habillage dans le menu contextuel afin d'accder la bote de dialogue Balayage/Habillage, illustre
ci-contre.
Par dfaut, l'Outil de Slection pour le Balayage est dfini sur Simple, et
vous permet de tracer un rectangle dans le graphique afin de slectionner tous les points contenus dans le rectangle. Dans l'illustration de la
page suivante, nous allons utiliser cet outil sur le fichier de donnes
Adstudy.sta, dans un nuage de points en 2D de la variable MESURE1 en
fonction de la variable MESURE2. Vous remarquerez que nous avons
slectionn les trois points situs dans l'angle suprieur gauche du graphique l'aide de l'outil de balayage/habillage, et que ces points apparaissent en surbrillance dans le graphique, ainsi que les observations
correspondantes dans la feuille de donnes qui a servi crer le graphique.
CHAPITRE 7 : GRAPHIQUES
Au lieu d'utiliser les fonctionnalits de Balayage/Habillage, vous pouvez galement slectionner des observations dans la feuille de donnes (cliquez pour ce faire sur la partie situe
l'extrme gauche des noms d'observations) afin de marquer les points correspondants dans le
graphique, comme dans l'illustration ci-contre, o nous avons slectionn les cinq premires
observations de la feuille de donnes Adstudy.sta.
CHAPITRE 7 : GRAPHIQUES
Vous pouvez spcifier le statut des observations soit depuis la feuille de donnes, soit depuis
un graphique. Pour dfinir le statut des observations depuis la feuille de donnes STATISTICA,
cliquez avec le bouton droit de la souris sur un nom d'observation afin d'appeler le menu
contextuel qui contient un certain nombre de commandes, en particulier les commandes Exclure des Analyses, Exclure des Graphiques, tiqueter l'Observation, Marquer l'Observation et
Statut des Observations. Les mmes commandes sont accessibles par le menu contextuel qui
apparat lorsque vous cliquez avec le bouton droit de la souris sur un point dans un graphique.
Le graphique va utiliser ces options lors de l'affichage des points reprsentant cette observation. Par exemple, si vous slectionnez l'option tiqueter l'Observation, les points correspondants vont tre tiquets, comme dans l'illustration de la page suivante. Remarque : les observations sont associes une petite icne dans la feuille de donnes pour indiquer qu'elles sont
tiquetes dans les graphiques.
L'option Combiner les statuts 'Exclure des analyses' et 'Exclure des graphiques' dans un statut
unique 'Ignorer l'observation' dans le volet d'options Documents - Feuilles de donnes Navigation/Dfauts de la bote de dialogue Outils - Options permet de crer un statut d'observation
synthtique, Ignorer l'observation qui combine les statuts Exclure des analyses et Exclure des
graphiques, en supprimant le point correspondant la fois des calculs et des graphiques.
CHAPITRE 7 : GRAPHIQUES
Cliquez avec le bouton droit de la souris sur un nom d'observation et dans le menu contextuel,
slectionnez le sous-menu Statut des Observations, puis la commande Modifier le Statut des
Observations pour changer le symbole de points utilis ou sa couleur. Remarque : la slection
des points est disponible pour d'autres types de graphiques que les nuages de points. Pour les
histogrammes, vous pouvez ainsi slectionner une barre de l'histogramme en mode d'habillage/
balayage pour slectionner tous les points correspondants dans la feuille de donnes. De la
mme manire, vous pouvez utiliser les outils d'habillage/balayage pour slectionner tous les
points correspondant aux composantes des botes moustaches.
Le statut des observations et les outils d'habillage/balayage prsentent un intrt avec les
options Exclure des graphiques et Exclure des analyses. Dans le menu Donnes - Observations - Statut des Observations, slectionnez le commande Exclure des graphiques afin de
masquer l'observation correspondante dans les graphiques, c'est--dire, que l'observation ne
sera pas visible dans les graphiques, mais elle sera utilise dans les analyses. Vous pouvez
galement cliquer avec le bouton droit de la souris sur un nom d'observation et accder cette
option par le menu contextuel. L'option Exclure des analyses accessible par l'un ou l'autre de
ces menus permet d'exclure l'observation correspondante des calculs ; toutefois, l'observation
apparatra dans la plupart des types de graphiques. Pour ignorer totalement un point (des analyses et des graphiques), vous devez cocher les deux options Exclure des graphiques et
218 STATISTICA Prise en Main
Copyright StatSoft, 2010
CHAPITRE 7 : GRAPHIQUES
Exclure des analyses (ou slectionner l'option Ignorer l'observation si vous avez coch l'option
Combiner les statuts 'Exclure des analyses' et 'Exclure des graphiques' dans un statut unique
'Ignorer l'observation' dans le volet d'options Documents - Feuilles de donnes Navigation/
Dfauts de la bote de dialogue Outils - Options. Le statut d'observation Ignorer l'observation
fonctionne comme les filtres de slection de la feuille de donnes ; toute observation possdant
le statut Ignorer l'observation sera traite de la mme manire que si elle avait t exclue par
les filtres de slection. Ainsi, les outils d'habillage/balayage vous permettent de supprimer de
faon interactive les points atypiques, et rexcuter les analyses sans ces points.
Outre les Graphiques des Donnes d'Entre, les Graphiques de Blocs et les graphiques du
menu Graphiques (voir ci-dessus), d'autres graphiques statistiques spcialiss, spcifiques un
type d'analyse particulier (par exemple, un dendrogramme en sortie d'une CAH), sont accessibles depuis les botes de dialogue de rsultats (c'est--dire, les botes de dialogue contenant
les options de sortie de l'analyse courante).
CHAPITRE 7 : GRAPHIQUES
Les graphiques spcialiss sont dcrits dans le cadre des analyses respectives partir desquelles ils peuvent tre produits ; pour toute information complmentaire, reportez-vous aux
sections respectives du Manuel lectronique.
Les options graphiques de STATISTICA sont accessibles par programmation grce au langage
intgr STATISTICA Visual Basic, ou d'autres langages compatibles. En consquence, il
n'existe aucune limite quant au degr de personnalisation des graphiques STATISTICA,
parce que STATISTICA Visual Basic (avec ses puissants outils de dessin et ses bibliothques
de procdures graphiques reposant sur STATISTICA) permet de produire la plupart des graphiques ou sorties multimdia compatibles avec le matriel informatique actuel. Ces affichages
personnaliss ou sorties multimdia peuvent ensuite tre affects aux barres d'outils de
STATISTICA, mais aussi aux menus ou aux botes de dialogue et devenir partie intgrante de
votre application STATISTICA.
Une application crite en STATISTICA Visual Basic peut agir de 3 manires sur un graphique :
Crer un nouveau graphique puis le modifier, l'imprimer ou l'enregistrer, etc... ;
Accder une fentre graphique existante puis modifier le graphique ;
Ouvrir un fichier graphique existant puis le modifier, l'imprimer ou l'enregistrer, ...
Tous les graphiques disponibles dans STATISTICA peuvent tre produits en langage STATISTICA Visual Basic, puis tre personnaliss l'aide des procdures STATISTICA ou des options
gnrales offertes dans ce langage complet.
CHAPITRE 7 : GRAPHIQUES
Comme pour toutes les autres fonctions de STATISTICA Visual Basic, vous pouvez aisment
incorporer dans vos programmes STATISTICA Visual Basic, les fonctions permettant d'accder
la bibliothque graphique de STATISTICA grce un Explorateur de Fonctions, organis
sous forme hirarchique. Cette liste contient une brve description de toutes les fonctions et
permet de les insrer directement dans le code source de votre programme (c'est--dire, dans
l'diteur STATISTICA Visual Basic, voir page 235).
CHAPITRE 7 : GRAPHIQUES
CHAPITRE 7: GRAPHIQUES
Comme nous l'avons dj mentionn, STATISTICA permet de dfinir de nouvelles interfacesutilisateur (voir page 145), notamment celles bases sur le navigateur Internet (voir page 147).
La plupart des aspects de l'interface-utilisateur interactive par dfaut peuvent tre modifis de
diverses manires. Vous pouvez par exemple ajouter de nouvelles options celles proposes
par dfaut, les simplifier ou les modifier volont mesure que vos besoins voluent. En
fonction des tches raliser et de vos prfrences pour des modes de travail particuliers,
STATISTICA Prise en Main 225
Copyright StatSoft, 2010
Vous pouvez aussi dfinir des barres d'outils labores locales (temporaires) ou globales et
tirer parti de tous les outils spcialiss, icnes, barres d'outils, macros (par exemple, en affectant des tches particulires des touches de raccourci, commandes dans de nouveaux menus
ou icnes dans des barres d'outils), tableaux multimdia, classeurs, et fonctionnalits GlisserDplacer. Vous pouvez dfinir des liens dynamiques (automatiques) entre les graphiques et les
donnes avec des liens internes entre les objets graphiques. Vous pouvez personnaliser les rapports avec des couleurs ou des polices spciales ou encore, ajuster le style des graphiques par
dfaut et leur mode d'affichage. Vous pouvez encore envoyer les rsultats dans diffrents
226 STATISTICA Prise en Main
Copyright StatSoft, 2010
Toutes ces options et d'autres paramtres gnraux sont accessibles, quel que soit le type de
document actuellement ouvert l'cran (par exemple, qu'il s'agisse d'une feuille de donnes ou
d'un graphique). Pour plus d'informations sur un onglet particulier, voir le Manuel lectronique.
Le volet d'options Configurations de la bote de dialogue Options permet de
conserver diffrentes bibliothques de paramtrages et vous pouvez passer de l'une l'autre
pour vos diffrents projets (ou utilisateurs). Pour plus d'informations, voir le descriptif du volet
d'options Configurations, page 230 et dans le Manuel lectronique.
Divers outils spcialiss permettent de personnaliser la mise en forme et les oprations des
documents STATISTICA (voir Chapitre 6 Documents STATISTICA, page 179). STATISTICA
possde un systme de gestion des paramtres par dfaut pour tous les aspects des graphiques
et permet de combiner les personnalisations dans des styles organiss de faon hirarchique.
De la mme manire, vous pouvez personnaliser la mise en forme et le format des feuilles de
donnes et personnaliser des vnements (par exemple, que doit-il se produire si je doubleclique dans un tableau ?). Voir le Manuel lectronique pour plus d'informations.
Les options de personnalisation des graphiques STATISTICA offrent des centaines d'outils et de fonctionnalits pour ajuster chaque
aspect de l'affichage et du traitement des donnes associes. Ces options sont organises de
faon hirarchique, ce qui permet d'accder rapidement aux options de personnalisation les
plus courantes en double-cliquant sur l'lment correspondant du graphique ou en utilisant le
menu contextuel de l'lment respectif (bouton droit de la souris).
Vous pouvez aisment
modifier les paramtres par dfaut pour que l'apparence et le comportement par dfaut des graphiques STATISTICA rpondent vos besoins spcifiques et/ou ncessitent un minimum
d'intervention de votre part. Divers aspects des graphiques STATISTICA peuvent ainsi tre modifis de faon permanente en utilisant :
1. la bote de dialogue Options (accessible par le menu Outils - Options),
2. l'ensemble des styles de graphiques,
3. les graphiques personnaliss, et
4. STATISTICA Visual Basic.
Ces fonctionnalits sont brivement prsentes dans le Chapitre 7 Graphiques (page 199).
STATISTICA enregistre les paramtres du programme lorsque vous quittez l'application, et les
restaure lorsque vous la redmarrez. Vous pouvez crer diffrentes configurations de ces paramtres en utilisant le volet d'options Configurations de la bote de dialogue Options (accessible
par le menu Outils - Options). Ces options vous permettent d'enregistrer l'tat actuel du programme dans une nouvelle configuration ou dans une configuration dj enregistre, et vous
pouvez dmarrer STATISTICA dans une autre configuration. Vous pouvez galement importer
ou exporter une configuration dans un fichier pour la partager entre diffrentes installations de
STATISTICA.
Le principe dcrit au paragraphe prcdent s'applique galement aux installations de STATISTICA en rseau. Avec les versions rseau, l'application est installe en un seul et mme endroit
(sur un serveur), mais chaque utilisateur a nanmoins la possibilit de personnaliser son application puisque l'information relative la configuration est stocke en local (sur le disque dur
de l'utilisateur). Vous devez choisir l'option Installation en Rseau lors de l'Installation de STATISTICA pour installer correctement l'application sur un serveur.
Remarque : une version rseau de STATISTICA est ncessaire pour une utilisation simultane
sur plusieurs postes.
Le langage universel STATISTICA Visual Basic (largement utilis dans le monde industriel et
intgr STATISTICA) offre une interface-utilisateur alternative toutes les fonctionnalits de
STATISTICA et constitue bien plus qu'une nouvelle application de programmation permettant d'crire des extensions personnalises. STATISTICA Visual Basic tire pleinement parti de
l'architecture du modle-objet de STATISTICA et permet d'accder par programmation tous
les aspects et la plupart des fonctionnalits de STATISTICA. Mme les analyses et les graphiques les plus complexes peuvent tre enregistrs dans des macros Visual Basic que vous
pouvez ensuite excuter de faon rptitive ou modifier et utiliser comme blocs de construction dans d'autres applications. STATISTICA Visual Basic ajoute un arsenal de plus de 14.000
nouvelles fonctions la syntaxe complte de Microsoft Visual Basic, devenant l'un des environnements de dveloppement les plus riches et complets actuellement disponibles.
Les programmes
STATISTICA Visual Basic sont utiliss dans de nombreuses applications, allant des simples
macros pour automatiser des tches spcifiques (utilises de faon rptitive), des systmes
analytiques labors combinant la puissance des procdures optimises de STATISTICA des
extensions personnalises disposant de leur propre interface-utilisateur. Sous rserve de disposer d'une licence adquate, les scripts d'analyses dvelopps de cette faon peuvent tre intgrs dans de vastes environnements informatiques, excuts partir de logiciels propritaires
ou de portails Internet ou Intranet.
Vous avez la possibilit d'associer des programmes SVB la plupart des vnements importants d'une analyse STATISTICA comme l'ouverture ou l'enregistrement de fichiers, un clic
dans une cellule d'une feuille de donnes, etc... ; de cette manire, vous pouvez personnaliser
l'interface-utilisateur de STATISTICA pour vos applications spcifiques (par exemple, pour les
oprations de saisie, etc...).
STATISTICA offre une gamme complte de fonctionnalits pour enregistrer des macros, c'est-dire, des programmes STATISTICA Visual Basic (SVB) que vous pouvez utiliser pour automatiser vos tches rptitives, ou comme moyen de gnrer automatiquement des programmes
que vous pouvez ensuite modifier faon. Les macros enregistres de cette manire sont des
programmes cls-en-mains, mais peuvent aussi faire office de blocs de construction pour
des applications Visual Basic plus complexes et ultra-personnalises. Les Macros d'Analyse et
les Filires d'Analyses utilisent la mme syntaxe et peuvent tre modifies volont, mais en
raison de la manire dont elles sont cres, chacune possde ses propres avantages et ses
propres inconvnients selon le contexte spcifique dans lequel elles sont utilises.
Les Macros d'Analyse enregistrent automatiquement vos paramtrages, slections et choix d'options pour une analyse spcifique. Remarque : le terme analyse
dans STATISTICA fait rfrence une tche slectionne dans les menus Statistiques, Data
Mining ou Graphiques et peut tre trs simple et rapide (par exemple, un nuage de points cr
partir du menu Graphiques), ou au contraire trs labore (par exemple, une analyse de modlisation d'quations structurelles cre partir du menu Statistiques, qui peut produire plusieurs centaines de documents de sortie). Lorsque vous slectionnez une commande statistique
dans le menu Statistiques ou dans le menu Data Mining ou une commande graphique dans le
menu Graphiques, toutes les actions telles que la slection des variables, le paramtrage des
options, etc..., sont enregistres en arrire-plan ; vous pouvez rcuprer tout moment cet
enregistrement (c'est--dire, le code Visual Basic de la macro) dans l'diteur Visual Basic. La
commande Crer une Macro est accessible pour chaque analyse partir du menu qui apparat
lorsque vous cliquez sur le bouton Options ou par le menu contextuel (en cliquant avec le
bouton droit de la souris sur le bouton de l'analyse) lorsque l'analyse est rduite.
Vous pouvez aussi enregistrer une Filire d'Analyses de toute votre
session, constitue d'une ou plusieurs analyses. Cette Filire d'Analyses va alors connecter
les diffrentes analyses avec les diverses options analytiques des menus Statistiques, Data
Mining ou Graphiques. En revanche, contrairement aux Macros d'Analyses simples voques
ci-dessus, vous pouvez dmarrer ou arrter l'enregistrement des Filires d'Analyses tout moment. L'enregistrement d'une Filire d'Analyses dmarre en cliquant sur le bouton Enregistrer
234 STATISTICA Prise en Main
Copyright StatSoft, 2010
slections de fichiers et oprations de gestion des donnes sont enregistres, au mme titre que
les analyses et leurs paramtrages, dans l'ordre o vous les choisissez.
Ce type de macro permet de stocker une srie de touches au clavier.
Aprs avoir slectionn la commande Enregistrer une Macro au Clavier dans le menu Outils Macro, STATISTICA va enregistrer chaque touche du clavier sur laquelle vous appuyez. l'issue
de l'enregistrement, l'diteur STATISTICA apparat avec un programme lmentaire constitu d'une
seule commande SendKeys suivie des symboles reprsentant les diffrentes touches utilises au
cours de la session. Remarque : ce type de macro est trs rudimentaire puisqu'il n'enregistre pas
l'environnement dans lequel les touches sont utilises ni leur signification (c'est--dire, les commandes dclenches par ces touches), mais c'est justement cette fonctionnalit qui va les rendre
intressantes pour certaines applications spcifiques, par exemple, pour automatiser de la saisie de
texte, comme des titres, des filtres de slection, etc...
Vous pouvez galement crire
intgralement vos programmes en utilisant l'environnement de dveloppement professionnel
STATISTICA Visual Basic constitu d'un diteur de programmes avec un puissant dbogueur
(avec des points d'arrt, etc...), et de nombreuses fonctionnalits pour vous aider construire
efficacement le code. Ces fonctionnalits sont dcrites en dtail dans le Manuel lectronique
de STATISTICA.
Lorsque vous ditez une macro en saisissant des commandes Visual Basic ou des commandes
propres STATISTICA Visual Basic, l'diteur fait apparatre une aide contextuelle visant
illustrer la syntaxe approprie. Vous trouverez galement une aide sur les membres et fonctions de chaque classe (objet) dans l'aide en ligne.
Il existe galement un diteur de botes de dialogue interactif qui vous permet de construire
vos propres botes de dialogue.
Les programmes STATISTICA Visual Basic (SVB) peuvent tre excuts depuis STATISTICA,
mais grce la compatibilit tendue de ce langage de programmation universel, vous pouvez
galement les excuter depuis tout environnement compatible (par exemple, Microsoft Excel,
Microsoft Word ou un langage autonome Visual Basic). En pratique, vous pouvez appeler les
fonctions STATISTICA en langage Visual Basic depuis une autre application. Toutefois, lorsque vous excutez un programme STATISTICA Visual Basic ou que vous appelez des fonctions STATISTICA depuis une autre application, tous les appels de fonctions spcifiques de
STATISTICA (par opposition aux fonctions gnriques de Microsoft Visual Basic) ne peuvent
s'effectuer que si les bibliothques respectives de STATISTICA sont installes sur l'ordinateur
excutant le programme. En rsum, l'utilisateur du programme doit possder une licence des
bibliothques de procdures respectives de STATISTICA. Cette vaste bibliothque de fonctions
STATISTICA Prise en Main 237
Copyright StatSoft, 2010
Vous pouvez enregistrer vos programmes STATISTICA Visual Basic puis les affecter vos
barres d'outils ou des commandes personnalises de vos menus. De cette manire, vous pouvez aisment personnaliser les oprations et l'aspect de STATISTICA en ajoutant vos propres
macros. Pour utiliser ces fonctionnalits, vous devez enregistrer la macro par la commande
Enregistrer comme Macro Globale du menu Fichier. Pour personnaliser les menus et/ou les
238 STATISTICA Prise en Main
Copyright StatSoft, 2010
Vous pouvez alors slectionner puis dplacer un lment spcifique depuis la liste Commandes vers le menu ou la barre d'outils de votre choix. Remarque : lorsque vous dplacez le pointeur de la souris sur un menu, celui-ci se dveloppe, et vous permet d'insrer l'lment l'endroit souhait, y compris dans un sous-menu. Lorsque la macro est insre dans le menu ou la
barre d'outils et que la bote de dialogue Personnaliser est ouverte, vous pouvez cliquer avec le
bouton droit de la souris sur la macro et modifier le texte de l'lment, ou ajouter des icnes.
STATISTICA vous permet d'excuter vos programmes SVB en ligne de commande l'aide du paramtre /RunMacro= dans la
ligne de commande. La syntaxe est la suivante :
statist.exe /RunMacro="nom de la macro"
Cet exemple illustre la manire d'enregistrer une analyse dans un script, excutable volont
pour reproduire l'analyse. Nous allons ensuite modifier ce script et le combiner avec un autre
afin de crer un script personnalis qui pourra excuter des analyses la demande. Enfin, nous
montrerons comment utiliser des scripts attachs pour actualiser et rexcuter des analyses
depuis les classeurs de rsultats.
Ouvrons tout d'abord le fichier d'exemple Adstudy. Slectionnez pour ce faire la commande
Ouvrir des Exemples dans le menu Fichier afin d'accder la bote de dialogue Ouvrir un
Fichier de Donnes STATISTICA. Double-cliquez sur le rpertoire Fichiers de donnes, puis sur
le fichier de donnes Adstudy.sta de STATISTICA.
Le bouton Variables permet d'accder la bote de dialogue Slectionnez les variables de l'analyse. Slectionnez les variables MESURE1 MESURE23 en cliquant sur MESURE1 puis en
faisant glisser le pointeur de la souris jusqu' MESURE23, puis cliquez sur le bouton OK. Dans
la bote de dialogue Statistiques Descriptives, cliquez sur l'onglet Avanc, et voyez les nombreuses options proposes.
Dans cet exemple, nous allons conserver les options par dfaut. Cliquez sur le bouton Synthse afin de produire les statistiques descriptives des variables slectionnes.
Cette ligne permet d'indiquer la macro que nous voulons excuter une analyse de Statistiques
lmentaires sur le fichier de donnes actif, c'est--dire la feuille de donnes slectionne au
moment de l'excution de la macro.
Descendons quelques lignes plus bas, dans la section qui commence par :
With newanalysis.Dialog
Ces proprits correspondent toutes les options disponibles dans les diffrents onglets de la
bote de dialogue Statistiques Descriptives. Chaque option de cette bote de dialogue est reprsente par une proprit, et tous les paramtrages sont enregistrs. Si vous dcidez d'inclure la
Mdiane et la Somme de chacune des variables, vous pouvez aisment les ajouter dans votre
macro SVB ; il vous suffit de reprer les lignes suivantes :
.Median = False
et
.Sum = False
et
.Sum = True
Excutons nouveau la macro en appuyant sur la touche F5. Une nouvelle feuille de donnes
va apparatre dans le classeur, mais cette fois, avec de nouvelles colonnes Mdiane et Somme
comme illustr la page suivante.
Gardons la fentre de la macro ouverte et dmarrons une nouvelle analyse sur le mme fichier
de donnes. Cliquez sur la feuille de donnes Adstudy afin de l'amener au premier-plan. Puis,
dans le menu Graphiques - Graphiques en 2D, slectionnez la commande Tracs de Normalit
afin d'accder la bote de dialogue Tracs de Normalit.
Cliquez sur le bouton Variables, puis dans la bote de dialogue Variables du Trac de Normalit, slectionnez les variables MESURE1 MESURE3. Cliquez sur le bouton OK pour fermer
cette bote de dialogue, puis nouveau sur le bouton OK dans la bote de dialogue Tracs de
Normalit. Les trois Tracs de Probabilis vont tre envoys dans le classeur des rsultats, un
trac pour chacune des trois variables que nous avons slectionnes.
Si nous voulons galement intgrer la variable MESURE4 dans l'analyse, nous devons rechercher la ligne suivante :
.Variables = "3-5"
Cette ligne correspond aux variables slectionnes pour les tracs. Dans la mesure o nous
avons slectionn les variables MESURE1 MESURE3 et qu'il s'agit des variables numro 3
5 du fichier de donnes, cette chane a t enregistre dans le script. Pour ajouter la variable
MESURE4 (variable numro 6), nous devons modifier cette ligne comme suit :
.Variables = "3-6"
Excutons cette macro en appuyant sur la touche F5. Quatre graphiques vont tre produits sous
forme de Tracs de Normalit par Moiti pour les variables MESURE1 MESURE4.
Dans cet exemple, nous avons montr comment raliser une analyse quelconque puis crer une
macro de cette analyse que nous pouvons ensuite modifier et rexcuter. Cet exemple a
dmontr comment il est possible de combiner ces macros pour crer des macros plus
complexes. Ce sont les fondations qui vont vous permettre de crer vos propres analyses,
puissantes et personnalises, en langage SVB.
Dans l'exemple prcdent, nous avons vu que toutes les analyses STATISTICA enregistrent les
tapes ncessaires pour les produire, et nous avons ensuite la possibilit de rcuprer ces
tapes dans une macro o nous pouvons les modifier et les excuter. Lorsqu'une analyse produit des rsultats qui sont envoys dans un classeur, STATISTICA associe automatiquement le
script enregistr de ces tapes dans le dossier du classeur contenant les rsultats. De cette manire, vous pouvez rexcuter une analyse ou la poursuivre tout moment.
Jusqu' prsent, nous avons excut plusieurs analyses de Statistiques Descriptives et de
Tracs de probabilit. Le classeur des rsultats doit avoir l'aspect suivant.
Vous remarquerez la flche rouge sur chaque dossier du classeur. C'est le signe que le script
qui a permis de produire les rsultats de ce dossier est attach au rpertoire. C'est ce qui permet STATISTICA de reprendre ou rexcuteer l'analyse. Pour rexcuter une analyse, cliquez
avec le bouton droit de la souris sur un dossier libell Statistiques Descriptives et dans le menu
contextuel, slectionnez la commande Rexcuter l'Analyse. La bote de dialogue Rexcution
d'une Analyse apparat.
Vous pouvez Utiliser la source de donnes originale ou Utiliser une nouvelle source de donnes. Cette dernire option vous permet de crer des modles d'analyses que vous pouvez
ensuite appliquer de nouvelles sources de donnes. Outre la possibilit de spcifier la source
des donnes, vous pouvez choisir de Remplacer le contenu du dossier actuel ou de Crer un
nouveau dossier. Dans cet exemple, conservons les options par dfaut et cliquons sur le bouton OK. Vous allez constater la disparition temporaire du contenu du dossier qui va rapparatre lors de la rexcution de l'analyse.
L'un des objectifs de cette fonctionnalit est de vous permettre d'actualiser ou de rexcuter
des rsultats produits par des analyses complexes ds que de nouvelles donnes apparaissent
dans la feuille de donnes. Par exemple, si nous modifions les donnes de notre fichier de
STATISTICA Prise en Main 247
Copyright StatSoft, 2010
Conservons les options par dfaut, et cliquons sur le bouton OK. La bote de dialogue Statistiques Descriptives apparat, avec toutes les options utilises pour produire les rsultats prcdents. Puisque l'option par dfaut envoie les Rsultats dans le rpertoire en cours, les nouveaux rsultats vont tre crs dans le mme dossier si vous cliquez sur le bouton Synthse.
Le terme ActiveX est utilis dans diffrents contextes et ses dfinitions font rfrence diffrents aspects du concept. Nous regrouperons ces composantes en deux catgories dans STATISTICA : les objets ActiveX et les documents ActiveX.
Les objets ActiveX taient autrefois appels objets OLE (Object Linking
and Embedding). La technologie COM (Component Object Model) de Microsoft qui permet
d'accder aux objets de manire uniforme est au cur du concept. Grce l'utilisation de protocoles standard, les objets crs dans une application peuvent dsormais tre stocks et modifis dans d'autres applications. Pour ce faire, l'objet rceptacle (container) doit tre un client
248 STATISTICA Prise en Main
Copyright StatSoft, 2010
STATISTICA reconnat les conventions Object Linking and Embedding (OLE) qui sont utilises pour lier des valeurs, du texte, des graphiques, ou d'autres objets des documents STATISTICA (par exemple, feuilles de donnes, rapports) des documents dans d'autres applications
(Windows). Techniquement, vous pouvez tablir des liens OLE entre un fichier source (ou
serveur) (par exemple, un document Microsoft Word) et un document STATISTICA (le fichier
client), afin que les donnes se mettent automatiquement jour dans la partie respective du
document STATISTICA ds que les donnes du fichier source sont modifies. En outre, STATISTICA peut servir de serveur pour d'autres documents compatibles OLE. De cette faon,
STATISTICA Prise en Main 249
Copyright StatSoft, 2010
STATISTICA reconnat galement les conventions Dynamic Data Exchange (DDE). Vous pouvez tablir des liens DDE entre un fichier source (par exemple, une feuille de calcul Microsoft Excel) et un fichier de donnes STATISTICA (le fichier client), afin que les donnes se
mettent automatiquement jour dans la feuille de donnes STATISTICA ds que les donnes
du fichier source sont modifies. Vous pouvez ainsi lier dynamiquement un champ de la feuille de donnes un sous-ensemble de donnes dans d'autres applications (Windows).
Cette application (liaison dynamique entre deux fichiers) se rencontre souvent dans le milieu
industriel, lorsque le fichier de donnes STATISTICA est li dynamiquement un appareil de
mesure connect au port srie (par exemple, pour mettre jour automatiquement des mesures
spcifiques toutes les heures). Comme OLE, la procdure est beaucoup plus simple qu'il n'y
parat et peut tre facilement utilise sans connaissance technique des mcanismes DDE.
Comme vous pourrez le constater dans les sections suivantes, STATISTICA Visual Basic est
trs proche du langage Microsoft Visual Basic ainsi que du langage Visual Basic disponible
dans d'autres applications (Microsoft Windows) comme Microsoft Excel.
Le programme suivant illustre diverses fonctionnalits du langage Visual Basic (VB et SVB).
Cet exemple lmentaire va afficher le premier message ci-contre, puis l'un des deux messages
suivants en fonction de l'action ralise par l'utilisateur.
Dans STATISTICA, slectionnez l'option Nouveau du menu Fichier. Dans la bote de dialogue
Cration d'un Nouveau Document, slectionnez l'onglet Macro, et crez une nouvelle macro
que vous pouvez appeler Exemple1.
Sub Main
' NOTE : L'instruction suivante appelle
If MsgBox ("Bonjour ! Cliquez sur
vbOkCancel)=vbOK Then
MsgBox "Vous avez cliqu sur le
Else
MsgBox "Vous avez cliqu sur le
End If
End Sub
un message.
OK ou Annuler", _
bouton OK !"
bouton Annuler !"
Programme Principal : tout programme comporte au minimum une routine Main, commenant par Sub Main et se terminant par End Sub (les vnements peuvent tre personnaliss par des sous-routines avec des noms faisant rfrence un vnement particulier).
Commentaires : une ligne commenant par une quote est traite comme un commentaire.
Elle n'est donc pas prise en compte au moment de l'excution.
Suite de ligne : vous pouvez scinder une ligne de commandes sur plusieurs lignes en ajoutant la fin de chaque ligne le symbole underscore (_ ; il doit tre spar du texte qui le
prcde par un espace).
Aide sur les mots-cl SVB : vous pouvez tout moment obtenir plus d'informations sur un
mot-cl ou une instruction en mettant le texte correspondant en surbrillance dans votre
Le programme suivant illustre la manire dont vous pouvez dclarer et utiliser des variables
(pour stocker du texte ou des valeurs numriques) et des tableaux. Il montre aussi comment
dclarer des sous-routines (fonctions) et transmettre des arguments aux fonctions. Dans STATISTICA, slectionnez l'option Nouveau du menu Fichier. Dans la bote de dialogue Cration
d'un Nouveau Document, slectionnez l'onglet Macro puis crez une nouvelle macro que vous
pouvez appeler Exemple2.
Sub Main
Dim x (1 To 10) As Double
Dim Sum As Double, ResText As String
Dim i As Integer
For i =1 To 10
x(i)=i
Next i
Sum=ComputeSumOfSqrs ( LBound (x), UBound(x), x)
ResText="La somme des racines carres des valeurs de" + _
Str(LBound(x)) + _
" " + _
Str(UBound(x)) + _
" est gale " + _
Str(Sum)
MsgBox ResText
End Sub
Function ComputeSumOfSqrs (iFrom As Integer, _
iTo As Integer, _
x() As Double) As Double
Dim i As Integer
ComputeSumOfSqrs=0
For i= iFrom To iTo
ComputeSumOfSqrs=ComputeSumOfSqrs+x(i)^2
Next i
End Function
Les donnes de type Double, Integer et Long sont sans doute les plus utilises
dans les calculs. Les variables dclares en Double peuvent stocker des nombres rels compris
dans l'intervalle 1,7E 308 (environ 15 chiffres significatifs). Les variables dclares en
252 STATISTICA Prise en Main
Copyright StatSoft, 2010
wb As Workbook
ss As Spreadsheet
g As Graph
wb=ActiveWorkbook
Set ss=Spreadsheets.Open( _
"j:\Statistica\Exemples\Fichiers de Donnes\Adstudy.sta")
ss.Visible=True
Set g=ActiveGraph
End Sub
Une collection ressemble un tableau, mais la collection est un objet (voir la section Objets,
Mthodes et Proprits, page 256) avec diverses mthodes, ce qui rend souvent le travail plus
pratique avec les collections qu'avec les tableaux. Dans STATISTICA Visual Basic, tous les
Une variable dclare en type de donnes Variant peut tre vide, contenir des donnes numriques ou montaires, des dates, des chanes de caractres, des objets, des codes d'erreur, une
valeur nulle ou une valeur d'un tableau. Lorsque vous utilisez SVB pour incorporer des modules statistiques (fonctions) dans un programme personnalis, le type de donnes Variant est
souvent utilis pour travailler sur des listes de variables, etc... Par exemple, vous pouvez spcifier les variables comme des chanes (par exemple, .Variables="NomDeVariable"), des nombres (par exemple, .Variables=2), ou des tableaux (.Variables=VarArray). Remarque : les
variables qui ne sont pas explicitement dclares dans le programme sont considres par
dfaut comme des variables de type Variant.
Par dfaut, les variables sont transmises aux sous-routines et fonctions, par rfrence.
La sous-routine ou la fonction peut ainsi modifier la valeur d'une variable et renvoyer la valeur
actualise la routine qui a appel la sous-routine ou la fonction. Par consquent, si les sousroutines ou fonctions doivent modifier des valeurs (dans la routine partir de laquelle elle a
t appele), transmettez-les par rfrence (c'est--dire, utilisez les options par dfaut ou dclarez explicitement les arguments en utilisant le mot-cl ByRef dans la fonction). Lorsqu'une
variable est transmise une sous-routine ou une fonction par rfrence, c'est la rfrence la
variable qui est transmise ; lorsque la valeur de la variable est modifie dans la sous-routine, la
valeur de la routine appelante (celle qui a appel la routine respective) est galement modifie.
...
ComputeX x, y1,y2
...
Sub ComputeX(ByRef x
ByVal y2
'ou : Sub ComputeX(x
ByVal y2
x=y1+y2
End Sub
As
As
As
As
Dans la bote de dialogue Rfrences, slectionnez les bibliothques (objets) rendre visibles
depuis le programme Visual Basic. Pour rendre STATISTICA visible, slectionnez STATISTICA
Object Library et STATISTICA Basic Statistics Library (de la version courante de STATISTICA) ; puis cliquez sur le bouton OK.
256 STATISTICA Prise en Main
Copyright StatSoft, 2010
Lorsque vous excutez ce programme Visual Basic depuis Microsoft Excel (Visual Basic
Editor), les rsultats de la feuille de donnes Synthse de l'analyse produite par la procdure
Statistiques Descriptives du module Statistiques lmentaires sont colls dans la feuille Excel
en cours.
Vous pouvez appeler, depuis vos programmes SVB, des fonctions dfinies dans des DLL
externes. Veuillez vous reporter la rubrique Appeler des Fonctions depuis des DLL Externes
Les bibliothques de fonctions STATISTICA permettent de programmer et personnaliser entirement votre application STATISTICA ; ces fonctions peuvent tre appeles depuis d'autres applications compatibles avec le langage Visual Basic, comme Microsoft Visual Basic, Microsoft Excel, etc...
Dans STATISTICA, slectionnez la commande Nouveau du menu Fichier puis dans la bote de
dialogue Cration d'un Nouveau Document, slectionnez l'onglet Macro et crez une nouvelle
macro que vous pouvez appeler Exemple3.
Vous pouvez considrer chaque bote de dialogue comme une proprit de l'analyse (par exemple, Statistiques lmentaires) et chaque
option, slection, etc... de cette bote de dialogue comme une proprit de celle-ci. Vous allez
donc tout d'abord appeler le module en dclarant l'objet d'analyse respectif, puis dfinir les
options dsires, etc... comme des proprits de l'analyse (et des botes de dialogue de cette
analyse). Lors de la cration de programmes, l'enregistrement automatique de la macro STATISTICA effectue l'essentiel du travail de programmation votre place. Il vous suffit de raliser vos analyses de faon interactive, puis de crer une macro de ces analyses ; cette macro
comporte tout le code de programmation permettant de recrer l'analyse pas--pas et peut aisment tre modifi (copi, coll) pour crer votre propre application personnalise.
Pour passer
d'une bote de dialogue une autre au cours d'une analyse interactive dans STATISTICA, vous
STATISTICA Prise en Main 259
Copyright StatSoft, 2010
Dans STATISTICA, slectionnez la commande Nouveau du menu Fichier puis, dans la bote de
dialogue Cration d'un Nouveau Document, slectionnez l'onglet Macro et crez une nouvelle
macro. Saisissez (ou collez) le programme ci-aprs.
STATISTICA Prise en Main 261
Copyright StatSoft, 2010
Lors d'une analyse interactive, les rsultats sont envoys dans des classeurs, fentres indpendantes, rapports, etc..., selon les paramtres de la bote de dialogue Gestionnaire de Sorties de
l'Analyse/Graphique, accessible par l'option Gestionnaire de Sorties du menu
. Les
options de cette bote de dialogue sont accessibles par l'objet AnalysisOutput qui peut tre
utilis comme un container de feuilles de donnes et de graphiques. D'une manire gnrale,
une collection de feuilles de donnes et graphiques (rsultats) est enregistre comme suit :
newanalysis.RouteOutput(newanalysis.Dialog.Summary).Visible=True
Toutes les procdures statistiques et graphiques et leurs personnalisations sont accessibles sous
forme de proprits ou fonctions en STATISTICA Visual Basic. Afin de fournir un environnement de programmation aussi transparent que possible pour l'utilisateur, les objets d'analyse et
proprits de ces objets sont organiss conformment au droulement des options et botes de
dialogue des analyses interactives. En outre, de nombreuses proprits, fonctions, constantes et
vnements (sous-routines associes des vnements particuliers et raliss sur des
documents, par exemple, en cliquant avec le bouton droit dans une feuille de donnes) permettent de grer des documents, des fichiers et de nombreuses options gnralistes d'analyse. Pour
connatre les bibliothques et l'envergure de l'installation de SVB sur votre machine, vous pouvez appeler l'Explorateur d'Objets. Pour ce faire, crez une nouvelle macro en slectionnant la
commande Nouveau du menu Fichier, puis dans la bote de dialogue Cration d'un Nouveau
Document, cliquez sur l'onglet Macro, et slectionnez l'option Explorateur d'Objets dans le
menu Affichage.
STAFactor
STANonparametrics
scAdvancedPCA
scDistributions
Analyse Canonique
STACanonical
scCanonicalAnalysis
STACorrespondence
scCorrespondenceAnalysis
Analyse Discriminante
STADiscriminant
scDiscriminantAnalysis
Analyse Factorielle
STAFactor
scFactorAnalysis
Analyse Log-Linaire
STALogLinear
scLoglinearAnalysis
Analyse de Processus
STAProcessAnalysis
scProcessAnalysis
Analyse de Proximit
STAMultidimensional
scMultidimensionalScaling
Analyse de Survie
STASurvival
scSurvivalAnalysis
ANOVA
Arbres de Dcision
STAMANOVA
STAQuickTrees
scMANOVA
scClassificationTrees
STAITrees
scInteractiveTrees
STABTrees
scBoostingTrees
STAIQCVChartsLib
STAQuality
scQCCVariableLists
scQualityControl
Classification Gnralise
STAGCluster
scGeneralClusterAnalysis
Classifications
STACluster
scClusterAnalysis
Dcomposition de la Variance
STAVarianceComponents scVarianceComponents
Drill-Down
STADrillDown
scDrillDown
Estimation Non-Linaire
STANonlinear
scNonlinearEstimation
(3)
STAReliability
scReliabilityandItemAnalysis
Machine Learning
MARSplines (Multivariate
Adaptative Regression Splines)
Modle Linaire Gnral
STAMachineLearning
scMachineLearning
STAMARSplines
STAGLM
scMARSplines
scGLM
STAGAM
scGAM
STAGTrees
STAGCHAID
scGTrees
scGCHAID
STAGDA
scGDA
STAGRM
STAGLZ
scGSR
scGLZ
Plans d'Expriences
STAExperimental
scDesignOfExperiments
Qualit d'Ajustement
STAGoodnessOfFit
scGoodnessOfFit
Rgles d'Association
STAASC
scAssociation
Rgression PLS
STAPLS
scPLS
Rgression Multiple
STARegression
scMultipleRegression
Rseaux de Neurones
Slection et Filtrage des
Meilleurs Prdicteurs
Sries Chronologiques
STASANN
scSANN
STAFSL
STATimeSeries
scFeatureSelection
scTimeSeries
Statistiques lmentaires
STABasicStatistics
scBasicStatistics
Tests Non-Paramtriques
STANonparametrics
scNonparametrics
(1)
Lorsque vous lancez une analyse statistique l'aide d'un programme STATISTICA Visual
Basic, vous devez d'abord crer un nouvel objet d'analyse. Pour excuter une analyse STATISTICA depuis une autre application par Visual Basic (par exemple, Excel, voir page 256), vous
devez pralablement charger les bibliothques STATISTICA requises (par une option gnralement appele Rfrences dans le menu Outils de l'diteur Visual Basic de l'application), puis
crer un objet du type STATISTICA.Application. Vous pouvez ensuite crer des objets d'analyse qui font partie de l'objet STATISTICA.Application.
Ainsi, pour accder aux fonctions de la bibliothque Statistiques lmentaires de STATISTICA
depuis Microsoft Excel, vous devez inclure le code Visual Basic suivant :
Set x = CreateObject("STATISTICA.Application")
' NOTE : Ce fichier peut se trouver dans un rpertoire
' diffrent de votre installation.
Set a = x.Analysis(scBasicStatistics, _
"j:\STATISTICA\Exemples\Fichiers de donnes\exp.sta")
Notez que x est dsormais un objet de type STATISTICA.Application ; a est un objet de type
STATISTICA.Application.Analysis. Lorsque vous excutez un programme depuis l'diteur
de programmes STATISTICA Visual Basic (SVB), vous pouvez ne pas dclarer explicitement
l'objet STATISTICA.Application, et crire simplement :
Set a = Analysis(scBasicStatistics, _
"j:\Statistica\Exemples\Fichiers de Donnes\exp.sta")
Lorsque vous excutez le programme depuis STATISTICA, le programme sait que l'objet
Analysis appartient STATISTICA.Application. Vous pouvez nanmoins crer un nouvel
objet STATISTICA.Application ; par exemple, vous pouvez tenter d'excuter le programme
de la page suivante depuis STATISTICA Visual Basic (SVB).
Ce programme va crer une nouvelle application STATISTICA puis ouvrir le fichier de donnes spcifi et le module de Statistiques lmentaires de STATISTICA. Tous les objets dclars dans le programme sont ensuite rendus visibles ; aprs l'excution du programme, vous
allez voir apparatre une nouvelle application STATISTICA, le fichier de donnes d'entre ainsi
que le Panneau de Dmarrage du module Statistiques lmentaires.
Cette section contient un certain nombre de programmes SVB courts et trs simples permettant
d'illustrer des tches spcifiques et la manire de les accomplir.
Lorsque vous excutez le programme, vous voyez apparatre un premier message, et selon que
vous cliquez sur OK ou Annuler, un second message indiquant le choix que vous avez fait.
Cet exemple va crer une nouvelle feuille de donnes et la remplir avec des valeurs alatoires.
La premire colonne contiendra des valeurs alatoires distribues selon la loi uniforme tandis
que la seconde contiendra des valeurs alatoires distribues normalement.
Option Base 1
Sub Main
Dim n As Long,i As Long
n=1000
' Cre et dimensionne l'objet Spreadsheet (feuille de donnes)
Dim s As New Spreadsheet
' Dfinit la taille de l'objet
s.SetSize(n,2)
' Affecte les valeurs alatoires
For i=1 To n
s.Value(i,1)=Rnd(1)
s.Value(i,2)=RndNormal(1)
Next i
' Dfinit le nom des variables
s.VariableName(1)="Uniforme"
s.VariableName(2)="Normale"
s.Visible=True
End Sub
Il peut tre utile d'indiquer la progression des calculs par une barre de progression du mme
type que celle qui est utilise dans STATISTICA lors de l'analyse de gros fichiers de donnes.
Ci-dessous, un programme qui implmente une barre de progression dans le programme permettant de produire des valeurs alatoires :
Option Base 1
Sub Main
Dim n As Long,i As Long
n=1000
' Cr et dimensionne l'objet Spreadsheet (feuille de donnes)
Dim s As New Spreadsheet
' Dfinit la taille de l'objet
s.SetSize(n,2)
' Insre une barre de progression
Dim pb As ProgressBar
Set pb = AddProgressBar("Gnration de nombres alatoires", 1, n)
' Affecte les valeurs alatoires
For i=1 To n
' Met jour la barre de progression
pb.CurrentCounter = i
s.Value(i,1)=Rnd(1)
s.Value(i,2)=RndNormal(1)
Next i
' Ferme la barre de progression
Set pb = Nothing
' Dfinit le nom des variables
s.VariableName(1)="Uniforme"
s.VariableName(2)="Normale"
s.Visible=True
End Sub
L'exemple suivant illustre la faon de crer un histogramme simple partir des donnes gnres dans le programme ; plus particulirement, nous allons crer deux histogrammes partir
des donnes produites dans l'exemple prcdent.
Ce programme fait appel une sous-routine pour calculer les donnes de la feuille de donnes
d'entre, puis une autre pour crer les histogrammes.
Vous pouvez envoyer tous les rsultats (feuilles de donnes et graphiques) de vos programmes
SVB vers les mmes canaux (par exemple, classeurs, rapports) que vos rsultats d'analyses.
La mthode RouteOutput peut envoyer les graphiques ou feuilles de donnes vers un classeur
ou un rapport selon le paramtrage en cours de STATISTICA. Voir galement la description de
la mthode RouteOutput (page 260) pour plus d'informations. Par exemple, dans l'exemple
prcdent, si vous remplacez, dans la sous-routine Sub CreateHistograms, la ligne :
newanalysis.Dialog.Graphs.Visible = True
par la ligne :
newanalysis.RouteOutput(newanalysis.Dialog.Graphs).Visible = True
les histogrammes seront envoys vers le ou les canaux par dfaut, spcifis dans la bote de
dialogue Gestionnaire de Sorties.
272 STATISTICA Prise en Main
Copyright StatSoft, 2010
La mthode RouteOutput (voir page 260) envoie les rsultats vers le mme canal de sortie
que les autres rsultats, selon le paramtrage du Gestionnaire de Sorties. Vous pouvez aussi
envoyer du texte, des graphiques, etc... directement dans un rapport. Ci-dessous, un programme illustrant la manire de procder (attention car la sous-routine ComputeRandomNumbers,
ncessaire l'excution du programme, n'a pas t reporte ici).
Option Base 1
Sub Main
Dim g(2) As Graph
Dim n As Long
Dim s As New Spreadsheet
' Cr une nouvelle fentre de rapport
Dim r As New Report
n=1000
' Cre les valeurs alatoires dans la feuille de donnes s
ComputeRandomNumbers s, n
' Cre l'histogramme partir des valeurs de s
CreateHistograms s, g
' Ajoute le texte suivant
r.SelectionText="Graphique de la variable Uniforme :" +vbCrLf+vbCrLf
' Ajoute le premier graphique au rapport
r.SelectionObject=g(1)
' Ajoute deux <cr>-<lf> (nouvelles lignes)
r.SelectionText=vbCrLf+vbCrLf
r.SelectionText=" Graphique de la variable Normale :" +vbCrLf+vbCrLf
' Ajoute le second graphique au rapport
r.SelectionObject=g(2)
r.SelectionText=vbCrLf+vbCrLf
' Rend le rapport visible
r.Visible=True
End Sub
Sub CreateHistograms (s As Spreadsheet, g() As Graph)
' Ce code a t cr en modifiant le code d'une macro d'analyse.
Dim newanalysis As Analysis
Set newanalysis = Analysis (sc2dHistograms, s)
newanalysis.Dialog.Variables = "1 2 | "
Set g(1)=newanalysis.Dialog.Graphs(1)
Set g(2)=newanalysis.Dialog.Graphs(2)
End Sub
Pour une dfinition des termes techniques utiliss dans cette introduction (par
exemple, ODBC, SQL,...), veuillez vous reporter au glossaire du Manuel lectronique, accessible par la commande Aide STATISTICA du menu Aide.
STATISTICA Query permet d'accder facilement des donnes issues de divers types de bases
de donnes (notamment des systmes comme Oracle, MS SQL Server, Sybase, etc...) grce
aux conventions OLE DB de Microsoft. OLE DB est une puissante technologie permettant
l'intgration universelle des donnes sur un rseau d'entreprise, allant des gros systmes
l'ordinateur de bureau, quel que soit le type de donnes. OLE DB offre une stratgie d'accs
aux donnes plus gnraliste et efficace que l'ancienne convention ODBC dans la mesure o
elle permet d'accder davantage de types de donnes et qu'elle est base sur le modle-objet.
STATISTICA Query gre des bases de donnes relationnelles. Vous pouvez slectionner des
enregistrements spcifiques (lignes des tables) grce des commandes SQL que STATISTICA
Query va construire automatiquement pour vous. Vous devez simplement slectionner les
composantes de la requte au travers d'une interface graphique simple et/ou des options de
menus ou de botes de dialogues intuitives. Il n'est donc pas ncessaire de matriser le langage
SQL pour crer rapidement et simplement des requtes complexes. Il est possible de dfinir
plusieurs requtes, sur une ou plusieurs bases de donnes diffrentes, pour rcuprer les donnes dans une mme feuille de donnes, et vous pouvez maintenir des connexions plusieurs
bases de donnes externes simultanment.
CHAPITRE 10 :
STATISTICA QUERY
Ci-dessous, les tapes ncessaires pour rcuprer des donnes avec STATISTICA Query :
1. Slectionnez la commande Crer une Requte dans le menu Donnes - Donnes Externes
(ou dans le menu Fichier - Donnes Externes) afin d'accder la bote de dialogue Connexion une Base de Donnes. Cette bote de dialogue vous permet de slectionner une connexion prdfinie une base de donnes (avec le fournisseur, l'emplacement de la source de
donnes et divers paramtres avancs relatifs au serveur ou au rpertoire dans lequel se
trouvent les donnes). Si vous n'avez encore spcifi aucune connexion, vous pouvez le
faire en cliquant sur le bouton Nouvelle dans la bote de dialogue Connexion une Base de
Donnes. La bote de dialogue Proprits des Liaisons de Donnes apparat et un Assistant
vous aide crer la connexion. Pour plus d'informations sur l'utilisation de la bote de dialogue Proprits des Liaisons de Donnes, appuyez sur la touche F1 pour appeler l'Aide de
Microsoft Data Link.
2. Aprs avoir slectionn une connexion une base de donnes et cliqu sur le bouton OK
dans la bote de dialogue Proprits des Liaisons de Donnes, STATISTICA Query vous
permet de crer votre instruction SQL en spcifiant les tables, les champs, les jointures et
les critres (par les menus Table, Jointure et Critres) inclure dans la requte.
Le requteur, lorsqu'il est intgr dans une version Entreprise de STATISTICA (voir STATISTICA Entreprise, page 313), permet de traiter directement des donnes situes sur un serveur
distant, c'est--dire sans avoir importer pralablement ces donnes dans un fichier en local
(stock sur le disque dur de l'ordinateur de l'utilisateur). Cette technologie permet de traiter de
trs gros fichiers de donnes, dpassant mme les capacits de stockage de votre ordinateur,
tout en permettant une amlioration significative des performances. Les utilisateurs de STATISTICA peuvent ainsi traiter des fichiers de donnes dpassant les capacits de stockage des
machines en local ou mme du serveur STATISTICA.
La technologie IDBD repose sur l'architecture du traitement distribu, o
les requtes sont effectues au niveau du serveur (en utilisant les ressources et les processeurs
du serveur) et les enregistrements respectifs sont envoys l'ordinateur STATISTICA o ils
sont traits simultanment (de faon asynchrone) mesure qu'ils deviennent disponibles.
CHAPITRE 10 :
STATISTICA QUERY
La plupart des aspects de STATISTICA sont exposs sous la forme d'interfaces COM qui sont
inscrits dans le registre d'une machine au moment de l'installation de STATISTICA. Dans la
mesure o les langages reposant sur le .NET ne peuvent pas communiquer directement avec
COM, vous pouvez utiliser une classe de wrapper appele Interop COM pour intgrer les
bibliothques STATISTICA dans votre projet .NET. La couche Interop COM est cre
automatiquement par l'IDE de Visual Studio .NET lorsque vous importez une interface COM.
La couche Interop COM gre tous les aspects relatifs l'interaction avec les bibliothques
COM depuis .NET. Lorsque la couche Interop COM est en place, l'interface COM de STATISTICA se comporte comme n'importe quel autre objet .NET.
La couche Interop .NET se cre automatiquement en ajoutant les interfaces COM souhaites
de STATISTICA dans votre projet .NET. STATISTICA Object Library est la base de la bibliothque STATISTICA COM. Pour ajouter STATISTICA Object Library dans un projet .NET,
slectionnez tout d'abord le projet .NET souhait dans l'Explorateur de Solutions, puis slectionnez la commande Ajouter une Rfrence dans le menu contextuel (accessible en cliquant
avec le bouton droit de la souris sur le projet .NET). La bote de dialogue Ajouter une Rfrence apparat.
Dans la bote de dialogue Ajouter une Rfrence, slectionnez l'onglet COM. Dans la liste Nom
du Composant, slectionnez STATISTICA Object Library puis cliquez sur le bouton OK.
Vous pouvez galement crer la bibliothque Interop COM manuellement et l'importer dans
votre projet .NET. Vous pouvez de cette manire spcifier un nom diffrent pour la DLL
Interop ainsi qu'un espace de nom particulier. Le programme permettant de crer un Interop
est TLBIMP.EXE. Depuis une invite de commande (par exemple, Visual Studio), excutez
TLBIMP avec un paramtre initial de la source du type de bibliothque. Dans l'exemple cidessous, nous avons galement spcifi le nom et les catgories de la DLL de sortie.
Afin d'tre en mesure de grer plusieurs versions diffrentes de STATISTICA, il est ncessaire
de conserver des DLL Interop distinctes de STATISTICA Object Library pour chaque numro
de version de STATISTICA utiliser. Vous pouvez utiliser la commande TLBIMP pour gnrer
des DLL Interop pour des versions particulires de STATIST.EXE et d'autres DLL. Lorsque
vous distribuez l'application, veillez dployer la bonne version de la DLL Interop de STATISTICA dans votre application .NET.
Grce son architecture COM, vous pouvez intgrer STATISTICA dans de nombreux environnements de dveloppement. Si vous utilisez STATISTICA depuis un environnement de dveloppement externe, vous devez disposer d'un objet appel objet Application. L'objet Application est l'application elle-mme et contient d'autres objets (par exemple, feuilles de donnes et
graphiques), mais l'accs ces autres objets est limit sauf si l'objet Application est en cours
d'excution.
Si vous utilisez le nom STATISTICA par dfaut, vous devez dclarer votre variable dans l'interface STATISTICA.Application. Pour crer une instance de STATISTICA, votre variable doit
tre gale new STATISTICA.ApplicationClass().
STATISTICA.Application pApp = (STATISTICA.Application)
new STATISTICA.ApplicationClass();
pApp.Visible = true ;
Lorsque vous avez cr une instance de STATISTICA.ApplicationClass, vous devez voir apparatre STATIST.EXE dans la liste des processus. Vous obtenez le mme rsultat en lanant
STATISTICA partir du menu Dmarrer. L'instance STATISTICA est initialement silencieuse
286 STATISTICA Prise en Main
Copyright StatSoft, 2010
Le Manuel lectronique de STATISTICA est extrmement riche. Il intgre un Conseiller Statistique (voir
page 33), un Glossaire et le Manuel lectronique de
Statistiques de StatSoft, le tout, intgralement traduit
en Franais. La version anglaise est galement accessible en ligne sur notre site web : www.statsoft.com.
Le Manuel lectronique de Statistiques de StatSoft a
t recommand par l'Encyclopedia Britannica
Le site Web de StatSoft, l'une des adresses Internet les plus visites dans le domaine de l'analyse des donnes, donne accs de nombreuses informations, utiles pour les professionnels de l'analyse de
donnes, mais offre galement :
Un Forum permettant aux utilisateurs d'changer
sur leurs problmatiques particulires ou rechercher des rponses des questions dj rsolues, et
Une zone de tlchargement dans laquelle les utilisateurs de la version courante de STATISTICA peuvent tlcharger gratuitement des mises jour de
leur logiciel. Nos dveloppeurs travaillent en permanence pour augmenter la compatibilit de STATISTICA avec d'autres applications (ne respectant
pas ncessairement les conventions standard). Par
consquent, il est souvent conseill de tlcharger
une mise jour pour rsoudre des problmes
information utile sur la configuration de votre ordinateur, comme le type de processeur (CPU), la mmoire
(RAM), l'espace disque ou la version du systme
d'exploitation avant de contacter le support technique.
et une infinit de possibilits et applications l'ensemble des produits d'analyse de donnes, de data mining,
et de contrle qualit / six sigma de la gamme STATISTICA.
WebSTATISTICA Server est un systme entreprise entirement personnalisable, permettant l'accs aux bases de donnes et
l'analyse des donnes au travers d'Internet. Construit sur la
technologie du calcul distribu, il est totalement compatible
avec l'architecture Client/Serveur multi-tiers. WebSTATISTICA Server offre les fonctionnalits
analytiques, de requtage, de reporting, et les graphiques de STATISTICA
par l'intermdiaire d'interfaces Web
classiques, interactives et faciles
d'utilisation. Le programme se prsente sous la forme d'une application
complte, cl-en-mains, avec une
interface-utilisateur base sur le navigateur Internet, permettant aux utilisateurs distance de crer leurs fichiers
de donnes, d'effectuer leurs analyses
et de vrifier leurs rsultats, le tout, de
faon interactive. Toutefois, en raison
de son architecture ouverte, WebSTATISTICA Server comprend galement des outils de dveloppement compatibles avec .NET (entirement bass sur
les conventions de syntaxe habituelles comme le langage
Visual Basic, C++, HTML, XML), permettant aux
dpartements informatiques de personnaliser les principales
composantes du systme, ou d'tendre le systme en
utilisant ses fondations en ajoutant, par exemple, de
ANNEXE B : WebSTATISTICA
nouvelles composantes et/ou fonctionnalits analytiques
trs spcifiques ou relatives aux bases de donnes en place.
Le systme est compatible avec la plupart des plate-formes
serveur Web (par exemple, UNIX Apache, Microsoft IIS),
fonctionne la fois dans les environnements Microsoft
.NET et Sun/Java, et ne requiert aucune modification du
pare-feu ou des paramtres de scurit Internet/ Intranet en
vigueur.
L'avantage incontestable de la technologie de WebSTATISTICA Server est la possibilit d'accder la puissance des diffrents produits de la gamme
STATISTICA depuis tout ordinateur connect Internet.
Ainsi, les applications WebSTATISTICA Server ajoutent
une nouvelle dimension et une infinit de possibilits et
d'applications l'ensemble des produits d'analyse de
ANNEXE B : WebSTATISTICA
puisque les CPU (Central Processing Unit) multiprocesseurs les plus puissants (et/ou plusieurs ordinateurs) sont utiliss comme serveurs, les utilisateurs ont
la possibilit de dlguer les tches lourdes au serveur.
Ils peuvent, par exemple, excuter en arrire-plan sur
les serveurs distants, des requtes sur des traoctets de
donnes et raliser de longues squences d'analyses et
de rapports, tout en conservant leur station de travail
libre pour d'autres tches. Grce son architecture en
traitement distribu, WebSTATISTICA Server peut voluer de manire efficace et tirer parti des CPU multiprocesseurs et/ou d'ordinateurs multiples, et permettre
aux utilisateurs de bnficier de l'architecture trois-tiers
o :
Le Premier Tiers est l'Interface-Utilisateur du poste
client (navigateur ou client STATISTICA, voir le
paragraphe Client STATISTICA, ci-dessous),
Le Deuxime Tiers est le logiciel WebSTATISTICA
Server et l'implmentation des fonctionnalits de
business intelligence qu'il peut contenir (requtes
spcifiques, scripts d'analyses personnalises ou
propritaires, etc...), et
Le Troisime Tiers concerne les bases de donnes
STATISTICA (par exemple, STATISTICA Data Warehouse) ou les autres entrepts de donnes de l'entreprise.
Dans les versions bureautiques de STATISTICA, tous
les calculs sont pris en charge par la station de travail
en local, et les ressources des autres ordinateurs ne sont
utilises que si vous avez recours la fonctionnalit
d'Interface Directe avec les Bases de Donnes (IDBD).
L'IDBD est une technologie qui traite directement les
donnes de manire asynchrone sur des bases de
donnes distantes (en utilisant la technologie du calcul
distribu si le serveur le permet), sans avoir crer de
copie des donnes en local, ni les importer. Les
enregistrements sont alors envoys l'ordinateur
STATISTICA de manire asynchrone par la CPU du
serveur de base de donnes, et STATISTICA les traite
en utilisant la CPU de la station de travail.
Si vous utilisez une version Client-Serveur de STATISTICA, la station de travail ne gre que l'interface-utilisateur de STATISTICA, tous les calculs tant pris en
charge par le serveur. L'architecture Client-Serveur
En outre, lorsque vous analysez vos rsultats WebSTATISTICA dans un navigateur, vous avez la possibilit de
rapatrier ces rsultats en local sur votre ordinateur pour
poursuivre leur traitement. Par exemple, en cliquant sur
un petit bouton situ (selon la configuration) ct de
chacun des documents de sortie (tableaux, graphiques)
ANNEXE B : WebSTATISTICA
envoys dans votre navigateur par WebSTATISTICA
Server, vous pourrez rapatrier cet objet (un tableau ou
un graphique STATISTICA) sur le client dans son
format natif STATISTICA (en format .sta ou .stg), ce
qui vous permet de poursuivre son analyse ou sa modification off-line grce aux outils STATISTICA en
local.
L'architecture de WebSTATISTICA est totalement indpendante de la plate-forme. Elle offre une interface-
ANNEXE B : WebSTATISTICA
Les diffrents aspects de l'interface-utilisateur de STATISTICA peuvent tre excuts par un ou plusieurs utilisateurs depuis tout ordinateur au monde (tant qu'il est
connect Internet, mme sans connexion haut
dbit), et le serveur ralise tous les calculs et les oprations sur les donnes, en utilisant les droits d'accs et
rgles de scurit applicables aux diffrents projets et
groupes d'utilisateurs, tels qu'ils ont t dfinis par
l'administrateur du rseau.
ANNEXE B : WebSTATISTICA
visualiser et modifier les donnes dans l'diteur de
Feuilles de Donnes interactif de WebSTATISTICA,
slectionner l'analyse raliser l'aide du systme traditionnel de menus (ou un raccourci dans le menu personnalis Mon Menu),
ANNEXE B : WebSTATISTICA
Outre ces fonctionnalits intgres et intuitives, WebSTATISTICA possde galement une bote outils permettant l'utilisateur de personnaliser l'interface-utilisateur et de dvelopper des applications personnalises
avec des fonctionnalits spcifiquement dfinies, et qui
s'adaptent aux besoins de leurs applications particulires.
ANNEXE B : WebSTATISTICA
prise de pointe, volutifs, qui sont aujourd'hui installs
dans les plus grandes entreprises du monde entier.
Toutefois, WebSTATISTICA Server reste bas sur les
protocoles standard de communication de l'industrie
(par exemple, XML) garantissant (a) son indpendance
par rapport aux plates-formes, (b) l'volutivit vers les
technologies futures, et (c) une personnalisation facile
par le client. Cette possibilit de personnalisation est
d'ailleurs accrue par le fait que seules les conventions
industrielles standard de syntaxes (notamment Visual
Basic, C++, HTML, XML) sont utilises pour personnaliser, configurer et dfinir toutes les oprations analytiques spcifiques et tous les rsultats dans WebSTATISTICA.
ANNEXE B : WebSTATISTICA
la prsentation des pages produites en ajoutant les
instructions HTML appropries.
Les problmes d'authentification et de scurit sont des
paramtres cl de l'architecture de WebSTATISTICA
Server. Au dbut de chaque session, les utilisateurs se
connectent au systme en indiquant leur nom
d'utilisateur et leur mot de passe. Les administrateurs du
systme peuvent contrler l'accs aux sources de
donnes et aux scripts en accordant des droits d'accs
individuels (par utilisateur) ou collectifs (par groupe
d'utilisateurs). Le niveau d'accs le moins scuris permet aux utilisateurs avancs (ou aux administrateurs)
d'excuter quasiment tout type de script (afin, par
exemple, d'effectuer des oprations d'administration du
systme ou de maintenance). Ce niveau ncessite un
droit d'accs spcifique (le plus lev), car en raison de
la nature et de la puissance du langage STATISTICA
Visual Basic, il permet d'accder (pour les utilisateurs
autoriss) toutes les ressources du rseau.
Remarque : ce systme peut tre intgr aux rseaux
traditionnels de STATISTICA en licences flottantes
(c'est--dire non bass sur le Web) ou aux systmes
Entreprise de STATISTICA, ce qui vous permet d'installer, par exemple, une licence flottante ou un systme
Entreprise de STATISTICA compos (au total) de 50
licences, dont 20 seulement seront accessibles par
l'intermdiaire de WebSTATISTICA Server.
Le principal avantage des applications WebSTATISTICA Server rside bien videmment dans la liste impressionnante des fonctionnalits spcifiques de STATISTICA. En outre, et contrairement aux produits concurrents, nous offrons une solution complte avec une
interface-utilisateur base sur le Web et non pas simplement un kit de dveloppement (mme si des outils
de dveloppement sont galement proposs pour tendre ou personnaliser le systme). De mme, il n'est pas
ncessaire qu'un serveur Web spcifique soit pralablement install (compatible ou non avec les normes de
scurit et autres rgles du client). Enfin, notre systme
est pilot par les scripts VB standard, aisment modifiables par les utilisateurs ou les administrateurs du
systme.
ANNEXE B : WebSTATISTICA
Outre une gamme analytique complte et performante, tous les produits STATISTICA offrent une interface-utilisateur entirement personnalisable (avec des
modles simplifis pour les novices), une gestion
flexible des rsultats (notamment diffrents formats
pour les rapports, comme .pdf, Word, .rtf, .html, et
des rsultats sur le portail Web), une compatibilit
totale avec OLE/ActiveX, et une intgration avec le
Web. En outre, tous les produits offrent un gestionnaire de donnes optimis permettant de manipuler
des volumes importants de donnes, des outils interactifs pour requter des bases de donnes et une large
gamme de fonctionnalits d'importation/exportation.
Tous les produits STATISTICA permettent de traiter
des donnes d'une taille illimite (avec des calculs en
quadruple prcision), avec plusieurs fichiers en
entre, et sont multitches. Chaque produit offre une
large slection d'outils interactifs et totalement intgrs de visualisation et de reprsentation graphique ou
de dessin, et offre un ensemble complet d'options
d'automatisation ainsi qu'un environnement de dveloppement professionnel compatible avec Visual Basic et .NET, avec un arsenal de plus de 14.000 fonctions accessibles dans des environnements externes.
Tracs de dispersion
Tracs multiples permettant une comparaison directe de plusieurs variables dpendantes
met
votre disposition une vaste gamme de cartes
totalement personnalisables (que vous pouvez appeler
depuis d'autres environnements), simples et rapides
utiliser ainsi que diverses options d'automatisation et
raccourcis d'interface-utilisateur destins simplifier
votre travail routinier (un outil complet pour les
mthodes Six Sigma).
Rapport et affichage de cartes de synthse (Type
Six Sigma)
Cartes X-barre et R ; Cartes X-barre et S ; Cartes
Np, P, U, C
Diagrammes de Pareto
Indices de capabilit et de performance du processus
Cartes de Moyennes/tendues Mobiles, Cartes
EWMA
Cartes petites sries (avec nominal & cible)
Cartes CuSum (somme cumule)
Tests des sries
Causes et actions, alarmes personnalisables,
balayage analytique, etc
intgre une large gamme de plans d'expriences et outils de reprsentation graphique, notamment un profil de dsirabilit interactif (un outil
complet pour les mthodes Six Sigma).
Plans Factoriels Fractionnaires
Plans de Mlange
Carrs Latins
Recherche de Plans Optimaux 2(k-p)
Analyse et transformations des rsidus
Optimisation d'une ou plusieurs variables de rponse
Plans composites centrs
Plans de Taguchi
Plans avec minimum d'aberrations et maximum
d'effets non-confondus
Plans factoriels fractionnaires 2(k-p) avec blocs
Surfaces sous contraintes
Plans D- et A-optimaux
Profils de dsirabilit, etc
offre une solution complte de matrise statistique des procds multidimensionnelle, dployable sur une plate-forme analytique volutive et
scurise.
Mthodes statistiques univaries et multivaries de
contrle qualit, modlisation prdictive et de rduction des donnes
Fonctions permettant de dterminer les facteurs
influents au niveau du processus, des matires premires et de l'environnement ainsi que leurs paramtrages optimaux pour fabriquer des produits de la
meilleure qualit possible
Suivi interactif ou automatis des caractristiques
du processus au cours des diffrentes phases de production
Construction, test et dploiement de modles prdictifs sur la base de rsultats connus issus de
donnes historiques
Analyse historique, exploration et reprsentation
des donnes, construction et valuation de modles
Outre les fonctionnalits communes dtailles prcdemment, les Systmes Entreprise de STATISTICA
offrent une large gamme d'outils pour le travail collaboratif, une interface-utilisateur base sur un navigateur Web (grce au produit complmentaire WebSTATISTICA), des bases de donnes spcialises,
ainsi qu'une interface hautement optimise pour les
entrepts de stockage des donnes l'chelle de
l'entreprise, et notamment des options permettant de
traiter rapidement de grosses volumtries de donnes
directement sur les serveurs, sans avoir crer de
copies en local. Des services de dploiement et de
formation sur site sont galement proposs.
est l'outil le plus
riche du march en termes de solutions de data
mining, avec une interface-utilisateur trs simple
utiliser (ventuellement disponible en client lger en
complment de WebSTATISTICA, voir page 315), et
un moteur de dploiement. Il est constitu de systmes totalement intgrs et automatiss, cl-enmains (mais galement facilement personnalisables)
offrant des solutions spcifiques pour de nombreuses
applications. Une version ddie l'industrie (STATISTICA Optimisation de Processus) permet d'explorer/analyser de grosses volumtries de donnes de
contrle qualit. Les solutions de data mining sont accessibles par des procdures puissantes contenues
dans cinq modules :
Explorateur/Segmenteur en 2D/3D
Classification supervise et non supervise
Modlisation et exploration multivarie
Prvisions et sries chronologiques
Modlisation par rseaux de neurones, etc
blances entre les documents et les termes, et extraction de l'information pertinente par rapport votre
mission et vos objectifs
Utilisation de listes de mots vides (mots ignorer)
et algorithmes de lemmatisation dans diffrentes
langues (notamment le Franais et l'anglais, mais
d'autres langues sont proposes)
Nombreuses options pour convertir les documents
en information numrique en vue de leur traitement
(par exemple, mapping, clustering, data mining
prdictif, classification de documents, etc...)
Possibilit d'oprations en multithreading sur des
installations serveur multi-processeurs pour une
indexation et une recherche trs rapides dans des
entrepts de documents gigantesques
Permet d'indexer, analyser et explorer d'autres
sources d'information non structure, comme des
images ou des sons (aprs prparation)
Totalement intgr avec STATISTICA et WebSTATISTICA ; toutes les mthodes d'apprentissage
supervis et non-supervis (clustering), mapping,
reprsentation graphique, etc..., sont instantanment
et directement accessibles ; la plupart des algorithmes disponibles dans STATISTICA Data Miner,
comme les algorithmes de machine learning (k-plus
proches voisins, rseaux baysiens nafs, Sparateurs Vaste Marge et classification par les noyaux), sont particulirement bien adapts aux oprations de text mining ou l'analyse d'autres types
d'informations non-structures
est une solution cl en main, destine au monde industriel. Elle vise mettre en
vidence les relations de cause effet entre la
qualit de vos produits et les processus permettant de
les fabriquer, en utilisant les donnes que vous collectez dj. PROCEED intgre une approche brevete et
labore par Caterpillar Inc. pour ses propres besoins,
reposant sur la plate-forme analytique STATISTICA
Entreprise.
Les entreprises industrielles de pointe collectent
aujourd'hui des quantits importantes de donnes :
Relatives aux processus de production.
Relatives aux tests des matires premires, des produits intermdiaires, et des matriaux intervenant
dans les processus de production.
Portant sur les lments critiques de la qualit des
produits finis.
Tous ces efforts de collecte et de stockage des donnes continuent tre aliments par une amlioration
incessante des processus d'automatisation, les avances technologiques des systmes de stockage dans
les entrepts de donnes, et les progrs raliss sur les
capteurs et autres techniques de mesure. Les industriels disposent de mines d'informations... qui ne demandent qu' tre transformes en information dcisionnelle interactive.
La collecte des donnes ne suffit pas elle seule
guider les changements stratgiques ncessaires de
l'entreprise. Pour rendre ces volutions possibles,
nous devons convertir ces donnes en connaissances,
puis transmettre ces connaissances sous une forme
permettant aux dcisionnaires d'agir directement
dessus. Avec PROCEED, c'est la garantie d'un Retour
sur Investissement partir de vos Donnes.
PROCEED allie des mthodes d'extraction de connaissances traditionnelles et novatrices pour :
Identifier les facteurs influents, simples ou complexes, existant entre les processus de production et
la qualit des produits
.NET, 283
C/C++, 5
capabilit du processus, 78
classeurs, 45, 91, 154, 159
classeurs
arborescence, 183, 191
commentaires, 155
danalyse, 22
donnes actives, 188
introduction, 181
rexcuter lanalyse, 246
codes, 70, 107
collections, 253, 260
collections
rcupration, 261
Conseiller Statistique, 33
copier, 24
copier avec noms (vars/obs.),
24
corrlations, exemple, 11
corrlations, exemple...
classeur de rsultats, 22
feuille de rsultats, 22
graphique, 27
matrice, 20
personnalisation des
graphiques, 28
rapport des rsultats, 24
synthse, 20
enregistrement
au format PDF, 160
automatique, 154
environnements rglements,
100
rsultats, 22
variables, 187
verrouillage, 104
filires danalyses, 234
filtrage
automatique, 138
des donnes, 63
fonctions, 252
fonctions
externes, 238, 309
internes, 11, 73, 102, 237
formats
html, 148
pdf, 160
rtf, 190
str, 190
xml, 148
formules
feuille de donnes, 14, 72
par lot, 72, 74
importer
donnes, 6, 149, 299, 309
imprimer
feuille de donnes, 24
intgration avec
le Web, 6
Microsoft Office, 161
WebSTATISTICA, 95
interface-utilisateur, 131
interface-utilisateur
analyse interactive, 135
caractristiques, 131
interface interactive, 134
navigateur internet, 297
personnalisations, 131
web, 147
introduction, 3
introduction
fonctions analytiques, 3
philosophie du logiciel, 5
spcificits, 4
technologie du logiciel, 5
ISO 21747, 78, 80, 81, 82
Java, 5
Journal des vnements, 101
macros, 192
macros au clavier, 235
macros
affecter aux barres doutils et
menus, 238
au clavier, 235
danalyse, 234
enregistrement, 52, 192, 234
excuter en ligne de
commande, 239
filires danalyses, 234
Manuel lectronique, 32, 291
matrice de corrlations, 16
menus
affichage, 227
data mining, 139
donnes, 13
fichier, 12
graphiques, 140
menu contextuel, 15
outils, 227
personnaliser, 146
statistiques, 139
mthodes, 256
mthodes
Goback, 259
RouteOutput, 260, 262
Microsoft Office
intgration, 149, 249
rapports Word, 150, 161
mise en forme des cellules, 188
modle linaire gnral, 309
modle-objet, 258, 259
modles avancs, 309
modules et bibliothques, 264
mot de passe, 103
objets, 256
observations
bouton, 13
filtrage des doublons, 64
OLE, 191, 249
OLE DB, 277
onglets
Avanc, 18
Base, 4, 18, 43, 80
optimisation de processus, 312
options, 141, 142, 143
options par dfaut, 227
organisation des programmes,
259
ouvrir un fichier, 12
rseau, 230
SVB, 146, 233
temporaire/permanente, 227
philosophie du logiciel, 5
PI (connecteur), 315
plans dexpriences, 311
points atypiques
recodification, 68
portail, 174
portail interactif, 163
PROCEED, 319
programmation
botes de dialogue, 259
environnement, 250
projets STATISTICA, 193
proprits, 256
qualit
sixpacks, 77
optimisation de processus,
312
plans dexpriences, 311
PowerSolutions, 319
puissance de test, 310
rseaux de neurones, 310
SDMS, 315
systmes entreprise, 312
techniques exploratoires
multivaries, 310
text miner, 312
WebSTATISTICA, 315
STATISTICA Entreprise, 108,
313, 314
STATISTICA Query, 277
STATISTICA Visual Basic
applications, 146, 233
crer des graphiques, 220
diteur et dboggage, 235
excuter un programme, 237
exemple, 240
filires danalyses, 234
macros au clavier, 235
macros danalyse, 234
mthodes, 147
performances, 238
proprits, 147
structure, 238
STATISTICA
bouton Dmarrer, 143
fonctionnalits, 309
ligne de produits, 309
projets, 193
Visual Basic, 146
statistiques, 139
statistiques lmentaires, 16
StatSoft
site web, 292
statut des observations, 215
support technique, 293
synthse de lanalyse, 81
systme expert de suivi et
dalertes, 314
systmes entreprise, 312
tableaux, 253
tableaux multimdia, 13, 185
technologie du logiciel, 5
text miner, 312
tracs de dispersion, 47, 49
transmettre des arguments
aux fonctions, 255
de tableaux, 255
types de documents, 143
types de donnes, 252
Web
site de StatSoft, 292
Web (intgration), 6