STATISTICA Quick Reference

Vous aimerez peut-être aussi

Vous êtes sur la page 1sur 336

PRISE EN MAIN

ii STATISTICA Prise en Main


Copyright StatSoft, 2010

PRISE EN MAIN : TABLE DES MATIRES

Exemple 1 : Corrlations .................................................................................................... 11


Exemple 2 : ANOVA ......................................................................................................... 34
Exemple 3 : Groupes de Variables ..................................................................................... 41
Exemple 4 : Analyses Par Groupes ................................................................................. 44
Exemple 1 : Utiliser Directement des Donnes Excel ...................................................... 55
Exemple 2 : Accder Directement aux Donnes Contenues
dans des Bases de Donnes ................................................................................................ 58
Exemple 3 : Prparation des Donnes : Nettoyage et Filtrage .......................................... 63
Exemple 4 : Formules de la Feuille de Donnes et Formules par Lot ............................... 72
Exemple 5 : Rsultats de Synthse (SixPacks) .............................................................. 77
Exemple 6 : STATISTICA Data Miner Plus ....................................................................... 84
Exemple 7 : WebSTATISTICA - Dlguer les Analyses au Serveur
Rcuprer les Rsultats ...................................................................................................... 95
Exemple 8 : Utiliser STATISTICA dans les Environnements Rglements ..................... 100
Exemple 9 : STATISTICA Entreprise ............................................................................... 108
Caractristiques Gnrales ............................................................................................... 131
Excuter Plusieurs Analyses ............................................................................................ 132
Interface-Utilisateur Interactive ....................................................................................... 134
STATISTICA Visual Basic et Contrle de STATISTICA
depuis d'Autres Applications ............................................................................................ 146
Interface-Utilisateur Base sur un Navigateur Internet : WebSTATISTICA ..................... 147
Intgration avec Microsoft Office .................................................................................... 149

STATISTICA Prise en Main iii


Copyright StatSoft, 2010

PRISE EN MAIN : TABLE DES MATIRES

Introduction ...................................................................................................................... 153


1. Classeurs STATISTICA ................................................................................................. 154
2. Fentres Indpendantes ................................................................................................ 156
3. Rapports ........................................................................................................................ 157
4. Microsoft Word ............................................................................................................ 161
5. Rsultats sur le Web ..................................................................................................... 163
Classeurs ........................................................................................................................... 181
Feuilles de Donnes (Tableaux Multimdia) ................................................................... 185
Rapports ............................................................................................................................ 189
Graphiques ........................................................................................................................ 192
Macros (Programmes STATISTICA Visual Basic) ........................................................... 192
Projets STATISTICA ......................................................................................................... 193
Data Miner Plus ............................................................................................................... 195
Introduction ...................................................................................................................... 201
Personnalisation des Graphiques ...................................................................................... 202
Grandes Catgories de Graphiques .................................................................................. 207
Graphiques des Donnes d'Entre .................................................................................... 208
Graphiques de Blocs ......................................................................................................... 211
Graphiques du Menu Graphiques ..................................................................................... 213
Habillage et Balayage des Graphiques, Statut des Observations ..................................... 215
Autres Graphiques Spcialiss ......................................................................................... 219
Cration de Graphiques en STATISTICA Visual Basic .................................................... 220
Personnalisation de l'Interface-Utilisateur Interactive...................................................... 225
Personnalisations Temporaires et Permanentes................................................................ 227
Options Gnrales par Dfaut .......................................................................................... 227
Personnalisation des Documents ...................................................................................... 229
Personnalisation des Graphiques ...................................................................................... 229
Conserver Plusieurs Configurations de STATISTICA ...................................................... 230
Configurations Personnalises pour les Utilisateurs en Rseau ....................................... 230

iv STATISTICA Prise en Main


Copyright StatSoft, 2010

PRISE EN MAIN : TABLE DES MATIRES

Enregistrement de Macros ................................................................................................ 234


Exemple : Enregistrer une Analyse .................................................................................. 240
Objets et Documents ActiveX (Note Technique) ............................................................ 248
Compatibilit OLE ........................................................................................................... 249
Compatibilit DDE ........................................................................................................... 250
Environnement de Programmation ................................................................................... 250
Modle-Objet de SVB : Exemples ................................................................................... 258
Bibliothques et Modules ................................................................................................. 264
Exemples d'Introduction ................................................................................................... 268
Introduction ...................................................................................................................... 277
Instructions lmentaires Pas--Pas ................................................................................. 278
Traitement Direct des Donnes situes sur un Serveur Distant
(la technologie IDBD) ...................................................................................................... 279
Ajouter la Bibliothque de l'Objet STATISTICA dans votre Projet .NET ........................ 283
Cration Manuelle de la Bibliothque Interop COM ....................................................... 285
Grer Plusieurs Versions de STATISTICA ....................................................................... 286
Lancement de STATISTICA.............................................................................................. 286
Version de la Bibliothque de STATISTICA .................................................................... 287
Pour Plus d'Informations .................................................................................................. 289
WebSTATISTICA .............................................................................................................. 295
Ligne de Produits STATISTICA ........................................................................................ 307

STATISTICA Prise en Main v


Copyright StatSoft, 2010

PRISE EN MAIN : TABLE DES MATIRES

vi STATISTICA Prise en Main


Copyright StatSoft, 2010

2 STATISTICA Prise en Main


Copyright StatSoft, 2010

STATISTICA est un systme complet et intgr d'analyse des donnes, de reprsentation graphique, de gestion de bases de donnes et de dveloppement d'applications personnalises,
offrant une large gamme de procdures lmentaires ou avances pour les sciences, le data
mining et toutes les applications industrielles ou commerciales

STATISTICA offre non seulement des procdures gnralistes pour les statistiques, les
graphiques et la gestion analytique des donnes, mais galement un ensemble complet de
mthodes spcialises pour l'analyse des donnes (par exemple, le data mining, les sciences
sociales, la recherche biomdicale ou les applications industrielles et commerciales). Tous les
outils analytiques de la gamme STATISTICA sont des composantes intgres du logiciel. Ces
outils peuvent tre pilots par diverses interfaces-utilisateur, notamment :
Une interface-utilisateur interactive et intuitive (avec la possibilit d'excuter STATISTICA
depuis Microsoft Office ou d'autres applications),
Une interface-utilisateur en client lger, base sur votre navigateur Internet (au travers de
WebSTATISTICA) qui vous permet d'accder STATISTICA depuis tout ordinateur au
monde, pourvu qu'il soit reli Internet, et
Une interface de programmation complte, compatible avec le langage universel .NET
(notamment le langage intgr Visual Basic compatible avec .NET), donnant accs plus
de 14.000 fonctions externes.

STATISTICA Prise en Main 3


Copyright StatSoft, 2010

CHAPITRE 1 : FONCTIONNALITS
Vous pouvez aisment automatiser et personnaliser l'interface-utilisateur interactive l'aide de
macros ou d'autres mthodes ; les macros sont enregistres sous forme de scripts VB.
L'environnement de dveloppement intgr permet d'interfacer STATISTICA avec d'autres
applications ou avec votre infrastructure informatique ; vous pouvez construire vos propres
extensions personnalises, allant des raccourcis les plus simples des projets de dveloppement avancs grande chelle.

Parmi les fonctionnalits exclusives de la gamme STATISTICA vous apprcierez :


Le choix et la richesse des procdures analytiques proposes,
La large palette, la qualit et les possibilits de personnalisation des graphiques, intgrs de
faon automatique avec toutes les procdures de calcul,
L'efficacit et la convivialit de l'interface-utilisateur,
L'architecture ouverte, compatible avec la plupart des environnements informatiques et de
dveloppement (notamment .NET), qui donne accs plus de 14.000 fonctions proposes
dans STATISTICA,
L'utilisation d'un grand nombre de nouvelles technologies informatiques de pointe (voir la
section Technologie du Logiciel, ci-contre) qui sont l'origine des capacits quasi-illimites
de STATISTICA, de sa performance (rapidit, prcision) et de ses possibilits de personnalisation.
L'un des principaux atouts des produits de la gamme STATISTICA est la possibilit offerte
ses utilisateurs, quel que soit leur niveau d'expertise, de configurer STATISTICA selon leurs
prfrences. Vous pouvez ainsi personnaliser la plupart des aspects de STATISTICA, mme les
procdures les plus lmentaires de l'interface-utilisateur.
La mme version de STATISTICA peut tre utilise par :
Des nophytes qui souhaitent raliser des tches routinires en utilisant les paramtrages par
dfaut (l'onglet Base) des botes de dfinition des analyses (ne contenant que quelques
boutons trs explicites) ou en accdant STATISTICA par l'intermdiaire de leur navigateur
Internet (avec une interface ultra-simplifie), et
Des analystes confirms, des statisticiens, des dveloppeurs qui peuvent intgrer chacune
des procdures optimises de STATISTICA (plus de 14.000 fonctions) dans des applications
spcifiques ou des environnements informatiques, en utilisant les dernires technologies
compatibles avec le Web et .NET.
4 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 1 : FONCTIONNALITS

La configuration par dfaut de STATISTICA (les options gnrales de l'interface-utilisateur et


du systme) est l'aboutissement de nombreuses annes passes couter les remarques et
suggestions de nos utilisateurs. Plusieurs dizaines de milliers d'utilisateurs, issus de tous les
continents et d'horizons professionnels diffrents, nous ont fait part de leurs remarques. Le
premier enseignement tirer de tous ces commentaires est combien leurs besoins et leurs prfrences sont diffrents (d'un point de vue individuel, mais aussi en termes de projets ou
d'applications). Pour rpondre tous ces besoins, STATISTICA s'est sans doute dot de l'interface-utilisateur la plus souple et la plus facilement personnalisable qu'aucune autre application
actuellement disponible.
Bien que STATISTICA donne accs un puissant arsenal de technologies de pointe (voir la
section Technologie du Logiciel, ci-dessous), vous n'avez pas besoin de matriser ces technologies car elles ont t intgres pour travailler de manire automatique et intuitive. Un utilisateur nophyte pourra se contenter d'utiliser les options par dfaut. Mais les options plus avances sont aisment accessibles dans les autres onglets ou par un simple clic. Pratiquement tous
les aspects de STATISTICA (la configuration au dmarrage de l'application, la manire dont
sont gres et produites les sorties, la faon dont STATISTICA amne l'tape suivante)
peuvent tre modifis d'un simple clic. En outre, STATISTICA mmorise vos modifications
jusqu'au moment o vous dcidez de les annuler. La plupart des botes de dialogue utilises
pour spcifier une analyse ou raliser une tche routinire peuvent tre facilement remplaces
(par exemple, simplifies, amliores, ou combines avec des procdures personnalises).
STATISTICA saura toujours s'adapter vos besoins en termes d'apparence ou d'ergonomie.

La performance, la souplesse de personnalisation et le vaste choix d'options ne seraient pas


possibles si STATISTICA n'intgrait pas les technologies les plus rcentes pour piloter toutes
les fonctions du logiciel. STATISTICA utilise et/ou reconnat les technologies les plus avances
actuellement disponibles. Chacune des 14.000 fonctions de STATISTICA peut tre appele par
des applications externes. Il n'existe pratiquement aucune limite quant la taille et la complexit des donnes pouvant tre stockes. STATISTICA est galement optimis pour les applications Web et multimdia. Les procdures statistiques et graphiques intgrent de nombreuses
optimisations propritaires (telles que la technologie de calcul en quadruple prcision qui
permet de s'affranchir des limites standard de stockage du point flottant IEEE) offrant une
prcision que seules certaines applications mathmatiques spcialises sont en mesure de
STATISTICA Prise en Main 5
Copyright StatSoft, 2010

CHAPITRE 1 : FONCTIONNALITS
proposer, mais rarement les applications de traitement de grosses volumtries de donnes
comme les programmes statistiques ou de data mining.
C'est la raison pour laquelle STATISTICA offre une rapidit, une prcision et un temps de
rponse incomparables, facilits par des fonctions de traitement multiple (ainsi que l'architecture avance de traitement parallle/distribu de type super-ordinateur propose dans la
version Client-Serveur de WebSTATISTICA et disponible directement au travers d'Internet).
L'accs aux donnes utilise une technologie permettant STATISTICA de travailler aussi bien
sur des fichiers de donnes plats stocks en local, qu'en requtant des bases de donnes
multidimensionnelles contenant des Traoctets de donnes stockes dans des entrepts de donnes externes, les calculs tant raliss directement sur le serveur (c'est--dire, sans avoir
importer pralablement les donnes en local ; cette possibilit est offerte dans les versions
entreprise de STATISTICA).
Par exemple, vous pouvez ouvrir simultanment plusieurs instances STATISTICA, chacune
excutant diverses analyses et requtes sur plusieurs fichiers ou bases de donnes et les
rsultats peuvent tre organiss dans des projets distincts. Les fichiers d'entre et de sortie,
ainsi que les graphiques STATISTICA peuvent tre de taille quasi-illimite, y compris des
documents hirarchiques de diffrent type. Les sorties peuvent tre envoyes vers des canaux
de sortie diffrents comme des tableaux multimdia, des classeurs optimiss, des rapports (y
compris sous forme de fichiers .pdf ou de documents Microsoft Office, Internet, ou encore
l'application complmentaire et totalement intgre STATISTICA Gestion Documentaire).

L'une des fonctionnalits majeures de la famille de produits STATISTICA est qu'elle est totalement intgre avec le Web, et sous rserve que le serveur STATISTICA soit install, vous
pouvez accder l'ensemble des fonctionnalits de STATISTICA depuis tout ordinateur connect Internet dans le monde. Vous avez non seulement la possibilit d'excuter des scripts
au travers d'Internet, mais galement une plthore de fonctionnalits interactives, comme des
oprations interactives de construction de modles prdictifs de data mining en glissant simplement des flches dans l'espace de travail de STATISTICA Data Miner (depuis votre navigateur internet, sans aucun logiciel client install). Pour plus d'informations, voir l'Annexe B
WebSTATISTICA, page 297.
Remarque : la plupart des fonctionnalits dcrites dans ce manuel sont disponibles dans tous
les produits de la gamme STATISTICA, mme si certaines sections de cet ouvrage font rfrence certains produits spcifiques comme les fonctionnalits des produits WebSTATISTICA
Server ou STATISTICA Data Miner.

6 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 1 : FONCTIONNALITS

Nous sommes heureux de vous annoncer qu' ce jour, STATISTICA a reu les meilleures
valuations dans toutes les tudes comparatives indpendantes qui l'ont cit. Dans l'industrie
du logiciel, peu de produits ont reu une reconnaissance aussi unanime.
Pour plus d'informations sur StatSoft et sur cette reconnaissance ingale de STATISTICA,
visitez notre site Internet : http://www.statsoft.fr.

STATISTICA Prise en Main 7


Copyright StatSoft, 2010

CHAPITRE 1 : FONCTIONNALITS

8 STATISTICA Prise en Main


Copyright StatSoft, 2010

12/11/09

Aprs avoir install STATISTICA, dmarrez le programme en


slectionnant le raccourci STATISTICA dans le menu Tous les Programmes du menu Dmarrer
de Windows. Vous pouvez galement double-cliquer sur le fichier STATIST.exe dans l'Explorateur Windows ou sur l'icne d'un fichier STATISTICA, par exemple, une feuille de donnes,
pour dmarrer l'application.

Lors de l'ouverture initiale de STATISTICA, une feuille de donnes vierge apparat ainsi que la
bote de dialogue Bienvenue dans STATISTICA. La bote de dialogue Bienvenue dans STATISTICA contient un certain nombre d'options permettant d'accder aisment et rapidement aux
fonctions les plus courantes de STATISTICA.

STATISTICA Prise en Main 11


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

Vous pouvez cocher l'option Ne plus afficher cette bote de dialogue dans la partie infrieure
de la bote de dialogue si vous ne souhaitez plus voir apparatre cette bote de dialogue
l'ouverture de STATISTICA.
La plupart des aspects de STATISTICA, tant au
niveau de l'apparence que des fonctionnalits (notamment les fonctionnalits lmentaires
illustres dans cet exemple comme le canal de sortie vers lequel sont orients les rsultats)
peuvent tre modifis de faon permanente pour rpondre vos prfrences. Par exemple,
mme la premire tape (l'ouverture de STATISTICA) peut tre personnalise ; vous pouvez
modifier le mode d'ouverture en plein-cran, l'apparence de la feuille de donnes, les barres
d'outils, etc...
Dans cet exemple, nous utiliserons le fichier de
donnes Adstudy.sta ; dans le menu Fichier, slectionnez la commande Ouvrir des Exemples
afin d'accder la bote de dialogue Ouvrir un Fichier de Donnes STATISTICA. Double-cliquez sur le rpertoire Fichiers de donnes, puis sur le fichier Adstudy. Vous pouvez galement
ouvrir des fichiers de donnes en utilisant le menu Fichier - Ouvrir qui vous permet de choisir
le lecteur et le rpertoire spcifique contenant le fichier de donnes, en cliquant sur l'un des
boutons
du Panneau de Dmarrage d'une analyse (la premire bote de dialogue qui

12 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS


apparat aprs avoir slectionn une commande du menu Statistiques, Data-Mining ou Graphiques), ou sur le bouton
de la barre d'outils.
Les fichiers de donnes STATISTICA
sont affichs dans une feuille de donnes (c'est--dire qu'une feuille de donnes est en fait un
fichier de donnes). Toutes les feuilles de donnes STATISTICA sont affiches grce la puissante technologie des tableaux multimdia de StatSoft, illustre plus loin, et ces tableaux peuvent comporter des quantits de donnes quasi-illimites mais aussi des sons, des vidos, des
documents incorpors, des scripts d'automatisation ou des interfaces-utilisateur personnalises.
Vous pouvez ouvrir plusieurs feuilles de donnes simultanment (chaque feuille de donnes
permettant de raliser une analyse diffrente) ; la plupart des sorties produites par STATISTICA sont galement affiches dans des feuilles de donnes (tableaux multimdia). Vous pouvez accder aux fonctionnalits de gestion des donnes tout moment par l'intermdiaire du
menu Donnes lorsqu'une feuille de donnes est active.
La barre d'outils de la Feuille de donnes comporte deux boutons
et
; ces
boutons permettent d'accder un menu d'options destines restructurer votre fichier de
donnes (par exemple, Ajouter ou Dplacer des variables ou des observations).
menu du bouton

menu du bouton

Vous trouverez un descriptif de l'ensemble de ces options dans le Manuel lectronique de


STATISTICA.
L'intitul des variables (colonnes) de la feuille de donnes contient le nom des variables. Double-cliquez sur le nom d'une variable pour afficher la
bote de dialogue des spcifications de la Variable respective.

STATISTICA Prise en Main 13


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

Cette bote de dialogue permet de modifier le


nom et/ou le format d'une variable, de saisir une formule pour recalculer ses valeurs, etc... Si le
champ Description dtaille commence par le signe gal (=), STATISTICA va l'interprter
comme une formule [vous pouvez insrer un commentaire aprs un point virgule (;)]. Par
exemple, si vous saisissez dans le champ Description dtaille (de la variable 1) =(v2+v3+v4)/3
ou =mean(v2:v4), les valeurs de la variable seront remplaces par la moyenne des variables 2
4, individuellement pour chaque observation (ligne) de la feuille de donnes.
Vous pouvez visualiser ou modifier les spcifications de toutes les variables dans la bote de
dialogue de synthse Spcifications de Toutes les Variables, accessible en cliquant sur le
bouton Toutes Spcif. de la bote de dialogue des spcifications de la Variable.

14 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS


Les feuilles de donnes permettent
un accs rapide une srie de commandes grce aux menus contextuels. Les menus contextuels sont des menus dynamiques qui apparaissent lorsque vous cliquez avec le bouton droit de
la souris sur un lment (par exemple, une cellule de la feuille de donnes). Le menu contextuel de la feuille de donnes propose diverses oprations spcifiques, relatives la gestion des
donnes et d'autres options associes la variable (colonne), l'observation (ligne), et/ou au
bloc de cellules actuellement slectionn.

Vous pouvez personnaliser la manire dont les rsultats sont


grs par STATISTICA (voir le chapitre Cinq Canaux de Sortie pour les Rsultats de vos Analyses, page 153). Vous pouvez envoyer tous vos rsultats vers cinq canaux de sortie :
Classeurs (voir page 154),
Fentres individuelles (voir page 156),
Rapports (voir page 157),
Microsoft Word (voir page 161), et
Le Web (voir page 163)
Les quatre premiers sont contrls par le volet d'options Analyses/Graphiques : Gestionnaire
de Sorties de la bote de dialogue Options (accessible par le menu Fichier - Gestionnaire de
Sorties ou par le menu Outils - Options). Ils ne sont pas mutuellement exclusifs (vous pouvez
par exemple, envoyer vos rsultats simultanment dans un classeur et un rapport), et chaque
canal de sortie peut tre personnalis de diverses manires. En outre, tous les rsultats produits
(feuilles de donnes et graphiques) peuvent contenir d'autres documents et objets incorpors et

STATISTICA Prise en Main 15


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS


lis, ce qui permet d'organiser les rsultats de STATISTICA de faon hirarchique, de diffrentes manires.
Calculons maintenant une matrice de corrlations sur les
variables de notre fichier de donnes. Pour accder la bote de dialogue Statistiques lmentaires (Panneau de Dmarrage), slectionnez l'option Statistiques lmentaires dans le menu
Statistiques,

ou partir du bouton Dmarrer


l'cran.

de STATISTICA, situ dans l'angle infrieur gauche de

16 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

ce stade, assurez-vous qu'aucun bloc (groupe de cellules) n'est en surbrillance dans la feuille
de donnes (pour dslectionner un bloc, cliquez simplement avec le curseur sur une cellule de
la feuille de donnes). Si un bloc est slectionn, STATISTICA considrera que les variables du
bloc ont t intentionnellement prslectionnes pour l'analyse, et produira automatiquement
les rsultats (corrlations) pour les variables slectionnes lorsque vous cliquerez sur les boutons OK ou Synthse, sans vous demander de slectionner les variables.
Dans le Panneau de Dmarrage du module Statistiques lmentaires ci-dessous,

STATISTICA Prise en Main 17


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS


slectionnez l'option Matrices de corrlations en double-cliquant dessus (ou en cliquant sur
l'option Matrices de corrlations puis en cliquant sur le bouton OK).
Aprs avoir slectionn l'option Matrices de corrlations dans le Panneau de Dmarrage, la
bote de dialogue Matrices de Corrlations apparat.

Comme la plupart des botes de dialogue d'analyse (et


de graphiques) de STATISTICA, la bote de dialogue Matrices de Corrlations est organise en
fonction du type d'options disponibles. D'une manire gnrale, au moins deux types d'analyses sont disponibles.
L'onglet Base d'une bote de dialogue comporte les options les plus courantes et permet de
spcifier rapidement et simplement une analyse lmentaire.

L'onglet Avanc comporte, outre les options disponibles dans l'onglet Base, diverses options
plus spcialises (par exemple, dans notre cas, des options pour enregistrer les matrices,

18 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS


produire des statistiques plus pousses, ou divers tracs). D'autres onglets sont en gnral
disponibles, selon le type d'analyse spcifi.

Dans certains cas, seul l'onglet Base est disponible. Comme pour toutes les botes de dialogue
de STATISTICA, vous pouvez appuyer sur la touche F1 ou cliquer sur le bouton
situ dans
l'angle suprieur droit de la bote de dialogue pour accder l'Aide dans laquelle vous trouverez un descriptif des options de l'onglet respectif.
Les botes de dialogue de STATISTICA sont
des botes de dialogue intelligentes. En effet, lorsque vous n'tes pas sr(e) de l'opration
raliser, il vous suffit de cliquer sur le bouton OK ou sur le bouton Synthse pour laisser STATISTICA vous amener automatiquement l'tape logique suivante (par exemple, la slection
des variables analyser).
Chaque bote de dfinition d'une analyse STATISTICA comporte au
moins un bouton Variables, permettant de spcifier les variables analyser.
Dans notre exemple, cliquons sur le bouton 1 liste
de variables (vous pouvez galement appuyer sur la touche 1). Aprs avoir cliqu sur le bouton
1 liste de variables (ou sur le bouton Synthse si vous n'avez pralablement slectionn aucune
variable dans votre feuille de donnes), une bote de slection des variables apparat. Comme
nous l'avons dj mentionn, si vous avez prcdemment slectionn un bloc de cellules dans
la feuille de donnes, les variables du bloc en surbrillance seront automatiquement slectionnes ; si vous cliquez ensuite sur le bouton Synthse, la matrice de corrlations sera automatiquement produite pour les variables du bloc slectionn.

STATISTICA Prise en Main 19


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

La bote de dialogue de slection des variables offre diverses possibilits pour slectionner les
variables (vous pouvez notamment utiliser les conventions standard de Windows, MAJ+clic et
CTRL+clic pour slectionner respectivement des listes continues et discontinues de variables).
Cette bote de dialogue offre galement divers raccourcis et options pour examiner le contenu
du fichier de donnes. Par exemple, vous pouvez visualiser la description dtaille ou les formules des variables (en cliquant sur le bouton Rsum/Dtail) ; vous pouvez galement accder la liste des valeurs/modalits d'une variable particulire ainsi qu' diffrentes statistiques
descriptives lmentaires en cliquant sur le bouton Zoom, comme illustr ci-dessous.

Pour cet exemple, cliquez sur le bouton Tout, puis sur le bouton OK pour revenir la bote de
dialogue Matrices de Corrlations. Cliquez ensuite sur le bouton Synthse pour produire la matrice de corrlations par dfaut des variables slectionnes.

20 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

Remarque : le bouton Synthse est quivalent au bouton Synthse : Matrice de corrlations. En


outre, selon les paramtres par dfaut qui sont spcifis pour la gestion des sorties, la feuille de
donnes des Corrlations peut tre affiche dans un rapport, une fentre indpendante ou dans
un document Word plutt que dans un classeur (comme illustr ci-dessus).
STATISTICA propose des outils et mthodes gnralistes pour
synthtiser les principaux rsultats sous forme de graphiques et/ou de tableaux. Par exemple,
cliquez sur le bouton
pour produire des graphiques de synthse pour chaque couple de variables de la matrice de corrlation.

Ces graphiques reprsentent non seulement les nuages de points de chaque corrlation, mais
galement la distribution (histogramme) de chaque variable, ainsi que l'quation de la rgression et le coefficient de corrlation respectif.
STATISTICA intgre de nombreux graphiques de ce type afin de synthtiser les statistiques
descriptives, les corrlations, les rsultats des analyses de capabilit, ou encore d'autres types
d'analyses.
STATISTICA Prise en Main 21
Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS


Outre le fait de stocker des donnes,
les feuilles de donnes de STATISTICA permettent d'afficher la plupart des sorties numriques.
Remarque : les feuilles de donnes offrent de nombreuses fonctionnalits et options d'affichage ; dans notre exemple, les corrlations significatives apparaissent dans un format diffrent (par dfaut, en rouge), ce qui permet de les identifier rapidement (voir la cellule entre
MESURE7 et SEXE). Les feuilles de donnes peuvent contenir d'une simple ligne plusieurs
Gigaoctets d'informations, et offrent de nombreuses options pour faciliter l'tude des rsultats
et leur reprsentation dans des graphiques prdfinis et personnaliss, comme nous l'illustrerons plus tard dans cet exemple. En outre, comme nous l'avons dj mentionn, les feuilles de
donnes STATISTICA sont gres grce la puissante technologie des tableaux multimdia de
StatSoft. Elles peuvent contenir des quantits quasiment illimites de donnes, mais aussi des
vidos, des sons, des interfaces-utilisateur personnalises, des scripts auto-excutables, ainsi
qu'une gamme tendue d'options de personnalisation (voir page 185 pour plus d'informations
sur les feuilles de donnes).
La plupart des fonctionnalits des feuilles de donnes sont accessibles par les boutons de la barre d'outils et par les menus contextuels (accessibles en cliquant avec le bouton droit de la souris sur une cellule quelconque). Vous pouvez
vous amuser avec ces options pour voir la manire dont elles fonctionnent ou accder leur
description en appuyant sur le bouton d'Aide (F1) ou en cliquant sur l'icne
dans la barre
d'outils, puis sur le bouton de la barre d'outils pour lequel vous souhaitez obtenir davantage
d'informations. Vous pouvez personnaliser le format d'affichage de chaque colonne, modifier
les sorties ou ajouter de nouvelles observations et variables vierges que vous pourrez complter ultrieurement avec vos propres commentaires ou qui pourront servir coller des rsultats
issus d'autres sources. Les feuilles de donnes peuvent tre imprimes de diverses manires
(par dfaut, dans des tableaux de qualit, avec quadrillage). Par ailleurs, puisque les feuilles de
donnes sont utilises en entre, vous pouvez aisment spcifier une analyse en utilisant les
rsultats d'une analyse prcdente (par exemple, vous pouvez utiliser la matrice de corrlations
que nous venons de produire, en entre d'une analyse de proximit). Pour transformer une
feuille de rsultats en feuille de donnes d'entre, il vous suffit de slectionner l'option Feuille
de donnes active dans le menu Donnes lorsque cette feuille de donnes est slectionne.
Tous les rsultats peuvent tre
affichs (et stocks) dans des fentres indpendantes, des rapports, des documents Word ou
des classeurs qui constituent l'option par dfaut (et sans doute la plus polyvalente) de gestion
des rsultats d'analyses (voir pages 154 et 181 pour plus d'informations sur les classeurs).
Selon le choix opr dans le Gestionnaire de Sorties (accessible par le menu Fichier - Gestionnaire de Sorties, voir le paragraphe suivant), les rsultats peuvent tre envoys dans un classeur commun (unique), regroupant les rsultats (feuilles de donnes et graphiques) de toutes
22 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS


vos analyses, dans des classeurs d'analyse distincts (un par analyse), dans le classeur contenant
le fichier de donnes original, ou enfin dans un classeur existant (pralablement enregistr).
Vous pouvez galement envoyer automatiquement les rsultats (feuilles de donnes ou graphiques) dans le classeur de faon slective et interactive en cliquant sur le bouton
de
la barre d'outils.
Le type de classeur utiliser, voire l'utilisation mme d'un
classeur, dpend entirement de la manire dont vous prfrez stocker vos donnes et rsultats.
Pour modifier le canal de sortie d'une analyse particulire, cliquez sur le bouton
dans la bote de dfinition d'une analyse ou d'un graphique et slectionnez l'option Gestionnaire de Sorties afin d'accder la bote de dialogue Gestionnaire de Sorties de l'Analyse/Graphique.

Pour modifier les options de sortie de l'ensemble des analyses, utilisez l'option (globale) Gestionnaire de Sorties (le volet d'options Analyses/Graphiques : Gestionnaire de Sorties de la
bote de dialogue Options est accessible par le menu Fichier - Gestionnaire de Sorties ou par le
menu Outils - Options), ou slectionnez le bouton d'option Utiliser les paramtres de sortie globaux (toute modification ici va affecter les paramtres globaux) dans la bote de dialogue Gestionnaire de Sorties de l'Analyse/Graphique.
Comme pour tous les classeurs, vous pouvez imprimer, extraire, copier et supprimer les documents individuels (par exemple, feuilles de donnes, graphiques) ou des groupes de documents
STATISTICA Prise en Main 23
Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS


du classeur de l'analyse. Pour plus d'informations, voir la prsentation gnrale des Classeurs,
page 181 ; voir galement le Manuel lectronique.
Vous pouvez copier le contenu d'une
feuille de donnes dans le Presse-Papiers en utilisant les touches CTRL+C (pour copier l'intgralit du bloc slectionn) ou en slectionnant l'option Copier avec Noms (Vars/Obs.) du menu
dition (le nom des variables et des observations du bloc correspondant sera galement copi).
Si vous collez une feuille de donnes dans un traitement de texte, elle apparatra sous forme
d'objet STATISTICA (que vous pourrez diter directement), de tableau standard au format RTF
ou de texte brut, d'image ou de tableau HTML (selon le choix opr dans la bote de dialogue
Collage Spcial du traitement de texte).
Pour produire un tirage papier des feuilles de
donnes, slectionnez la commande Imprimer du menu Fichier (ou appuyez sur les touches
CTRL+P) pour appeler la bote de dialogue Imprimer la Feuille de Donnes, dans laquelle vous
pouvez spcifier les options d'impression. Vous pouvez galement cliquer sur le bouton d'impression
de la barre d'outils. Cette mthode permet d'imprimer directement l'intgralit du
document slectionn, sans passer par la bote de dialogue Imprimer la Feuille de Donnes.
Pour imprimer un document particulier du classeur, slectionnez le document imprimer, puis
choisissez le bouton d'option Slection dans la bote de dialogue Imprimer la Feuille de Donnes. Vous pouvez galement extraire une copie du document (en le glissant depuis l'arborescence du classeur vers l'arrire-plan de l'application ou en utilisant le menu Classeur) et l'imprimer comme indiqu ci-dessus.
Les classeurs constituent sans doute la manire la plus
efficace et flexible de grer les rsultats (voir pages 154 et 181). Dans certains cas, il pourra
toutefois tre utile de crer automatiquement un historique des rsultats produits (feuilles de
donnes et/ou graphiques) dans un rapport plus traditionnel de type traitement de texte, permettant d'insrer des commentaires et des annotations, ou de personnaliser l'organisation des
diffrents objets (voir pages 157 et 189 pour plus d'informations sur les rapports).
Pour produire automatiquement un rapport (comme celui illustr la page suivante), cliquez
sur la flche situe ct du Rapport de Sortie souhait dans le volet d'options Analyses/Graphiques : Gestionnaire de Sorties de la bote de dialogue Options ou dans la bote de dialogue
Gestionnaire de Sorties de l'Analyse/Graphique. Dans la liste droulante, slectionnez l'une des
options Envoyer dans diffrents rapports (un par analyse/graphique), Rapport commun (identique pour toutes les analyses/graphiques) ou (Slectionnez un Fichier) afin d'accder la bote
de dialogue Ouvrir qui vous permettra de spcifier un rapport existant. Pour accder la bote
de dialogue Gestionnaire de Sorties, slectionnez la commande Gestionnaire de Sorties dans le
menu Fichier, ou la commande Options dans le menu Outils puis cliquez sur le volet d'options
24 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS


Analyses/Graphiques : Gestionnaire de Sorties (pour des modifications globales). Pour accder
la bote de dialogue Gestionnaire de Sorties de l'Analyse/Graphique, cliquez sur le bouton

dans toute bote de dfinition d'analyse ou de graphique et slectionnez l'option


(pour des modifications temporaires). Le Gestionnaire de Sorties
permet galement de spcifier le niveau d'information supplmentaire reporter avec la feuille
de donnes des rsultats.
Gestionnaire de Sorties

Retournons maintenant notre exemple et notre matrice de corrlations.

STATISTICA Prise en Main 25


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS


Chaque cellule de la matrice de corrlations contient une valeur comprise entre 1,00 et +1,00,
qui reprsente la relation entre les variables (le nom des variables apparat la fois en lignes et
en colonnes). Plus la valeur absolue du coefficient de corrlation est importante, plus la relation entre les variables correspondantes est intense. Une valeur positive indique une relation
positive entre les variables (les valeurs leves d'une variable correspondant aux valeurs
leves de l'autre variable et les valeurs faibles d'une variable correspondant aux valeurs
faibles de l'autre).
Si la valeur du coefficient de corrlations est ngative, c'est l'inverse (les valeurs faibles d'une
variable correspondent aux valeurs leves de l'autre variable). Pour plus d'informations sur
l'interprtation des corrlations, vous pouvez vous reporter la prsentation complte et illustre que vous trouverez dans la rubrique correspondante du Manuel lectronique. Le Manuel
lectronique contient un Conseiller Statistique (voir page 33) ainsi que l'intgralit du Manuel
lectronique de Statistiques de StatSoft (une source gnraliste d'informations sur les statistiques, prime et recommande par l'Encyclopedia Britannica pour sa Qualit, sa Prcision, sa
Prsentation et sa Facilit d'Utilisation).

Pour accder au Manuel lectronique, slectionnez l'option Index dans le menu Aide. Saisissez
ensuite le terme respectif (par exemple, Corrlations) dans le champ Entrez le(s) mot(s)
rechercher de l'onglet Rechercher du Manuel lectronique, puis cliquez sur le bouton Rechercher. Slectionnez enfin la rubrique qui vous intresse dans la liste des rubriques disponibles
(dans notre cas Corrlations Introduction).

26 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

Un point important (mme s'il est souvent ignor) sur lequel nous insistons dans le Manuel
lectronique est l'tude des nuages de points dans l'analyse des corrlations. Des coefficients
de corrlations importants et trs significatifs statistiquement peuvent parfois tre entirement
imputables un point particulier (atypique). Si tel est le cas, les coefficients de corrlations
(mme s'ils sont statistiquement significatifs) ne devront pas tre interprts (car ils n'ont
aucun pouvoir prdictif). Dans cette optique, et comme le recommande le Manuel lectronique de Statistiques, penchons-nous un instant sur le nuage de points qui reprsente la relation
entre des variables (mesure par un coefficient de corrlations particulier du tableau).
Lors de l'analyse
d'une feuille de donnes, vous pouvez reprsenter graphiquement les corrlations, par exemple, pour visualiser la corrlation entre les variables Mesure9 et Mesure5.
Pour tracer le nuage de points de ces deux variables, cliquez avec le bouton droit de la souris
sur le coefficient de corrlation correspondant (-0,467199). Dans le menu contextuel qui apparat, slectionnez l'option Graphiques des Donnes d'Entre, puis choisissez l'un des graphiques proposs dans le sous-menu, comme indiqu ci-aprs.

STATISTICA Prise en Main 27


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

Le graphique demand apparat l'cran.

Le graphique nous indique que les donnes n'ont pas une structure atypique et nous n'avons
donc aucune raison de nous proccuper des points atypiques (voir la section sur les points
atypiques page 27 ; voir galement la rubrique sur les points atypiques dans le Manuel lectronique).
Vous noterez au passage que la barre d'outils est
diffrente, maintenant qu'un graphique est actif. La barre d'outils des Outils Graphiques (qui
accompagne les fentres graphiques) offre d'autres options que celle des feuilles de donnes :

28 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS


Elle comporte divers outils de personnalisation des graphiques ainsi que diffrents outils de
dessin. Toutes ces options sont galement accessibles partir des menus droulants et des
menus contextuels (pour les options les plus courantes) en cliquant avec le bouton droit de la
souris sur une partie spcifique du graphique. Les options des menus contextuels sont hirarchiques en ce sens que la premire ou les deux premires options s'appliquent spcifiquement
l'lment slectionn dans le graphique, tandis que les options suivantes permettent d'appeler
des botes de dialogue plus gnralistes avec davantage d'options ou d'autres lments graphiques par rapport l'lment slectionn. Si vous cliquez avec le bouton droit de la souris dans
un espace vierge l'extrieur des axes du graphique, un menu d'options globales apparat (voir
ci-dessous).

Vous trouverez davantage d'informations sur la personnalisation des graphiques, page 202 et
dans le Manuel lectronique.
Retournons prsent notre feuille de donnes.
Vous pouvez partager les feuilles
de donnes en plusieurs volets (jusqu' quatre sections) en dplaant la bote de partage (le
petit rectangle situ en haut de la barre de dfilement verticale ou gauche de la barre de dfilement horizontale). Cette fonction permet de naviguer aisment dans des feuilles de donnes
volumineuses et de comparer des rsultats situs en diffrents endroits. Lorsque vous placez le
curseur de la souris sur la bote de partage, le curseur se transforme en ou en . Pour partager l'cran, maintenez le bouton gauche de la souris enfonc et faites glisser le curseur la
position dsire.

STATISTICA Prise en Main 29


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

Vous pouvez modifier la position du partage d'cran en dplaant la bote de contrle (maintenant situe entre les deux volets) vers le nouvel emplacement.

Remarque : les volets partags verticalement se dplacent solidairement lorsque vous vous dplacez horizontalement, et les volets partags horizontalement se dplacent ensemble lorsque
vous vous dplacez verticalement. Pour plus d'informations sur la mise en surbrillance de
blocs de donnes couvrant plusieurs volets et sur la slection rapide de cellules, voir la rubrique Comment tendre un Bloc de la Feuille de Donnes en Dehors de l'cran ? dans le Manuel lectronique.
Vous pouvez naturellement utiliser dans STATISTICA l'ensemble des
fonctionnalits Glisser-Dplacer proposes dans les tableurs standard (de type Microsoft
Excel). Par exemple, pour dplacer un bloc, placez le curseur au bord de la slection (le
pointeur de la souris se transforme en flche) puis faites-le glisser jusqu' son nouvel emplacement.

30 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

Pour copier un bloc de donnes, placez le curseur au bord du bloc slectionn (le pointeur de
la souris se transforme en flche) puis dplacez la slection un nouvel endroit en appuyant
sur la touche CTRL. Remarque : lorsque vous dplacez la slection, le signe plus (+) apparat
ct du pointeur de la souris pour indiquer que vous copiez le texte et que vous n'effectuez pas
un simple dplacement (voir l'illustration ci-dessous).

Pour insrer un bloc entre des colonnes ou des lignes, placez le curseur au bord du bloc slectionn (le pointeur de la souris se transforme alors en flche) puis dplacez la slection en appuyant sur la touche MAJ.
Si vous placez le curseur entre deux lignes, la barre d'insertion apparatra entre ces deux
lignes ; aprs avoir relch le bouton de la souris, le bloc sera insr entre ces lignes [en crant
autant de nouvelles observations que ncessaire]. De la mme manire, si vous placez le curseur entre deux colonnes, la barre d'insertion apparatra entre ces deux colonnes et le bloc sera
insr entre ces colonnes lorsque vous relcherez le bouton de la souris [en crant autant de
nouvelles variables que ncessaire].
Si vous appuyez galement sur la touche CTRL tout en dplaant la slection (vous verrez alors
un signe plus (+) apparatre ct du pointeur de la souris ; voir l'illustration de la page
suivante), le bloc sera copi et insr, et non pas dplac et insr.

STATISTICA Prise en Main 31


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

Vous pouvez galement extrapoler une srie de valeurs dans un bloc (Remplissage Automatique) en dplaant la Poigne de Recopie (petit carr noir situ dans l'angle infrieur droit du
bloc).

STATISTICA contient, dans son Manuel lectronique, un descriptif de toutes les procdures et options disponibles dans le programme. Pour accder au Manuel
lectronique de STATISTICA, slectionnez la commande Aide STATISTICA dans le menu Aide
ou cliquez sur le bouton
de la barre d'outils. Pour plus d'informations sur une commande
d'un menu ou sur un onglet particulier, appuyez sur la touche d'aide (F1) lorsque l'lment correspondant est slectionn. Vous pouvez galement accder cette aide contextuelle en appuyant sur la touche F1 ou en cliquant sur le bouton d'aide
dans la barre de titre de toutes les
botes de dialogue (le Manuel lectronique contient plus de 100 Mgaoctets de documentation
compresse).
Grce son organisation dynamique sous forme de liens hypertexte et ses onglets ( Sommaire, Index, Rechercher et Favoris), ainsi qu'aux diverses fonctionnalits permettant de personnaliser le systme d'aide, il est souvent plus rapide d'utiliser le Manuel lectronique que de
rechercher l'information dans les manuels imprims traditionnels.

32 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS


Remarque : la barre d'tat, situe en bas de la fentre STATISTICA, donne de brves explications sur les commandes des menus ou sur les boutons de la barre d'outils (lorsque vous slectionnez un lment ou que vous cliquez sur un bouton).
Un Conseiller Statistique est intgr au Manuel lectronique.
Lorsque vous slectionnez l'option Conseiller Statistique dans le menu Aide, STATISTICA
vous pose un certain nombre de questions simples sur la nature de votre recherche et sur le
type de donnes analyser. Le Conseiller Statistique va ensuite vous proposer diverses mthodes statistiques pouvant s'appliquer et vous indiquer l'endroit o vous pouvez les trouver dans
STATISTICA.

Les diverses rubriques du Conseiller Statistique contiennent des liens hypertexte qui vous
renvoient directement aux Introductions correspondantes du Manuel lectronique de STATISTICA, prsentant en dtail les mthodes statistiques respectives et leurs procdures.

STATISTICA Prise en Main 33


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

Pour commencer une analyse ANOVA/MANOVA, slectionnez la commande ANOVA dans le menu Statistiques afin de faire apparatre la bote de dialogue ANOVA/MANOVA Gnrale (Panneau de Dmarrage).

Cette bote de dialogue permet de spcifier des analyses trs simples (par exemple, une ANOVA un Facteur pour un modle avec un seul facteur inter-groupes) ou plus complexes (par
exemple, une ANOVA Mesures rptes pour un modle comportant plusieurs facteurs intergroupes et un facteur intra-groupes).
Pour ce plan 2 x 2 (inter) x 3 (mesures rptes), ouvrez le fichier Adstudy.sta.
Slectionnez l'option ANOVA Mesures rptes en Type d'analyse et les Spcifications rapides
en Mthode de spcification puis cliquez sur le bouton OK dans la bote de dialogue ANOVA/
MANOVA Gnrale afin d'accder la bote de dialogue ANOVA/MANOVA Mesures Rptes.

Le premier facteur (inter-groupes) est le facteur Sexe


(avec 2 niveaux : Homme et Femme). Le second facteur (inter-groupes) est le facteur Pub
(avec 2 niveaux : Pepsi et Coca). Les deux facteurs sont croiss, ce qui signifie qu'il peut y
34 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS


avoir la fois des sujets Homme et Femme dans les groupes Pepsi et Coca. Chaque individu a
rpondu 3 questions (nous appellerons ce facteur de mesures rptes Rponse, les 3 niveaux
tant reprsents par les variables Mesure1, Mesure2 et Mesure3).
Cliquez sur le bouton Variables (dans la bote de dialogue ANOVA/MANOVA Mesures Rptes) afin d'afficher la bote de slection des variables. Slectionnez les variables Mesure1
Mesure3 comme variables dpendantes (dans le champ Liste de variables dpendantes) et les
variables Sexe et Pub comme facteurs (dans le champ Prdicteurs catgoriels (facteurs)).

Cliquez ensuite sur le bouton OK pour revenir la bote de dialogue prcdente.


Nous pouvons synthtiser le plan analyser de la manire
suivante :
Inter-Groupe Inter-Groupe Facteur de Mesures Rptes : Rponse

Sujet 1
Sujet 2
Sujet 3

Facteur #1 : Facteur #2 : Niveau #1 :


Sexe
Pub
Mesure1
Homme
Pepsi
9
Homme
Coca
6
Femme
Coca
9
.
.
.
.
.
.
.
.
.

Niveau #2 :
Mesure2
1
7
8
.
.
.

Niveau #3 :
Mesure3
6
1
2
.
.
.

Nous avons maintenant spcifi le minimum requis par STATISTICA pour effectuer l'analyse, et si nous n'avions pas de facteur de
mesures rptes, nous pourrions simplement appuyer sur le bouton OK pour faire apparatre
les rsultats de l'analyse. Toutefois, dans notre exemple, nous devons indiquer que les trois
variables dpendantes slectionnes doivent tre interprtes comme les trois niveaux d'un
facteur de mesures rptes (facteur intra), sans quoi, STATISTICA considrera que les trois

STATISTICA Prise en Main 35


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS


variables dpendantes sont totalement diffrentes et ralisera une MANOVA (c'est--dire,
une ANOVA multivarie).
Pour dfinir le facteur de mesures rptes, cliquez sur le bouton Effets intra afin d'accder la
bote de dialogue Spcifier les facteurs intra (mesures rptes).

Remarque : STATISTICA propose ici un facteur de mesures rptes 3 niveaux (avec le nom
par dfaut R1). Vous ne pouvez spcifier qu'un seul facteur intra (mesures rptes) dans cette
bote de dialogue, mais vous pouvez en spcifier davantage dans le module Modle Linaire
Gnral (disponible dans le produit complmentaire Modles Linaires/Non-linaires Avancs).
Appuyez sur la touche F1 (ou cliquez sur le bouton ) dans cette bote de dialogue pour une
prsentation dtaille des plans de mesures rptes avec des exemples dans le Manuel lectronique. Vous pouvez modifier le nom des facteurs (par exemple, changer R1 en RPONSE),
puis cliquer sur le bouton OK pour quitter cette bote de dialogue.
Vous n'avez pas
spcifier manuellement les codes des facteurs inter-groupes [par exemple, pour indiquer
explicitement que la variable Sexe possde deux niveaux : 1 et 2 (ou Homme et Femme)] sauf
si vous ne souhaitez pas que STATISTICA utilise par dfaut tous les codes des variables de
classement slectionnes dans le fichier de donnes. Pour dfinir des codes spcifiques, cliquez sur le bouton Codes facteurs pour accder la bote de dialogue Codes des vars indpendantes (facteurs).

Cette bote de dialogue comporte diverses options. Par exemple, vous pouvez visualiser la liste
des modalits des variables individuelles en cliquant sur le bouton Zoom, puis remplir les
champs des codes (ici, Sexe et Pub) de certaines variables individuelles ou de toutes les variables, etc... Pour le moment, contentons-nous de cliquer sur le bouton OK et laissons STATISTICA remplir automatiquement les champs des codes avec toutes les valeurs distinctes rencontres dans les variables slectionnes,

36 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

et fermer cette bote de dialogue.


Aprs avoir cliqu sur le bouton OK dans la bote de dialogue ANOVA/
l'analyse s'excute et la bote de dialogue Rsultats de l'ANOVA
apparat. Diffrents rsultats (feuilles de donnes, graphiques) sont alors disponibles.
MANOVA Mesures Rptes,

Cette bote de dialogue se prsente sous forme d'onglets, ce qui permet de localiser rapidement
les options de rsultats. Par exemple, si vous souhaitez raliser des comparaisons planifies,
cliquez sur l'onglet Comps. Pour l'analyse des statistiques sur les rsidus, cliquez sur l'onglet
Rsidus. Pour cet exemple introductif, nous allons nous contenter des rsultats disponibles
dans l'onglet Base.
Pour commencer, examinons le tableau de synthse
de tous les effets de l'ANOVA, en cliquant sur le bouton Tous les effets (ce bouton est
reprsent par une icne reprsentant un tableau et portant la mention SUMM : ).

STATISTICA Prise en Main 37


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

Le seul effet statistiquement significatif dans cette analyse (si nous ne tenons pas compte de
l'Ordonne l'origine) est l'effet RPONSE (p = 0,007). Ce rsultat peut tre imputable des
moyennes structurellement diffrentes pour l'effet RPONSE (pour plus d'informations, voir la
rubrique ANOVA - Introduction du Manuel lectronique). Examinons prsent le graphique
des moyennes marginales de cet effet pour tenter de trouver une explication.
Pour rappeler la bote de dialogue Rsultats ANOVA (c'est--dire, reprendre l'analyse),
appuyez sur les touches CTRL+R, slectionnez l'option Reprendre l'Analyse dans le menu
Statistiques, ou cliquez sur le bouton Rsultats ANOVA dans la Barre d'Analyse. Lorsque la
bote de dialogue Rsultats ANOVA apparat, cliquez sur le bouton Tous effets/Graphs pour
tudier les moyennes des effets individuels.

Cette bote de dialogue contient une Table de tous les effets (avec la plupart des informations
que vous avez pu voir dans la feuille de donnes Tous les effets) qui permet de reprsenter les
effets individuels sous forme de tracs de moyennes (ou ventuellement, sous forme de feuilles de donnes contenant les valeurs des moyennes respectives).

38 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS


Double-cliquez sur l'effet principal
(marqu d'un astrisque dans la colonne p pour indiquer qu'il est significatif) afin de
le reprsenter graphiquement.
RPONSE

Le graphique rvle une nette tendance dcroissante : les moyennes des 3 questions successives sont de plus en plus faibles. Bien qu'il n'existe pas d'interaction significative dans ce modle (voir la Table de Tous les Effets, ci-contre), examinons l'interaction de l'ordre le plus
lev pour vrifier la cohrence de cette tendance dcroissante sur les facteurs inter-groupes.
Pour afficher le trac de
l'interaction de l'ordre le plus lev, double-cliquez sur la ligne RPONSE*SEXE*PUB qui
reprsente l'interaction entre les facteurs 1 (Sexe), 2 (Pub) et 3 (Rponse), dans la bote de
dialogue Table de tous les Effets. La bote de dialogue Spcifiez l'organisation des facteurs
dans le trac permet de personnaliser la prsentation par dfaut des facteurs dans le graphique
(contrairement au trac prcdent, le rsultat peut tre reprsent de diffrentes manires).

Cliquez sur le bouton OK pour accepter l'organisation par dfaut et produire le trac des
moyennes.

STATISTICA Prise en Main 39


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

Comme vous pouvez le constater, cette structure de moyennes (rparties selon les modalits
des facteurs inter-groupes) ne rvle aucun cart significatif par rapport la structure gnrale
du premier trac (pour l'effet principal, RPONSE). Vous pouvez poursuivre l'analyse des
autres effets de manire interactive, en ralisant des comparaisons post-hoc, des comparaisons
planifies, des diagnostiques tendus,
Cet exemple illustre la
manire dont STATISTICA permet d'explorer les donnes de faon interactive : l'utilisateur
n'est pas oblig de dfinir les rsultats produire a priori. Les modles les plus simples
pouvant produire de nombreux tableaux et graphiques, il est souvent difficile de connatre les
rsultats potentiellement intressants sans les visualiser. STATISTICA permet de slectionner
diffrents types de rsultats spcifiques et d'approfondir de faon interactive les tests, puis
d'excuter des analyses conditionnelles complmentaires, une fois les donnes traites et les
sorties initiales produites. Les procdures de calcul de STATISTICA ainsi qu'une large gamme
d'options pour reprsenter toute combinaison arbitraire de rsultats numriques, constituent
autant d'outils pour explorer vos donnes et vrifier vos hypothses.
Toutes les slections ralises au cours d'une analyse interactive (notamment la spcification
du modle et le choix des rsultats produire) sont automatiquement enregistres dans le code
standard en Visual Basic. Vous pouvez sauvegarder ces macros pour une utilisation rpte
(vous pouvez galement les affecter des boutons dans les barres d'outils, les modifier
volont, les combiner d'autres programmes, etc...). Pour plus d'informations, voir le Chapitre
9 - STATISTICA Visual Basic, page 231 ou le Manuel lectronique.

40 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

STATISTICA offre une fonctionnalit trs intressante les groupes de variables pour slectionner facilement et rapidement un sous-ensemble de donnes dans des fichiers de donnes
volumineux. Vous pouvez crer des ensembles de variables afin de simplifier l'utilisation rpte des mme groupes de variables, en particulier sur de grosses volumtries.
Ouvrez le fichier de donnes EnginePerformance.sta. Ce fichier contient des donnes relatives
la performance de trs gros moteurs, avec diffrents paramtres process enregistrs lors de
leur fabrication. Nous disposons de donnes collectes lors de la phase de test sur l'Efficacit,
l'conomie en Carburant et la Puissance de 128 moteurs, ainsi que 74 paramtres process collects au moment de la fabrication de chaque moteur.
Pour cet exemple, supposons que nous allons devoir utiliser frquemment le mme ensemble
de variables pour nos diffrentes analyses.
Dans le menu Donnes, slectionnez la commande Gestionnaire de Groupes de Vars afin
d'accder la bote de dialogue Gestionnaire de Groupes Logiques (Personnaliss) de
Variables.

Cliquez sur le bouton Nouveau afin d'accder la bote de dialogue Nouveau Groupe Logique
de Variables.

STATISTICA Prise en Main 41


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

Saisissez ensuite le nom Production dans le champ Nom du groupe de variables puis cliquez
sur le bouton OK. La bote de dialogue Variables du groupe logique apparat, avec toutes les
variables du fichier de donnes EnginePerformance.sta.

Pour les besoins de nos diffrentes analyses, nous allons slectionner les variables Entre01Entre05, Entre20, Entre30-Entre35 et Entre70. Vous pouvez slectionner ces variables
en utilisant les conventions standard de Windows MAJ+clic et CTRL+clic pour slectionner respectivement des listes continues et discontinues de variables.
Cliquez sur OK pour fermer la bote de dialogue Variables du groupe logique et retourner la
bote de dialogue Gestionnaire de Groupes Logiques (Personnaliss) de Variables.

42 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS


Le volet de gauche de cette bote de dialogue indique le nom de tous les groupes de variables
dfinis dans cette feuille de donnes (vous pouvez crer autant de groupes de variables que
vous le souhaitez dans une feuille de donnes). Le volet de droite donne le dtail des variables
du groupe slectionn dans le volet de gauche. Si ces deux volets sont vierges, c'est que vous
n'avez dfini aucun groupe de variables dans votre feuille de donnes.
Vous pouvez ajouter de nouveaux groupes de variables la feuille de donnes en cliquant sur
le bouton Nouveau. Vous pouvez aussi modifier un groupe l'aide du bouton Modifier, supprimer un groupe existant l'aide du bouton Supprimer ou changer le nom d'un groupe l'aide du
bouton Renommer. Le bouton Synthse (Feuille de Donnes) permet de produire une nouvelle
feuille de donnes contenant toute l'information relative aux groupes logiques de variables
actuellement dfinis dans la feuille de donnes.
Dans cet exemple, cliquez sur le bouton OK afin de valider le groupe de variables prcdemment dfini et fermer la bote de dialogue Gestionnaire de Groupes Logiques (Personnaliss)
de Variables. Dans le menu Statistiques, slectionnez la commande Rgression Multiple afin
d'accder la bote de dialogue Rgression Linaire Multiple. Dans l'onglet Base, cliquez sur le
bouton Variables pour accder une bote de dialogue de slection de variables.
Les groupes de variables sont reports entre crochets et apparaissent (dans l'ordre alphabtique) en haut de la liste de variables. Dans le champ Liste de variables indpendantes, slectionnez le groupe Production afin de spcifier en un seul clic les variables Entre01-Entre05,
Entre20, Entre30-Entre35 et Entre70 comme variables indpendantes dans notre analyse.

Si vous souhaitez vrifier les variables dfinies dans un groupe de variables, dplacez le pointeur de la souris sur le nom du groupe dans une bote de dialogue de slection de variables :
une InfoBulle va alors rappeler le numro des variables.

STATISTICA Prise en Main 43


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

Vous pouvez galement visualiser la liste des variables (avec leur nom) dans la bote de dialogue Gestionnaire de Groupes Logiques (Personnaliss) de Variables en cliquant sur le bouton
[Groupes]. Remarque : les groupes de variables sont associs une feuille de donnes particulire et ne servent qu' slectionner les variables. Vous ne les verrez donc jamais apparatre
dans les rapports ou les rsultats.
Comme vous pouvez le constater, nous avons conomis normment de temps en slectionnant un groupe logique de variables plutt que les variables individuelles qui le composent, et
vit tout risque d'erreur dans le choix des variables de ce fichier de donnes volumineux.

STATISTICA vous permet de transformer chaque analyse statistique ou graphique en analyse


par groupes. Lors de l'examen des rsultats dans la bote de dialogue des rsultats de la plupart des analyses, ou lorsque vous utilisez les options du menu Graphiques, vous pouvez slectionner une ou plusieurs variables de classement, et produire les rsultats 1) pour toutes les
observations du fichier de donnes, et/ou 2) pour chaque combinaison distincte des modalits
des variables de classement.

44 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

Cet outil puissant d'analyse interactive et exploratoire des donnes, vous permet d'examiner
rapidement s'il existe une structure particulire dans les diffrents groupes, chantillons ou
strates de vos donnes.
Par exemple, vous pouvez raliser une analyse de rgression multiple, et dcider de vous intresser a posteriori, sans quitter la bote de dialogue l'cran, aux rsultats dcomposs en
fonction du Sexe et ventuellement d'autres variables de classement dans vos donnes.
Si vous activez cette option (en cliquant sur le bouton
Par Groupes), tous les rsultats
seront dornavant calculs pour l'ensemble des groupes (option facultative), mais galement
pour chaque combinaison distincte des modalits des variables de classement spcifies (par
exemple, selon le Sexe et d'autres variables de classement), chaque fois que vous cliquerez
sur un bouton de rsultats (par exemple, pour produire une feuille de rsultats ou un graphique
de synthse),
Les rsultats de l'analyse Par Groupes peuvent tre envoys dans des dossiers distincts du
classeur par dfaut, libells selon la condition respective de l'analyse par groupes (par
exemple, Sexe=Femme ; Priode=Aprs1), ou tre envoys dans un dossier commun avec
l'ensemble des autres rsultats.

STATISTICA Prise en Main 45


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

Par exemple, vous pouvez produire des tracs curvilignes multiples pour dcrire un processus
multidimensionnel par batch, en crant un graphique distinct (trajectoire) pour chaque batch.

Cet exemple utilise le fichier de donnes Tomatoes.sta, dcrit en dtail dans la section Plans
d'Expriences du Manuel lectronique de STATISTICA (voir notamment l'exemple Cration
et Analyse d'un Plan 2332). Connor et Young (dans l'ouvrage de McLean et Anderson, 1984)
rapportent une exprience (tire de Youden et Zimmerman, 1936) sur diverses mthodes de
culture de plants de tomates avant de les repiquer en plein champ.
Commenons par ouvrir le fichier de donnes Tomatoes.sta. Slectionnez pour ce faire la commande Ouvrir des Exemples du menu Fichier afin d'accder la bote de dialogue Ouvrir un
Fichier de Donnes STATISTICA. Double-cliquez sur le dossier Fichiers de donnes, puis
slectionnez et ouvrez le fichier de donnes Tomatoes.sta de STATISTICA.

46 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

Ci-dessus, un extrait de quelques lignes du fichier de donnes. Veuillez vous reporter la


rubrique Exemples du module Plans d'Expriences dans le Manuel lectronique pour plus
d'informations et pour une analyse complte de ces donnes.

Cet exemple illustre un cheminement analytique frquent dans l'analyse de donnes de production par batch, c'est--dire lorsque l'objectif de l'analyse consiste vrifier (graphiquement
ou par des calculs) qu'un modle donn ou une certaine distribution s'appliquent tous les
chantillons, gammes ou batches considrs.
Nous allons nous intresser l'impact de la Mthode de Production, de la Condition du Sol et
de la Taille du Pot sur le rendement (Poids), et tester si nous pouvons identifier un modle
spcifique pour chaque Varit de l'tude. Plutt que de raliser une analyse de variance complte (comme dans l'exemple de Plans d'Expriences du Manuel lectronique), nous utiliserons plutt ici une approche graphique et des mthodes visuelles d'inspection.
Dans le menu Graphiques Graphiques en
2D, slectionnez la commande Tracs de Dispersion afin d'accder la bote de dialogue Trac
de Dispersion. Cliquez sur le bouton Variables et dans la bote de dialogue Variables du Trac
de Dispersion, slectionnez la variable Poids comme Variable dpendante et les variables Condition du Sol, Taille du Pot et Mthode de Production comme Variables de classement pour ce
graphique.

STATISTICA Prise en Main 47


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

Nous allons poursuivre cet exemple en crant un graphique par Variet afin d'illustrer les fonctionnalits Par Groupes. Cliquez pour le moment sur le bouton OK dans la bote de dialogue
de slection des variables.
Pour produire un trac aussi
informatif que possible, rorganisons les variables de telle sorte que la Mthode de Production
devienne le premier facteur dans la liste des Facteurs. Cliquez sur cette variable dans la liste
Facteurs, puis, tout en maintenant le bouton gauche de la souris enfonc, dplacez-la en haut
de la liste.

48 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS


Enfin dans la bote de dialogue Trac de Dispersion, vrifiez que la variable Mthode de
Production est bien slectionne dans la liste des Facteurs et dslectionnez l'option Encadrer
les groupes.
Nous souhaitons crer un trac de dispersion par
rapport la Mthode de Production, la Condition de Sol et la Taille du Pot pour toutes les
varits de tomates ensemble, et pour chaque Varit prise individuellement (en crant un
graphique distinct pour chaque Varit). Cliquez sur le bouton Par Groupes afin d'accder la
bote de dialogue Analyses Par Groupes.

Cliquez sur le bouton Variable(s) de Classement afin d'accder la bote de dialogue Slectionnez les Variables Par Groupes et spcifiez la Varit comme variable Par Groupes.

Remarque : vous pouvez spcifier plusieurs variables Par Groupes ; dans ce cas, les analyses
ultrieures seront ralises pour chaque combinaison distincte des modalits rencontres dans
les variables Par Groupes que vous aurez spcifies.
Cliquez prsent sur le bouton OK pour fermer la
bote de dialogue Slectionnez les Variables Par Groupes, puis cliquez sur le bouton OK pour
fermer la bote de dialogue Analyses Par Groupes. Enfin, dans la bote de dialogue Trac de
Dispersion, cliquez sur le bouton OK pour produire les graphiques.

STATISTICA Prise en Main 49


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

Vous remarquerez que le Trac de Dispersion est cr 1) pour l'Ensemble des Groupes, et 2)
pour chaque Varit (Bonny et Marglobe). L'examen de ces graphiques rvle que la Mthode
de Production conduit une lgre diffrence (sur les valeurs observes du Poids) pour la
Varit=Bonny, tandis que pour la Varit=Marglobe, la mthode FibrePl produit une moindre dispersion des valeurs qui tendent se situer dans la moiti suprieure de la distribution de
l'ensemble des valeurs de la variable Poids.

Utilisons prsent les options Statistiques Descriptives pour poursuivre notre analyse. Dans le
menu Statistiques, slectionnez la commande Statistiques lmentaires pour accder la bote
de dialogue Statistiques lmentaires (Panneau de Dmarrage). Slectionnez l'option Dcompositions & ANOVA 1 Facteur, puis cliquez sur le bouton OK afin d'ouvrir la bote de dialogue
Statistiques par Groupe (Dcompositions). Cliquez sur le bouton Variables et dans la bote de
dialogue Slectionnez les variables dpendantes et les variables de classement , spcifiez la
variable Poids comme Variable dpendante, et la variable Mthode de Production comme
Variable de classement. Cliquez ensuite sur le bouton OK pour fermer la bote de slection des
variables, puis sur le bouton OK dans la bote de dialogue Statistiques par Groupe (Dcompositions) afin d'accder la bote de dialogue Statistiques par Groupe - Rsultats.
Nous souhaitons par ailleurs calculer des Statistiques par Groupes en fonction de la Varit de
tomates. Pour ce faire, cliquez sur le bouton Par Groupes, et dans la bote de dialogue Par
Groupes, cliquez sur le bouton Variable(s) de Classement. Dans la bote de dialogue Slectionnez les Variables Par Groupes, slectionnez la Varit comme Variable Par Groupes.

50 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

Cliquez sur le bouton OK dans cette bote de dialogue puis sur le bouton OK dans la bote de
dialogue Analyses Par Groupes. Dans la bote de dialogue Statistiques par Groupes Rsultats, cliquez dans l'ordre sur les boutons 1) Synthse, 2) Analyse de Variance et 3) Tracs
d'Interactions.

Tous les rsultats sont envoys dans les dossiers respectifs, c'est--dire dans le dossier Ensemble des Groupes, Varit=Bonny, ou encore Varit=Marglobe.
Vous pouvez maintenant tudier ces rsultats pour tous les groupes ensemble ou en fonction
de la Varit ; comme vous pouvez le constater, la Mthode de Production semble avoir un

STATISTICA Prise en Main 51


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS


effet significatif sur le rendement (Poids) de la Varit=Marglobe, tandis que l'effet est
moindre pour la Varit=Bonny.

Dans STATISTICA, vous pouvez raliser des analyses par groupes ad-hoc depuis la plupart des
botes de dialogue de rsultats, et analyser les rsultats pour l'ensemble des groupes ou pour
des groupes particuliers, que vous dfinissez par une ou plusieurs variables de classement.
Cette fonctionnalit prsente un intrt majeur lors de la phase exploratoire de l'analyse des
donnes, et permet de comparer des groupes et vrifier la cohrence des rsultats selon les
groupes pour tout type d'analyse.
Avant de conclure cette section, penchons-nous un instant sur les aspects techniques de l'implmentation de cette fonctionnalit. Lorsque vous ralisez une analyse par groupes, comme
dans cet exemple, le programme va en fait r-excuter l'analyse pour chaque groupe, grce au
code STATISTICA Visual Basic qui est enregistr automatiquement lors des analyses interactives, et que vous pouvez enregistrer par ailleurs sous forme de macros comme indiqu plus
loin dans ce manuel (voir Chapitre 9 - STATISTICA Visual Basic, page 233). Lorsque vous
analysez de grosses volumtries (par exemple, de trs gros plans d'expriences dsquilibrs
ou des analyses complexes ncessitant des calculs itratifs), les analyses individuelles peuvent
prendre un certain temps, notamment en prsence de nombreux groupes distincts (par
exemple, imaginez un modle linaire gnralis complexe qui devrait tre estim pour une
centaine de groupes).
Il est donc fortement conseill de dmarrer la phase exploratoire de l'analyse des donnes en
calculant des statistiques descriptives lmentaires, des tables de frquences et des graphiques
pour bien comprendre la structure des donnes et identifier le nombre de groupes distincts
(combinaison des modalits des variables de classement) dans les donnes.

52 STATISTICA Prise en Main


Copyright StatSoft, 2010

STATISTICA Prise en Main 53


Copyright StatSoft, 2010

CHAPITRE 2 : EXEMPLES INTRODUCTIFS

54 STATISTICA Prise en Main


Copyright StatSoft, 2010

Outre la possibilit d'utiliser l'approche traditionnelle des feuilles de donnes STATISTICA,


vous pouvez ouvrir directement des fichiers Excel dans une fentre STATISTICA, puis raliser
vos analyses en utilisant un fichier de donnes Excel en source de donnes.
Dans le menu Fichier de STATISTICA, slectionnez la commande Ouvrir des Exemples pour
accder la bote de dialogue Ouvrir un Fichier de Donnes STATISTICA. Dans la liste droulante Fichiers de type situe en bas de cette bote de dialogue, slectionnez l'option Fichiers
Excel (*.xls, *.xlsx). Double-cliquez sur le dossier Fichiers de donnes, puis slectionnez le
fichier de donnes Weather report, qui est un fichier Excel. Cliquez sur le bouton Ouvrir afin
d'accder la bote de dialogue Ouverture de fichier. Cliquez sur le bouton Ouvrir sous la
Forme d'un Classeur Excel pour faire apparatre le fichier Excel.
Remarque : lorsque vous ouvrez une feuille de calcul Excel dans STATISTICA, les menus
d'Excel et de STATISTICA fusionnent, vous donnant accs aux principales fonctionnalits des
deux applications.

STATISTICA Prise en Main 55


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Dans le menu Statistiques, slectionnez la commande Statistiques lmentaires pour accder


la bote de dialogue Fichier Excel.

Cette bote de dialogue apparat ds que vous slectionnez une option dans le menu Statistiques, Data-Mining ou Graphiques et qu'une feuille de calcul Excel est ouverte dans STATISTICA. Remarque : STATISTICA dtermine les spcifications logiques, mais vous pouvez modifier ces options si besoin. Si la feuille de calcul Excel ne contient aucun nom de variables,
STATISTICA va affecter automatiquement des noms de variables, c'est--dire, Var1, Var2,

56 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


Var3, etc... Comme avec les feuilles de donnes STATISTICA, les analyses slectionnes vont
utiliser toutes les valeurs rencontres dans une colonne particulire, sauf si vous spcifiez des
filtres de slection. Dans cet exemple, cliquez sur le bouton OK dans la bote de dialogue
Fichier Excel afin d'accepter les valeurs par dfaut ; la bote de dialogue va se fermer, et laisser
place la bote de dialogue Visualiser/Modifier les Types de Colonnes.

STATISTICA vous permet de dfinir le type de donnes des diffrentes colonnes individuelles.
Il peut s'agir de valeurs numriques, textuelles, de valeurs numriques associes des valeurs
texte, ou de valeurs manquantes. Les cellules vierges d'une feuille de calcul Excel sont systmatiquement considres comme des valeurs manquantes, et lorsqu'une colonne dfinie comme une colonne numrique comporte des valeurs-texte, ces valeurs sont galement considres
comme des valeurs manquantes. STATISTICA propose des types de donnes par dfaut pour
toutes les colonnes sur la base des premires lignes de donnes rencontres (en fait, vous
pouvez dslectionner l'option Visualiser/Modifier le type des colonnes avant de procder
l'importation dans la bote de dialogue Fichier Excel avant de cliquer sur le bouton OK afin de
ne pas voir apparatre la bote de dialogue Visualiser/Modifier les Types de Colonnes). Vous
pouvez videmment modifier les types par dfaut si ncessaire : pour ce faire, slectionnez le
nom d'une colonne modifier, puis cliquez sur le bouton dition (ou double-cliquez sur le
nom de la colonne) afin d'accder la bote de dialogue Modifier le Type de la Colonne
Importer qui vous permet de spcifier le type de donnes contenues dans la colonne respective.

Pour cet exemple, acceptons les options par dfaut et cliquons sur le bouton Annuler dans la
bote de dialogue Modifier le Type de la Colonne Importer. Cliquez ensuite sur le bouton OK
STATISTICA Prise en Main 57
Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


dans la bote de dialogue Visualiser/Modifier les Types de Colonnes. Aprs avoir cliqu sur le
bouton OK, le Panneau de Dmarrage de l'analyse ou du graphique slectionn apparat (dans
cet exemple, le Panneau de Dmarrage du module Statistiques lmentaires) et vous permet
de raliser votre analyse comme vous en avez l'habitude.

STATISTICA vous permet d'accder la plupart des bases de donnes (notamment les systmes de gestion de bases de donnes les plus courants comme Oracle, SQL Server, Sybase,
etc...) grce STATISTICA Query, accessible par le menu Fichier - Donnes Externes ou par le
menu Donnes - Donnes Externes. Pour importer des donnes d'une base de donnes directement dans une feuille de donnes STATISTICA que vous pourrez ensuite enregistrer, utilisez
STATISTICA Query.
STATISTICA Query vous permet d'accder aisment vos donnes en utilisant les conventions
OLE DB. OLE DB est une architecture de base de donnes [base sur la technologie COM
(Component Object Model)] qui permet une intgration universelle des donnes au travers du
rseau de l'entreprise, des gros systmes vers les PC, quel que soit le type de donnes.
STATISTICA Query permet de requter plusieurs tables d'une base de donnes ; vous slectionnez les enregistrements (lignes) en spcifiant des instructions SQL. STATISTICA Query va
alors construire automatiquement l'instruction SQL mesure que vous slectionnez les composantes de la requte au moyen d'une interface graphique simple et/ou des options intuitives
dans les menus et botes de dialogue. Une connaissance approfondie du langage SQL n'est
donc pas ncessaire pour crer des requtes avances et puissantes, simplement et efficacement. Vous pouvez crer une ou plusieurs requtes sur diffrentes bases de donnes et rcuprer les donnes dans une mme feuille de donnes individuelle ; de cette manire, vous pouvez
tablir des connexions avec plusieurs bases de donnes externes simultanment.
Dans cet exemple, crons une nouvelle requte : dans le menu Fichier - Donnes Externes,
slectionnez la commande Crer une Requte. STATISTICA Query apparat et vous donne
accs la bote de dialogue Connexion une Base de Donnes.

58 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Dans cette bote de dialogue, vous pouvez choisir des connexions existantes des bases de
donnes ou en dfinir de nouvelles. Dans cet exemple, crons une nouvelle connexion une
base de donnes ; pour ce faire, cliquons sur le bouton Nouvelle afin d'accder la bote de
dialogue Proprits des Liaisons de Donnes.

Vous pouvez choisir l'un des fournisseurs OLE DB mis disposition par votre vendeur de base
de donnes, ou l'un des fournisseurs OLE DB installs par dfaut par Microsoft et compatible
avec votre systme de base de donnes. Dans cet exemple, nous utiliserons un fournisseur Jet
database install avec STATISTICA ; pour ce faire, slectionnez le fournisseur Microsoft Jet 4.0
OLE DB Provider puis cliquez sur le bouton Suivant >>. La bote de dialogue Proprits des
Liaisons de Donnes - onglet Connexion apparat.

STATISTICA Prise en Main 59


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Cliquez sur le bouton


situ ct du champ Slectionnez ou tapez un nom de base de
donnes afin d'accder la bote de dialogue Slectionnez une Base de Donnes Access.
Recherchez le dossier Exemples de STATISTICA, puis ouvrez le dossier Bases de Donnes, et
double-cliquez sur le fichier Donnes Process.mdb. Le nom du fichier et le chemin sont reports dans le champ Slectionnez ou tapez un nom de base de donnes.
Cliquez sur le bouton OK dans la bote de dialogue Proprits des Liaisons de Donnes afin
d'accder la bote de dialogue Ajouter une Connexion une Base de Donnes. Saisissez le
nom Donnes Process dans le champ d'dition Nom, puis cliquez sur le bouton OK. La bote
de dialogue Connexion une Base de Donnes apparat nouveau, avec la nouvelle connexion
Donnes Process que nous venons de dfinir. Slectionnez cette connexion, puis cliquez sur le
bouton OK. La fentre STATISTICA Query apparat avec toutes les tables de la base de
donnes dans le volet de gauche (voir page suivante).

60 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Cliquez avec le bouton droit de la souris sur la table RAWMAT, et dans le menu contextuel,
slectionnez la commande Ajouter afin d'ajouter la table correspondante dans le volet suprieur
droit de la fentre STATISTICA Query. Cliquez ensuite sur la table PERSONNEL, et faites la
mme opration.

Pour slectionner les champs intgrer dans la requte, cliquez avec le bouton droit de la
souris sur la table RAWMAT dans le volet suprieur droit, et slectionnez la commande Slectionner Tous les Champs dans le menu contextuel ; faites de mme pour la table PERSONNEL.
STATISTICA Prise en Main 61
Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


Remarque : les deux tables possdent un champ ID selon lequel vous pouvez effectuer une
jointure. Pour raliser la jointure, slectionnez le champ ID dans la table RAWMAT gauche,
et faites glisser ce champ sur le champ ID de la table PERSONNEL. Cliquez sur l'onglet
Aperu des Donnes dans le volet infrieur droit afin de voir un aperu des donnes rcupres par la requte :

L'onglet Syntaxe SQL permet de visualiser la syntaxe SQL de la requte.


Pour rcuprer les donnes dans une feuille de donnes STATISTICA, cliquez sur la petite
flche verte dans la barre d'outils de STATISTICA Query. La bote de dialogue Rcuprer des
Donnes Externes apparat ; elle vous permet de spcifier si la requte doit envoyer les donnes dans la feuille de donnes en cours ou au contraire dans une nouvelle feuille de donnes,
et d'ajuster d'autres paramtres de la requte. Slectionnez le bouton d'option Nouvelle Feuille
de Donnes, puis cliquez sur le bouton Excuter afin de lancer la requte. Aprs quelques
instants, les donnes apparaissent dans la feuille de donnes STATISTICA.

62 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Vous pouvez prsent analyser ces donnes l'aide des diffrents outils proposs dans STATISTICA. Remarque : la feuille de donnes conserve une connexion avec la base de donnes ;
vous pouvez donc r-excuter la requte tout moment en slectionnant la commande Actualiser les Donnes du menu Fichier - Donnes Externes ou en apputyant sur la touche F5 du clavier lorsque la feuille de donnes est active.

Dans la pratique, l'essentiel du temps ncessaire pour mener bien un projet d'analyse de
donnes ou de data mining est consacr la prparation des donnes. Il n'est pas rare d'allouer
jusqu' 90% du temps et des efforts ncessaires l'aboutissement d'un projet, au nettoyage et
la prparation des donnes.
Lorsque vous construisez des modles de prvision l'aide d'outils de data mining, ou mme
que vous calculez de simples statistiques descriptives (moyennes, tables de frquences), les

STATISTICA Prise en Main 63


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


rsultats des analyses peuvent tre errons s'il existe de nombreux doublons (par exemple, les
mmes numros de pices sont enregistrs plusieurs fois), ou que les donnes comportent des
points aberrants, des valeurs mal codifies (en dehors de l'intervalle de validit des donnes),
ou encore en raison d'un trop grand nombre de valeurs manquantes (vierges).
Le menu Donnes - Filtrage/Recodification des Donnes propose un certain nombre de commandes pour traiter rapidement et efficacement ces questions de qualit des donnes en vue de
raliser plus rapidement vos projets d'analyse de donnes ou de data mining.

Vous pouvez utiliser cette option lorsque vous pensez que votre fichier de donnes comporte
des doublons (c'est--dire, des enregistrements identiques/dupliqus).
Par exemple, supposons que dans une analyse visant identifier des comportements dmographiques de vos clients (profils), vous souhaitez comptabiliser chaque client individuellement ; mais votre base de donnes transactionnelle peut tre organise de telle sorte que chaque client apparat plusieurs fois. Dans ce cas, l'option Filtrage des Doublons va vous permettre de crer un fichier de donnes pour vos analyses, dans lequel chaque enregistrement sera
unique (c'est--dire, o chaque identifiant-client sera distinct, et n'apparatra qu'une seule fois).
Ouvrez le fichier de donnes Duplicates.sta.
Dans le menu Donnes - Filtrage/Recodification des Donnes, slectionnez la commande Filtrage des Doublons afin d'accder la bote de dialogue Filtrage des Doublons. Dans le cadre
Entre, le bouton Variables permet de spcifier les critres utiliser pour dterminer les doublons ; par exemple, cliquez sur le bouton Variables et dans la bote de dialogue de slection
des variables, slectionnez la variable Personne interroge de sorte rechercher les doublons
parmi toutes les personnes interroges. Cliquez sur le bouton OK dans la bote de dialogue de
slection des variables afin de revenir la bote de dialogue Filtrage des Doublons.

64 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Dans le cadre Entre, cliquez sur le bouton Observations afin d'accder la bote de dialogue
Filtres de Slection de la Feuille de Donnes qui offre un certain nombre d'options pour ne
slectionner que certaines observations spcifiques pour vos oprations de ddoublonnage.
Dans cet exemple, nous allons filtrer toutes les observations. Cliquez par consquent sur le
bouton Annuler dans la bote de dialogue Filtres de Slection de la Feuille de Donnes.
L'option Utiliser les noms d'observations n'est pas coche par dfaut ; nous allons conserver
cette option en l'tat ici. Lorsque cette option est coche, le ddoublonnage s'effectue galement sur les noms d'observations, c'est--dire que STATISTICA va considrer toutes les observations qui possdent le mme nom d'observation comme des doublons (sous rserve que ces
observations possdent galement des valeurs identiques sur les autres variables spcifies). Si
cette option n'est pas coche, les doublons sur les noms d'observations seront ignors.
Dslectionnez l'option Donnes dj tries (puisque notre fichier de donnes n'a pas t tri
sur de trs gros fichiers de donnes, il est plus efficace de trier pralablement vos donnes).
Dans le cadre Sortie, vrifiez que toutes les variables sont slectionnes (la mention TOUT
doit apparatre ct du bouton Variables). Cette option permet de spcifier les variables de la
feuille de donnes d'entre intgrer dans la feuille de donnes de sortie (filtre) ; l'option par
dfaut est TOUT.
Vrifiez que l'option Crer une nouvelle feuille de donnes est coche (par dfaut), et cochez
l'option Crer une feuille de donnes avec les doublons . Conservez les deux autres options
leur statut par dfaut : l'option Conserver l'ordre initial n'est pas coche [les nouvelles feuilles
de donnes seront tries selon la ou les variables slectionnes comme critres de ddoublonnage, c'est--dire dans cet exemple, selon la variable Personne interroge], et l'option Copier
la mise en forme est coche. Cliquez sur le bouton OK.
Deux nouvelles feuilles de donnes vont tre produites. L'une avec 10 variables et 51 observations qui contient les personnes interroges de la feuille de donnes originale sans doublons.

STATISTICA Prise en Main 65


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


L'autre feuille de donnes avec 10 variables et 9 observations ne contenant que les personnes
interroges en double dans la feuille de donnes originale.
Si vous examinez la feuille de donnes originale Duplicates.sta, vous constaterez que certains
noms de variables Personne interroge, Rgion et Couleurs sont mis en forme diffremment. Si vous examinez maintenant les deux nouvelles feuilles de donnes, vous verrez que le
nom des variables Personne interroge, Rgion et Couleurs possdent la mme mise en forme
dans les trois feuilles de donnes. STATISTICA va en fait crer les nouvelles feuilles de
donnes comme des sous-ensembles, et ainsi garantir que les proprits des variables de la
feuille de donnes initiale sont prserves dans les nouvelles feuilles de donnes.
Fermons prsent ces deux nouvelles feuilles de donnes, mais laissons la feuille de donnes
Duplicates.sta ouverte. Vous remarquerez que cette feuille de donnes comporte 10 variables
et 60 observations. Dans le menu Donnes - Filtrage/Recodification des Donnes, slectionnez
la commande Filtrage des Doublons afin d'accder nouveau la bote de dialogue Filtrage
des Doublons. Dans le cadre Entre, cliquez sur le bouton Variables, et dans la bote de dialogue de slection des variables, slectionnez la variable Personne interroge puis cliquez sur le
bouton OK. Dans le cadre Entre, dslectionnez l'option Donnes dj tries. Dans le cadre
Sortie, dslectionnez l'option Crer une nouvelle feuille de donnes. Cliquez sur le bouton
OK. La bote de dialogue va alors se fermer, et au lieu de crer une nouvelle feuille de donnes
sans les doublons, c'est la feuille de donnes Duplicates.sta qui va tre modifie directement.
Tous les doublons vont tre supprims, et notre feuille de donnes ne comportera plus que 10
variables et 51 observations.
Remarque : la fonctionnalit de ddoublonnage est insensible la casse (elle est indiffrente
aux lettres en majuscules et en minuscules) dans la recherche des doublons, c'est--dire, que si
vous avez deux personnes Dupont et DUPONT la seconde sera supprime.

Il n'est pas rare de rencontrer des variables (paramtres ou champs de donnes), notamment
dans le cadre de la modlisation prdictive, avec trs peu de donnes valides. Par exemple,
dans une base de donnes dclarative (o les rponses des clients sont facultatives) vous
pouvez demander le Revenu, mais il est trs probable que la majorit des clients ne vont pas
accepter de divulguer leur revenu, et la plupart des donnes de ce champ seront vierges (ou
manquantes) dans la base de donnes. Dans les donnes de production, vous pouvez enregistrer un paramtre spcifique dans un champ, mais le capteur peut tre dfectueux pendant un
certain temps et ce champ ne contiendra que des donnes manquantes (incorrectes).

66 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

L'utilisation de ce type de variables clairsemes dans une analyse, peut conduire des rsultats errons, ou mme vous empcher de construire des modles prdictifs (selon la manire
dont les valeurs manquantes seront gres dans les analyses). Par consquent, il est conseill
d'identifier ces variables parses en amont grce aux options de Filtrage des Donnes parses
(accessibles par le menu Donnes - Filtrage/Recodification des Donnes), et de les liminer
dans la perspective des analyses ultrieures.

Nous sommes galement parfois confronts un problme similaire ( celui des donnes parses) qui affecte frquemment la qualit des donnes, notamment sur des donnes (process) en
production industrielle, lorsque certaines variables (paramtres) enregistres et utilises dans
les analyses sont constantes, c'est--dire que toutes les valeurs sont identiques (invariantes).

STATISTICA Prise en Main 67


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Ces variables sont sans intrt pour la modlisation prdictive et les options Traitement des
Variables Invariantes (accessibles par le menu Donnes - Filtrage/ Recodification des Donnes)
vous permettent d'identifier automatiquement ces variables, et de les exclure des analyses.

Les valeurs extrmes ou points atypiques (galement appels points aberrants) peuvent
fortement influencer certaines analyses et altrer la prcision des modles de prvision (en
data mining). Il n'existe pas de dfinition universelle de ce qui rend un point atypique ou une
valeur extrme mais les outils graphiques de STATISTICA constituent une excellente manire d'identifier ce type d'observations inhabituelles (par exemple, vous pouvez crer des botes
moustaches des variables afin de reprer les observations extrmes sur les graphiques et les
identifier dans les donnes grce aux outils de balayage afin de les liminer de vos analyses).
Pour traiter automatiquement des listes entires de variables afin d'identifier et supprimer ces
points atypiques, les options de Recodification des Points Atypiques (accessibles par le menu
Donnes - Filtrage/Recodification des Donnes) vous donnent accs diffrents tests pour
identifier et remplacer les points aberrants (diverses approches permettent d'identifier les
valeurs extrmes).

68 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Vous pouvez remplacer les points aberrants par des valeurs manquantes ou des valeurs valides
(par exemple, remplacer par la borne du centile correspondant, etc...).

Il est ncessaire de traiter les valeurs manquantes ou incorrectes d'une manire cohrente avec
les objectifs des analyses. Dans certains cas, les valeurs manquantes ou incorrectes peuvent
renfermer une information utile concernant un processus ou une variable particulire. Ainsi, en
recherche marketing, il est courant que les personnes interroges refusent de communiquer des
informations personnelles relatives leur sant, leur patrimoine (par exemple, leur pargne),
etc..., et ces absences de rponse peuvent tre troitement corrles d'autres variables importantes de l'analyse (par exemple, le refus de rpondre des questions relatives au revenu peut,
en soi, tre un bon indicateur d'un revenu lev, si effectivement les individus en meilleure
sant dans l'tude tendent ne pas rpondre ces questions).

STATISTICA Prise en Main 69


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Les options de Traitement des Valeurs Manquantes accessibles par le menu Donnes Filtrage/
Recodification des Donnes vous permettent de recodifier vos valeurs manquantes de diverses
manires, de dfinir plusieurs codes de valeurs manquantes dans une mme variable (ces
valeurs peuvent alors tre recodifies selon le code des valeurs manquantes de la variable), ou
d'liminer les variables dpassant un certain pourcentage de valeurs manquantes.

Il n'existe pas de recette universelle pour remplacer les valeurs manquantes, et parfois, en
recodifiant les valeurs manquantes d'une variable particulire en une certaine valeur (par
exemple, la moyenne), les rsultats finaux peuvent se trouver biaiss. Par exemple, supposons
que dans une tude, les personnes ayant refus de communiquer leur revenu tendent plutt se
situer dans une tranche de revenus suprieure. Dans ce cas, le fait de remplacer les valeurs
manquantes par le revenu moyen pour ces individus (c'est--dire, remplacer les valeurs manquantes de la variable Revenu par la moyenne du revenu de l'chantillon tout entier) peut
conduire des conclusions errones.
STATISTICA propose une mthode trs efficace (applicable de trs gros fichiers de donnes
et de trs grosses bases de donnes) pour remplacer les valeurs manquantes par des valeurs
valides et cohrentes avec les autres observations de l'chantillon. Pour plus d'informations

70 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


concernant la mthode et l'algorithme des k plus proches voisins, voir le descriptif du module
Machine Learning de STATISTICA Data Miner dans le Manuel lectronique.
En rsum, l'utilisation des options Interpolation des Valeurs Manquantes (accessibles par le
menu Donnes - Filtrage/Recodification des Donnes) lors d'une premire lecture des donnes va
permettre l'algorithme des k plus proches voisins de tirer un sous-chantillon parmi les donnes
disponibles. Lors d'une seconde lecture du fichier, l'algorithme va alors remplacer les valeurs
manquantes par des valeurs observes (valides) dans des observations similaires de ce souschantillon (cette similarit est dtermine en tenant compte de toutes les autres variables
slectionnes). Ainsi, pour reprendre notre exemple, si les individus interrogs qui possdent les
revenus les plus levs sont moins enclins rvler leurs revenus, mais qu'ils rpondent sur
d'autres indicateurs de revenus levs (par exemple, s'ils possdent une voiture de luxe, davantage de mtres carrs dans leur habitation, etc...), l'algorithme des k plus proches voisins va
russir affecter avec prcision ces individus (qui ont refus de dvoiler leur revenu) la tranche de revenus suprieure.

L'algorithme des k plus proches voisins est un algorithme rapide et efficace, qui constitue une
excellente mthode pour remplacer les valeurs manquantes dans le fichier d'entre avec des
hypothses raisonnables reposant sur les donnes similaires de l'chantillon. Cette approche
ne fait aucune hypothse particulire quant la nature des relations entre les variables (c'est-dire qu'il n'est pas ncessaire d'estimer un modle pour chaque variable afin de prvoir les
valeurs manquantes), mais se contente d'utiliser les valeurs observes comme modle.

STATISTICA Prise en Main 71


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Vous pouvez dfinir de nouvelles variables dans vos feuilles de donnes STATISTICA en fonction d'autres variables, c'est--dire comme des transformations d'autres variables. Vous pouvez
galement vrifier, transformer et recodifier vos donnes dans une mme variable (par opposition un ensemble de formules de transformation qui sont appeles "Formules par Lot").
Toutes ces oprations sont possibles grce aux Formules de la Feuille de Donnes.
Pour accder aux Formules de la Feuille de Donnes, double-cliquez sur le nom d'une variable
dans une feuille de donnes STATISTICA afin d'accder la bote de dialogue des spcifications de la Variable. Vous pouvez saisir une formule dans le champ Description dtaille (tiquette ou formule avec Fonction), galement appel diteur de formules, situ en bas de la
bote de dialogue. Lorsque vous saisissez la description dtaille d'une variable dans l'diteur
de formules en la faisant commencer par le signe gal, STATISTICA va l'interprter comme
une formule et vrifier sa syntaxe.
Vous pouvez utiliser dans vos formules le nom des autres variables (MESURE1, PRIODE),
ou leur numro au moyen de la syntaxe Vx, o x reprsente le numro absolu de la variable.
Par exemple, V3 reprsente la variable numro 3. V0 a une signification particulire et reprsente les numros d'observations.
Les Formules de la Feuille de Donnes sont calcules ligne par ligne (observation par observation). Pour chaque observation de la feuille de donnes, la formule est calcule et les rfrences aux autres variables sont remplaces par les valeurs de l'observation correspondante.
Dans STATISTICA, l'accs alatoire des fonctions de la feuille de donnes permet aux formules
d'accder aux valeurs des variables depuis d'autres observations. Par exemple, la fonction
Dcalage va rfrencer une variable et la dcaler vers l'avant ou vers l'arrire selon un nombre
d'observations spcifique.
Le tableau ci-contre donne la liste de diverses Formules de la Feuille de Donnes avec leurs
rsultats.

72 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


Formule

Rsultat
Produit la valeur 1 si le texte B12C
apparat dans la variable 1 pour l'observation
=contains(v1, "B12C")
correspondante.
Produit la valeur 0 dans le cas contraire.
Calcule la moyenne des trois premires
=(v1+v2+v3)/3
variables.
Recodifie les observations 1-10 en 1. Toutes
=(v0<=10)*1+(v0>10)*2
les autres observations prennent la valeur 2.
=((v1=1) AND (v2=5))*5
Produit la valeur 5 si v1=1 et v2=5, sinon 0.
Produit les valeurs de la densit de
probabilit pour la distribution du t de
=student(v4,15)
Student sur la base des valeurs de la variable
v4 avec 15 degrs de libert.
=iif(V0 <= 1, V3, V3+LAG(VCUR, 1)) Effectue la somme cumule de la variable 3.
Remarque : cliquez sur le bouton
dans la bote de dialogue des spcifications de la
Variable pour accder la bote de dialogue Explorateur de Fonctions qui permet d'afficher la
liste complte des Formules et Oprateurs (=, +, >, and, or).

Ouvrez le fichier de donnes Adstudy.sta. Nous allons crer une nouvelle variable qui sera la
moyenne des variables 3 25 (c'est--dire, MESURE1 MESURE23).
Double-cliquez sur le premier intitul de variable vierge (aprs la variable 25). La bote de
dialogue Ajouter des Observations et/ou des Variables apparat. Cliquez sur le bouton OK afin
d'accepter les valeurs par dfaut, c'est--dire ajouter une variable.
La bote de dialogue des spcifications de la Variable apparat. Dans le groupe Format d'affichage, slectionnez le format Nombre. Dans le champ Description dtaille, situ en bas de la
bote de dialogue, saisissez la formule suivante :
=mean(v3:v25)

STATISTICA Prise en Main 73


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Cliquez ensuite sur le bouton OK. Une bote de dialogue va vous indiquer si la syntaxe est
correcte. Cliquez sur le bouton Oui pour poursuivre. La nouvelle variable va maintenant contenir la moyenne des variables 3 25, pour chacune des observations.
Dans la mesure o nous pouvons utiliser aussi bien des numros de variables que leur nom,
nous aurions galement pu crire la formule sous la forme suivante :
=mean(MESURE1:MESURE23)

Les formules de la feuille de donnes permettent de dfinir une formule pour une variable la
fois. Mais il existe des situations o nous devons calculer plusieurs formules pour diffrentes
variables simultanment. C'est ce que permettent de faire les formules par lot dans STATISTICA.
Ouvrez le fichier de donnes Characteristics.sta. Ce fichier contient diverses informations
relatives aux patients d'une tude. Dans cet exemple, nous allons 1) calculer l'Indice de Masse
Corporelle (IMC) et 2) convertir la taille en pouces (in), puis ajouter ces deux variables notre
fichier de donnes.
Dans le menu Donnes, slectionnez la commande Formules de Transformation par Lot afin
d'accder la bote de dialogue Formules de Transformation par Lot.

74 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

La seule diffrence de syntaxe entre les Formules de transformation par lot et les Formules de
la feuille de donnes concerne, d'une part, la possibilit de spcifier plusieurs formules simultanment dans l'option par lot, et, d'autre part, le fait de ne pas devoir commencer la formule
par un signe gal dans les formules par lot puisque les formules par lot ne sont associes
aucune variable spcifique (en fait, vous pouvez copier librement ces formules d'un fichier de
donnes l'autre) et vous devez par consquent dfinir explicitement la variable cible (par
exemple, v1=... ou Mesure3=...) afin que STATISTICA puisse identifier quelle variable chaque formule doit s'appliquer. Une option vous permet de ventiler les diffrentes formules par
lot dans les variables respectives de la feuille de donnes et de les enregistrer avec le fichier de
donnes, en remplaant les ventuelles Formules de la feuille de donnes qui pouvaient exister
jusqu'alors.
Ci-dessous les calculs utiliss pour calculer l'IMC et convertir la Taille (cm) en pouces, ainsi
que les formules saisir dans la bote de dialogue Formules de Transformation par Lot :
Calculs

Formule saisir dans la bote de dialogue


'IMC' = ('poids (kg)' / 'Taille (cm)' **2)*10000
'Taille (in)' = 'taille (cm)' / 2,54

Dans le champ Formules, saisissez la liste des formules de transformation appliquer la


feuille de donnes active. Sparez chacune des formules de transformation par un retour
chariot (appuyez sur la touche ENTRE de votre clavier).

STATISTICA Prise en Main 75


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Cliquez sur OK dans la bote de dialogue Formules de Transformation par Lot.


La bote de dialogue Ajouter de Nouvelles Variables ? apparat ; cliquez sur le bouton Oui afin
de confirmer l'ajout de deux nouvelles variables dans le fichier de donnes.
Une bote de dialogue va alors vous indiquer si la syntaxe des expressions saisies dans la bote
de dialogue Formules de Transformation par Lot est correcte. Si c'est le cas, cliquez sur le
bouton Oui pour raliser les calculs.
STATISTICA va alors calculer les formules et ajouter deux variables, IMC et Taille (in) la
feuille de donnes.

Les options de la bote de dialogue Formules de Transformation par Lot sont particulirement
bien adaptes (optimises) pour transformer de gros fichiers de donnes. Les formules sont
calcules les unes la suite des autres, de faon squentielle, ce qui permet d'utiliser les

76 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


rsultats d'une transformation de la liste en entre de la suivante. Ainsi, vous pouvez crer une
nouvelle variable l'aide d'une formule puis utiliser cette variable dans les formules suivantes.
Cliquez sur le bouton

dans l'angle suprieur droit de la bote de dialogue Formules de


afin d'accder la rubrique d'aide du Manuel lectronique de
STATISTICA relative ces options ainsi que diffrents liens vers des rubriques avec des
exemples de formules et les conventions de syntaxe.
Transformation par Lot

Diffrentes analyses dans STATISTICA proposent des graphiques et rapports de synthse


organiss dans un document unique (graphique). Dans les applications industrielles et Six
Sigma, ce type de graphique est parfois appel graphique de qualit Sixpacks dans la mesure
o il permet de synthtiser la qualit d'une variable individuelle par six graphiques et tableaux
distincts (ou moins).

STATISTICA offre de nombreux graphiques de ce type pour synthtiser rapidement et efficacement les statistiques descriptives lmentaires, corrlations, rsultats des analyses de capabilit
du processus ou de l'appareil de mesure, ou d'autres types d'analyses de donnes, comme
illustr ci-aprs.

STATISTICA Prise en Main 77


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Au cours des dernires annes, les industriels europens notamment ont dvelopp des normes
spcifiques pour calculer des indices de capabilit du processus permettant de tenir compte
explicitement de la variation alatoire et de la variation systmatique d'un processus au cours
du temps, ainsi que de distributions non-normales. Ces indices ont t par exemple largement
adopts dans l'industrie automobile et ses sous-traitants, et STATISTICA intgre ces nouvelles
normes.
Les indices de Capabilit du processus mesurent le nombre de fois o une distribution de
valeurs observes (normales) se situe entre les limites de spcification de la pice produite.
Ainsi, ces indices permettent de synthtiser la qualit d'un processus pour fabriquer des produits ou des pices conformes aux spcifications. Sans entrer dans le dtail, les normes DIN
(Deutsche Industrie Norm) 55319 et ISO 21747 dcrivent les rgles appliquer pour choisir
entre diffrents modles de distributions et la manire d'expliquer les variations du processus
au cours du temps.
Par exemple, si la distribution des points dans chaque chantillon est Normale, mais qu'il
existe une variation systmatique ou alatoire dans le temps mesure que nous tirons les
chantillons successifs, la distribution rsultante des valeurs ne sera pas Normale. Par consquent, dans de nombreux cas, les calculs de capabilit du processus reposant sur la loi normale
ne sont pas applicables. En outre, il est gnralement intressant d'identifier la dispersion ou
78 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


les tendances qui se dgagent au cours du temps, puisqu'elles peuvent mettre en vidence une
usure de la machine ou d'autres problmes relatifs au processus.
L'exemple suivant va illustrer pas--pas la manire de calculer des indices de capabilit du
processus conformes ces normes, et produire un rapport de synthse efficace dans un document unique.
L'exemple repose sur des donnes prsentes par Montgomery
(1985, page 177 ; 1991, page 234). Nous utiliserons ici le fichier de donnes Pistons.sta situ
dans votre rpertoire d'exemples. Plus prcisment, nous allons nous intresser au suivi de la
taille (diamtre) de segments de piston pour des moteurs automobiles. Nous avons tir des
chantillons de taille constante, constitus de cinq observations chacun, partir d'un processus
de production continu. Comme c'est le cas dans la plupart des processus de production continus, nous tirons les chantillons intervalles de temps dfinis, ce qui signifie que toute variabilit dans la qualit du processus au cours du temps va se retrouver dans la variabilit globale.
Dans le menu Fichier, slectionnez la commande Ouvrir des Exemples afin d'ouvrir le dossier
contenant les fichiers de donnes d'exemple ; ouvrez le rpertoire Fichiers de donnes puis
double-cliquez sur le fichier de donnes Pistons.sta (ou slectionnez-le et cliquez sur le bouton
Ouvrir).
Dans le menu Statistiques - Statistiques Industrielles & Six Sigma,
slectionnez la commande Analyse de Processus. Dans la bote de dialogue Procdures d'Analyse de Processus, slectionnez l'option Capabilit du Processus ISO/DIN (Capabilit dans le
Temps).

STATISTICA Prise en Main 79


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


Cliquez sur le bouton OK dans la bote de dialogue Procdures d'Analyse de Processus. Dans
l'onglet Base de la bote de dialogue ISO 21747 - Capabilit du Processus - Configuration, cliquez sur le bouton Variables. Dans la bote de dialogue Slectionnez les Variables (et ventuellement une variable de classement), slectionnez la variable Taille dans la liste Variables des
analyses, et la variable ch. dans la liste par ... (var. de classement/temporelle) puis cliquez sur
le bouton OK.
Dans la bote de dialogue ISO 21747 - Capabilit du Processus - Configuration, cliquez sur le
bouton Spcs du processus afin d'accder la bote de dialogue Saisissez ou modifiez les
limites de spcification qui vous permet de dfinir les limites de spcification du processus.
Les limites de spcification vous permettent d'tablir les valeurs maximum et (ou) minimum
autorises de la pice respective ; dans le cas prsent, tablissons les limites de spcification
infrieure et suprieure (LSI, LSS) 74 +/- 0,05 (LSI=73,95, LSS=74,05). Saisissez la valeur
74 dans le champ Nominal et la valeur 0,05 dans le champ Delta.

Cliquez sur le bouton OK pour valider ces valeurs.

80 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Cette bote de dialogue offre de nombreuses options permettant de modifier les rgles qui
s'appliquent pour slectionner la distribution la mieux adapte et le modle de rpartition
temporel des donnes en vue de calculer les indices de capabilit du processus appropris. Le
bouton
situ dans l'angle suprieur droit de la bote de dialogue ou la touche F1 vous
permettent d'afficher une rubrique du Manuel lectronique de STATISTICA contenant un
certain nombre d'informations relatives aux options de cette bote de dialogue. Par exemple,
cette rubrique dtaille les diffrences (mineures) entre les spcifications DIN et ISO.
Cliquez sur le bouton OK dans la bote de dialogue ISO 21747 - Capabilit du Processus
Configuration afin de raliser l'analyse sur la variable Taille.
Rsultats,

Dans la bote de dialogue ISO 21747 - Capabilit du Processus cliquez sur le bouton Synthse afin de produire les rsultats.

STATISTICA Prise en Main 81


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


Comme vous pouvez le constater, toutes les informations (requises par les normes ISO 21747
et/ou DIN 55319) sont rassembles sur un mme document, ce qui vous permet de juger rapidement si le processus est capable, non capable ou douteux.

Nous allons produire un autre exemple de ce type de synthse graphique multiple dans
STATISTICA en ralisant l'analyse d'un systme de mesure aux attributs.
D'une manire gnrale, tous les systmes de mesure utiliss en production doivent tre valids afin de garantir que nous mesurons les caractristiques de qualit avec une prcision et une
fiabilit suffisantes. Il est important de dterminer si une pice produite est de qualit suffisante pour tre accepte, ou si elle doit tre rejete ; en d'autres termes, notre systme de mesure doit nous permettre d'tablir un attribut simple du type acceptation/rejet.
Pour dterminer la qualit d'un systme de mesure, nous devons raliser priodiquement une
tude o nous appliquons notre systme de mesure (dcision d'acceptation/rejet) des pices
de rfrence possdant des carts connus aux spcifications souhaites. Ce processus est dcrit
dans la section correspondante du Manuel lectronique de STATISTICA ainsi que dans le
manuel de l'AIAG (Automotive Industry Action Group) Analyse du Systme de Mesure
(2000).
Cet exemple illustre l'analyse dcrite dans le manuel Analyse du Systme de Mesure, pages 8186.
Dans le menu Fichier, slectionnez la commande Ouvrir des
Exemples afin d'ouvrir le dossier contenant les fichiers de donnes d'exemple ; ouvrez ensuite
le rpertoire Fichiers de donnes et double-cliquez sur le fichier AttributeGageStudy.sta ou
slectionnez-le et cliquez sur le bouton Ouvrir. Ce fichier contient les donnes, dj synthtises en donnes d'acceptation, de l'tude du systme de mesure aux attributs telle qu'elle est
dcrite dans le manuel Analyse du Systme de Mesure (page 84)
Dans le menu Statistiques - Statistiques Industrielles & Six Sigma,
slectionnez la commande Analyse de Processus. Dans la bote de dialogue Procdures
d'Analyse de Processus, slectionnez l'option tude du systme de mesure aux attributs
(Mthode analytique) puis cliquez sur le bouton OK. Dans la bote de dialogue tude du
systme de mesure aux attributs (Mthode analytique), cliquez sur le bouton Variables.
Slectionnez la variable Pice dans la liste Numros de pices, la variable Rfrence dans la
liste Valeurs de rfrence et la variable Acceptation dans la liste Acceptation/Rponse puis
cliquez sur le bouton OK afin de fermer cette bote de dialogue et revenir la bote de dialogue
82 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


tude du systme de mesure aux attributs (Mthode analytique) . Dans le groupe Limite de tolrance pour les calculs, spcifiez la valeur 0,01 comme Limit infrieure, puis cochez l'option
Afficher l'autre limite (facultatif), et spcifiez la valeur 0,01 pour cette limite.

Nous souhaitons valuer la performance du systme de mesure pour un processus ou un type


de pice que nous produisons, la pice devant tre rejete (mise au rebut) ds lors que sa
vritable limite infrieure passe sous la barre 0,01 (exprime ici sous forme d'un cart la
spcification). Dans le fichier de donnes, les probabilits d'Acceptation reprsentent le nombre de mesures ralises sur les pices de rfrence, sur un total de 20 pices et mesures
chacune, et qui ont t dclares non-acceptables (c'est--dire, qui ont t mises au rebut).
Cliquez sur le bouton OK dans la bote de dialogue tude du systme de mesure aux attributs (Mthode analytique). Dans la bote de dialogue des Rsultats,
cliquez sur le bouton Synthse afin d'tudier les rsultats.

STATISTICA Prise en Main 83


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Tous les rsultats importants pour dterminer le biais et la rptabilit des mesures de notre
systme de mesure aux attributs sont rassembls sur une mme page. Pour plus d'informations
sur l'interprtation des statistiques et graphiques produits, voir le Manuel lectronique.

Il est de plus en plus courant en data mining de recourir des solutions reposant sur des processus analytiques simples, plutt que de crer des outils gnralistes toujours plus complexes.
L'approche propose dans STATISTICA Data Miner Plus vous permet, au travers d'une interface graphique intuitive, de mettre en uvre ces techniques, mme pour les novices en data
mining, puisqu'il s'agit simplement de suivre un processus analytique pas--pas. Grce des
botes de dialogue intuitives, vous pouvez raliser diffrentes tches de data mining, comme
de la rgression, de la classification ou du clustering. Vous pouvez galement construire
rapidement votre propre mthodologie pas--pas comme solution personnalise. Vous sauvegardez ensuite ces assistants pour les dployer sous forme de projets afin d'effectuer du
scoring sur de nouvelles donnes.

84 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


STATISTICA Data Miner Plus va dcomposer le processus de data mining en diffrentes
phases du requtage des bases de donnes externes au dploiement final des solutions qui
se rsument gnralement aux tapes suivantes.
1. Identifier les donnes utiliser pour l'apprentissage
Connexion des bases de donnes ODBC ou compatibles OLEDB
Connexion aux fichiers de donnes STATISTICA
2. Nettoyer les donnes et supprimer les prdicteurs redondants
Mthodes efficaces et flexibles d'chantillonnage des donnes (chantillonnage simple,
stratifi, systmatique, etc...)
Autres manires d'identifier et recodifier les valeurs manquantes
Identification des points aberrants
Transformation des donnes avant de passer l'tape suivante
Identification et suppression des prdicteurs redondants
3. Identifier les prdicteurs influents parmi de nombreux prdicteurs fortement lis la variable dpendante (de sortie ou cible)
Slection des prdicteurs sur de grosses volumtries (par exemple, plusieurs milliers de
variables)
Dtection des interactions importantes entre les prdicteurs l'aide de mthodes d'arbres
de dcision
4. Gnrer un ensemble de modles pertinents
Tirer parti des techniques de pointe disponibles dans STATISTICA Data Miner Plus pour
le data mining prdictif
Dlguer les tches ncessitant des calculs intensifs WebSTATISTICA, et librer votre
ordinateur en local pour d'autres tches
5. Raliser une valuation comparative automatique des modles pour identifier le modle
optimal, avec le meilleur compromis entre performances et complexit
6. Dployer le modle sur de nouvelles donnes l'aide des outils intgrs et efficaces de
dploiement
Cet exemple va mettre en vidence la manire de construire un projet de data mining
rapidement et efficacement l'aide de STATISTICA Data Miner Plus, mme si la meilleure

STATISTICA Prise en Main 85


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


solution au problme (prvision) n'merge qu'aprs avoir compar (automatiquement)
l'efficacit de diffrents algorithmes avancs de data mining.
Dans cet exemple, nous allons utiliser STATISTICA Data Miner
Plus pour des applications de scoring c'est--dire de notation statistique des emprunteurs.
Cet exemple repose sur le fichier de donnes CreditScoring.sta, contenant des donnes rparties sur 18 variables et 1.000 demandes passes de prts. Chaque dossier a reu le label bon
(700 observations) ou mauvais (300 observations). Nous souhaitons dvelopper un modle
de scoring que nous allons utiliser pour dterminer si un nouvel emprunteur sera un bon ou un
mauvais payeur et prendre ensuite la dcision approprie (acceptation sans condition, prise de
garantie ou refus), sur la base des valeurs d'une ou plusieurs variables prdictives. Nous avons
ajout une variable supplmentaire Apprentissage/Test dans le fichier de donnes dans une
optique de validation.

Pour utiliser STATISTICA Data Miner Plus pour cette application, suivez les instructions ciaprs. Ouvrez STATISTICA, puis dans le menu Data Mining, slectionnez la commande Data
Miner Plus - Mthodologie Pas--Pas afin d'accder la bote de dialogue Data Miner Plus.
Cliquez sur le bouton Nouveau afin de construire un nouveau projet.

86 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


Les grandes tapes de la mthodologie pas--pas se situent dans longlet tapes et sorganisent
autour des quatre grandes phases suivantes : Prparation des donnes, Donnes de lanalyse,
Redondance des donnes et Variable de sortie.
Il existe trois statuts possibles pour chaque tape (selon le degr davancement).
Chaque statut est symbolis par une icne : le symbole rouge correspond un statut en
attente, ce qui signifie que vous ne pouvez pas dmarrer ltape correspondante car elle dpend
dune tape prcdente qui na pas t finalise ; le symbole jaune correspond au statut prt,
c'est--dire que vous pouvez dmarrer l'tape correspondante car les tapes pralables ont t
ralises ; le symbole vert indique que l'tape correspondante est termine. Remarque : vous
devez cliquer sur le bouton tape suivante pour passer du symbole jaune (prt) au symbole
vert
(termin). La modification ne devient effective que si l'tape a t correctement
termine.

Dans l'onglet Prparation des donnes, cliquez sur le bouton


puis double-cliquez sur le fichier dexemple CreditScoring.sta
situ dans le rpertoire Fichier de donnes de STATISTICA. Cliquez sur le bouton Slectionner
les variables et dans la bote de dialogue Slectionnez les variables, choisissez :
Ouvrir un fichier de donnes

La variable 1 (Dossier de Prt) dans la liste de variables de Sorties catgorielles,


Les variables 3, 6 et 14 comme Entres continues (c'est--dire, prdicteurs continus),
Les variables 2, 4-5, 7-13 et 15-18 comme Entres catgorielles (c'est--dire, prdicteurs
catgoriels), et
La variable 19 (Ensemble) comme ch. de validation.

Cliquez ensuite sur le bouton OK.


STATISTICA Prise en Main 87
Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


Dans longlet Avanc de la bote de dialogue Data Miner Plus, cochez loption chantillonner
les donnes. Slectionnez le bouton d'option chantillonnage alatoire stratifi comme stratgie dchantillonnage afin de garantir que chacune des classes de la variable dpendante
Dossier de prt sera reprsente par un nombre sensiblement identique dobservations dans les
ensembles dapprentissage et de validation. Cliquez sur le bouton Autres options afin d'accder la bote de dialogue chantillonnage stratifi. Cliquez sur le bouton Variables de stratification, et slectionnez Dossier de Prt comme variable de stratification, puis cliquez sur le
bouton OK dans cette bote de dialogue et dans la bote de dialogue chantillonnage stratifi.
Cliquez sur le bouton tape suivante dans la phase de Prparation des donnes pour finaliser
cette tape (dans le champ situ ct de la phase Prparation des donnes, le symbole jaune
se transforme en symbole vert ).

Lorsque la phase de Prparation des donnes est termine, celle des Donnes de lanalyse apparat automatiquement. Dans longlet Donnes de lanalyse, cliquez sur le bouton chantillon
de validation, puis dans la bote de dialogue Spcifications de lchantillon de validation,
activez le bouton d'option Variable. Vrifiez que la catgorie Apprentissage apparat dans le
champ Code de lchantillon dapprentissage et que la catgorie Test apparat dans le champ
Code de lchantillon de validation.

Cliquez ensuite sur le bouton OK. Les modles vont tre ajusts sur la base de lchantillon
dapprentissage, puis tests laide des observations de lchantillon de validation. Nous pouvons tester la validit prdictive de chaque modle, et donc comparer les modles entre eux en
calculant des statistiques de qualit dajustement partir des observations nayant pas t
utilises dans les calculs dajustement des modles, pour les diffrents modles (algorithmes)
de data mining.

88 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


Nous allons calculer des statistiques descriptives pour toutes
les variables slectionnes dans lanalyse. Les statistiques descriptives nous donnent diverses
informations quant aux tendues et aux distributions des donnes utilises dans le projet.
Cliquez sur le bouton tape suivante pour finaliser cette tape.

La phase de Redondance des donnes apparat. Lobjectif de cette tape de Redondance des
donnes consiste liminer les prdicteurs fortement redondants. Par exemple, si nos donnes
contenaient deux mesures de poids, lune exprime en kilogrammes et lautre exprime en
livres, ces deux mesures seraient totalement redondantes.
Dans longlet Redondance des donnes, slectionnez le bouton d'option Coefficient de corrlation et spcifiez la Valeur du critre 0,8. Cliquez sur le bouton Appliquer le critre de redondance afin dliminer les prdicteurs redondants fortement corrls (r0,8). Dans la mesure o
il nexiste pas de redondance dans notre fichier de donnes, le message suivant va apparatre.

Cliquez sur le bouton OK puis cliquez sur le bouton tape suivante ; la phase de nettoyage et
de prparation des donnes dans la perspective de la construction des modles est prsent
termine.

Nous devons maintenant construire des modles prdictifs pour la variable de sortie de cet
exemple. Dans le champ des diffrentes tapes, le nud Variable de sortie possde une structure arborescente dont les nuds enfants sont les suivants : Variables influentes, Construction
des modles, valuation et Dploiement.

STATISTICA Prise en Main 89


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Le nud Variables influentes apparat automatiquement. Au cours


de cette tape, nous allons chercher rduire le nombre de dimensions de notre problme de
prvision, c'est--dire slectionner un sous-ensemble dentres vraisemblablement lies la
variable de sortie (dans notre exemple, le Dossier de prt) et qui ont, par consquent, le plus
de chances de produire des modles prdictifs pertinents et prcis. Ce type de stratgie analytique est parfois appel slection des prdicteurs.
Il existe deux stratgies possibles. Si vous slectionnez le bouton d'option Filtrage rapide des
meilleurs prdicteurs, le programme va retenir parmi plusieurs milliers dentres, celles qui
sont fortement lies la variable dpendante tudie. Si vous slectionnez le bouton d'option
Interactions (C&RT), ce sont des mthodes darbres de dcision qui permettront de dtecter les
interactions importantes entre les prdicteurs.
Pour cet exemple, slectionnez le bouton d'option Interactions (C&RT) comme stratgie de
slection des prdicteurs, puis cliquez sur le bouton Interactions (C&RT) afin d'accder la
bote de dialogue C&RT. Saisissez la valeur 12 dans le champ Nombre de prdicteurs extraire
et slectionnez la valeur gales dans le champ Probabilits a priori des classes.

90 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Cliquez sur le bouton OK dans cette bote de dialogue puis cliquez sur le bouton tape suivante pour terminer cette tape. Pour accder une synthse de lanalyse ralise jusqu prsent,
cliquez sur le bouton Rapport dans longlet tapes, puis slectionnez la commande Rapport de
synthse afin de produire le classeur des Rsultats.

Nous allons nous pencher prsent sur ces prdicteurs laide des diffrents algorithmes de
data mining et de machine learning proposs dans STATISTICA Data Miner Plus.
La bote de dialogue Data Miner Plus a t rduite pour
vous permettre de visualiser le classeur des Rsultats. Cliquez sur le bouton Data Miner Plus
situ dans la Barre dAnalyse afin de restaurer cette bote de dialogue. Le nud Construction
des modles est slectionn. Au cours de cette tape, vous pouvez construire un certain nombre de modles pour les entres slectionnes. Dans longlet Construction des modles, les
options C&RT, Forts alatoires, Boosting darbres, Rseaux de neurones et SVM vous permettent dessayer diffrents modles ou algorithmes sur vos donnes.
Vous pouvez raliser les calculs ncessaires la construction des modles prdictifs soit en
local (sur votre ordinateur) soit au moyen de WebSTATISTICA Server. Cette dernire option

STATISTICA Prise en Main 91


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


nest disponible que si vous disposez dun compte WebSTATISTICA Server valide et que vous
tes connect(e) linstallation sur le serveur de votre site. Dans cet exemple, cliquez sur le
bouton Construire les modles afin deffectuer les calculs en local sur votre ordinateur. Aprs
quelques instants, lissue de la phase de construction des diffrents modles, cliquez sur le
bouton tape suivante pour finaliser cette tape.
Le nud valuation est prsent slectionn.
Dans longlet valuation, cliquez sur le bouton Estimer les modles afin de raliser une valuation comparative des modles et identifier le modle le plus performant sur lchantillon de
validation. Dans notre cas, le meilleur modle est celui des Forts Alatoires qui prsente le
plus faible taux derreur (31,34%). En dautres termes, 68,66% des observations de lchantillon de validation sont correctement prvues par ce modle. Remarque : vos rsultats peuvent
diverger sensiblement dans la mesure o ces mthodes avances de data mining rpartissent
les donnes de faon alatoire entre les sous-ensembles lors de lapprentissage afin de produire
des estimations fiables des taux derreur.
Dans longlet tapes, cliquez sur le bouton Rapport, puis slectionnez la commande Rapport
de synthse afin de produire le classeur des Rsultats.

La feuille de donnes ci-dessus nous donne la performance de classification du meilleur modle sur lensemble de validation. Les colonnes reprsentent les effectifs prvus des classes,
tels quils sont prvus par le modle de Forts Alatoires, et les lignes reprsentent les classes
observes dans lchantillon de validation. Ce tableau rvle que 80 des 103 prts risques
ont t correctement classs, mais que 23 dentre eux ont t mal classs. Cette information est
gnralement beaucoup plus pertinente quun taux global derreur de classement, qui nous
indique simplement que la prcision globale est de 68,66%.

92 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


Restaurez la bote de dialogue Data Miner Plus, puis cliquez sur le bouton tape suivante afin
de finaliser cette tape.

La dernire phase de Dploiement va utiliser le meilleur modle et lappliquer sur de nouvelles


donnes afin de prvoir les bons et les mauvais emprunteurs. Dans notre cas, cest le modle de Forts Alatoires qui nous donne la meilleure prcision prdictive sur lchantillon de
validation par rapport aux autres modles. Cette tape nous permet par ailleurs de rintgrer
linformation relative au scoring (probabilits de classification dtermines par le meilleur modle, classifications prvues, etc...) dans la base de donnes, ou dans le fichier de donnes original.
Dans longlet Dploiement, cliquez sur le bouton Fichier de donnes pour le dploiement puis
double-cliquez sur le fichier de donnes CreditScoring.sta situ dans le dossier Fichiers de
donnes de STATISTICA. Pour les besoins de notre exemple, nous utiliserons le mme fichier
de donnes pour le dploiement du meilleur modle.

Cliquez sur le bouton tape suivante pour calculer les scores de ce fichier de donnes en
utilisant le meilleur modle. Le fichier avec les probabilits de classifications et de prvision
(intitul Synthse du Dploiement) se situe dans le rpertoire Dploiement du classeur du
projet illustr ci-aprs.
STATISTICA Prise en Main 93
Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Lobjectif de cet exemple est de dmontrer lefficacit du processus de fonctionnement du data


miner tel quil est implment dans STATISTICA Data Miner Plus. En seulement quelques
clics, le programme va vous guider tout au long du processus analytique de la dfinition des
donnes dentre et du problme analytique, au nettoyage et la prparation des donnes puis
la construction du modle, jusqu la slection du modle final et au dploiement.
La plupart des difficults statistiques du data mining sont rsolues de faon automatique dans
STATISTICA Data Miner Plus, ce qui permet de passer rapidement de la dfinition dun problme une solution, mme pour des novices ; le programme va appliquer et essayer un
grand nombre dalgorithmes avancs de data mining et dterminer automatiquement lapproche la plus pertinente.
La mthodologie implmente dans STATISTICA Data Miner Plus et son interface-utilisateur
permettent dexploiter pleinement la large gamme dalgorithmes de data mining proposs dans
le logiciel afin de rsoudre vos diffrentes problmatiques.

94 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

WebSTATISTICA Server tend les fonctionnalits de la plate-forme STATISTICA, en transformant plusieurs stations de travail individuelles en un systme collaboratif et puissant dintelligence. Lune des fonctionnalits majeures de larchitecture client-serveur de WebSTATISTICA
rside dans la possibilit dutiliser les ressources du serveur pour raliser diffrentes analyses
statistiques rptitives et potentiellement gourmandes en ressources (dlguer les tches
au serveur) tout en librant vos ressources en local pour dautres tches ncessitant une attention plus immdiate. Vous pouvez le faire au travers dun navigateur Internet (un client
lger) ou de la version bureautique de STATISTICA (client lourd, client WebSTATISTICA). La premire option vous permet dexcuter WebSTATISTICA Server depuis pratiquement
tout ordinateur au monde connect Internet, tandis que la seconde option ncessite linstallation de STATISTICA sur votre ordinateur. Ltroite intgration de WebSTATISTICA avec
lapplication STATISTICA vous permet de travailler dans une interface identique et sans rien
changer vos habitudes, que vous ralisiez vos oprations sur le client ou sur le serveur, en
combinant une interface-utilisateur plus rapide et plus riche, et toutes les composantes et outils
de la version bureautique de STATISTICA.
Tout dabord, assurez-vous davoir activ lintgration avec WebSTATISTICA. Dans
le menu Outils de STATISTICA, slectionnez la commande Options afin d'accder la bote de
dialogue Options. Cliquez sur le volet d'options Serveur / Web. Cochez loption Permettre une
Authentification Intgre. Le seul paramtre requis est le chemin vers le serveur WebSTATISTICA (ainsi que les paramtres de connexion, sils sont diffrents de ceux par dfaut). Contactez votre administrateur rseau pour obtenir ces paramtres. Vous pouvez Permettre une
Authentification Intgre si elle est autorise et active sur le serveur ; dans le cas contraire,
vous devrez saisir votre nom dutilisateur et votre mot de passe pour vous connecter au serveur
WebSTATISTICA.

STATISTICA Prise en Main 95


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Aprs avoir spcifi les paramtres dans ce volet d'options, cliquez sur le bouton OK.
Le menu Serveur apparat dans votre barre doutils STATISTCA. Dans le menu Serveur, slectionnez la commande Connexion et saisissez votre nom dutilisateur ainsi que votre mot de
passe si ncessaire. Si la connexion est russie, les commandes suivantes vont apparatre.

Les commandes Ouvrir, Enregistrer et Enregistrer Sous de ce menu vous permettent denregistrer le fichier actif sur le serveur ou de rapatrier un fichier pour louvrir en local. Les commandes explicites Envoyer un Fichier et Rapatrier un Fichier permettent de choisir les dossiers
souhaits sur le serveur ou sur le client.
96 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


Remarque : Dans la mesure o les analyses les plus gourmandes en temps et en ressources
dans les applications relles sont gnralement bases de grosses volumtries de donnes et/ou
font appel des algorithmes itratifs correspondant des composantes de STATISTICA qui ne
sont pas intgres dans toutes les configurations de STATISTICA, nous nous contenterons dun
exemple ne ncessitant pas de gros calculs. Toutefois, mme si une analyse particulire ne
ncessite pas de calculs intensifs, vous pouvez avoir besoin dexcuter une srie complexe de
tches, et lexcuter intervalles de temps rguliers. Dans ce cas, le planificateur de tches de
WebSTATISTICA vous permet denregistrer le script personnalis de ces tches (par exemple,
en enregistrant une filire danalyses lors dune session STATISTICA).
Enregistrons une macro danalyse, en suivant par exemple les tapes dcrites dans lExemple
2 : ANOVA (page 34).
Aprs avoir complt cet exemple, cliquez sur le bouton Options dans la bote de dialogue
ANOVA - Rsultats (il est situ en bas de la bote de dialogue) et dans la liste droulante, slectionnez la commande Crer une Macro. Dans la bote de dialogue Nouvelle Macro, acceptez
toutes les valeurs par dfaut, et cliquez sur le bouton OK. Vous pouvez tester la macro ainsi
produite en lexcutant (appuyez pour ce faire sur la touche F5) afin de vous assurer quelle
produit bien les rsultats escompts. Cliquez ensuite sur la fentre du code de la macro afin de
lamener au premier-plan.
Dans le menu Serveur, slectionnez la commande Dlguer une Tche afin d'accder la bote
de dialogue Dlguer une tche.

STATISTICA Prise en Main 97


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


Nous devons slectionner une tche dlguer au serveur (un script ou un projet Data Miner)
et ventuellement un jeu de donnes sur lequel nous allons appliquer cette tche (le jeu de
donnes est facultatif dans la mesure o les projets Data Miner peuvent intgrer leurs propres
jeux de donnes et les macros peuvent ouvrir explicitement des fichiers de donnes, voire ne
ncessiter aucun fichier de donnes).
Dans la mesure o nous avons un fichier de donnes actif (Adstudy.sta) ainsi quune macro STATISTICA ouverte (celle de notre analyse), la bote de dialogue Dlguer une tche propose de les
utiliser par dfaut pour dlguer la tche au serveur. Toutefois, dans cet exemple, nous allons
montrer comment rfrencer une tche et un fichier de donnes sur le serveur. Cette option prsente lavantage doffrir un espace de stockage centralis sur le serveur, ce qui peut tre particulirement intressant dans le cas de gros fichiers de donnes (ventuellement mis jour rgulirement) qui sont partags par diffrents utilisateurs.
Pour rfrencer un fichier de donnes sur le serveur, slectionnez le bouton d'option Slectionner un fichier de donnes stock sur le serveur afin d'accder la bote de dialogue Entrept
de WebSTATISTICA.

Larborescence de cette bote de dialogue reprsente lEntrept de WebSTATISTICA Server


(ventuellement restreint en fonction de vos autorisations spcifiques). Cliquez sur le dossier
Fichiers de donnes dans le volet de gauche, et slectionnez le fichier de donnes Adstudy.sta
dans le volet de droite (vous pouvez galement saisir le chemin dans le champ ddition situ
en bas de la bote de dialogue).
Cliquez sur le bouton OK dans la bote de dialogue Entrept de WebSTATISTICA puis dans la
bote de dialogue Dlguer une tche. STATISTICA va alors soumettre la tche au serveur, en
98 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


envoyant les fichiers ncessaires. Vous pouvez prsent passer dautres activits, tout en
vrifiant priodiquement le statut des tches dlgues au serveur en slectionnant la commande Statut des Tches du menu Serveur qui vous permet d'accder la bote de dialogue Statut
des Tches. Lillustration ci-dessous reprsente la bote de dialogue Statut des Tches avec un
certain nombre de tches que nous avons dlgues au serveur.

Vous pouvez mettre jour la liste des tches manuellement en cliquant sur le bouton Actualiser ou automatiquement en cochant loption Automatique dans la partie infrieure droite de
la bote de dialogue Statut des Tches. Les tches passent du statut En attente et En cours au
statut Termin ou Erreur.
Si votre tche choue, double-cliquez sur la ligne correspondante pour accder des informations complmentaires relatives cet chec. Une fois lerreur corrige (par exemple, aprs
mise jour du script SVB ou de lespace de travail du Data Miner), slectionnez la tche
ayant produit lerreur et cliquez sur le bouton Soumettre Nouveau.
lissue de lexcution russie de la tche, vous pouvez rcuprer les rsultats.
Remarque : dans la mesure o les rsultats sont stocks sur le serveur, ils sont accessibles
depuis toute station de travail STATISTICA, sous rserve de disposer des autorisations daccs
ncessaires. Le cadre Rsultats contient une option Tche et une autre option Donnes qui permettent respectivement de rapatrier la source de la tche et le fichier de donnes (ventuel) sur
le client. Si loption Navigateur est coche, les rsultats seront envoys dans votre navigateur,
et vous passerez en client lger. Cette option prsente un grand intrt lorsque vous attendez
de nombreux rsultats ; par exemple, si lanalyse produit de nombreux tableaux de donnes

STATISTICA Prise en Main 99


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


et/ou graphiques, vous pouvez parcourir le navigateur et ne slectionner que les rsultats que
vous souhaitez rapatrier. Loption Traceur offre un diagnostic de lexcution de la tche.
Dans la mesure o le serveur ne connat pas le moment o les rsultats dune tche deviennent inutiles, il vous appartient de les supprimer manuellement. Ainsi, pour gagner de lespace
disque sur le serveur, un message va apparatre chaque fois que vous rcuprez des rsultats
en vous demandant si vous souhaitez supprimer les rsultats aprs rcupration (sauf si loption Supprimer la tche aprs rapatriement est dslectionne).
Lorsque notre tche est termine, nous pouvons rcuprer les rsultats et fermer la bote de
dialogue Statut des Tches. Les rsultats sont strictement identiques, quils soient excuts en
local ou sur le serveur.

Dans les environnements rglements, les analyses ralises pour les applications de BPx
(Bonnes Pratiques de Fabrication, Bonnes Pratiques Cliniques, Bonnes Pratiques de Laboratoire) sont celles qui ont un impact direct sur la scurit des consommateurs, par exemple dans
les essais cliniques, la production ou le contrle qualit. Lorsquune entreprise ralise des
analyses pour une application de BPx, les agents en charge de la rglementation demandent
aux socits de prouver que les rsultats du systme danalyses valid (par exemple,

100 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


STATISTICA) sont sous contrle. STATISTICA, au travers de son Journal des vnements et
des fonctionnalits de verrouillage des feuilles de donnes/rapport, met votre disposition tous
les outils dont vous avez besoin pour rpondre ces exigences rglementaires.
Pour rpondre aux exigences de traabilit dans les applications de BPx, nous devons 1)
contrler les donnes dentre utilises pour les analyses (cest--dire, savoir qui a effectu les
modifications, quel moment, pour quelles raisons ; et quelles sont les anciennes et nouvelles
valeurs), 2) contrler les tableaux de rsultats et les graphiques (par exemple, prouver quils
nont pas t altrs depuis leur cration), et enfin 3) garantir la traabilit entre une version
particulire de la feuille de donnes dentre et les rsultats. STATISTICA fournit cette information au travers du Journal des vnements de la feuille de donnes et des Rapports BPx.
Voir aussi la section relative STATISTICA Gestion Documentaire dans le Manuel lectronique pour plus d'informations sur le versioning dans STATISTICA.

Ouvrez une feuille de donnes STATISTICA. Dans le menu Outils - Journal des vnements,
slectionnez la commande Paramtres pour accder la bote de dialogue Paramtres du Journal des vnements de la Feuille de Donnes. Cochez loption Autoriser lenregistrement des
vnements dans le Journal des vnements afin de dmarrer lenregistrement des vnements de la feuille de donnes actuelle dans le Journal des vnements.

Remarque : lorsque vous activez le Journal des vnements sur une feuille de donnes, cette
dernire passe automatiquement en mode direct, cest--dire que chaque modification de la
feuille de donnes est immdiatement crite sur le disque. Ainsi, lorsque vous activez le
Journal des vnements, vous ne pouvez plus annuler les modifications du fichier de donnes.
Cochez loption Exiger un commentaire de la part des utilisateurs pour chaque modification
afin de demander aux utilisateurs de justifier les modifications quils apportent la feuille de
donnes.
Le bouton Rinitialiser le Journal des vnements nest accessible que si vous avez dj activ
le Journal des vnements et que ce dernier comporte des informations. Si vous cliquez sur ce
STATISTICA Prise en Main 101
Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


bouton, le Journal des vnements sera rinitialis et toutes les informations quil contient
seront perdues. Vous devrez confirmer cette action avant suppression dfinitive des entres.
Lorsque vous rinitialisez le Journal des vnements, cette action est enregistre dans le nouveau Journal des vnements.
Cliquez sur le bouton OK dans la bote de dialogue Paramtres du Journal des vnements de
la Feuille de Donnes afin dactiver le Journal des vnements ; la bote de dialogue Indiquez
la raison de cette modification va alors immdiatement apparatre pour vous demander la raison de lactivation du Journal des vnements. Saisissez un commentaire puis cliquez sur le
bouton OK. Cliquez prsent sur lintitul de la dernire variable de la feuille de donnes avec
le bouton droit de la souris et slectionnez la commande Ajouter des variables dans le menu
contextuel. Dans la bote de dialogue Ajouter des Variables, acceptez les paramtres par dfaut
et cliquez sur le bouton OK. La bote de dialogue Indiquez la raison de cette modification va
nouveau apparatre ; vous devrez saisir un commentaire puis cliquer sur le bouton OK avant
que les modifications ne soient ralises. Lorsque le Journal des vnements est activ, chaque modification effectue sur la feuille de donnes est documente, et si loption Exiger un
commentaire de la part des utilisateurs pour chaque modification est coche, les commentaires
des utilisateurs sont galement reports dans le Journal des vnements.
Dans le menu Outils - Journal des vnements, slectionnez prsent la commande Afficher le
Journal afin d'accder la bote de dialogue Journal des vnements de la Feuille de Donnes.

Le Journal des vnements se prsente sous la forme dun tableau dinformations relatif aux
actions que vous suivez, avec notamment un numro squentiel, la date et lheure de la
modification, lordinateur partir duquel la modification a t ralise, le nom de lutilisateur,
la nature ainsi que la raison de la modification. Vous pouvez augmenter ou rduire la taille des
colonnes en utilisant les conventions Windows standard. Le Journal des vnements dune
feuille de donnes particulire est intgr et enregistr avec cette feuille de donnes.

102 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


Vous pouvez protger une feuille
de donnes laide dun mot de passe de manire ce que personne ne puisse louvrir sans ce
mot de passe. Seuls les utilisateurs connaissant le mot de passe peuvent ouvrir la feuille de
donnes. Ce nest quaprs avoir ouvert une feuille de donnes protge par un mot de passe
que vous pouvez modifier le mot de passe. linverse, le verrouillage de la feuille de donnes
permet de placer certaines parties de la feuille de donnes en lecture seule, ce qui vous permet
dinterdire toute modification de certains aspects particuliers de la feuille de donnes. La feuille de donnes reste accessible tout le monde, mais les parties verrouilles ne peuvent pas tre
modifies. Vous pouvez utiliser simultanment la protection par mot de passe et le verrouillage.

Ouvrez une feuille de donnes STATISTICA. Dans le menu Fichier, slectionnez la commande
Proprits afin d'accder la bote de dialogue Proprits du Document. Slectionnez longlet
Mot de passe.

Saisissez un mot de passe dans le champ Mot de Passe du Document, puis cliquez sur le bouton OK. La bote de dialogue Mot de Passe apparat et vous permet de confirmer le mot de
passe ; les mots de passe sont sensibles la casse et il est donc important de respecter les
majuscules et les minuscules.

STATISTICA Prise en Main 103


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


Cliquez sur le bouton OK dans la bote de dialogue Mot de Passe, et fermez le fichier de donnes aprs lavoir enregistr. Lors de la prochaine ouverture du fichier de donnes, la bote de
dialogue Mot de Passe va apparatre et vous devrez saisir le mot de passe pour pouvoir ouvrir
la feuille de donnes.

Afin de respecter les exigences de contrle et de rgulation, il est ncessaire de vrifier la


fiabilit des donnes dentre. Les options de verrouillage de la feuille de donnes vous permettent dinterdire la modification de certains, voire de tous les aspects de la feuille de donnes, de la simple apparence des donnes (cest--dire, les lments daffichage, les spcifications des variables) jusquaux donnes proprement dites, filtres de slection ou pondrations
dfinies dans la feuille de donnes. Bien videmment, il est parfois ncessaire dapporter certaines modifications (par exemple, en cas derreur de saisie). Le Journal des vnements des
feuilles de donnes STATISTICA permet, lorsquil est activ, denregistrer chacune des modifications ralises sur la feuille de donnes.
Dans STATISTICA Entreprise, seuls les utilisateurs disposant des autorisations Administrateur
du Systme peuvent modifier les paramtres du Journal des vnements. Pour plus d'informations, voir la section relative STATISTICA Entreprise dans le Manuel lectronique.
Dans le menu Outils de la feuille de donnes, slectionnez la commande Verrouillage afin d'accder la bote de dialogue Verrouillage de la Feuille de Donnes.

Cette bote de dialogue vous permet de spcifier les aspects de la feuille de donnes que vous
souhaitez verrouiller. Si un utilisateur cherche modifier un aspect verrouill, un message va
lui indiquer que la feuille de donnes est verrouille.
Cochez loption Donnes de la feuille de donnes afin dinterdire toute modification des valeurs contenues dans la feuille de donnes. De cette manire, personne ne pourra modifier les
donnes, ni le code des valeurs manquantes. Personne ne pourra non plus effectuer dopration
de gestion des donnes susceptible daltrer la feuille de donnes (par exemple, changer le
104 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


type de donnes ou la taille des variables textuelles). Si cette option nest pas coche, les utilisateurs pourront modifier les donnes en toute libert (par exemple, en mettant jour des
requtes et des Formules de la Feuille de Donnes ou en saisissant de nouvelles valeurs).
Cochez l'option lments d'affichage (police, mise en forme, etc...) afin dinterdire toute modification au niveau des polices et formats utiliss dans la feuille de donnes. Si cette option est
coche, les options permettant de modifier la taille de la police, sa couleur, son type ainsi que
ses attributs (c'est--dire, gras, soulign) seront grises. En outre, les options permettant d'appliquer les diverses mises en forme de la feuille de donnes ( laide du Gestionnaire de Mise
en Forme, accessible par le menu Format - Feuille de Donnes) ne seront pas accessibles.
Cochez l'option Filtres de slection et pondrations afin d'interdire toute modification des
filtres de slection et des pondrations dans la feuille de donnes verrouille. Si cette option
est coche, les utilisateurs ne pourront pas modifier le statut (actif ou inactif) des filtres de
slection ni les conditions de filtrage actuellement dfinies. La plupart des options de l'onglet
Filtres de slection de la bote de dialogue Filtres de Slection de la Feuille de Donnes apparatront grises ; cette option est sans effet sur les options des autres onglets de cette bote de
dialogue (par exemple, cration de sous-ensembles, format spcifique pour identifier les observations slectionnes dans la feuille de donnes). Les options relatives la bote de dialogue
Pondrations seront galement inaccessibles.
Cochez l'option Spcification des variables afin d'interdire toute modification au niveau des
spcifications des variables (par exemple, type de mesure, code des valeurs manquantes, format d'affichage, description dtaille). Si cette option est coche, les utilisateurs pourront accder aux botes de dialogue individuelles de spcification des variables (accessible en doublecliquant sur le nom dune variable) ainsi qu' la bote de dialogue de Spcification de Toutes
les Variables ; en revanche, les options permettant de modifier ces spcifications seront grises.
Cochez l'option Journal des vnements afin dinterdire toute modification au niveau des
paramtres du Journal des vnements. Si cette option est coche, les utilisateurs ne pourront
pas modifier les paramtres du Journal des vnements.
Saisissez un mot de passe afin de verrouiller et dverrouiller la feuille de donnes, puis confirmez-le (en respectant les majuscules et les minuscules) et cliquez sur le bouton OK. Bien qu'un
mot de passe ne soit pas ncessaire, il est fortement conseill d'en spcifier un. Si vous ne spcifiez aucun mot de passe, n'importe quel utilisateur pourra dverrouiller les fonctionnalits de
la feuille de donnes en dslectionnant simplement les options coches. Remarque : si vous
avez dj verrouill la feuille de donnes laide dun mot de passe, vous devrez saisir le bon
mot de passe avant de pouvoir modifier ces paramtres de verrouillage.

STATISTICA Prise en Main 105


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


Tentez prsent de modifier la feuille de donnes ; un message va vous indiquer que lopration ne peut aboutir puisque la feuille de donnes est verrouille.

Pour respecter les exigences rglementaires, il est galement ncessaire de garantir que les
rsultats reports sont sous contrle. STATISTICA offre diffrentes options pour crer des rapports BPx. En mode BPx, tous les rsultats sont envoys dans un rapport et la fentre est verrouille. Toutes les options permettant de supprimer (Couper, Extraire - Original, Effacer, etc...)
ou dajouter des rsultats (Coller, Insrer) sont inactives. STATISTICA permet galement de
reporter la date de cration dans tous les rapports ainsi que lheure laquelle les diffrents
rsultats ont t produits partir des botes de dialogue de rsultats. Laspect et le contenu des
indicateurs de date et dheure de cration sont entirement paramtrables et vous pouvez ajouter le nom de lutilisateur et de lordinateur en plus de la date et de lheure. Par consquent, en
mode BPx, vous savez quand les rsultats ont t produits et par qui. Vous avez galement
lassurance quaucun rsultat na t supprim.
Le mode GxP offre galement une option de traabilit. Lorsque vous excutez STATISTICA
en mode BPx, le programme va vrifier automatiquement si le Journal des vnements de la
feuille de donnes est activ. Si tel est le cas, STATISTICA va inclure le nom ainsi que le
numro de version de la feuille de donnes dans le rapport. Les numros de version ne sont
pas systmatiquement disponibles, par exemple, si Journal des vnements nest pas activ ou
si les rsultats ont t produits partir dune Interface Directe avec une Base de Donnes.
Dans ce cas, STATISTICA indiquera la raison pour laquelle un numro de version nest pas
disponible.

Dans le menu Outils, slectionnez la commande Options afin d'accder la bote de dialogue
Options. Slectionnez le volet d'options Analyses/Graphiques - Gestionnaire de Sorties. Dans
la liste droulante Rapport STATISTICA, slectionnez lune des options Envoyer dans Diffrents Rapports (un par Analyse/Graphique) ou Rapport Commun (identique pour toutes les
Analyses/Graphiques). Les options du cadre Verrouillage du rapport (Options des BPx, Bonnes
Pratiques) deviennent alors accessibles.
Cochez loption Verrouillage afin de garantir que les documents ne pourront pas tre supprims du rapport. Les commandes Couper, Coller, Effacer, Renommer et Proprits de lObjet

106 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


seront grises dans le menu contextuel du rapport. De mme, les commandes Extraire - Original
ainsi que toutes les commandes du menu Insertion seront indisponibles.

Pour intgrer un indicateur de cration en haut du rapport, vous pouvez accepter le format par
dfaut dans le champ Indicateur de Cration ou crer votre propre indicateur. Vous pouvez utiliser les codes suivants dans ce champ : &[Date], &[Heure], &[Utilisateur] et &[Ordinateur].
Vous pouvez galement saisir du texte librement pour le faire apparatre en tte du rapport.
Pour reporter lheure de cration au dessus de chaque objet que vous ajoutez dans le rapport,
vous pouvez accepter le format par dfaut dans le champ Indicateur horaire, ou crer votre propre indicateur. Vous pouvez utiliser les codes suivants dans ce champ : &[Date], &[Heure],
&[Utilisateur] et &[Ordinateur].
Cliquez sur le bouton OK dans la bote de dialogue Options, puis excutez lanalyse de votre
choix, par exemple, utilisez le module Statistiques lmentaires pour crer une feuille de donnes de synthse des Statistiques Descriptives. Aprs avoir cliqu sur le bouton Synthse, les
rsultats seront envoys dans un rapport verrouill qui indiquera lauteur, ainsi que la date et
lheure de cration, etc..., des analyses.

STATISTICA Prise en Main 107


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

La gamme Entreprise de STATISTICA ajoute un certain nombre de fonctionnalits intressantes pour le travail collaboratif, ladministration centralise, les personnalisations du systme, et
dune manire gnrale, toutes les fonctionnalits ncessaires ds que vous utilisez STATISTICA grande chelle dans lentreprise.
Le Gestionnaire STATISTICA Entreprise est une composante du systme STATISTICA Entreprise qui permet aux utilisateurs de paramtrer diffrents aspects du systme Entreprise, notamment ladministration des utilisateurs, larborescence, la maintenance des connexions avec
les bases de donnes, la configuration des donnes et la configuration des analyses.
Dans cet exemple, nous allons :
1. Crer un nouvel utilisateur
2. Crer un nouveau groupe
a. Attribuer des autorisations ce groupe
b. Ajouter lutilisateur (voir le point n1) ce groupe

108 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


3. Crer larborescence
4. Crer une connexion avec une base de donnes
5. Crer une configuration de donnes source
6. Crer une configuration danalyse
7. Excuter lanalyse

Avant de dmarrer cet exemple, vous devez savoir une chose. Dans le menu Affichage du Gestionnaire STATISTICA Entreprise, vous pouvez afficher lArborescence ou au contraire Afficher les Objets. Dans lArborescence, tous les objets, par exemple, Donnes Source et Analyses, sont attachs des dossiers. Si vous choisissez dAfficher les Objets, ces derniers seront
regroups dans des dossiers en fonction de leur catgorie respective. Dans cet exemple, nous
utiliserons un affichage sous forme dArborescence.

Dmarrez le Gestionnaire STATISTICA Entreprise et connectez-vous avec le nom dun utilisateur appartenant au groupe par dfaut des Administrateurs. Dans lArborescence, cliquez sur le
signe situ ct du rpertoire Administration des Utilisateurs afin de le dvelopper, puis
slectionnez le dossier Utilisateurs.
Dans la page des proprits (le volet de droite), cliquez sur le bouton Nouvel Utilisateur afin
daccder aux options permettant de crer le nouvel utilisateur. Dans le champ Nom, saisissez
le nom Nouvel Utilisateur 1 puis dfinissez un mot de passe et confirmez ce mot de passe.

STATISTICA Prise en Main 109


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Cliquez sur le bouton Enregistrer les Modifications

dans la barre doutils.

Nous allons maintenant crer un nouveau groupe, attribuer des droits daccs ce groupe et lui
affecter notre nouvel utilisateur pour lui permettre de se connecter au Gestionnaire STATISTICA Entreprise. De cette manire, nous pourrons raliser nos futures modifications des droits
daccs sur le groupe et non sur les utilisateurs individuels, ce qui va simplifier la maintenance
de STATISTICA Entreprise.

Dans le rpertoire Administration des Utilisateurs, slectionnez le dossier Groupes, puis dans
la page des proprits, droite, cliquez sur le bouton Nouveau Groupe afin d'accder aux
options permettant de crer le nouveau groupe. Dans le champ Nom, saisissez l'intitul
Nouveau Groupe 1. Dans le cadre Membres du Groupe, cochez la case situe ct du Nouvel
Utilisateur 1. Nous allons ainsi affecter lutilisateur prcdemment cr notre nouveau groupe. Dans le cadre Droits dAccs du Groupe, cochez les cases situes ct des autorisations
Administrateur Analyses et Utilisateur Web. Dans lArborescence, cliquez sur le signe plus
110 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


situ ct du Nouveau Groupe 1 pour dvelopper ce nud, puis cliquez sur Modules analytiques. Cliquez sur le bouton Slectionner Tout afin de slectionner lensemble des modules de
la liste des Modules analytiques disponibles.

Les utilisateurs de ce groupe pourront ainsi se connecter STATISTICA, la fois en version


Web et bureautique, pour excuter leurs analyses et produire leurs rapports.
Cliquez sur le bouton Enregistrer les Modifications

dans la barre doutils.

Nous avons maintenant cr les stratgies de scurit ncessaires pour cet utilisateur et ce
groupe afin de leur permettre dexcuter leurs analyses et leurs rapports. Lorsque nous serons
amens crer nos diffrents objets de configuration (donnes source, analyses et rapports) au
cours des diffrentes tapes successives, nous pourrons associer ces objets de configuration
ce groupe afin de permettre aux seuls utilisateurs de ce groupe de les excuter.

STATISTICA Prise en Main 111


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Nous allons prsent crer un dossier dans lArborescence pour contenir les diffrents objets
de configuration de cet exemple (donnes source, analyses et rapports). Dans lArborescence,
cliquez sur le signe plus
situ ct du rpertoire Arborescence afin de le dvelopper.
Cliquez avec le bouton droit de la souris sur le dossier STATISTICA Entreprise puis dans le
menu contextuel, slectionnez la commande Nouveau Dossier. Dans le champ ddition Nom
du dossier de la page des proprits, saisissez Nouveau Dossier 1 comme nom du nouveau
dossier.

Cliquez sur le bouton Enregistrer les Modifications


dans la barre doutils afin de valider vos
changements. Ce dossier va contenir tous les objets de configuration (donnes source, analyses
et rapports) que nous allons maintenant crer.

112 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Cliquez avec le bouton droit de la souris sur le rpertoire Connexions aux Bases de Donnes
dans larborescence, puis slectionnez la commande Nouvelle Connexion une Base de Donnes dans le menu contextuel afin d'accder la bote de dialogue Proprits des Liaisons de
Donnes.

Slectionnez loption Microsoft Jet 4.0 OLE DB Provider puis cliquez sur le bouton Suivant (si
ce fournisseur nest pas accessible dans la liste, rendez-vous sur le site Web de Microsoft
l'adresse http://msdn2.microsoft.com/en-us/data/aa937712.aspx#MDAC pour installer le fournisseur MDAC ou Jet le plus jour avant de recommencer cette tape). Dans longlet Connexion, cliquez sur le bouton situ ct du champ Slectionnez ou tapez un nom de base de
donnes, puis recherchez le dossier dinstallation de STATISTICA (par dfaut C:\Program
Files\StatSoft\STATISTICA). Double-cliquez sur le dossier Exemples puis sur le dossier Bases
de Donnes, et slectionnez le fichier Donnes Process.mdb puis cliquez sur le bouton Ouvrir.

STATISTICA Prise en Main 113


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Dans longlet Connexion, cliquez sur le bouton Tester la Connexion. Le message Test de
connexion russi devrait alors apparatre (si ce nest pas le cas, vrifiez vos droits daccs sur
le fichier ainsi que votre installation MDAC).

Cliquez sur le bouton OK dans cette bote de dialogue, puis nouveau sur le bouton OK dans la
bote de dialogue Proprits des Liaisons de Donnes. Dans la page des proprits, saisissez le
libell Nouvelle Connexion 1 dans le champ Nom.

114 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Cliquez sur le bouton Enregistrer les Modifications

dans la barre doutils.

Puisque la connexion avec la base de donnes Donnes Process est cre, nous pouvons maintenant crer la configuration des donnes sources afin de rapatrier les donnes depuis la base
de donnes.

Cliquez avec le bouton droit de la souris sur le rpertoire Nouveau Dossier 1 dans larborescence, et slectionnez la commande Nouvelles Donnes Source dans le menu contextuel. Dans
la page des proprits, saisissez Nouvelles Donnes 1 dans le champ Nom. Cliquez sur la
flche de la liste droulante Connexion, et slectionnez la connexion Nouvelle Connexion 1.

STATISTICA Prise en Main 115


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Cliquez sur le bouton tape Suivante dans langle infrieur droit de la page des proprits afin
d'accder aux options de la nouvelle requte.
Remarque : si le bouton tape Suivante napparat pas dans votre installation, cochez la commande Afficher le Bouton tape Suivante dans le menu Affichage du Gestionnaire STATISTICA Entreprise.

116 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Cliquez sur le bouton Assistant SQL afin d'accder la bote de dialogue Nouvelle Requte qui
va apparatre dans STATISTICA.

Glissez la table RAWMAT, depuis le volet de gauche, vers le volet suprieur droit de visualisation, puis slectionnez dans cet ordre les champs ID, OPRATEUR, SITE et HAUTEUR.

STATISTICA Prise en Main 117


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Slectionnez longlet Aperu des Donnes dans laffichage des proprits de la requte (le
volet infrieur droit) puis cliquez sur le bouton Actualiser de la barre doutils (matrialis
par un point dexclamation rouge). Le programme va alors tester la requte pour vrifier que
des valeurs sont bien rcupres par la requte que nous venons de dfinir.

Cliquez sur le bouton Rcuprer les Donnes dans STATISTICA


de la barre doutils (la
flche verte) afin de renvoyer cette requte vers la configuration des donnes source. Lorsque
vous tes invit(e) tester linstruction SQL, cliquez sur le bouton Oui, afin de dterminer les
Colonnes OLE DB.

118 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Aprs avoir mis la ligne ID en surbrillance, cliquez sur le bouton dition afin daccder aux
options ddition de la colonne ID. Cliquez sur la liste droulante situe ct du champ Mise
Jour Automatique et slectionnez loption Premire colonne de mise jour. De cette manire,
toute modification dans la colonne ID sera dtecte, et cette colonne fera office de premire
cl de tri du fichier de donnes.

STATISTICA Prise en Main 119


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Cliquez sur le bouton tape Suivante afin de modifier la colonne OPRATEUR. Cliquez sur le
bouton Filtrage afin daccder aux options de filtrage et cochez loption Permettre le filtrage
sur ce champ afin dautoriser le filtrage sur la colonne OPRATEUR.

120 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Le bouton tape Suivante vous permet de revenir aux options ddition de la colonne OPRATEUR. Cliquez sur le bouton tape Suivante afin daccder aux options ddition de la colonne SITE. Cliquez sur le bouton Filtrage et cochez nouveau loption Permettre le filtrage sur
ce champ afin dautoriser le filtrage sur la colonne SITE. Cliquez sur le bouton tape Suivante
afin de revenir aux options ddition de la colonne SITE, puis cliquez sur le bouton tape
Suivante afin de modifier la colonne HAUTEUR. Cliquez sur la liste droulante Type de Cible,
et slectionnez loption Caractristique aux Mesures. De cette manire, nous indiquons au programme que cette colonne sera disponible pour les analyses de MSP (c'est--dire que cette
colonne contient les donnes que nous souhaitons analyser, par exemple, sous forme de carte
de contrle en temps rel).

STATISTICA Prise en Main 121


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Cliquez ensuite sur le bouton tape Suivante afin daccder aux options des Droits dAccs de
cet objet. Dans la liste Groupes et Utilisateurs Disponibles, slectionnez le Nouveau Groupe 1,
puis cliquez sur le bouton suprieur en forme de flche
afin de dplacer le Nouveau Groupe
1 dans la liste Droits dAccs. De cette manire, cette configuration de donnes source pourra
tre excute (mais pas modifie) par tous les utilisateurs du groupe Nouveau Groupe 1.
Cliquez sur le bouton Enregistrer les Modifications de la barre doutils afin de valider notre
nouvelle configuration de donnes source dans le Gestionnaire STATISTICA Entreprise.

prsent que nos donnes source sont configures pour extraire les donnes de la base de
donnes Donnes Process.mdb, nous allons devoir configurer une analyse afin de pouvoir analyser ces donnes.
Cliquez avec le bouton droit de la souris sur le rpertoire Nouveau Dossier 1 dans larborescence, et slectionnez la commande Nouvelle Analyse dans le menu contextuel afin d'accder
la bote de dialogue Slectionnez les Donnes Source. Slectionnez ensuite lobjet Nouvelles
122 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


Donnes 1 puis cliquez sur le bouton OK. Si une bote de dialogue apparat avec la phrase
suivante Si vous cochez cette option, les droits daccs de cet lment (Analyse) seront
remplacs par ceux de llment slectionn (Donnes Source), cliquez sur le bouton OK.
Par dfaut, le nom de lanalyse est identique celui des donnes source. Vous pouvez modifier
ce nom en saisissant le nom de votre choix dans le champ Nom de la page des proprits. Dans
cet exemple, appelons lanalyse, Nouvelle Analyse 1.

Cliquez sur le bouton tape Suivante afin daccder la page des proprits des Caractristiques MSP, puis nouveau sur le bouton tape Suivante afin d'accder la page des proprits
de la Caractristique MSP qui nous intresse, HAUTEUR.

STATISTICA Prise en Main 123


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Dans la page des proprits de la Caractristique MSP - HAUTEUR, changez le Type de Carte
en Carte Individuelle & tendues Mobiles (comme illustr ci-dessus).
Dans la mesure o nous navons besoin de paramtrer aucune autre option ici, nous pouvons
accder directement au dossier Options dexcution dans larborescence, et cocher loption Afficher la bote de dialogue des Critres SQL lors de lexcution dans la page des proprits.

124 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Au moment de lexcution de lanalyse, STATISTICA va vous demander de filtrer sur les colonnes contenant des options de Filtrage dans les donnes sources (si nous avions coch loption Ncessaire pour filtrer lorsque nous avons dfini les options de Filtrage, nous naurions
pas eu besoin de cocher loption Afficher la bote de dialogue des Critres SQL lors de lexcution dans la page des proprits ci-dessus puisquune bote de dialogue de filtrage aurait
automatiquement t appele lors de lexcution dans notre exemple, nous avons dfini le
filtrage selon les colonnes SITE et OPRATEUR possible, mais facultatif).
Cliquez sur le bouton Enregistrer les Modifications de la barre doutils afin de valider cette
configuration danalyse dans STATISTICA Entreprise.

Fermez le Gestionnaire STATISTICA Entreprise, et connectez-vous STATISTICA sous le


nom dutilisateur Nouvel Utilisateur 1 que nous avons cr ltape 1.

STATISTICA Prise en Main 125


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


Dans le menu Entreprise, slectionnez la commande Excuter une Analyse/Produire un Rapport afin d'accder la bote de dialogue Excuter une Analyse ou Produire un Rapport (il se
peut que cette bote de dialogue apparaisse automatiquement en fonction de votre configuration). Slectionnez lanalyse Nouvelle Analyse 1, puis cliquez sur le bouton OK ; la bote de
dialogue Critres SQL apparat.

Cliquez sur la liste droulante Colonne et slectionnez la variable SITE dans la liste. Le bouton
permet daccder la bote de dialogue Valeur de SITE, qui contient la liste des modalits
disponibles de la variable SITE. Slectionnez le site de Lyon puis cliquez sur le bouton OK.

Cliquez sur le bouton Terminer afin de finir ltape de filtrage, extraire les donnes, et raliser
lanalyse de la colonne HAUTEUR.

126 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

Cet exemple simple illustre la manire de configurer et dexcuter une analyse dans linterface-utilisateur classique de STATISTICA, avec les composantes traditionnelles.
Toutefois, lun des atouts de STATISTICA Entreprise est la possibilit de crer simplement des
interfaces-utilisateur personnalises (par exemple, pour diffrentes catgories dutilisateurs
selon le rle quils jouent dans lorganisation, leur expertise, ou les autorisations daccs aux
donnes).
Vous pouvez crer des interfaces personnalises, quel qu'en soit le degr de complexit, depuis
de simples interfaces ultra-dpouilles avec, par exemple, seulement trois options :

STATISTICA Prise en Main 127


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS


jusqu des interfaces trs labores, dune complexit quasiment sans limites :

Veuillez vous reporter la documentation relative STATISTICA Entreprise pour plus d'informations et dexemples.

128 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

STATISTICA Prise en Main 129


Copyright StatSoft, 2010

CHAPITRE 3 : EXEMPLES AVANCS

130 STATISTICA Prise en Main


Copyright StatSoft, 2010

Le systme STATISTICA peut tre contrl de diverses manires. Les sections suivantes prsentent les caractristiques des diffrents types dinterfaces-utilisateur de STATISTICA :
1. Interface interactive (voir page 134)
2. STATISTICA Visual Basic (voir page 146)
3. Interfaces bases sur le navigateur Internet (voir page 147), et
4. Intgration avec Microsoft Office (voir page 149)
Notez toutefois que :
La plupart des aspects de ces interfaces-utilisateur ne sont pas mutuellement exclusifs ;
vous pouvez les combiner selon vos applications et prfrences ;
Les menus personnalisables et les barres doutils permettent dintgrer dautres types dinterfaces-utilisateur, par exemple, pour accder rapidement aux macros (Visual Basic) ou
des fichiers que vous utilisez le plus frquemment.
Vous pouvez personnaliser la plupart des fonctionnalits de ces diverses interfaces-utilisateur (avec une multitude daspects et de comportements possibles de STATISTICA) ; nous
vous recommandons de personnaliser votre systme afin de tirer le meilleur parti des possibilits offertes par STATISTICA pour rpondre vos exigences et besoins dans les tches
que vous avez accomplir (voir la section Personnalisation de lInterface-Utilisateur
Interactive, page 225).

STATISTICA Prise en Main 131


Copyright StatSoft, 2010

CHAPITRE 4 : INTERFACE-UTILISATEUR

Mme sans aucune personnalisation, les paramtres par dfaut de STATISTICA offrent diverses interfaces-utilisateur et solutions pour obtenir les mmes rsultats. Ce principe daccs
alternatif, prsent tout niveau de linterface-utilisateur, permet STATISTICA de sadapter
la manire de travailler de chacun. Par exemple, les outils les plus courants sont accessibles :
partir des menus traditionnels,
Par des raccourcis au clavier (touches de raccourci),
Depuis la barre doutils et les champs cliquables de la barre dtat,
Grce aux barres doutils personnalises (avec des boutons et autres contrles spciaux,
pouvant contenir des macros et des commandes), et
Par les menus contextuels associs des objets particuliers (cellules, lments dun graphique), en cliquant avec le bouton droit de la souris sur llment respectif.
Il est conseill dexplorer les diffrentes interfaces-utlilisateur possibles de STATISTICA avant
de sattacher un style particulier.

Vous pouvez ouvrir plusieurs instances de STATISTICA simultanment, chacune ralisant le


mme type danalyse ou non (appels des modules). Une mme application STATISTICA peut
raliser plusieurs analyses simultanment, chacune pouvant tre ou non du mme type (par
exemple, cinq Rgressions Multiples et deux ANOVA), et tre base sur le mme fichier de
donnes ou sur un fichier diffrent (vous pouvez ouvrir plusieurs fichiers de donnes en mme
temps).
Pour simplifier
lutilisation de cette fonctionnalit multitche, STATISTICA est organis en units fonctionnelles, appeles analyses et reprsentes par des boutons dans la barre danalyse, en bas de
lapplication (au-dessus de la barre dtat, voir lillustration ci-contre, o trois analyses sont en
cours). Dune manire gnrale, un nouveau bouton danalyse est cr chaque fois que vous
132 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 4 : INTERFACE-UTILISATEUR
dmarrez une nouvelle analyse. Diverses options permettent de contrler (et/ou de configurer
de faon permanente) cet aspect de STATISTICA.

Par dfaut, lorsque vous produisez une sortie partir dune bote de dialogue de rsultats, les
rsultats (tableaux ou graphiques) apparaissent et la bote de dialogue est automatiquement rduite en bouton danalyse, en bas de lcran. Cliquez sur ce bouton (ou appuyez sur les touches CTRL+R) pour restaurer la bote de dialogue et reprendre lanalyse.
Diverses options de gestion des analyses sont proposes dans le menu contextuel des boutons
danalyse respectifs, comme illustr ci-dessus (pour y accder, cliquez avec le bouton droit de
la souris sur un bouton danalyse dans la barre danalyse).
Les utilisateurs
disposant de grands crans peuvent inactiver la rduction automatique des botes danalyse et
profiter du fait que la plupart de ces botes de dialogue sont petites pour les conserver en permanence lcran comme de simili-barres doutils et y slectionner les rsultats produire.
Cette option peut tre modifie pour une analyse particulire (dslectionnez loption Rduction Automatique dans le menu contextuel du bouton danalyse respectif, comme illustr cidessus), ou globalement, pour lensemble du programme (utilisez alors le volet d'options Analyses/Graphiques - Affichage de la bote de dialogue Options, accessible par le menu Outils Options).
STATISTICA Prise en Main 133
Copyright StatSoft, 2010

CHAPITRE 4 : INTERFACE-UTILISATEUR
Lorsque vous ralisez plusieurs analyses et que lespace de travail de STATISTICA devient
encombr, vous pouvez masquer toutes les fentres dune analyse particulire (ou les fermer
simultanment grce la commande Fermer Toutes les Analyses du menu contextuel du bouton danalyse) ; vous pouvez galement ouvrir dautres instances de STATISTICA, ce qui constitue une autre manire simple de grer et dorganiser votre travail.

Bien que linterface-utilisateur interactive de STATISTICA ne soit pas la seule


disponible (voir le Chapitre 8 Personnaliser STATISTICA, page 223 et le Chapitre 9 STATISTICA Visual Basic, page 231), elle reste la plus utilise en raison de sa simplicit. Nombre
de composantes de cette interface-utilisateur apparaissent lcran dans STATISTICA
Tout dabord, comme pour la plupart des logiciels, les barres de menu et diverses barres doutils apparaissent en haut de lcran. Elles sont personnalisables et apparaissent de la manire la
plus approprie pour vos tches.
En bas de lcran, vous trouvez la barre danalyse (avec diverses botes de dialogue danalyse/
graphique rduites) ainsi que la barre dtat. Les menus contextuels sont accessibles en cliquant avec le bouton droit de la souris aux endroits appropris.
Vous pouvez afficher les fichiers de donnes dans des feuilles de donnes, des classeurs, des
rapports ou des fentres individuelles (indpendantes). Les feuilles de rsultats ou les graphiques peuvent galement tre affichs dans des classeurs, des rapports ou des fentres indpendantes. Notez que dautres documents (comme des documents Microsoft Word ou des images
Bitmap) peuvent eux aussi tre affichs dans des feuilles de donnes, des classeurs ou des rapports. Enfin, le code STATISTICA Visual Basic est affich dans des fentres de macros.
Dune manire gnrale, vous ne verrez jamais lensemble de ces fonctionnalits et outils
lcran simultanment. Vous avez toujours la possibilit de rendre linterface-utilisateur de
STATISTICA aussi simple ou complexe que vos besoins particuliers le ncessitent (voir page
223). Ces diffrents outils et fonctionnalits sont dcrits en dtail dans le Manuel lectronique.

134 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 4 : INTERFACE-UTILISATEUR
STATISTICA contient de nombreuses procdures statistiques et graphiques, et chaque procdure peut tre ralise dans une mme application de STATISTICA. Il est ainsi tout
fait possible de calculer des statistiques sur les rsidus dans le module de Rgression Multiple,
puis dutiliser instantanment ces rsultats dans le module dAnalyse Factorielle ou dans un
autre module exploratoire sans avoir ouvrir pralablement une autre application de STATISTICA. Pour plus dinformations sur lutilisation des rsultats en entre dune autre analyse,
voir la rubrique Comment Utiliser les Rsultats dune Analyse en Entre dune Autre Analyse
dans le Manuel lectronique.

Aprs avoir slectionn une procdure statistique particulire


dans les menus Statistiques, Data-Mining ou Graphiques, vous voyez apparatre le Panneau de
Dmarrage correspondant (dans lillustration ci-dessous, nous avons slectionn la commande
Statistiques lmentaires dans le menu Statistiques afin d'accder au Panneau de Dmarrage
du module Statistiques lmentaires).

Le Panneau de Dmarrage contient la liste des diffrentes procdures analytiques du module


en question. Si vous cliquez en dehors de cette bote de dialogue, elle sera automatiquement
rduite en bouton dans la barre danalyse. Les utilisateurs disposant dun cran en haute
rsolution peuvent modifier ces paramtres par dfaut et garder les botes de dialogue successives (produites par vos analyses) lcran.
Si vous prfrez appeler les analyses statistiques par des boutons plutt
que par les menus, vous pouvez activer la barre doutils Statistiques (chaque bouton reprsente un module) en cliquant avec le bouton droit de la souris sur une barre doutils puis en

STATISTICA Prise en Main 135


Copyright StatSoft, 2010

CHAPITRE 4 : INTERFACE-UTILISATEUR
slectionnant la commande Statistiques dans le menu contextuel. Vous pouvez aussi slectionner loption Statistiques dans le menu Affichage - Barres doutils. Ou encore crer votre
propre barre doutils avec les analyses que vous utilisez le plus souvent (voir page 145). Pour
plus dinformations sur les barres doutils voir le Manuel lectronique.
Lorsque vous appelez une analyse particulire dans le Panneau de Dmarrage,
la bote de dfinition de lanalyse apparat, vous permettant de slectionner les variables
analyser ainsi que dautres options sur la tche raliser. Ces botes de dialogue comportent
souvent plusieurs onglets qui regroupent en catgories logiques, les options, analyses et/ou
rsultats, afin de faciliter laccs aux fonctionnalits correspondantes.

Dans certaines analyses simples (comme les statistiques descriptives ; voir lillustration cidessus), la bote de dfinition de lanalyse permet galement de slectionner le type et le format des rsultats produire (par exemple, certaines feuilles de donnes ou graphiques spcifiques. La plupart des analyses proposent toutefois des botes de dialogue distinctes pour la
spcification des analyses et des rsultats.
STATISTICA vous permet
dajouter un certain nombre dinformations complmentaires concernant le type de mesure des
variables et le statut des observations dans vos feuilles de donnes. Ces mtadonnes permettent une meilleure description de vos jeux de donnes, mais galement de raliser des analyses exploratoires conditionnelles et de personnaliser laspect des observations dans les graphiques.

136 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 4 : INTERFACE-UTILISATEUR
Vous pouvez utiliser le statut des
observations pour personnaliser lapparence des points dans les graphiques et permettre une
identification simple et rapide des points intressants ou influents. Vous disposez dune large
gamme de symboles et couleurs pour personnaliser laspect des points slectionns. Vous pouvez affecter des statuts dobservations dans la feuille de donnes avant de produire un graphique, mais galement les dfinir de faon interactive dans les graphiques grce aux outils de
Balayage/Habillage (accessibles par la commande Balayage/Habillage du menu Affichage si le
graphique est ouvert). Le statut des observations que vous dfinissez dans un graphique est
rpercut dans la feuille de donnes et rciproquement. Vous pouvez ainsi raliser des analyses exploratoires visuelles de vos donnes.
Vous pouvez dfinir
explicitement le type de mesure dune variable afin de dterminer les analyses et graphiques
adapts pour cette variable. Ces types de mesures sont ensuite utiliss dans les analyses et graphiques qui vont identifier les variables appropries (par exemple, les variables catgorielles
apparaissent dans la liste des prdicteurs catgoriels disponibles pour une ANOVA Factorielle).

Dans toutes les botes de dialogue de slection de variables (comme celle illustre ci-dessus),
loption Nafficher que les variables appropries vous permet de filtrer les variables en fonction du Type de Mesure (que vous dfinissez dans la bote de dialogue des spcifications de la
Variable accessible en double-cliquant sur lintitul de la variable respective) ; si ce type est
dfini en Automatique, ce sont les options de Classification et filtrage automatique de la
variable qui sappliqueront (telles quelles sont spcifies dans le volet d'options Analyse/Graphique - Affichage de la bote de dialogue Options, accessible en slectionnant la commande
Options dans le menu Outils) et qui vont dterminer la manire dont STATISTICA va dfinir
automatiquement le Type de Mesure.

STATISTICA Prise en Main 137


Copyright StatSoft, 2010

CHAPITRE 4 : INTERFACE-UTILISATEUR
Le filtrage
(accessible par le menu Donnes - Filtre Automatique) constitue une manire simple et rapide
dafficher une section spcifique des donnes dans votre feuille de donnes sans avoir trier
les donnes ou crer un sous-ensemble. Lorsque vous filtrez une variable, seules les valeurs
correspondant certains critres dfinis sont affiches dans la feuille de donnes. Les observations ne correspondant pas ces critres sont masques laffichage, mais ne sont pas supprimes de la feuille de donnes (par exemple, dans la feuille de donnes ci-dessous, seules les
observations correspondant au filtre SEXE = Homme apparaissent).

Bien que masques dans la feuille de donnes, ces observations restent disponibles pour les
analyses statistiques et graphiques.
Comme indiqu dans le Chapitre 5 Cinq Canaux de Sortie pour les Rsultats
de vos Analyses (page 151) et illustr diverses reprises dans lExemple 1 : Corrlations (page
11) ou dans lExemple 2 : ANOVA (page 34), les feuilles de rsultats et graphiques successifs
sont envoys par dfaut dans des classeurs. Vous pouvez enregistrer et ouvrir ces classeurs
volont, ce qui permet daccder rapidement aux rsultats souhaits.
Vous pouvez galement envoyer tous vos rsultats dans un rapport danalyse (voir page 157),
organis simplement (sous forme darborescence), et facile mettre en forme et imprimer.
Vous pouvez aussi envoyer tous vos rsultats dans des fentres distinctes (indpendantes). Il
est galement possible denvoyer tous vos rsultats, quelle que soit lanalyse dont ils sont issus, dans un rapport commun ou dans des fentres spares (indpendantes).
Dans tous les cas, vous pouvez dfinir les options de sortie dune analyse ou dune session, en
cliquant sur le bouton
dans la bote de dfinition de lanalyse ou du graphique, puis
en slectionnant loption Gestionnaire de Sorties. Vous pouvez paramtrer les options globales
de sortie dans le volet d'options Analyses/Graphiques - Gestionnaire de Sorties de la bote de
dialogue Options (accessible par le menu Outils - Options) ou en slectionnant loption
Gestionnaire de Sorties dans le menu Fichier.
138 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 4 : INTERFACE-UTILISATEUR

STATISTICA permet daccder directement toutes les botes de dfinition des analyses statistiques par le menu Statistiques :

ou par le menu Data Mining :

STATISTICA Prise en Main 139


Copyright StatSoft, 2010

CHAPITRE 4 : INTERFACE-UTILISATEUR
et toutes les botes de dfinition des graphiques par le menu Graphiques :

(ou par les barres doutils Statistiques, Data Mining et Graphiques). Ces menus restent toujours
accessibles, cest--dire quils sont toujours disponibles, quel que soit le type de document
ouvert lcran. Les menus Statistiques et Data Mining donnent accs tous les types danalyses
disponibles dans STATISTICA. Le menu Graphiques fournit un accs direct aux graphiques les
plus courants (par exemple, nuages de points, histogrammes, tracs de moyennes avec barres
derreur, ...) et un accs hirarchique tous les types de graphiques de STATISTICA,
notamment les Graphiques en 2D, les Graphiques Squentiels et Graphiques XYZ en 3D, les
Tracs Matriciels, les Tracs de Figures, les Graphiques Catgoriss, les Graphiques Personnaliss, les Graphiques de Blocs et les Graphiques de Donnes dEntre. Il donne galement
accs aux Graphiques Composs. Vous trouverez une prsentation dtaille des diffrents
types de statistiques et de graphiques de STATISTICA dans le glossaire du Manuel lectronique de STATISTICA. Voir aussi lAnnexe C : Ligne de Produits STATISTICA (page 307) pour
plus d'informations sur les diffrentes composantes de la ligne de produits STATISTICA pour
lanalyse des donnes.
Pour tirer parti de la fonctionnalit multitches
de STATISTICA (voir Excuter Plusieurs Analyses, page 132), les analyses de STATISTICA
sont organises en units fonctionnelles, reprsentes par des boutons dans la barre danalyse ,
en bas de la fentre de lapplication (au-dessus de la barre dtat, voir lillustration ci-aprs, o
les modules de Statistiques lmentaires, Classifications et Analyse Canonique sont lancs
simultanment). Dune manire gnrale, un nouveau bouton danalyse est cr chaque fois
que vous dmarrez une nouvelle analyse.

140 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 4 : INTERFACE-UTILISATEUR

Vous avez la possibilit de rduire automatiquement toutes les


botes de dialogue danalyse lorsquune nouvelle fentre STATISTICA apparat, ou que vous
ouvrez une autre application. Par dfaut, la commande Rduction Automatique est coche,
mais si votre cran est suffisamment grand pour afficher plusieurs fentres, nous vous conseillons de dslectionner cette option. De cette manire, la bote de dfinition de lanalyse restera
lcran lorsque les rsultats seront produits, et elle pourra faire office de simili-barre
doutils dans laquelle vous pourrez slectionner les rsultats produire. Voir page 133 pour
plus dinformations sur le paramtrage de cette commande.
Vous pouvez aisment poursuivre une analyse
ou un graphique en cours (cest--dire, rappeler la bote de dialogue de lanalyse en cours).
Pour ce faire, slectionnez loption Reprendre lAnalyse dans le menu Outils - Barre dAnalyse,
appuyez sur CTRL+R ou cliquez sur le bouton danalyse correspondant dans la barre danalyse.
Si vous avez excut plusieurs analyses, vous pouvez galement choisir une analyse particulire dans le menu Outils - Barre dAnalyse - Slectionner lAnalyse/Graphique comme illustr
la page suivante.

STATISTICA Prise en Main 141


Copyright StatSoft, 2010

CHAPITRE 4 : INTERFACE-UTILISATEUR

Pour faciliter lorganisation des fentres issues de diverses


analyses, vous pouvez masquer toutes les fentres associes une analyse particulire lorsque
cette analyse est inactive en cochant loption Masquer si Dslectionn dans le menu Outils Barre dAnalyse - Options. Cette commande nest pas coche par dfaut, et ne sapplique que si
les rsultats sont envoys dans des fentres indpendantes ; voir le descriptif du volet d'options
Analyses/Graphiques - Gestionnaire de Sorties de la bote de dialogue Options (page 153)
pour plus dinformations. La commande Fermer Tout (ou CTRL+L) du menu Fentre vous permet de fermer toutes les fentres de documents actifs, et la commande Fermer toutes les
Analyses du menu Outils - Barre dAnalyse permet de fermer toutes les analyses en cours.
Slectionnez loption Amener au Premierdans le menu Outils - Barre dAnalyse - Options pour faire apparatre (amener au premier plan de lapplication STATISTICA) toutes les fentres associes une analyse
particulire ds que lanalyse correspondante est slectionne, remplaant ainsi toutes les
botes de dialogue prcdemment affiches. Cette commande permet de faciliter lorganisation
des fentres indpendantes de plusieurs analyses. Elle est coche par dfaut et ne sapplique
que si les rsultats sont envoys dans des fentres indpendantes ; voir le descriptif du volet
d'options Analyses/Graphiques - Gestionnaire de Sorties de la bote de dialogue Options (page
153) pour plus dinformations sur la gestion des sorties.
Plan si Slectionn

142 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 4 : INTERFACE-UTILISATEUR
Par dfaut, certaines botes de dialogue de rsultats
(comme la bote de dialogue Rgression Multiple - Rsultats) contiennent une bote de synthse avec les principaux rsultats de lanalyse. Vous pouvez masquer cette bote de synthse
en cliquant sur le bouton
situ en bas droite de la bote de synthse. Vous pouvez galement supprimer laffichage de toutes les botes de synthse de faon permanente (cest--dire,
dfinir le nouveau paramtre par dfaut de STATISTICA) en cochant loption Masquer la Bote
de Synthse dans le menu Outils - Barre dAnalyse - Options.

STATISTICA utilise sept grands types de document


Les Classeurs (voir pages 154 et 181)
Les Feuilles de donnes (tableaux multimdia) (voir page 185)
Les Rapports (voir pages 157 et 189)
Les Graphiques (voir pages 192 et 201)
Les Macros (programmes STATISTICA Visual Basic) (voir pages 192 et 231)
Les Projets STATISTICA (voir page 193)
Les Projets du Data Miner (voir page 197)
Grce ces sept types de documents, vous pouvez grer diffrents types de donnes, saisir et
analyser des donnes, produire des graphiques de la plus haute qualit, dvelopper vos propres
applications quel quen soit le degr de complexit et crer des rapports avec mise en forme
personnalise.
Pour accder rapidement aux derniers documents utiliss, cliquez sur le bouton Dmarrer de
STATISTICA (dans langle infrieur gauche de lcran) et slectionnez loption Documents.

STATISTICA Prise en Main 143


Copyright StatSoft, 2010

CHAPITRE 4 : INTERFACE-UTILISATEUR

Le volet d'options Gnralits de la bote de dialogue Options (accessible par le menu Outils Options), permet de spcifier le nombre de documents rcents afficher (par dfaut 16).
Pour plus dinformations sur les diffrents types de documents, voir lintroduction sur les
classeurs, feuilles de donnes, rapports, graphiques et macros, page 181 ; pour des informations dtailles, veuillez vous reporter au Manuel lectronique.
Chacun des principaux types de documents STATISTICA (voir ci-dessus) gre les donnes de manire diffrente,
et offre donc des options de personnalisation et de gestion diffrentes. Ces diffrences sont
refltes dans les barres doutils associes chaque type de fentre. Les commandes des diffrents menus ainsi que les boutons des barres doutils de chacun des grands types de documents
sont dcrits en dtail dans le Manuel lectronique.
Les classeurs ne possdent pas leur propre barre doutils spcialise (bien que la barre doutils
Standard soit toujours disponible) puisque les barres doutils disponibles dpendent du type de
document actif dans le classeur. Ainsi, lorsque vous modifiez une feuille de donnes, un graphique, un rapport, une macro ou un document externe (par exemple, une feuille de calcul
Excel) dans un classeur, ce sont les barres doutils et les menus correspondants ce type de
document qui sont disponibles.
144 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 4 : INTERFACE-UTILISATEUR
Si vous slectionnez un rpertoire vide dans larborescence du classeur, cest la barre
doutils Statistiques qui apparat par dfaut (et non la barre doutils dun type de document
particulier) afin de prserver la taille et les proportions de lespace de travail de lapplication.
Outre les barres doutils par dfaut de STATISTICA,
vous pouvez crer vos propres barres doutils. Ces barres doutils peuvent intgrer toutes les
commandes disponibles dans STATISTICA, ainsi que des contrles spciaux (par exemple,
police de caractres, taille de police, styles de graphiques, ...). Vous pouvez donner nimporte
quel nom vos barres doutils et les associer des types de documents particuliers (elles
napparatront alors que si le type de document choisi est actif).
Vous pouvez galement personnaliser toutes les barres doutils prdfinies en y ajoutant des
commandes et des contrles spciaux.
Pour crer une barre doutils (ou en modifier une existante) utilisez longlet Barres doutils de
la bote de dialogue Personnaliser, accessible par le menu Outils Personnaliser. Pour personnaliser une barre doutils, faites simplement glisser les commandes depuis cette bote de dialogue vers la barre doutils, comme illustr ci-dessous.

STATISTICA Prise en Main 145


Copyright StatSoft, 2010

CHAPITRE 4 : INTERFACE-UTILISATEUR
Vous pouvez facilement modifier la forme et la position des barres doutils (par exemple,
toutes les barres doutils peuvent tre ancres un bord de lcran ou au contraire, tre flottantes). Toutes ces options vous permettent de crer des barres doutils individualises, avec
une interface-utilisateur ultra-spcialise. Le Manuel lectronique contient des instructions
pas--pas sur la manire deffectuer ces personnalisations. Voir en particulier la rubrique
Crer une Nouvelle Barre dOutils dans le Manuel lectronique.
La personnalisation des menus est tout aussi simple et peut tre
ralise grce longlet Menu de la bote de dialogue Personnaliser illustre la page
prcdente (voir le Manuel lectronique pour plus dinformations).

Le langage universel STATISTICA Visual Basic (largement utilis dans le monde industriel et
intgr STATISTICA) offre une interface-utilisateur alternative toutes les fonctionnalits de
STATISTICA et constitue bien plus quune nouvelle application de programmation permettant dcrire des extensions personnalises. STATISTICA Visual Basic tire pleinement parti de
larchitecture du modle-objet de STATISTICA et permet daccder, par programmation, tous
les aspects et la plupart des fonctionnalits de STATISTICA. Mme les analyses et les
graphiques les plus complexes peuvent tre enregistrs dans des macros Visual Basic que vous
pouvez ensuite excuter de faon rptitive ou modifier et utiliser comme des blocs de construction dans dautres applications. STATISTICA Visual Basic ajoute un arsenal de plus de
14.000 nouvelles fonctions la syntaxe complte de Microsoft Visual Basic, devenant lun des
environnements de dveloppement les plus riches et complets actuellement disponibles. Pour
plus dinformations sur STATISTICA Visual Basic, voir le Chapitre 9 (page 231).
Si lenvironnement de
STATISTICA Visual Basic est aussi puissant, cest parce quil est capable dintgrer et de
manipuler diverses applications et leurs environnements respectifs dans un mme programme.
Vous pouvez ainsi enregistrer ou crire un programme STATISTICA Visual Basic pour
calculer des prvisions dans le module Sries Chronologiques de STATISTICA et excuter ce
programme depuis une feuille de calcul Excel ou un document Microsoft Word. Lchange
dinformations entre les diffrentes applications sopre en exposant ces applications aux programmes Visual Basic sous forme dObjets. Vous pouvez par exemple raliser des analyses

146 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 4 : INTERFACE-UTILISATEUR
statistiques dans le module Statistiques lmentaires de STATISTICA grce un programme
Visual Basic excut dans Excel, en dclarant dans votre programme un objet du type
Statistica.Application.
Une fois lobjet cr, le programme Visual Basic peut alors accder aux proprits et mthodes contenues dans cet objet. Les proprits peuvent sapprhender comme des variables, et
les mthodes peuvent tre considres comme des sous-routines ou des fonctions ralisant
certaines oprations ou calculs lintrieur de lapplication-objet respective. Vous pouvez
appeler directement les procdures STATISTICA depuis de nombreuses applications externes
et langages de programmation (par exemple, C++, Java, ).

Outre les deux grands types dinterfaces-utilisateur dcrites dans les deux sections prcdentes, toute la gamme de produits STATISTICA peut galement se prsenter dans linterface dun navigateur Internet,
o les interactions avec lapplication, notamment le requtage des bases de donnes mais aussi les oprations de gestion des donnes, les tches danalyse des donnes et de data
mining, ou encore les rapports et autres aspects de travail
collaboratif, peuvent seffectuer sans que lapplication STATISTICA ne soit installe en local sur lordinateur, et depuis
nimporte quel ordinateur, pourvu quil dispose dune
connexion Internet. Cette interface-utilisateur alternative
ncessite linstallation dune version Client-Serveur de lapplication STATISTICA correspondante.
WebSTATISTICA Server est une application permettant
dintgrer STATISTICA avec Internet et en particulier d'excuter STATISTICA de faon interactive depuis un simple navigateur Web. Il permet aux utilisateurs d'accder rapidement et
facilement aux bases de donnes et aux puissants outils analytiques depuis tout ordinateur
connect Internet, n'importe o dans le monde. Le produit est propos avec une slection
d'interfaces-utilisateur bases sur le navigateur Internet (avec des botes de dialogue intuitives
et une navigation extrmement simplifie) permettant aux utilisateurs de spcifier leurs

STATISTICA Prise en Main 147


Copyright StatSoft, 2010

CHAPITRE 4 : INTERFACE-UTILISATEUR
analyses et d'accder aux rsultats respectifs depuis un simple navigateur Internet. En outre, le
programme met votre disposition un certain nombre d'outils destins personnaliser ou dfinir de nouvelles interfaces-utilisateur ou de nouvelles fonctions. Vous pouvez, par exemple,
faire apparatre dans votre navigateur une simple bote de dialogue constitue de trois boutons
uniquement, chacun excutant sur une srie d'analyses venant complter un rapport dtaill.
Les applications WebSTATISTICA Server ajoutent une nouvelle dimension et une infinit de
possibilits et d'applications l'ensemble des produits d'analyse de donnes, de data mining et
de contrle qualit/six sigma de la gamme STATISTICA.
WebSTATISTICA Server est un systme entreprise entirement personnalisable permettant d'accder des bases de donnes et d'analyser
des donnes au travers du web. Construit sur la technologie du traitement distribu, il est totalement compatible avec l'architecture Client/Serveur multi-tiers. WebSTATISTICA Server
expose les fonctionnalits analytiques, graphiques, de requte et de reporting de STATISTICA
au travers d'interfaces Web classiques, interactives et simples utiliser. Le programme se prsente sous la forme d'une application complte, cl-en-mains, avec une interface-utilisateur
base sur le navigateur Internet, permettant aux utilisateurs distants de crer leurs propres
fichiers de donnes, d'effectuer leurs propres analyses et d'accder aux rsultats de faon interactive. Toutefois, en raison de son architecture ouverte, WebSTATISTICA Server comprend
galement des outils de dveloppement (totalement compatibles avec les conventions de
syntaxe universelles utilises dans le milieu industriel comme le langage Visual Basic, C++,
HTML, XML), et qui permettent aux dpartements informatiques de personnaliser les principales composantes du systme, ou d'tendre le systme en utilisant ses fondations et en ajoutant, par exemple, de nouvelles composantes et/ou fonctionnalits analytiques trs spcifiques
ou relatives aux bases de donnes. Le systme est compatible avec la plupart des plates-formes
de serveurs Web (par exemple, UNIX Apache, Microsoft IIS), et fonctionne aussi bien dans
les environnements Microsoft .net que Sun/Java ; aucune modification du pare-feu en place ni
des paramtres de scurit Internet/Intranet n'est ncessaire.
Pour plus d'informations, voir l'Annexe B WebSTATISTICA, page 295.

148 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 4 : INTERFACE-UTILISATEUR

Si Microsoft Office est install sur la mme machine que STATISTICA, vous aurez la possibilit d'ouvrir directement des feuilles de calcul Excel dans STATISTICA et les utiliser comme
source de donnes pour vos analyses (pour un exemple, voir page 55). De la mme manire,
vous pourrez utiliser des documents Word comme destination pour vos rapports (pour un
exemple, voir page 161).
Vous pouvez ouvrir des documents Excel dans l'espace
de travail STATISTICA l'aide de la bote de dialogue Ouvrir classique. Lorsque vous slectionnez un classeur Excel, une bote de dialogue vous demande si vous souhaitez importer le
fichier dans une feuille de donnes STATISTICA ou si vous prfrez conserver le document
sous sa forme Excel, c'est--dire, sous forme d'une fentre Excel dans l'application STATISTICA.
Aprs avoir ouvert le document Excel, vous avez accs tous les menus et barres d'outils
d'Excel. Vous pouvez ainsi modifier et mettre jour les formules, changer la mise en forme,
copier/coller, glisser-dplacer et d'une manire gnrale, utiliser tous les outils habituellement disponibles dans l'application Excel.
Le principal avantage de l'intgration avec Excel rside dans le fait que vous pouvez utiliser
des documents Excel en source de donnes de vos analyses. Il vous suffit de slectionner la
fentre du document Excel lorsque vous dmarrez une analyse, afin que l'analyse utilise automatiquement le document Excel en entre. Lorsque vous excutez l'analyse, STATISTICA
affiche une bote de dialogue vous permettant de spcifier le champ du document Excel
utiliser comme source de donnes et si une ligne ou une colonne particulire sont considrer
comme noms de variables ou d'observations. Ces paramtres sont alors associs au document
Excel et il n'est pas ncessaire de les spcifier nouveau.
Vous pouvez non seulement utiliser des documents Excel comme source de donnes dans
STATISTICA, mais vous pouvez galement activer la mise jour automatique. Si vous crez
un graphique avec mise jour automatique partir du menu Graphiques et que vous changez
les donnes dans le fichier Excel en saisissant de nouvelles donnes ou en recalculant les
formules, le graphique se mettra jour galement.

STATISTICA Prise en Main 149


Copyright StatSoft, 2010

CHAPITRE 4 : INTERFACE-UTILISATEUR
Vous pouvez galement ouvrir et modifier vos documents Word dans l'espace de travail STATISTICA l'aide de la bote de dialogue
Ouvrir classique ; lorsque vous ralisez des analyses statistiques ou que vous crez des
graphiques, vous pouvez envoyer les rsultats dans un document Word. Tous les lments que
vous pouvez envoyer dans un rapport STATISTICA peuvent galement tre envoys dans un
document Word.
Comme pour les fentres Excel, les fentres Word contiennent toutes les barres d'outils et
menus disponibles dans l'application Word. Vous pouvez effectuer toutes les oprations de
mise en forme et d'dition habituellement disponibles dans l'application Word.
Lorsque vous envoyez une feuille de donnes dans Word, STATISTICA utilise les fonctionnalits d'dition des tableaux de Word et convertit la feuille de donnes en tableau. Pour les
grosses feuilles de donnes qui ne peuvent pas tenir sur une seule page, c'est vous qui dfinissez les sauts de lignes et de colonnes. La largeur de page dtermine le nombre de colonnes
affiches pour la feuille de donnes. Toutes les lignes d'un ensemble dfini de colonnes sont
affiches avant les colonnes suivantes dans le document Word. Cette solution permet d'afficher les feuilles de donnes dans Word o elles peuvent tre modifies de faon native dans
Word, mais galement d'afficher l'intgralit de la feuille de donnes, et de la mettre en page
correctement avant impression.

150 STATISTICA Prise en Main


Copyright StatSoft, 2010

Lorsque vous ralisez une analyse, STATISTICA produit des rsultats sous forme de tableaux
multimdia (feuilles de donnes) et de graphiques. Il existe cinq canaux de sortie vers lesquels
vous pouvez envoyer tous vos rsultats :
1. Les Classeurs STATISTICA (page 154)
2. Des fentres indpendantes (page 156)
3. Les Rapports (page 157)
4. Microsoft Word (page 161)
5. Le Web (page 163)
Les quatre premiers sont contrls par le Gestionnaire de Sorties (accessible par la commande
Gestionnaire de Sorties du menu Fichier, voir page 23 pour plus d'informations sur le Gestionnaire de Sorties global de la bote de dialogue Options et sur le Gestionnaire de Sorties de
l'Analyse/Graphique). Vous pouvez envoyer vos rsultats sur le Web de diverses manires
selon la version de STATISTICA dont vous disposez.
Vous pouvez utiliser diffrentes combinaisons de ces canaux de sortie (par exemple, un classeur et un rapport simultanment) et personnaliser chacun des canaux de sortie de diverses
manires. En outre, tous les rsultats (feuilles de donnes et graphiques) qui sont envoys vers
ces canaux de sortie peuvent contenir d'autres objets et documents incorpors ou lis, ce qui
vous permet d'organiser les rsultats STATISTICA de diverses manires. Chacun des canaux de
STATISTICA Prise en Main 153
Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES


sortie de STATISTICA possde ses propres avantages que nous voquerons dans les sections
suivantes. Vous trouverez plus d'informations sur les types de documents associs aux diffrents canaux de sortie dans le chapitre suivant (page 179).
Tous les documents de STATISTICA
(feuilles de donnes, classeurs, rapports, macros) destins rassembler les rsultats de vos travaux sur le long terme (c'est--dire vos donnes, saisies ou modifies, vos rsultats, etc)
offrent une option d'Enregistrement Automatique, paramtrable dans le volet d'options Gnralits de la bote de dialogue Options (accessible par le menu Outils - Options). Votre travail
peut donc tre automatiquement sauvegard (par exemple, toutes les 10 minutes), ce qui permet de rcuprer votre travail en cas d'incident matriel ou de coupure lectrique.

Les classeurs constituent l'option de gestion par dfaut des sorties (pour plus d'informations,
voir page 181). Ils conservent chaque document de sortie (par exemple, une feuille de donnes
ou un graphique STATISTICA ou des documents Microsoft Word ou Excel) sous forme d'onglets dans le classeur.
Les documents peuvent tre organiss sous une forme hirarchique de dossiers ou de groupes
de documents (par dfaut, un par analyse) dans une arborescence, o les documents individuels, dossiers ou rpertoires entiers de l'arborescence peuvent tre manipuls de faon flexible.

Par exemple, vous pouvez extraire des documents (par exemple, en utilisant les fonctionnalits
Glisser-Copier ou Glisser-Dplacer) vers un rapport ou vers l'espace de travail de l'application
(c'est--dire, vers l'arrire-plan de l'application STATISTICA o ils apparaissent sous forme

154 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES


de fentres indpendantes). Vous pouvez placer des branches entires dans d'autres classeurs
pour personnaliser l'organisation de vos dossiers, etc...
D'un point de vue technique, les classeurs STATISTICA sont des containers ActiveX (voir
page 248 pour plus d'informations sur la technologie ActiveX, voir galement le Manuel lectronique). Les classeurs sont compatibles avec de nombreux formats de fichiers externes (par
exemple, des documents Microsoft Office) qui peuvent tre facilement insrs et dits
directement dans le classeur.
Les classeurs offrent des options puissantes pour grer efficacement des quantits importantes de rsultats, et
constituent sans doute l'option optimale de gestion des rsultats, la fois pour les novices et
les utilisateurs expriments. Le principal reproche qui pourrait leur tre fait concerne l'insertion de commentaires (par exemple, des notes) et d'informations complmentaires qui ne peut
tre ralise de manire aussi simple que dans des rapports traditionnels de type traitement de
texte, comme les rapports STATISTICA (voir la section suivante). Notez toutefois que :
Tous les documents STATISTICA peuvent tre annots (a) directement, en saisissant du
texte dans les graphiques, tableaux et rapports, et (b) indirectement, en crivant des notes
dans le champ Commentaires de la bote de dialogue Proprits du Document (accessible
partir du menu Fichier - Proprits), et
Vous pouvez facilement insrer des documents comportant des notes et commentaires
(sous forme de fichiers texte, rapports STATISTICA, documents WordPad ou traitement de
texte) tout niveau dans l'arborescence des rsultats du classeur. Vous pouvez mme attacher ces documents de commentaires ou de notes de synthse, des groupes d'objets subordonns auxquels la note se rapporte, afin amliorer encore leur organisation.
Vous pouvez enregistrer
les classeurs sous forme de fichiers *.html (Web) en slectionnant la commande Enregistrer
Sous dans le menu Fichier de STATISTICA, puis en choisissant l'option Page Web (*.htm;
*.html) dans la liste Type de la bote de dialogue Enregistrer Sous. Lorsque vous procdez
ainsi, un fichier *.html est cr dans le dossier spcifi, et vous pouvez l'ouvrir l'aide de tout
navigateur internet classique comme Microsoft Internet Explorer. Lorsque vous enregistrez un
classeur sous forme de page Web, STATISTICA cre galement un sous-dossier contenant
toutes les images rfrences sur la page Web.

STATISTICA Prise en Main 155


Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES

La page Web de sortie contient une arborescence avec des liens hypertexte qui vous permet de
naviguer entre les diffrentes images du classeur, comme vous le feriez dans le classeur.

Les documents de sortie STATISTICA peuvent galement tre dirigs vers une file de fentres
indpendantes ; la Taille de la File peut tre modifie dans le volet d'options Analyses/Graphiques - Gestionnaire de Sorties de la bote de dialogue Options (accessible par le menu Fichier Gestionnaire de Sorties).

156 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES

L'inconvnient majeur de ce mode de sortie est son manque total d'organisation et sa tendance
naturelle encombrer l'espace de travail de l'application (notez que certaines procdures peuvent gnrer des centaines de tableaux ou graphiques avec un seul clic).
L'un des avantages de cette faon de procder est la possibilit de personnaliser facilement
l'organisation de ces objets dans l'espace de travail (par exemple, pour crer des documents
de rfrence, qu'il est alors facile de comparer d'autres rsultats). Pour ce faire, il n'est
cependant pas ncessaire de paramtrer par dfaut les sorties sous forme de fentres individuelles, avec le risque de produire un nombre important (et souvent inutile) de fentres distinctes
risquant de saturer l'espace de travail. En revanche, il est possible tout moment d'extraire des
fentres individuelles, pralablement envoyes vers les deux autres canaux de sortie (classeurs,
rapports), en les glissant de l'arborescence respective vers l'espace de travail de l'application si
ncessaire.

Lorsque vous ralisez une analyse, le but ultime consiste produire des rsultats clairs qui
vont permettre d'amliorer la comprhension des donnes. La manire dont les rsultats sont
produits est galement importante. STATISTICA propose diverses mthodes pour produire des
rapports en fonction des diffrents besoins des utilisateurs.

Les rapports STATISTICA (pour plus d'informations, voir page 189) permettent de manipuler
les sorties de faon plus traditionnelle puisque les objets (par exemple, une feuille de donnes,
STATISTICA Prise en Main 157
Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES


un graphique STATISTICA, ou encore une feuille de calcul Microsoft Excel) apparaissent les
uns la suite des autres comme dans un traitement de texte.

Toutefois, la technologie cache derrire ce simple rapport vous permet d'accder de riches
fonctionnalits. Par exemple, comme pour les classeurs, chaque rapport STATISTICA est aussi
un container ActiveX (pour plus d'informations sur la technologie ActiveX, voir page 248
ou le Manuel lectronique) o chaque objet (non seulement les feuilles de donnes et les graphiques STATISTICA mais aussi tout autre document compatible ActiveX, comme une feuille
de donnes Microsoft Excel) est actif, personnalisable et ditable directement.
Cette manire de procder offre des avantages vidents dans la mesure o il est facile d'insrer
des notes et commentaires entre les objets et que cette manire plus traditionnelle correspond
ce que certains utilisateurs ont l'habitude d'utiliser (notez que l'diteur supporte le dfilement
vitesse variable et les autres fonctionnalits de la souris IntelliMouse).
En outre, seul le rapport contient et prserve l'enregistrement des informations complmentaires, c'est--dire un journal des options spcifies au cours des analyses (par exemple, les
variables slectionnes et leur description dtaille, etc...) selon le niveau d'information complmentaire demand dans le volet d'options Analyses/Graphiques - Gestionnaire de Sorties de
la bote de dialogue Options (accessible par le menu Fichier - Gestionnaire de Sorties), voir
page 23. L'inconvnient vident de ces rapports traditionnels demeure toutefois la structure
plate inhrente impose par leur format de style traitement de texte, bien que certains utilisateurs ou applications prfrent cette organisation.

158 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES

Lorsqu'un classeur STATISTICA contient les rsultats de vos analyses, vous pouvez les transfrer dans un rapport.
En procdant de cette manire, vous pouvez ajouter vos propres commentaires entre les objets
et utiliser une mthode plus classique de navigation entre les rsultats laquelle certains utilisateurs sont plus habitus. En outre, seuls les rapports permettent de stocker des informations
complmentaires, comme le dtail des options spcifies pour l'analyse (par exemple, les variables slectionnes, leur description dtaille, etc...) selon le niveau d'information complmentaire demand dans le volet d'options Analyses/Graphiques - Gestionnaire de Sorties de la
bote de dialogue Options accessible par la commande Options du menu Outils. Voir page 23.
Ouvrez un classeur STATISTICA. Si vous n'en avez aucun d'enregistr, crez-en un nouveau :
vrifiez tout d'abord que le bouton d'option Classeur est slectionn dans le Gestionnaire de
Sorties (accessible en slectionnant la commande Gestionnaire de Sorties dans le menu
Fichier). Puis crez un classeur en suivant l'Exemple 1 : Corrlations (page 11) ou l'Exemple
2 : ANOVA (page 34).
Dans un classeur ouvert, slectionnez tous les fichiers en cliquant sur le premier fichier, puis,
tout en appuyant sur la touche MAJ de votre clavier, en cliquant sur le dernier fichier. Cliquez
ensuite sur le bouton Ajouter au Rapport dans la barre d'outils. Tous les fichiers contenus dans
le classeur seront alors copis dans un Rapport STATISTICA.

Le format RTF est une mthode de codification standard de Microsoft permettant l'change
ais de graphiques et de texte mis en forme avec d'autres applications. Lorsque vous enregistrez des rapports au format *.rtf (Rich Text Format), toute la mise en forme du fichier est
prserve et le fichier peut tre lu et correctement interprt par toutes les applications compatibles avec RTF (par exemple, Word).
Le format des Rapports STATISTICA (.str) respecte les conventions RTF ; toutefois, si vous
enregistrez vos rapports au format natif des Rapports STATISTICA (par dfaut), vous avez l'assurance que vos rapports seront ouverts dans STATISTICA, et que vous pourrez accder
l'arborescence du rapport.
Afin d'ouvrir un rapport STATISTICA dans une application compatible RTF, ouvrez le rapport
et slectionnez la commande Enregistrer Sous dans le menu Fichier afin d'accder la bote de
STATISTICA Prise en Main 159
Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES


dialogue Enregistrer Sous. Dans la liste droulante Type, slectionnez l'option Rich Text
Format (*.rtf), saisissez un nom dans le champ Nom du fichier, puis cliquez sur le bouton
Enregistrer. Vous pouvez ouvrir le fichier dans toute application compatible RTF.

Les lettres PDF sont les initiales de Portable Document Format ; il s'agit d'un format universel
de stockage de donnes graphiques et de texte. Le format PDF possde une structure et un
aspect graphique volus qui en font un outil idal pour des prsentations. En outre, vous
pouvez visualiser vos documents PDF en mode graphique ou en mode texte, c'est--dire que
vous pouvez slectionner les donnes soit sous forme d'image mise en forme, soit de texte
traditionnel.
Le format PDF n'est pas li un systme d'exploitation particulier et il existe des utilitaires de
visualisation de documents PDF gratuits pour chacun d'eux (par exemple, Adobe Acrobat pour
Windows ou Ghostscript pour Linux).
Le format PDF a t reconnu comme un format de stockage de documents acceptable dans les
environnements rglements par la norme 21 CFR Part 11 de la FDA.
Pour enregistrer un Rapport STATISTICA au format PDF, ouvrez le rapport et slectionnez la
commande Enregistrer au Format PDF dans le menu Fichier. La bote de dialogue Options de
Sortie va alors vous permettre de choisir de crer les feuilles de donnes sous forme d'Objets
(telles qu'elles apparaissent dans la fentre du Rapport) ou de Feuilles de Donnes de Taille
Complte (pages distinctes). Si vous souhaitez produire vos feuilles de donnes toujours de la
mme manire, cochez l'option Utiliser le paramtrage courant et ne plus afficher cette bote de
dialogue. Cliquez sur le bouton OK pour fermer la bote de dialogue Options de Sortie et afficher la bote de dialogue Enregistrer le Rapport au Format PDF. Le champ Enregistrer dans
vous permet de slectionner le dossier dans lequel vous souhaitez enregistrer le document ;
saisissez un nom dans le champ Nom du fichier puis cliquez sur le bouton Enregistrer. Vous
pouvez sauvegarder vos Rapports, Feuilles de Donnes et Graphiques STATISTICA au format
PDF.
Remarque : il ne s'agit pas de pseudo fichiers PDF (avec un bitmap compress des images
respectives des pages de documents) mais bien de vritables fichiers PDF permettant la copie
slective des informations textuelles.

160 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES

STATISTICA vous permet galement d'envoyer vos rsultats directement dans Word grce aux
fonctionnalits d'intgration avec Office. Lorsque vous ouvrez Word depuis STATISTICA, les
barres d'outils et menus de Word deviennent accessibles grce la technologie d'interface avec
les Documents ActiveX. Dans STATISTICA, vous pouvez effectuer toute opration de mise en
forme et d'dition reconnue par Word.
Lorsque vous envoyez une feuille de donnes dans Word, STATISTICA utilise les fonctionnalits d'dition de tableaux de Word et convertit la feuille de donnes en tableau. Pour les grosses
feuilles de donnes qui ne peuvent pas tenir sur une seule page, c'est vous qui dfinissez les
sauts de lignes et de colonnes. La largeur de page dtermine le nombre de colonnes affiches
pour la feuille de donnes. Toutes les lignes d'un ensemble dfini de colonnes sont affiches
avant les colonnes suivantes dans le document Word. Cette solution vous permet d'afficher les
feuilles de donnes dans Word o elles peuvent tre modifies de faon native dans Word,
mais galement d'afficher l'intgralit de la feuille de donnes et de la mettre en page correctement avant impression.
Comme pour les Rapports STATISTICA classiques (voir page 157), les documents Word peuvent contenir diverses informations supplmentaires (par exemple, variables slectionnes,
description dtaille des variables, etc...).
Pour envoyer vos rsultats dans un document Word, utilisez les options du Gestionnaire de
Sorties (accessible par la commande Gestionnaire de Sorties du menu Fichier, ou slectionnez
la commande Options du menu Outils puis slectionnez le volet d'options Analyses/Graphiques - Gestionnaire de Sorties dans la bote de dialogue Options). Dans la liste droulante Rapport Microsoft Word, slectionnez l'une des options Envoyer dans diffrents documents Word
(un par analyse/ graphique), Document Word commun (identique pour toutes les analyses/graphiques), ou [Slectionnez un Fichier] pour spcifier un document Word existant.
Si les documents Word, contrairement aux Rapports ou Classeurs STATISTICA, n'offrent pas
d'arborescence, il existe de nombreux avantages envoyer vos rsultats dans des documents
Word. En effet, lorsque vous envoyez vos rsultats dans des rapports Word, vous bnficiez de
toutes les fonctionnalits de traitement de texte disponibles dans Word. Par exemple, vous
pouvez utiliser des modles pour crer des documents ultra-personnaliss, ajouter une table
des matires et des index, suivre les modifications, etc...

STATISTICA Prise en Main 161


Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES


Lorsque vous insrez de grandes feuilles de donnes dans des documents Word, STATISTICA
dtecte automatiquement le nombre de variables que vous pouvez insrer sur chaque page et
partitionne la feuille de donnes en diffrents tableaux Word. Si la feuille de donnes contient
des noms d'observations, ils apparatront en premire colonne sur chacun des tableaux.
Les documents Word offrent d'autres avantages, notamment au niveau des fonctionnalits
d'impression (par exemple, impression dans des fichiers, copies assembles) et de la possibilit
d'enregistrer les rsultats sous forme de pages Web.

Vous pouvez avoir besoin d'envoyer un Rapport ou un Classeur STATISTICA sur Internet pour
permettre d'autres de le consulter. STATISTICA vous permet d'enregistrer vos rapports et
classeurs au format HTML. Les lettres HTML sont les initiales de HyperText Markup Language. Le langage HTML utilise des balises pour identifier les diffrents lments du document, comme le texte ou les graphiques.
Aprs avoir ouvert un Rapport ou un Classeur STATISTICA, slectionnez la commande Enregistrer Sous du menu Fichier afin d'accder la bote de dialogue Enregistrer Sous. Dans la
liste droulante Type, slectionnez l'option Fichiers HTML (*.html; *.htm) afin d'enregistrer le
fichier avec l'extension *.htm.
Tous les graphiques contenus dans le rapport ou dans le classeur sont enregistrs au format
*.png dans le mme dossier que le fichier HTM en utilisant les conventions d'appellation
suivantes : nom_du_rapport_image0001.png, nom_du_rapport_image0002.png, etc... Vous
pouvez aussi enregistrer les graphiques au format JPG si vous prfrez. Pour ce faire, slectionnez la commande Options du menu Outils afin d'accder la bote de dialogue Options.
Slectionnez le volet d'options Documents - Rapports ou Documents - Classeurs, selon le type
de document enregistrer au format .htm, puis slectionnez le bouton d'option Format JPEG
dans le groupe Format d'exportation des images HTML avant de cliquer sur le bouton OK.

162 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES

WebSTATISTICA offre une manire alternative de diffuser les rapports au travers de son Portail Interactif. Ce Portail Interactif vous permet de publier des documents STATISTICA (feuilles de donnes, graphiques, rapports ou classeurs) sur Internet. Les utilisateurs disposant de
droits limits sur le Portail Interactif peuvent seulement consulter ces documents. Vous pouvez
contrler l'accs ces documents en dfinissant des autorisations d'accs sur les documents et
les dossiers grce aux outils standard fournis avec WebSTATISTICA.
Pour publier des informations sur le Portail Interactif, vous devez pralablement crer un
dossier dans le dossier Portail de l'entrept WebSTATISTICA : connectez-vous tout d'abord
WebSTATISTICA en tant qu'utilisateur disposant de droits d'Administration, puis dans le menu
Fichier, slectionnez Oprations sur Mes Rpertoires pour accder la bote de dialogue Mes
Rpertoires de WebSTATISTICA ; une bote de dialogue similaire celle-ci va alors apparatre.

Pour crer un dossier dans le rpertoire Portail afin d'y enregistrer vos rapports, slectionnez
le rpertoire Portail, puis cliquez sur le bouton Crer afin d'accder la bote de dialogue
Invite Utilisateur de Internet Explorer. Dans le champ d'dition, saisissez le nom du nouveau
dossier, Exemples, puis cliquez sur le bouton OK. Une bote de dialogue va apparatre pour
STATISTICA Prise en Main 163
Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES


confirmer que Le rpertoire /Portail/Exemples a t cr. Cliquez sur le bouton Afficher Mes
Rpertoires afin de revenir la bote de dialogue Mes Rpertoires. Cochez l'option Afficher les
Dossiers Vides puis cliquez sur le bouton Actualiser. Vous pouvez dvelopper le dossier
Portail en cliquant sur le signe + situ ct de ce dossier, afin de faire apparatre le nouveau
dossier Exemples.

Remarque : vous pouvez dterminer les individus habilits lire et crire dans ce dossier en
mettant le dossier Exemples en surbrillance, puis en cliquant sur le bouton Scurit et en
utilisant les options de WebSTATISTICA pour dterminer les droits d'accs au niveau des utilisateurs et des groupes pour ce rpertoire.

prsent que notre rpertoire est cr, nous allons pouvoir ajouter nos rsultats d'analyse afin
de permettre aux utilisateurs du Portail d'y accder depuis WebSTATISTICA ou depuis STATISTICA.
Dmarrons une analyse dans WebSTATISTICA. Dans le menu Fichier de WebSTATISTICA,
slectionnez la commande Ouvrir une Feuille de Donnes. Dans la bote de dialogue Slectionnez une Source des Donnes, slectionnez le rpertoire Fichiers de donnes dans le volet de
gauche, puis le fichier de donnes Adstudy.sta dans le volet de droite et cliquez sur le bouton
OK.

164 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES

Fermez la fentre de l'diteur de Feuilles de Donnes de WebSTATISTICA (nous ne l'utiliserons pas dans cet exemple) et conservez simplement la fentre du navigateur reportant l'information de synthse de la Source de Donnes Active pour le fichier de donnes Adstudy.sta.
Dans le menu Statistiques - Statistiques lmentaires de WebSTATISTICA, slectionnez la
commande Statistiques Descriptives afin d'accder la bote de slection des variables et la
bote de dialogue des paramtres des Statistiques Descriptives. Dans la bote de dialogue de
slection des variables, slectionnez les variables MESURE1 et MESURE2 dans la liste des
Variables continues. Puis, dans la bote de dialogue des paramtres des Statistiques Descriptives, slectionnez Tous les rsultats dans la liste des Rsultats produire.

STATISTICA Prise en Main 165


Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES

Cliquez sur le bouton OK afin d'accder aux rsultats de cette analyse, constitus de diffrentes
feuilles de donnes et graphiques.

166 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES

Avant de publier cette page sur le Portail, vous avez la possibilit de rorganiser les objets ou
d'ajouter des commentaires. Cliquez sur le bouton Modifier la Page dans la partie suprieure de
la page. La bote de dialogue Portail Interactif - dition des Rsultats apparat.

STATISTICA Prise en Main 167


Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES

La liste des objets prsents sur la page apparat dans le volet gauche de l'diteur ; dans le cas
prsent, nous avons trois feuilles de donnes et quatre graphiques. Le volet droit de la page
reprsente le contenu de la page. L'objet initial de la page porte l'intitul Espace Rserv pour
les lments Restants, ce qui signifie que tous les objets qui n'auront pas t spcifiquement
slectionns seront insrs cet endroit de la page. Dans la mesure o il s'agit du seul lment
prsent sur cette page, nos trois feuilles de donnes et nos quatre graphiques seront donc
reports dans la page de rsultats, comme c'tait le cas sur la page originale.
Dans cet exemple, nous allons inclure uniquement le second graphique (Graph2) et la troisime feuille de donnes (Spreadsheet3) dans les rsultats. Slectionnez tout d'abord l'objet Espace Rserv pour les lments Restants dans le volet de droite, et supprimez-le. La page est
prsent totalement vierge. Slectionnez l'objet Graph2 dans la liste gauche, puis cliquez sur
le bouton Insrer l'lment afin d'insrer le graphique sur la page. Pour insrer la feuille de
donnes la suite, cliquez tout d'abord en dessous du graphique pour dplacer le pointeur d'insertion sous le graphique que nous venons d'ajouter. Puis slectionnez l'objet Spreadsheet3
dans le volet de gauche et cliquez sur le bouton Insrer l'lment. La feuille de donnes va
alors s'insrer automatiquement en dessous du graphique.
168 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES


Remarque : les lments insrs dans la page sont automatiquement slectionns dans la liste
gauche.

Insrons prsent un commentaire entre les deux objets. Pour ce faire, nous devons pralablement positionner le curseur entre les deux objets dans l'aperu de la page. Saisissons le texte
Table de Frquences de MESURE2 issue de. Pour modifier la police et sa taille, mettez en
surbrillance le texte que vous venez de saisir puis cliquez sur le bouton A de la barre d'outils.
Nous avons ici spcifi un style Gras et une taille de police de 24 points avant de cliquer sur le
bouton OK pour valider notre choix.

STATISTICA Prise en Main 169


Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES

Outre les objets que vous pouvez intgrer, il est galement possible d'insrer des paramtres
prdfinis pour cette analyse. Il s'agit notamment de tous les paramtres issus de la bote de
dialogue initiale des paramtres, mais galement de paramtres tels que la date et l'heure d'excution, le nom de l'utilisateur ou encore le nom de la source de donnes. Pour accder ces
paramtres, cliquez sur le bouton Variables, situ dans la partie suprieure gauche de la fentre
Portail Interactif - dition des Rsultats. Cette liste reporte tous les paramtres que vous pouvez insrer.
Placez votre curseur la fin du texte que vous venez de saisir et cliquez sur le paramtre DataSource, puis cliquez sur le bouton Insrer la Variable. Le nom de la source de donnes utilise
va alors s'insrer la position du curseur.

170 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES

Remarque : le paramtre que nous venons d'ajouter est un simple marqueur et ce n'est pas le
nom de la source de donnes qui apparat dans l'diteur ; en revanche, lorsque la page sera affiche en dehors de l'diteur, le nom qui apparatra la place du marqueur sera bien celui de la
source de donnes. Pour un aperu de la page, cliquez sur le bouton Aperu. Pour enregistrer
la page modifie, cliquez sur le bouton Enregistrer. Un message vous indiquera que la page a
t correctement enregistre.

Cliquez sur le bouton OK de ce message, puis fermez la fentre Portail Interactif - dition des
Rsultats. Vous pourrez constater que notre page originale a t mise jour, et qu'elle intgre
bien les modifications que nous venons d'apporter.
STATISTICA Prise en Main 171
Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES

Nous allons prsent publier cette page afin que les autres utilisateurs puissent la consulter sur
le Portail. Cliquez sur le bouton Publier dans la partie suprieure droite de la fentre pour faire
apparatre la bote de dialogue Rpertoire de Publication. Slectionnez le rpertoire Exemples
cr prcdemment. Vous pouvez galement dterminer les utilisateurs habilits consulter
cette page spcifique en cochant l'option Dfinir les autorisations d'accs sur cette page de
sortie ; dans cet exemple, gardons cette option dslectionne afin de permettre tous les utilisateurs ayant accs au dossier Exemples de visualiser ce document.

172 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES

Cliquez sur le bouton Suivant afin d'enregistrer la page dans le rpertoire slectionn.
Dornavant, si un utilisateur se connecte au Portail, il verra le nouveau dossier Exemples, avec
la page que nous venons de crer pour les Statistiques Descriptives.

STATISTICA Prise en Main 173


Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES

Grce la fonctionnalit d'intgration des versions bureautiques de STATISTICA avec WebSTATISTICA, vous pouvez galement publier des documents STATISTICA (feuilles de donnes, graphiques, rapports et classeurs) directement sur le Portail depuis l'application STATISTICA.
La premire tape consiste activer l'intgration avec WebSTATISTICA. Dans le menu Outils
de STATISTICA, slectionnez la commande Options afin d'accder la bote de dialogue
Options. Slectionnez le volet d'options Serveur / Web, afin de spcifier l'URL du Serveur
WebSTATISTICA ainsi que tout autre paramtre de configuration dfini par votre administrateur systme lors de l'installation de WebSTATISTICA.

174 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES


Dans l'illustration prcdente, WebSTATISTICA a t install sur le serveur serveur23 ; l'information contenue dans cette bote de dialogue peut tre diffrente selon l'endroit o WebSTATISTICA est install sur votre rseau.
Aprs avoir cliqu sur le bouton OK dans la bote de dialogue Options, vous devriez voir apparatre un nouveau menu Serveur dans STATISTICA, juste ct du menu Fichier. La seule
commande accessible ce stade dans le menu Serveur est la commande Connexion ; slectionnez cette commande dans le menu. Si vous avez activ l'authentification intgre (et que votre
compte Windows est actif dans WebSTATISTICA), vous serez connect(e) automatiquement.
Si l'authentification intgre n'est pas active, vous devrez renseigner un nom d'utilisateur et
un mot de passe WebSTATISTICA. Une fois connect(e), les autres commandes du menu Serveur deviennent accessibles.
Nous allons prsent crer une analyse et envoyer les rsultats sur le Portail. Ouvrons le fichier
de donnes Adstudy.sta en slectionnant la commande Ouvrir des Exemples du menu Fichier ;
dans la bote de dialogue Ouvrir un Fichier de Donnes STATISTICA, double-cliquez sur le
rpertoire Fichiers de donnes, puis double-cliquez sur le fichier Adstudy.sta afin d'ouvrir cette
feuille de donnes dans STATISTICA. Dans le menu Statistiques, slectionnez la commande
Statistiques lmentaires pour accder la bote de dialogue Statistiques lmentaires (Panneau
de Dmarrage), puis slectionnez l'option Statistiques Descriptives.

Cliquez ensuite sur le bouton OK afin d'accder la bote de dialogue Statistiques Descriptives.

STATISTICA Prise en Main 175


Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES

Assurons-nous tout d'abord que tous les rsultats de cette analyse vont bien tre envoys dans
un classeur. Pour ce faire, cliquez sur le bouton Options dans la partie droite de la bote de dialogue, et dans la liste droulante, slectionnez la commande Gestionnaire de Sorties. Dans la
bote de dialogue Gestionnaire de Sorties de l'Analyse/Graphique, vrifiez que le bouton d'option Classeur est bien slectionn dans le cadre Placer tous les rsultats (Feuilles de donnes,
Graphiques) dans. Cliquez sur le bouton OK afin de revenir la bote de dialogue Statistiques
Descriptives.
Cliquez sur le bouton Variables afin d'accder une bote de dialogue de slection de variables, slectionnez les variables MESURE1 et MESURE2, puis cliquez sur le bouton OK afin
de revenir la bote de dialogue Statistiques Descriptives. Dans l'onglet Base, cliquez sur le
bouton Statistiques : Synthse afin d'envoyer les rsultats dans un classeur. La bote de dialogue Statistiques Descriptives va alors se rduire automatiquement pour vous permettre de
visualiser les rsultats ; restaurez la bote de dialogue en cliquant sur le bouton Statistiques
Descriptives dans la Barre d'Analyse, dans l'angle infrieur gauche de l'cran. Cliquez maintenant sur le bouton Histogrammes afin de produire un histogramme de chacune des variables
slectionnes. La bote de dialogue de l'analyse va nouveau se rduire, et le classeur devrait
prsent avoir l'aspect illustr ci-contre.

176 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES

Il s'agit du document que nous souhaitons publier sur le Portail. Dans le menu Serveur, slectionnez la commande Enregistrer Sous. La bote de dialogue Entrept de WebSTATISTICA
apparat avec une liste de dossiers de WebSTATISTICA. Ouvrez le dossier Portail, puis slectionnez le rpertoire Exemples, et cliquez sur le bouton OK afin d'enregistrer le classeur dans
ce dossier du Portail.

Vous pouvez visualiser ce document dans STATISTICA en ouvrant une fentre du navigateur
dans l'espace de travail STATISTICA. Dans le menu Serveur, slectionnez la commande Ouvrir
dans le Navigateur afin d'ouvrir une fentre du navigateur et vous connecter WebSTATISTICA. Dans le menu Fichier de WebSTATISTICA, choisissez l'option Oprations sur Mes Rpertoires ; dans la bote de dialogue Mes Rpertoires, vous pouvez ouvrir le dossier Exemples et
accder au fichier Classeur1.stw que nous avons enregistr. Slectionnez ce fichier et cliquez
sur le bouton Visualiser afin d'ouvrir le classeur dans le navigateur.

STATISTICA Prise en Main 177


Copyright StatSoft, 2010

CHAPITRE 5 : RSULTATS DES ANALYSES

178 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 6 : DOCUMENTS STATISTICA

180 STATISTICA Prise en Main


Copyright StatSoft, 2010

Les classeurs (prsents brivement page 154) constituent l'option de gestion par dfaut des
rsultats et conservent chaque document de sortie (par exemple, une feuille de donnes ou un
graphique STATISTICA, mais aussi un document Microsoft Word ou Excel) sous forme d'onglets.

D'un point de vue technique, les classeurs STATISTICA sont des containers ActiveX optimiss (pouvant stocker efficacement de grandes quantits de documents ; voir page 248 pour
plus d'informations). Les documents peuvent tre organiss sous forme hirarchique de dossiers ou de groupes de documents (par dfaut, un par analyse) en utilisant une arborescence,
dans laquelle les documents individuels, dossiers ou rpertoires entiers de l'arborescence peuvent tre manipuls de faon flexible.

STATISTICA Prise en Main 181


Copyright StatSoft, 2010

CHAPITRE 6 : DOCUMENTS STATISTICA


Vous pouvez ainsi extraire des documents (par exemple, l'aide des fonctionnalits GlisserCopier ou Glisser-Dplacer) vers un rapport ou vers l'espace de travail de l'application (c'est-dire, l'arrire-plan de l'application STATISTICA o ils apparaissent sous forme de fentres
indpendantes). Vous pouvez, de diverses manires, placer des branches entires dans d'autres
classeurs pour personnaliser l'organisation de vos dossiers, etc...
Chaque classeur se compose de deux parties : une arborescence de type Explorateur, situe
dans la partie gauche du classeur, vous permet de naviguer entre les diffrents documents qui
apparaissent dans la partie droite (volet de visualisation). L'arborescence peut tre organise en
diffrents rpertoires, ce qui vous permet d'effectuer des regroupements logiques de fichiers
(par exemple, toutes les sorties d'analyse, toutes les macros cres pour un projet). Les onglets
situs sous la fentre d'affichage des documents (du classeur) vous permettent de naviguer
aisment entre les diffrents lments du dossier en cours. Vous pouvez facilement dplacer
les onglets en haut, droite ou gauche du classeur en cliquant avec le bouton droit de la souris sur un onglet et en slectionnant le positionnement des onglets dans le menu contextuel.
Vous pouvez ainsi organiser les onglets sur plusieurs ranges situes sur le ct (comme illustr ci-dessous) plutt que sur une seule et longue range, ce qui permet d'accder plus facilement l'onglet appropri.

Vous pouvez galement supprimer l'affichage des onglets pour gagner de la place. Contrairement la plupart des applications d'organisation ou de navigation de type Explorateur qui ne
permettent d'attacher les diffrents lments qu' des dossiers, le classeur STATISTICA permet
chaque lment de l'arborescence d'avoir ses propres sous-dossiers (dpendances). Par
exemple, vous pouvez ajouter une feuille de donnes votre classeur, puis ajouter les graphiques produits partir de ces donnes comme des sous-dossiers de la feuille de donnes.

182 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 6 : DOCUMENTS STATISTICA


Diverses fonctionnalits comme le Glisser-dplacer ou les oprations du Presse-papiers vous
permettent de rorganiser simplement les lments de vos classeurs.
Le classeur peut comporter tout type de document natif de STATISTICA : feuilles de donnes,
graphiques, rapports et macros. Mais il peut aussi contenir d'autres types de documents
ActiveX comme des feuilles de calcul Excel, des documents Word, etc... Vous pouvez modifier ces documents directement dans le volet droit du classeur. Pour modifier un document
Microsoft Word, double-cliquez sur l'objet dans l'arborescence du classeur. Le document
Word s'ouvre alors dans le volet de visualisation du classeur et la barre de menu du classeur
fusionne avec la barre de menu de Microsoft Word, vous donnant accs toutes les fonctions
d'dition dont vous avez besoin. Les classeurs peuvent galement tre utiliss pour stocker
toutes les sorties d'une analyse particulire.

L'arborescence du classeur affiche l'organisation des fichiers et dossiers dans le classeur. Les
fichiers et dossiers sont affichs dans un format de type Explorateur. Le signe plus (+) situ
ct des diffrents lments indique la prsence de sous-dossiers ou sous-fichiers. Pour dvelopper l'arborescence d'un dossier ou d'un fichier particulier, cliquez sur le signe plus situ
ct de l'lment. Le classeur peut contenir un nombre illimit de niveaux et vous pouvez
manipuler les lments individuels ou des branches entires de l'arborescence de manire
flexible et interactive (par exemple, vous pouvez dplacer ou copier des lments issus d'un
classeur ou d'un rapport grce au menu contextuel, comme illustr sur la seconde image).

Pour analyser ou modifier un lment du classeur, pointez simplement le fichier dans l'arborescence et cliquez sur l'icne associe. Le document va alors apparatre dans le volet de visuSTATISTICA Prise en Main 183
Copyright StatSoft, 2010

CHAPITRE 6 : DOCUMENTS STATISTICA


alisation ( droite). Remarque : vous pouvez aussi naviguer entre les sous-dossiers de l'lment
slectionn grce aux onglets situs (par dfaut) en bas du volet de visualisation du classeur.
Comme indiqu prcdemment, vous pouvez aisment dplacer ces onglets en haut, droite
ou gauche du volet de visualisation du classeur en cliquant avec le bouton droit de la souris
sur l'un des onglets et en slectionnant l'option de placement souhaite dans le menu contextuel ou en slectionnant la commande respective dans le menu Classeur - Onglets. Remarque :
vous pouvez faire dfiler les onglets situs en haut et en bas du volet de visualisation, tandis
que les onglets situs gauche ou droite du volet sont affichs sur plusieurs ranges.
Les divers lments de l'arborescence sont identifis par des icnes. L'icne
reprsente un
dossier qui peut contenir diffrents documents et sous-dossiers. L'icne
d'un dossier avec
une petite flche rouge superpose indique que le script qui a permis de produire les rsultats
contenus dans le dossier respectif est attach au dossier. De cette manire, vous pouvez reprendre ou rexcuter l'analyse dans STATISTICA tout moment (pour plus d'informations, voir le
Chapitre 9 STATISTICA Visual Basic page 231). Les icnes des feuilles de donnes ( ),
rapports ( ), macros ( ) et graphiques ( ) reprsentent respectivement des feuilles de donnes, des rapports, des macros et des graphiques STATISTICA. L'icne du Data Miner ( )
reprsente des espaces de travail du Data Miner.
Par dfaut, les documents externes STATISTICA sont reprsents par l'icne associe leur
application. Par exemple, les documents Word sont reprsents par l'icne Word ( ) et les
feuilles de calcul Excel sont reprsents par l'icne Excel ( ).

L'arborescence du classeur peut tre organise et modifie en utilisant les fonctionnalits Glisser-Dplacer et les oprations du Presse-papiers. Veuillez vous reporter aux rubriques Fonctions Glisser-Dplacer du Classeur et Oprations du Presse-papiers du Classeur dans le
Manuel lectronique. Les commandes Insrer, Extraire, Supprimer et Dplacer sont accessibles par le menu contextuel de l'arborescence (en cliquant avec le bouton droit de la souris
sur l'arborescence). Ces commandes sont galement accessibles partir du menu Classeur.
184 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 6 : DOCUMENTS STATISTICA

Les feuilles de donnes STATISTICA utilisent la technologie des tableaux multimdia brevete
par StatSoft ; elles permettent de manipuler la fois les donnes d'entre et les sorties numriques ou du texte (et d'autres types de sorties). Les feuilles de donnes se prsentent sous forme
de tableaux en deux dimensions, pouvant stocker un nombre pratiquement illimit d'observations (lignes) et de variables (colonnes), et chaque cellule peut comporter un nombre de caractres quasi-illimit. Il est galement possible d'attacher des sons, vidos, graphiques, animations, rapports avec des objets incorpors ou tout document compatible ActiveX.

Parce que les feuilles de donnes STATISTICA peuvent galement comporter des macros et
toute interface-utilisateur personnalise, ces tableaux multimdia peuvent servir de cadre pour
dvelopper vos propres applications personnalises (par exemple, avec une liste d'options ou
une srie de boutons placs dans l'angle suprieur gauche ; voir ci-aprs), des prsentations
auto-excutables, des animations, des simulations, etc

STATISTICA Prise en Main 185


Copyright StatSoft, 2010

CHAPITRE 6 : DOCUMENTS STATISTICA

Les donnes STATISTICA sont organises sous forme d'observations et de variables. Si ce concept ne vous est pas
familier, vous pouvez considrer les observations comme des enregistrements dans une base
de donnes (ou comme les lignes d'une feuille de donnes), et les variables comme des champs
(ou comme les colonnes d'une feuille de donnes). Chaque observation est constitue d'un
ensemble de valeurs (des diffrentes variables) et la premire colonne du fichier peut ventuellement contenir le nom des observations.
Les feuilles de donnes comprennent diverses composantes (voir ci-dessous).

186 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 6 : DOCUMENTS STATISTICA


La Barre de Titre indique le nom de la feuille de donnes, suivi de l'extension propre aux feuilles de donnes (.sta). S'il s'agit d'une feuille de donnes d'entre, la
Barre de Titre reportera galement le nombre de variables et d'observations (par exemple, 25
var. et 50 obs.). La Barre de Titre ci-contre contient le texte Donnes : Adstudy.sta (25 var. et
50 obs.).
Pour slectionner toute la feuille de donnes, cliquez une fois dans la Bote
(le pointeur de la souris reste la flche par dfaut) situe dans l'angle suprieur gauche
de la feuille de donnes. Pour slectionner uniquement la Bote d'Info (afin de modifier le texte
ou la mise en forme), placez le pointeur de la souris dans l'angle suprieur gauche de la Bote
d'Info (il se transforme alors en
) et cliquez avec le bouton gauche de la souris. Pour saisir
ou modifier du texte dans la Bote d'Info (par exemple, d'autres informations relatives la
feuille de donnes), double-cliquez dans la Bote d'Info. Dans l'illustration ci-contre, la Bote
d'Info contient le texte Rponses.
d'Info

Juste au-dessus du nom des variables, en haut de la fentre, vous pouvez saisir
ou modifier une ligne de texte pour dcrire vos donnes en double-cliquant dans la zone Descriptif. Pour ne slectionner que le Descriptif (afin d'en modifier la mise en forme), cliquez une
fois dans l'angle suprieur gauche (le pointeur de la souris transforme alors en ). Pour ajouter de nouvelles lignes, appuyez sur CTRL+ENTRE ou sur ALT+ENTRE. Dans l'illustration cicontre, le Descriptif contient le texte Enqute amricaine sur l'efficacit d'une pub.
Ces cellules, situes l'extrme gauche de la fentre, contiennent le nom des observations. Double-cliquez sur un Nom d'Observation pour saisir ou modifier le nom de l'observation correspondante. Pour slectionner uniquement le Nom d'Observation (mise en forme), cliquez une fois gauche du Nom d'Observation (le pointeur de la souris
se transforme alors en ). Pour slectionner toute la ligne respective (dition), cliquez une
fois droite du Nom d'Observation (le pointeur de la souris se transforme alors en
). Pour
slectionner un bloc de Noms d'Observations (sans slectionner les lignes respectives), utilisez
l'option Slectionner les Noms d'Observations du menu contextuel de la feuille de donnes.
Pour ajuster automatiquement la taille des Noms d'Observations, double-cliquez entre les
Noms d'Observations et la premire colonne du fichier (le pointeur de la souris se transforme
alors en
). Dans l'illustration ci-contre, les Noms d'Observations contiennent l'initiale du
prnom et le nom des personnes interroges dans l'tude. Remarque : les Noms d'Observations
sont facultatifs et vous pouvez afficher les numros correspondants en dslectionnant l'option
Noms d'Observations dans le menu Affichage.
Ces cellules situes en haut de chaque colonne, contiennent le nom
des variables respectives. Pour afficher le dtail d'une variable, double-cliquez sur le Nom de la
Variable respective. Pour slectionner le Nom de Variable (mise en forme) cliquez une fois
STATISTICA Prise en Main 187
Copyright StatSoft, 2010

CHAPITRE 6 : DOCUMENTS STATISTICA


dans la partie suprieure du Nom de Variable (le pointeur de la souris se transforme alors en
). Pour slectionner une colonne entire (dition) cliquez une fois dans la partie infrieure
du Nom de la Variable (le pointeur de la souris se transforme alors en ). Pour ajuster automatiquement la largeur des colonnes, double-cliquez entre deux Noms de Variables (le pointeur
de la souris se transforme alors en ). Dans l'illustration prcdente, les deux premiers Noms
de Variables sont Sexe et Pub. Vous pouvez personnaliser les Noms des Variables en ajoutant
le numro de la colonne, la description dtaille de la variable, et/ou le type de la variable respective. Ces options sont accessibles par le menu Affichage - Noms des Variables.
Le corps de la feuille
de donnes contient les donnes relatives aux observations et aux variables, et peut ventuellement contenir divers objets incorpors ou lis (objets multimdia, macros, interface-utilisateur
personnalise). Le texte des cellules peut tre de longueur pratiquement illimite (dans la plupart des configurations de STATISTICA, il est toutefois limit 1 000 caractres pour prvenir
un collage involontaire de grandes quantits de donnes non dsires dans une cellule).
Chaque cellule peut tre mise en forme en utilisant des polices de caractres ou des attributs
diffrents.

STATISTICA permet d'ouvrir et de travailler sur plusieurs feuilles de donnes en mme temps.
Les feuilles de donnes de STATISTICA stockent les donnes mais servent galement afficher les rsultats numriques des analyses. Puisque STATISTICA offre les mmes fonctionnalits pour les feuilles de donnes d'entre (dont sont issues les donnes analyses) et les feuilles
de donnes de sortie (o sont envoys les rsultats de l'analyse), il est facile d'utiliser les
rsultats d'une analyse en entre d'une autre analyse.
Une feuille de donnes pralablement enregistre est automatiquement traite comme une
feuille de donnes d'entre et vous pouvez ouvrir simultanment autant de feuilles de donnes
d'entre que vous le souhaitez. En revanche, afin d'viter toute confusion, les feuilles de donnes de sortie (avec les rsultats des analyses) ne sont pas considres automatiquement comme des donnes d'entre. Vous devez le spcifier explicitement avant de pouvoir les utiliser en
entre d'une autre analyse. En outre, les feuilles de donnes d'entre indiquent le nombre de
variables et d'observations de la feuille de donnes dans la barre de titre. Par exemple, Exp.sta
(88 var. et 48 obs.) est une feuille de donnes d'entre, contrairement Exp.sta.
Pour transformer une feuille de donnes de sortie en feuille de donnes d'entre, slectionnez
la feuille de donnes respective puis cochez l'option Feuille de Donnes Active dans le menu
188 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 6 : DOCUMENTS STATISTICA


Donnes.

STATISTICA va alors utiliser cette feuille de donnes pour l'analyse. Si vous revenez
une autre feuille de donnes prcdemment dfinie comme feuille de donnes d'entre, elle
pourra, elle aussi, tre utilise pour l'analyse.
Dans un classeur, vous ne pouvez utiliser qu'une seule feuille de donnes d'entre la fois
pour vos analyses, mme si le classeur en comporte plusieurs. Cette feuille de donnes est
appele feuille de donnes active et son icne (dans l'arborescence) est encadre en rouge.
Par dfaut, lorsque vous dfinissez une feuille de donnes de sortie en feuille de donnes
d'entre, STATISTICA la considre automatiquement comme feuille de donnes active. Pour
slectionner une autre feuille de donnes d'entre comme feuille de donnes active, slectionnez la feuille de donnes respective dans l'arborescence puis cochez l'option Feuille de Donnes Active dans le menu Classeur ou dans le menu contextuel de l'arborescence du classeur.

Vous pouvez galement conserver une feuille de donne ouverte l'cran, tout en la rendant
indisponible pour les analyses. Pour ce faire, slectionnez tout d'abord la feuille de donnes,
puis dslectionnez l'option Feuille de donnes active dans le menu Donnes. STATISTICA va
alors automatiquement utiliser la dernire feuille de donnes active utilise pour une analyse.

Les rapports STATISTICA (brivement dcrits page 157) permettent de manipuler les sorties
de faon plus traditionnelle (par rapport aux classeurs) puisque les objets (par exemple, une
feuille de donnes ou un graphique STATISTICA ou encore une feuille de calcul Microsoft

STATISTICA Prise en Main 189


Copyright StatSoft, 2010

CHAPITRE 6 : DOCUMENTS STATISTICA


Excel) apparaissent de faon squentielle, les uns en dessous des autres, comme dans un
traitement de texte.

Cependant, la technologie derrire ce simple rapport vous offre de riches fonctionnalits. Par
exemple, comme pour le classeur, chaque rapport STATISTICA est aussi un container ActiveX (voir page 248), o chaque objet (non seulement les feuilles de donnes et les graphiques STATISTICA mais aussi tout document compatible ActiveX, comme un document Word
ou une image Bitmap) est actif, personnalisable, et ditable directement. Les rapports sont
enregistrs au format STR, qui est l'extension StatSoft du format RTF (Rich Text Format,
*.rtf) de Microsoft. Les fichiers STR stockent la mme information que les fichiers RTF, mais
prservent en plus l'information sur l'arborescence (qui ne peut pas tre stocke dans les
fichiers RTF standard). Dans STATISTICA, les fichiers de rapport sont enregistrs par dfaut
avec l'extension *.str, mais peuvent aussi tre enregistrs au format standard RTF (dans ce cas,
l'information sur l'arborescence n'est pas conserve).
Cette manire de procder offre des avantages vidents dans la mesure o il est facile d'insrer
des notes et commentaires entre les objets et que cette manire plus traditionnelle (par rapport
aux classeurs) correspond ce que certains utilisateurs ont l'habitude de manipuler avec des
rsultats les uns suite des autres. En outre, le rapport de sortie contient des informations
comme les options spcifies pour l'analyse (par exemple, les variables slectionnes, leur description dtaille, etc...) ; vous pouvez demander des informations complmentaires plus ou
moins dtailles dans le volet d'options Analyses/Graphiques - Gestionnaire de Sorties de la
bote de dialogue Options (accessible par le menu Fichier - Gestionnaire de Sorties).

190 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 6 : DOCUMENTS STATISTICA


L'inconvnient majeur de ces rapports traditionnels demeure toutefois la structure plate inhrente impose par leur format de style traitement de texte, bien que ce soit prcisment ce que
certains utilisateurs ou applications prfrent.

L'arborescence du rapport affiche l'organisation des fichiers et dossiers dans le rapport. Les
fichiers et dossiers sont affichs dans un format de type Explorateur. Toutefois, contrairement
aux classeurs qui permettent de dfinir une hirarchie quasi-illimite de dossiers, sous-dossiers
et fichiers, vous ne pouvez dfinir qu'un seul niveau de fichiers dans les rapports.
Vous pouvez incorporer tout type de document STATISTICA dans un rapport, notamment des
feuilles de donnes, graphiques et analyses. Vous pouvez insrer d'autres objets ActiveX/OLE,
comme des feuilles Excel, des documents Word, des images bitmap, etc... Pour diter un
document insr, il suffit de double-cliquer dessus. Le fichier apparat alors dans un diteur et
la barre d'outils du Rapport fusionne avec la barre d'outils de l'application native du fichier
insr, vous permettant ainsi d'accder toutes les fonctions d'dition ncessaires.
Les lments de l'arborescence sont reprsents par une icne. Les icnes des feuilles de donnes ( ), rapports ( ), macros ( ) et graphiques ( ) reprsentent respectivement des feuilles de donnes, des rapports, des macros et des graphiques STATISTICA. L'icne du Data
Miner ( ) reprsente des espaces de travail du Data Miner.
Tous les documents externes STATISTICA sont reprsents par l'icne associe leur application. Par exemple, les documents Word sont reprsents par l'icne Word ( ), et les feuilles
de calcul Excel sont reprsentes par l'icne Excel ( ).

STATISTICA Prise en Main 191


Copyright StatSoft, 2010

CHAPITRE 6 : DOCUMENTS STATISTICA


Diverses commandes permettent d'insrer, extraire, renommer et supprimer des lments de
l'arborescence du rapport sont accessibles dans le menu contextuel de l'arborescence du rapport (en cliquant avec le bouton droit de la souris sur l'arborescence, comme illustr la page
prcdente).

Les documents graphiques constituent un autre type de document STATISTICA et offrent de


riches fonctionnalits, la fois en termes de possibilits de cration de graphiques dans STATISTICA et d'outils de personnalisation.
Comme pour tous les autres documents STATISTICA, les graphiques sont des containers ActiveX (voir page 248), ce qui signifie qu'ils peuvent incorporer un grand nombre de documents compatibles (par exemple, Visio drawings, illustrations Adobe, feuilles de calcul Excel,
etc...). Les graphiques STATISTICA sont galement des objets ActiveX et par consquent, peuvent tre lis ou incorpors dans d'autres documents compatibles (par exemple, documents
Word) o ils peuvent tre modifis directement en double-cliquant dessus).
Les graphiques sont dcrits plus en dtail dans le Chapitre 7 Graphiques, page 199.

Le langage standard STATISTICA Visual Basic (largement utilis dans le monde industriel et
intgr STATISTICA) offre une interface-utilisateur alternative toutes les fonctionnalits de
STATISTICA et constitue bien plus qu'une nouvelle application de programmation permettant d'crire des extensions personnalises. STATISTICA Visual Basic tire pleinement parti de
l'architecture du modle-objet de STATISTICA et permet d'accder par programmation tous
les aspects et la plupart des fonctionnalits de STATISTICA. Mme les analyses et les graphiques les plus complexes peuvent tre enregistrs dans des macros Visual Basic que vous pouvez ensuite excuter de faon rptitive ou modifier et utiliser comme des blocs de construction dans d'autres applications. STATISTICA Visual Basic ajoute un arsenal de plus de 14.000
nouvelles fonctions la syntaxe complte de Microsoft Visual Basic, devenant l'un des environnements de dveloppement les plus riches et complets actuellement disponibles.

192 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 6 : DOCUMENTS STATISTICA

Vous pouvez enregistrer les macros STATISTICA dans diffrents formats, selon la manire
dont vous souhaitez les utiliser (voir aussi le Manuel lectronique pour plus d'informations).
Vous pouvez galement les copier dans le Presse-papiers et les coller dans d'autres programmes ou documents.
Vous trouverez une prsentation plus approfondie de STATISTICA Visual Basic dans le
Chapitre 9 (page 231).

Lorsque vous ralisez des analyses et que vous travaillez avec des documents STATISTICA,
vous avez gnralement un certain nombre de fentres l'cran et diverses analyses des
stades d'avancement diffrents. STATISTICA vous permet d'enregistrer votre espace de travail,
y compris les analyses en cours. Vous pouvez fermer STATISTICA tout moment et l'ouverture du projet, les fichiers prcdemment ouverts et toute analyse en cours seront automatiquement restaurs.
Pour enregistrer un Projet STATISTICA, slectionnez la commande Enregistrer le Projet Sous
du menu Fichier afin d'accder la bote de dialogue Enregistrer un Projet STATISTICA.

STATISTICA Prise en Main 193


Copyright StatSoft, 2010

CHAPITRE 6 : DOCUMENTS STATISTICA

Cette bote de dialogue vous permet de spcifier le nom de fichier et le chemin du Projet STATISTICA (avec l'extension .spf). Vous pouvez dfinir les lments spcifiques intgrer dans le
Projet. Vous pouvez slectionner tous les types de documents STATISTICA (Feuilles de donnes,
Graphiques, Classeurs, Macros, Rapports, Projets du Data Miner, Connexions d'Interface Directe
avec les Bases de Donnes, Analyses et Rsultats des analyses). Pour les documents STATISTICA
enregistrs sur disque, vous pouvez tablir une Liaison avec le fichier existant du document ou au
contraire, enregistrer une copie du document tel qu'il apparaissait l'cran au moment de son enregistrement dans le fichier du Projet STATISTICA (Intgrer le document dans le projet).
Outre les documents STATISTICA, les fichiers des Projets peuvent galement enregistrer
toutes les analyses en cours. Le Projet va alors stocker les scripts crs automatiquement lors
de l'excution des diffrentes analyses. l'ouverture du Projet, les scripts des analyses sont
nouveau excuts sur les donnes originales et les botes de dialogue des analyses sont restaures exactement comme elles l'taient au moment de l'enregistrement du fichier du Projet.
Les Projets constituent une manire efficace de partager les diffrentes tapes des analyses en
cours et leurs rsultats entre diffrents utilisateurs si vous intgrez les documents enregistrs
dans le Projet. Un utilisateur peut excuter des analyses jusqu' un stade particulier, puis enregistrer le Projet avant de le transmettre un autre utilisateur, qui sera alors en mesure d'ouvrir
le fichier du Projet et poursuivre l'analyse exactement o le premier utilisateur s'est arrt.
Sauf si vous avez paramtr STATISTICA diffremment, vous recevrez automatiquement un
message vous proposant d'enregistrer un Projet en quittant STATISTICA et le dernier Projet
194 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 6 : DOCUMENTS STATISTICA


enregistr est automatiquement ouvert au dmarrage de l'application. Ainsi, STATISTICA vous
permet de reprendre vos travaux de la veille l'endroit exact o vous vous tiez arrt(e).
Remarque : un projet correspond la photographie d'une instance de STATISTICA. Par consquent, contrairement aux autres documents, vous ne pouvez pas ouvrir plusieurs projets dans
une mme instance de STATISTICA. Vous devez ncessairement ouvrir autant d'instances de
STATISTICA que vous souhaitez ouvrir simultanment de projets diffrents.

L'interface du Data Miner Plus constitue une solution qui dcompose toutes les phases d'une
dmarche de data mining jusqu'aux rsultats. Depuis la phase de prparation des donnes
jusqu' la validation du modle, Data Miner Plus vous guide du dbut la fin de votre analyse
de manire obtenir des rponses et des rsultats que vous pouvez mettre en uvre rapidement. STATISTICA Data Miner Plus applique la gamme la plus complte d'algorithmes de
data mining, sans que l'utilisateur n'ait connatre le dtail de ces algorithmes.
STATISTICA Data Miner offre une large gamme de mthodes et algorithmes de data mining.
En termes trs gnraux, ces algorithmes empruntent l'approche et la mthodologie de diffrents domaines comme les statistiques, l'ingnierie, l'intelligence artificielle, les sciences
cognitives, etc..., afin de mettre en vidence des phnomnes partir des donnes pour en
tirer des prvisions (dans le domaine des assurances ou des crdits risques, de la qualit d'un
produit ou d'un processus, des dfaillances matrielles, des diagnostics mdicaux, etc). Le
Manuel lectronique de STATISTICA et sa version anglaise en ligne (le Manuel lectronique
de Statistiques) proposent une introduction dtaille aux principales mthodes et techniques
habituellement regroupes sous la terminologie du data mining.
Dans la pratique, certains types de mthodes et d'algorithmes se rvlent plus efficaces pour
certains domaines ou certains types de donnes spcifiques. Par exemple, les techniques de data
mining les plus efficaces pour modliser les donnes des indemnisations d'assurance sont gnralement diffrentes de celles qui permettent d'obtenir les meilleurs rsultats pour prvoir les
rejets mis par un haut fourneau. Ceci tant dit, il existe une dmarche type qui va de la dfinition des donnes et du problme analytique l'chantillonnage, la construction du modle et
l'valuation qui peut s'appliquer toutes les tches de data mining prdictif.
L'interface-utilisateur du Data Miner Plus permet des utilisateurs ne disposant pas d'une
grande exprience des outils du data mining, de passer rapidement de la dfinition d'une problmatique des rsultats tangibles et directement actionnables.

STATISTICA Prise en Main 195


Copyright StatSoft, 2010

CHAPITRE 6 : DOCUMENTS STATISTICA

Avec cette approche, vous n'avez qu' vous laisser guider dans une interface-utilisateur de type
Assistant pour complter les tapes ncessaires jusqu' la solution. En fait, la plupart de ces
tapes sont entirement automatises et vous ne devez spcifier en entre que les donnes et
les variables analyser : le programme s'occupe automatiquement du reste dterminer les
chantillons d'apprentissage et de test, slectionner les meilleurs prdicteurs, essayer diffrents
algorithmes et mthodes de data mining, et tester automatiquement les rsultats afin de choisir
le meilleur modle de data mining. Vous pouvez raliser ces calculs et analyses dans la version bureautique de STATISTICA Data Miner ou dans la version Client-Serveur, WebSTATISTICA Data Miner si vous disposez de la licence ncessaire.

196 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 6 : DOCUMENTS STATISTICA

Lorsque vous enregistrez un projet du data miner (Data Miner Plus) en cours de ralisation,
deux fichiers distincts sont en fait crs :
Un fichier Data Miner Plus portant l'extension .dmrproj
Un fichier de Classeur STATISTICA portant le mme nom avec l'extension .stw, et contenant les rsultats et informations de chaque phase de l'Assistant
Il est important que les deux fichiers soient situs dans le mme dossier. Ainsi, pour copier un
projet du Data Miner Plus, disons MonProjetDataMiner vers un nouveau rpertoire, l'envoyer
un collgue par messagerie lectronique, ou l'intgrer dans le systme STATISTICA Gestion
Documentaire, vous devrez copier les deux fichiers MonProjetDataMiner.dmrproj et
MonProjetDataMiner.stw vers le nouvel emplacement.
Ci-aprs, diverses informations concernant ces deux fichiers.
Les fichiers Data Miner Plus sont des fichiers
stocks au format XML (extensible markup language) et contenant toutes les informations relatives aux choix de l'utilisateur (ou aux choix effectus automatiquement par le programme),
notamment :
L'information relative au fichier de donnes (ou la connexion aux donnes)
La slection des variables et les mtadonnes relatives ces variables (par exemple, la dfinition des variables de sortie et des prdicteurs catgoriels et continus)
Les choix concernant les phases de prparation des donnes (par exemple, la gestion des
valeurs manquantes, le filtrage des doublons, les transformations, etc...)
La slection finale des variables retenus par les algorithmes de slection des meilleurs prdicteurs
Les rsultats de la construction du modle, les tests finaux de comparaison des modles
ainsi que le choix des modles
Toutes les informations ncessaires au dploiement des modles prdictifs et la prvision
des nouvelles observations (par exemple, pour rintgrer des scores dans des bases de donnes, tablir des valeurs sensorielles, calculer des probabilits prvues de dfaillance ou de
risque, etc)
Par consquent, lorsque vous dployez des solutions Data Miner Plus dans la version STATISTICA Entreprise afin de calculer automatiquement des valeurs prvues dans une application
STATISTICA Prise en Main 197
Copyright StatSoft, 2010

CHAPITRE 6 : DOCUMENTS STATISTICA


entreprise (crdit scoring automatis, analyse des pannes et cartes de contrle multivaries,
etc...), toutes les informations ncessaires aux calculs des valeurs ou classifications prvues,
aux probabilits de classification (par exemple, probabilit de dfaillance, pertes), etc sont
stockes dans les fichiers au format XML.
Ces fichiers contiennent toutes les
informations dcrivant les rsultats chaque tape.

Les rsultats stocks dans ce classeur fournissent une information complte sur les calculs et
les analyses raliss par le Data Miner Plus. Ainsi, lorsque des analyses de data mining sont
menes dans des environnements rglements (par exemple, FDA, ISO, etc...), ou si le data
mining intervient dans une organisation au niveau d'activits sensibles qui sont encadres et
rglementes par certaines procdures techniques, ou autres procdures normalises d'exploitation (SOP - Standard Operating Procedures en anglais), il est gnralement conseill de
stocker ce fichier dans le systme STATISTICA Gestion Documentaire avec le fichier du projet
Data Miner Plus (.dmrproj).

198 STATISTICA Prise en Main


Copyright StatSoft, 2010

STATISTICA Prise en Main 199


Copyright StatSoft, 2009

CHAPITRE 6 : DOCUMENTS STATISTICA

200 STATISTICA Prise en Main


Copyright StatSoft, 2010

Les graphiques ont vocation reprsenter et communiquer de faon efficace des informations
(habituellement, des donnes numriques). Toutefois, les techniques graphiques constituent
galement des outils analytiques puissants pour explorer les donnes et vrifier des hypothses.
STATISTICA offre une large gamme de
mthodes graphiques pour analyser des donnes et reprsenter les rsultats. Tous les graphiques de STATISTICA comportent une vaste slection de techniques analytiques intgres et
interactives ainsi que de nombreux outils de personnalisation pour contrler de faon interactive la plupart des aspects de l'affichage. En outre, vous disposez de fonctionnalits de gestion multi-graphiques pour intgrer divers graphiques et construire des liens dynamiques entre
des applications (par exemple, par la technologie OLE de Liaison et Incorporation d'Objets).
Vous pouvez
accder aux options graphiques de STATISTICA par programmation (grce au langage intgr
STATISTICA Visual Basic ou d'autres langages compatibles), ce qui ouvre des possibilits
quasi-infinies pour produire des graphiques ultra-personnalisables. Vous pouvez alors ajouter
ces graphiques personnaliss de faon permanente l'interface-utilisateur de STATISTICA (par
exemple, en les affectant des boutons des barres d'outils ou en les ajoutant des menus).
STATISTICA offre diverses mthodes pour raliser des graphiques. Ces mthodes sont dcrites dans la section Grandes Catgories de Graphiques, page 207. Elles sont complmentaires et fournissent un haut niveau d'intgration
entre les donnes numriques (donnes brutes, rsultats intermdiaires ou rsultats finaux) et
leur reprsentation graphique. Vous pouvez ainsi produire automatiquement des graphiques

STATISTICA Prise en Main 201


Copyright StatSoft, 2010

CHAPITRE 7 : GRAPHIQUES
spcialiss en sortie de vos procdures statistiques ou grce aux outils intgrs pour visualiser
toute combinaison numrique (et/ou de valeurs-texte) produite par STATISTICA.

Les options de personnalisation


des graphiques de STATISTICA offrent des centaines de fonctionnalits et outils pour ajuster
chaque aspect de l'affichage. Ces options sont organises de faon hirarchique pour permettre
un accs direct aux options les plus courantes, en double-cliquant sur l'lment personnaliser
dans le graphique ou en utilisant le menu contextuel associ (accessible en cliquant avec le
bouton droit de la souris sur l'lment respectif du graphique).
Le paramtrage initial
(par dfaut) de l'ensemble de ces fonctionnalits est aisment modifiable pour que l'aspect par
dfaut et le comportement des graphiques STATISTICA rpondent vos besoins spcifiques
et/ou ne ncessitent qu'une intervention limite de l'utilisateur. Vous pouvez oprer ces ajustements de quatre manires diffrentes :
La manire la plus simple de modifier l'aspect par dfaut des graphiques consiste utiliser les volets d'options Documents : Graphs - Affichage
et Documents : Graphs - Paramtres de la bote de dialogue Options (accessible par le
menu Outils - Options). Vous pouvez y paramtrer les options les plus courantes des styles
par dfaut (voir le point n 2), utiliss par le systme et sauvegards automatiquement dans
le fichier de configuration STATISTICA (par exemple, vous pouvez utiliser diffrents paramtrages pour diffrents projets). Pour plus d'informations, voir le descriptif du volet d'options Configurations de la bote de dialogue Options dans le Manuel lectronique.
Toutes les fonctionnalits affectant l'apparence
du graphique (des plus lmentaires comme la couleur de la police du pied de page, aux plus
gnralistes comme les fonctionnalits globales du document graphique) peuvent tre enregistres sous forme de styles individuels. Vous pouvez affecter des noms personnaliss ces
styles et les appliquer ultrieurement grce des raccourcis (par exemple, en appuyant sur une
combinaison spcifique de touches ou en cliquant sur un bouton d'une barre d'outils
personnalise). Un systme intelligent gre en interne ces milliers de styles et leurs combinaisons dans STATISTICA et vous aide raliser vos personnalisations avec un minimum
d'efforts. Tous les styles personnaliss ou modifis sont enregistrs automatiquement dans le
fichier de configuration de STATISTICA (vous pouvez ainsi utiliser diffrents ensembles ou
202 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 7 : GRAPHIQUES
systmes de styles pour diffrents projets). Pour plus d'informations, voir le descriptif du volet
d'options Configurations de la bote de dialogue Options dans le Manuel lectronique.
Vous pouvez dfinir de nouveaux types de graphiques
de diverses manires et les ajouter aux menus, botes de dialogue ou barres d'outils. Si
vous souhaitez utiliser un graphique personnalis de faon rptitive (non pas un graphique construit de toutes pices, par exemple, l'aide des outils lmentaires de dessin, mais
au contraire, en personnalisant un graphique existant du menu Graphiques), vous pouvez
l'ajouter au menu Graphiques comme nouveau type de graphique en cliquant sur le bouton
Ajouter au Menu des Graphiques Personnaliss dans l'onglet Options 2 de la bote de
dialogue de dfinition du graphique. Toutes les spcifications du graphique personnalis
seront alors enregistres automatiquement dans le fichier de configuration de STATISTICA
(par exemple, vous pouvez dfinir diffrents groupes de graphiques personnaliss selon
vos diffrents projets). Pour plus d'informations, voir le descriptif du volet d'options Configurations de la bote de dialogue Options dans le Manuel lectronique.
Notez enfin qu'il n'existe aucune limite quant au degr
de personnalisation des graphiques STATISTICA parce que STATISTICA Visual Basic
(avec ses puissants outils de dessin et bibliothques de procdures graphiques bases sur
STATISTICA) permet de produire la plupart des graphiques ou sorties multimdia compatibles avec le matriel informatique actuel. Ces affichages personnaliss ou sorties multimdia peuvent alors tre affects aux barres d'outils STATISTICA, aux menus ou aux
botes de dialogue et devenir partie intgrante de votre application STATISTICA.
Voir le Manuel lectronique pour plus d'informations sur ces diffrentes mthodes de personnalisation des graphiques. Le Manuel lectronique contient diffrentes rubriques consacres
aux diffrentes catgories de graphiques, avec des introductions conceptuelles et des exemples
d'applications courantes, et aborde les proprits fonctionnelles qui caractrisent ces diffrents
types de graphiques.
Les paramtres par dfaut de la plupart des graphiques STATISTICA respectent les conventions explicitement dcrites dans les ouvrages de statistique ou de reprsentation graphique, ou
qui constituent des normes communment acceptes par les principaux journaux scientifiques
(par exemple, SCIENCE). Toutefois, vous avez la possibilit de personnaliser quasiment tous
les paramtres par dfaut de STATISTICA afin de rpondre des besoins spcifiques pour des
applications particulires (voir page 202). Les fonctionnalits graphiques de STATISTICA
constituent une bote outils modulable, en mesure de produire des effets ultra-professionnels.
En outre, vous pouvez personnaliser ces outils ou crer vos propres outils, et les intgrer aux
barres d'outils et aux menus pour une utilisation rpte (voir page 202).

STATISTICA Prise en Main 203


Copyright StatSoft, 2010

CHAPITRE 7 : GRAPHIQUES
Outre une gamme complte de graphiques statistiques et techniques standard, STATISTICA offre de nombreux types de graphiques et fonctionnalits de personnalisation indits. Si les statisticiens de StatSoft en ont conu la grande majorit, il faut souligner le rle important que les
utilisateurs de STATISTICA ont pu jouer dans leur cration. En fait, la gamme actuelle d'options graphiques proposes dans STATISTICA est la rsultante des commentaires de milliers
d'utilisateurs qui ont rpondu aux sollicitations de StatSoft. De nombreuses fonctionnalits
spcifiques aux Graphiques STATISTICA (par exemple, les sous-ensembles multiples ou les
options de catgorisation interactives) ont t introduites en rponse aux suggestions et prconisations des utilisateurs. StatSoft tient ici remercier ses utilisateurs pour toutes leurs
suggestions.
Comme nous l'avons dj mentionn prcdemment (voir aussi page 207), il existe de nombreuses manires de faire appel des graphiques STATISTICA. Vous pouvez considrer que
ces mthodes constituent autant d'interfaces diffrentes entre des valeurs numriques et des
graphiques.
Par exemple, les valeurs d'un camembert (diagramme circulaire) peuvent simplement reprsenter les valeurs des observations successives (par exemple, les observations libelles Anne
2008, Anne 2009, Anne 2010,...) d'une colonne de la feuille de donnes (par exemple, la
variable Ventes). Les valeurs reprsentes sur un autre camembert du mme type, peuvent en
revanche reprsenter les rsultats d'un calcul particulier. Par exemple, les secteurs du camembert peuvent reprsenter le pourcentage d'observations appartenant diverses catgories calcules par une procdure de catgorisation d'histogramme ou d'effectifs (par exemple, le nombre
d'annes o les Ventes ont t infrieures 10 millions d'Euros, comprises entre 10 et 20
millions d'Euros et enfin, suprieures 20 millions d'Euros).
Quelle que soit la mthode utilise pour crer le graphique (c'est--dire, indpendamment de
l'origine des nombres reprsents dans le graphique ou de la manire dont ils ont t calculs),
toutes les fonctionnalits de personnalisation et de gestion multigraphique des graphiques
STATISTICA peuvent tre utilises pour modifier l'apparence du graphique ou l'intgrer d'autres graphiques ou documents.

204 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 7 : GRAPHIQUES

En outre, toutes les fonctionnalits analytiques intgres qui sont accessibles depuis les graphiques STATISTICA (ajustement d'une fonction, lissage, rotation, balayage et zoom analytique, etc...) peuvent tre appliques au graphique, quelle que soit la source des valeurs ou la
mthode utilise pour crer le graphique.
Les fonctions d'dition graphique offertes dans STATISTICA vous permettent de crer des publications scientifiques et techniques ultra-personnalises :

STATISTICA Prise en Main 205


Copyright StatSoft, 2010

CHAPITRE 7 : GRAPHIQUES
mais galement des tracs prcis :

ou encore des diagrammes, prsentations professionnelles ou cartes de qualit :

pour permettre de communiquer l'information de manire efficace et attrayante.

206 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 7 : GRAPHIQUES
Les graphiques enregistrs dans des fichiers ou temporairement dtachs de l'application STATISTICA (par exemple, copis dans le Presse-papiers ou lis un document d'une autre application) sont des objets complets (d'un point de vue technique, ce sont des objets ActiveX,
voir page 248) qui contiennent, outre les fonctionnalits de personnalisation et des objets
incorpors, toutes les donnes ncessaires la poursuite de l'dition des diffrents aspects de
l'affichage et l'analyse de son contenu (ajustement, lissage, etc...).
Comme les graphiques STATISTICA sont des objets ActiveX, ils peuvent aisment tre lis ou
incorpors dans d'autres documents compatibles (par exemple, des feuilles de calcul Excel ou
des documents Word) dans lesquels ils peuvent tre modifis directement en double-cliquant
dessus. Les graphiques STATISTICA sont galement des containers ActiveX et peuvent par
consquent comporter une large gamme de documents incorpors ou lis comme des dessins
Visio, des illustrations Adobe, des feuilles de calcul Excel ou des documents Word. En outre,
STATISTICA permet d'tablir des hirarchies d'objets incorpors jusqu' quatre niveaux, ce qui
signifie qu'il est possible de crer des documents, contenant des documents, contenant des
documents, contenant eux-mmes des documents.

Outre les graphiques statistiques spcialiss disponibles partir des botes de dialogue de
rsultats de toutes les procdures statistiques (voir page 219), il existe deux grandes catgories
de graphiques accessibles par le menu Graphiques, la barre d'outils Graphiques, les menus
contextuels et le bouton Dmarrer de STATISTICA ) :
Les graphiques des donnes d'entre (qu'il s'agisse des Graphiques des Donnes d'Entre,
voir page 208, ou des graphiques du menu Graphiques, voir page 213)
Les Graphiques de Blocs (voir page 211).
La principale diffrence entre ces deux grandes catgories rside dans les donnes que le graphique utilise pour produire le trac.
Les Graphiques des Donnes d'Entre et leur
version tendue du menu Graphiques, produisent une synthse statistique ou graphique des
donnes brutes de la feuille de donnes d'entre (d'une manire gnrale, une ou plusieurs variables, ou un sous-ensemble, si vous utilisez les filtres de slection). Si vous crez un graphique
de ce type par un menu contextuel dans une feuille de donnes ne contenant pas des donnes

STATISTICA Prise en Main 207


Copyright StatSoft, 2010

CHAPITRE 7 : GRAPHIQUES
brutes (par exemple, une matrice de corrlation), STATISTICA va utiliser les donnes brutes
pour produire le graphique (par exemple, le nuage de points des variables identifies par la cellule de la matrice de corrlations ayant servi appeler le menu contextuel).
Les Graphiques de Blocs sont indpendants du concept de donnes d'entre ou de fichier de donnes. Il s'agit d'un outil gnraliste pour reprsenter des
valeurs numriques d'un bloc de donnes slectionn dans une feuille de donnes (il peut s'agir
de rsultats numriques spcifiques ou d'une slection arbitraire de donnes brutes).
Ces deux
grandes catgories de graphiques offrent les mmes types de graphiques et options de personnalisation. Vous pouvez ainsi produire un graphique ternaire catgoris ultra-spcialis partir
du fichier de donnes d'entre (donnes brutes) ou d'un bloc de valeurs particulires slectionnes pour un test particulier (rsultats).
Ces deux grandes catgories de graphiques seront prsentes dans les deux sections suivantes,
puis dans la section sur le menu Graphiques, qui dcrit les autres graphiques de la premire
catgorie (graphiques des donnes d'entre), souvent appele graphiques du menu Graphiques,
bien qu'ils permettent galement d'accder aux Graphiques de Blocs ainsi qu' d'autres options.

La commande Graphiques des Donnes d'Entre du menu contextuel de toutes les feuilles de
donnes offre un accs rapide aux types de graphiques les plus courants.

208 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 7 : GRAPHIQUES
Tous ces graphiques sont galement accessibles par le menu Graphiques, le bouton Dmarrer
de STATISTICA ( ), ou en cliquant sur le bouton Galerie Graphique ( ) d'une bote de spcification d'un graphique. Les Graphiques des Donnes d'Entre offrent moins d'options que les
graphiques correspondants du menu Graphiques mais sont en revanche plus rapides slectionner puisque, contrairement aux graphiques du menu Graphiques :
les Graphiques des Donnes d'Entre peuvent tre appels directement depuis le menu
contextuel de la feuille de donnes,
les Graphiques des Donnes d'Entre ne ncessitent pas la slection d'options dans les
botes de dialogue (les graphiques sont produits avec les paramtres par dfaut), et
les Graphiques des Donnes d'Entre ne ncessitent pas la slection pralable des variables
(le choix des variables est fonction de la position du curseur dans la feuille de donnes).
Les Graphiques des Donnes d'Entre traitent les donnes directement depuis le fichier de
donnes ouvert et se servent de la position du curseur pour dterminer les variables utiliser
(quel que soit le type de feuille de donnes).
Ainsi, si vous cliquez avec le bouton droit de la souris sur une corrlation dans une feuille de
donnes et que vous crez un graphique du type Nuage de Points par, STATISTICA va produire le nuage en 2D partir des valeurs originales brutes des deux variables reprsentes par
cette corrlation (voir l'Exemple Introductif, page 11 pour plus de dtails).
Bien qu'il soit plus pratique (et sans doute plus logique) de slectionner les Graphiques des
Donnes d'Entre dans le menu contextuel de la feuille de donnes, vous pouvez galement les
slectionner partir du menu Graphiques ou partir du bouton Dmarrer
de STATISTICA.
Un sous-menu va alors apparatre, vous permettant de choisir un graphique statistique applicable la variable courante (identifie par la position du curseur dans la feuille de donnes).
Si la feuille de donnes est une matrice ou si elle possde un format dans lequel la position du
curseur fait rfrence, non pas une, mais deux variables (comme dans la matrice de corrlation illustre ci-aprs), le menu Graphiques des Donnes d'Entre va proposer des graphiques
bivaris prdfinis pour la paire de variables spcifie.

STATISTICA Prise en Main 209


Copyright StatSoft, 2010

CHAPITRE 7 : GRAPHIQUES

Dans les autres cas (c'est--dire lorsque la position courante du curseur ne fait rfrence qu'
une seule variable, comme illustr dans le tableau de statistiques descriptives ci-dessous), et
que vous slectionnez un graphique bivari dans le menu, STATISTICA va vous demander de
slectionner une seconde variable. Dans l'illustration suivante, si vous slectionnez l'option
Nuage de Points par, STATISTICA va vous demander la variable selon laquelle vous souhaitez reprsenter la variable Mesure5.

Si plusieurs variables sont en surbrillance (c'est--dire, lorsque le bloc slectionn s'tale sur
plusieurs variables), le menu Graphiques des Donnes d'Entre s'applique uniquement la
premire variable slectionne.
210 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 7 : GRAPHIQUES
Lorsque vous produisez un Graphique des Donnes d'Entre, STATISTICA tient compte des
filtres de slection et des pondrations qui sont dfinis pour reprsenter les variables. Notez
toutefois que les filtres de slection et/ou les pondrations doivent s'appliquer la feuille de
donnes courante (c'est--dire, en utilisant les commandes des menus Outils - Filtres de Slection - dition et Outils - Pondrations) et non pas seulement localement pour une analyse
particulire (c'est--dire, en utilisant les boutons
et
de la bote de spcification de
l'analyse ou du graphique respectif). Pour plus d'informations sur les diffrents types de Graphiques des Donnes d'Entre, voir le Manuel lectronique.

Contrairement aux Graphiques des Donnes d'Entre, les Graphiques de Blocs utilisent le bloc
de donnes en surbrillance dans la feuille de donnes active pour spcifier les donnes reprsenter dans le graphique.

Ces graphiques sont totalement indpendants du concept de donnes d'entre. Ils traitent les
valeurs numriques du bloc slectionn sans se proccuper de la signification de ces valeurs
(par exemple, il peut s'agir de donnes brutes ou de coefficients de corrlation). Ils permettent
de visualiser, explorer et synthtiser efficacement les rsultats numriques des analyses contenus dans les feuilles de donnes (par exemple, un histogramme des rsultats d'une simulation
de Monte Carlo dans le module SEPATH, ou une bote moustaches des moyennes agrges
issues d'un tableau de classification multiple dans le module ANOVA).

STATISTICA Prise en Main 211


Copyright StatSoft, 2010

CHAPITRE 7 : GRAPHIQUES
Bien qu'il soit plus pratique et sans doute plus logique de slectionner les Graphiques des Donnes d'Entre dans le menu contextuel de la feuille de donnes, vous pouvez aussi les slectionner partir du menu Graphiques ou du bouton Dmarrer
de STATISTICA. Lorsque vous
crez un Graphique de Bloc, vous pouvez produire un graphique par dfaut (par exemple,
Histogramme : Colonnes du Bloc ou Trac Curviligne : Lignes du Bloc), ou crer votre propre
graphique personnalis, soit pour les cellules slectionnes des lignes ou colonnes respectives,
soit pour l'ensemble des cellules des lignes ou des colonnes slectionnes (c'est--dire, mme
pour les valeurs qui ne sont pas slectionnes dans le bloc).
Les graphiques par dfaut (les six premires commandes de
l'illustration prcdente) permettent de crer les graphiques spcifis d'un simple clic. Pour une
information plus prcise sur ces graphiques par dfaut, reportez-vous au Manuel lectronique.
Slectionnez l'une des quatre commandes de Graphiques
pour accder la bote de dialogue Slection du Graphique, dans laquelle vous
trouverez diverses options pour crer vos graphiques personnaliss.
Personnaliss

Pour plus d'informations sur les graphiques personnaliss, voir aussi le Manuel lectronique.
Comme la plupart des fonctionnalits de STATISTICA, les Graphiques de Blocs sont entirement personnalisables. L'option Personnaliser la
Liste du menu Graphiques de Blocs permet d'accder la bote de dialogue Personnaliser le
Menu Graphique, et de supprimer, renommer ou modifier les graphiques lists ou d'en ajouter
de nouveaux (personnaliss) au menu Graphiques de Blocs.
Par exemple, si vous souhaitez ajouter un ajustement normal aux histogrammes crs par la
commande Histogramme : Colonnes du Bloc, slectionnez l'option Histogramme : Colonnes du
Bloc dans la bote de dialogue Personnaliser le Menu Graphique, cliquez sur le bouton dition,
et cochez l'option Ajustement Normal dans le cadre Type de Reprsentation. Tous les tracs
produits par la commande Histogramme : Colonnes du Bloc incluront dsormais un ajustement
normal.
212 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 7 : GRAPHIQUES

Le menu Graphiques (tout comme le bouton Dmarrer


de STATISTICA) vous donne accs
l'ensemble des graphiques statistiques et aux options de personnalisation disponibles dans
STATISTICA ; vous disposez ainsi de plusieurs centaines de types de reprsentation graphique
pour analyser et synthtiser vos donnes.
Contrairement aux Graphiques de Blocs (galement proposs dans ce menu pour complter les
autres options graphiques et les rendre accessibles partir d'un mme endroit), les autres types
de graphiques du menu Graphiques ne se limitent pas aux valeurs contenues dans votre feuille
de donnes de sortie. En revanche, ils traitent les donnes directement depuis la feuille de donnes d'entre, de la mme manire que les Graphiques des Donnes d'Entre (dcrits prcdemment). Ils constituent soit des mthodes standard pour synthtiser graphiquement les donnes brutes (par exemple, divers nuages de points, histogrammes ou tracs de tendance
centrale comme les mdianes), soit des techniques standard d'analyse graphique (par exemple,
des droites de Henry catgorises, des tracs d'cart la normalit ou des droites de rgression
avec intervalles de confiance). Lorsque vous produisez ces graphiques, STATISTICA tient
compte des filtres de slection et des pondrations dfinies pour les variables reprsenter.

STATISTICA Prise en Main 213


Copyright StatSoft, 2010

CHAPITRE 7 : GRAPHIQUES

Le menu Graphiques propose des Graphiques en 2D, des Graphiques Squentiels en 3D, des
Graphiques XYZ en 3D, des Tracs Matriciels, des Tracs de Figures, des Graphiques Catgoriss et des Graphiques Personnaliss. Notez que la partie suprieure de ce menu vous donne
accs aux graphiques les plus courants (Histogrammes, Nuages de Points, Tracs de Moyennes
avec Barres d'Erreur, etc...).
Comme tous les menus de STATISTICA, vous pouvez aisment personnaliser ce menu (dans
l'onglet Menu de la bote de dialogue Personnaliser, accessible par le menu Outils Personnaliser) pour placer les options les plus frquemment utilises l'endroit qui vous convient le
mieux. Voir la rubrique Menu Graphiques - Types de Graphiques dans le Manuel lectronique.

214 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 7 : GRAPHIQUES

Les graphiques crs partir du menu Graphiques sont troitement lis la feuille de donnes
dont ils sont issus. Vous avez la possibilit d'identifier et de slectionner des points dans le
graphique et de demander les mettre en surbrillance dans la feuille de donnes source, et
rciproquement. Outre la possibilit de slectionner des points dans les graphiques et les
feuilles de donnes, vous pouvez galement dfinir les proprits d'une observation dans une
feuille de donnes et utiliser ces proprits lorsque vous crez un graphique partir des
donnes. Parmi ces proprits, vous pouvez dfinir un symbole de point et sa couleur, indiquer
si le point doit tre exclu des graphiques et/ou des calculs d'ajustement, etc...
Pour dmarrer l'habillage/balayage d'un graphique, cliquez sur le bouton d'habillage/balayage
de la barre d'outils ou cliquez avec le bouton droit de la souris sur l'arrire-plan d'un graphique puis slectionnez
la commande Afficher l'Outil de Balayage/Habillage dans le menu contextuel afin d'accder la bote de dialogue Balayage/Habillage, illustre
ci-contre.
Par dfaut, l'Outil de Slection pour le Balayage est dfini sur Simple, et
vous permet de tracer un rectangle dans le graphique afin de slectionner tous les points contenus dans le rectangle. Dans l'illustration de la
page suivante, nous allons utiliser cet outil sur le fichier de donnes
Adstudy.sta, dans un nuage de points en 2D de la variable MESURE1 en
fonction de la variable MESURE2. Vous remarquerez que nous avons
slectionn les trois points situs dans l'angle suprieur gauche du graphique l'aide de l'outil de balayage/habillage, et que ces points apparaissent en surbrillance dans le graphique, ainsi que les observations
correspondantes dans la feuille de donnes qui a servi crer le graphique.

STATISTICA Prise en Main 215


Copyright StatSoft, 2010

CHAPITRE 7 : GRAPHIQUES

Au lieu d'utiliser les fonctionnalits de Balayage/Habillage, vous pouvez galement slectionner des observations dans la feuille de donnes (cliquez pour ce faire sur la partie situe
l'extrme gauche des noms d'observations) afin de marquer les points correspondants dans le
graphique, comme dans l'illustration ci-contre, o nous avons slectionn les cinq premires
observations de la feuille de donnes Adstudy.sta.

216 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 7 : GRAPHIQUES

Vous pouvez spcifier le statut des observations soit depuis la feuille de donnes, soit depuis
un graphique. Pour dfinir le statut des observations depuis la feuille de donnes STATISTICA,
cliquez avec le bouton droit de la souris sur un nom d'observation afin d'appeler le menu
contextuel qui contient un certain nombre de commandes, en particulier les commandes Exclure des Analyses, Exclure des Graphiques, tiqueter l'Observation, Marquer l'Observation et
Statut des Observations. Les mmes commandes sont accessibles par le menu contextuel qui
apparat lorsque vous cliquez avec le bouton droit de la souris sur un point dans un graphique.
Le graphique va utiliser ces options lors de l'affichage des points reprsentant cette observation. Par exemple, si vous slectionnez l'option tiqueter l'Observation, les points correspondants vont tre tiquets, comme dans l'illustration de la page suivante. Remarque : les observations sont associes une petite icne dans la feuille de donnes pour indiquer qu'elles sont
tiquetes dans les graphiques.
L'option Combiner les statuts 'Exclure des analyses' et 'Exclure des graphiques' dans un statut
unique 'Ignorer l'observation' dans le volet d'options Documents - Feuilles de donnes Navigation/Dfauts de la bote de dialogue Outils - Options permet de crer un statut d'observation
synthtique, Ignorer l'observation qui combine les statuts Exclure des analyses et Exclure des
graphiques, en supprimant le point correspondant la fois des calculs et des graphiques.

STATISTICA Prise en Main 217


Copyright StatSoft, 2010

CHAPITRE 7 : GRAPHIQUES

Cliquez avec le bouton droit de la souris sur un nom d'observation et dans le menu contextuel,
slectionnez le sous-menu Statut des Observations, puis la commande Modifier le Statut des
Observations pour changer le symbole de points utilis ou sa couleur. Remarque : la slection
des points est disponible pour d'autres types de graphiques que les nuages de points. Pour les
histogrammes, vous pouvez ainsi slectionner une barre de l'histogramme en mode d'habillage/
balayage pour slectionner tous les points correspondants dans la feuille de donnes. De la
mme manire, vous pouvez utiliser les outils d'habillage/balayage pour slectionner tous les
points correspondant aux composantes des botes moustaches.
Le statut des observations et les outils d'habillage/balayage prsentent un intrt avec les
options Exclure des graphiques et Exclure des analyses. Dans le menu Donnes - Observations - Statut des Observations, slectionnez le commande Exclure des graphiques afin de
masquer l'observation correspondante dans les graphiques, c'est--dire, que l'observation ne
sera pas visible dans les graphiques, mais elle sera utilise dans les analyses. Vous pouvez
galement cliquer avec le bouton droit de la souris sur un nom d'observation et accder cette
option par le menu contextuel. L'option Exclure des analyses accessible par l'un ou l'autre de
ces menus permet d'exclure l'observation correspondante des calculs ; toutefois, l'observation
apparatra dans la plupart des types de graphiques. Pour ignorer totalement un point (des analyses et des graphiques), vous devez cocher les deux options Exclure des graphiques et
218 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 7 : GRAPHIQUES
Exclure des analyses (ou slectionner l'option Ignorer l'observation si vous avez coch l'option
Combiner les statuts 'Exclure des analyses' et 'Exclure des graphiques' dans un statut unique
'Ignorer l'observation' dans le volet d'options Documents - Feuilles de donnes Navigation/
Dfauts de la bote de dialogue Outils - Options. Le statut d'observation Ignorer l'observation

fonctionne comme les filtres de slection de la feuille de donnes ; toute observation possdant
le statut Ignorer l'observation sera traite de la mme manire que si elle avait t exclue par
les filtres de slection. Ainsi, les outils d'habillage/balayage vous permettent de supprimer de
faon interactive les points atypiques, et rexcuter les analyses sans ces points.

Outre les Graphiques des Donnes d'Entre, les Graphiques de Blocs et les graphiques du
menu Graphiques (voir ci-dessus), d'autres graphiques statistiques spcialiss, spcifiques un
type d'analyse particulier (par exemple, un dendrogramme en sortie d'une CAH), sont accessibles depuis les botes de dialogue de rsultats (c'est--dire, les botes de dialogue contenant
les options de sortie de l'analyse courante).

STATISTICA Prise en Main 219


Copyright StatSoft, 2010

CHAPITRE 7 : GRAPHIQUES
Les graphiques spcialiss sont dcrits dans le cadre des analyses respectives partir desquelles ils peuvent tre produits ; pour toute information complmentaire, reportez-vous aux
sections respectives du Manuel lectronique.

Les options graphiques de STATISTICA sont accessibles par programmation grce au langage
intgr STATISTICA Visual Basic, ou d'autres langages compatibles. En consquence, il
n'existe aucune limite quant au degr de personnalisation des graphiques STATISTICA,
parce que STATISTICA Visual Basic (avec ses puissants outils de dessin et ses bibliothques
de procdures graphiques reposant sur STATISTICA) permet de produire la plupart des graphiques ou sorties multimdia compatibles avec le matriel informatique actuel. Ces affichages
personnaliss ou sorties multimdia peuvent ensuite tre affects aux barres d'outils de
STATISTICA, mais aussi aux menus ou aux botes de dialogue et devenir partie intgrante de
votre application STATISTICA.
Une application crite en STATISTICA Visual Basic peut agir de 3 manires sur un graphique :
Crer un nouveau graphique puis le modifier, l'imprimer ou l'enregistrer, etc... ;
Accder une fentre graphique existante puis modifier le graphique ;
Ouvrir un fichier graphique existant puis le modifier, l'imprimer ou l'enregistrer, ...
Tous les graphiques disponibles dans STATISTICA peuvent tre produits en langage STATISTICA Visual Basic, puis tre personnaliss l'aide des procdures STATISTICA ou des options
gnrales offertes dans ce langage complet.

220 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 7 : GRAPHIQUES

Comme pour toutes les autres fonctions de STATISTICA Visual Basic, vous pouvez aisment
incorporer dans vos programmes STATISTICA Visual Basic, les fonctions permettant d'accder
la bibliothque graphique de STATISTICA grce un Explorateur de Fonctions, organis
sous forme hirarchique. Cette liste contient une brve description de toutes les fonctions et
permet de les insrer directement dans le code source de votre programme (c'est--dire, dans
l'diteur STATISTICA Visual Basic, voir page 235).

STATISTICA Prise en Main 221


Copyright StatSoft, 2010

CHAPITRE 7 : GRAPHIQUES

222 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 7: GRAPHIQUES

STATISTICA vous permet de personnaliser entirement l'interface-utilisateur et reconnat la


ncessit d'adapter cette interface aux diffrents besoins de chacun. En fait, STATISTICA va
mme jusqu' anticiper vos besoins en mmorisant vos diffrents choix mesure que vous
les faites. Par exemple, si vous lancez une analyse partir de l'onglet Avanc dans une bote de
spcification d'analyse, c'est l'onglet Avanc qui apparatra automatiquement (et non l'onglet
Base) la prochaine ouverture de cette bote de dialogue.
La plupart des aspects de l'interface-utilisateur (menus, barres d'outils et raccourcis-clavier)
sont personnalisables, simplement et rapidement (voir comment personnaliser une barre
d'outils, page 145). Vous pouvez personnaliser vos graphiques, feuilles de donnes, classeurs,
rapports, etc..., de faon temporaire ou globale et conserver diffrentes configurations de STATISTICA (pour les versions monopostes et pour les versions rseau). Vous pouvez galement
crer des interfaces-utilisateur compltement nouvelles (voir pages 145 et 146).

Comme nous l'avons dj mentionn, STATISTICA permet de dfinir de nouvelles interfacesutilisateur (voir page 145), notamment celles bases sur le navigateur Internet (voir page 147).
La plupart des aspects de l'interface-utilisateur interactive par dfaut peuvent tre modifis de
diverses manires. Vous pouvez par exemple ajouter de nouvelles options celles proposes
par dfaut, les simplifier ou les modifier volont mesure que vos besoins voluent. En
fonction des tches raliser et de vos prfrences pour des modes de travail particuliers,
STATISTICA Prise en Main 225
Copyright StatSoft, 2010

CHAPITRE 8 : PERSONNALISER STATISTICA


vous pouvez supprimer toutes les icnes, barres d'outils, barres d'tat, menus, fonctionnalits
du classeur, fonctions Glisser-Dplacer, liens dynamiques (automatiques) entre les graphiques
et les donnes, effets 3D dans les tableaux et botes de dialogue. Vous pouvez produire des
sorties squentielles brutes avec des feuilles de donnes sur fond blanc et des graphiques
monochromes et paramtrer le systme pour produire automatiquement les rsultats sous la
forme de fentres individuelles (voir ci-dessous, gauche) ;

Vous pouvez aussi dfinir des barres d'outils labores locales (temporaires) ou globales et
tirer parti de tous les outils spcialiss, icnes, barres d'outils, macros (par exemple, en affectant des tches particulires des touches de raccourci, commandes dans de nouveaux menus
ou icnes dans des barres d'outils), tableaux multimdia, classeurs, et fonctionnalits GlisserDplacer. Vous pouvez dfinir des liens dynamiques (automatiques) entre les graphiques et les
donnes avec des liens internes entre les objets graphiques. Vous pouvez personnaliser les rapports avec des couleurs ou des polices spciales ou encore, ajuster le style des graphiques par
dfaut et leur mode d'affichage. Vous pouvez encore envoyer les rsultats dans diffrents
226 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 8 : PERSONNALISER STATISTICA


classeurs organiss de faon hirarchique pour crer un environnement d'analyse labor,
multi-niveaux facilitant l'exploration de fichiers de donnes complexes et vous permettant
de comparer diffrents aspects des rsultats (voir l'illustration ci-contre, droite).

Les menus Affichage et Outils permettent de modifier de nombreux aspects de l'affichage de


l'application. Chacune de ces deux mthodes a toutefois une fonction diffrente :
Les modifications demandes dans le menu Affichage affectent l'aspect
en cours de STATISTICA (par exemple, masquer une barre d'outils) ou de la fentre du document l'cran (par exemple, changer la police de caractre de la feuille de donnes).
Les options du menu Outils - Options (voir la page suivante) permettent de
modifier les paramtres par dfaut du programme. Notez toutefois que les options globales
applicables aux documents d'un certain type (par exemple, un graphique ou une feuille de donnes) ne modifient pas le document en cours. En revanche, ces options globales serviront de
paramtres par dfaut pour la cration de tous les futurs documents de ce type.
Par exemple, si vous modifiez la Mise en Forme par Dfaut de la feuille de donnes dans le
volet d'options Documents - Feuilles de donnes - Navigation/Dfauts de la bote de dialogue
Options (accessible par le menu Outils - Options), vous ne verrez la nouvelle mise en forme
qu'aprs avoir cr une nouvelle feuille de donnes. Ces paramtres par dfaut n'affectent pas
les fichiers enregistrs, puisque les feuilles de donnes sont ouvertes telles qu'elles ont t sauvegardes prcdemment (utilisez le menu Affichage pour personnaliser les objets existants).

Vous pouvez modifier les


options gnrales par dfaut tout moment, dans le volet d'options appropri de la bote de
dialogue Options (accessible par le menu Outils - Options). Ces options gnrales contrlent :
les aspects gnraux de l'application (comme l'ouverture de STATISTICA en plein cran,
les fonctionnalits du classeur et du rapport, les listes personnalises, etc...),

STATISTICA Prise en Main 227


Copyright StatSoft, 2010

CHAPITRE 8 : PERSONNALISER STATISTICA


la manire dont les sorties sont produites (par exemple, classeur ou rapport d'analyse, ...),
l'aspect gnral de la fentre d'application (les icnes, barres d'outils, etc...), et
l'aspect des fentres de documents (couleurs, polices de caractres).
Ci-dessous, le volet d'options Gnralits de la bote de dialogue Options :

Toutes ces options et d'autres paramtres gnraux sont accessibles, quel que soit le type de
document actuellement ouvert l'cran (par exemple, qu'il s'agisse d'une feuille de donnes ou
d'un graphique). Pour plus d'informations sur un onglet particulier, voir le Manuel lectronique.
Le volet d'options Configurations de la bote de dialogue Options permet de
conserver diffrentes bibliothques de paramtrages et vous pouvez passer de l'une l'autre
pour vos diffrents projets (ou utilisateurs). Pour plus d'informations, voir le descriptif du volet
d'options Configurations, page 230 et dans le Manuel lectronique.

228 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 8 : PERSONNALISER STATISTICA

Divers outils spcialiss permettent de personnaliser la mise en forme et les oprations des
documents STATISTICA (voir Chapitre 6 Documents STATISTICA, page 179). STATISTICA
possde un systme de gestion des paramtres par dfaut pour tous les aspects des graphiques
et permet de combiner les personnalisations dans des styles organiss de faon hirarchique.
De la mme manire, vous pouvez personnaliser la mise en forme et le format des feuilles de
donnes et personnaliser des vnements (par exemple, que doit-il se produire si je doubleclique dans un tableau ?). Voir le Manuel lectronique pour plus d'informations.

Les options de personnalisation des graphiques STATISTICA offrent des centaines d'outils et de fonctionnalits pour ajuster chaque
aspect de l'affichage et du traitement des donnes associes. Ces options sont organises de
faon hirarchique, ce qui permet d'accder rapidement aux options de personnalisation les
plus courantes en double-cliquant sur l'lment correspondant du graphique ou en utilisant le
menu contextuel de l'lment respectif (bouton droit de la souris).
Vous pouvez aisment
modifier les paramtres par dfaut pour que l'apparence et le comportement par dfaut des graphiques STATISTICA rpondent vos besoins spcifiques et/ou ncessitent un minimum
d'intervention de votre part. Divers aspects des graphiques STATISTICA peuvent ainsi tre modifis de faon permanente en utilisant :
1. la bote de dialogue Options (accessible par le menu Outils - Options),
2. l'ensemble des styles de graphiques,
3. les graphiques personnaliss, et
4. STATISTICA Visual Basic.
Ces fonctionnalits sont brivement prsentes dans le Chapitre 7 Graphiques (page 199).

STATISTICA Prise en Main 229


Copyright StatSoft, 2010

CHAPITRE 8 : PERSONNALISER STATISTICA


Il n'existe aucune limite quant au degr de personnalisation des graphiques STATISTICA,
parce que STATISTICA Visual Basic (avec ses puissants outils de dessin et ses bibliothques
de procdures graphiques) permet de produire la plupart des graphiques ou sorties multimdia
compatibles avec le matriel informatique actuel. Ces affichages personnaliss ou sorties multimdia peuvent alors tre affects aux barres d'outils STATISTICA, aux menus ou aux botes
de dialogue et devenir partie intgrante de votre application STATISTICA.

STATISTICA enregistre les paramtres du programme lorsque vous quittez l'application, et les
restaure lorsque vous la redmarrez. Vous pouvez crer diffrentes configurations de ces paramtres en utilisant le volet d'options Configurations de la bote de dialogue Options (accessible
par le menu Outils - Options). Ces options vous permettent d'enregistrer l'tat actuel du programme dans une nouvelle configuration ou dans une configuration dj enregistre, et vous
pouvez dmarrer STATISTICA dans une autre configuration. Vous pouvez galement importer
ou exporter une configuration dans un fichier pour la partager entre diffrentes installations de
STATISTICA.

Le principe dcrit au paragraphe prcdent s'applique galement aux installations de STATISTICA en rseau. Avec les versions rseau, l'application est installe en un seul et mme endroit
(sur un serveur), mais chaque utilisateur a nanmoins la possibilit de personnaliser son application puisque l'information relative la configuration est stocke en local (sur le disque dur
de l'utilisateur). Vous devez choisir l'option Installation en Rseau lors de l'Installation de STATISTICA pour installer correctement l'application sur un serveur.
Remarque : une version rseau de STATISTICA est ncessaire pour une utilisation simultane
sur plusieurs postes.

230 STATISTICA Prise en Main


Copyright StatSoft, 2010

Le langage universel STATISTICA Visual Basic (largement utilis dans le monde industriel et
intgr STATISTICA) offre une interface-utilisateur alternative toutes les fonctionnalits de
STATISTICA et constitue bien plus qu'une nouvelle application de programmation permettant d'crire des extensions personnalises. STATISTICA Visual Basic tire pleinement parti de
l'architecture du modle-objet de STATISTICA et permet d'accder par programmation tous
les aspects et la plupart des fonctionnalits de STATISTICA. Mme les analyses et les graphiques les plus complexes peuvent tre enregistrs dans des macros Visual Basic que vous
pouvez ensuite excuter de faon rptitive ou modifier et utiliser comme blocs de construction dans d'autres applications. STATISTICA Visual Basic ajoute un arsenal de plus de 14.000
nouvelles fonctions la syntaxe complte de Microsoft Visual Basic, devenant l'un des environnements de dveloppement les plus riches et complets actuellement disponibles.
Les programmes
STATISTICA Visual Basic sont utiliss dans de nombreuses applications, allant des simples
macros pour automatiser des tches spcifiques (utilises de faon rptitive), des systmes
analytiques labors combinant la puissance des procdures optimises de STATISTICA des
extensions personnalises disposant de leur propre interface-utilisateur. Sous rserve de disposer d'une licence adquate, les scripts d'analyses dvelopps de cette faon peuvent tre intgrs dans de vastes environnements informatiques, excuts partir de logiciels propritaires
ou de portails Internet ou Intranet.
Vous avez la possibilit d'associer des programmes SVB la plupart des vnements importants d'une analyse STATISTICA comme l'ouverture ou l'enregistrement de fichiers, un clic
dans une cellule d'une feuille de donnes, etc... ; de cette manire, vous pouvez personnaliser
l'interface-utilisateur de STATISTICA pour vos applications spcifiques (par exemple, pour les
oprations de saisie, etc...).

STATISTICA Prise en Main 233


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC

STATISTICA offre une gamme complte de fonctionnalits pour enregistrer des macros, c'est-dire, des programmes STATISTICA Visual Basic (SVB) que vous pouvez utiliser pour automatiser vos tches rptitives, ou comme moyen de gnrer automatiquement des programmes
que vous pouvez ensuite modifier faon. Les macros enregistres de cette manire sont des
programmes cls-en-mains, mais peuvent aussi faire office de blocs de construction pour
des applications Visual Basic plus complexes et ultra-personnalises. Les Macros d'Analyse et
les Filires d'Analyses utilisent la mme syntaxe et peuvent tre modifies volont, mais en
raison de la manire dont elles sont cres, chacune possde ses propres avantages et ses
propres inconvnients selon le contexte spcifique dans lequel elles sont utilises.
Les Macros d'Analyse enregistrent automatiquement vos paramtrages, slections et choix d'options pour une analyse spcifique. Remarque : le terme analyse
dans STATISTICA fait rfrence une tche slectionne dans les menus Statistiques, Data
Mining ou Graphiques et peut tre trs simple et rapide (par exemple, un nuage de points cr
partir du menu Graphiques), ou au contraire trs labore (par exemple, une analyse de modlisation d'quations structurelles cre partir du menu Statistiques, qui peut produire plusieurs centaines de documents de sortie). Lorsque vous slectionnez une commande statistique
dans le menu Statistiques ou dans le menu Data Mining ou une commande graphique dans le
menu Graphiques, toutes les actions telles que la slection des variables, le paramtrage des
options, etc..., sont enregistres en arrire-plan ; vous pouvez rcuprer tout moment cet
enregistrement (c'est--dire, le code Visual Basic de la macro) dans l'diteur Visual Basic. La
commande Crer une Macro est accessible pour chaque analyse partir du menu qui apparat
lorsque vous cliquez sur le bouton Options ou par le menu contextuel (en cliquant avec le
bouton droit de la souris sur le bouton de l'analyse) lorsque l'analyse est rduite.
Vous pouvez aussi enregistrer une Filire d'Analyses de toute votre
session, constitue d'une ou plusieurs analyses. Cette Filire d'Analyses va alors connecter
les diffrentes analyses avec les diverses options analytiques des menus Statistiques, Data
Mining ou Graphiques. En revanche, contrairement aux Macros d'Analyses simples voques
ci-dessus, vous pouvez dmarrer ou arrter l'enregistrement des Filires d'Analyses tout moment. L'enregistrement d'une Filire d'Analyses dmarre en cliquant sur le bouton Enregistrer
234 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


une Filire d'Analyses dans le menu Outils - Macro, et prend fin en slectionnant la commande
Arrter l'Enregistrement dans le menu Outils - Macro). Entre ces deux actions, toutes les

slections de fichiers et oprations de gestion des donnes sont enregistres, au mme titre que
les analyses et leurs paramtrages, dans l'ordre o vous les choisissez.
Ce type de macro permet de stocker une srie de touches au clavier.
Aprs avoir slectionn la commande Enregistrer une Macro au Clavier dans le menu Outils Macro, STATISTICA va enregistrer chaque touche du clavier sur laquelle vous appuyez. l'issue
de l'enregistrement, l'diteur STATISTICA apparat avec un programme lmentaire constitu d'une
seule commande SendKeys suivie des symboles reprsentant les diffrentes touches utilises au
cours de la session. Remarque : ce type de macro est trs rudimentaire puisqu'il n'enregistre pas
l'environnement dans lequel les touches sont utilises ni leur signification (c'est--dire, les commandes dclenches par ces touches), mais c'est justement cette fonctionnalit qui va les rendre
intressantes pour certaines applications spcifiques, par exemple, pour automatiser de la saisie de
texte, comme des titres, des filtres de slection, etc...
Vous pouvez galement crire
intgralement vos programmes en utilisant l'environnement de dveloppement professionnel
STATISTICA Visual Basic constitu d'un diteur de programmes avec un puissant dbogueur
(avec des points d'arrt, etc...), et de nombreuses fonctionnalits pour vous aider construire
efficacement le code. Ces fonctionnalits sont dcrites en dtail dans le Manuel lectronique
de STATISTICA.
Lorsque vous ditez une macro en saisissant des commandes Visual Basic ou des commandes
propres STATISTICA Visual Basic, l'diteur fait apparatre une aide contextuelle visant
illustrer la syntaxe approprie. Vous trouverez galement une aide sur les membres et fonctions de chaque classe (objet) dans l'aide en ligne.

STATISTICA Prise en Main 235


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


Lorsque vous excutez un programme, vous pouvez dfinir des points d'arrt dans le programme, avancer ligne par ligne, ou observer et modifier les valeurs des variables dans la macro en
cours d'excution.

Il existe galement un diteur de botes de dialogue interactif qui vous permet de construire
vos propres botes de dialogue.

236 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


En rsum, STATISTICA Visual Basic n'est pas seulement un puissant langage de programmation, mais constitue un environnement de programmation professionnel trs puissant pour
dvelopper de simples macros ou des applications personnalises complexes.
Vous pouvez galement dvelopper des programmes SVB qui vont enrichir des programmes en Visual Basic crs dans des
applications externes (par exemple, Excel) en appelant des fonctions et procdures de STATISTICA.

Les programmes STATISTICA Visual Basic (SVB) peuvent tre excuts depuis STATISTICA,
mais grce la compatibilit tendue de ce langage de programmation universel, vous pouvez
galement les excuter depuis tout environnement compatible (par exemple, Microsoft Excel,
Microsoft Word ou un langage autonome Visual Basic). En pratique, vous pouvez appeler les
fonctions STATISTICA en langage Visual Basic depuis une autre application. Toutefois, lorsque vous excutez un programme STATISTICA Visual Basic ou que vous appelez des fonctions STATISTICA depuis une autre application, tous les appels de fonctions spcifiques de
STATISTICA (par opposition aux fonctions gnriques de Microsoft Visual Basic) ne peuvent
s'effectuer que si les bibliothques respectives de STATISTICA sont installes sur l'ordinateur
excutant le programme. En rsum, l'utilisateur du programme doit possder une licence des
bibliothques de procdures respectives de STATISTICA. Cette vaste bibliothque de fonctions
STATISTICA Prise en Main 237
Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


STATISTICA (plus de 14.000 procdures) est accessible, de faon transparente, non seulement
par Visual Basic (qu'il s'agisse du langage incorpor ou d'un autre), mais aussi par d'autres
langages ou environnements de programmation compatibles, tels que C/C++, C# ou Delphi.
Si l'avantage vident de Visual Basic (par rapport d'autres langages) est sa convivialit et son utilisation par
un large public, l'un des inconvnients possibles tient sa rapidit d'excution, plus lente que
celle d'applications dveloppes dans des langages de programmation plus basiques (comme le
langage C). Toutefois, ce problme potentiel ne concerne gnralement pas les applications
STATISTICA Visual Basic, en particulier celles qui font appel aux procdures analytiques, graphiques et de gestion des donnes de STATISTICA. Ces procdures utilisent les technologies
optimises de STATISTICA et sont excutes presque aussi rapidement que les procdures respectives excutes directement dans STATISTICA.
STATISTICA Visual Basic est constitu
de deux grandes composantes : 1) L'environnement de programmation gnraliste de Visual
Basic avec diverses fonctionnalits et extensions permettant de crer des interfaces-utilisateur
(botes de dialogue) et de grer des fichiers, et 2) les bibliothques STATISTICA avec plusieurs
milliers de fonctions permettant d'accder la plupart des fonctionnalits de STATISTICA.
L'environnement de programmation Visual Basic suit les conventions de syntaxe standard du
langage Microsoft Visual Basic ; les quelques diffrences tiennent pour l'essentiel la manire
dont les botes de dialogue sont cres (voir la rubrique Botes de Dialogue Personnalises ;
Interfaces Utilisateur Personnalises dans le Manuel lectronique de STATISTICA), et offrent
davantage de flexibilit aux programmeurs et dveloppeurs dans la manipulation des interfaces-utilisateur pour les programmes les plus complexes. Dans l'environnement de programmation STATISTICA Visual Basic, les botes de dialogue peuvent tre entirement gres dans
des sous-routines spares, qui peuvent tre combines de manire flexible dans des programmes plus vastes faisant appel plusieurs botes de dialogue. Microsoft Visual Basic est bas
sur des formulaires ou des botes de dialogue, tous les vnements se produisant dans les
botes de dialogue tant grs dans des units distinctes du programme.

Vous pouvez enregistrer vos programmes STATISTICA Visual Basic puis les affecter vos
barres d'outils ou des commandes personnalises de vos menus. De cette manire, vous pouvez aisment personnaliser les oprations et l'aspect de STATISTICA en ajoutant vos propres
macros. Pour utiliser ces fonctionnalits, vous devez enregistrer la macro par la commande
Enregistrer comme Macro Globale du menu Fichier. Pour personnaliser les menus et/ou les
238 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


barres d'outils, slectionnez ensuite la commande Personnaliser du menu Outils afin d'accder
la bote de dialogue Personnaliser. Pour ajouter la macro un menu ou une barre d'outils,
slectionnez l'onglet Commandes/Macros, puis slectionnez Macros dans la liste Catgories.
Toutes vos Macros Globales vont alors apparatre dans la section Commandes de cet onglet.
Dans l'illustration suivante, nous avons enregistr une macro appele Analyse des Cots-Carbone comme Macro Globale.

Vous pouvez alors slectionner puis dplacer un lment spcifique depuis la liste Commandes vers le menu ou la barre d'outils de votre choix. Remarque : lorsque vous dplacez le pointeur de la souris sur un menu, celui-ci se dveloppe, et vous permet d'insrer l'lment l'endroit souhait, y compris dans un sous-menu. Lorsque la macro est insre dans le menu ou la
barre d'outils et que la bote de dialogue Personnaliser est ouverte, vous pouvez cliquer avec le
bouton droit de la souris sur la macro et modifier le texte de l'lment, ou ajouter des icnes.
STATISTICA vous permet d'excuter vos programmes SVB en ligne de commande l'aide du paramtre /RunMacro= dans la
ligne de commande. La syntaxe est la suivante :
statist.exe /RunMacro="nom de la macro"

o nom de la macro reprsente le nom du fichier de la macro. Si vous ne spcifiez pas le


chemin complet, STATISTICA va chercher excuter la macro depuis le dossier de l'application (conformment aux conventions Windows).
Si la macro ne rend pas l'application ou un quelconque document visible ( l'aide de la proprit Application.Visible = True ou une proprit similaire du document), l'instance STATISITCA se fermera automatiquement l'issue de l'excution. Si en revanche l'application est

STATISTICA Prise en Main 239


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


rendue visible, cette dernire demeurera ouverte l'issue de l'excution de la macro, et vous
devrez fermer manuellement le programme.

Cet exemple illustre la manire d'enregistrer une analyse dans un script, excutable volont
pour reproduire l'analyse. Nous allons ensuite modifier ce script et le combiner avec un autre
afin de crer un script personnalis qui pourra excuter des analyses la demande. Enfin, nous
montrerons comment utiliser des scripts attachs pour actualiser et rexcuter des analyses
depuis les classeurs de rsultats.
Ouvrons tout d'abord le fichier d'exemple Adstudy. Slectionnez pour ce faire la commande
Ouvrir des Exemples dans le menu Fichier afin d'accder la bote de dialogue Ouvrir un
Fichier de Donnes STATISTICA. Double-cliquez sur le rpertoire Fichiers de donnes, puis sur
le fichier de donnes Adstudy.sta de STATISTICA.

Cliquez sur le bouton OK afin d'accder la bote de dialogue Statistiques Descriptives.

240 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC

Le bouton Variables permet d'accder la bote de dialogue Slectionnez les variables de l'analyse. Slectionnez les variables MESURE1 MESURE23 en cliquant sur MESURE1 puis en
faisant glisser le pointeur de la souris jusqu' MESURE23, puis cliquez sur le bouton OK. Dans
la bote de dialogue Statistiques Descriptives, cliquez sur l'onglet Avanc, et voyez les nombreuses options proposes.

Dans cet exemple, nous allons conserver les options par dfaut. Cliquez sur le bouton Synthse afin de produire les statistiques descriptives des variables slectionnes.

STATISTICA Prise en Main 241


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC

Lorsque vous produisez un classeur de rsultats, la bote de dialogue Statistiques Descriptives


se rduit automatiquement pour permettre de visualiser les rsultats. Pour restaurer la bote de
dialogue, cliquez sur le bouton Statistiques Descriptives dans la Barre d'Analyse, situe dans
l'angle infrieur gauche de l'cran.
Lorsque vous excutez une analyse, STATISTICA enregistre automatiquement toutes les tapes
de l'analyse en arrire-plan. Vous pouvez maintenant produire une macro STATISTICA Visual
Basic (SVB) afin de reproduire cette analyse. Dans la bote de dialogue Statistiques Descriptives, cliquez sur le bouton
puis slectionnez la commande Crer une Macro dans le
menu droulant. La bote de dialogue Nouvelle Macro apparat, et vous permet de spcifier le
nom et la description ventuelle de cette macro. Conservons tous les paramtres par dfaut, et
cliquons sur le bouton OK. Une fentre SVB apparat avec tout l'enregistrement de notre session de Statistiques Descriptives.

242 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


Pour excuter cette macro, slectionnez la commande Excuter la Macro dans le menu Excution ou appuyez sur la touche F5 de votre clavier. Les rsultats produits lors de l'analyse initiale sont reproduits l'identique.
Examinons un instant la macro SVB. En haut du programme, nous pouvons voir :
Set newanalysis = Analysis (scBasicStatistics, ActiveDataSet)

Cette ligne permet d'indiquer la macro que nous voulons excuter une analyse de Statistiques
lmentaires sur le fichier de donnes actif, c'est--dire la feuille de donnes slectionne au
moment de l'excution de la macro.
Descendons quelques lignes plus bas, dans la section qui commence par :
With newanalysis.Dialog

o nous pouvons voir des proprits du type :


.Mean = True

Ces proprits correspondent toutes les options disponibles dans les diffrents onglets de la
bote de dialogue Statistiques Descriptives. Chaque option de cette bote de dialogue est reprsente par une proprit, et tous les paramtrages sont enregistrs. Si vous dcidez d'inclure la
Mdiane et la Somme de chacune des variables, vous pouvez aisment les ajouter dans votre
macro SVB ; il vous suffit de reprer les lignes suivantes :
.Median = False

et
.Sum = False

et de les modifier comme suit :


.Median = True

et
.Sum = True

Excutons nouveau la macro en appuyant sur la touche F5. Une nouvelle feuille de donnes
va apparatre dans le classeur, mais cette fois, avec de nouvelles colonnes Mdiane et Somme
comme illustr la page suivante.

STATISTICA Prise en Main 243


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC

Gardons la fentre de la macro ouverte et dmarrons une nouvelle analyse sur le mme fichier
de donnes. Cliquez sur la feuille de donnes Adstudy afin de l'amener au premier-plan. Puis,
dans le menu Graphiques - Graphiques en 2D, slectionnez la commande Tracs de Normalit
afin d'accder la bote de dialogue Tracs de Normalit.

Cliquez sur le bouton Variables, puis dans la bote de dialogue Variables du Trac de Normalit, slectionnez les variables MESURE1 MESURE3. Cliquez sur le bouton OK pour fermer
cette bote de dialogue, puis nouveau sur le bouton OK dans la bote de dialogue Tracs de
Normalit. Les trois Tracs de Probabilis vont tre envoys dans le classeur des rsultats, un
trac pour chacune des trois variables que nous avons slectionnes.

244 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC

Les diffrentes phases de l'analyse Tracs de Normalit ont t enregistres de la mme


manire que l'analyse prcdente de Statistiques Descriptives. Pour crer une nouvelle macro
avec ces diffrentes tapes, rappelez la bote de dialogue Tracs de Normalit en cliquant sur le
bouton correspondant de la Barre d'Analyse, dans la partie infrieure gauche de l'cran, puis
cliquez sur le bouton
et slectionnez la commande Crer une Macro dans le menu
droulant. Dans la bote de dialogue Nouvelle Macro, cliquez sur le bouton OK pour faire apparatre une nouvelle fentre de Macro SVB contenant le script du Trac de Normalit que nous
venons de produire.

STATISTICA Prise en Main 245


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


Comme pour l'analyse de Statistiques Descriptives, toutes les options de la bote de dialogue
Tracs de Probabilits sont spcifies sous forme de proprits dans la macro. Par exemple,
pour transformer notre Droite de Henry en Trac de Normalit par Moiti, nous devons
localiser la ligne suivante :
.GraphType = scProbNormal

et la changer comme suit :


.GraphType = scProbHalfNormal

Si nous voulons galement intgrer la variable MESURE4 dans l'analyse, nous devons rechercher la ligne suivante :
.Variables = "3-5"

Cette ligne correspond aux variables slectionnes pour les tracs. Dans la mesure o nous
avons slectionn les variables MESURE1 MESURE3 et qu'il s'agit des variables numro 3
5 du fichier de donnes, cette chane a t enregistre dans le script. Pour ajouter la variable
MESURE4 (variable numro 6), nous devons modifier cette ligne comme suit :
.Variables = "3-6"

Excutons cette macro en appuyant sur la touche F5. Quatre graphiques vont tre produits sous
forme de Tracs de Normalit par Moiti pour les variables MESURE1 MESURE4.
Dans cet exemple, nous avons montr comment raliser une analyse quelconque puis crer une
macro de cette analyse que nous pouvons ensuite modifier et rexcuter. Cet exemple a
dmontr comment il est possible de combiner ces macros pour crer des macros plus
complexes. Ce sont les fondations qui vont vous permettre de crer vos propres analyses,
puissantes et personnalises, en langage SVB.

Dans l'exemple prcdent, nous avons vu que toutes les analyses STATISTICA enregistrent les
tapes ncessaires pour les produire, et nous avons ensuite la possibilit de rcuprer ces
tapes dans une macro o nous pouvons les modifier et les excuter. Lorsqu'une analyse produit des rsultats qui sont envoys dans un classeur, STATISTICA associe automatiquement le
script enregistr de ces tapes dans le dossier du classeur contenant les rsultats. De cette manire, vous pouvez rexcuter une analyse ou la poursuivre tout moment.
Jusqu' prsent, nous avons excut plusieurs analyses de Statistiques Descriptives et de
Tracs de probabilit. Le classeur des rsultats doit avoir l'aspect suivant.

246 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC

Vous remarquerez la flche rouge sur chaque dossier du classeur. C'est le signe que le script
qui a permis de produire les rsultats de ce dossier est attach au rpertoire. C'est ce qui permet STATISTICA de reprendre ou rexcuteer l'analyse. Pour rexcuter une analyse, cliquez
avec le bouton droit de la souris sur un dossier libell Statistiques Descriptives et dans le menu
contextuel, slectionnez la commande Rexcuter l'Analyse. La bote de dialogue Rexcution
d'une Analyse apparat.

Vous pouvez Utiliser la source de donnes originale ou Utiliser une nouvelle source de donnes. Cette dernire option vous permet de crer des modles d'analyses que vous pouvez
ensuite appliquer de nouvelles sources de donnes. Outre la possibilit de spcifier la source
des donnes, vous pouvez choisir de Remplacer le contenu du dossier actuel ou de Crer un
nouveau dossier. Dans cet exemple, conservons les options par dfaut et cliquons sur le bouton OK. Vous allez constater la disparition temporaire du contenu du dossier qui va rapparatre lors de la rexcution de l'analyse.
L'un des objectifs de cette fonctionnalit est de vous permettre d'actualiser ou de rexcuter
des rsultats produits par des analyses complexes ds que de nouvelles donnes apparaissent
dans la feuille de donnes. Par exemple, si nous modifions les donnes de notre fichier de
STATISTICA Prise en Main 247
Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


donnes Adstudy.sta et que nous relanons l'analyse, les nouveaux rsultats seront produits
partir des nouvelles donnes.
La commande Reprendre l'Analyse permet de rappeler une analyse exactement au stade o elle
se trouvait avant de produire les rsultats. Vous pouvez donc slectionner d'autres options ou
poursuivre une analyse en cours. Cliquez sur le dossier Statistiques Descriptives et dans le
menu contextuel, slectionnez la commande Reprendre l'Analyse. La bote de dialogue
Reprendre l'Analyse apparat avec des options permettant de spcifier la source des donnes
(les donnes originales ou d'autres). Les options du cadre Rsultats permettent d'envoyer les
Rsultats dans le dossier en cours (comme s'il s'agissait de la suite de l'analyse prcdente) ou
de Crer un nouveau dossier (comme s'il s'agissait d'une analyse totalement nouvelle).

Conservons les options par dfaut, et cliquons sur le bouton OK. La bote de dialogue Statistiques Descriptives apparat, avec toutes les options utilises pour produire les rsultats prcdents. Puisque l'option par dfaut envoie les Rsultats dans le rpertoire en cours, les nouveaux rsultats vont tre crs dans le mme dossier si vous cliquez sur le bouton Synthse.

Le terme ActiveX est utilis dans diffrents contextes et ses dfinitions font rfrence diffrents aspects du concept. Nous regrouperons ces composantes en deux catgories dans STATISTICA : les objets ActiveX et les documents ActiveX.
Les objets ActiveX taient autrefois appels objets OLE (Object Linking
and Embedding). La technologie COM (Component Object Model) de Microsoft qui permet
d'accder aux objets de manire uniforme est au cur du concept. Grce l'utilisation de protocoles standard, les objets crs dans une application peuvent dsormais tre stocks et modifis dans d'autres applications. Pour ce faire, l'objet rceptacle (container) doit tre un client
248 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


ActiveX, et l'application ayant initialement cr l'objet doit tre un serveur ActiveX. STATISTICA est la fois client et serveur. En tant que client ActiveX, STATISTICA vous permet
d'incorporer et de lier des objets issus d'autres applications dans ses feuilles de donnes, graphiques et rapports. En tant que serveur ActiveX, il vous permet d'incorporer et de lier ses
feuilles de donnes et graphiques dans d'autres applications.
Les documents ActiveX vont plus loin, puisqu'ils permettent d'intgrer des documents entiers dans d'autres applications. Un container de documents ActiveX
permet des documents issus d'autres applications d'tre utiliss dans le container, et un
serveur de documents ActiveX permet l'utilisation de ses propres documents dans tout container de documents ActiveX. nouveau, STATISTICA est la fois client (container) et
serveur. Les classeurs STATISTICA sont des containers de documents ActiveX et permettent
des documents issus d'autres serveurs d'ActiveX d'tre affichs dans le classeur. Par
exemple, des documents Microsoft Word ou Excel peuvent tre utiliss et modifis directement dans un classeur STATISTICA. De mme, les feuilles de donnes, graphiques ou rapports
STATISTICA sont des serveurs de documents ActiveX, et peuvent donc tre placs dans tout
container de documents ActiveX, comme par exemple Microsoft Internet Explorer ou
Microsoft Binder.
La technologie des documents
ActiveX possde une application particulire avec les documents Word et Excel. STATISTICA
peut en effet ouvrir de faon native ces documents particuliers dans leurs propres fentres,
l'intrieur de l'espace de travail STATISTICA. Cette Intgration avec Office vous permet
d'utiliser des documents Excel en source de donnes, et des documents Word pour les rapports
de vos analyses. Lorsque les documents sont ouverts dans STATISTICA, les menus et barres
d'outils d'Excel/Word deviennent accessibles.

STATISTICA reconnat les conventions Object Linking and Embedding (OLE) qui sont utilises pour lier des valeurs, du texte, des graphiques, ou d'autres objets des documents STATISTICA (par exemple, feuilles de donnes, rapports) des documents dans d'autres applications
(Windows). Techniquement, vous pouvez tablir des liens OLE entre un fichier source (ou
serveur) (par exemple, un document Microsoft Word) et un document STATISTICA (le fichier
client), afin que les donnes se mettent automatiquement jour dans la partie respective du
document STATISTICA ds que les donnes du fichier source sont modifies. En outre, STATISTICA peut servir de serveur pour d'autres documents compatibles OLE. De cette faon,
STATISTICA Prise en Main 249
Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


vous pouvez lier les valeurs d'une feuille de donnes STATISTICA un tableau dans un document Microsoft Word, pour mettre jour le document Word ds que les donnes de la feuille
de donnes changent.

STATISTICA reconnat galement les conventions Dynamic Data Exchange (DDE). Vous pouvez tablir des liens DDE entre un fichier source (par exemple, une feuille de calcul Microsoft Excel) et un fichier de donnes STATISTICA (le fichier client), afin que les donnes se
mettent automatiquement jour dans la feuille de donnes STATISTICA ds que les donnes
du fichier source sont modifies. Vous pouvez ainsi lier dynamiquement un champ de la feuille de donnes un sous-ensemble de donnes dans d'autres applications (Windows).
Cette application (liaison dynamique entre deux fichiers) se rencontre souvent dans le milieu
industriel, lorsque le fichier de donnes STATISTICA est li dynamiquement un appareil de
mesure connect au port srie (par exemple, pour mettre jour automatiquement des mesures
spcifiques toutes les heures). Comme OLE, la procdure est beaucoup plus simple qu'il n'y
parat et peut tre facilement utilise sans connaissance technique des mcanismes DDE.

Comme vous pourrez le constater dans les sections suivantes, STATISTICA Visual Basic est
trs proche du langage Microsoft Visual Basic ainsi que du langage Visual Basic disponible
dans d'autres applications (Microsoft Windows) comme Microsoft Excel.

Le programme suivant illustre diverses fonctionnalits du langage Visual Basic (VB et SVB).
Cet exemple lmentaire va afficher le premier message ci-contre, puis l'un des deux messages
suivants en fonction de l'action ralise par l'utilisateur.

250 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC

Dans STATISTICA, slectionnez l'option Nouveau du menu Fichier. Dans la bote de dialogue
Cration d'un Nouveau Document, slectionnez l'onglet Macro, et crez une nouvelle macro
que vous pouvez appeler Exemple1.
Sub Main
' NOTE : L'instruction suivante appelle
If MsgBox ("Bonjour ! Cliquez sur
vbOkCancel)=vbOK Then
MsgBox "Vous avez cliqu sur le
Else
MsgBox "Vous avez cliqu sur le
End If
End Sub

un message.
OK ou Annuler", _
bouton OK !"
bouton Annuler !"

Pour excuter ce programme, cliquez sur le bouton


de la barre d'outils Macro, appuyez sur
F5 ou slectionnez l'option Excuter la Macro dans le menu Excution.

Programme Principal : tout programme comporte au minimum une routine Main, commenant par Sub Main et se terminant par End Sub (les vnements peuvent tre personnaliss par des sous-routines avec des noms faisant rfrence un vnement particulier).
Commentaires : une ligne commenant par une quote est traite comme un commentaire.
Elle n'est donc pas prise en compte au moment de l'excution.
Suite de ligne : vous pouvez scinder une ligne de commandes sur plusieurs lignes en ajoutant la fin de chaque ligne le symbole underscore (_ ; il doit tre spar du texte qui le
prcde par un espace).
Aide sur les mots-cl SVB : vous pouvez tout moment obtenir plus d'informations sur un
mot-cl ou une instruction en mettant le texte correspondant en surbrillance dans votre

STATISTICA Prise en Main 251


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


programme, puis en appuyant sur la touche F1 pour afficher l'aide gnrale de SVB avec la
syntaxe du mot-cl ou de l'instruction correspondante et des exemples simples d'utilisation.

Le programme suivant illustre la manire dont vous pouvez dclarer et utiliser des variables
(pour stocker du texte ou des valeurs numriques) et des tableaux. Il montre aussi comment
dclarer des sous-routines (fonctions) et transmettre des arguments aux fonctions. Dans STATISTICA, slectionnez l'option Nouveau du menu Fichier. Dans la bote de dialogue Cration
d'un Nouveau Document, slectionnez l'onglet Macro puis crez une nouvelle macro que vous
pouvez appeler Exemple2.
Sub Main
Dim x (1 To 10) As Double
Dim Sum As Double, ResText As String
Dim i As Integer
For i =1 To 10
x(i)=i
Next i
Sum=ComputeSumOfSqrs ( LBound (x), UBound(x), x)
ResText="La somme des racines carres des valeurs de" + _
Str(LBound(x)) + _
" " + _
Str(UBound(x)) + _
" est gale " + _
Str(Sum)
MsgBox ResText
End Sub
Function ComputeSumOfSqrs (iFrom As Integer, _
iTo As Integer, _
x() As Double) As Double
Dim i As Integer
ComputeSumOfSqrs=0
For i= iFrom To iTo
ComputeSumOfSqrs=ComputeSumOfSqrs+x(i)^2
Next i
End Function

Les donnes de type Double, Integer et Long sont sans doute les plus utilises
dans les calculs. Les variables dclares en Double peuvent stocker des nombres rels compris
dans l'intervalle 1,7E 308 (environ 15 chiffres significatifs). Les variables dclares en
252 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


peuvent stocker des nombres entiers compris entre 32.768 et 32.767. Les variables
dclares en Long peuvent stocker des nombres entiers compris entre -2.147.483.648 et
2.147.483.647.
Integer

Utilisez le type de donnes String pour travailler sur des


chanes de caractres de longueur arbitraire.
Le type de donnes Boolean peut contenir deux valeurs : True (1) ou False (0).
L'exemple ci-dessus illustre galement la manire dont les tableaux de valeurs
sont dclars et utiliss dans Visual Basic. Par dfaut, le premier lment du tableau est associ l'indice 0. Par consquent, un tableau (x) dclar Dim x(5) possde en fait six lments :
le premier lment est rfrenc x(0), le second, x(1),, et le sixime lment, x(5).
Vous pouvez galement dclarer les tableaux avec des limites explicites ; par exemple, un
tableau dclar Dim x(1 to 5) ne possdera que cinq lments dont le premier sera rfrenc
x(1). Vous pouvez aussi ajouter en dbut de programme l'instruction Option Base 1 pour
associer le chiffre 1 au premier lment de tous les tableaux du programme, c'est--dire, avec
une limite infrieure gale 1 (cette option est insre par dfaut dans les macros enregistres).
Lorsque vous affectez des objets aux variables
(voir la section Objets, Mthodes et Proprits, page 256), vous devez utiliser la syntaxe suivante Set Variable = Objet ; par exemple :
Sub Main
Dim
Dim
Dim
Set

wb As Workbook
ss As Spreadsheet
g As Graph
wb=ActiveWorkbook
Set ss=Spreadsheets.Open( _
"j:\Statistica\Exemples\Fichiers de Donnes\Adstudy.sta")
ss.Visible=True
Set g=ActiveGraph
End Sub

Une collection ressemble un tableau, mais la collection est un objet (voir la section Objets,
Mthodes et Proprits, page 256) avec diverses mthodes, ce qui rend souvent le travail plus
pratique avec les collections qu'avec les tableaux. Dans STATISTICA Visual Basic, tous les

STATISTICA Prise en Main 253


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


rsultats (feuilles de donnes et graphiques) sont produits sous forme de collections ; l'dition,
le stockage et les autres traitements sont donc beaucoup plus pratiques pour la programmation.

Une variable dclare en type de donnes Variant peut tre vide, contenir des donnes numriques ou montaires, des dates, des chanes de caractres, des objets, des codes d'erreur, une
valeur nulle ou une valeur d'un tableau. Lorsque vous utilisez SVB pour incorporer des modules statistiques (fonctions) dans un programme personnalis, le type de donnes Variant est
souvent utilis pour travailler sur des listes de variables, etc... Par exemple, vous pouvez spcifier les variables comme des chanes (par exemple, .Variables="NomDeVariable"), des nombres (par exemple, .Variables=2), ou des tableaux (.Variables=VarArray). Remarque : les
variables qui ne sont pas explicitement dclares dans le programme sont considres par
dfaut comme des variables de type Variant.

Par dfaut, les variables sont transmises aux sous-routines et fonctions, par rfrence.
La sous-routine ou la fonction peut ainsi modifier la valeur d'une variable et renvoyer la valeur
actualise la routine qui a appel la sous-routine ou la fonction. Par consquent, si les sousroutines ou fonctions doivent modifier des valeurs (dans la routine partir de laquelle elle a
t appele), transmettez-les par rfrence (c'est--dire, utilisez les options par dfaut ou dclarez explicitement les arguments en utilisant le mot-cl ByRef dans la fonction). Lorsqu'une
variable est transmise une sous-routine ou une fonction par rfrence, c'est la rfrence la
variable qui est transmise ; lorsque la valeur de la variable est modifie dans la sous-routine, la
valeur de la routine appelante (celle qui a appel la routine respective) est galement modifie.
...
ComputeX x, y1,y2
...
Sub ComputeX(ByRef x
ByVal y2
'ou : Sub ComputeX(x
ByVal y2
x=y1+y2
End Sub

As
As
As
As

Double, ByVal y1 As Double, _


Double)
Double, ByVal y1 As Double, _
Double)

254 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


Les variables peuvent aussi tre transmises aux sous-routines et fonctions, par valeur.
D'une certaine manire, vous pouvez considrer que c'est la valeur de la variable (en quelque
sorte, une copie de cette variable) qui est transmise la sous-routine, et non pas la variable
elle-mme. D'un point de vue pratique, lorsque la valeur d'une variable transmise une sousroutine par valeur est modifie, la routine appelante (celle qui a appel la sous-routine respective) n'est pas modifie. Par consquent, les arguments transmis par valeur ne sont gnralement utiliss que comme arguments d'entre. Par exemple :
...
x = ComputeX(y1,y2)
...
Function ComputeX(ByVal y1 As Double, ByVal y2 As Double) As Double
ComputeX=y1+y2
End Function

Vous pouvez galement dclarer des variables en


dehors des sous-routines et fonctions, afin de les rendre visibles globalement pour toutes les
sous-routines et fonctions du programme SVB respectif.
Dim x as double, y1 as double, y2 as double
Sub Main
ComputeX
...
End Sub
Sub ComputeX
x=y1+y2
End Sub

Au lieu des variables individuelles, les sous-routines et les


fonctions Visual Basic peuvent aussi tre appeles avec des arguments de tableaux. Les tableaux sont toujours transmis par rfrence.
Dim xy(3) As Double
...
ComputeX xy
...
Sub ComputeX (xy() As Double)
xy(1) =xy(2)+xy(3)
End Sub

STATISTICA Prise en Main 255


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC

L'change d'informations entre diffrentes applications s'effectue en exposant ces applications


aux programmes Visual Basic sous forme d'objets. Vous pouvez donc, par exemple, excuter
des analyses statistiques dans le module Statistiques lmentaires de STATISTICA par un programme Visual Basic excut dans Excel, en dclarant dans le programme un objet du type
Statistica.Application.
Une fois l'objet cr, le programme Visual Basic peut alors accder aux proprits et mthodes
contenues dans cet objet. Vous pouvez considrer les proprits comme des variables et les
mthodes comme des sous-routines ou des fonctions ralisant certaines oprations ou calculs
l'intrieur de l'objet-application respectif.
Pour illustrer cette fonctionnalit, crons un
petit programme que nous allons excuter depuis Visual Basic dans Excel. Aprs avoir
dmarr Excel, crez un nouveau classeur (feuille de calcul). Dans le menu Outils, slectionnez l'option Macro - Visual Basic Editor. Dans le menu Outils de Visual Basic, slectionnez
l'option Rfrences.

Dans la bote de dialogue Rfrences, slectionnez les bibliothques (objets) rendre visibles
depuis le programme Visual Basic. Pour rendre STATISTICA visible, slectionnez STATISTICA
Object Library et STATISTICA Basic Statistics Library (de la version courante de STATISTICA) ; puis cliquez sur le bouton OK.
256 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC

Saisissez prsent le texte suivant dans l'diteur du programme.


Sub TestExcel()
Set x = CreateObject("Statistica.Application")
' NOTE : Ce fichier peut se trouver dans un autre rpertoire
Set a = x.Analysis(scBasicStatistics, _
"j:\STATISTICA\Exemples\Fichiers de Donnes\Exp.sta")
a.Dialog.Statistics = scBasDescriptives
a.Run
a.Dialog.Variables = "5-8"
Set out = a.Dialog.Summary
' Slectionne toutes les lignes et colonnes de la feuille de
' donnes STATISTICA.
out.Item(1).SelectAll
out.Item(1).Copy
Range("A1").Select
ActiveSheet.PasteSpecial Format :="Biff4"
End Sub

Lorsque vous excutez ce programme Visual Basic depuis Microsoft Excel (Visual Basic
Editor), les rsultats de la feuille de donnes Synthse de l'analyse produite par la procdure
Statistiques Descriptives du module Statistiques lmentaires sont colls dans la feuille Excel
en cours.

Vous pouvez appeler, depuis vos programmes SVB, des fonctions dfinies dans des DLL
externes. Veuillez vous reporter la rubrique Appeler des Fonctions depuis des DLL Externes

STATISTICA Prise en Main 257


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


dans le Manuel lectronique pour les conventions d'appellation et les dclarations de fonctions
ncessaires pour rendre des fonctions externes visibles (et utilisables) dans SVB.

Les bibliothques de fonctions STATISTICA permettent de programmer et personnaliser entirement votre application STATISTICA ; ces fonctions peuvent tre appeles depuis d'autres applications compatibles avec le langage Visual Basic, comme Microsoft Visual Basic, Microsoft Excel, etc...

Dans STATISTICA, slectionnez la commande Nouveau du menu Fichier puis dans la bote de
dialogue Cration d'un Nouveau Document, slectionnez l'onglet Macro et crez une nouvelle
macro que vous pouvez appeler Exemple3.

258 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


SVB est organis autour d'objets d'analyse ; ainsi, pour raliser une analyse avec le module
Statistiques lmentaires de STATISTICA, vous devez pralablement crer un objet d'analyse
avec la constante scBasicStatistics et (ventuellement) un nom de fichier (nom et rpertoire du fichier contenant la feuille de donnes d'entre). Pour faciliter l'accs aux milliers de
fonctions statistiques et options disponibles dans STATISTICA, SVB conserve un lien aussi
troit que possible entre les botes de dialogue utilises lors d'une analyse interactive et le
droulement du programme SVB. D'une certaine manire, lorsqu'une analyse a t cre, comme celle du module Statistiques lmentaires dans notre exemple, vous programmez simplement les botes de dialogue de l'analyse statistique respective :
Sub Main
' NOTE : Le fichier de donnes peut se trouver dans un rpertoire
' diffrent. Si vous avez enregistr cette portion de code par une
' Filire, les analyses conscutives vont s'appeler newanalysis1,
' newanalysis2, etc..., et les feuilles de donnes d'entre du
' fichier seront associes explicitement aux variables (objets)
' S1, S2, etc...
Set newanalysis = Analysis (scBasicStatistics, _
"j:\STATISTICA\Exemples\Fichiers de Donnes\exp.sta")
newanalysis.Dialog.Statistics = scBasDescriptives
newanalysis.Run
newanalysis.Dialog.Variables = "1-8"
' NOTE : la ligne suivante montre comment rendre une feuille de
' rsultats visible ; lorsque vous enregistrez des macros d'analyse,
' d'autres paramtres-systme (par exemple : options de sortie) sont
' galement enregistrs et les rsultats sont grs par la mthode
' RouteOutput.
newanalysis.Dialog.Summary.Visible = True
End Sub

Vous pouvez considrer chaque bote de dialogue comme une proprit de l'analyse (par exemple, Statistiques lmentaires) et chaque
option, slection, etc... de cette bote de dialogue comme une proprit de celle-ci. Vous allez
donc tout d'abord appeler le module en dclarant l'objet d'analyse respectif, puis dfinir les
options dsires, etc... comme des proprits de l'analyse (et des botes de dialogue de cette
analyse). Lors de la cration de programmes, l'enregistrement automatique de la macro STATISTICA effectue l'essentiel du travail de programmation votre place. Il vous suffit de raliser vos analyses de faon interactive, puis de crer une macro de ces analyses ; cette macro
comporte tout le code de programmation permettant de recrer l'analyse pas--pas et peut aisment tre modifi (copi, coll) pour crer votre propre application personnalise.
Pour passer
d'une bote de dialogue une autre au cours d'une analyse interactive dans STATISTICA, vous
STATISTICA Prise en Main 259
Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


utilisez les boutons OK (pour accder la bote de dialogue suivante) et Annuler (pour revenir
la prcdente). SVB utilise deux mthodes appartenant l'objet de l'analyse. La mthode Run
permet d'accder la bote de dialogue suivante tandis que GoBack permet de revenir la prcdente. Seule la mthode Run est illustre dans l'exemple prcdent.
Les rsultats des analyses STATISTICA se prsentent sous forme de feuilles de donnes et graphiques. Lors d'une analyse interactive, ces rsultats sont produits en cliquant sur les boutons respectifs des botes d'analyse. Dans SVB, vous
pouvez cliquer (implicitement) sur ces boutons en excutant la mthode correspondante de
la bote de dialogue respective. Par exemple, la plupart des botes de dialogue d'analyse de
STATISTICA possdent un bouton Synthse (associ l'icne
) pour produire les rsultats
essentiels de l'analyse. Dans SVB, c'est la mthode Summary associe aux botes de dialogue
d'analyse qui permet de le faire.
Chaque mthode utilise pour produire des rsultats sous forme de feuilles de
donnes et de graphiques (par exemple, la mthode Summary) renvoie une collection d'objets
de feuilles de donnes, de graphiques ou de feuilles de donnes et de graphiques. Mme si les
rsultats (feuilles de donnes et graphiques) ne sont constitus que d'un seul document, ils sont
renvoys comme une collection. Par consquent, vous pouvez utiliser les conventions standard
de Visual Basic pour rcuprer les objets individuels d'une collection, etc
Lorsque vous utilisez STATISTICA de faon interactive, les rsultats (feuilles de donnes et graphiques) sont envoys dans
des classeurs (par dfaut), des fentres indpendantes, des rapports, etc..., selon les choix
raliss dans la bote de dialogue Gestionnaire de Sorties de l'Analyse/Graphique. Les options
de cette bote de dialogue sont accessibles par l'objet AnalysisOutput, qui peut tre utilis
comme un container de feuilles de donnes et de graphiques. D'une manire gnrale, une
collection de feuilles de donnes ou de graphiques (rsultats) est enregistre comme suit :
newanalysis.RouteOutput(newanalysis.Dialog.Summary).Visible=True

La mthode RouteOutput prend comme argument la collection Summary (feuilles de donnes,


graphiques ou les deux) et la place dans le classeur, rapport, etc... en fonction des slections de
la bote de dialogue Gestionnaire de Sorties de l'Analyse/Graphique. La mthode RouteOutput
renvoie en fait un objet de type AnalysisOutput qui possde lui-mme un certain nombre de
mthodes et de proprits le rendant entirement programmable.
Notez que les slections de la bote de dialogue Gestionnaire de Sorties de l'Analyse/Graphique
sont enregistres par l'objet OutputOption. Plus prcisment, ces options sont enregistres,
soit dans le cadre d'une Macro d'Analyse si elles sont dfinies ou modifies par le bouton
Options - Gestionnaire de Sorties d'une analyse spcifique, soit dans le cadre d'une Filire
260 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


d'Analyses si elles sont dfinies ou modifies dans une analyse spcifique ou dans le volet
d'options Analyses/Graphiques - Gestionnaire de Sorties de la bote de dialogue Options
(accessible par le menu Outils - Options).
Lorsque vous enregistrez une srie d'analyses
avec diffrents fichiers, filtres de slection, pondrations, etc..., de longues squences d'instructions sont produites dans le programme SVB pour rendre compte des divers paramtres et
choix oprs lors des analyses successives. La rexcution de ces macros enregistres permet
de reproduire les mmes analyses ; soyez particulirement vigilant(e), car les rsultats produits
par une macro enregistre peuvent diffrer de ceux produits lors de l'analyse interactive. Les
filtres de slection et les pondrations qui sont dfinis pour le fichier de donnes d'entre sont
une proprit du fichier d'entre (document) et non de l'analyse ; ils ne sont donc pas enregistrs (un message vous alerte lorsque vous dfinissez, par exemple, des filtres de slection sur
un fichier de donnes d'entre), sauf si :
1. Vous avez enregistr une Macro d'Analyse et spcifi les filtres de slection ou les pondrations dans une bote de dialogue d'analyse (par les boutons Filtres de slection
ou
Pondrations
), et non pas par les options Filtres de Slection ou Pondrations du menu Outils ;
2. Vous avez enregistr une Filire d'Analyse et spcifi les filtres de slection ou pondrations dans une bote de dialogue d'analyse ou par les commandes du menu Outils aprs
avoir commenc l'enregistrement de la Filire d'Analyses (par le menu Outils - Macro Enregistrer une Filire d'Analyses).
En d'autres termes, les filtres de slection ou pondrations dfinis pour un fichier de donnes
appartiennent au fichier de donnes puisqu'ils dcrivent la nature des donnes (et non la
nature d'une analyse particulire). Ainsi, lorsque vous crez un enregistrement dans lequel
vous souhaitez documenter une analyse ayant produit des rsultats spcifiques, vous pouvez
dfinir explicitement les filtres de slection ou pondrations d'observations dans le cadre de
votre analyse pour vous assurer qu'ils sont correctement enregistrs.

Dans STATISTICA, slectionnez la commande Nouveau du menu Fichier puis, dans la bote de
dialogue Cration d'un Nouveau Document, slectionnez l'onglet Macro et crez une nouvelle
macro. Saisissez (ou collez) le programme ci-aprs.
STATISTICA Prise en Main 261
Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


Sub Main
' NOTE : ce fichier peut se trouver dans un autre rpertoire.
Set newanalysis = Analysis (scBasicStatistics, _
"j:\Statistica\Exemples\Fichiers de Donnes\exp.sta")
newanalysis.Dialog.Statistics = scBasFrequencies
newanalysis.Run
newanalysis.Dialog.Variables = "1-8"
Set s=newanalysis.Dialog.Summary
s.Visible=False
MsgBox "Nombre de feuilles de donnes : " + s.Count
s.Item(s.Count).Visible=True
End Sub

Les feuilles de donnes


et graphiques ne constituent que deux des types de documents que STATISTICA utilise pour
grer les entres et les sorties des analyses statistiques. Parmi les autres types de documents,
citons les rapports et les classeurs, qui permettent d'organiser et grer tous les autres documents. Chaque type de document dispose de proprits et mthodes permettant de personnaliser ou d'accder diffrents aspects de vos rsultats pour poursuivre vos traitements.

Lors d'une analyse interactive, les rsultats sont envoys dans des classeurs, fentres indpendantes, rapports, etc..., selon les paramtres de la bote de dialogue Gestionnaire de Sorties de
l'Analyse/Graphique, accessible par l'option Gestionnaire de Sorties du menu
. Les
options de cette bote de dialogue sont accessibles par l'objet AnalysisOutput qui peut tre
utilis comme un container de feuilles de donnes et de graphiques. D'une manire gnrale,
une collection de feuilles de donnes et graphiques (rsultats) est enregistre comme suit :
newanalysis.RouteOutput(newanalysis.Dialog.Summary).Visible=True

La mthode RouteOutput prend comme argument la collection Summary (feuilles de donnes,


graphiques ou les deux) et la place dans le classeur, rapport, etc... en fonction des slections de
la bote de dialogue Gestionnaire de Sorties de l'Analyse/Graphique. La mthode RouteOutput
renvoie en fait un objet de type AnalysisOutput qui possde lui-mme un certain nombre de
mthodes et de proprits le rendant entirement programmable.
Remarque : les slections de la bote de dialogue Gestionnaire de Sorties de l'Analyse/Graphique sont enregistres par l'objet OutputOption. Plus prcisment, ces options sont enregis262 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


tres soit dans le cadre d'une Macro d'Analyse si elles sont dfinies ou modifies par le bouton
Options - Gestionnaire de Sorties d'une analyse spcifique, soit dans le cadre d'une Filire
d'Analyses si elles sont dfinies ou modifies dans une analyse spcifique ou dans le volet
d'options Analyses/Graphiques : Gestionnaire de Sorties de la bote de dialogue Options
(accessible par le menu Outils - Options).
Supposez que dans votre analyse interactive, toutes les feuilles de rsultats ont t envoyes
automatiquement dans un classeur ; une macro enregistre partir de cette analyse peut ressembler ce que nous avons illustr dans l'exemple suivant. Cet exemple montre galement la
faon d'accder aux documents de rsultats dans l'objet AnalysisOutput.
Sub Main
' NOTE : Le fichier de donnes peut se trouver dans un autre
' rpertoire. Si vous avez enregistr cette portion de code par une
' Filire, les analyses conscutives vont s'appeler newanalysis1,
' newanalysis2, etc..., et les feuilles de donnes d'entre du
' fichier seront associes explicitement aux variables (objets)
' S1, S2, etc...
Set newanalysis = Analysis (scBasicStatistics, _
"j:\Statistica\Exemples\Fichiers de Donnes\exp.sta")
newanalysis.Dialog.Statistics = scBasFrequencies
newanalysis.Run
newanalysis.Dialog.Variables = "1-8"
' Cre l'objet de Sortie d'Analyse comme spcifi par les
' paramtres courants du Gestionnaire de Sorties.
Set r=newanalysis.RouteOutput(newanalysis.Dialog.Summary)
' Vrifie que l'objet AnalysisOutput contient bien un classeur.
If (r.HasWorkbook=True) then
' Nous allons ensuite trouver la premire feuille de donnes (table
' de frquences) et l'extraire du classeur sous forme de fentre
' indpendante. Notez que nous avons explicitement dimensionn les
' objets dans le code SVB suivant, afin de le rendre plus clair.
Dim w as Workbook
Set w=r.Workbook
Dim wi As WorkbookItem
Set wi=w.Root.Child
While (wi.Type<>scWorkbookItemTypeSpreadsheet)
Set wi=wi.Child
Wend
Dim s As Spreadsheet
Set s=wi.Extract(scWorkbookExtractCopy)
s.Visible=True
End If
End Sub

STATISTICA Prise en Main 263


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC

Toutes les procdures statistiques et graphiques et leurs personnalisations sont accessibles sous
forme de proprits ou fonctions en STATISTICA Visual Basic. Afin de fournir un environnement de programmation aussi transparent que possible pour l'utilisateur, les objets d'analyse et
proprits de ces objets sont organiss conformment au droulement des options et botes de
dialogue des analyses interactives. En outre, de nombreuses proprits, fonctions, constantes et
vnements (sous-routines associes des vnements particuliers et raliss sur des
documents, par exemple, en cliquant avec le bouton droit dans une feuille de donnes) permettent de grer des documents, des fichiers et de nombreuses options gnralistes d'analyse. Pour
connatre les bibliothques et l'envergure de l'installation de SVB sur votre machine, vous pouvez appeler l'Explorateur d'Objets. Pour ce faire, crez une nouvelle macro en slectionnant la
commande Nouveau du menu Fichier, puis dans la bote de dialogue Cration d'un Nouveau
Document, cliquez sur l'onglet Macro, et slectionnez l'option Explorateur d'Objets dans le
menu Affichage.

264 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


Ci-dessous, la liste des modules STATISTICA actuellement disponibles ainsi que le nom de la
bibliothque correspondante, accessible en Visual Basic.

ACP la Franaise (1)


Ajustement de Distributions (2)

STAFactor
STANonparametrics

scAdvancedPCA
scDistributions

Analyse Canonique

STACanonical

scCanonicalAnalysis

Analyse des Correspondances

STACorrespondence

scCorrespondenceAnalysis

Analyse Discriminante

STADiscriminant

scDiscriminantAnalysis

Analyse Factorielle

STAFactor

scFactorAnalysis

Analyse Log-Linaire

STALogLinear

scLoglinearAnalysis

Analyse de Processus

STAProcessAnalysis

scProcessAnalysis

Analyse de Proximit

STAMultidimensional

scMultidimensionalScaling

Analyse de Survie

STASurvival

scSurvivalAnalysis

ANOVA
Arbres de Dcision

STAMANOVA
STAQuickTrees

scMANOVA
scClassificationTrees

Arbres de Dcision Interactifs

STAITrees

scInteractiveTrees

Boosting d'Arbres de Dcision


Cartes de Contrle pour des
Listes de Variables
Cartes de Contrle Qualit

STABTrees

scBoostingTrees

STAIQCVChartsLib
STAQuality

scQCCVariableLists
scQualityControl

Classification Gnralise

STAGCluster

scGeneralClusterAnalysis

Classifications

STACluster

scClusterAnalysis

Dcomposition de la Variance

STAVarianceComponents scVarianceComponents

Drill-Down

STADrillDown

scDrillDown

Estimation Non-Linaire

STANonlinear

scNonlinearEstimation

(3)

STATISTICA Prise en Main 265


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


Fiabilit et Analyse d'Echelle

STAReliability

scReliabilityandItemAnalysis

Machine Learning
MARSplines (Multivariate
Adaptative Regression Splines)
Modle Linaire Gnral

STAMachineLearning

scMachineLearning

STAMARSplines
STAGLM

scMARSplines
scGLM

Modles Additifs Gnraliss


Modles d'Arbres de
Classification et de Rgression
Modles CHAID
Modles Gnraux d'Analyse
Discriminante
Modles Gnraux
de Rgression
Modles Linaires Gnraliss

STAGAM

scGAM

STAGTrees
STAGCHAID

scGTrees
scGCHAID

STAGDA

scGDA

STAGRM
STAGLZ

scGSR
scGLZ

Plans d'Expriences

STAExperimental

scDesignOfExperiments

Qualit d'Ajustement

STAGoodnessOfFit

scGoodnessOfFit

Rgles d'Association

STAASC

scAssociation

Rgression PLS

STAPLS

scPLS

Rgression Multiple

STARegression

scMultipleRegression

Rseaux de Neurones
Slection et Filtrage des
Meilleurs Prdicteurs
Sries Chronologiques

STASANN

scSANN

STAFSL
STATimeSeries

scFeatureSelection
scTimeSeries

Statistiques lmentaires

STABasicStatistics

scBasicStatistics

Tests Non-Paramtriques

STANonparametrics

scNonparametrics

(1)

Les techniques d'ACP la Franaise sont accessibles par la bibliothque du module


Analyse Factorielle.
(2)
Les fonctions et routines du module Ajustement de Distributions font partie de la bibliothque du module Tests Non-Paramtriques.
(3)
Les fonctions de la bote de dialogue des rsultats de l'ANOVA sont accessibles par la bibliothque du Modle Linaire Gnral.
266 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


La liste des modules et procdures ainsi que les bibliothques STATISTICA
accessibles en Visual Basic sont en constante volution. Visitez rgulirement le site web de
StatSoft (www.statsoft.com).
Les graphiques du menu Graphiques font partie de la bibliothque de rfrence principale de STATISTICA ; vous pouvez tudier les constantes respectives pour initier
une analyse graphique dans l'Explorateur d'Objets.

Lorsque vous lancez une analyse statistique l'aide d'un programme STATISTICA Visual
Basic, vous devez d'abord crer un nouvel objet d'analyse. Pour excuter une analyse STATISTICA depuis une autre application par Visual Basic (par exemple, Excel, voir page 256), vous
devez pralablement charger les bibliothques STATISTICA requises (par une option gnralement appele Rfrences dans le menu Outils de l'diteur Visual Basic de l'application), puis
crer un objet du type STATISTICA.Application. Vous pouvez ensuite crer des objets d'analyse qui font partie de l'objet STATISTICA.Application.
Ainsi, pour accder aux fonctions de la bibliothque Statistiques lmentaires de STATISTICA
depuis Microsoft Excel, vous devez inclure le code Visual Basic suivant :
Set x = CreateObject("STATISTICA.Application")
' NOTE : Ce fichier peut se trouver dans un rpertoire
' diffrent de votre installation.
Set a = x.Analysis(scBasicStatistics, _
"j:\STATISTICA\Exemples\Fichiers de donnes\exp.sta")

Notez que x est dsormais un objet de type STATISTICA.Application ; a est un objet de type
STATISTICA.Application.Analysis. Lorsque vous excutez un programme depuis l'diteur
de programmes STATISTICA Visual Basic (SVB), vous pouvez ne pas dclarer explicitement
l'objet STATISTICA.Application, et crire simplement :
Set a = Analysis(scBasicStatistics, _
"j:\Statistica\Exemples\Fichiers de Donnes\exp.sta")

Lorsque vous excutez le programme depuis STATISTICA, le programme sait que l'objet
Analysis appartient STATISTICA.Application. Vous pouvez nanmoins crer un nouvel
objet STATISTICA.Application ; par exemple, vous pouvez tenter d'excuter le programme
de la page suivante depuis STATISTICA Visual Basic (SVB).

STATISTICA Prise en Main 267


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


Sub Main
Set x = New Application
Dim InputDocument As StaDocuments
Dim InputFile As Spreadsheet
Set InputDocument=x.Spreadsheets
' NOTE : Ce fichier peut se trouver dans un autre rpertoire.
Set InputFile=InputDocument.Open( _
"j:\Statistica\Exemples\Fichiers de donnes\exp.sta")
Set a = x.Analysis(scBasicStatistics, InputFile)
InputFile.Visible=True
x.Visible=True
a.Visible=True
End Sub

Ce programme va crer une nouvelle application STATISTICA puis ouvrir le fichier de donnes spcifi et le module de Statistiques lmentaires de STATISTICA. Tous les objets dclars dans le programme sont ensuite rendus visibles ; aprs l'excution du programme, vous
allez voir apparatre une nouvelle application STATISTICA, le fichier de donnes d'entre ainsi
que le Panneau de Dmarrage du module Statistiques lmentaires.

Cette section contient un certain nombre de programmes SVB courts et trs simples permettant
d'illustrer des tches spcifiques et la manire de les accomplir.

Ce programme permet d'afficher une bote de message lmentaire.


Sub Main
' NOTE : L'instruction suivante fait apparatre une bote de message.
If MsgBox ("Bonjour ! Cliquez sur OK ou Annuler", _
vbOkCancel)=vbOK Then
MsgBox "Vous avez cliqu sur le bouton OK !"
Else
MsgBox "Vous avez cliqu sur le bouton Annuler !"
End If
End Sub

268 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC

Lorsque vous excutez le programme, vous voyez apparatre un premier message, et selon que
vous cliquez sur OK ou Annuler, un second message indiquant le choix que vous avez fait.

Cet exemple va crer une nouvelle feuille de donnes et la remplir avec des valeurs alatoires.
La premire colonne contiendra des valeurs alatoires distribues selon la loi uniforme tandis
que la seconde contiendra des valeurs alatoires distribues normalement.
Option Base 1
Sub Main
Dim n As Long,i As Long
n=1000
' Cre et dimensionne l'objet Spreadsheet (feuille de donnes)
Dim s As New Spreadsheet
' Dfinit la taille de l'objet
s.SetSize(n,2)
' Affecte les valeurs alatoires
For i=1 To n
s.Value(i,1)=Rnd(1)
s.Value(i,2)=RndNormal(1)
Next i
' Dfinit le nom des variables
s.VariableName(1)="Uniforme"
s.VariableName(2)="Normale"
s.Visible=True
End Sub

STATISTICA Prise en Main 269


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC

Il peut tre utile d'indiquer la progression des calculs par une barre de progression du mme
type que celle qui est utilise dans STATISTICA lors de l'analyse de gros fichiers de donnes.
Ci-dessous, un programme qui implmente une barre de progression dans le programme permettant de produire des valeurs alatoires :
Option Base 1
Sub Main
Dim n As Long,i As Long
n=1000
' Cr et dimensionne l'objet Spreadsheet (feuille de donnes)
Dim s As New Spreadsheet
' Dfinit la taille de l'objet
s.SetSize(n,2)
' Insre une barre de progression
Dim pb As ProgressBar
Set pb = AddProgressBar("Gnration de nombres alatoires", 1, n)
' Affecte les valeurs alatoires
For i=1 To n
' Met jour la barre de progression
pb.CurrentCounter = i
s.Value(i,1)=Rnd(1)
s.Value(i,2)=RndNormal(1)
Next i
' Ferme la barre de progression
Set pb = Nothing
' Dfinit le nom des variables
s.VariableName(1)="Uniforme"
s.VariableName(2)="Normale"
s.Visible=True
End Sub

L'exemple suivant illustre la faon de crer un histogramme simple partir des donnes gnres dans le programme ; plus particulirement, nous allons crer deux histogrammes partir
des donnes produites dans l'exemple prcdent.

270 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


Option Base 1
Sub Main
Dim n As Long
n=1000
Dim s As New Spreadsheet
' Cre les valeurs alatoires dans la feuille de donnes s
ComputeRandomNumbers s, n
' Cr l'histogramme partir des valeurs de s
CreateHistograms s
End Sub
Sub ComputeRandomNumbers (s As Spreadsheet, n As Long)
Dim i As Long
s.SetSize(n,2)
For i=1 To n
s.Value(i,1)=Rnd(1)
s.Value(i,2)=RndNormal(1)
Next i
s.VariableName(1)="Uniforme"
s.VariableName(2)="Normale"
End Sub
Sub CreateHistograms (s As Spreadsheet)
' NOTE : Le code suivant a t cr en modifiant (simplifiant)
' le code produit par une macro d'analyse.
Dim newanalysis As Analysis
Set newanalysis = Analysis (sc2dHistograms, s)
With newanalysis.Dialog
.Variables = "1 2 | "
.GraphType = scHistogramRegularPlot
End With
newanalysis.Dialog.Graphs.Visible = True
End Sub

Ce programme fait appel une sous-routine pour calculer les donnes de la feuille de donnes
d'entre, puis une autre pour crer les histogrammes.

STATISTICA Prise en Main 271


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC

L'histogramme est cr par une analyse STATISTICA et le code report ci-dessus a t cr en


enregistrant une analyse simple dans une macro d'analyse, puis en simplifiant le programme
enregistr (notamment en supprimant la dfinition explicite des diverses options par dfaut).

Vous pouvez envoyer tous les rsultats (feuilles de donnes et graphiques) de vos programmes
SVB vers les mmes canaux (par exemple, classeurs, rapports) que vos rsultats d'analyses.
La mthode RouteOutput peut envoyer les graphiques ou feuilles de donnes vers un classeur
ou un rapport selon le paramtrage en cours de STATISTICA. Voir galement la description de
la mthode RouteOutput (page 260) pour plus d'informations. Par exemple, dans l'exemple
prcdent, si vous remplacez, dans la sous-routine Sub CreateHistograms, la ligne :
newanalysis.Dialog.Graphs.Visible = True

par la ligne :
newanalysis.RouteOutput(newanalysis.Dialog.Graphs).Visible = True

les histogrammes seront envoys vers le ou les canaux par dfaut, spcifis dans la bote de
dialogue Gestionnaire de Sorties.
272 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC

La mthode RouteOutput (voir page 260) envoie les rsultats vers le mme canal de sortie
que les autres rsultats, selon le paramtrage du Gestionnaire de Sorties. Vous pouvez aussi
envoyer du texte, des graphiques, etc... directement dans un rapport. Ci-dessous, un programme illustrant la manire de procder (attention car la sous-routine ComputeRandomNumbers,
ncessaire l'excution du programme, n'a pas t reporte ici).
Option Base 1
Sub Main
Dim g(2) As Graph
Dim n As Long
Dim s As New Spreadsheet
' Cr une nouvelle fentre de rapport
Dim r As New Report
n=1000
' Cre les valeurs alatoires dans la feuille de donnes s
ComputeRandomNumbers s, n
' Cre l'histogramme partir des valeurs de s
CreateHistograms s, g
' Ajoute le texte suivant
r.SelectionText="Graphique de la variable Uniforme :" +vbCrLf+vbCrLf
' Ajoute le premier graphique au rapport
r.SelectionObject=g(1)
' Ajoute deux <cr>-<lf> (nouvelles lignes)
r.SelectionText=vbCrLf+vbCrLf
r.SelectionText=" Graphique de la variable Normale :" +vbCrLf+vbCrLf
' Ajoute le second graphique au rapport
r.SelectionObject=g(2)
r.SelectionText=vbCrLf+vbCrLf
' Rend le rapport visible
r.Visible=True
End Sub
Sub CreateHistograms (s As Spreadsheet, g() As Graph)
' Ce code a t cr en modifiant le code d'une macro d'analyse.
Dim newanalysis As Analysis
Set newanalysis = Analysis (sc2dHistograms, s)
newanalysis.Dialog.Variables = "1 2 | "
Set g(1)=newanalysis.Dialog.Graphs(1)
Set g(2)=newanalysis.Dialog.Graphs(2)
End Sub

STATISTICA Prise en Main 273


Copyright StatSoft, 2010

CHAPITRE 9 : STATISTICA VISUAL BASIC


Lorsque vous excutez ce programme, le rapport suivant est cr ; vous remarquerez les titres
crs par le programme qui ont t insrs dans le mme rapport que les objets graphiques.

274 STATISTICA Prise en Main


Copyright StatSoft, 2010

STATISTICA Quick Reference 275

Copyright StatSoft, 2007

Pour une dfinition des termes techniques utiliss dans cette introduction (par
exemple, ODBC, SQL,...), veuillez vous reporter au glossaire du Manuel lectronique, accessible par la commande Aide STATISTICA du menu Aide.

STATISTICA Query permet d'accder facilement des donnes issues de divers types de bases
de donnes (notamment des systmes comme Oracle, MS SQL Server, Sybase, etc...) grce
aux conventions OLE DB de Microsoft. OLE DB est une puissante technologie permettant
l'intgration universelle des donnes sur un rseau d'entreprise, allant des gros systmes
l'ordinateur de bureau, quel que soit le type de donnes. OLE DB offre une stratgie d'accs
aux donnes plus gnraliste et efficace que l'ancienne convention ODBC dans la mesure o
elle permet d'accder davantage de types de donnes et qu'elle est base sur le modle-objet.
STATISTICA Query gre des bases de donnes relationnelles. Vous pouvez slectionner des
enregistrements spcifiques (lignes des tables) grce des commandes SQL que STATISTICA
Query va construire automatiquement pour vous. Vous devez simplement slectionner les
composantes de la requte au travers d'une interface graphique simple et/ou des options de
menus ou de botes de dialogues intuitives. Il n'est donc pas ncessaire de matriser le langage
SQL pour crer rapidement et simplement des requtes complexes. Il est possible de dfinir
plusieurs requtes, sur une ou plusieurs bases de donnes diffrentes, pour rcuprer les donnes dans une mme feuille de donnes, et vous pouvez maintenir des connexions plusieurs
bases de donnes externes simultanment.

STATISTICA Prise en Main 277


Copyright StatSoft, 2010

CHAPITRE 10 :

STATISTICA QUERY

Ci-dessous, les tapes ncessaires pour rcuprer des donnes avec STATISTICA Query :
1. Slectionnez la commande Crer une Requte dans le menu Donnes - Donnes Externes
(ou dans le menu Fichier - Donnes Externes) afin d'accder la bote de dialogue Connexion une Base de Donnes. Cette bote de dialogue vous permet de slectionner une connexion prdfinie une base de donnes (avec le fournisseur, l'emplacement de la source de
donnes et divers paramtres avancs relatifs au serveur ou au rpertoire dans lequel se
trouvent les donnes). Si vous n'avez encore spcifi aucune connexion, vous pouvez le
faire en cliquant sur le bouton Nouvelle dans la bote de dialogue Connexion une Base de
Donnes. La bote de dialogue Proprits des Liaisons de Donnes apparat et un Assistant
vous aide crer la connexion. Pour plus d'informations sur l'utilisation de la bote de dialogue Proprits des Liaisons de Donnes, appuyez sur la touche F1 pour appeler l'Aide de
Microsoft Data Link.
2. Aprs avoir slectionn une connexion une base de donnes et cliqu sur le bouton OK
dans la bote de dialogue Proprits des Liaisons de Donnes, STATISTICA Query vous
permet de crer votre instruction SQL en spcifiant les tables, les champs, les jointures et
les critres (par les menus Table, Jointure et Critres) inclure dans la requte.

278 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 10 : STATISTICA QUERY


3. Aprs avoir spcifi votre requte, slectionnez la commande Rcuprer les Donnes dans
STATISTICA dans le menu Fichier. La bote de dialogue Rcuprer des Donnes Externes
apparat alors et vous permet de spcifier le nom de la requte, l'emplacement o les donnes rcupres par STATISTICA Query doivent tre insres, ainsi que d'autres options.
Voir le Manuel lectronique pour plus d'informations.

Le requteur, lorsqu'il est intgr dans une version Entreprise de STATISTICA (voir STATISTICA Entreprise, page 313), permet de traiter directement des donnes situes sur un serveur
distant, c'est--dire sans avoir importer pralablement ces donnes dans un fichier en local
(stock sur le disque dur de l'ordinateur de l'utilisateur). Cette technologie permet de traiter de
trs gros fichiers de donnes, dpassant mme les capacits de stockage de votre ordinateur,
tout en permettant une amlioration significative des performances. Les utilisateurs de STATISTICA peuvent ainsi traiter des fichiers de donnes dpassant les capacits de stockage des
machines en local ou mme du serveur STATISTICA.
La technologie IDBD repose sur l'architecture du traitement distribu, o
les requtes sont effectues au niveau du serveur (en utilisant les ressources et les processeurs
du serveur) et les enregistrements respectifs sont envoys l'ordinateur STATISTICA o ils
sont traits simultanment (de faon asynchrone) mesure qu'ils deviennent disponibles.

STATISTICA Prise en Main 279


Copyright StatSoft, 2010

CHAPITRE 10 :

STATISTICA QUERY

280 STATISTICA Prise en Main


Copyright StatSoft, 2010

La plupart des aspects de STATISTICA sont exposs sous la forme d'interfaces COM qui sont
inscrits dans le registre d'une machine au moment de l'installation de STATISTICA. Dans la
mesure o les langages reposant sur le .NET ne peuvent pas communiquer directement avec
COM, vous pouvez utiliser une classe de wrapper appele Interop COM pour intgrer les
bibliothques STATISTICA dans votre projet .NET. La couche Interop COM est cre
automatiquement par l'IDE de Visual Studio .NET lorsque vous importez une interface COM.
La couche Interop COM gre tous les aspects relatifs l'interaction avec les bibliothques
COM depuis .NET. Lorsque la couche Interop COM est en place, l'interface COM de STATISTICA se comporte comme n'importe quel autre objet .NET.

La couche Interop .NET se cre automatiquement en ajoutant les interfaces COM souhaites
de STATISTICA dans votre projet .NET. STATISTICA Object Library est la base de la bibliothque STATISTICA COM. Pour ajouter STATISTICA Object Library dans un projet .NET,
slectionnez tout d'abord le projet .NET souhait dans l'Explorateur de Solutions, puis slectionnez la commande Ajouter une Rfrence dans le menu contextuel (accessible en cliquant
avec le bouton droit de la souris sur le projet .NET). La bote de dialogue Ajouter une Rfrence apparat.

STATISTICA Prise en Main 283


Copyright StatSoft, 2010

CHAPITRE 11 : PROGRAMMER EN .NET

Dans la bote de dialogue Ajouter une Rfrence, slectionnez l'onglet COM. Dans la liste Nom
du Composant, slectionnez STATISTICA Object Library puis cliquez sur le bouton OK.

ce stade, la bibliothque ncessaire de l'Interop COM est cre automatiquement. Dans le


nud Rfrences du projet, une entre STATISTICA apparat dsormais.

284 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 11 : PROGRAMMER EN .NET


Le fichier Interop.STATISTICA.dll est galement ajout au dossier de sortie du projet. La bibliothque Interop COM de STATISTICA est stocke dans ce fichier. Pour visualiser STATISTICA Object Library depuis votre projet .NET, cliquez avec le bouton droit de la souris sur la
rfrence STATISTICA et dans le menu Affichage - Autres Fentres, slectionnez la commande
Explorateur d'Objets.

Vous pouvez galement crer la bibliothque Interop COM manuellement et l'importer dans
votre projet .NET. Vous pouvez de cette manire spcifier un nom diffrent pour la DLL
Interop ainsi qu'un espace de nom particulier. Le programme permettant de crer un Interop
est TLBIMP.EXE. Depuis une invite de commande (par exemple, Visual Studio), excutez
TLBIMP avec un paramtre initial de la source du type de bibliothque. Dans l'exemple cidessous, nous avons galement spcifi le nom et les catgories de la DLL de sortie.

STATISTICA Prise en Main 285


Copyright StatSoft, 2010

CHAPITRE 11 : PROGRAMMER EN .NET


Dans cet exemple, nous avons fait rfrence au fichier STATIST.EXE dans la mesure o cet
excutable contient le type de bibliothque STATISTICA Object Library. l'issue de la cration de la DLL Interop, vous pouvez l'ajouter votre projet .NET par la commande Ajouter
une Rfrence de l'Explorateur de Solution comme prcdemment, mais cette fois en cliquant
sur le bouton Parcourir pour slectionner la DLL Interop que nous venons de crer.

Afin d'tre en mesure de grer plusieurs versions diffrentes de STATISTICA, il est ncessaire
de conserver des DLL Interop distinctes de STATISTICA Object Library pour chaque numro
de version de STATISTICA utiliser. Vous pouvez utiliser la commande TLBIMP pour gnrer
des DLL Interop pour des versions particulires de STATIST.EXE et d'autres DLL. Lorsque
vous distribuez l'application, veillez dployer la bonne version de la DLL Interop de STATISTICA dans votre application .NET.

Grce son architecture COM, vous pouvez intgrer STATISTICA dans de nombreux environnements de dveloppement. Si vous utilisez STATISTICA depuis un environnement de dveloppement externe, vous devez disposer d'un objet appel objet Application. L'objet Application est l'application elle-mme et contient d'autres objets (par exemple, feuilles de donnes et
graphiques), mais l'accs ces autres objets est limit sauf si l'objet Application est en cours
d'excution.
Si vous utilisez le nom STATISTICA par dfaut, vous devez dclarer votre variable dans l'interface STATISTICA.Application. Pour crer une instance de STATISTICA, votre variable doit
tre gale new STATISTICA.ApplicationClass().
STATISTICA.Application pApp = (STATISTICA.Application)
new STATISTICA.ApplicationClass();
pApp.Visible = true ;

Lorsque vous avez cr une instance de STATISTICA.ApplicationClass, vous devez voir apparatre STATIST.EXE dans la liste des processus. Vous obtenez le mme rsultat en lanant
STATISTICA partir du menu Dmarrer. L'instance STATISTICA est initialement silencieuse
286 STATISTICA Prise en Main
Copyright StatSoft, 2010

CHAPITRE 11 : PROGRAMMER EN .NET


mais vous pouvez la rendre visible. Dans la mesure o il s'agit d'un processus distinct, tous les
appels cette instance sont faits en mode out of process.

Outre l'objet STATISTICA.Application, il existe une version allge et plus performante de


l'objet, appele STATISTICA.Library. La version Bibliothque fait l'objet d'une licence distincte et n'est pas ncessairement disponible sur votre installation. Elle offre les mmes interfaces
que la bibliothque STATISTICA.Application. Tout code existant qui utilise l'objet Application
peut tre remplac par l'objet Library.
Le principal inconvnient de cette approche, c'est que les fonctionnalits de l'interface-utilisateur de STATISTICA ne sont pas disponibles dans la version Bibliothque. Par consquent,
dans l'exemple ci-dessus, si nous avions dmarr l'objet Application sous la forme d'un nouveau STATISTICA.LibraryClass, nous ne pourrions pas rendre l'objet visible (et faire apparatre l'interface de STATISTICA).
La version Bibliothque de STATISTICA est charge en mode in-process, ce qui signifie que
l'accs ses interfaces COM est plus efficace que si nous utilisions la version Application de
l'objet (qui est ouverte en mode out of process). Puisqu'elle est charge en mode in-process, il
n'est pas possible de lancer plusieurs versions de la bibliothque. En conditions normales, vous
ne dmarrerez qu'un seul objet Bibliothque ou un seul objet Application dans votre programme.

STATISTICA Prise en Main 287


Copyright StatSoft, 2010

CHAPITRE 11 : PROGRAMMER EN .NET

288 STATISTICA Prise en Main


Copyright StatSoft, 2010

CHAPITRE 11 : PROGRAMMER EN .NET

STATISTICA Prise en Main 289


Copyright StatSoft, 2010

CHAPITRE 11 : PROGRAMMER EN .NET

290 STATISTICA Prise en Main


Copyright StatSoft, 2010

La manire la plus simple et efficace d'accder


l'information souhaite sur STATISTICA consiste
rechercher dans le Manuel lectronique, qui contient
plus de 100 Mgaoctets de rfrences, illustrations et
exemples.

Ce document hypertexte va bien au-del de la simple


explication des options proposes dans STATISTICA.
Il inclut de nombreux exemples, introductions et
illustrations avec des centaines d'astuces sur la manire d'optimiser votre travail.

STATISTICA Prise en Main 291


Copyright StatSoft, 2010

ANNEXE A : POUR PLUS DINFORMATIONS

Le Manuel lectronique de STATISTICA est extrmement riche. Il intgre un Conseiller Statistique (voir
page 33), un Glossaire et le Manuel lectronique de
Statistiques de StatSoft, le tout, intgralement traduit
en Franais. La version anglaise est galement accessible en ligne sur notre site web : www.statsoft.com.
Le Manuel lectronique de Statistiques de StatSoft a
t recommand par l'Encyclopedia Britannica

pour sa Qualit, sa Prcision, sa Prsentation et sa


Facilit d'Utilisation. Ce manuel est utilis depuis de
nombreuses annes dans les principales universits et
organismes de recherche travers le monde.

Le site Web de StatSoft, l'une des adresses Internet les plus visites dans le domaine de l'analyse des donnes, donne accs de nombreuses informations, utiles pour les professionnels de l'analyse de
donnes, mais offre galement :
Un Forum permettant aux utilisateurs d'changer
sur leurs problmatiques particulires ou rechercher des rponses des questions dj rsolues, et
Une zone de tlchargement dans laquelle les utilisateurs de la version courante de STATISTICA peuvent tlcharger gratuitement des mises jour de
leur logiciel. Nos dveloppeurs travaillent en permanence pour augmenter la compatibilit de STATISTICA avec d'autres applications (ne respectant
pas ncessairement les conventions standard). Par
consquent, il est souvent conseill de tlcharger
une mise jour pour rsoudre des problmes

292 STATISTICA Prise en Main


Copyright StatSoft, 2010

ANNEXE A : POUR PLUS DINFORMATIONS


causs par des configurations de systme non-standard ou des conflits avec d'autres applications.
Si vous ne trouvez pas de rponse votre
problme ou votre question sur le site Web de
StatSoft, vous pouvez nous envoyer un e-mail. Merci
de reporter votre numro de srie (situ au dos de la
pochette du CD-rom d'installation ou accessible par le
menu Aide - Propos de STATISTICA) ainsi que toute
information utile sur la configuration de votre ordinateur, comme le type de processeur (CPU), la mmoire
(RAM), l'espace disque ou la version du systme
d'exploitation.

information utile sur la configuration de votre ordinateur, comme le type de processeur (CPU), la mmoire
(RAM), l'espace disque ou la version du systme
d'exploitation avant de contacter le support technique.

Pour les pays francophones, envoyez-nous un e-mail


l'adresse support@statsoft.fr.
Vous pouvez aussi nous contacter par
tlphone et dialoguer avec un consultant en appelant
au +33 (0)1-45-185-999. Nos consultants et techniciens sont votre disposition de 9h00 18h00, du
Lundi au Vendredi.
Pour contacter un autre bureau StatSoft, reportez-vous
la liste des filiales de StatSoft dans menu Aide -
Propos de STATISTICA, onglet Bureaux Internationaux :

Merci de prparer votre numro de srie (slectionnez


l'option - Propos de STATISTICA dans le menu Aide
pour obtenir votre numro de srie), ainsi que toute

STATISTICA Prise en Main 293


Copyright StatSoft, 2010

ANNEXE A : POUR PLUS DINFORMATIONS

294 STATISTICA Prise en Main


Copyright StatSoft, 2010

STATISTICA Prise en Main 295


Copyright StatSoft, 2010

ANNEXE A : POUR PLUS DINFORMATIONS

296 STATISTICA Prise en Main


Copyright StatSoft, 2010

WebSTATISTICA Server est une application permettant d'intgrer


STATISTICA avec Internet, et offre des fonctionnalits
pour excuter STATISTICA de faon interactive depuis
un navigateur Internet. Grce WebSTATISTICA, les
utilisateurs peuvent accder rapidement et facilement
aux donnes et aux puissants outils analytiques depuis
tout ordinateur, ds lors qu'il est connect Internet,
partout dans le monde. Le
produit est propos avec
diverses interfaces-utilisateur
bases sur le navigateur
Internet (sous forme de
botes de dialogue simples et
intuitives) permettant aux
utilisateurs de spcifier des
analyses et vrifier leurs
rsultats en utilisant simplement leur navigateur Internet
habituel. Des outils vous permettent de personnaliser les
botes de dialogue existantes,
de crer de nouvelles interfaces-utilisateur entirement
personnalises ou d'ajouter de nouvelles fonctions. Par
exemple, vous pouvez construire une bote de dialogue
lmentaire constitue uniquement de trois boutons
dans votre navigateur, chacun de ces trois boutons
dclenchant une srie d'analyses spcifiques et produisant un rapport dtaill. Les applications de WebSTATISTICA Server ajoutent une nouvelle dimension

et une infinit de possibilits et applications l'ensemble des produits d'analyse de donnes, de data mining,
et de contrle qualit / six sigma de la gamme STATISTICA.
WebSTATISTICA Server est un systme entreprise entirement personnalisable, permettant l'accs aux bases de donnes et
l'analyse des donnes au travers d'Internet. Construit sur la
technologie du calcul distribu, il est totalement compatible
avec l'architecture Client/Serveur multi-tiers. WebSTATISTICA Server offre les fonctionnalits
analytiques, de requtage, de reporting, et les graphiques de STATISTICA
par l'intermdiaire d'interfaces Web
classiques, interactives et faciles
d'utilisation. Le programme se prsente sous la forme d'une application
complte, cl-en-mains, avec une
interface-utilisateur base sur le navigateur Internet, permettant aux utilisateurs distance de crer leurs fichiers
de donnes, d'effectuer leurs analyses
et de vrifier leurs rsultats, le tout, de
faon interactive. Toutefois, en raison
de son architecture ouverte, WebSTATISTICA Server comprend galement des outils de dveloppement compatibles avec .NET (entirement bass sur
les conventions de syntaxe habituelles comme le langage
Visual Basic, C++, HTML, XML), permettant aux
dpartements informatiques de personnaliser les principales
composantes du systme, ou d'tendre le systme en
utilisant ses fondations en ajoutant, par exemple, de

STATISTICA Prise en Main 297


Copyright StatSoft, 2010

ANNEXE B : WebSTATISTICA
nouvelles composantes et/ou fonctionnalits analytiques
trs spcifiques ou relatives aux bases de donnes en place.
Le systme est compatible avec la plupart des plate-formes
serveur Web (par exemple, UNIX Apache, Microsoft IIS),
fonctionne la fois dans les environnements Microsoft
.NET et Sun/Java, et ne requiert aucune modification du
pare-feu ou des paramtres de scurit Internet/ Intranet en
vigueur.

Le systme WebSTATISTICA Server est une solution


complte offrant toutes les fonctionnalits analytiques
du produit ou de la combinaison de produits STATISTICA slectionns, depuis STATISTICA Base jusqu'aux
produits Entreprise les plus volus (STATISTICA
Entreprise et STATISTICA Data Miner).
L'installation minimum de WebSTATISTICA Server
intgre les fonctionnalits de STATISTICA Base et se
compose d'une licence avec 5 accs simultans (au
moins).
Vous avez la possibilit d'acqurir une version spcifique de WebSTATISTICA Server avec les fonctionnalits analytiques que vous souhaitez (par exemple,
STATISTICA Base pour dix utilisateurs), ou vous
pouvez ajouter la fonctionnalit Web Server (dcrites
dans cette section) certaines ou toutes les stations
comprises dans votre installation STATISTICA (par
exemple, ajouter une fonctionnalit Web Server 20
des 50 licences STATISTICA Entreprise).

L'avantage incontestable de la technologie de WebSTATISTICA Server est la possibilit d'accder la puissance des diffrents produits de la gamme
STATISTICA depuis tout ordinateur connect Internet.
Ainsi, les applications WebSTATISTICA Server ajoutent
une nouvelle dimension et une infinit de possibilits et
d'applications l'ensemble des produits d'analyse de

donnes, de data mining et de contrle qualit / six


sigma de la gamme STATISTICA.
Par exemple, les donnes et rapports les plus rcents
(avec mise jour des requtes sur des segments spcifiques du data warehouse de l'entreprise) - avec des options d'exploration interactive des rsultats (drill-down)
- peuvent dsormais tre rendus accessibles, en fonction des droits d'accs des utilisateurs, indpendamment de la station de travail depuis laquelle ils se
connectent. Ds lors qu'il est possible d'accder
Internet (en thorie partout dans le monde), vous
pouvez utiliser les outils d'analyse, de requte et de
reporting du systme d'analyse de donnes le plus
complet du march.
Un autre avantage tout aussi important de la fonctionnalit WebSTATISTICA Server est la possibilit d'utiliser le programme en complment des systmes entreprise de STATISTICA (STATISTICA Entreprise ou STATISTICA Data
Miner).
Plus prcisment, WebSTATISTICA Server peut tre au
cur du rseau de l'entreprise et permettre aux utilisateurs de travailler de faon collaborative, de partager
rapidement leurs rsultats (rapports), ainsi que les
scripts des analyses ou des requtes. Les droits d'accs
des utilisateurs ou groupes (voir le paragraphe Note
Technique, ci-dessous) peuvent tre utiliss par les
administrateurs pour dfinir les accs de chacun aux
diffrentes donnes et/ou rapports. L'accessibilit de
ces outils par Internet fait de WebSTATISTICA Server
un systme parfait pour faciliter le travail collaboratif
entre des utilisateurs travaillant des endroits et
branches diffrentes d'une entreprise (ou sur des continents diffrents), ou pour des utilisateurs changeant
des informations ou voyageant rgulirement.
Que les stations de travail soient proches du serveur WebSTATISTICA Server (par exemple, dans le mme immeuble)
ou trs loignes (par exemple, sur un autre continent),
elles vont toutes bnficier des outils pour le travail
collaboratif, mais aussi d'options permettant de dlguer les tches lourdes au serveur. Plus prcisment,

298 STATISTICA Prise en Main


Copyright StatSoft, 2010

ANNEXE B : WebSTATISTICA
puisque les CPU (Central Processing Unit) multiprocesseurs les plus puissants (et/ou plusieurs ordinateurs) sont utiliss comme serveurs, les utilisateurs ont
la possibilit de dlguer les tches lourdes au serveur.
Ils peuvent, par exemple, excuter en arrire-plan sur
les serveurs distants, des requtes sur des traoctets de
donnes et raliser de longues squences d'analyses et
de rapports, tout en conservant leur station de travail
libre pour d'autres tches. Grce son architecture en
traitement distribu, WebSTATISTICA Server peut voluer de manire efficace et tirer parti des CPU multiprocesseurs et/ou d'ordinateurs multiples, et permettre
aux utilisateurs de bnficier de l'architecture trois-tiers
o :
Le Premier Tiers est l'Interface-Utilisateur du poste
client (navigateur ou client STATISTICA, voir le
paragraphe Client STATISTICA, ci-dessous),
Le Deuxime Tiers est le logiciel WebSTATISTICA
Server et l'implmentation des fonctionnalits de
business intelligence qu'il peut contenir (requtes
spcifiques, scripts d'analyses personnalises ou
propritaires, etc...), et
Le Troisime Tiers concerne les bases de donnes
STATISTICA (par exemple, STATISTICA Data Warehouse) ou les autres entrepts de donnes de l'entreprise.
Dans les versions bureautiques de STATISTICA, tous
les calculs sont pris en charge par la station de travail
en local, et les ressources des autres ordinateurs ne sont
utilises que si vous avez recours la fonctionnalit
d'Interface Directe avec les Bases de Donnes (IDBD).
L'IDBD est une technologie qui traite directement les
donnes de manire asynchrone sur des bases de
donnes distantes (en utilisant la technologie du calcul
distribu si le serveur le permet), sans avoir crer de
copie des donnes en local, ni les importer. Les
enregistrements sont alors envoys l'ordinateur
STATISTICA de manire asynchrone par la CPU du
serveur de base de donnes, et STATISTICA les traite
en utilisant la CPU de la station de travail.
Si vous utilisez une version Client-Serveur de STATISTICA, la station de travail ne gre que l'interface-utilisateur de STATISTICA, tous les calculs tant pris en
charge par le serveur. L'architecture Client-Serveur

offre des avantages notables lorsque vous traitez de


gros projets (par exemple, des calculs intensifs ou le
traitement de jeux de donnes normes), car les projets
peuvent tre dlgus aux serveurs, librant ainsi la
station de travail pour d'autres tches.
Bien qu'aucune composante
du systme STATISTICA ne soit ncessaire sur la partie
cliente (seul un navigateur Internet est requis),
l'installation d'une copie de STATISTICA apporte toutefois de nouvelles possibilits. Mais alors, vous pouvez
vous demander Pourquoi utiliser WebSTATISTICA
Server si je dois aussi installer une copie du programme STATISTICA sur mon ordinateur ? En fait, si le
programme STATISTICA est install sur la partie
cliente, vous pouvez tirer parti de l'architecture troistiers Client/Serveur (voir ci-dessus) et travailler de
faon interactive avec STATISTICA en local, tout en
ayant la possibilit de dlguer les tches lourdes aux
serveurs et/ou de partager les donnes et rsultats entre
les diffrents collaborateurs. Vous pouvez appeler
WebSTATISTICA depuis l'application bureautique STATISTICA et contrler aisment les interactions entre les
deux. Diverses options permettent de rpartir les tches
entre la station de travail en local et le serveur.

En outre, lorsque vous analysez vos rsultats WebSTATISTICA dans un navigateur, vous avez la possibilit de
rapatrier ces rsultats en local sur votre ordinateur pour
poursuivre leur traitement. Par exemple, en cliquant sur
un petit bouton situ (selon la configuration) ct de
chacun des documents de sortie (tableaux, graphiques)

STATISTICA Prise en Main 299


Copyright StatSoft, 2010

ANNEXE B : WebSTATISTICA
envoys dans votre navigateur par WebSTATISTICA
Server, vous pourrez rapatrier cet objet (un tableau ou
un graphique STATISTICA) sur le client dans son
format natif STATISTICA (en format .sta ou .stg), ce
qui vous permet de poursuivre son analyse ou sa modification off-line grce aux outils STATISTICA en
local.

La plate-forme WebSTATISTICA est construite sur la


technologie du calcul distribu et du multithreading permettant une gestion optimale de charges de calculs importantes. Cette technologie permet un traitement rapide des
projets ncessitant des calculs intensifs sur de gros
fichiers de donnes, tirant pleinement avantage des diffrents CPU du serveur, ou de plusieurs serveurs en parallle.
L'illustration ci-dessous prsente un projet pris en charge
par les quatre processeurs d'un serveur. L'onglet Performance, du Gestionnaire des Tches de Windows, dmontre la pleine utilisation des ressources des quatre CPU
traitant en mode multithreading, un seul projet complexe
de STATISTICA Data Miner.

utilisateur base sur un navigateur Web et permet de


grer des projets importants l'chelle de l'entreprise
entre des groupes d'utilisateurs situs l'autre bout du
couloir ou l'autre bout du monde.
L'une des spcificits de la technologie du calcul distribu offerte dans STATISTICA
est la possibilit de tirer parti de tous les CPU du
serveur (pour grer plusieurs projets et/ou utilisateurs
simultanment, et traiter de lourds calculs), mais
galement de faire appel plusieurs ordinateurs du
serveur. Cette fonctionnalit est importante, puisqu'elle
permet d'augmenter significativement les performances. STATISTICA utilise la technologie du traitement
parallle sur des units indpendantes (comme le font
certains super-ordinateurs). Par exemple, si vous disposez de 3 serveurs, avec 4 processeurs chacun, STATISTICA pourra traiter un mme projet sur ces 12 processeurs (si l'tendue du projet permet ce traitement).

La fonctionnalit WebSTATISTICA de STATISTICA


permet aux utilisateurs d'excuter le programme de
faon interactive depuis un poste
client dans une interface Web,
proche de celle de la version
bureautique. L'application peut
donc tre excute au niveau du
client (l'application frontale)
depuis tout ordinateur (mme un
portable), ds lors qu'il est connect Internet. Toutefois, les
calculs et autres oprations sur
les donnes sont raliss sur le
serveur (distant) qui possde gnralement des processeurs plus
puissants et une plus grande
capacit de stockage (ils sont grs par l'architecture optimise
du systme, en calcul distribu et
en multithreading, pour une efficacit maximum).

L'architecture de WebSTATISTICA est totalement indpendante de la plate-forme. Elle offre une interface-

300 STATISTICA Prise en Main


Copyright StatSoft, 2010

ANNEXE B : WebSTATISTICA
Les diffrents aspects de l'interface-utilisateur de STATISTICA peuvent tre excuts par un ou plusieurs utilisateurs depuis tout ordinateur au monde (tant qu'il est
connect Internet, mme sans connexion haut
dbit), et le serveur ralise tous les calculs et les oprations sur les donnes, en utilisant les droits d'accs et
rgles de scurit applicables aux diffrents projets et
groupes d'utilisateurs, tels qu'ils ont t dfinis par
l'administrateur du rseau.

vous pouvez choisir une source de donnes (un fichier


de donnes ou une connexion une base de donnes),

WebSTATISTICA vous permet de raliser toutes vos


oprations d'analyse de donnes, de data mining, de
contrle qualit, de gestion de bases de donnes, de requtes ou de personnalisation des graphiques, de faon
interactive dans une interface-utilisateur simplifie.
Aprs vous tre connect(e) au systme WebSTATISTICA,

STATISTICA Prise en Main 301


Copyright StatSoft, 2010

ANNEXE B : WebSTATISTICA
visualiser et modifier les donnes dans l'diteur de
Feuilles de Donnes interactif de WebSTATISTICA,

slectionner les variables et spcifier les paramtres


ventuels de l'analyse,

slectionner l'analyse raliser l'aide du systme traditionnel de menus (ou un raccourci dans le menu personnalis Mon Menu),

puis tudier de faon interactive les rsultats.

302 STATISTICA Prise en Main


Copyright StatSoft, 2010

ANNEXE B : WebSTATISTICA

Outre ces fonctionnalits intgres et intuitives, WebSTATISTICA possde galement une bote outils permettant l'utilisateur de personnaliser l'interface-utilisateur et de dvelopper des applications personnalises
avec des fonctionnalits spcifiquement dfinies, et qui
s'adaptent aux besoins de leurs applications particulires.

Vous disposez de diverses fonctionnalits interactives


pour raliser vos oprations spcialises de contrle
qualit ou de data mining (y compris de construction
interactive de modles de data mining en glissant des
flches dans l'espace de travail du modle ; voir cicontre), et vous pouvez accder de faon interactive
ces outils depuis votre navigateur habituel.

Parmi les nombreuses spcificits de WebSTATISTICA


Server, il faut citer la grande compatibilit avec les
principaux standard de l'industrie. WebSTATISTICA
Server peut tre dploy sur les plate-formes de
serveur Web les plus courantes (par exemple, Apache
bas sur UNIX ou IIS), et respecte donc les protocoles
de scurit (pare-feu) mis en place dans l'entreprise.
WebSTATISTICA Server utilise une technologie propritaire dveloppe par StatSoft assurant performances et
volutivit (par exemple, volutivit vers plusieurs ordinateurs multiprocesseurs du serveur STATISTICA
pour travailler dans un environnement de calcul distribu). Cette technologie est le fruit de nombreuses annes d'exprience de StatSoft dans les systmes entre-

STATISTICA Prise en Main 303


Copyright StatSoft, 2010

ANNEXE B : WebSTATISTICA
prise de pointe, volutifs, qui sont aujourd'hui installs
dans les plus grandes entreprises du monde entier.
Toutefois, WebSTATISTICA Server reste bas sur les
protocoles standard de communication de l'industrie
(par exemple, XML) garantissant (a) son indpendance
par rapport aux plates-formes, (b) l'volutivit vers les
technologies futures, et (c) une personnalisation facile
par le client. Cette possibilit de personnalisation est
d'ailleurs accrue par le fait que seules les conventions
industrielles standard de syntaxes (notamment Visual
Basic, C++, HTML, XML) sont utilises pour personnaliser, configurer et dfinir toutes les oprations analytiques spcifiques et tous les rsultats dans WebSTATISTICA.

L'architecture gnrale ncessite deux machines, le


serveur Web (par exemple, un serveur Apache bas sur
UNIX) et au moins un serveur STATISTICA (pouvant
voluer vers plusieurs serveurs STATISTICA),

Dans la plupart des cas, WebSTATISTICA Server peut


tre install sur une mme machine (quand IIS est
utilis comme hte Web) :

L'architecture permet la mise en place d'un Serveur


Web gnrique en utilisant un langage de programmation standard sur le serveur Web. Le rle du serveur
Web est de rassembler (collecter) les demandes des
utilisateurs (reues depuis un navigateur), et de les
transmettre au Serveur STATISTICA, puis de traiter les
rponses envoyes par le Serveur STATISTICA afin de
les restituer l'utilisateur (dans son navigateur Web).
La communication entre le Serveur Web et le Serveur
STATISTICA s'effectue au travers d'une technologie base sur les conventions XML classiques. Le systme est
entirement personnalisable et les utilisateurs souhaitant
dvelopper leurs propres modifications ou extensions
ce systme (dj prt dployer) trouveront un ensemble d'outils permettant de modifier chacun des aspects
des scripts excuts par STATISTICA (sur la partie Serveur STATISTICA) ou de l'aspect de l'interface-utilisateur expose aux utilisateurs sur la partie client lger
(base sur le navigateur). Seuls les outils les plus standard et les plus connus (notamment Visual Basic ou
XML/HTML) sont utiliss pour tendre et personnaliser
le systme.
L'apparence des pages Web et
les scripts STATISTICA
excuter sont stocks dans un
rpertoire spcifique du Serveur STATISTICA et sont grs selon le principe de la
file d'attente. Le systme
offre galement un Gestionnaire du Traitement Distribu
grant le flux entrant de demandes de traitement et leur rpartition sur les multiples threads de STATISTICA et les diffrents ordinateurs du Serveur STATISTICA.
Le programme WebSTATISTICA Server inclut aussi les extensions Web
du langage STATISTICA Visual Basic. Ces extensions au langage SVB
permettent au crateur du script de
laisser le systme grer l'affichage
des graphiques et des feuilles de donnes dans les pages Web produites
automatiquement ou de personnaliser

304 STATISTICA Prise en Main


Copyright StatSoft, 2010

ANNEXE B : WebSTATISTICA
la prsentation des pages produites en ajoutant les
instructions HTML appropries.
Les problmes d'authentification et de scurit sont des
paramtres cl de l'architecture de WebSTATISTICA
Server. Au dbut de chaque session, les utilisateurs se
connectent au systme en indiquant leur nom
d'utilisateur et leur mot de passe. Les administrateurs du
systme peuvent contrler l'accs aux sources de
donnes et aux scripts en accordant des droits d'accs
individuels (par utilisateur) ou collectifs (par groupe
d'utilisateurs). Le niveau d'accs le moins scuris permet aux utilisateurs avancs (ou aux administrateurs)
d'excuter quasiment tout type de script (afin, par
exemple, d'effectuer des oprations d'administration du
systme ou de maintenance). Ce niveau ncessite un
droit d'accs spcifique (le plus lev), car en raison de
la nature et de la puissance du langage STATISTICA
Visual Basic, il permet d'accder (pour les utilisateurs
autoriss) toutes les ressources du rseau.
Remarque : ce systme peut tre intgr aux rseaux
traditionnels de STATISTICA en licences flottantes
(c'est--dire non bass sur le Web) ou aux systmes
Entreprise de STATISTICA, ce qui vous permet d'installer, par exemple, une licence flottante ou un systme
Entreprise de STATISTICA compos (au total) de 50
licences, dont 20 seulement seront accessibles par
l'intermdiaire de WebSTATISTICA Server.

L'application complmentaire WebSTATISTICA Knowledge Portal permet aux utilisateurs de distribuer et


partager efficacement et en toute scurit leurs rsultats
travers le Web. Vous pouvez dfinir des groupes de
travail (avec des droits d'accs distincts, et donc un
accs diffrenci aux diffrentes parties de la base de
donnes des documents de sortie), avec une organisation arborescente intuitive des diffrents lments disponibles, et des options pour diffuser les documents
actualiss sur le Serveur Web en temps rel.

Comment fonctionne WebSTATISTICA Server ? Pour


plus d'informations sur les fonctionnalits de WebSTATISTICA dcrites ici, rendez-vous sur le site Web de
StatSoft, www.statsoft.fr. Les didacticiels intgrent
notamment un exemple pas--pas.

Le principal avantage des applications WebSTATISTICA Server rside bien videmment dans la liste impressionnante des fonctionnalits spcifiques de STATISTICA. En outre, et contrairement aux produits concurrents, nous offrons une solution complte avec une
interface-utilisateur base sur le Web et non pas simplement un kit de dveloppement (mme si des outils
de dveloppement sont galement proposs pour tendre ou personnaliser le systme). De mme, il n'est pas
ncessaire qu'un serveur Web spcifique soit pralablement install (compatible ou non avec les normes de
scurit et autres rgles du client). Enfin, notre systme
est pilot par les scripts VB standard, aisment modifiables par les utilisateurs ou les administrateurs du
systme.

STATISTICA Prise en Main 305


Copyright StatSoft, 2010

ANNEXE B : WebSTATISTICA

306 STATISTICA Prise en Main


Copyright StatSoft, 2010

Outre une gamme analytique complte et performante, tous les produits STATISTICA offrent une interface-utilisateur entirement personnalisable (avec des
modles simplifis pour les novices), une gestion
flexible des rsultats (notamment diffrents formats
pour les rapports, comme .pdf, Word, .rtf, .html, et
des rsultats sur le portail Web), une compatibilit
totale avec OLE/ActiveX, et une intgration avec le
Web. En outre, tous les produits offrent un gestionnaire de donnes optimis permettant de manipuler
des volumes importants de donnes, des outils interactifs pour requter des bases de donnes et une large
gamme de fonctionnalits d'importation/exportation.
Tous les produits STATISTICA permettent de traiter
des donnes d'une taille illimite (avec des calculs en
quadruple prcision), avec plusieurs fichiers en
entre, et sont multitches. Chaque produit offre une
large slection d'outils interactifs et totalement intgrs de visualisation et de reprsentation graphique ou
de dessin, et offre un ensemble complet d'options
d'automatisation ainsi qu'un environnement de dveloppement professionnel compatible avec Visual Basic et .NET, avec un arsenal de plus de 14.000 fonctions accessibles dans des environnements externes.

vous propose les techniques statistiques essentielles dans un produit


convivial alliant performances, puissance et facilit
d'utilisation qui caractrisent tous les produits de la
gamme STATISTICA.
Tous les outils graphiques de STATISTICA
Statistiques Descriptives
Ajustement de Distributions
Rgression Multiple
Analyse de Variance
Tests Non-Paramtriques, etc
offre une gamme tendue d'outils avancs de modlisation et de prvision,
avec notamment des fonctionnalits de slection
automatique du meilleur modle et des outils puissants et interactifs de reprsentation.
Modle Linaire Gnral
Modles Linaires/Non Linaires Gnraliss
Modles Gnraux de Rgression
Rgression PLS
Dcomposition de la Variance
Analyse de Survie
Estimation Non Linaire

STATISTICA Prise en Main 309


Copyright StatSoft, 2010

ANNEXE C : LIGNE DE PRODUITS

Rgression Non-Linaire Fixe


Analyse Log-Linaire
Sries Chronologiques/Prvisions
Modlisation d'quations Structurelles, etc

offre une large gamme de


techniques exploratoires adaptes divers types de
donnes, avec des outils puissants et interactifs de
reprsentation.
Classifications
Analyse Factorielle
ACP la Franaise
Analyse Canonique
Fiabilit & Analyse d'Echelle
Arbres de Dcision [Classification]
Analyse des Correspondances
Analyse de Proximit
Analyse Discriminante
Modles d'Analyse Discriminante, etc
propose une
gamme complte de techniques pour analyser des
donnes issues d'expriences avec la fois des effets
fixes et des effets alatoires en utilisant la mthode
d'estimation REML du maximum de vraisemblance
restreint (Restricted Maximum Likelihood Estimation). Dans STATISTICA VEPAC, vous obtenez l'estimation des composantes de la variance que vous pouvez utiliser pour tester la prcision tout en comparant
les effets fixes en prsence de diffrentes sources de
variation.

Tracs de dispersion
Tracs multiples permettant une comparaison directe de plusieurs variables dpendantes

Moyenne des carrs thorique et composantes de la


variance avec intervalles de confiance

Gestion aise de plusieurs variables dpendantes :

Reprsentation des diffrentes composantes de la


variance
offre la gamme la
plus complte de mthodes et d'algorithmes de
rseaux de neurones.
Recherche automatique des meilleures architectures
et solutions du rseau
Perceptrons Multicouches
Rseaux de Fonctions Base Radiale
Cartes Auto-Organisatrices
Rseaux de Neurones pour des Sries Chronologiques, la fois sur des problmes de Rgression
et de Classification
Diffrents algorithmes pour un apprentissage rapide
et efficace des Modles de Rseaux de Neurones,
avec notamment Descente du Gradient, Descente
Conjugue et BFGS
Nombreux graphiques analytiques d'aide la dcision
chantillonnage des donnes en diffrents sousensembles pour optimiser les performances du
rseau et amliorer le pouvoir de gnralisation
Analyse de Sensibilit, Courbes de Lift et Courbes
ROC
Cration d'Ensembles partir de rseaux individuels
existants
Gnrateurs de code C et PMML (Predictive
Model Markup Language) simple dployer.
constitue un outil extrmement prcis, convivial et
spcialis permettant d'analyser tous les aspects des
calculs de puissance statistique et de taille d'chantillon.
Calculs de Taille d'chantillons
Estimation des Intervalles de Confiance
Calculateur de Probabilits, etc

analyse simultane de plusieurs variables avec le


mme modle ou un autre modle

310 STATISTICA Prise en Main


Copyright StatSoft, 2010

ANNEXE C : LIGNE DE PRODUITS

met
votre disposition une vaste gamme de cartes
totalement personnalisables (que vous pouvez appeler
depuis d'autres environnements), simples et rapides
utiliser ainsi que diverses options d'automatisation et
raccourcis d'interface-utilisateur destins simplifier
votre travail routinier (un outil complet pour les
mthodes Six Sigma).
Rapport et affichage de cartes de synthse (Type
Six Sigma)
Cartes X-barre et R ; Cartes X-barre et S ; Cartes
Np, P, U, C
Diagrammes de Pareto
Indices de capabilit et de performance du processus
Cartes de Moyennes/tendues Mobiles, Cartes
EWMA
Cartes petites sries (avec nominal & cible)
Cartes CuSum (somme cumule)
Tests des sries
Causes et actions, alarmes personnalisables,
balayage analytique, etc

est un programme complet d'analyse de capabilit du processus, de R&R et d'autres applications


de contrle et amlioration de la qualit (un outil
complet pour les mthodes Six Sigma).
Cartes d'analyse de capabilit du processus
Diagrammes d'Ishikawa (Causes-et-Effets)
Rptabilit & Reproductibilit
Dcomposition de la variance pour des effets
alatoires
Analyse de Weibull
Plans d'chantillonnage, etc

intgre une large gamme de plans d'expriences et outils de reprsentation graphique, notamment un profil de dsirabilit interactif (un outil
complet pour les mthodes Six Sigma).
Plans Factoriels Fractionnaires
Plans de Mlange
Carrs Latins
Recherche de Plans Optimaux 2(k-p)
Analyse et transformations des rsidus
Optimisation d'une ou plusieurs variables de rponse
Plans composites centrs
Plans de Taguchi
Plans avec minimum d'aberrations et maximum
d'effets non-confondus
Plans factoriels fractionnaires 2(k-p) avec blocs
Surfaces sous contraintes
Plans D- et A-optimaux
Profils de dsirabilit, etc
offre une solution complte de matrise statistique des procds multidimensionnelle, dployable sur une plate-forme analytique volutive et
scurise.
Mthodes statistiques univaries et multivaries de
contrle qualit, modlisation prdictive et de rduction des donnes
Fonctions permettant de dterminer les facteurs
influents au niveau du processus, des matires premires et de l'environnement ainsi que leurs paramtrages optimaux pour fabriquer des produits de la
meilleure qualit possible
Suivi interactif ou automatis des caractristiques
du processus au cours des diffrentes phases de production
Construction, test et dploiement de modles prdictifs sur la base de rsultats connus issus de
donnes historiques
Analyse historique, exploration et reprsentation
des donnes, construction et valuation de modles

STATISTICA Prise en Main 311


Copyright StatSoft, 2010

ANNEXE C : LIGNE DE PRODUITS


prdictifs, dploiement du modle sur le systme
expert de suivi et d'alertes
Suivi interactif avec tableau de bord et mise jour
automatique des rsultats
Suivi automatis avec rgles, dclenchement d'alarmes et actions paramtrables
Techniques multivaries, notamment les mthodes
PLS, ACP, rseaux de neurones, Sparateurs
Vastes Marges (SVM-Support Vector Machines),
mthodes de partition rcursive (arbres de dcision),
Analyse en Composantes Indpendantes, Classifications, etc

Outre les fonctionnalits communes dtailles prcdemment, les Systmes Entreprise de STATISTICA
offrent une large gamme d'outils pour le travail collaboratif, une interface-utilisateur base sur un navigateur Web (grce au produit complmentaire WebSTATISTICA), des bases de donnes spcialises,
ainsi qu'une interface hautement optimise pour les
entrepts de stockage des donnes l'chelle de
l'entreprise, et notamment des options permettant de
traiter rapidement de grosses volumtries de donnes
directement sur les serveurs, sans avoir crer de
copies en local. Des services de dploiement et de
formation sur site sont galement proposs.
est l'outil le plus
riche du march en termes de solutions de data
mining, avec une interface-utilisateur trs simple
utiliser (ventuellement disponible en client lger en
complment de WebSTATISTICA, voir page 315), et
un moteur de dploiement. Il est constitu de systmes totalement intgrs et automatiss, cl-enmains (mais galement facilement personnalisables)
offrant des solutions spcifiques pour de nombreuses
applications. Une version ddie l'industrie (STATISTICA Optimisation de Processus) permet d'explorer/analyser de grosses volumtries de donnes de
contrle qualit. Les solutions de data mining sont accessibles par des procdures puissantes contenues
dans cinq modules :

Explorateur/Segmenteur en 2D/3D
Classification supervise et non supervise
Modlisation et exploration multivarie
Prvisions et sries chronologiques
Modlisation par rseaux de neurones, etc

est une solution puissante destine suivre


des processus afin d'identifier et anticiper des problmes relatifs au contrle et l'amlioration de la
qualit avec une sensibilit et une efficacit incomparables. STATISTICA Optimisation de Processus intgre
toutes les procdures de cartes de contrle qualit,
analyse de processus, plans d'expriences, et mthodes
Six Sigma avec une gamme complte de techniques de
data mining exploratoire et prdictif :
Anticiper les problmes de qualit l'aide de
mthodes performantes de data mining
Mettre en vidence les causes les plus probables des
zones problmes
Suivre et amliorer le Retour Sur Investissement
(ROI - Return On Investment)
Suggrer des pistes d'amlioration
Suivre les processus en temps rel au travers du
Web
Crer et dployer des solutions de contrle qualit/
MSP au travers du Web
Utiliser le multithreading et le traitement distribu
afin de traiter rapidement de trs grosses volumtries de donnes
est une solution puissante de text mining, d'extraction de documents
et d'exploration de donnes non structures. Ce
programme se prsente sous la forme d'un produit
complmentaire STATISTICA Data Miner ; il a t
conu et optimis pour exploiter des documents (information non structure) dans diffrents formats: .txt
(texte), .pdf (Adobe), .ps (PostScriptTM), .html, . xml
(formats Web) et la plupart des formats de Microsoft
Office (par exemple, .doc, .rtf) ; accs optimis aux
pages Web (adresses URL).
Indexation efficace de trs nombreux documents
textuels ; identification des mots-cl et des ressem-

312 STATISTICA Prise en Main


Copyright StatSoft, 2010

ANNEXE C : LIGNE DE PRODUITS

blances entre les documents et les termes, et extraction de l'information pertinente par rapport votre
mission et vos objectifs
Utilisation de listes de mots vides (mots ignorer)
et algorithmes de lemmatisation dans diffrentes
langues (notamment le Franais et l'anglais, mais
d'autres langues sont proposes)
Nombreuses options pour convertir les documents
en information numrique en vue de leur traitement
(par exemple, mapping, clustering, data mining
prdictif, classification de documents, etc...)
Possibilit d'oprations en multithreading sur des
installations serveur multi-processeurs pour une
indexation et une recherche trs rapides dans des
entrepts de documents gigantesques
Permet d'indexer, analyser et explorer d'autres
sources d'information non structure, comme des
images ou des sons (aprs prparation)
Totalement intgr avec STATISTICA et WebSTATISTICA ; toutes les mthodes d'apprentissage
supervis et non-supervis (clustering), mapping,
reprsentation graphique, etc..., sont instantanment
et directement accessibles ; la plupart des algorithmes disponibles dans STATISTICA Data Miner,
comme les algorithmes de machine learning (k-plus
proches voisins, rseaux baysiens nafs, Sparateurs Vaste Marge et classification par les noyaux), sont particulirement bien adapts aux oprations de text mining ou l'analyse d'autres types
d'informations non-structures

s'adresse aux clients intervenant dans


le domaine de la grande distribution, la banque,
l'assurance, etc Le programme intgre l'algorithme
le plus rapide connu ce jour, avec la possibilit de
dterminer des rgles Squentielles et d'Association
dans une mme analyse. Le programme est un module
autonome que vous pouvez utiliser pour la
construction du modle et le dploiement. Vous pouvez utiliser tous les outils de STATISTICA Data
Miner pour analyser rapidement et efficacement les
donnes et explorer les rsultats gnrs par STATISTICA SAL.

Utilise des techniques d'arbres de dcision pour


extraire les rgles squentielles et rgles d'association partir des donnes
Utilise une base de donnes relationnelle en local
pour stocker les modles squentiels et d'association
Permet de grer plusieurs rponses, des dichotomies
multiples et des variables continues dans une mme
analyse
Ralise une analyse squentielle lors de la recherche
des rgles d'association
Extrait les rgles squentielles et d'association
simultanment pour plusieurs dimensions
Compte tenu de la possibilit d'effectuer une
recherche multidimensionnelle des rgles squentielles et d'association, et de n'extraire que les rgles
relatives certains articles particuliers, vous pouvez
utiliser le programme pour du Data Mining Prdictif
Effectue une CAH par la mthode du saut minimum,
qui permet de mettre en vidence les groupes les
plus probables d'articles homognes. On trouve des
applications extrmement utiles, pratiques et
pragmatiques, par exemple, dans la grande distribution.
est un systme
gnraliste, intgr et multi-utilisateurs d'analyse des donnes et d'applications BI (Business Intelligence) dans des domaines tels que la recherche, le
marketing, la finance, STATISTICA Entreprise peut
intgrer tout ou partie des fonctionnalits statistiques
disponibles dans les produits STATISTICA. En outre,
il offre :
Intgration avec les entrepts de donnes
Outils intuitifs de requte et de filtrage
Outils d'administration intuitifs
Diffusion automatique des rapports
Notification d'alarme, etc

STATISTICA Prise en Main 313


Copyright StatSoft, 2010

ANNEXE C : LIGNE DE PRODUITS


Bas sur des
technologies de connexion ultra-performantes,
STATISTICA Entreprise/QC est destin aux applications de contrle et d'amlioration de la qualit, notamment Six Sigma. Il permet de suivre en temps rel
le processus de production en atelier avec notification
d'alarmes, et offre aussi aux ingnieurs un ensemble
complet d'outils analytiques, et aux dcideurs, des
fonctionnalits sophistiques de reporting (notamment Six Sigma).
Il offre galement :
Interface-utilisateur et outils de reporting totalement
intgrs au Web ; requteur interactif
Interface-utilisateur spcifique pour les oprateurs,
les ingnieurs
Fonctionnalit groupware pour le partage des requtes, applications spciales, etc.
Notification d'alarmes avec causes/actions
Intgration avec des applications externes (MS
Word, MS Excel, navigateurs)
Nombreuses options d'extension et de personnalisation ; intgration possible avec les bases de donnes/ERP en place, etc
est un systme permettant aux utilisateurs d'automatiser le suivi en
continu de centaines, voire de milliers de paramtres
critiques au niveau des processus ou des produits. Le
suivi en continu est une mthode efficace et automatise pour :
Suivre de nombreux paramtres critiques simultanment
Donner le statut instantan de ces activits de
suivi aux individus en fonction de leurs responsabilits.
Tableaux de bord associs aux diffrents Utilisateurs et Groupes.
est une solution cl-en-mains permettant d'identifier et
mettre en uvre des stratgies efficaces pour le suivi
et la matrise de procds multivaris complexes.
STATISTICA MultiStream s'adresse aux industries

manufacturires en gnral, mais rpond parfaitement


aux problmatiques des industries de production
d'lectricit en leur permettant d'exploiter les donnes
qu'elles collectent dans des bases de donnes spcialises existantes en vue d'offrir des systmes interactifs
d'aide la dcision.
STATISTICA MultiStream est un systme complet,
construit autour d'une architecture client-serveur
avance (et entirement intgre avec le Web), offrant
des outils centraliss d'administration du systme et
de dploiement de modles, ainsi qu'une technologie
de pointe pour l'analyse des causes les plus probables
et le data mining prdictif ; tous les outils analytiques
sont parfaitement intgrs avec un systme de gestion
documentaire.
Analyse automatise (non-linaire) des causes les
plus probables et slection automatique des meilleurs prdicteurs parmi plusieurs milliers de paramtres, afin de dterminer clairement ceux qui sont
vraisemblablement l'origine des problmes du
processus
Analyse automatise et interactive des communauts
pour mettre en vidence les drives des paramtres
et processus par rapport aux oprations normales sur
des priodes dtermines
Modles linaires et non-linaires avancs (arbres
de dcision, Sparateurs Vaste Marge, ensembles
de rseaux de neurones) pour crer des schmas labors de contrle multivari et des workflows pour
identifier des drives et dcalages multivaris prcoces, avant l'apparition des problmes
Algorithmes avancs de data mining pour prvoir et
optimiser les indicateurs cl de la performance et de
la qualit
Suivi simultan de plusieurs centaines de canaux de
donnes
Accs des synthses relatives aux paramtres et
rsultats critiques du processus par des tableaux de
bord simples et efficaces et des outils d'exploration
(drill-down)
Accs des schmas standard et personnaliss
d'analyse des causes les plus probables, reposant sur

314 STATISTICA Prise en Main


Copyright StatSoft, 2010

ANNEXE C : LIGNE DE PRODUITS


les technologies les plus performantes d'analyse des
donnes et de data mining
Alertes relatives aux problmes prvus et aux
dfaillances des quipements avant qu'ils ne
surviennent (alarmes prdictives), vitant ainsi
d'avoir recourir des interruptions et autres
oprations de maintenance non planifies
Surveillance en temps rel de tout ce qui peut
affecter la performance de votre processus
est un systme
entreprise de pointe offrant une parfaite intgration avec le Web, notamment la possibilit d'excuter STATISTICA de faon interactive ou en batch
depuis le simple navigateur de tout type d'ordinateur
(y compris Linux, UNIX). Vous dlguez les tches
lourdes aux serveurs (en utilisant le traitement
distribu), utilisez une architecture Client-Serveur
multi-tiers, grez vos projets au travers du Web, et
collaborez sur des projets l'autre bout du couloir ou
l'autre bout du monde (compatible avec le multithreading et le traitement distribu/parallle, pouvant
tirer parti d'architectures en clusters de serveurs).

est un logiciel complet et volutif


permettant de grer tous vos documents lectroniques.
Grce STATISTICA Gestion Documentaire, vous
pouvez grer rapidement, efficacement et de faon
scurise des documents de tout type (par exemple,
trouver le document qui vous intresse, y accder,
rechercher l'information dans son contenu, visualiser,
organiser, modifier [traabilit des connexions et des
numros de version], approuver, etc...).
Transparence et facilit d'utilisation
Interface-utilisateur personnalisable (et compatible
avec votre navigateur Internet/Web)
Signatures lectroniques
Traabilit complte, approbations
Recherches optimises
Outils de comparaison de documents

Prise en compte des rgles de scurit


Conforme aux exigences de la norme FDA 21 CFR
Part 11
Conforme aux exigences de la norme ISO 9000
(9001, 14001)
volutivit sans limites (de la version bureautique
ou rseau en client-serveur, aux systmes les plus
vastes et performants par le Web)
Architecture ouverte et compatibilit avec les langages de programmation universels
Le Connecteur PI de STATISTICA est une composante
additionnelle facultative de STATISTICA, permettant
l'intgration directe avec les donnes stockes dans
l'historique des donnes de PI. Le Connecteur PI de
STATISTICA utilise le modle de scurit et le
contrle d'accs des utilisateurs, permettant le balayage interactif des tags et l'utilisation des fonctionnalits
ddies de PI pour interpoler et connatre le statut des
donnes un instant donn. L'intgration de STATISTICA avec le systme PI permet d'automatiser les
analyses pour les applications PAT (Process Analytical Technology) dans les industries rglementes par
la FDA, les systmes avancs de matrise des
procds (Advanced Process Control) dans les industries chimiques et ptrochimiques, et les systmes experts pour l'optimisation et la conformit des processus dans les industries lectriques.
est une
solution de data warehouse, la fois complte,
puissante, volutive et personnalisable, qui peut s'intgrer efficacement avec les fonctionnalits analytiques les plus compltes du march. STATISTICA
Data Warehouse est constitu d'un ensemble de composantes applicatives puissantes et flexibles.
Si vous tes novice dans le domaine du data warehousing, les consultants de StatSoft France vont vous
accompagner pas--pas tout au long du processus de
conception de l'architecture optimale du data warehouse, en commenant par l'audit de vos besoins en
matire de stockage de l'information et d'extraction/
analyse des donnes, jusqu' la formation de vos

STATISTICA Prise en Main 315


Copyright StatSoft, 2010

ANNEXE C : LIGNE DE PRODUITS


intervenants et l'assistance dont vous pourrez avoir
besoin dans vos oprations quotidiennes.
STATISTICA Data Warehouse vous offre notamment :
Une application complte de data warehousing
adapte votre activit
Une architecture indpendante de la plate-forme
permettant une parfaite intgration avec votre
infrastructure existante
Des fonctionnalits permettant d'intgrer des donnes issues de sources diverses
Une volutivit quasiment illimite
Des options pour mettre jour et synchroniser des
donnes issues de sources multiples grce des
gestionnaires de tches (planificateurs) automatiques ou la demande
Une architecture totalement intgre avec le Web
permettant des sites distants de bnficier de fonctionnalits volues et performantes (via un navigateur Web, partout au monde)
Un modle avanc de scurit et d'authentification
des utilisateurs
Des options compltes de gestion documentaire
permettant d'optimiser la gestion de documents de
tout type et de satisfaire aux exigences rglementaires (par exemple, FDA 21 CFR Part 11, ISO
9000)
Des composantes analytiques avances pour le nettoyage/vrification des donnes et pour l'intgration
de vos projets automatiss de data mining, d'intelligence artificielle, et de suivi des processus en
temps rel
Des options permettant d'excuter et de poster
automatiquement vers des portails (ou de diffuser)
des rapports personnaliss, et interactifs (c'est--dire
que vous pouvez explorer en utilisant les fonctionnalits de drill-down, segmentation, ou personnalisables faon)
Des options de sauvegarde et d'archivage
Possibilits de programmation, de personnalisation
et d'volutivit pour s'adapter des profils spcifiques (architecture ouverte, expose des extensions

en utilisant des langages classiques comme VB,


C++, Java, HTML)
Construit autour d'une technologie performante, robuste, prouve et volutive, permettant de tirer le
meilleur parti de votre investissement (notamment
la technologie d'interface directe avec les bases de
donnes (IDBD), et un vritable traitement distribu/parallle et multithreading permettant d'exploiter les ressources des CPU de plusieurs serveurs,
avec des performances proches des super-ordinateurs)
STATISTICA Data Warehouse est une solution intelligente complte de stockage des donnes et de
diffusion/distribution de l'information qui vous permet de personnaliser les canaux d'information au sein
de votre organisation, offrant tous les membres
autoriss de votre organisation, un accs flexible,
scuris et rapide l'information critique et aux rapports.
Le systme ne possde quasiment aucune contrainte de
plate-forme et va s'intgrer parfaitement avec vos
architectures existantes de bases de donnes et avec
votre environnement matriel. Il permet de combiner
efficacement l'information issue de plusieurs sources et
formats de bases de donnes (depuis des formulaires de
saisie manuelle des donnes des batteries importantes
d'appareils de collecte automatique). Vous pouvez
encore amliorer le systme par l'intgration de composantes totalement compatibles de la ligne d'applications
et de solutions STATISTICA ; pour n'en citer qu'un
chantillon :
STATISTICA Data Miner pour raliser des tches
avances de data mining et d'aide la dcision bases sur l'intelligence artificielle (par exemple, des
rseaux de neurones) au travers de mthodes modernes et performantes d'extraction de connaissances et
de prvision
STATISTICA Optimisation de Processus et STATISTICA Entreprise/QC pour une intgration avec toutes vos activits de contrle qualit, matrise des
processus, et yield management
STATISTICA Text Miner pour le traitement automatique d'informations non structures contenues dans

316 STATISTICA Prise en Main


Copyright StatSoft, 2010

ANNEXE C : LIGNE DE PRODUITS


des documents, bases de donnes ou dossiers Web
(navigation entre des URL sur le Web)
STATISTICA Knowledge Portal pour prsenter des
rapports de synthse, illustrations et plans d'action
aux utilisateurs finaux (management, forces de vente, ingnieurs,...) travers des portails d'accs
scuriss par le Web ; permet de mettre disposition des dispositifs cl-en-main d'aide la dcision
(par exemple, vous pouvez accder STATISTICA
Knowledge Portal par l'intermdiaire de tout navigateur Web conventionnel, partout dans le monde)
STATISTICA Data
Warehouse peut se connecter tout type de plateforme, base de donnes ou source de donnes, et sait
s'adapter des activits et des applications de toute
taille. Le programme est construit sur une base de
donnes et selon un schma de base de donnes
personnaliss afin de rpondre au mieux vos
besoins. La solution peut tre installe sur un moteur
de base de donnes (SQL Server) ou sous forme d'un
schma de base de donnes (virtuelle) compatible
avec la grande majorit des bases de donnes
industrielles classiques ; cette solution peut s'intgrer
parfaitement avec vos systmes existants de bases de
donnes.
Puisque STATISTICA Data Warehouse n'est li
aucune base de donnes spcifique ni aucune plateforme matrielle, le systme est totalement indpendant de la plate-forme. Le logiciel principal du Data
Warehouse peut se connecter tout format de bases
de donnes, et combiner et regrouper efficacement
des informations issues de plusieurs sources.
Le logiciel de l'application STATISTICA Data Warehouse fonctionne sur des serveurs quips de plusieurs processeurs, ou des banques de serveurs multiprocesseurs permettant d'atteindre des performances
proches des super-ordinateurs. Le systme peut donc
traiter conomiquement et efficacement de grosses
volumtries de donnes et des problmes analytiques
lourds en calculs (intelligence).
STATISTICA Data Warehouse extrait l'information issue de diffrentes
sources, partout dans le monde, et la diffuse aux
quatre coins de la plante.

La composante Web du systme est construite sur la


base de la technologie prouve de WebSTATISTICA
qu'un certain nombre d'organisations utilisent dsormais l'chelle plantaire pour offrir un accs scuris par l'intermdiaire des navigateurs web standard :
contrairement d'autres solutions bases sur le Web,
STATISTICA Data Warehouse ne requiert aucune
composante complmentaire sur les postes client.
Ainsi, tout utilisateur (autoris et reconnu) peut utiliser le systme, o qu'il se trouve : en dplacement
depuis sa chambre d'htel, depuis son domicile, depuis le bureau ou un site de production particulier,
mme s'il se trouve dans les endroits les plus reculs
(par exemple, grce des liens web par satellite).
STATISTICA Data Warehouse intgre un systme de scurit performant et sophistiqu, garantissant la confidentialit des connaissances et de l'intelligence dont vous tes propritaire par rapport toute
tentative d'intrusion non autorise. Le systme STATISTICA Data Warehouse va sans doute s'imposer
comme le systme incontournable d'information dcisionnelle au sein de votre organisation. C'est la raison
pour laquelle le systme de scurit revt une importance particulire, afin de prvenir toute intrusion non
autorise au niveau des ressources les plus sensibles.
STATISTICA Data Warehouse intgre le niveau de
scurit le plus lev en vous permettant de dfinir
des groupes d'utilisateurs associs des droits d'accs
diffrents (qui vont leur tour spcifier l'information
accessible, et les oprations ralisables) ; les mots de
passe sont mis jour priodiquement pour accrotre la
scurit, etc... Diverses mthodes spcialises sont
proposes pour dtecter et vous protger contre toute
tentative d'intrusion lectronique systmatique (les
hackers).
STATISTICA Data
Warehouse permet une gestion documentaire complte, conforme aux exigences et normes industrielles
et rglementaires en vigueur.
STATISTICA Gestion Documentaire peut s'intgrer
avec votre application STATISTICA Data Warehouse
afin d'optimiser les flux d'informations au sein de votre
organisation, et ainsi, amliorer votre productivit. Ce

STATISTICA Prise en Main 317


Copyright StatSoft, 2010

ANNEXE C : LIGNE DE PRODUITS


systme peut galement tre configur de sorte respecter toutes les politiques de gestion documentaire (en
place dans votre entreprise) ou exigences rglementaires en matire de scurit des documents, traabilit pour les audits, et signatures/authentifications
lectroniques (par exemple, comme elles sont stipules
par la FDA dans la norme 21 CFR Part 11 : Enregistrements lectroniques ; signatures lectroniques ; ou
dans la norme ISO 9001 4.5 : Matrise des documents
et des donnes).
STATISTICA Data Warehouse peut galement intgrer les
mthodes les plus avances en termes d'analyse des
donnes et d'extraction de connaissances ; vous pouvez ainsi mettre en vidence les phnomnes structurels les plus complexes - parfois inaccessibles pour
d'autres applications - prsents dans vos donnes.
Dans la mesure o STATISTICA Data Warehouse est
construit partir des mmes composantes que tous les
logiciels de la gamme STATISTICA, vous pouvez aisment intgrer ces solutions analytiques dans votre
entrept de donnes. STATISTICA offre la gamme la
plus complte et la plus impressionnante du march
d'outils de data mining, d'analyse textuelle, d'analyse
des donnes, de reprsentation graphique des rsultats,
ou encore de contrle qualit et de matrise des procds (y compris Six Sigma), etc... Ces ressources et
technologies peuvent tre connectes aux sources de
donnes dans STATISTICA Data Warehouse, afin de
tirer parti des technologies et des algorithmes les plus
avancs pour analyser et extraire l'intelligence-cl
depuis toutes les sources disponibles. Par exemple,
vous pouvez appliquer des centaines d'architectures de
rseaux de neurones, des arbres de classification (par
exemple, boosting d'arbres par gradient stochastique),
l'analyse des causes les plus probables, des mthodes
de cartes de contrle, de prvisions, ou d'autres mthodes analytiques ou graphiques sophistiques permettant
de convertir les donnes brutes de votre entrept de
donnes en intelligence utile et exploitable, constituant
ainsi un vritable systme d'information dcisionnel
avec des implications stratgiques sur les orientations
de votre organisation au quotidien.

STATISTICA Data Warehouse


est un systme en architecture ouverte qui ne vous
aline pas une solution spcifique ou une relation
avec un diteur particulier ; vous pouvez rpondre
rapidement aux nouvelles demandes ou exigences au
niveau de votre activit et les incorporer dans l'entrept de donnes.
Comme pour toutes les applications et solutions de la
gamme STATISTICA, STATISTICA Data Warehouse
est entirement programmable et personnalisable
grce aux outils standard de programmation comme
Visual Basic, C++, Java, ou HTML. Cette fonctionnalit revt une importance toute particulire lorsque
votre succs dpend de votre capacit rgir rapidement face aux nouvelles informations et aux modifications de votre environnement. Dans la mesure o
vous pouvez personnaliser le systme sans devoir
compter sur les programmeurs d'un diteur particulier, ni sur la connaissance d'un langage de programmation propritaire (ce que requirent de nombreuses
solutions concurrentes), vous avez la libert de dvelopper vos propres extensions au data warehouse, et
ajouter, non seulement vos propres rapports, mais
aussi toute procdure personnalise de nettoyage,
transformation et d'analyse des donnes, en vous
appuyant sur des ressources et comptences largement disponibles, et sur les outils les plus standard
(par exemple, les programmeurs et outils en VB,
C++, Java, ou HTML). Si vous le souhaitez, StatSoft
peut vous proposer toute une gamme de services de
consulting, d'intgration de systme, et de programmation, qu'une quipe exprimente mettra en place
pour vous au sein de votre organisation.

318 STATISTICA Prise en Main


Copyright StatSoft, 2010

ANNEXE C : LIGNE DE PRODUITS

est une solution cl en main, destine au monde industriel. Elle vise mettre en
vidence les relations de cause effet entre la
qualit de vos produits et les processus permettant de
les fabriquer, en utilisant les donnes que vous collectez dj. PROCEED intgre une approche brevete et
labore par Caterpillar Inc. pour ses propres besoins,
reposant sur la plate-forme analytique STATISTICA
Entreprise.
Les entreprises industrielles de pointe collectent
aujourd'hui des quantits importantes de donnes :
Relatives aux processus de production.
Relatives aux tests des matires premires, des produits intermdiaires, et des matriaux intervenant
dans les processus de production.
Portant sur les lments critiques de la qualit des
produits finis.
Tous ces efforts de collecte et de stockage des donnes continuent tre aliments par une amlioration
incessante des processus d'automatisation, les avances technologiques des systmes de stockage dans
les entrepts de donnes, et les progrs raliss sur les
capteurs et autres techniques de mesure. Les industriels disposent de mines d'informations... qui ne demandent qu' tre transformes en information dcisionnelle interactive.
La collecte des donnes ne suffit pas elle seule
guider les changements stratgiques ncessaires de
l'entreprise. Pour rendre ces volutions possibles,
nous devons convertir ces donnes en connaissances,
puis transmettre ces connaissances sous une forme
permettant aux dcisionnaires d'agir directement
dessus. Avec PROCEED, c'est la garantie d'un Retour
sur Investissement partir de vos Donnes.
PROCEED allie des mthodes d'extraction de connaissances traditionnelles et novatrices pour :
Identifier les facteurs influents, simples ou complexes, existant entre les processus de production et
la qualit des produits

Dployer une information dcisionnelle interactive


(actionnable) permettant aux diffrents responsables ingnierie/dveloppement et aux responsables
process dcideurs de comparer diffrents scnarios
possibles et d'optimiser simultanment diffrents
rsultats.
est une
solution cl-en-main permettant d'optimiser les
performances des usines de production d'lectricit,
d'amliorer l'efficacit tout en rduisant les missions
atmosphriques. Reposant sur plus de 20 annes
d'exprience dans l'application de technologies avances de data mining et d'aide la dcision dans de
nombreuses industries manufacturires, STATISTICA
PowerSolutions permet aux usines de production
d'lectricit de tirer le meilleur parti de leurs quipements et de leurs systmes de contrle, en exploitant
toutes les donnes collectes sur votre site pour identifier les possibilits d'amlioration, mme avec les
quipements classiques comme les chaudires Cyclone au charbon (ou les systmes de combustion wallfired ou T-fired).

STATISTICA Prise en Main 319


Copyright StatSoft, 2010

ANNEXE C : LIGNE DE PRODUITS

320 STATISTICA Prise en Main


Copyright StatSoft, 2010

PRISE EN MAIN : INDEX

.NET, 283

accs aux bibliothques SVB,


267
ActiveX, 181, 190, 248, 249
Aide, 291
analyses par groupes, 44
analyses multiples, 132
analyses
rexcution, 246
ANOVA, exemple, 34
ANOVA, exemple
bouton variables, 35
facteurs inter-groupe, 36
mesures rptes, 35
module ANOVA, 34
rsultats, 37
spcifier le modle, 34
table des effets, 37
trac des moyennes, 39
applications externes, 146
arguments des tableaux, 255
Avanc (onglet), 18

balayage, 137, 215


barre doutils, 135, 144
barre doutils
personnalisation, 145
barre de progression, cration
en SVB, 270
barre de titre, 187
Base (onglet), 18
bases de donnes
accs aux donnes, 58
distantes, 279
bibliothques, 264

bloc de donnes (graphiques),


211
bloc
ifthenend if, 250
bote dinfo, 187
bote de message, 250
botes de dialogue, 19
botes de dialogue du
programme, 259
bouton droit de la souris, 15
BPx
rapport, 106
byref (par rfrence),
transmettre des arguments,
255
byval (par valeur), transmettre
des arguments, 255

C/C++, 5
capabilit du processus, 78
classeurs, 45, 91, 154, 159
classeurs
arborescence, 183, 191
commentaires, 155
danalyse, 22
donnes actives, 188
introduction, 181
rexcuter lanalyse, 246
codes, 70, 107
collections, 253, 260
collections
rcupration, 261
Conseiller Statistique, 33
copier, 24
copier avec noms (vars/obs.),
24
corrlations, exemple, 11
corrlations, exemple...
classeur de rsultats, 22
feuille de rsultats, 22
graphique, 27
matrice, 20

personnalisation des
graphiques, 28
rapport des rsultats, 24
synthse, 20

Data Miner, 312


Data Miner Plus, 84, 195
data mining, 139
data mining
dploiement, 93
tapes, 87
noeuds, 87
data warehouse, 315
DDE (Dynamic Data
Exchange), 250
dmarrer STATISTICA, 11
dployer des modles, 312
descriptif du fichier, 187
DIN 55319, 78, 82
DLL externes
appel de fonctions, 257
documents
ActiveX, 249
personnalisation, 229
sorties, 260, 269, 273
types, 143
donnes
dentre, 188
donnes parses, 66
filtrage des doublons, 64
formules, 72, 75
graphiques, 208
nettoyage et filtrage, 63
recodification, 66
recodifier, 70
transformation, 74, 76

enregistrement
au format PDF, 160
automatique, 154
environnements rglements,
100

STATISTICA Prise en Main 321


Copyright StatSoft, 2010

PRISE EN MAIN : INDEX


Excel, 55, 146, 149, 249
Excel
intgration avec
STATISTICA, 55, 149
excuter une mthode, 259
exemples
analyses par groupes, 44
ANOVA, 34
bases de donnes, 58
bouton variables, 19
corrlations, 17
Data Miner Plus, 84
Entreprise, 108
environnements rglements,
100
Excel, 55
formules, 72
groupes de variables, 41
introduction, 268
prparer les donnes, 63
rsultats de synthse, 77
slection dun fichier, 12
slection des variables, 19
SVB, 240
WebSTATISTICA, 95
exporter
donnes, 309
rsultats, 6, 15

fentres indpendantes, 156


feuilles de donnes, 13, 185
feuilles de donnes...
barre de titre, 187
bote dinfo, 187
descriptif, 187
format des cellules, 188
formules, 14, 73
formules par lot, 74
glisser-dplacer, 30
mot de passe, 103
observations, 187
partage dcran, 29

rsultats, 22
variables, 187
verrouillage, 104
filires danalyses, 234
filtrage
automatique, 138
des donnes, 63
fonctions, 252
fonctions
externes, 238, 309
internes, 11, 73, 102, 237
formats
html, 148
pdf, 160
rtf, 190
str, 190
xml, 148
formules
feuille de donnes, 14, 72
par lot, 72, 74

gestion des rsultats, 15, 138,


153
gestion documentaire, 315
Gestionnaire STATISTICA
Entreprise, 108
glisser-dplacer, 30, 149, 184
globale
variable, 255
goback (mthode), 259
graphiques, 140, 192, 201
graphiques
balayage, 215
catgories, 207
de blocs, 208, 211
de synthse, 77
des donnes dentre, 207,
208
habillage, 215
menu, 213
mise jour automatique, 149

personnalisations, 202, 204,


212, 229
rfrences, 203
spcialiss, 219
statut des observations, 215
groupes de variables, 41

habillage, 137, 215


HTML, 148, 297, 312, 316
HTML
rapport, 162

importer
donnes, 6, 149, 299, 309
imprimer
feuille de donnes, 24
intgration avec
le Web, 6
Microsoft Office, 161
WebSTATISTICA, 95
interface-utilisateur, 131
interface-utilisateur
analyse interactive, 135
caractristiques, 131
interface interactive, 134
navigateur internet, 297
personnalisations, 131
web, 147
introduction, 3
introduction
fonctions analytiques, 3
philosophie du logiciel, 5
spcificits, 4
technologie du logiciel, 5
ISO 21747, 78, 80, 81, 82

Java, 5
Journal des vnements, 101

322 STATISTICA Prise en Main


Copyright StatSoft, 2010

PRISE EN MAIN : INDEX

k plus proches voisins, 70

macros, 192
macros au clavier, 235
macros
affecter aux barres doutils et
menus, 238
au clavier, 235
danalyse, 234
enregistrement, 52, 192, 234
excuter en ligne de
commande, 239
filires danalyses, 234
Manuel lectronique, 32, 291
matrice de corrlations, 16
menus
affichage, 227
data mining, 139
donnes, 13
fichier, 12
graphiques, 140
menu contextuel, 15
outils, 227
personnaliser, 146
statistiques, 139
mthodes, 256
mthodes
Goback, 259
RouteOutput, 260, 262
Microsoft Office
intgration, 149, 249
rapports Word, 150, 161
mise en forme des cellules, 188
modle linaire gnral, 309
modle-objet, 258, 259
modles avancs, 309
modules et bibliothques, 264
mot de passe, 103

naviguer entre les botes de


dialogue, 259
nom des observations, 187
nom des variables, 187
notes et commentaires
(classeurs), 155

objets, 256
observations
bouton, 13
filtrage des doublons, 64
OLE, 191, 249
OLE DB, 277
onglets
Avanc, 18
Base, 4, 18, 43, 80
optimisation de processus, 312
options, 141, 142, 143
options par dfaut, 227
organisation des programmes,
259
ouvrir un fichier, 12

panneau de dmarrage, 135


PDF, 160
personnalisations, 12, 131
personnalisations
accs alternatifs aux
fonctionnalits, 132
applications externes, 146
aspect du logiciel, 225
barre doutils, 145
conserver diverses
configurations, 230
documents, 229
graphiques, 28, 202, 229
interface-utilisateur, 225
oprations de STATISTICA,
225
options par dfaut, 227

rseau, 230
SVB, 146, 233
temporaire/permanente, 227
philosophie du logiciel, 5
PI (connecteur), 315
plans dexpriences, 311
points atypiques
recodification, 68
portail, 174
portail interactif, 163
PROCEED, 319
programmation
botes de dialogue, 259
environnement, 250
projets STATISTICA, 193
proprits, 256

qualit
sixpacks, 77

rapport, 24, 157, 189


rapports
BPx, 106
rapports issus de classeurs, 159
rapports
HTML, 162
Microsoft Word, 161
PDF, 160
Rich Text Format, 159
raliser des calculs, 252
recodification
points atypiques, 68
recodifier les donnes, 72
reconnaissance ingale, 7
rfrences, 264
rgles dassociation, 313
rgles lmentaires pour les
programmes SVB simples,
251
reprendre lanalyse, 248
requte, 277
rsultats, 15, 138, 153

STATISTICA Prise en Main 323


Copyright StatSoft, 2010

PRISE EN MAIN : INDEX


rsultats de synthse, 77
rsultats
feuille de donnes, 260
graphiques, 192, 260
routeoutput (mthode), 260,
262
RTF, 159, 190

sauvegarde automatique, 154


serveurs distants, 279
six sigma, 311
sorties, 15
sorties
classeurs, 154
documents, 260, 262
fentres indpendantes, 156
feuilles de donnes, 185
Microsoft Word, 161
objets, 260, 262
rapports, 157
web, 163
sous-routines, 252
spcifications des variables, 13
spcificits du programme, 4
SQL, 58, 62, 117, 124, 125
SQL Server, 277
STATISTICA (produits)
rgles dassociation, 313
STATISTICA (produits)
analyse de liens, 313
analyse de processus, 311
cartes de contrle, 311
connecteur PI, 315
data miner, 312
data warehouse, 315
entreprise, 313
estimation et prcision de la
variance, 310
MAS, 314
modles avancs, 309
MSPC, 311
MultiStream, 314

optimisation de processus,
312
plans dexpriences, 311
PowerSolutions, 319
puissance de test, 310
rseaux de neurones, 310
SDMS, 315
systmes entreprise, 312
techniques exploratoires
multivaries, 310
text miner, 312
WebSTATISTICA, 315
STATISTICA Entreprise, 108,
313, 314
STATISTICA Query, 277
STATISTICA Visual Basic
applications, 146, 233
crer des graphiques, 220
diteur et dboggage, 235
excuter un programme, 237
exemple, 240
filires danalyses, 234
macros au clavier, 235
macros danalyse, 234
mthodes, 147
performances, 238
proprits, 147
structure, 238
STATISTICA
bouton Dmarrer, 143
fonctionnalits, 309
ligne de produits, 309
projets, 193
Visual Basic, 146
statistiques, 139
statistiques lmentaires, 16
StatSoft
site web, 292
statut des observations, 215
support technique, 293
synthse de lanalyse, 81
systme expert de suivi et
dalertes, 314
systmes entreprise, 312

tableaux, 253
tableaux multimdia, 13, 185
technologie du logiciel, 5
text miner, 312
tracs de dispersion, 47, 49
transmettre des arguments
aux fonctions, 255
de tableaux, 255
types de documents, 143
types de donnes, 252

valeurs manquantes, 57, 67, 69,


70, 71, 85, 105, 197
valeurs manquantes
dfinir la valeur, 69, 70
dfinir le code des, 104
remplacement, 70, 71
variables
bouton, 13
filtrage automatique, 137
globales, 255
invariantes, 67
publiques, 255
slection, 19
spcifications, 13
variance
analyse, exemple, 34
estimation et prcision, 310
variant (type de donnes), 254
verrouiller les feuilles de
donnes, 104
Visual Basic, 233
Visual Basic
mthodes, 147
proprits, 147

Web
site de StatSoft, 292
Web (intgration), 6

324 STATISTICA Prise en Main


Copyright StatSoft, 2010

PRISE EN MAIN : INDEX


WebSTATISTICA, 95, 147, 163,
297, 315
WebSTATISTICA
portail interactif, 163
publier des informations, 164
Word (Microsoft), 249

XML, 148, 297, 312

STATISTICA Prise en Main 325


Copyright StatSoft, 2010

PRISE EN MAIN : NOTES

326 STATISTICA Prise en Main


Copyright StatSoft, 2010

PRISE EN MAIN : NOTES

STATISTICA Prise en Main 327


Copyright StatSoft, 2010

PRISE EN MAIN : NOTES

328 STATISTICA Prise en Main


Copyright StatSoft, 2010

PRISE EN MAIN : NOTES

STATISTICA Prise en Main 329


Copyright StatSoft, 2010

PRISE EN MAIN : NOTES

330 STATISTICA Prise en Main


Copyright StatSoft, 2010

Vous aimerez peut-être aussi