Vous êtes sur la page 1sur 8

Traitement des donnes avec Microsoft EXCEL 2010

Vincent Jalby Septembre 2012

Saisie des donnes

Les donnes collectes sont saisies dans une feuille Excel. Chaque ligne correspond une observation (questionnaire), chaque colonne une variable (question ou partie de question). Observation Obs 1 sans espace. La premire colonne contient le numro de l'observation (questionnaire) : lors de la saisie, chaque questionnaire est numrot (physiquement) et son numro retranscrit dans la premire colonne. Q1 1 Q2 5 Q3a 3 Q3b 2

La premire ligne contient le numro ou l'intitul de la question : utiliser des noms simples, courts, sans accent,

Codage des questions

Le codage dpend de la nature des questions : questions numriques (age, nombre d'employs, ) : la valeur est directement saisie : question dichotomique (sexe, oui/non, ) : on utilise les valeurs 0/1 (faux/vrai) ou 1/2 (homme/femme). QCM rponse unique (situation familiale, ) : les modalits de rponse sont numrotes ; seul le numro de la modalit choisie est saisi. QCM rponses multiples (moyens de transports utiliss, ) : elles correspondent autant de questions dichotomiques que de modalits de rponse. On codera donc ces questions par autant de colonnes que de modalits de rponse. Chaque colonne contiendra la valeur 1 ou 0 selon que l'individu a coch ou non cette modalit. questions avec chelle (Pas du tout d'accord, tout fait d'accord, ) : les modalits sont numrotes de 1 5 (dans le cas d'une chelle 5 modalits) ou de 2 +2. 1 ou 2 correspond la modalit la plus ngative (pas du tout d'accord), 5 ou +2 la plus positive (tout fait d'accord) et 3 ou 0 correspond la modalit moyenne (ni d'accord, ni pas d'accord). Obs 1 2 Age 25 29 Sexe 1 2 SitFam 1 1 Q4 :Voiture 0 1 Q4 :Velo 1 0 Q4 : Commun 0 1

Les rponses manquantes (questions non rpondues, ou incorrectement) doivent tre codes, soit en laissant la cellule vide, soit par des 9/99/999. L 'utilisation d'une cellule vide facilite le traitement avec les fonctions incluses dans Excel (en particulier pour les questions numriques). C'est la mthode prfrer. L 'utilisation de 9 est choisir lorsqu'on prvoit d'exporter les donnes vers SPSS. Pour faciliter la saisie, il est souhaitable de rajouter deux lignes indiquant les rgles de saisie. On peut aussi faire prcder la ligne des intituls par une ligne reprenant le numro des questions.

Facult de Droit et des Sciences conomiques, Universit de Limoges. Ml : vincent.jalby@unilim.fr

Organisation de la feuille
t de slectionner la premire

A n de faciliter la saisie et la consultation des donnes, il est prfrable de scinder la feuille en 3 : 1re colonne (numro d'observation), 1res lignes (nom des variables, ), donnes. Pour cela, il su cellule contenant une donne (dans l'exemple prcdent, la cellule de la Af chage > Fentre > Figer les volets > Figer les volets. 5e ligne, 2nde colonne) puis de choisir

Une fois la saisie termine, il faut supprimer les premires lignes (numro question, valeur, manquante) pour ne conserver que la ligne des intituls (et les donnes dessous). Pour ne pas perdre ces informations, il est prfrable de dupliquer la feuille auparavant ! On est alors en prsence d'une feuille du type

L 'utilisation de ltres automatiques est souvent pratique pour trier/slectionner des donnes. Pour cela, il su slectionner la premire ligne (nom des variables) puis de choisir Donnes > Trier et ltrer > Filtrer.

t de

Les menus apparaissant cot du nom de chaque colonne (sur la premire ligne) permettent de trier l'ensemble du tableau de donnes par ordre croissant ou dcroissant de valeurs de la variable de la colonne choisie. Il est aussi possible de ltrer sur une ou plusieurs valeurs, voire une plage de valeurs, de la variable les lignes du tableau. Les autres lignes sont juste masques.

Fonctions, Utilitaire d'analyse, Tableau crois dynamique

Il est possible de faire un traitement des donnes complet en utilisant les fonctions d'EXCEL : NB(), NBVAL(), NBVIDE(), NB.SI( ; ), MOYENNE, ECARTYPE, MIN, MAX, SOMME. Toutefois, EXCEL inclut des outils avancs permettant d'automatiser ce traitement : Utilitaire d'analyse : ensemble d'outils permettant d'tudier une ou plusieurs variables quantitative ; Tableau crois dynamique : outil permettant d'tudier une ou plusieurs variables qualitatives mais aussi quantitative. L 'utilitaire d'analyse fait partie des macros complmentaires d'EXCEL qui ne sont pas actives par dfaut. Avant la premire utilisation, il faut donc l'activer : 1. Dans l'onglet Fichier, slectionner l'item Options. 2. Dans la fentre qui s'ouvre, choisir Complments puis cliquer sur le bouton Atteindre en bas de la fentre. 3. Dans la nouvelle fentre Macro complmentaires , cocher Analysis ToolPak. puis valider (OK). Tous les traitements seront fait dans une ou plusieurs feuilles (onglets) spares. Dans la suite, on supposera que la feuille des donnes est nomme donnees et la feuille de rsultat est nomme resultats.

5
5.1

Traitements univaris
Variables quantitatives

Elles correspondent aux questions numriques (revenu, ge, ). Certains traitements s'appliquent aussi aux variables qualitatives ordinales (en particulier issues de questions avec chelle de type Likert) et aux questions dichotomiques codes en 0/1 (variables qualitatives nominales). 5.1.1 Rsums statistiques

Ils correspondent la moyenne, minimum, maximum, cart-type, somme, etc. On peut les calculer en une seule opration en utilisant l'utilitaire d'analyse : 1. slectionner Donnes > Analyse > Utilitaire d'analyse, puis Statistiques descriptives ; 2. pour la plage d'entre, slectionner (dans la feuille donnees) la ou les colonnes correspondant aux variables quantitatives tudier (il su colonne) ; 3. cocher Intitules en premire ligne et Rapport dtaill ; 4. dcocher Niveau de con ance ; 5. cocher Plage de sortie et slectionner une cellule vide de la feuille resultats (les rsultats seront a nouvelle feuille soit cre. chs partir de cette cellule, en dessous et droite). ou cocher insrer une nouvelle feuille pour qu'une t pour cela de slectionner la colonne complte, en cliquant sur la lettre de la

5.1.2

Reprsentation graphique : histogramme

Pour obtenir l'histogramme d'une variable quantitative (continue), il est (quasiment) indispensable d'utiliser l'utilitaire d'analyse. Pour cela, il faut auparavant d nir les bornes des intervalles (classes) de valeurs servant la discrtisation. Cette opration doit tre faite manuellement (en s'aidant des rsultats donnes par Statistiques descriptives : minimum, maximum, etc). Dans une colonne de la feuille resultats, on tape l'intitul ( Classes ) suivi de la borne suprieure de chaque classe. L 'exemple cicontre correspond la saisie ncessaire pour obtenir les classes [0, 10], ]10, 20] et ]20, 30]. Classes 10 20 30

Remarque. Il est prfrable de choisir des intervalles de longueur rgulire (de longueur 10 dans l'exemple prcdent). Pour obtenir un histogramme, il faut ensuite : 1. slectionner Donnes > Analyse > Utilitaire d'analyse, puis Histogramme ; 2. pour la plage d'entre, slectionner (dans la feuille donnees) la colonnes correspondant la variable quantitative reprsenter (il su colonne) ; 3. de la mme faon, slectionner (dans la feuille resultats les cellules correspondants aux classes d nies prcdemment (y compris la cellule d'intitul) ; 4. cocher Intitules en premire ligne et Reprsentation graphique ; 5. cocher Plage de sortie et slectionner une cellule vide de la feuille resultats (les rsultats seront a partir de cette cellule, en dessous et droite). 6. nalement, ne pas oublier de cocher Reprsentation graphique ! chs t pour cela de slectionner la colonne complte, en cliquant sur la lettre de la

5.2

Variables qualitatives

Elles correspondent aux QCM. Elles sont soit ordinales (les modalits sont classes) soit nominales (les modalits ne peuvent pas tre classes), en particulier dichotomiques. Certains traitements s'appliquent aussi aux variables quantitatives discrtes (nombre d'enfants, ). 5.2.1 Tri plat

Outre les rsums statistiques (mode pour les variables nominales, minimum, maximum, mdiane pour les variables ordinales, moyenne et cart-type pour les variables issues d'chelle de Likert) obtenus via les Statistiques descriptives de l'utilitaire d'analyse (c.f. section 5.1.1), la prsentation de tris plat permet de dcrire compltement une variable qualitative (ou discrte continue). Pour cela, on utilise le rapport de tableau crois dynamique : 1. slectionner Insertion > Tableaux > Tableau crois dynamique ; 4

2. dans le dialogue, d nir la plage de donnes en slectionnant les colonnes correspondantes dans la feuille donnees et slectionner l'emplacement du tableau qui sera cr ( Nouvelle feuille de calcul pour crer une nouvelle feuille contenant le tableau) ;

3. faire glisser le nom de la variable de la liste des champs vers la colonne de gauche du tableau (Champs de ligne) ; 4. faire glisser nouveau le nom de la variable de la liste des champs vers la zone principale du tableau (Donnes) : le tri plat s'e ectue automatiquement !

Faire glisser pour obtenir un tri crois

Faire glisser ici

Faire glisser ici

Tableau dynamique : Chaque zone peut recevoir une ou plusieurs variables.

Liste des variables : correspond aux colonnes slectionnes. La variable age (quantitative) ne doit pas tre utilise.

Ruban d'outils : permet de dnir certaines options ainsi que l'apparence du tableau. Le bouton Graphique permet d'obtenir un graphique dynamique.

5. changer ensuite dans la premire colonne les numros des modalits par leur nom ; 6. pour masquer la modalit vide (= donne manquante 1 ), il su colonne 1 et de dcocher vide . 7. pour a cher les pourcentages, faire un clic droit dans la partie principale du tableau (colonne de droite), puis slectionner Paramtres de champ ; cliquer alors sur Af cher les valeurs, puis dans le menu Af cher les valeurs slectionner % du total ;
1. Cette modalit n'a che aucune valeur. En e et, les valeurs manquantes vides ne sont pas prises en compte. Si ncessaire, pour remdier cela, il faut slectionner au point 3, outre la colonne correspondant la variable tudie, la premire colonne correspondant au numro d'observation. C'est cette variable qu'il faudra faire glisser (au point 6) vers la zone principale du tableau.

t de cliquer dans le menu local de la

Menu local : permet de choisir les modalits afficher.

Clic droit : paramtres de Champ

Modalits : numro remplacer par intitul.

Synthse par Nombre : affiche le nombre (effectif) de chaque modalit

% du total : affiche le % (au lieu de l'effectif), par rapport au total (de l'chantillon, ou de la ligne ou de la colonne.

5.2.2

Diagramme en btons t de cliquer sur le bouton Graphique crois dynamique de la

A partir du tableau crois dynamique : il su

barre d'outils (cliquer d'abord sur l'onglet Outils de tableau crois dynamique ). Mais attention, toute modi cation du graphique sera rpercute sur le tableau et inversement. Directement : il su t de slectionner la zone de donnes (les deux colonnes contenant, pour la premire le nom

des modalits et pour la seconde les e ectifs ou pourcentages correspondants, y compris la ligne d'intitul, mais hors ligne total), puis de choisir Insertion > Graphique.

5.3

Variables qualitatives issues d'une question rponses multiples

Ces variables, codes en 0/1, ncessitent un traitement simultann. On peut soit utiliser les fonctions d'Excel pour e ectuer les calculs manuellement, soit utiliser le rapport de tableau crois dynamique de manire un peu dtourne : on procde comme prcdemment, mais au point 2, on slectionne l'ensemble des colonnes/variables 0/1 correspondantes aux rponses la question. au points 3 et 4, ne pas faire glisser de variable dans la premire colonne, mais faire glisser toutes les variables (une par une) vers la zone principale du tableau. faire ensuite un clic droit sur chaque ligne puis slectionner Paramtres de champ et Somme au lieu de Nombre. On obtient ainsi les e ectifs de chacune des rponses.

6
6.1

Traitements bivaris
Variables quantitatives
cient de corrlation

Pour tudier le lien entre deux variables quantitatives, il est possible de calculer leur coe linaire et/ou de les reprsenter graphiquement.

Lorsque les variables quantititatives tudier ne se trouvent pas dans des colonnes adjacentes, il est pratique de recopier ces colonnes dans une nouvelle feuille. 6.1.1 Coe cient de corrlation linaire cient de corrlation linaire, il est ncessaire d'utiliser l'utilitaire d'analyse :

Pour calculer le coe

1. slectionner Donnes > Analyse > Utilitaire d'analyse, puis Analyse de corrlation ; 2. pour la plage d'entre, slectionner (dans la feuille donnees) les colonnes correspondant aux variables quantitatives tudier ; il su lettre de chaque colonne ; 3. cocher Intitules en premire ligne ; t pour cela de slectionner les colonnes compltes, en majuscule-cliquant sur la

4. cocher Plage de sortie et slectionner une cellule vide de la feuille resultats (les rsultats seront a partir de cette cellule, en dessous et droite). La matrice obtenue a che pour chaque couple de variables le coe

chs

cient de corrlation linaire correspondant.

6.1.2

Diagramme de dispersion

Pour reprsenter graphiquement deux variables quantitatives, on utilise un diagramme de dispersion (ou un nuage de points) : 1. slectionner les 2 colonnes concernes ; 2. choisir Insertion > Graphique >Nuages de points en prenant le premier modle. 3. un clic droit sur les di rents lments du graphique (axes, points, titre) permet de les modi er.

6.2

Variables qualitatives

Pour obtenir un tri crois et le graphique associ de deux variables qualitatives, on utilise le rapport de tableau crois dynamique : 1. dans le dialogue, d nir la plage de donnes en slectionnant les colonnes correspondantes dans la feuille donnees et slectionner l'emplacement du tableau qui sera cr. Si les colonnes ne sont pas adjacentes, slectionner aussi les colonnes sparant les deux variables ; 2. dans le tableau, faire glisser le nom de la premire variable de la liste des champs vers la colonne de gauche du tableau (Champs de ligne) ; 3. faire glisser le nom de la seconde variable de la liste des champs vers la premire ligne du tableau (Champs de colonne0) ; 4. faire glisser nouveau le nom d'une des deux variables 2 de la liste des champs vers la zone principale du tableau (Donnes) : le tri crois s'e ectue automatiquement !
2. ou mieux : faite glisser la variable numro d'observation ; cela permettra d'avoir le nombre de valeurs manquantes.

5. changer ensuite dans la premire colonne et la premire ligne les numros des modalits par leur nom ; 6. pour masquer la modalit vide (= donne manquante), il su 1/ligne 1 et de dcocher vide . 7. pour a cher les pourcentages en ligne ou en colonne, faire un clic droit dans la partie principale du tableau, puis slectionner Paramtres de champ ; cliquer alors sur Af cher les valeurs, puis dans le menu Af cher les valeurs slectionner % par ligne ou % par colonne. Le graphique (de prfrence des e ectifs) s'obtient en cliquant sur Assistant graphique de la barre d'outils Tableau crois dynamique . t de cliquer dans le menu local de la colonne

Vous aimerez peut-être aussi