Vous êtes sur la page 1sur 22

Frédérique HELIAS CNAM TET003 – 4.

Analyser des données et interpréter les résultats

4. ANALYSER DES DONNEES ET INTERPRETER LES RESULTATS

Vous avez rassemblé les données avec toutes les précautions d’usage. La collecte est terminée et vous
allez maintenant traiter et organiser les informations pour pouvoir répondre à la problématique de
l’étude. Cette partie est consacrée aux traitements et aux analyses des données des enquêtes
quantitatives (questionnaires) et qualitatives (entretiens et observations).

4.1. Le traitement des enquêtes quantitatives (par questionnaires)

L’exploitation des enquêtes quantitatives est généralement réalisée à l’aide de l’ordinateur : grâce à
lui, on peut effectuer divers calculs sans difficulté. Néanmoins, les données ne peuvent être traitées
telles qu’elles ont été recueillies sur le terrain. Il faut les mettre sous une forme qui les rend aptes à être
analysées. Avec la réalisation d’un codage, on passera des données brutes aux données préparées pour
l’analyse. Ensuite, plusieurs opérations seront effectuées dans le dépouillement des questionnaires afin
de faire ressortir les résultats pertinents de l’enquête.

4.1.1. Codage des questionnaires

Même avec un petit nombre de questionnaires, et surtout si l’analyse s’oriente vers des observations
statistiques ou des comparaisons, il n’est pas rentable de travailler directement sur les formulaires
d’enquête. Les informations recueillies seront alors présentées sous une forme simple et systématique
obtenue au moyen d’un codage. Les analyses ultérieures s’effectueront à partir du document
rassemblant les données codées.

Coder les réponses consiste à leur attribuer un code en vue de leur inscription sur un support adapté à
un traitement informatique. C’est la (les) personne(s) chargée(s) de l’analyse des résultats de l’enquête
qui doit (doivent) déterminer de quelle façon les réponses vont être codées. Il s’agit de proposer une
traduction simple, en termes chiffrés, d’une expression rédigée en clair, qu’il s’agisse d’un fait ou d’un
jugement. Coder les données brutes (c’est-à-dire telles qu’elles ont été reçues des enquêtés) consiste à
libeller les réponses obtenues à l’aide de codes numériques simples.

4.1.1.1. Des questions aux variables

Les indicateurs de l’enquête ont été traduits en questions. Au moment de l’analyse, chaque question de
l’enquête devient une variable. Une fois identifiée, chaque variable de l’enquête fait l’objet d’une
codification. Un code associe à chaque modalité de réponse une valeur (comme le numéro
minéralogique pour les départements). Les numéros de code affectés aux réponses n’auront pas la
même signification suivant la nature des variables.

62
Frédérique HELIAS CNAM TET003 – 4. Analyser des données et interpréter les résultats

Toutes les variables de l’enquête (c’est-à-dire les mesures effectuées dans le questionnaire) ne se
ressemblent pas. On distingue généralement trois types de variables :

 Variable nominale ou catégorie

Une variable est nominale lorsque les modalités de réponses sont simplement distinctes. On pourrait
ainsi écrire cette liste dans n’importe quel ordre. Les répondants sont rangés sur une échelle nominale :
c’est-à-dire sur une échelle dont les modalités sont seulement nommées.

Ex. : « Avec qui êtes-vous venu visiter cette exposition ? »


 seul  en famille
 avec des voisins ou amis  avec des collègues de travail

Avec les variables nominales, on se borne à compter le nombre de choix de chaque modalité. Le code
associé est alors purement symbolique et arbitraire et n’a pas valeur de quantité, c’est une
correspondance destinée à simplifier l’écriture. Par exemple, on peut donner la valeur 1 pour la
réponse « masculin » et 2 pour la réponse « féminin » (c’est le code de la sécurité sociale), ou
inversement, l’important étant que le code soit identique pour tous les enquêtés. Idem pour les
réponses « oui » ou « non » à une question.

 Variable ordonnée ou ordinale

Une variable est ordinale si un ordre existe entre les modalités de réponses : celles-ci constituent un
ensemble de classes ordonnées comme des classes d’âge, des degrés de faveur ou d’accord (tout à fait
d’accord/ plutôt d’accord/ plutôt en désaccord/ tout à fait en désaccord), des degrés de fréquence
(moins de 2h/ 2 à 4h/ plus de 4h). Les répondants seront rangés sur une échelle ordinale.

Ex. : « Qu’avez-vous pensé de cette exposition ? D’une manière générale, vous avez trouvé cette
exposition ? »
 très intéressante  assez intéressante
 peu intéressante  pas intéressante du tout

Les numéros de code attribué aux réponses d’une variable ordinale indiquent un ordre de classement,
mais pas une quantité. Par exemple, 1 pour « jamais », 2 pour « rarement », 3 pour « parfois », 4 pour
« souvent » et 5 pour « toujours ».

=> Ces deux variables (nominales et ordinales) sont dites qualitatives. Elles s’opposent aux variables
quantitatives.

 Variable quantitative ou numérique

Avec une échelle numérique ou quantitative, non seulement les modalités de réponses sont ordonnées,
mais on dispose d’une mesure avec un intervalle constant : l’augmentation d’une unité a toujours la
même signification.

63
Frédérique HELIAS CNAM TET003 – 4. Analyser des données et interpréter les résultats

Ex. : le nombre d’enfants, l’âge, le poids sont mesurés sur des échelles quantitatives.

Pour les variables quantitatives, la valeur portée sur le questionnaire devient la valeur codée et a le
sens d’une unité de mesure.

 Le traitement des non-réponses

Les listes de modalités de réponses aux questions supposent qu’il n’y ait aucune réponse. Or, il arrive
que certains enquêtés ne répondent pas. Que faire ? On peut prévoir un code, ce qui revient à ajouter
une modalité dans la liste. Il est conseillé de conserver le même code pour toutes les non-réponses (0
ou 9). Certains logiciels acceptent aussi le blanc (espace vide) comme signe de valeur manquante.
Dans certains cas, on peut prévoir plusieurs types de non-réponse si on est capable de les distinguer :
« ne sait pas répondre » (n’a pas d’avis), « ne veut pas répondre » (refus de réponse), « a oublié de
répondre à une question », etc.

4.1.1.2. Codification des questions fermées

 A une seule réponse possible

Un numéro de code est attribué à chaque modalité de réponse. Le mieux est de commencer à 1 et de
suivre l’ordre des modalités inscrites sur le questionnaire.

Ex. : « En cas de problèmes sentimentaux, à qui se confie-t-on de préférence ? »


Code Réponse
1 un proche
2 un psychologue
3 un conseiller conjugal
4 un spécialiste de courrier du cœur
5 une cartomancienne
6 à personne
9 non-réponse

 A choix multiples

Dans certains cas, l’enquêté peut choisir plusieurs réponses d’une liste. Par exemple : « Sur cette liste,
quelle(s) langue(s) étrangère(s) avez-vous appris pendant au moins deux années de scolarité :
anglais/ allemand/ italien/ espagnol ? ». Il y a trois manières de procéder à la codification :

Retenir toutes les combinaisons de réponses : ayant établi la liste de tous les modèles de réponses,
chacun sera affecté d’un numéro de code. La question en exemple produit 16 modèles de réponses,
codées de 1 à 16 :

64
Frédérique HELIAS CNAM TET003 – 4. Analyser des données et interpréter les résultats

1. anglais 9. allemand/ espagnol


2. allemand 10. italien/ espagnol
3. italien 11. anglais/ allemand/ espagnol
4. espagnol 12. anglais/ allemand/ italien
5. anglais/ allemand 13. anglais/ italien/ espagnol
6. anglais/ italien 14. allemand/ italien/ espagnol
7. anglais/ espagnol 15. Les quatre langues
8. allemand/ italien 16. Aucune langue

Coder par décomposition logique : l’information est décomposée comme si une série de questions
de la forme « oui/ non » ou « présence/ absence » avait été posée. Par exemple, on crée une
première variable correspondant à la question : « Avez-vous appris l’anglais : oui ou non ? » et
ainsi de suite pour les autres langues. Avec ce système, on obtient pour une question autant de
variables qu’elle a de modalité de réponses.

D’autres procédés avec certains logiciels d’analyse d’enquête (essentiellement professionnels) qui
offrent des possibilités particulières pour le traitement des questions à choix multiple, comme
accepter qu’on attribue à une variable (annoncée comme variable à réponses multiples) plusieurs
modalités de réponses simultanées, donc plusieurs numéros de code.

 A classement

Des questions pouvaient demander aux enquêtés de donner un ordre de préférence. La codification de
ce type de questions est très semblable à celui des questions à choix multiples : en retenant tous les
classements possibles ou en codant par décomposition logique.

4.1.1.3. Codification des questions ouvertes

 Questions ouvertes quantitatives

Certaines questions ouvertes ont recueilli un grand nombre de valeurs numériques : « Quel est votre
âge ? Combien d’enfants avez-vous ? Combien de cigarettes fumez-vous par jour ? ». La valeur
indiquée par le répondant est choisie comme valeur de code (pour ne pas réduire arbitrairement
l’information). De cette façon, il sera possible de décrire les données par le calcul de moyennes (âge
moyen, nombre moyen d’enfants ou de cigarettes quotidiennes). On pourra aussi s’intéresser à la
dispersion des valeurs autour de la moyenne (écart-type) et examiner en détail la distribution des
réponses.

 Questions ouvertes qualitatives

Les réponses aux questions ouvertes peuvent être diverses et riches. Parfois, les questions ouvertes ne
sont pas destinées à une analyse statistique, elles servent simplement à illustrer certains points. Il suffit

65
Frédérique HELIAS CNAM TET003 – 4. Analyser des données et interpréter les résultats

alors d’établir une liste classée des réponses sans prévoir de code. Mais pour réaliser une analyse
statistique des réponses aux questions ouvertes, la technique la plus classique consiste à les fermer a
posteriori en élaborant une catégorisation des réponses : on relève d’abord un nombre suffisant
d’énoncés, puis on réduit les propositions en ne gardant que l’essentiel des idées et enfin on propose
un classement objectif en rapprochant et en éloignant les réponses selon leurs degrés d’analogie et de
différence.

Ex. avec une question posée aux professeurs des écoles : « Que pourriez-vous conseiller comme bande
dessinée intéressante à un enfant de 10 ans ? ». Face à la variété de réponses, il faudra les catégoriser :

Code Réponses
1 Non, refus marqué (réprouve cette forme de littérature, ne connaît pas, ne veut pas
connaître, il faut lire de vrais livres, etc.)
2 Réticence, mise en garde (le choix est délicat, il y en a tant de mauvaises, elles sont rares,
veillez à ce que les dessins soient bien faits et l’orthographe respectée, il faut que je me
documente, etc.)
3 Réponse de dérivation (revues ou magazines pour jeunes cités au lieu de BD)
4 Choix classique (Astérix, Lucky Luke, Gaston Lagaffe, etc.)
5 Choix de connaisseur de BD considérée comme un instrument pédagogique (L’histoire de
France en BD, Génie des alpages, etc.)
9 Non-réponse

4.1.1.4. Du dictionnaire des codes au tableau de données

Le résultat de l’élaboration du code est un document synthétique indiquant comment chaque


information du questionnaire sera notée dans le fichier de données.

Voici par exemple un extrait de dictionnaire des codes pour une enquête réalisée auprès de
562 visiteurs de plus de 18 ans d’une exposition. Les questionnaires seront numérotés de 1 à 562 :

Question (résumé) N° de la variable Nom de la variable Description du codage


(résumé)
1 = masculin
Q1 1 sexe 2 = féminin
9 = non-réponse
Q2 2 âge nombre de 18 à 99
1 = seul
Q3 – Venu avec qui ? 3 venu 2 = voisins, amis
3 = en famille
4 = collègues
9 = non-réponse
1 = très intéressante
Q4 – Intérêt de 4 intérêt 2 = assez intéressante
l’exposition ? 3 = peu intéressante
4 = pas intéressante du tout
9 = non-réponse

66
Frédérique HELIAS CNAM TET003 – 4. Analyser des données et interpréter les résultats

Une fois toutes les réponses des questionnaires codées, on reporte les informations dans un document
synthétique afin d’obtenir un tableau de données (qu’on appelle matrice ou fichier de données) dont
chaque colonne représente une variable et chaque ligne un répondant.

Exemple de tableau de données :

N° Variable 1 Variable 2 Variable 3 Variable 4 etc.


questionnaire (sexe) (âge) (venu) (intérêt)
1 1 35 2 1
2 1 45 3 1
3 2 28 3 2
4 1 32 1 1
etc.

Dans ce tableau, une ligne (horizontale) est réservée à chaque questionnaire et une colonne (verticale)
est assignée à chaque variable de l’enquête. Toute l’information de l’enquête est ainsi résumée sur
quelques pages. Les dépouillements ultérieurs seront effectués à partir de ce tableau.

L’information pourra donc être saisie sur un tableur classique (type Excel) en prévoyant une ligne pour
chaque sujet et une colonne par variable de l’enquête. Par la suite, ces données pourront être importées
dans le logiciel choisi pour l’analyse.

4.1.2. Dépouillement

Lorsque les questionnaires ont été codés et saisis, il faut les dépouiller ; autrement dit, il faut dégager
les résultats qui nous intéressent parce qu’ils s’inscrivent dans le cadre défini par les hypothèses de
travail.

Les principales analyses que l’on peut faire de ces données, par ordre du plus simple au plus
complexe, sont : les tris à plat (examen d’une seule variable à la fois), les tris croisés (deux variables
prises en compte simultanément) et l’analyse multivariée (plusieurs variables prises en compte
simultanément). Ici, nous nous pencherons sur les deux premiers types d’analyses qui sont les plus
fréquents ainsi que sur l’analyse statistique qui permet de révéler si le croisement des différentes
variables est significatif.

4.1.2.1. Analyses par tris à plat pour décrire les variables

La première étape a pour objet la description simple de l’information : elle est réalisée à travers
l’opération de « tri à plat », c’est-à-dire le calcul de la distribution des effectifs et des pourcentages des
modalités de réponses pour chaque question.

Sur le tableau de données codées, il suffit de recenser dans une colonne (représentant une variable de
l’enquête) le nombre d’occurrences de chaque code. Cette opération peut paraître fastidieuse lorsque le

67
Frédérique HELIAS CNAM TET003 – 4. Analyser des données et interpréter les résultats

nombre de sujets ou de variables de l’enquête est important. Elle est très facile à réaliser par ordinateur
avec un programme adapté (logiciel spécialisé ou tableur).

 Présentation des tris à plat

Cette analyse permet de connaître, pour chaque variable, l’importance de chaque réponse soit en
termes absolus (nombre de réponses pour chaque proposition), soit en termes de pourcentage (le
pourcentage de répondants pour chaque réponse d’une question).

Exemple : les étudiants des universités grenobloises ont donné leur niveau d’accord avec une proposition
sur la culture :

« La culture, c’est une ouverture sur les autres »


Effectif Pourcentage
Tout à fait d’accord 527 65 %
Plutôt d’accord 218 27 %
Plutôt pas d’accord 35 4%
Pas du tout d’accord 6 1%
Non-réponse 24 3%
Total 810 100 %

=> On fait le décompte des réponses dans deux colonnes : celle des effectifs que l’on conserve tels
quels (fréquences absolues) et celle des pourcentages où l’on ramène les effectifs à 100 (fréquences
relatives). Ces derniers pourcentages sont calculés par simple règle de trois comme pour le premier :
(527÷810) × 100 = 65,06 % arrondi à 65 %.

Etant donné la marge d’incertitude attachée aux observations d’enquête, il est inutile de tomber dans le
travers « quantophrénique » en publiant des pourcentages avec plusieurs décimales. Le plus souvent
ils sont donnés en valeurs arrondies à l’unité (ou à une décimale si l’échantillon est de grande taille)
avec les règles d’arrondis classiques :

- le chiffre après la virgule inférieur à 0,5 est supprimé ;


- il est arrondi à l’unité supérieure s’il est au-dessus de 0,5 ;
- il est conservé ou arrondi à l’unité supérieure s’il est exactement 0,5.

Il arrive que la somme des pourcentages d’une distribution ne soit pas strictement égale à 100 % à
cause des arrondis. Dans ce cas, on l’annonce dans la présentation des résultats plutôt que de tricher
sur les chiffres pour arriver exactement à 100 %.

68
Frédérique HELIAS CNAM TET003 – 4. Analyser des données et interpréter les résultats

 Analyser les tris à plat

Pour l’analyse, on s’attache d’abord à décrire les distributions sans répétition pure et simple des
chiffres en usant de rapports simples (les trois quarts, la moitié, un tiers des répondants...), en attirant
l’attention sur les chiffres remarquables (ou étonnants) ou sur l’allure des distributions.

Il sera pertinent de ne pas considérer que seuls les pourcentages supérieurs à 50 % (les « gros
chiffres ») sont intéressants. L’enquête n’est pas une élection. De plus, on sait que certaines réponses
peuvent être empreintes de désirabilité sociale ou influencées. L’analyse cherchera toujours à
rapprocher les questions éloignées relatives au même thème. De même, elle pourra comparer ses
propres résultats à ceux d’autres enquêtes.

Une enquête sociologique ne se limite en effet presque jamais à la description de conduites ou de


jugements considérés isolément. Dans cette première analyse, quelques indications apparaissent,
surtout sous forme d’hypothèses ou de questions suggérées par les chiffres. Mais la prudence est de
mise : on sait que la formulation ou l’ordre des questions a pu influencer les répondants ; on ignore si
ce sont les mêmes personnes qui ont répondu positivement à plusieurs questions, si ceux qui ont fait
certains choix ont des caractéristiques particulières.

4.1.2.2. Analyses par tris croisés pour comprendre les réponses

L’analyse de l’enquête commence véritablement avec l’examen de tableaux qui prennent en compte
non plus une seule variable, mais simultanément deux variables. Ces tableaux croisés servent à
examiner si les hypothèses formulées sont acceptables, à comparer la distribution des comportements
et opinions entre sous-groupes de répondants ou encore à faire apparaître des associations entre
réponses à des questions qualitatives. Par exemple, « le nombre ou le pourcentage de personnes de
moins de trente ans qui ont un ordinateur ». Il s’agit alors de voir comment une variable se combine
avec une autre.

 Construction d’un tableau croisé

Les tris à plat ne sont d’aucune aide pour réaliser un tri croisé. Il est donc nécessaire de reprendre le
tableau de données afin d’observer en même temps les modalités de réponses à deux questions pour un
répondant. Chaque couple de réponses se situe dans une case du tableau : on comptabilise leur nombre
dans chaque case.

Ex. : Pour reprendre l’exemple précédent, on se demande si la distribution des réponses à la question
« La culture, c’est une ouverture sur les autres » est modifiée par le niveau d’études. En croisant le
degré d’accord et le niveau d’études (deux variables), on obtient le tableau de contingence ci-après
dans lequel sont répartis les 786 étudiants ayant répondus aux deux questions :

69
Frédérique HELIAS CNAM TET003 – 4. Analyser des données et interpréter les résultats

Tableau 1 : Degré d’accord avec l’opinion « La culture, c’est une ouverture sur les autres »
croisé avec le niveau d’études (en effectifs)

Bac +1 Bac +2 Bac +3 Bac +4 et + Total


Tout à fait d’accord 137 123 131 136 527
Plutôt d’accord 82 65 49 22 218
Plutôt pas d’accord 14 8 8 5 35
Pas du tout d’accord 2 2 1 1 6
Total 235 198 189 164 786

Ce tableau a été construit en vue de repérer l’effet que pouvait avoir le niveau d’études sur l’accord
avec la proposition. Comme les effectifs des groupes de niveau d’études sont différents, les
comparaisons ne sont pas directement possibles. On ramène alors les effectifs de chaque groupe à la
base 100 par calcul de pourcentage par lignes et par colonne.

 Analyse d’un tableau croisé

La variable à expliquer est l’opinion sur la culture (c’est la variable dépendante) et le facteur explicatif
est le niveau d’études (c’est la variable indépendante). Les modalités de la variable indépendante
servent de base au calcul des pourcentages.

Tableau 2 : Degré d’accord avec l’opinion « La culture, c’est une ouverture sur les autres »
croisé avec le niveau d’études (en pourcentages)

Bac +1 Bac +2 Bac +3 Bac +4 et + Total


Tout à fait d’accord 58 % 62 % 69 % 83 % 67 %
Plutôt d’accord 35 % 33 % 26 % 13 % 28 %
Plutôt pas d’accord ET 7% 5% 5% 4% 5%
Pas du tout d’accord
Total 100 % 100 % 100 % 100 % 100 %
Effectifs (235) (198) (189) (164) (786)

Dans ce tableau 2, le titre (en gras) et l’indication du total (100%) décrivent le sens de calcul des
pourcentages (ici par colonnes). Les effectifs, base de calcul de chaque groupe, complètent les
informations. La distribution marginale des répondants (la marge) reproduit dans la colonne « Total »
le tri à plat de la variable à expliquer.

Les pourcentages étant calculés en colonnes, on va comparer les valeurs portées sur une ligne en
repérant les variations et les extrêmes et pointer les écarts intéressants par rapport à la marge.

Qu’observe-t-on ici ?

sur la première ligne (« tout à fait d’accord »), le niveau « Bac +1 » a le plus faible score (58 %) et
celui-ci augmente d’un groupe à l’autre jusqu’au niveau d’études le plus élevé (83 %) ;

70
Frédérique HELIAS CNAM TET003 – 4. Analyser des données et interpréter les résultats

sur la deuxième ligne (« plutôt d’accord »), la variation est inverse : le niveau « Bac +1 » a le plus
fort score (35 %) et le niveau d’études le plus élevé le score le plus faible (13 %).
sur la troisième ligne (« pas d’accord »), les écarts sont très faibles ;
la variation est continue entre les quatre groupes mais au niveau « Bac +4 et plus », le saut est plus
marqué ;
dans les quatre groupes, on a toujours la même hiérarchie des modalités (qui reproduit celle de la
marge).

En résumé, l’accord total avec l’opinion sur « la culture comme ouverture » est toujours majoritaire et
augmente régulièrement avec le niveau d’études au détriment de l’accord mitigé. Le niveau de
désaccord avec la proposition est assez constant et faible d’un niveau d’études à l’autre.

Il est important de noter que l’observation la plus intéressante d’un tableau croisé s’effectue en
comparant les différents groupes ayant servi de base aux calculs des pourcentages, et non en
examinant dans chacun des groupes les chiffres importants (qui ici sont toujours situés sur la même
ligne).

 Discussion et interprétation

On peut ensuite tenter de proposer différentes interprétations ou hypothèses explicatives pour ces
observations. Les connaissances sociologiques ainsi que l’imagination et l’esprit d’à-propos sont utiles
pour rechercher des explications. On se méfiera des interprétations directes en termes de cause à effet :
c’est le moment de se demander s’il n’y a pas d’autres raisons qui peuvent intervenir.

Dans l’exemple ci-dessus, puisqu’on considère que l’échantillon est représentatif des étudiants d’une
ville universitaire, on peut tenter de généraliser l’observation faite sur l’échantillon et proposer des
hypothèses explicatives à la liaison constatée entre le degré d’accord avec la proposition et le niveau
d’études. On peut par exemple rechercher dans les caractéristiques de la formation universitaire
(ouverture et adaptabilité) l’explication au fait que les étudiants depuis plus longtemps à l’université
ont pris de la distance par rapport à une définition étroite de la culture. Une autre hypothèse
explicative serait que les étudiants les plus avancés ont pris de l’assurance et osent davantage
s’affirmer alors que les plus jeunes tempèrent leur réponse. On pourrait également supposer que les
étudiants qui valorisent davantage l’ouverture restent davantage à l’université. Les propositions
d’explications sont multiples !

4.1.2.3. Analyse statistique : le test du χ²

Les statistiques les plus simples sont de nature descriptive. On parle en effet de l’âge moyen, du
nombre d’individus qui possèdent certaines caractéristiques, de l’opinion ou de la perception d’un
groupe d’individus. Ces statistiques ont leur utilité mais également leurs limites. Ce n’est pas parce

71
Frédérique HELIAS CNAM TET003 – 4. Analyser des données et interpréter les résultats

qu’il y a plus d’hommes, en nombre, qui utilisent des mots d’argot, que nécessairement les hommes
utilisent significativement plus les mots argotiques que les femmes. Dans un cas comme celui-ci, le
fait de retrouver plus d’hommes peut être simplement dû à un nombre d’hommes plus élevé dans la
population étudiée. C’est pourquoi il est important d’utiliser, avant de conclure, des tests statistiques.

Le test du χ² (lettre grecque prononcée « khi-deux » ou « khi carré ») est basé sur la différence entre
les fréquences observées (Fo) et les fréquences théoriques (Ft). Ce calcul permet d’établir si la
différence entre les Fo et les Ft s’écarte de la façon significative, ce qui impliquerait que les résultats
obtenus sont différents de ce à quoi nous nous serions attendus si les variables étaient indépendantes
l’une de l’autre. Le test du χ² permet donc d’évaluer si un écart doit être considéré comme significatif
ou au contraire comme ayant beaucoup de chance d’être fortuit.

Si la valeur du χ² calculé est supérieure à une limite déterminée par une table, on dira que l’écart est
significatif à un seuil déterminé : on rejette alors l’hypothèse d’indépendance pour admettre que les
deux variables sont liées ou encore que les deux distributions par colonnes diffèrent significativement.

Certains logiciels peuvent indiquer pour chaque tri croisé la valeur du χ² et précisent la probabilité
pour que la répartition observée soit ou non due au hasard. Il est également parfois possible de
demander l’affichage de la contribution de chaque case au χ² global, ce qui renseigne sur les
combinaisons de modalités qui influent le plus sur la liaison entre variables.

4.2. Le traitement des enquêtes qualitatives (par entretiens)

Vous avez recueilli des données visibles dans les entretiens : à l’instar des questionnaires, il va
maintenant falloir traiter et analyser les informations, cette fois selon une méthodologie qualitative,
dans le but de répondre à la problématique. On passe donc à l’étape de l’analyse des entretiens par un
examen systématique et méthodique du discours des informateurs interrogés. Car un entretien ne parle
pas de lui-même : pour parvenir aux résultats de la recherche, il faut effectuer une analyse de contenu.
Cette analyse consiste à sélectionner et à extraire les données susceptibles de permettre la
confrontation des hypothèses aux faits.

4.2.1. Transcription du corpus en fonction des besoins

Pour être soumis à une analyse de contenu, l’entretien doit être transcrit intégralement avec toutes les
caractéristiques propres au langage oral : les hésitations, les répétitions, les phrases inachevées mais
aussi les fautes de syntaxe, les termes propres à une variété de langue sans oublier les silences, les
rires, les interruptions. On pourra ainsi porter l’attention sur le contenu du discours mais aussi sur
l’aspect linguistique et formel du discours qui en dit beaucoup.

72
Frédérique HELIAS CNAM TET003 – 4. Analyser des données et interpréter les résultats

Il existe plusieurs conventions de transcription selon les écoles. Celle qui suit est utilisée par la plupart
des linguistes en France :

/ Pause brève
// Pause moyenne ou longue (la longueur n’est pas objectivée par une mesure de temps)
>+ Auto-interruption : rupture de construction, faux départ
<+ Hétéro-interruption : le locuteur est interrompu par l’intervention d’un tiers
Blablabla Le soulignement des segments indique le chevauchement d’interventions entre l’enquêteur
blablabla et l’enquêté
VRAIment Phonème, syllabe ou segment accentué
Euh : Syllabe prolongée
<bleu> Essai de transcription demeurant incertain
I(l) faut mett(re) Phonème ou segment non réalisé
<banc/blanc> Hésitation entre deux propositions possibles
X Syllabes inaudibles
XX Deux ou plusieurs syllabes inaudibles
(rires) Phénomènes non verbaux, commentaires du transcripteur
[∫epa] (je sais pas) Transcription phonétique suivie de la proposition normée du segment que le locuteur a
voulu prononcer
? Interrogation marquée ou non marquée morphologiquement
[…] Coupure d’un segment de l’énoncé

Extrait d’un entretien suivant les conventions de transcriptions exposées ci-dessus :

1. EN : Comme je vous l’ai dit / je m’intéresse aux langues présentes à La Réunion / et à leur enseignement
/ que pouvez-vous me dire là-dessus de par votre vécu et votre vie professionnelle ?
2. GS : Bon / moi je pense surtout maintenant / avec l’affût du tourisme / on trouve un peu toute sorte de
langues / enfin le réunionnais est confronté déjà à de l’allemand / à de l’anglais / à euh >+ à de l’espagnol /
de par le tourisme // bon les langues qui sont parlées par la population réunionnaise / ben le créole et le
français et puis // bon un mélange des deux / ce qu’on appelle maintenant l’interlangue / puisque // c’est
vrai que maintenant j’ai plus ce regard innocent que j’avais à une époque / puisque on a eu des stages / on a
été formé / on nous a fait prendre conscience justement de ce problème // bon maintenant de mon vécu /
moi je suis née à Madagascar / d’un père / je dirai euh >+ mentalité colonialiste / donc pour lui c’était
apprendre le français / parler le français / QUE le français / pourtant il est réunionnais / mes parents parlent
très bien le réunionnais >+ le créole / mais jamais ils ont parlé créole devant nous
3. EN : Mmh
4. GS : Et maintenant oui / maintenant qu’on est grand / qu’on est >+ mais enfant <+
5. EN : Même entre eux ?
6. GS : Même entre eux / JAMAIS / et donc en plus ils nous interdisaient de >+ de parler >+ de parler le
créole / et je vois / bon / on est quand même huit enfants à la maison / j’ai tous mes frères et sœurs qui
parlent le créole spontanément / mais moi je fais un blocage / quand on est rentré de Madagascar / arrivée

73
Frédérique HELIAS CNAM TET003 – 4. Analyser des données et interpréter les résultats

ici / bon / la pression de mon père / qui était là / surtout il faut pas parler créole etc / je suis arrivée moi / ne
connaissant pas le créole puisqu’on était à Mada / ils parlaient que créole >+ euh que français // et à l’école
on m’appelait français manioc / enfin patate je sais pas quoi / enfin bon / et c’est vrai que je pense >+ je
pense que ça a dû créer un blocage chez moi / si bien que moi / spontanément / je ne parle pas du tout le
créole / MAIS je comprends / je comprends très bien / ça m’est arrivé UNE fois / de me sentir à l’aise / et
de parler créole / et où personne ne s’est moquée de moi je pense // mais c’est vrai / que même ici / quand
je me mets à parler / on se moque de moi (rires) / bon alors je m’arrête quoi (rires) /voilà // et ça maintenant
/ je suis capable d’en parler alors qu’avant ça me >+ je pouvais pas non plus

=> Le but de la transcription est de permettre au chercheur de se servir de ce qui est dit pour rendre
compte d’une interprétation de la réalité des enquêtés. La transcription sert aussi à mettre l’accent sur
ce que dit la forme lorsque le fond du propos n’est pas probant dans le vocabulaire utilisé.

4.2.2. Pourquoi analyser le contenu ?

L’analyse du contenu est un sous-ensemble de l’analyse du discours (ce mot « discours » étant entendu
comme toute production d’un locuteur dans un contexte particulier). L’analyse du discours concerne
l’analyse de tous les composants langagiers et recouvre essentiellement deux types d’approches :
d’une part les analyses linguistiques qui étudient et comparent les structures formelles du langage ;
d’autre part les analyses de contenu qui étudient et comparent les sens des discours pour mettre à jour
les systèmes de représentations véhiculés par ces discours.

Les analyses de contenu sont préférentiellement utilisées en sociologie et en psychologie sociale. Elles
occupent ainsi une grande place dans la recherche sociale notamment parce qu’elles offrent la
possibilité de traiter de manière méthodique des informations et des témoignages qui présentent un
certain degré de profondeur et de complexité.

4.2.2.1. Présentation

L’analyse de contenu a un très vaste champ d’application : elle peut porter sur des communications
variées et de formes très diverses telles que des œuvres littéraires, des articles de journaux, des
documents officiels, des émissions télévisées ou radiophoniques, des déclarations politiques, des films,
des rapports de réunion, des entretiens par exemple. L’analyse de contenu s’intéresse aux choix des
termes utilisés par celui qui parle (le locuteur), à leur fréquence et à leur mode d’agencement, à la
construction du discours et à son développement : tous ces éléments discursifs constituent des sources
d’information à partir desquelles le chercheur tente de construire une connaissance.

Contrairement à la linguistique, l’analyse de contenu en sciences sociales n’a pas pour objectif de
comprendre le fonctionnement de la langue en tant que telle. Si les aspects formels les plus divers du
discours peuvent être pris en compte et examinés minutieusement, ce n’est jamais pour en retirer un
enseignement qui porte sur un objet extérieur à eux-mêmes. Les aspects formels sont ainsi considérés

74
Frédérique HELIAS CNAM TET003 – 4. Analyser des données et interpréter les résultats

comme des indicateurs de l’activité cognitive du locuteur, des significations sociales ou politiques de
son discours ou de l’usage social qu’il fait de la communication.

L’entretien n’est en effet pas une fin en soi : il est une étape dans un processus de recherche dont
l’aboutissement est l’analyse finale du matériau. Surtout face à une production d’un discours qui
dépend du contexte dans lequel il a été réalisé, de la relation interpersonnelle enquêteur-enquêté, de la
capacité de verbalisation de l’informateur, etc., les ruses de l’inconscient, les pièges tactiques, les
maladresses de l’enquêteur font que l’information obtenue subit des interprétations, des réductions,
des détériorations. De ce fait, il est impossible de prendre le discours d’un individu comme un
matériau brut et une vérité simple et univoque. Ecouter et analyser un entretien, c’est donc rester
conscient des différents niveaux de signification d’une prise de parole et rester vigilant sur les
différentes articulations d’une pensée.

4.2.2.2. Objectifs

L’analyse de contenu d’un entretien cherche à étayer les impressions, les jugements, les intuitions à
partir d’une observation méthodique et rigoureuse du discours. Ce travail consiste alors à expliciter et
à explorer le contenu formel ou latent à partir de repères objectifs, d’indices quantifiables ou non.
L’analyse de contenu dépend évidemment des buts de l’étude et des objectifs fixés. Chaque objectif
demande de redéfinir la méthode en fonction de ce que l’on veut prouver, démonter, mettre en relief.

Sur le plan des objectifs de recherche, l’analyse de contenu peut notamment être utilisée pour :

l’analyse des idéologies, des systèmes de valeurs, des représentations et des aspirations ainsi que de
leur transformation ;
l’examen des logiques de fonctionnement d’organisations grâce aux documents qu’elles
produisent ;
l’analyse des processus de diffusion et de socialisation (manuels scolaires, journaux, publicité,
etc.) ;
l’analyse de stratégies, des enjeux d’un conflit, des composantes d’une situation problématique, des
interprétations d’un événement, des réactions latentes à une décision, de l’impact d’une mesure,
etc. ;
la reconstitution de réalités passées non matérielles : mentalités, sensibilités, etc.

4.2.2.3. Production du sens

Le sens d’un discours est une production, pas une donnée : c’est une lecture orientée. Si les entretiens
semblent livrer un matériau spontané, le traitement/ l’analyse qui lui est appliqué ensuite contribue à
sculpter le message et le sens qui va en être dégagé. Après avoir fait parler l’enquêté, l’enquêteur fait
parler le texte/ le produit par l’analyse des discours.

75
Frédérique HELIAS CNAM TET003 – 4. Analyser des données et interpréter les résultats

Pour illustrer ce point1, on comparera deux traitements que sont le résumé d’un texte et l’analyse de
son contenu. Le résumé est neutre, il se présente comme une photographie simplifiée du texte. Il se
veut non sélectif et procède par réduction du texte en ne conservant que les propositions principales ou
causales. Il épouse autant que faire se peut la logique du texte et sa cohérence interne.

L’analyse de contenu implique de son côté des hypothèses. Elle est hyper-sélective et se fait en
fonction des objectifs de l’analyste. Elle ignore la cohérence explicite du texte et procède par
décomposition des unités. Elle a pour fonction de produire un effet d’intelligibilité et comporte une
part d’interprétation.

 Texte

Enquêteur : « Vous hébergez depuis plusieurs mois quelqu’un chez vous. Pouvez-vous me dire comment
cela a commencé ? »

Enquêtée : « C’est un de mes neveux qui a 17 ans, un garçon, et qui est en première, qui s’est trouvé,
comment on pourrait dire... en échec scolaire... mais fort... depuis des années... et à mon avis pas dû... je
suis moi-même professeure en lycée... pas dû... parce que je l’ai fait travailler dans des matières pas... c’est
quelqu’un qui a une très belle plume, qui lisait à 5 ans... pas parce qu’il est incapable de suivre et de
comprendre, mais parce qu’il avait des problèmes personnels notamment avec son père. Donc nous avons
proposé... on s’est concertées avec ma sœur qui ne savait plus dans quel lycée le mettre, de le prendre et de
le sortir de son cadre habituel. On l’avait orienté en première professionnelle, ce qui est une façon pour le
lycée commode de se débarrasser des individus qui chahutent. Donc moi j’ai aidé ma sœur à faire le
dossier du rectorat à la commission d’appel et à le domicilier ici pour qu’il soit pris au lycée de E. en
première L qui est la filière qui lui convient. Voilà donc l’expérience et le but qu’on se donne, c’est pas
qu’il soit premier de sa classe, ce n’est pas la question, c’est qu’il reprenne le goût de travailler, à être
bien dans sa façon de voir les choses... sur le plan humain et puis effectivement le mettre au travail quand
il faut. »

 Résumé

L’enquêtée a un neveu en classe de première, en échec scolaire depuis plusieurs années. Elle est elle-
même professeure et l’a fait travailler. Cet échec n’est pas dû à une incapacité mais à des problèmes
personnels avec son père. Elle propose donc, en concertation avec sa sœur, de le prendre chez elle. En
le domiciliant chez elle, elle réussit à le faire changer de lycée et à l’inscrire dans une filière qui lui
convient. Elle le fait également sortir de son cadre habituel. Son but est double : le remettre au travail
et faire qu’il soit bien.

 Analyse de contenu : première lecture

L’analyse est orientée par une problématique concernant l’échec scolaire et l’orientation scolaire :

1
L’exemple qui suit est tiré de l’ouvrage d’Alain Blanchet et Anne Gotman, L’Entretien, Paris, Nathan, Coll.
« 128 », 1992, p. 90-92.

76
Frédérique HELIAS CNAM TET003 – 4. Analyser des données et interpréter les résultats

Un jeune garçon est en échec scolaire et son lycée l’oriente dans une filière professionnelle, mais sa
tante, professeure de lycée, estime qu’une filière L lui conviendrait mieux.
Pour le sortir de la filière technique, elle recourt à la commission d’appel du rectorat et demande
son admission dans un autre lycée, en le domiciliant chez elle.

Conclusion-hypothèse : l’orientation scolaire dépend-elle du cursus scolaire de l’élève, du domicile de


ses parents, du fait qu’il a un membre de l’enseignement dans sa parentèle ?

 Analyse de contenu : deuxième lecture

L’analyse est orientée par une problématique concernant l’hospitalité et les relations familiales :

Un jeune garçon est en échec scolaire, mais sa tante estime que cet échec est dû aux problèmes
personnels qu’il a avec son père.
Grâce à sa double position professionnelle et familiale (professeure et sœur de la mère du jeune
garçon), elle décide en accord avec la mère d’inscrire son neveu dans un autre lycée et de le
prendre chez elle, à la fois pour résoudre son problème scolaire et pour le sortir de son cadre
familial.

Conclusion-hypothèse : la compétence professionnelle de l’enquêtée est ce qui lui permet de jouer son
rôle de tante sans « prendre la place » de la mère, sans s’immiscer dans les problèmes familiaux du
jeune garçon. L’hospitalité suppose une certaine neutralité du rôle familial.

4.2.3. Comment analyser le contenu ?

Chaque analyse, chaque lecture, extrait donc du même texte un sens différent selon les hypothèses
engagées dans la recherche. Le choix du type d’analyse de contenu est subordonné aux objectifs de la
recherche et à sa formulation théorique.

4.2.3.1. Analyses thématiques

Ce sont celles qui tentent principalement de mettre en évidence les représentations sociales ou les
jugements des locuteurs à partir d’un examen de certains éléments constitutifs du discours. Parmi ces
méthodes, on peut distinguer :

L’analyse catégorielle : la plus ancienne et la plus courante. Elle consiste à calculer et à comparer
les fréquences de certaines caractéristiques (le plus souvent les thèmes évoqués) préalablement
regroupées en catégories significatives. Elle se fonde sur l’hypothèse qu’une caractéristique est
d’autant plus importante pour le locuteur qu’elle est fréquemment citée. La démarche est
essentiellement quantitative.

L’analyse de l’évaluation : qui porte sur les jugements formulés par le locuteur. La fréquence des
différents jugements (ou évaluations) est calculée mais aussi leur direction (jugement positif ou

77
Frédérique HELIAS CNAM TET003 – 4. Analyser des données et interpréter les résultats

négatif) et leur intensité. La méthode n’est pas exhaustive puisque tout le texte n’est pas pris en
considération : seule la dimension des attitudes est prise en compte et seuls les énoncés exprimant
une évaluation sont soumis à l’analyse. Sur un thème donné, on pourra classer les jugements
exprimés par ordre d’intensité. Une information peut être neutre, favorable ou défavorable. Elle
peut se positionner sur une échelle de valeur bipolaire. Par exemple, on étudie l’image d’un produit
en reclassant tous les qualificatifs employés au cours de l’entretien pour le décrire.

4.2.3.2. Analyses formelles

Ce sont celles qui portent principalement sur les formes et l’enchaînement du discours. Parmi ces
méthodes, on peut distinguer :

L’analyse de l’énonciation : qui porte sur le discours conçu comme un processus dont la
dynamique propre est en elle-même révélatrice. Le chercheur est alors attentif à des données telles
que le développement général du discours, l’ordre de ses séquences, les répétitions, les ruptures de
rythme, les figures de rhétoriques, etc. Sont donc pris en compte les conditions de production de la
parole (qui parle ? de quoi ? à qui ?) et les éléments formels atypiques (par exemple les omissions,
failles logiques, silences, etc.).

L’analyse de l’expression : qui porte sur la forme de la communication dont les caractéristiques
(vocabulaire, longueur des phrases, ordre des mots, hésitations...) apportent une information sur
l’état d’esprit du locuteur et ses dispositions idéologiques. Ici, l’analyse rend compte des
particularités de l’expression : la sélection intentionnelle du matériel verbal et la combinaison
originale de ces mots. Elle tend à dégager ce qui est répétitif, ce qui peut être quantifié et ce qui est
original, propre à celui qui parle : (a. approche quantitative) Combien de fois tel mot ou telle
expression est utilisé ? (b. approche qualitative) Quel est/sont le/les sens particulier/s d’un mot,
d’une expression, d’un thème ? (c. approche comparative) Tel mot ou telle expression sont-ils
toujours employés par rapport au même thème ?

4.2.3.3. Analyses structurales

Les analyses structurales partent de l’idée que la fréquence à laquelle revient un mot ou un thème n’est
pas, en soi, un indicateur suffisant pour décrypter les significations d’un texte. Car un texte n’est pas
une somme d’éléments juxtaposés : il les articule et les « structure » d’une certaine manière et chaque
élément occupe une place qui peut être centrale ou non, quelle que soit sa fréquence. Le plus important
à étudier est donc la manière dont les éléments composant le texte sont agencés.

L’analyse des co-occurrences : qui représente une modalité relativement simple de l’analyse
structurale. Il s’agit d’examiner non plus les fréquences individuelles (ou occurrences) des thèmes
mais bien leurs associations (ou co-occurrences). Savoir quels thèmes sont systématiquement
associés dans les propos du répondant informe sur son univers culturel ou idéologique.

78
Frédérique HELIAS CNAM TET003 – 4. Analyser des données et interpréter les résultats

L’analyse structurelle proprement dite : elle va plus loin car elle vise à mettre au jour la structure
d’ensemble du texte, les principes sous-jacents d’organisation entre ses éléments, le système de
relations entre eux. L’analyse structurale s’intéresse notamment aux couples d’oppositions entre
éléments et à la manière dont ces couples d’oppositions s’articulent les uns aux autres pour former
des structures d’oppositions plus englobantes des éléments du texte, aux règles d’enchaînement
entre les éléments du texte, à sa trame et, plus largement, à tout ce qui structure le texte et y révèle
un « ordre » sous des propos qui, au premier abord, peuvent sembler désordonnés voire décousus.
Dans un entretien, l’ordre des thèmes abordés, s’il n’est pas volontairement induit par l’enquêteur,
est souvent un indice pertinent et utile à analyser. Si le thème A précède toujours les thèmes B et C,
il y a certainement une raison qui mérite d’être prise en considération. Par exemple, les personnes
peuvent évoquer l’ambiance de travail, le climat avant de parler des conditions objectives de
travail. Un individu parlera de son passé, de ses expériences antérieures pendant presque tout
l’entretien et expliquera très rapidement ses projets, ses désirs : le passé n’a pas laissé de place au
futur.

4.2.3.4. Avantages et limites

Toutes les méthodes d’analyse de contenu conviennent à l’étude de l’implicite.

Elles obligent le chercheur à prendre beaucoup de recul à l’égard des interprétations spontanées et, en
particulier, des siennes. Il ne s’agit en effet pas d’utiliser ses propres repères idéologiques ou normatifs
pour juger ceux des autres, mais bien de les analyser à partir de critères qui portent davantage sur
l’organisation interne du discours que sur son contenu explicite.

Portant sur une communication reproduite sur un support matériel (habituellement un document écrit),
elles permettent un contrôle ultérieur du travail de recherche.

Plusieurs de ces méthodes sont construites de manière très méthodique et systématique sans que cela
ne nuise à la profondeur du travail et à la créativité du chercheur, bien au contraire.

Certaines méthodes, comme l’analyse évaluative, sont très lourdes et laborieuses. Avant de s’y
engager, il faut être certain qu’elles conviennent parfaitement aux objectifs de la recherche et que l’on
dispose du temps et des moyens nécessaires pour les mener à bien.

Si l’analyse de contenu, prise globalement, offre un champ d’application extrêmement vaste, il n’en va
pas de même pour chacune des méthodes particulières dont certaines ont, au contraire, un champ
d’application très réduit. En réalité, il n’y a pas une mais des méthodes d’analyse de contenu.

Ainsi, il est souvent très utile et pertinent d’utiliser simultanément plusieurs méthodes, en fonction
des objectifs de la recherche, les unes comblant en effet les limites des autres.

79
Frédérique HELIAS CNAM TET003 – 4. Analyser des données et interpréter les résultats

4.2.4. Procédure pour la construction d’une grille de lecture

L’analyse de contenu comporte plusieurs étapes :

4.2.4.1. Lecture flottante

Elle demande d’abord une première lecture intuitive, flottante, une lecture ouverte où l’on se laisse
imprégner par toutes les idées qui jaillissent au fur et à mesure du discours. Cette première approche
est la phase-clé de l’analyse. Sans elle, il n’y a pas d’axe de recherche et donc de travail possible. Il
faut par conséquent laisser émerger les premières questions : que veut-on démontrer, comment le
démontrer ? Quels sont les éléments qui peuvent confirmer ou infirmer ces données ? Ces premières
interprétations sont à croiser avec les impressions ressenties au moment de l’entretien et notées sur le
guide comme les hésitations, les répétitions, les gênes de l’enquêté, etc.

4.2.4.2. Codage 1 : catégorisation

Laurence Bardin affirme : « Traiter le matériel, c’est le coder. Le codage correspond à une
transformation – effectuée selon des règles précises – des données brutes du texte »2. Elaborée par le
chercheur au contact de son matériau brut, la grille de lecture propose un codage des données en
faisant travailler simultanément : catégorisation (choix des critères) et recensement (extraction des
unités dans l’entretien).

Au fur et à mesure du premier dépouillement, le chercheur choisit et définit le plus précisément


possible les catégories ou les critères de son analyse en fonction de sa problématique et surtout de ses
hypothèses. Cette grille de lecture pourra bien entendu être modifiée et réajustée au cours des lectures.

Cela dit, l’agencement même d’un entretien, les questions qui y sont posées et les débats qui y sont
engagés supposent qu’une partie de ce travail de catégorisation ait déjà été faite par le chercheur, à
titre hypothétique naturellement, pendant la préparation de l’entretien. Au moment de l’analyse, il est
donc important de revoir son guide d’entretien avec un regard particulièrement critique. Car si le guide
d’entretien est un outil d’exploration visant la production de données, la « grille d’analyse » est un
outil explicatif visant la production de sens. Cette grille d’analyse n’est pas un décalque du guide mais
une version rationalisée parce qu’elle a été confrontée aux données. Cet outil met alors en relation des
analogies, causalités, ambivalences, négations, associations d’idées, redondances, silences, lapsus,
etc., autant d’éléments qui participent à la construction du sens et doivent être en tant que tels pris en
compte dans l’analyse. La « pré-catégorisation » doit donc s’attendre à être refondue à la lecture des
résultats. C’est du reste cela qui est intéressant, car si le travail de catégorisation ne consistait qu’à
reprendre les questions et à s’apercevoir que les types de réponses obtenues étaient toujours attendus,
cela signifierait presque que l’enquête a été inutile ou tout au moins qu’elle n’a servi qu’à étayer des

2
BARDIN Laurence, L’Analyse du contenu, Paris, PUF, 1989 (3e éd.), p. 134.

80
Frédérique HELIAS CNAM TET003 – 4. Analyser des données et interpréter les résultats

analyses antérieures ou encore que la façon dont elle a été menée n’a pas permis de faire apparaître
d’éléments nouveaux et constructifs.

Le chercheur définit alors une catégorie en étant avant tout attentif à sa matérialité textuelle :

- La réalité du mot, de l’expression : le mot est présent ou absent, le thème est abordé ou pas, le
personnage existe ou n’existe pas. Une unité de codage doit pouvoir être nettement identifiée sans
extrapolation possible.

- La pertinence : l’unité enregistrée éclaire les questions posées par l’étude et leur répond de façon
précise. Il faut que l’unité dise quelque chose sur la problématique.

- L’utilité : tout ne peut être classé dans un entretien pour d’évidentes raisons pratiques de temps et
de coût. Il faut faire un choix et concentrer l’analyse sur les éléments les plus essentiels, les plus
utiles.

4.2.4.3. Codage 2 : recensement

Pour permettre l’analyse, pour comprendre la logique de production du sens de l’enquêté, on va donc
rechercher et répertorier les unités de sens. Ces unités d’enregistrement peuvent être constituées d’un
mot, d’un groupe de mots, d’une phrase, d’un paragraphe. Rien ne doit être laissé à l’état de donnée
brute et les informations, même quand elles semblent aller de soi, sont à extraire. Il est important de ne
pas se contenter d’une exposition plate des données mais se dire que chaque mot, répétition, lapsus,
etc. a une valeur spécifique :

- Le mot : au niveau lexical, on essaie de repérer la nature des mots utilisés. Dans l’entretien, on
verra apparaître un lexique propre aux techniciens, aux juristes, aux économistes. On cherchera
alors à noter les termes les plus souvent utilisés : la personne possède un vocabulaire concret ou
abstrait. De quel champ de référence, de quelles expériences particulières relève-t-il ?

- Le thème est une unité de signification complexe, il constitue un noyau de sens : tout ce qui est dit
sur un point donné est rassemblé en un même thème. Par exemple, dans une enquête sur le travail,
on rassemblera sous des thèmes différents toutes les informations sur la tâche, l’organisation, les
relations, le climat, etc.

- Les personnages : un locuteur peut être choisi comme unité d’enregistrement. On identifie les
personnages : qui est évoqué dans le discours ? Avec quel rôle, quels attributs, quelles fonctions ?

- Les événements : tout ce qui se rapporte au temps, à la chronologie de l’action, peut figurer dans
une même rubrique. D’autres rubriques peuvent être utilisées pour le classement des informations
en fonction du but recherché. Elles tenteront de distinguer, de répertorier les données suivant des
questions fondamentales : qui ? quoi ? quand ? où ? comment ? dans quel contexte ?...

81
Frédérique HELIAS CNAM TET003 – 4. Analyser des données et interpréter les résultats

4.2.4.4. Interprétation

Réalisé en symbiose avec la problématique de la recherche, le codage sélectionne les données qui sont
confrontées aux hypothèses dans la dernière étape de la procédure analytique. C’est en croisant a
minima trois niveaux que l’analyse permettra au chercheur d’aboutir à une interprétation :

(a) formel et explicite : présence ou absence d’un mot ;


(b) implicite : l’analyse cherche à retrouver le sens du discours en travaillant sur les connotations, les
images, les symboles ;
(c) dynamique qui caractérise la façon dont le discours se construit, s’énonce. L’analyse essaie là de
suivre le cheminement de la pensée, la dynamique et l’enchaînement des séquences.

Car l’analyse de contenu est une étude particulièrement structurée qui opère à partir de données
qualitatives un traitement à la fois rigoureux et scientifique qui permet d’allier des analyses
quantitatives et qualitatives laissant ainsi la place à l’interprétation et à l’analyse personnelle du
chercheur. Le travail d’interprétation est un fonctionnement normal de la connaissance. Par
interprétation, il ne faut pas entendre une déformation de la réalité mais plutôt un effort vers la
construction de catégories d’intelligibilité (compréhension). Car l’homme ne « déforme » pas, au
contraire, il « donne forme » pour produire du sens et de la vérité (SA vérité !).

Il ne faut cependant pas perdre de vue les caractéristiques essentielles et/ou les qualités spécifiques du
discours. L’entretien repose en effet toujours sur la rencontre de deux subjectivités. De ce fait, toutes
les analyses aussi savantes soient-elles ne pourront jamais dépasser les imprécisions, les détériorations
du recueil d’informations. Une grille d’analyse aide seulement à mieux observer, à mieux écouter, à
devenir plus sensible, plus vigilant à certains aspects du discours. Elle ne dégagera jamais de
conclusions, de « vérités » définitives. La qualité du travail et des résultats importants et intéressants à
faire ressortir dépend donc de la qualité de l’analyste.

4.3. Repères pour l’analyse quantitative et qualitative des informations

Voici quelques questions à se poser pour vérifier la bonne marche de la procédure analytique :

 Pour l’analyse quantitative :

1) Quelles sont les variables impliquées par les hypothèses ?


2) Quelles sont les informations qui correspondent aux variables ou qui doivent être assemblées
pour décrire les variables ?

82
Frédérique HELIAS CNAM TET003 – 4. Analyser des données et interpréter les résultats

3) Comment exprimer les données pour bien mettre en évidence leurs caractéristiques
principales ?

 Pour l’analyse qualitative :

1) Comment organiser les éléments retranscrits ?


2) Comment les analyser en fonction des hypothèses et, le cas échéant, de la grille d’analyse ?
3) Selon quels critères construire la typologie ?
4) Dans quelle mesure les résultats obtenus correspondent-ils aux hypothèses ? Quels sont les
résultats qui ne concordent pas et comment les expliquer ?

83

Vous aimerez peut-être aussi