Télécharger au format docx, pdf ou txt
Télécharger au format docx, pdf ou txt
Vous êtes sur la page 1sur 29

CM1

Etude marketing
= analyse de données pour mieux comprendre une population définie
→ pour l’entreprise et pour les clients
→ une entreprise est confrontée à un pb (ex : baisse des ventes), le pb a plusieurs pistes d’analyse (ex :
baisse des ventes dues à l’image)
→ face à ce pb : appel à un institut pour tenter de répondre à la question ou possibilité de travailler au fee-
ling (mais…)
→ éléments nécessaires = des données
→ données =
- élément brut qui sert de base à un raisonnement
- Donnée qualitative = texte, discours, image, vidéo etc
- Donnée quantitative = chiffres, échelles de mesure, % etc
- Donnée interprétée = information
Etude qualitative
→ obj = exploration
= découverte d’un phénomène inconnu
= analyse en profondeur des comportements et attitudes
→ méthode type = entretien individuel avec 1 consommateur
→ données recueillies = discours

Etude quantitative
→ obj = description
= mesure/quantification d’un phénomène

→ caractéristiques d’une pop définie


→ méthode type = questionnaire
→ données recueillies = chiffres

Principaux cabinets d’études :

DÉMARCHE D’ÉTUDE
Place des études dans l’entreprise D

Déroulement d’une enquête

- Découpage en 4 grandes phases :


1. Préparation de l’étude
2. Le recueil de données (terrain)
3. L’analyse et l’exploitation des données
4. Synthèse des résultats et recommandations
→ remarque :
-

Déroulement d’une enquête quantitative :


1. Diagnostic d’études
Diagnostic d’étude = interne : rencontre avec les demandeurs de l’étude :
- affiner la compréhension des objectifs d’étude
- Délimiter le périmètre de la collecte de données
- Comprendre l’entreprise (façon de pensée, histoire etc)

2. Etude documentaire

→ recherche d’informations existantes :


- définir correctement la problématique de recherche
- Permet d’éliminer ce qu’on sait déjà, les hypothèses peu probables
→ remarques :
- allers-retours avec le commanditaire de l’enquête
= externe :
- connaitre l’environnement d’un marché
- Formuler des hypothèses (2 ou 3 seront testées)
- Résoudre un problème
→ les sources d’information pour l’étude documentaire
Info secondaires, insane greffe syndicats ca, vdm
4. Objectifs opérationnels

= dernière étape du diagnostic d’études : quels phénomènes je vais mesurer ?


→ décomposition de la problématique de l’entreprise en questions plus précises
→ représentent les différents axes de l’étude
→ son présentés sous forme d’actions :
- décrire, mesurer, comprendre…

→ objectif descriptif / objectif exploratoire :


EXEMPLE :
→ voir autre exemple cours cm1

CM2 : RÉALISER UN QUESTIONNAIRE

L’ENQUÊTE PAR QUESTIONNAIRE


→ Principes :
- description d’un phénomène (comportements, habitudes, préférences)
- Analyse des résultats via des méthodes stat (stat descriptives, tris croisés etc)
- Basé sur un échantillon représentatif
→ Intérêts de la méthode
- validité externe (+ représentatif qu’une étude quali)
- Simple à mettre en oeuvre
- Efficacité (résultats concrets)
→ Limites
- présence potentielle de très nombreux biais
- Ne permet pas de comprendre mais simplement d’observer
- Parfois solution de simplicité
→ contraintes
- traduire les information à récolter en une série de questions
- Les répondants doivent répondre sans ambiguité
- Impliquer le répondant du début à la fin et éviter les non-réponses
- Minimiser les erreurs de réponse (imprécisions, incompréhension etc)
Principales étapes pour un questionnaire :

L’ÉCHANTILLONNAGE :

→ définition de l’individu statistique :


- une personne physique
- Un foyer (chef de famille, responsable des achats etc)
- Une entreprise ou une autre entité
Ex : les ménages français ayant au moins 1 enfant

→ représentativité :
- reproduction la plus fidèle possible de la population mère
- Selon les critères considérés importants pour
→ objectifs :
- extrapoler les résultats de l’enquête à l’en-
→ contraintes :
- souvent, peu de connaissances sur la popu-
lation cible
Méthodes d’échantillonnage :

→ méthodes aléatoires :
- il fait disposer d’une liste exhaustive des individus de la population (base de sondage de taille N)
- Chaque individu a une probabilité 1/N de faire partie de l’échantillon
- Selection des individus par un tirage aléatoire ou par tirage systématique (ex : tous les 10 numéros)

→ Méthodes empiriques :

- relèvent de l’expérience
- Résultent d’un choix résonné (subjectif) des individus
-
→ voir ex d’application CM2

LA FORMULATION DES QUESTIONS

Objectifs du questionnaire
→ traduire les infos en une série de questions auxquelles les participants peuvent répondre
→ etre motivant et encourageant pour impliquer le répondant du début à la fin et éviter les non réponses
→ minimiser les erreurs de réponse (imprécisions, incompréhension ou mauvaise compréhension, biais etc)
Informations à récolter

Administration du questionnaire

Longueur du questionnaire

→ pas de solution unique : il faut trouver le bon équilibre


→ arbitrage dans le nombre de
questions :
- cette question est elle néces-
saire ?
- Pour l’info recherchée une seule
question suffit elle ?
- La personne interrogée pourra-t-
elle fournir l’info exacte ?
Les types de questions :

1. Questions ouvertes :
→ question ouverte type numérique :
- quel âge avez vous ?
- Combien d’enfants à charge avez vous ?
→ question ouverte type littéraire :
- quelle est votre profession ?
- Quelles sont, selon vous les caractéristiques du produit les + importantes ?
2. Les questions fermées :
→ question fermée dichotomique :
- connaissez vous la marque x ? oui/non
- De quel sexe êtes vous ? homme/femme
→ questions à choix multiples :
- à réponse unique : quelle est votre situation familiale ? celib/couple/marié etc
- À réponses multiples : quelles sont les marques de cosmétiques que vous connaissez ?

Les échelles de mesure

→ principe
= réponse ordonnée selon une mesure spécifique

→ points neutres :
- pour les échelles impaires (5pts,7pts)
Ex : ni d’accord ni pas d’accord
- inerte : « porte de sortie) pour les questions complexes ou personnelles
- Contrainte : diminue la variance (souvent réponses au milieu)
- Équivalent du NSP
(ne se prononce
pas dans les ques-
tions fermées

→ échelles non com-


paratives :
= osgood, graphique,
stable icones, likert,
thurstone

→ échelles comparatives
= rang, paire, somme constante

Formulation des questions :

→ toujours se mettre à la place du répondant :


Comprend-il la question ? Est il capable de répondre ? La réponse propose t elle toutes les modalités pos-
sibles ? Peut il souhaiter ne pas répondre ?
→ le répondant vous rend service donc ne lui compliquez pas la tache
→ éviter les termes techniques
→ éviter les mots ambigus
→ éviter les sous entendus (ex : aimez vous prendre l’avion? On doit mettre quel mode de transport préférez

vous ?)
→ éviter les généralisations/estimations
→ utiliser des formulations positives et négatives
→ délimiter le problème :
→ voir ex cours cm2 : problèmes dans la formulation des questions/dans l’interaction des questions/ dans la
réponse

→ pb dans la réponse :
- désidérabilité sociale = répondre pour donner une bonne image de soi
- Ye saying (nay saying) = tendance a donner des rep positives ou neg
- Extrémisme = tendance à utiliser les points extremes d’une échelle
- Centrisme = tendance à utiliser le point neutre
STRUCTURE DU
QUESTIONNAIRE

Présentation de l’enquête :
→ intéresser/motiver le répondant
→ ne pas mentir/ne pas trop en dire

Questions qualifiantes :

→ fairele tri parmi les répondants


- déterminent si la personne possède l’info
- Orientent vers des parties spécifiques
- Déterminent un état ou comportement précis (utile pour les ana bigarrées)
Questions de mise en route :

→ mesures basiques du sujet traité :


- comportements et connaissances
- Permet de comparer à des études déjà réalisées
Questions spécifiques :
→ donne l’info précise recherchée
- le coeur du questionnaire, motivation, freins, opinions, jugements
Identification du répondant :
→ signalétique :
- caractéristiques du répondant : variables socidémo, psycho
→ ne pas demander des infos inutiles

Organisation en thèmes :
→ du + général au + précis
→ garder une cohérence entre les thèmes
→ il ne faut pas profiter d’une enquête par questionnaire pour interroger sur tout et n’importe quoi

Questions spéciales :
→ question filtre = orienter le répondant (si non allez question x)
→ question piège = tester l’honnêteté (connaissez vous..)

Prétest :
= pour vérifier le questionnaire :
→ vérifier sa compréhension s’il manque des questions, le choix des modalités, le temps etc

CM3 ANALYSE UNIVARIÉE & BIVARIÉE

QUALITÉ DU QUESTIONNAIRE

1. Nettoyer le questionnaire
2. r
e
(
c
o

der) les réponses


3. Vérifier la structure de l’échantillon interrogé

Codage :

LES DIFFÉRENTES TYPES DE VARIABLES



qualitative nominale, qualitative ordinale, quantitative

3 types de
variables :
univariée,
bivariée,
multivariée

VARIABLES UNIVARIÉES

= 1ère étape de l’analyse des résultats


→ donne les réponses moyennes de la pop, décrit les grandes tendances

Fonctionnement :
→ question par question au brouillon
→ chercher les convergences/divergences dans les résultats
→ NE PAS CHERCHER UNE EXPLICATION DANS LES RÉSULTATS

Différents traitements statistiques :

Analyse variable quali-


tative nominale :

→ diagrammes en ba-
tons ou diagrammes en
secteurs (camenbert)
pour les réponses à choix
uniques

Analyse d’une variable


qualitative ordinale :

→ utilité des variables ordinales :


- regrouper des modalités (ex : neg vs positives)
→ médiane et fractiles :
- médiane = découpage de la pop en 2 groupes de taille égale
- Fractale = découpage de la pop
en n groupe de taille égale

Analyse d’une variable numé-


rique

→ toutes les stat : mé-


diane, moyenne, écart
type
→ possibilité de recol-
ler en classes (numé-
rique, ordinale)
→ variable la + riche
mais la + complexe à
analyser

ANALYSE BIVARIÉE

= croisement entre 2 variables


- relation entre les variables ? Intensité de la relation ? Direction de la relation ?
→ réalisation d’un test statistique

Problématique :
→ on s’interroge sur la pertinence des croisements avant de faire la pb

Choix des variables :


→ selon les obj de l’enquête, en fonction des résultats univariés, à partir de l’étude doc
→ au minimum = il faut croiser les réponses avec les variables sociodémo

Principe d’une analyse bivariée :


→ hypothèses =
- Le lien peut être +, - ou incertain
→ hypothèses généralement implicites (non formulées)
→ NE JAMAIS CHERCHER D’EXPLICATIONS DANS LES RÉSULTATS

Réalisation d’un test statistique :


Etapes :

Les différentes analyses bivariées :

(tri croisé, test chi2, variance, fisher, regression, coefficient de corrélation)

TEST CHI2

→ croisement de 2 variables NOMINALES (ou ordinales)


→ min 5 rep
→ comparer les valeurs pour la variable sommée à 100%
TEST DE FI-
SHER :

→ croisement
entre variable
NUMÉRIQUE et
variable NOMI-
NALE
→ comparaison
des moyennes
pour les diffé-
rents sous
groupes
→ variable no-
minale = sert de
découpage

COEFFICIENT DE CORRÉLA-
TION
CM4 ANALYSES MULTIVARIÉES

OBJECTIFS ANA MULTIVARIÉES :

1. Réduire le nombre de variables initiales


2. Simplifier l’analyse
3. Synthétiser l’info en sortie

CONTRAINTES ANALYSES MUTLIVARIÉES :


→ pas de traitement automatique et pas de résultats uniques
→ choix de l’analyste et donc part de subjectivité
→ bcp de rigueur

ANALYSE :

→ méthode DESCRIPTIVE ou EXPLICATIVE



va-

riables numériques nominales ou ordinales

1. ANALYSE EN COMPOSANTES PRINCIPALES


Objectifs :
- regrouper les variables en « meta variables » (facteurs, composantes ou dimensions)
- Comprendre la signification de ces composantes
Arbitrage :
- réduire au mieux les variables
- Tout en perdant le moins d’infos possibles
Contraintes :
- Seulement variables métriques
- Qui forment un ensemble cohérent
- Variables comparables avec peu d’observations manquantes
Part de subjectivité :
→ dans le nb de variables à intégrer, dans le choix des variables à intégrer, dans le nb de composantes, dans
le

nom des compostantes

ETAPES ANALYSE EN COMPOSANTES PRINCIPALES :

SI ON A PAS LES MEMES UNITÉS DE VALEUR : ex : chômage, pop, superficie etc


1. (xi - X)/S

Ex : (population - moyenne de la pop)/équart type

= permet de redimensionner les moyennes = centrer-réduire


= les données ont donc la même valeur pour comparer les variables entre elles
= courbe en cloche

2. Calculer la matrice corrélation = 1ER TRI dans les variables qui sont regroupantes

→ croiser toutes les données entre elles, 2à2, = pour les regrouper entre elles
Ex : corrélation entre entreprises et chômage, entre chômage et pop active etc
→ coefficient de corrélation = entre -1 et 1
→ si c’est -1 = peu de lien, corrélation neg, varie dans le sens inverse,
ex = si le chômage AUGMENTE de 1 unité la pop active DIMINUE de 1 unité
→ si c’est +1 = fortement corrélé : AUGMENTE donc AUGMENTE ou DIMINUE donc DI-
MINUE
Ex : on lit de colonne à ligne

4. Calcul des combinaisons linéaires


= part de la variance expliquée par chaque variable
→ dimension = composante
→ si on réduit les 7 variables (ex: chômage, entr, pop, brevets, superf, tel) pour faire 1 seule di-
mension on va expliquer 59% de tout ce qu’on a observé (informations), je conserve 59% mais j’en
perd 41%
→ si on les réduit en 2 dim on va observé 86% de l’information, si on prend 3 dim = 95% etc (cu-
mul)
→ si on en fait qu’une seule = 100%, = « moyenne »
→ arbitrage entre la précision de l’analyse et le nb de donnée que j’ai à traité

→ comment choisir le nb de dimension : VALEUR PROPRE (% de variance) = valeur de chaque


dimension : si elle est >1 on la garde mais si elle est <1 on l’enlève

A FAIRE
5. Choisir les composantes principales (avec la valeur propre)
→ + la variance est élevé + la valeur propre est élevée
→ avec critère de Kaiser : valeur propre >1
→ ou avec test du coude (tracé d’effondrement, screen plot) : dans un graphique on va chercher la
« cassure » entre les variables = point auquel on peut s’arrêter dans le choix des dimensions
Ex : sur le graphique la cassure est après la 2e dimension, elle a une valeur propre a peu près =1
donc il faudrait peut être garder la 3e dimension (cela pourrait être pénalisant pour l’analyse), on
choisi finalement d’en garder que 2 (pour réduire le % d’erreur)
→ il faut qu’on soit capable d’expliquer MIN 50%

6. Interprétation/signification des composantes = NOMMER LES DIMENSIONS


→ savoir quelles variables sont corrélées entre elles
→ savoir que signifie cette relation
→ on appelle ces données les scores
→ si >1 = fortement reliée
ex : entr = 0,98>1 donc le score entr est fortement reliée avec la dim 1
ex : pop active et chômage ont une relation en commun = elles sont sur la même dimension MAIS
elles sont en interprétation opposées : quand 1 augmente l’autre diminue
ex : ce tableau ne nous dit pas si par ex les entr>superf : ça nous dit seulement que ces variables
peuvent être regroupées en 2 dimensions = veulent dire la meme chose
→ signification des dimensions :
Ex : dimension 2 = a 2 variables (pop active et chom) = peut renvoyer à l’attractivité/dynamisme
des régions
Ex : dimension 1 (entr, tel, pop, brevets, superf) = peut renvoyer au potentiel d’activité de la région
(en opposition avec la dim 2)
= ça nous permet de comparer les régions selon les 2 dimensions = bcp plus facile = on aurait 1 axe
sur le graphique qui mesure l’attractivité et 1 axe qui mesure le potentiel d’activité
→ on SUPPRIME les variables >0,5 (celles neg aussi, par ex on garde -0,97)
7. Graphiquement :
→ 1 graphique = MAX 2 dim (si + de 2 dim on fait plusieurs graphiques)
Ex : si on a 50 variables qui traitent du meme sujet = 1 dim = 1 graphique
Ex : si on a 50 variables qui traitent de 10 sujets = 10 dim = 5 graphiques
→ la dim 1 = la + forte = HORIZONTALE/ dim 2 = VERTICALE (ordonnée)
→ + on la ligne est proche du cercle + elle contribue à l’axe = + elle a un pouvoir explicatif
Ex : pop act, chom = très proche du cercle = contribue bcp à l’axe de la dim 2 (pareil pour les lignes
vertes dim 1 sur ce schéma)
→ + une ligne est proche de l’axe + elle est corrélée à la dim
ex : superf = un peu éloignée de l’axe = pas très contributrice dans les infos = info pas très
importante (confirmé par le tableau : 0,67, score faible par rapport aux autres)
→ on passe de 7 à 2 dimensions (variables) = on a conservé 86% de l’info = on a 86% de pouvoir
explicatif (= il y a 14% des infos qui ne sont pas utile)
→ il faut qu’on soit capable d’expliquer MIN 50%

8. Représenter graphiquement les individus


(Ex : individu = region)
→ ils ont chacun un score pour chaque dim
→ les rajouter a la main (nuages de points sur Excel)
Ex : dim 1 = chaque entr aurait un score selon le potentiel d’activité (en fonction du nb de brevet,
du nb d’entr etc, toutes les lignes vertes en gros)
Ex : dim 2 = pareil : score + ou - élevé selon les régions (en fonction de leur nb d’habitants, du nb
de chômeurs)
Ex : l’entreprise doit ‘implanter en Rhones alpes

EX 2

→ On garde que les variables en gras (car >0,5)


→ dim 1 = variables 6,7,8,9,11 = renvoient à l’appréciation du film, la satisfaction de la sortie
→ dim 2 = variables 2,3,5 = renvoient à la qualité de la séance (confort image, son etc)
→ dim 3 = variables 1,4 = renvoient aux nuisances de la séance, mesure de l’insatisfaction

= analyse de la satisfaction vis a vis du film (1) de la salle (2) de la foule présente (3)

2. ANALYSE FACTORIELLE DES CORRESPONDANCES = AFC

OBJECTIFS DE L’AFC :

→ simplifier les données initiales


→ représenter les relations entre les 2 variables
→ la signification des axes n’est pas importante

Attention :
AFC = on croise 2 variables (= tri croisé graphique)
AFM = analyse factorielle multiple (au moins 3 variables)
Etapes AFC :

→ sert à simplifier les données et à créer des relations entre 2 variables


→ les axes n’ont pas d’importance ici → on cherche la distance/proximité entre les points
→ AFC = QUE 2 VARIABLES → (AFM = MIN 3 VARIABLES)

→ on regarde les tableaux de fréquence en ligne et en colonne


→ puis on représente graphiquement
→ plus on interprète = CE QU’ON DOIT FAIRE NOUS

EX :

→ on croise 2 variables : fidélité à la lessive (fréquence d’achat) et tranche d’âge


→ variance = inertie

1. TABLEAU

→ on réduit les données

2. GRAPHIQUE

→ modalités de variables (pas les chiffres mais la signification des valeurs = choix du question-
naire)
→ ETRE LE + ÉLOIGNÉ DU CENTRE : + on est éloigné du centre plus on a une association
avec une dimension
→ les données près du centre = sont peu associé à un axe (ex : 35-44ans)
→ on regarde si les modalités sont éloignées ou proches

3.INTERPRÉTATION

1. on sélectionne le score le + élevé sur chaque dimensions (à partir des tableaux) = les 2 plus
grandes variables de chaque tableau
→ on va regarder les modalités de la variable 1 associée ou non aux modalités de la variable 2
Ex :
Dim 1 : catégorie 60ans et + est associée à la dimension 1
15/19 ans est associée à la dimension 2
Dim 2 : la modalité « systématiquement » est associée à la dimension 1
la modalité « la plupart du temps « est associée à la dimension 2

2. on va regarder si la variable 1 est associée aux modalités de la variable 2


Ex : variable 60ans et + (modalité de la dim 1) est associée à la variable « systématiquement »
(dimension 1)
15-19ans est associée à la variable « la plupart du temps »

3. mais attention : il faut regarder sur le graphique si ces variables sont proches
(Ex : regarder si 60ans et + et « systématiquement » sont proches = ont la meme signification )

→ les 60 ans et + et « systématiquement » sont très proche (elles sont sur le meme axe) donc sont
associés/ corrélés = les 60 ans et + rachètent systématiquement leur lessive
→ a l’inverse : les 15-19ans et « la plupart du temps » sont très éloignés (pas sur le même axe) =
pas associés = ils sont fortement opposés (la plupart du temps) au rachat de leur lessive
→ on remarque que le « jamais » est très proche du 15-19ans = on en déduit que les 15-19ans ne
rachètent jamais (ou très rarement « la plupart du temps » ) la même lessive (= ne sont pas fidèles)
EX : savoir ce que pensent les gens d’un packaging de champagne

→ 3 packaging
→ questions ouvertes : 25 mots
= variable 1 : A,B;C (nominale)
= variable 2 : 1,2,3…25 (métrique)
→ petits traits fins = données

→ avec 25 mots on arrive à trouver une thématique globale pour les 3 packaging

→ ex : packaging complexe (= 1ere varible) très associé à attractif, coloré, inovant / packaging
simple (1ere variable) = associé à tout ce qu’il y a dans le cercle rouge etc
→ traditionnel et familial = pas associé avec une des variables
les mots pas relis = termes peu fréquents
TYPOLOGIE (classification) pour ACP et AFC

→ on a regroupé les variables (colonnes) mais pas les individus


→ on va donc essayer de les regroupé (on va regroupé les lignes = les individus)
→ il faut faire des groupes de personnes qui se ressemblent et qui soient différents entre eux
→ à partir d’un nuage de points on va représenter les individus
→ dans les ronds les individus se ressemblent/ et donc sont différents des autres ronds

Vous aimerez peut-être aussi