Cours ESM

COURS
EXPERTISE STATISTIQUE EN MARKETING
1. Objectifs pédagogiques
 Identifier le bon test statistique à réaliser compte tenu de la problématique managériale

marketing
 Opérer des tests statistiques sur le logiciel JAMOVI
 Savoir interpréter les outputs des tests statistiques
 Proposer la bonne décision managériale à prendre suite aux résultats des tests statistiques
2. Contenu du cours ESM
1) Manipulation de JAMOVI et préparation des données

2) Test de Khi-deux
3) Test de Pearson
4) Test de Spearman
5) Test de comparaison de moyennes sur échantillons indépendants
6) Test de comparaison de moyennes sur échantillons appariés
7) Test d’ANOVA un facteur
8) Test de régression linéaire simple
9) Test de linéaire multiple
10) Test de régression logistique
 Volume horaire : 20h

 Agenda du cours : fin en principe le 17 mars
 Évaluation : Examen final classique -> partiel
Pour les variables qualitatives, je ne peux calculer que les fréquences.

Variable nominale -> on ne peut pas calculer la moyenne, la médiane etc mais juste les
fréquences
I- Manipulation de JAMOVI et préparation des données
 Importer base « open »

 Faire ajustement notamment sur types de variables dans onglet « variables ». Double
cliquer sur chaque variable pour changer type ou autre ( voir questionnaire de base).
« Description » c’est pour écrire la question mais pas obligatoire
 Traitement données -> onglet « analyses » , « exploration », « descriptives »
On choisit les variables auxquelles on s’intéresse pour les décrire . Exemple : on s’intéresse à
la variable âge
Descriptives « variables across
columns »
Interprétation : 25% des répondants ont moins de 20 ans

Plus l’écart type est élevé, plus les variables sont hétérogènes : standard deviation 7,48
 Pour avoir graphique -> plots « histogram »
C’était pour les variables quanti
Pour les variables quali -> faut tout découcher, écart type, médiane, moyenne -> pas de
sens de le calculer pour variables quali. Par contre on peut cocher « frequency tables »
La majorité des valeurs s’approchent de la moyenne. On peut utiliser la moyenne comme
indicateur de comparaison.
La moyenne n’est pas toujours un indicateur de comparaison !
La distribution suit-elle un loi normale ? Oui
Les premiers indicateurs peuvent êtres représentes graphiquement sous forme de boite
à moustache. C’est un graphique très intéressant qui synthétise ces informations.
Plot < Box plot (boite à moustache)

3. Analyses préliminaires sur les données
 Boites à moustaches : représenter plusieurs indicateurs sur un seul graphique – min et

max de la série
- 3e quartile
- médiane
- 1er quartile
- valeurs extrêmes
Obj : capacité a combiner plusieurs variables
La ligne inférieure c’est le 1er quartile

La ligne supérieure de la boite est le 3e quartile
= Boîte qui vient décrire de manière statistique et visuelle l’ensemble des variables
descriptives
VOIR SLIDE
On peut modifier les titres de la boite à moustache en allant dans Edit
Pour les variables qualitatives (nominales et ordinales)

Cliquer sur « frequency tables » pour avoir les %
Les 3 points verticaux en haut à droite pour changer couleur par ex
Pour rajouter les packages, il faut aller dans « module » < manage installed
Quand on croise 3, 4 ou 5 variables et qu’on s’intéresse à une variable quanti, je pourrai

utiliser les boîtes à moustache.
Comment faire un score moyen par ex
Data < compute
Tests statistiques
Transformation de variables
Data < transform

Using transform < Add recode condition
puis changer type de variable à nominale
Filtrage
Data < filters

Peut être activé ou désactivé, et même supprimé et caché
Erreur dans le 2e point « 18 à 24 ans »
1)
2)
3)
<= car « non satisfait »
Puis je cherche dans Analyse < exploration < descriptive < montant de la commande
Rattraper 3 cours !
7. Test de régression linéaire simple
 Ce test vise à examiner l’existence d’une relation de cause à effet entre une variable
indépendante quantitative et une variable dépendante quantitative
 Ce test permet de modéliser une relation linéaire entre deux variables à l’aide d’une
équation mathématique : Y =a x+b
 Elle indique si la variable indépendante explique une partie de la variable dépendante
Exemples :
 La satisfaction des clients a-t-elle un effet positif sur la part de marché ? Si oui, de
combien la part de marché peut augmenter lorsque le niveau de satisfaction augmente
de 1 point ?
La
satisfaction La part de
marché
Exemple : la satisfaction globale influence-t-elle l’intention de revenir au restaurant ?

Étape 1 :
 D’abord, il faut analyser s’il y a un effet de la variable indépendante sur la variable

dépendante. Pour cela, il faut interpréter les résultats du test F
 Nous constatons dans le tableau ci-dessus qu’il y a une relation statistiquement
significative entre la variable dépendante (l’intention de revenir) et la variable
indépendante (satisfaction). La satisfaction explique significativement l’intention de
revenir au restaurant
Étape 2 :
 R² (R-deux) indique la proportion de variance totale de l’intention de revenir expliquée

par la satisfaction globale
 La satisfaction explique 1,69% de la variabilité de l’intention de revenir au restaurant
 Il est compris entre 0 et 1
 R² = 0 : la variable indépendante n’explique rien
 R2 = 1 : la variable indépendante explique complètement Y

Étape 3 :
 La satisfaction a un effet significatif et positif sur l’intention de revenir au restaurant
 Y = a X + b avec a = coeff non standardisé 0,2
 L’intention de revenir = 0,200 (coeff non standardisé) satisfaction + 3,913
 Si la satisfaction augmente de 1 point, l’intention de revenir augmente 0,2 point
8. Test de régression linéaire multiple
 Ce test vise à expliquer la variance d’une variable dépendante à l’aide d’une combinaison
de plusieurs facteurs explicatifs (variables indépendantes)
 Ce test permet de modéliser cette relation linéaire à l’aide d’une équation
mathématique :
Y =a1 x 1 +a 2 x 2+ an xn +... b
Exemple :
 Est-ce que la part de marché varie en fonction du niveau de satisfaction des clients, du
nombre ……
Exemple : Dans quelle mesure, la satisfaction vis-à-vis des prix pratiqués, de l’efficacité du
personnel, de la facilité à trouver de l’information influencent-ils l’intention de revenir au
restaurant ?
Premier tableau à analyser : Model
Étape 1 :
 Nous constatons ci-dessus qu’il y a une relation statistiquement significative entre

intention de revenir et les variables indépendantes (satisfaction vis-à-vis des prix
pratiqués, de l’efficacité du personnel, de la facilité à trouver de l’information).
Étape 2 :
 8% de l’intention de revenir au restaurant est expliquée par la combinaison de trois

variables : la satisfaction vis-à-vis des prix pratiqués, l’efficacité du personnel et la facilité
à trouver de l’information
Étape 3 :
Regarder la sig de chaque variable

Regarder si c’est posi ou nega
On voit que
 La satisfaction de l’efficacité du personnel a un effet significatif ET positif sur l’intention
de revenir au restaurant
 La satisfaction de facilité de trouver l’information a un effet significatif MAIS négatif sur
l’intention de revenir au restaurant => plus gens ont facilité de trouver infos moins ils
auront intention de revenir au resto
 La satisfaction de prix a PAS un effet significatif, aucun impact sur l’intention de revenir
au restaurant
DONC : combi de 3 facteurs est significatif mais la satisfaction du prix à elle seule n’a pas un
effet significatif sur intention
 Quelle est la variable qui explique le plus l’intention de revenir au resto ?

Regarder la valeur de Beta la plus élevée ici │Bêta│ = │0,2547│ > │-0,1701│
=> efficacité du personnel est celle qui explique le plus intention de revenir au resto
Pour améliorer modèle : on sort la variable qui n’est pas significative : ici c’est la satisfaction
prix
9. Test de régression logistique
 Ce test vise à tester un modèle de régression dont la variable dépendante est nominale
(dichotomique) et dont le(s) variable(s) peuvent être quantitative(s) ou qualitative(s).
 Ce test permet de prédire la probabilité qu’un événement survienne ou non en fonction
de(s) variable(s) explicative(s)/prédictive(s)
Exemples :
 Est-ce que la note de techniques d’enquête en management, la note de marketing, l’âge
de l’étudiant permettent de prédire la réussite ou l’échec à l’examen d’expertise
statistique en marketing ?
 Est-ce que le revenu, le lieu d’habitation et la taille du foyer permettent de prédire le
défaut de remboursement ? Ces variables permettent-elles de distinguer les mauvais des
bons emprunteurs ?
 Est-ce que la CSP, le lieu d’habitation, l’âge et le degré de respect des gestes barrières
permettent-ils de prédire la probabilité de contracter la Covid-19 ?
Exemple : Est-ce que l’âge du client et le montant de la commande permettent-ils de prédire

la probabilité d’insatisfaction ou de satisfaction envers le restaurant ?
 Nous pouvons dire que le modèle permet de prédire significativement la probabilité
d’insatisfaction ou de satisfaction envers le restaurant
 L’âge affecte négativement la chance d’être satisfait envers le restaurant. Plus le client
est âgé, plus la chance d’être satisfait diminue.
 Le montant de la commande ne permet pas de prédire la probabilité d’insatisfaction et
de satisfaction envers le restaurant
Application (demander qq)
Le manager du restaurant vise à expliquer certains réactions et comportements de ces

clients. Il se pose, ainsi, les questions suivantes :
 Dans quelle mesure la satisfaction envers la rapidité du service et la satisfaction vis-à-

vis de l’amabilité du personnel influencent-elles l’intention de retour au restaurant ?
(demander à quelqu’un)
Jamovi < Regression < Linéraire

(pas tout à fait les
mêmes données que le prof)
Il existe une relation statistiquement significative entre x et x et x et x, car P inférieur ou égal

à 0,1 (strictement inférieur à 5%).
R carré = 0,0587 : L’amabilité du personnel, et la rapidité du service expliquent 5,87% de la

variance de l’intention de revenir
2e tableau : coefficients
Les résultats du tableau 2 montrent que l’amabilité du personnel a un impact significatif et

positif sur l’intention de retour au restaurant car P < 0,001 soit inférieur à 5%. Et positif car
bêta (Estimate) est positif (0,2091). Autrement dit, plus le personnel est aimable, plus les
consommateurs ont l’intention de revenir au restaurant.
Les résultat du tableau 2 montrent que la rapidité du service n’a pas d’effets significatifs sur
l’intention de revenir au restaurant.
 Est-ce que la satisfaction globale, l’âge du client, la proximité du domicile permettent

de prédire l’intention de revenir ou non au restaurant ?
Pour répondre à cette questions il convient de réaliser un test de corrélation statistique car il
s’agit de tester la relation prédiction entre plusieurs variables indépendantes, et une variable
dépendante de nature qualitative dichotomique.
Il faut transformer la variable intention de revenir

Analyse < regression < logistique binomial
Les résultats du tableau 1 montrent que la combinaison permettent de prédire

significativement l’intention de revenir ou non au restaurant car P est inférieur à 5%.
R deux Mcf = 0,120 : cela signifie que …. ?
L’âge a un effet significatif sur l’intention de revenir au restaurant car P = 0,005. Cela signifie
que l’âge permet de prédire l’intention de revenir, plus précisément il ressort que plus on est
âgé, moins la probabilité de revenir au restaurant est forte et vice-versa.
 Le montant de la commande dépend-il de la situation de la consommation (client seul

vs client accompagné) ?
 Y a-t-il un lien entre l’âge du client et sa fréquence de visite du restaurant ?
 Quelle proportion de la variance de la satisfaction globale est expliquée par le niveau de

satisfaction moyen envers le personnel (amabilité, efficacité et apparence) ?
Rattraper dernières q
Pour ajouter des packages : analyses<modules+ < bilbiothèque jamovi < flexplot et jjstatplot
Pour utiliser ses packages, pas d’espaces et pas de caractére spéciaux
JJSTATPLOT
Analyses < jjstatplot < exploration : dans variables Temperature -> split by Sexe -> box flots
(boite à moustache)
1er graphe
JjstatPlot < Histogram < Variables Age > Split By Sexe
Il est intéressant de croiser les variables, dans cet exemple 3 histogrammes, un pour les
hommes un pour les femmes et un selon la population totale en fonction de l’âge.
Dans Plot>values on Bars on peut changer à « proportion » pour mettre % ou alors mix pour
avoir effectif et proportion
Comme je croise variable une variable quanti avec quali, on nous donne le résultat du test T
qui peut être également intéressant => Femme, moyenne 30 ans et hommes ?, différence
significative
Analysis < Measure < moyenne ou médiane selon ce que l’on cherche
2e graphe- Matrice de corrélation
JJstatPlot < Correlation Matrix < sélectionner les variables quanti que l’on souhaite (ici
caractéristique environnement de vente donc est-ce que lien entre agencement et facilité de
déplacement ? ou alors entre ressenti plaisir et musique ?) < Dependent variables :
temperature, musique, lumiere, accesibilite, deplacement, agencement
Autre graphe pour s’intéresser à la relation entre variable quanti et quali ou alors plusieurs
variables quali
JJstatPlot > Box Violin Plots to compare between groups
La variable de dépendance est la température en ordonné et sur l’axe des abscisses on a les
différentes catégories de CSP avec entre parenthèses l’effectif de chaque groupe.
L’information la plus importante est de voit la moyenne -> les points rouges, plus ils sont
hauts plus ils sont importants. Ceux qui apprécient le plus la température est la CSP+ avec
4,19 de moyenne.
A l’intérieur des violons on a une boite à moustache. Le trait qui coupe la boite est la
médiane. Le trait supérieur de la boite est le quart type 3 et le trait inférieur est le quart type
1.
Si on prend le premier diagramme, on voit que le diagramme est large au niveau de la

moyenne, cela veut dire qu’il y a beaucoup de répondants. Plus il est large, plus il y a de
répondants. La plupart des répondants de la CSP+ ont répondu ?. Pour la CSP- c’est large au
niveau du quart type 1, la plupart des résultat sont au niveau de 2,5.
On sait qu’on a une moyenne de 4,19 mais la tendance est atour de la moyenne, pour le 2 e,
la majorité de la réponse est de 2,5/3.
On peut multiplier ce graphe, en le divisant selon une autre variable. Ici sexe
Dernier graphe de Jjstat pour croiser deux variables quali et PAS DE QUANTI !!
Jjspot < Bar Charts

Entre variable CSP et sexe
Test de Khi 2 n’est pas significatif donc pas de différence significative entre hommes et
femmes en terme de proportion
Ce qui est intéressant est d’aller plus loin en croisant 3 variables quali : par exemple
répartition des clients selon moments de la journée
A midi, les visiteurs que ce soit hommes ou femmes -> CSP-
Le soir on a les inactifs et les CSP+ que ce soit hommes ou femmes
En revanche, on a une surreprésentation de CSP+
FLEXPLOT
Fait la même chose JjSpotPlot mais moins riche. Mais son avantage comparatif est l’étude de
l’effet de régression.
FlexPlot < General Linear Model pour étudier relations de cause a effet des variables
Variables de nature quanti !
Y-a-t-il Lien entre agencement et plaisir ?
On fait généralement des nuages de points
Variable indépendante sur l’axe des abscisses ici agencement et la variable dépendant sur
celle des ordonnées ici plaisir
Graphic options < Fitted line < changer à Regression
Interpréter les résultats sur la base du graphique au partiel!
Première chose à voir : Quelle est la variable dépendante et indépendante ?

On s’intéresse entre la relation de cause à effet entre agencement du point de vente et le
plaisir du ressenti.
Les points représentent des individus et les coordonnées sont les réponses.
Ce qui nous intéresse le plus est la droite. Celle de notre exemple indique une relation
positive car plus x augmente alors plus y augmente => relation positive entre agencement et
plaisir. Plus satisfait par l’agencement, plus ils ressentent du plaisir
La relation est-elle faible ou forte ? il suffit de regarder la pente de la droite qui reflète le
coefficient a (y=ax+b). ici, notre pente est relativement faible donc la relation est faible.
Si la droite est plate, il n’y a pas d’effet, pas de relation.
IL FAUT REGARDER QUEL EST LE SENS ET LA PENTE DE LA DROITE
Relation entre plaisir et accessibilité
Ici, le plaisir ne varie pas. L’accessibilité n’influence pas forcément le plaisir => pas de
relation
On rajoute la variable temperature

On a 3 graphes car Jamovi a découpé cette variable en 3 modalités.
On constate visuellement, que dans le cas de la température appréciée modérément et dans
le cas où la température est pas du tout appréciée, il n’y a pas d’impact -> droite quasiment
plate, pas d’effet d’accessibilité dans ces deux cas.
En revanche, quand température est bien apprécie par le client, l’accessibilité a un impact
sur le plaisir -> pente. L’accessibilité est en mesure d’influencer positivement lorsque la
température est appréciée.
FlexPlot < flexplot -> la même chose qu’au-dessus
QCM EN COURS – questions screen shot Mimi
Partiel – 4 exercices pendant 1h30, on a un tableau de résultats et on nous demande

d’interpréter . Justifier utilisation de ce test, quel es l’intérêt managérial de ce test ? (ce qui
se cache derrière le test).
2 ou 3 ex de ce type
1 exercice sur présentation graphique et il faut interpréter
Exercice où on nous demande de préciser le test statistique (peut être un QCM)
ATTENTION AUX PIEGES : tableau de résultats avec nature des variables précisées et on nous
demande l’interprétation alors que peut-être il fallait pas faire ce test.
 4 ou 5 mai
Correction QCM – Document atmosphère du point de vente carrefour City
1- Deux variables quanti : musique et déplacement

 Test de corrélation de Pearson ou régression linéaire
Test de régression linéaire est plus puissant que celui de corrélation
Corrélation positive donc plus la musique est plaisante, plus le déplacement est facile
2- Ici on a une variable quantitative (senteur) et une variable quali (sexe) qui a deux
modalités (homme/femme : si on rajoute modalité autre alors change la nature du test)
On compare le score des homme et des femmes en termes de comparaison de moyenne
 Test t pour échantillon appariés ??
Pas de différence entre homme et femme donc pas de relation
3- Variable qualitative avec trois modalités (CSP) et variable quantitative

 Test Anova ?
Test n’est pas significatif, CSP pas d’effet sur la recommandation
4- Deux variable quali

 Test de khi-deux
Il y a bien un lien entre le genre et le fait d’avoir fréquenté ou non le magasin, lien de
dépendance
5- Deux variables quantitatives

Test de corrélation de pearson et test de régression linéaire
On s’intéresse à la relation de cause à effet donc cause de régression linéaire
 Test de régression linéaire
Variable Dépendante –> recommandation
Influe fortement
6- Comparer deux moyennes obtenues sur l’agencement et vis-à-vis de la lumière

Test sur échantillon apparié
 Test t échantillon apparié
Il y a une différence significative
7- Homme -> on est pas sur la variable genre !

Comparer moyennes obtenues sur agencement, musique et senteur en prévision
Pas une seule moyenne comme dans q. 6
 Test Anova intra-sujets
Il faut mettre dans Level les 3 différentes étiquettes (musique, agencement et senteurs-
Puis en bas variables associées
Faut créer un filtre pour garder que les hommes
Avec JAMOVI -> Ils apprécient plus l’agencement que les senteurs et la musique
8- Variable quanti avec variable quali (moments de la journée)

Cette variable quali à + de 2 modalités donc Anova car 3 modalités
 Test ANOVA inter-sujets
Pas de différence significative, le plaisir ne varie pas selon le moment de la journée donc pas
d’impact
9- Variable qualitative nominale (apprécier) et plusieurs variables, quel que soit leur nature
on utilise => le test de régression logistique
Transformer la variable -> si sup ou égal à 4 pas apprécier et sinon oui apprécié
Puis sur Jamovi analyse de régression logistique (binomial logistic regression)
Temps en fonction d’âge et musique
10- Variables quantitatives

 Test de régression linéaire multiple
L’ensemble de ces variables expliquent 89,9% ? de l’appareillage du plaisir pour savoir celle
qui agit le plus regarder le coeff standardisé
Agencement n’a pas d’impact car la plus-value est sup à 5%
La lumière agi positivement et les senteurs aussi car plus-value inf à 5%
La variable qui agit le plus sont les senteurs

Cours ESM

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Cours ESM

Transféré par

Droits d'auteur :

Formats disponibles

COURS

EXPERTISE STATISTIQUE EN MARKETING

 Identifier le bon test statistique à réaliser compte tenu de la problématique managériale

2. Contenu du cours ESM

1) Manipulation de JAMOVI et préparation des données

 Volume horaire : 20h

Pour les variables qualitatives, je ne peux calculer que les fréquences.

I- Manipulation de JAMOVI et préparation des données

 Importer base « open »

Interprétation : 25% des répondants ont moins de 20 ans

C’était pour les variables quanti

La distribution suit-elle un loi normale ? Oui

Plot < Box plot (boite à moustache)

 Boites à moustaches : représenter plusieurs indicateurs sur un seul graphique – min et

La ligne inférieure c’est le 1er quartile

On peut modifier les titres de la boite à moustache en allant dans Edit

Pour les variables qualitatives (nominales et ordinales)

Les 3 points verticaux en haut à droite pour changer couleur par ex

Quand on croise 3, 4 ou 5 variables et qu’on s’intéresse à une variable quanti, je pourrai

Data < compute

Data < transform

puis changer type de variable à nominale

Data < filters

Erreur dans le 2e point « 18 à 24 ans »

<= car « non satisfait »

Exemple : la satisfaction globale influence-t-elle l’intention de revenir au restaurant ?

 D’abord, il faut analyser s’il y a un effet de la variable indépendante sur la variable

Exemple : la satisfaction globale influence-t-elle l’intention de revenir au restaurant ?

 R² (R-deux) indique la proportion de variance totale de l’intention de revenir expliquée

Exemple : la satisfaction globale influence-t-elle l’intention de revenir au restaurant ?

8. Test de régression linéaire multiple

Premier tableau à analyser : Model

 Nous constatons ci-dessus qu’il y a une relation statistiquement significative entre

 8% de l’intention de revenir au restaurant est expliquée par la combinaison de trois

Regarder la sig de chaque variable

 Quelle est la variable qui explique le plus l’intention de revenir au resto ?

Exemple : Est-ce que l’âge du client et le montant de la commande permettent-ils de prédire

Application (demander qq)

Le manager du restaurant vise à expliquer certains réactions et comportements de ces

 Dans quelle mesure la satisfaction envers la rapidité du service et la satisfaction vis-à-

Jamovi < Regression < Linéraire

Il existe une relation statistiquement significative entre x et x et x et x, car P inférieur ou égal

R carré = 0,0587 : L’amabilité du personnel, et la rapidité du service expliquent 5,87% de la

Les résultats du tableau 2 montrent que l’amabilité du personnel a un impact significatif et

 Est-ce que la satisfaction globale, l’âge du client, la proximité du domicile permettent

Il faut transformer la variable intention de revenir

Les résultats du tableau 1 montrent que la combinaison permettent de prédire

 Le montant de la commande dépend-il de la situation de la consommation (client seul

 Y a-t-il un lien entre l’âge du client et sa fréquence de visite du restaurant ?

 Quelle proportion de la variance de la satisfaction globale est expliquée par le niveau de

JjstatPlot < Histogram < Variables Age > Split By Sexe

2e graphe- Matrice de corrélation

JJstatPlot > Box Violin Plots to compare between groups

Si on prend le premier diagramme, on voit que le diagramme est large au niveau de la

Jjspot < Bar Charts

Variables de nature quanti !

Y-a-t-il Lien entre agencement et plaisir ?

On fait généralement des nuages de points

Graphic options < Fitted line < changer à Regression

Interpréter les résultats sur la base du graphique au partiel!

Première chose à voir : Quelle est la variable dépendante et indépendante ?

IL FAUT REGARDER QUEL EST LE SENS ET LA PENTE DE LA DROITE

Relation entre plaisir et accessibilité

On rajoute la variable temperature