Vous êtes sur la page 1sur 35

COURS

EXPERTISE STATISTIQUE EN MARKETING

1. Objectifs pédagogiques

  Identifier le bon test statistique à réaliser compte tenu de la problématique managériale


marketing
  Opérer des tests statistiques sur le logiciel JAMOVI
  Savoir interpréter les outputs des tests statistiques
  Proposer la bonne décision managériale à prendre suite aux résultats des tests statistiques

2. Contenu du cours ESM

1)  Manipulation de JAMOVI et préparation des données


2)  Test de Khi-deux
3)  Test de Pearson
4)  Test de Spearman
5)  Test de comparaison de moyennes sur échantillons indépendants
6)  Test de comparaison de moyennes sur échantillons appariés
7)  Test d’ANOVA un facteur
8)  Test de régression linéaire simple
9)  Test de linéaire multiple
10)  Test de régression logistique

 Volume horaire : 20h


 Agenda du cours : fin en principe le 17 mars
 Évaluation : Examen final classique -> partiel

Pour les variables qualitatives, je ne peux calculer que les fréquences.


Variable nominale -> on ne peut pas calculer la moyenne, la médiane etc mais juste les
fréquences

I- Manipulation de JAMOVI et préparation des données

 Importer base « open »


 Faire ajustement notamment sur types de variables dans onglet « variables ». Double
cliquer sur chaque variable pour changer type ou autre ( voir questionnaire de base).
« Description » c’est pour écrire la question mais pas obligatoire
 Traitement données -> onglet « analyses » , « exploration », « descriptives »

On choisit les variables auxquelles on s’intéresse pour les décrire . Exemple : on s’intéresse à
la variable âge
Descriptives « variables across
columns » 

Interprétation : 25% des répondants ont moins de 20 ans


Plus l’écart type est élevé, plus les variables sont hétérogènes : standard deviation 7,48
 Pour avoir graphique -> plots « histogram »

C’était pour les variables quanti

Pour les variables quali -> faut tout découcher, écart type, médiane, moyenne -> pas de
sens de le calculer pour variables quali. Par contre on peut cocher « frequency tables »
La majorité des valeurs s’approchent de la moyenne. On peut utiliser la moyenne comme
indicateur de comparaison.
La moyenne n’est pas toujours un indicateur de comparaison !

La distribution suit-elle un loi normale ? Oui

Les premiers indicateurs peuvent êtres représentes graphiquement sous forme de boite
à moustache. C’est un graphique très intéressant qui synthétise ces informations.

Plot < Box plot (boite à moustache)


3. Analyses préliminaires sur les données

 Boites à moustaches : représenter plusieurs indicateurs sur un seul graphique – min et


max de la série
- 3e quartile
- médiane
- 1er quartile
- valeurs extrêmes
Obj : capacité a combiner plusieurs variables

La ligne inférieure c’est le 1er quartile


La ligne supérieure de la boite est le 3e quartile

= Boîte qui vient décrire de manière statistique et visuelle l’ensemble des variables
descriptives

VOIR SLIDE

On peut modifier les titres de la boite à moustache en allant dans Edit

Pour les variables qualitatives (nominales et ordinales)


Cliquer sur « frequency tables » pour avoir les %

Les 3 points verticaux en haut à droite pour changer couleur par ex

Pour rajouter les packages, il faut aller dans « module » < manage installed

Quand on croise 3, 4 ou 5 variables et qu’on s’intéresse à une variable quanti, je pourrai


utiliser les boîtes à moustache.
Comment faire un score moyen par ex

Data < compute

Tests statistiques

Transformation de variables

Data < transform


Using transform < Add recode condition

puis changer type de variable à nominale

Filtrage

Data < filters


Peut être activé ou désactivé, et même supprimé et caché

Erreur dans le 2e point « 18 à 24 ans »

1)
2)

3)

<= car « non satisfait »

Puis je cherche dans Analyse < exploration < descriptive < montant de la commande

Rattraper 3 cours !
7. Test de régression linéaire simple

 Ce test vise à examiner l’existence d’une relation de cause à effet entre une variable
indépendante quantitative et une variable dépendante quantitative
 Ce test permet de modéliser une relation linéaire entre deux variables à l’aide d’une
équation mathématique : Y =a x+b
 Elle indique si la variable indépendante explique une partie de la variable dépendante

Exemples :
 La satisfaction des clients a-t-elle un effet positif sur la part de marché ? Si oui, de
combien la part de marché peut augmenter lorsque le niveau de satisfaction augmente
de 1 point ?

La
satisfaction La part de
marché

Exemple : la satisfaction globale influence-t-elle l’intention de revenir au restaurant ?


Étape 1 :

 D’abord, il faut analyser s’il y a un effet de la variable indépendante sur la variable


dépendante. Pour cela, il faut interpréter les résultats du test F
 Nous constatons dans le tableau ci-dessus qu’il y a une relation statistiquement
significative entre la variable dépendante (l’intention de revenir) et la variable
indépendante (satisfaction). La satisfaction explique significativement l’intention de
revenir au restaurant

Exemple : la satisfaction globale influence-t-elle l’intention de revenir au restaurant ?

Étape 2 :

 R² (R-deux) indique la proportion de variance totale de l’intention de revenir expliquée


par la satisfaction globale
 La satisfaction explique 1,69% de la variabilité de l’intention de revenir au restaurant
 Il est compris entre 0 et 1
 R² = 0 : la variable indépendante n’explique rien
 R2 = 1 : la variable indépendante explique complètement Y

Exemple : la satisfaction globale influence-t-elle l’intention de revenir au restaurant ?


Étape 3 :
 La satisfaction a un effet significatif et positif sur l’intention de revenir au restaurant
 Y = a X + b avec a = coeff non standardisé 0,2
 L’intention de revenir = 0,200 (coeff non standardisé) satisfaction + 3,913
 Si la satisfaction augmente de 1 point, l’intention de revenir augmente 0,2 point

8. Test de régression linéaire multiple

 Ce test vise à expliquer la variance d’une variable dépendante à l’aide d’une combinaison
de plusieurs facteurs explicatifs (variables indépendantes)
 Ce test permet de modéliser cette relation linéaire à l’aide d’une équation
mathématique :
Y =a1 x 1 +a 2 x 2+ an xn +... b

Exemple :
 Est-ce que la part de marché varie en fonction du niveau de satisfaction des clients, du
nombre ……
Exemple : Dans quelle mesure, la satisfaction vis-à-vis des prix pratiqués, de l’efficacité du
personnel, de la facilité à trouver de l’information influencent-ils l’intention de revenir au
restaurant ?

Premier tableau à analyser : Model

Étape 1 :

 Nous constatons ci-dessus qu’il y a une relation statistiquement significative entre


intention de revenir et les variables indépendantes (satisfaction vis-à-vis des prix
pratiqués, de l’efficacité du personnel, de la facilité à trouver de l’information).
Étape 2 :

 8% de l’intention de revenir au restaurant est expliquée par la combinaison de trois


variables : la satisfaction vis-à-vis des prix pratiqués, l’efficacité du personnel et la facilité
à trouver de l’information

Étape 3 :

Regarder la sig de chaque variable


Regarder si c’est posi ou nega

On voit que
 La satisfaction de l’efficacité du personnel a un effet significatif ET positif sur l’intention
de revenir au restaurant
 La satisfaction de facilité de trouver l’information a un effet significatif MAIS négatif sur
l’intention de revenir au restaurant => plus gens ont facilité de trouver infos moins ils
auront intention de revenir au resto
 La satisfaction de prix a PAS un effet significatif, aucun impact sur l’intention de revenir
au restaurant
DONC : combi de 3 facteurs est significatif mais la satisfaction du prix à elle seule n’a pas un
effet significatif sur intention

 Quelle est la variable qui explique le plus l’intention de revenir au resto ?


Regarder la valeur de Beta la plus élevée ici │Bêta│ = │0,2547│ > │-0,1701│

=> efficacité du personnel est celle qui explique le plus intention de revenir au resto

Pour améliorer modèle : on sort la variable qui n’est pas significative : ici c’est la satisfaction
prix
9. Test de régression logistique

 Ce test vise à tester un modèle de régression dont la variable dépendante est nominale
(dichotomique) et dont le(s) variable(s) peuvent être quantitative(s) ou qualitative(s).
 Ce test permet de prédire la probabilité qu’un événement survienne ou non en fonction
de(s) variable(s) explicative(s)/prédictive(s)

Exemples :
 Est-ce que la note de techniques d’enquête en management, la note de marketing, l’âge
de l’étudiant permettent de prédire la réussite ou l’échec à l’examen d’expertise
statistique en marketing ?
 Est-ce que le revenu, le lieu d’habitation et la taille du foyer permettent de prédire le
défaut de remboursement ? Ces variables permettent-elles de distinguer les mauvais des
bons emprunteurs ?
 Est-ce que la CSP, le lieu d’habitation, l’âge et le degré de respect des gestes barrières
permettent-ils de prédire la probabilité de contracter la Covid-19 ?

Exemple : Est-ce que l’âge du client et le montant de la commande permettent-ils de prédire


la probabilité d’insatisfaction ou de satisfaction envers le restaurant ?
 Nous pouvons dire que le modèle permet de prédire significativement la probabilité
d’insatisfaction ou de satisfaction envers le restaurant

 L’âge affecte négativement la chance d’être satisfait envers le restaurant. Plus le client
est âgé, plus la chance d’être satisfait diminue.
 Le montant de la commande ne permet pas de prédire la probabilité d’insatisfaction et
de satisfaction envers le restaurant

Application (demander qq)

Le manager du restaurant vise à expliquer certains réactions et comportements de ces


clients. Il se pose, ainsi, les questions suivantes :

 Dans quelle mesure la satisfaction envers la rapidité du service et la satisfaction vis-à-


vis de l’amabilité du personnel influencent-elles l’intention de retour au restaurant ?

(demander à quelqu’un)

Jamovi < Regression < Linéraire


(pas tout à fait les
mêmes données que le prof)

Il existe une relation statistiquement significative entre x et x et x et x, car P inférieur ou égal


à 0,1 (strictement inférieur à 5%).

R carré = 0,0587 : L’amabilité du personnel, et la rapidité du service expliquent 5,87% de la


variance de l’intention de revenir

2e tableau : coefficients

Les résultats du tableau 2 montrent que l’amabilité du personnel a un impact significatif et


positif sur l’intention de retour au restaurant car P < 0,001 soit inférieur à 5%. Et positif car
bêta (Estimate) est positif (0,2091). Autrement dit, plus le personnel est aimable, plus les
consommateurs ont l’intention de revenir au restaurant.

Les résultat du tableau 2 montrent que la rapidité du service n’a pas d’effets significatifs sur
l’intention de revenir au restaurant.

 Est-ce que la satisfaction globale, l’âge du client, la proximité du domicile permettent


de prédire l’intention de revenir ou non au restaurant ?

Pour répondre à cette questions il convient de réaliser un test de corrélation statistique car il
s’agit de tester la relation prédiction entre plusieurs variables indépendantes, et une variable
dépendante de nature qualitative dichotomique.

Il faut transformer la variable intention de revenir


Analyse < regression < logistique binomial

Les résultats du tableau 1 montrent que la combinaison permettent de prédire


significativement l’intention de revenir ou non au restaurant car P est inférieur à 5%.
R deux Mcf = 0,120 : cela signifie que …. ?

L’âge a un effet significatif sur l’intention de revenir au restaurant car P = 0,005. Cela signifie
que l’âge permet de prédire l’intention de revenir, plus précisément il ressort que plus on est
âgé, moins la probabilité de revenir au restaurant est forte et vice-versa.

 Le montant de la commande dépend-il de la situation de la consommation (client seul


vs client accompagné) ?

 Y a-t-il un lien entre l’âge du client et sa fréquence de visite du restaurant ?

 Quelle proportion de la variance de la satisfaction globale est expliquée par le niveau de


satisfaction moyen envers le personnel (amabilité, efficacité et apparence) ?

Rattraper dernières q
Pour ajouter des packages : analyses<modules+ < bilbiothèque jamovi < flexplot et jjstatplot
Pour utiliser ses packages, pas d’espaces et pas de caractére spéciaux

JJSTATPLOT
Analyses < jjstatplot < exploration : dans variables Temperature -> split by Sexe -> box flots
(boite à moustache)

1er graphe

JjstatPlot < Histogram < Variables Age > Split By Sexe

Il est intéressant de croiser les variables, dans cet exemple 3 histogrammes, un pour les
hommes un pour les femmes et un selon la population totale en fonction de l’âge.

Dans Plot>values on Bars on peut changer à « proportion » pour mettre % ou alors mix pour
avoir effectif et proportion

Comme je croise variable une variable quanti avec quali, on nous donne le résultat du test T
qui peut être également intéressant => Femme, moyenne 30 ans et hommes ?, différence
significative

Analysis < Measure < moyenne ou médiane selon ce que l’on cherche

2e graphe- Matrice de corrélation

JJstatPlot < Correlation Matrix < sélectionner les variables quanti que l’on souhaite (ici
caractéristique environnement de vente donc est-ce que lien entre agencement et facilité de
déplacement ? ou alors entre ressenti plaisir et musique ?) < Dependent variables :
temperature, musique, lumiere, accesibilite, deplacement, agencement
Autre graphe pour s’intéresser à la relation entre variable quanti et quali ou alors plusieurs
variables quali

JJstatPlot > Box Violin Plots to compare between groups

La variable de dépendance est la température en ordonné et sur l’axe des abscisses on a les
différentes catégories de CSP avec entre parenthèses l’effectif de chaque groupe.
L’information la plus importante est de voit la moyenne -> les points rouges, plus ils sont
hauts plus ils sont importants. Ceux qui apprécient le plus la température est la CSP+ avec
4,19 de moyenne.

A l’intérieur des violons on a une boite à moustache. Le trait qui coupe la boite est la
médiane. Le trait supérieur de la boite est le quart type 3 et le trait inférieur est le quart type
1.

Si on prend le premier diagramme, on voit que le diagramme est large au niveau de la


moyenne, cela veut dire qu’il y a beaucoup de répondants. Plus il est large, plus il y a de
répondants. La plupart des répondants de la CSP+ ont répondu ?. Pour la CSP- c’est large au
niveau du quart type 1, la plupart des résultat sont au niveau de 2,5.
On sait qu’on a une moyenne de 4,19 mais la tendance est atour de la moyenne, pour le 2 e,
la majorité de la réponse est de 2,5/3.

On peut multiplier ce graphe, en le divisant selon une autre variable. Ici sexe
Dernier graphe de Jjstat pour croiser deux variables quali et PAS DE QUANTI !!

Jjspot < Bar Charts


Entre variable CSP et sexe

Test de Khi 2 n’est pas significatif donc pas de différence significative entre hommes et
femmes en terme de proportion

Ce qui est intéressant est d’aller plus loin en croisant 3 variables quali : par exemple
répartition des clients selon moments de la journée
A midi, les visiteurs que ce soit hommes ou femmes -> CSP-
Le soir on a les inactifs et les CSP+ que ce soit hommes ou femmes
En revanche, on a une surreprésentation de CSP+

FLEXPLOT
Fait la même chose JjSpotPlot mais moins riche. Mais son avantage comparatif est l’étude de
l’effet de régression.

FlexPlot < General Linear Model pour étudier relations de cause a effet des variables

Variables de nature quanti !

Y-a-t-il Lien entre agencement et plaisir ?

On fait généralement des nuages de points

Variable indépendante sur l’axe des abscisses ici agencement et la variable dépendant sur
celle des ordonnées ici plaisir

Graphic options < Fitted line < changer à Regression

Interpréter les résultats sur la base du graphique au partiel!

Première chose à voir : Quelle est la variable dépendante et indépendante ?


On s’intéresse entre la relation de cause à effet entre agencement du point de vente et le
plaisir du ressenti.
Les points représentent des individus et les coordonnées sont les réponses.

Ce qui nous intéresse le plus est la droite. Celle de notre exemple indique une relation
positive car plus x augmente alors plus y augmente => relation positive entre agencement et
plaisir. Plus satisfait par l’agencement, plus ils ressentent du plaisir

La relation est-elle faible ou forte ? il suffit de regarder la pente de la droite qui reflète le
coefficient a (y=ax+b). ici, notre pente est relativement faible donc la relation est faible.
Si la droite est plate, il n’y a pas d’effet, pas de relation.

IL FAUT REGARDER QUEL EST LE SENS ET LA PENTE DE LA DROITE

Relation entre plaisir et accessibilité

Ici, le plaisir ne varie pas. L’accessibilité n’influence pas forcément le plaisir => pas de
relation

On rajoute la variable temperature


On a 3 graphes car Jamovi a découpé cette variable en 3 modalités.
On constate visuellement, que dans le cas de la température appréciée modérément et dans
le cas où la température est pas du tout appréciée, il n’y a pas d’impact -> droite quasiment
plate, pas d’effet d’accessibilité dans ces deux cas.
En revanche, quand température est bien apprécie par le client, l’accessibilité a un impact
sur le plaisir -> pente. L’accessibilité est en mesure d’influencer positivement lorsque la
température est appréciée.
FlexPlot < flexplot -> la même chose qu’au-dessus

QCM EN COURS – questions screen shot Mimi

Partiel – 4 exercices pendant 1h30, on a un tableau de résultats et on nous demande


d’interpréter . Justifier utilisation de ce test, quel es l’intérêt managérial de ce test ? (ce qui
se cache derrière le test).
2 ou 3 ex de ce type
1 exercice sur présentation graphique et il faut interpréter
Exercice où on nous demande de préciser le test statistique (peut être un QCM)
ATTENTION AUX PIEGES : tableau de résultats avec nature des variables précisées et on nous
demande l’interprétation alors que peut-être il fallait pas faire ce test.

 4 ou 5 mai

Correction QCM – Document atmosphère du point de vente carrefour City

1- Deux variables quanti : musique et déplacement


 Test de corrélation de Pearson ou régression linéaire
Test de régression linéaire est plus puissant que celui de corrélation
Corrélation positive donc plus la musique est plaisante, plus le déplacement est facile

2- Ici on a une variable quantitative (senteur) et une variable quali (sexe) qui a deux
modalités (homme/femme : si on rajoute modalité autre alors change la nature du test)
On compare le score des homme et des femmes en termes de comparaison de moyenne

 Test t pour échantillon appariés ??

Pas de différence entre homme et femme donc pas de relation

3- Variable qualitative avec trois modalités (CSP) et variable quantitative


 Test Anova ?

Test n’est pas significatif, CSP pas d’effet sur la recommandation

4- Deux variable quali


 Test de khi-deux
Il y a bien un lien entre le genre et le fait d’avoir fréquenté ou non le magasin, lien de
dépendance

5- Deux variables quantitatives


Test de corrélation de pearson et test de régression linéaire
On s’intéresse à la relation de cause à effet donc cause de régression linéaire
 Test de régression linéaire
Variable Dépendante –> recommandation

Influe fortement

6- Comparer deux moyennes obtenues sur l’agencement et vis-à-vis de la lumière


Test sur échantillon apparié
 Test t échantillon apparié
Il y a une différence significative

7- Homme -> on est pas sur la variable genre !


Comparer moyennes obtenues sur agencement, musique et senteur en prévision
Pas une seule moyenne comme dans q. 6
 Test Anova intra-sujets

Il faut mettre dans Level les 3 différentes étiquettes (musique, agencement et senteurs-
Puis en bas variables associées
Faut créer un filtre pour garder que les hommes

Avec JAMOVI -> Ils apprécient plus l’agencement que les senteurs et la musique

8- Variable quanti avec variable quali (moments de la journée)


Cette variable quali à + de 2 modalités donc Anova car 3 modalités
 Test ANOVA inter-sujets

Pas de différence significative, le plaisir ne varie pas selon le moment de la journée donc pas
d’impact

9- Variable qualitative nominale (apprécier) et plusieurs variables, quel que soit leur nature
on utilise => le test de régression logistique
Transformer la variable -> si sup ou égal à 4 pas apprécier et sinon oui apprécié
Puis sur Jamovi analyse de régression logistique (binomial logistic regression)
Temps en fonction d’âge et musique

10- Variables quantitatives


 Test de régression linéaire multiple

L’ensemble de ces variables expliquent 89,9% ? de l’appareillage du plaisir pour savoir celle
qui agit le plus regarder le coeff standardisé
Agencement n’a pas d’impact car la plus-value est sup à 5%
La lumière agi positivement et les senteurs aussi car plus-value inf à 5%
La variable qui agit le plus sont les senteurs

Vous aimerez peut-être aussi