Académique Documents
Professionnel Documents
Culture Documents
1. Objectifs pédagogiques
On choisit les variables auxquelles on s’intéresse pour les décrire . Exemple : on s’intéresse à
la variable âge
Descriptives « variables across
columns »
Pour les variables quali -> faut tout découcher, écart type, médiane, moyenne -> pas de
sens de le calculer pour variables quali. Par contre on peut cocher « frequency tables »
La majorité des valeurs s’approchent de la moyenne. On peut utiliser la moyenne comme
indicateur de comparaison.
La moyenne n’est pas toujours un indicateur de comparaison !
Les premiers indicateurs peuvent êtres représentes graphiquement sous forme de boite
à moustache. C’est un graphique très intéressant qui synthétise ces informations.
= Boîte qui vient décrire de manière statistique et visuelle l’ensemble des variables
descriptives
VOIR SLIDE
Pour rajouter les packages, il faut aller dans « module » < manage installed
Tests statistiques
Transformation de variables
Filtrage
1)
2)
3)
Puis je cherche dans Analyse < exploration < descriptive < montant de la commande
Rattraper 3 cours !
7. Test de régression linéaire simple
Ce test vise à examiner l’existence d’une relation de cause à effet entre une variable
indépendante quantitative et une variable dépendante quantitative
Ce test permet de modéliser une relation linéaire entre deux variables à l’aide d’une
équation mathématique : Y =a x+b
Elle indique si la variable indépendante explique une partie de la variable dépendante
Exemples :
La satisfaction des clients a-t-elle un effet positif sur la part de marché ? Si oui, de
combien la part de marché peut augmenter lorsque le niveau de satisfaction augmente
de 1 point ?
La
satisfaction La part de
marché
Étape 2 :
Ce test vise à expliquer la variance d’une variable dépendante à l’aide d’une combinaison
de plusieurs facteurs explicatifs (variables indépendantes)
Ce test permet de modéliser cette relation linéaire à l’aide d’une équation
mathématique :
Y =a1 x 1 +a 2 x 2+ an xn +... b
Exemple :
Est-ce que la part de marché varie en fonction du niveau de satisfaction des clients, du
nombre ……
Exemple : Dans quelle mesure, la satisfaction vis-à-vis des prix pratiqués, de l’efficacité du
personnel, de la facilité à trouver de l’information influencent-ils l’intention de revenir au
restaurant ?
Étape 1 :
Étape 3 :
On voit que
La satisfaction de l’efficacité du personnel a un effet significatif ET positif sur l’intention
de revenir au restaurant
La satisfaction de facilité de trouver l’information a un effet significatif MAIS négatif sur
l’intention de revenir au restaurant => plus gens ont facilité de trouver infos moins ils
auront intention de revenir au resto
La satisfaction de prix a PAS un effet significatif, aucun impact sur l’intention de revenir
au restaurant
DONC : combi de 3 facteurs est significatif mais la satisfaction du prix à elle seule n’a pas un
effet significatif sur intention
=> efficacité du personnel est celle qui explique le plus intention de revenir au resto
Pour améliorer modèle : on sort la variable qui n’est pas significative : ici c’est la satisfaction
prix
9. Test de régression logistique
Ce test vise à tester un modèle de régression dont la variable dépendante est nominale
(dichotomique) et dont le(s) variable(s) peuvent être quantitative(s) ou qualitative(s).
Ce test permet de prédire la probabilité qu’un événement survienne ou non en fonction
de(s) variable(s) explicative(s)/prédictive(s)
Exemples :
Est-ce que la note de techniques d’enquête en management, la note de marketing, l’âge
de l’étudiant permettent de prédire la réussite ou l’échec à l’examen d’expertise
statistique en marketing ?
Est-ce que le revenu, le lieu d’habitation et la taille du foyer permettent de prédire le
défaut de remboursement ? Ces variables permettent-elles de distinguer les mauvais des
bons emprunteurs ?
Est-ce que la CSP, le lieu d’habitation, l’âge et le degré de respect des gestes barrières
permettent-ils de prédire la probabilité de contracter la Covid-19 ?
L’âge affecte négativement la chance d’être satisfait envers le restaurant. Plus le client
est âgé, plus la chance d’être satisfait diminue.
Le montant de la commande ne permet pas de prédire la probabilité d’insatisfaction et
de satisfaction envers le restaurant
(demander à quelqu’un)
2e tableau : coefficients
Les résultat du tableau 2 montrent que la rapidité du service n’a pas d’effets significatifs sur
l’intention de revenir au restaurant.
Pour répondre à cette questions il convient de réaliser un test de corrélation statistique car il
s’agit de tester la relation prédiction entre plusieurs variables indépendantes, et une variable
dépendante de nature qualitative dichotomique.
L’âge a un effet significatif sur l’intention de revenir au restaurant car P = 0,005. Cela signifie
que l’âge permet de prédire l’intention de revenir, plus précisément il ressort que plus on est
âgé, moins la probabilité de revenir au restaurant est forte et vice-versa.
Rattraper dernières q
Pour ajouter des packages : analyses<modules+ < bilbiothèque jamovi < flexplot et jjstatplot
Pour utiliser ses packages, pas d’espaces et pas de caractére spéciaux
JJSTATPLOT
Analyses < jjstatplot < exploration : dans variables Temperature -> split by Sexe -> box flots
(boite à moustache)
1er graphe
Il est intéressant de croiser les variables, dans cet exemple 3 histogrammes, un pour les
hommes un pour les femmes et un selon la population totale en fonction de l’âge.
Dans Plot>values on Bars on peut changer à « proportion » pour mettre % ou alors mix pour
avoir effectif et proportion
Comme je croise variable une variable quanti avec quali, on nous donne le résultat du test T
qui peut être également intéressant => Femme, moyenne 30 ans et hommes ?, différence
significative
Analysis < Measure < moyenne ou médiane selon ce que l’on cherche
JJstatPlot < Correlation Matrix < sélectionner les variables quanti que l’on souhaite (ici
caractéristique environnement de vente donc est-ce que lien entre agencement et facilité de
déplacement ? ou alors entre ressenti plaisir et musique ?) < Dependent variables :
temperature, musique, lumiere, accesibilite, deplacement, agencement
Autre graphe pour s’intéresser à la relation entre variable quanti et quali ou alors plusieurs
variables quali
La variable de dépendance est la température en ordonné et sur l’axe des abscisses on a les
différentes catégories de CSP avec entre parenthèses l’effectif de chaque groupe.
L’information la plus importante est de voit la moyenne -> les points rouges, plus ils sont
hauts plus ils sont importants. Ceux qui apprécient le plus la température est la CSP+ avec
4,19 de moyenne.
A l’intérieur des violons on a une boite à moustache. Le trait qui coupe la boite est la
médiane. Le trait supérieur de la boite est le quart type 3 et le trait inférieur est le quart type
1.
On peut multiplier ce graphe, en le divisant selon une autre variable. Ici sexe
Dernier graphe de Jjstat pour croiser deux variables quali et PAS DE QUANTI !!
Test de Khi 2 n’est pas significatif donc pas de différence significative entre hommes et
femmes en terme de proportion
Ce qui est intéressant est d’aller plus loin en croisant 3 variables quali : par exemple
répartition des clients selon moments de la journée
A midi, les visiteurs que ce soit hommes ou femmes -> CSP-
Le soir on a les inactifs et les CSP+ que ce soit hommes ou femmes
En revanche, on a une surreprésentation de CSP+
FLEXPLOT
Fait la même chose JjSpotPlot mais moins riche. Mais son avantage comparatif est l’étude de
l’effet de régression.
FlexPlot < General Linear Model pour étudier relations de cause a effet des variables
Variable indépendante sur l’axe des abscisses ici agencement et la variable dépendant sur
celle des ordonnées ici plaisir
Ce qui nous intéresse le plus est la droite. Celle de notre exemple indique une relation
positive car plus x augmente alors plus y augmente => relation positive entre agencement et
plaisir. Plus satisfait par l’agencement, plus ils ressentent du plaisir
La relation est-elle faible ou forte ? il suffit de regarder la pente de la droite qui reflète le
coefficient a (y=ax+b). ici, notre pente est relativement faible donc la relation est faible.
Si la droite est plate, il n’y a pas d’effet, pas de relation.
Ici, le plaisir ne varie pas. L’accessibilité n’influence pas forcément le plaisir => pas de
relation
4 ou 5 mai
2- Ici on a une variable quantitative (senteur) et une variable quali (sexe) qui a deux
modalités (homme/femme : si on rajoute modalité autre alors change la nature du test)
On compare le score des homme et des femmes en termes de comparaison de moyenne
Influe fortement
Il faut mettre dans Level les 3 différentes étiquettes (musique, agencement et senteurs-
Puis en bas variables associées
Faut créer un filtre pour garder que les hommes
Avec JAMOVI -> Ils apprécient plus l’agencement que les senteurs et la musique
Pas de différence significative, le plaisir ne varie pas selon le moment de la journée donc pas
d’impact
9- Variable qualitative nominale (apprécier) et plusieurs variables, quel que soit leur nature
on utilise => le test de régression logistique
Transformer la variable -> si sup ou égal à 4 pas apprécier et sinon oui apprécié
Puis sur Jamovi analyse de régression logistique (binomial logistic regression)
Temps en fonction d’âge et musique
L’ensemble de ces variables expliquent 89,9% ? de l’appareillage du plaisir pour savoir celle
qui agit le plus regarder le coeff standardisé
Agencement n’a pas d’impact car la plus-value est sup à 5%
La lumière agi positivement et les senteurs aussi car plus-value inf à 5%
La variable qui agit le plus sont les senteurs