Académique Documents
Professionnel Documents
Culture Documents
EP 09
Décembre 2021
Session 1
Semestre 1
- Analyse de données -
Durée : 24 h
D. FILALI, S. IVANAJ, K. AFAWUBO, E. KOUDOU, H. MAVOORI
Consignes :
• Vous devez soumettre vos réponses avant 9h, le 15 décembre sur MyICN dans le dépôt
«EXAMEN SEMESTRE 1 SESSION 1 - FR Analyse de données -…»
• Calculatrice ou tableur (Excel ou équivalent) autorisé(e) pour les calculs
• Aucun plagiat ne sera toléré et les étudiants acceptent de suivre sur l’honneur ces
instructions
• Cet examen est strictement personnel
Sujet : voir page suivante
IMPORTANT:
Cet examen est strictement individuel et votre copie est susceptible d'être analysée
par un logiciel anti-plagiat.
1
PARTIE I : CHOISISSEZ LA BONNE REPONSE (UNE SEULE)
Q01 : Dans le cadre d’un essai pilote pour tester un questionnaire, lequel des conseils
suivants n’est pas pertinent ?
A. Les répondants de l'essai pilote doivent être tirés de la même population que celle
ciblée pour l’étude
B. La taille de l'échantillon de l'essai pilote est généralement faible - entre 15 et 30
répondants.
C. Les essais pilotes devraient être administrés dans un contexte différent de celui de
l'enquête.
Q03 : Dans cette technique d'analyse quantitative, une analyse des tableaux de
contingence comprend souvent l'examen des profils de lignes et de colonnes et le
test d'indépendance via la statistique du chi carré.
Q04 : Quel type de problème à éviter un facteur d'inflation à variance (VIF) élevée
signale-t-il ?
2
D. Multi-colinéarité dans la régression linéaire multiple
E. Aucune des réponses ci-dessus
3
Q09 : Une méthode de recherche qualitative pourrait être :
Q10 : Les questions qu'un chercheur doit se poser pour formuler les objectifs de la
recherche sont les suivantes :
4
PARTIE II: REPONDRE AUX QUESTIONS SUIVANTES EN QUELQUES
PHRASES
Q11. Quelles sont les conditions d’utilisation d’une analyse factorielle des
correspondances simples, symbolisée AFC ?
On constate qu’il est essentiel de sélectionner les axes car elles sont significatives (la valeur
maximale de variance sur l’axe doit être supérieure au nombre de rendre compte de toute
l’inertie, soit le nombre de modalités moins une, de la variable la plus courte).
Enfin, pour qu’un modèle soit intéressant le plus petit nombre de dimensions rendent compte
de la plus grande part de l’inertie et pour qu’un modèle soit conforme les axes sélectionnés
rendent compte avec une grande moitié de l’inertie. (Exemple : (> 50%)
Q12. Lors d’une étude de littérature, quelles sont les étapes principales de l’approche
systématique ?
Il est important de noter que la revue systémique est définie par un rassemblement, une
évaluation et une synthèse des résultats des investigations initiales.
L’objectif est d’établir un résumé qualitatif.
Lors d’une étude de littérature, les étapes principales de l’approche systémique sont les
entrées en premier lieu, dans un second temps il s’agit du traitement puis pour finir les
résultats.
Par ailleurs, il est primordial de noter que l’étude de littérature implique quelques étapes lors
de la réalisation de l’approche systémique en commençant par l’input (sélectionner de
documents utilisés en fonction du thème, du sujet), le processing (collecte et évaluation de
l’information) puis l’output (analyse des documents, permettant de tirer les conclusions)
5
Q13. Que signifient le KMO et Sphericité de Bartlett? Comment les interprète-t-
on pendant une ACP ?
Le KMO est un indice défini par Kaiser-Mayer-Olkin. L’indice KMO varie entre 0 et 1 s’il est
proche de 0, les corrélations partielles sont identiques aux corrélations brutes c’està-àdire
qu’une compression efficace n’est pas possible.
La sphéricité de Barlett est un test, représentant des outils qui permettent de mesurer la
pertinence de l’échantillon. Ce test est statistique relatif à l’indépendance globale des
composantes d’un vecteur complétement aléatoires. Celui-ci est basé sur le déterminant d’une
estimation de la matrice de corrélation.
L’objectif de la sphéricité de Barlett (permettant une mesure globale en s’appuyant sur des
données statistiques) de détecter dans quelle mesure la matrice de corrélation calcule diverge
de la matrice unité.
Il est important de les distinguer car le KMO est un indice de solution factorielle indiquant
l’ensemble des variables retenu étant un ensemble cohérent qui va nous permettre de
constituer une mesure adéquate de certains concepts.
Pour les interpréter durant une ACP, il faut utiliser la matrice de corrélation. En effet, la
Sphéricité de Barlett permet d’avoir un test à l’utilisateur afin de connaitre les corrélations
nulles (si possible). Lors d’une ACP, l’indice KMO quant à lui permet de savoir si un lien de
corrélation existe.
Q14. Dans l'analyse des correspondances multiples (AMC), qu'indiquent les valeurs
plus élevées des scores de contribution (CTR) ?
Q15. Décrivez les différences entre les corrélations paramétriques et non paramétriques.
Lors d’une corrélation paramétrique, les variables doivent être continues ou sur des valeurs
d'intervalle. Les variables sont normalement distribuées avec Pearson.
Dans une corrélation non paramétrique, les variables doivent être ordinales, discrètes et n'ont
pas besoin d'être distribuées normalement
Q16. Énumérez toutes les étapes de recherche clés utilisées pour le projet de classe sur
les comportements de consommation durables dans la nouvelle normalité. Indiquez
lesquelles de ces étapes étaient qualitatives/quantitatives, exploratoires/confirmatoires et
inductives/déductives.
Les étapes de recherches clés utilisées pour le projet de classe sur les comportements de
consommation durables dans la nouvelle normalité sont composé de 6 étapes. En effet :
- Collecte d’informations
- Modèle conceptuel (déductif)
- Hypothesis (inductive)
6
- Création de guide d’interview (qualitative)
- Sondage (questionnaire, quantitative cette fois-ci)
- Réponse du sondage (quantitative et qualitative)
Q18. Quelle est l’hypothèse nulle du test d’homogénéité réalisé lors de l’ANOVA ?
Quelle est l’hypothèse alternative ?
Q19. Décrivez les étapes impliquées dans l'exécution d'une régression linéaire multiple.
Quels contrôles a priori et post hoc pouvez-vous utiliser pour vous assurer de la validité
des résultats ?
Q20. Que représente l’« inertie » dans le résultat d’une analyse AFC ?
L’inertie dans le résultat d’une analyse AFC est un indicateur de dispersion de nuage de point.
L’inertie permet donc de mesurer la lésion entre deux variables qualitatives.
7
PARTIE III: INTERPRETEZ LES RESULTATS, EFFECTUER DES CALCULS SI
NECESSAIRE ET REPONDEZ AUX QUESTIONS
Récapitulatif du modèle
Modèle R R-deux R-deux ajusté Erreur standard de l'estimation
1 ,687a ,635 ,417 21,285
a. Prédicteurs : (Constante), Internet , Ouverture, Croissance, Prix
b. Variable dépendante : Touristes
ANOVAa
Somme des
Modèle carrés ddl Carré moyen F Sig.
1 Régression 1217,405 4 304,351 67,2 ,014b
de Student 33525,982 74 453,054
Total 34743,387 78
a. Variable dépendante : Touristes
b. Prédicteurs : (Constante), Internet , Ouverture, Croissance, Prix
Coefficientsa
Coefficients non Coefficients Intervalle de confiance à Statistiques de
standardisés standardisés 95,0% pour B colinéarité
Erreur Borne Borne
Modèle B standard Bêta t Sig. inférieure supérieure Tolérance VIF
1 (Constante) 60,707 32,840 1,849 ,069 -4,728 126,142
Prix ,199 1,515 ,016 ,131 ,006 -3,218 2,820 ,007 4,102
Croissance ,731 1,042 ,082 ,701 ,005 -2,806 1,345 ,002 4,051
Ouverture ,023 ,035 ,075 ,648 ,519 -,047 ,092 ,002 4,029
Internet ,516 ,355 ,174 1,455 ,010 -1,223 ,191 ,001 4,098
a. Variable dépendante : Touristes
8
Q21. Que représente le R-deux ? Interpréter le.
Q22. Que représente la statistique de Fisher (F) ? Est-elle significative ? Interpréter la.
La statistique de Fisher (F), représente l’hypothèse nulle de deux lois normales ayant la
variante. Cette statistique est significative car l’hypothèse nulle est rejetée car le sigma
(0,014) est proche de 0 alors que F (Fisher) est de 67,2 est complétement supérieure à 0.
Cette justification est faite car on retrouve au moins un facteur qui ont eu un effet sur le
tourisme.
9
ACP
La perception de l’auto-efficacité est considérée par la littérature comme un facteur très
important du comportement du consommateur responsable. Le questionnaire que nous avons
administré auprès des consommateurs français a mesuré l’auto-efficacité (variable latente) à
l’aide échelle de Likert de 5 points et comportant 5 items :
Q20 Je suis convaincu que : (1=Pas du tout d'accord à 5=Très d'accord)
A. Mes actions personnelles ont une influence sur le développement durable
B. Les membres de ma communauté prennent des mesures pour faire face au changement
durable.
C. Mes actions visant à réduire les effets du réchauffement planétaire et du changement
climatique dans ma communauté encourageront les autres à réduire les effets du
réchauffement planétaire par leurs propres actions.
D. Je ne peux rien faire pour aider à contrôler la pollution de l'environnement.
E. Mon comportement peut avoir un effet positif sur le développement durable
Le tableau ci-dessous donne les coefficients de corrélation entre les facteurs (composantes)
extraits et les 5 items initiaux (Matrice des composantes)
Corrélations entre les facteurs et les items (Matrice des composantes)
Composantes ou facteurs
ITEMS
1 2 3 4 5
Q20A 0,816 -0,016 0,219 0,465 -0,262
Q20C 0,807 0,209 -0,092 -0,432 -0,332
Q20E 0,790 -0,228 0,406 -0,180 0,356
Q20B 0,734 0,390 -0,451 0,150 0,288
Q20D -0,290 0,900 0,324 -0,002 0,038
Alors que le tableau ci-dessous donne les carrés des coefficients de corrélation entre les
facteurs (composantes) extraits et les 5 items initiaux.
10
E. 5
Q27 Supposons que nous retenons 3 facteurs. De combien est la qualité de représentation (la
part de la variance expliquée par le modèle à trois facteurs) pour l’item Q20C ?
A. 47,5 %
B. 52,7 %
C. 60,1 %
D. 70,3%
E. 83,05 %
Q29 Supposons que nous ne retenons que 2 facteurs. De combien est la variance
« expliquée » par le modèle retenu ?
A. 29,154 %
B. 35,254 %
C. 61,458, %
D. 98,831 %
E. 72,454 % ((pourcentage 51,29 + 21,164).
En supposant que le modèle est monodimensionnel (1 seul facteur retenu) nous avons calculé
la fiabilité de l’échelle (alpha de Cronbach) : α =0 , 579. Le tableau ci-dessous donne l’Alpha
de Cronbach en cas de suppression de l'élément.
Q30 Que pensez-vous de la fiabilité (cohérence) de cette échelle? En d’autres mots, est-ce
que les 5 items que nous avons choisis pour mesurer l’auto-efficacité sont cohérents?
Sinon, est-il possible d’améliorer la fiabilité de l’échelle et si oui, comment?
11
Valeur critiques de t
ν t 0 ,25 t 0 ,20 t 0 ,15 t 0 ,10 t 0 ,05 t 0 ,025 t 0 ,01 t 0 ,005 t 0 ,0025 t 0 ,001 t 0 ,0005
1 1 1,376 1,963 3,078 6,314 12,71 31,82 63,66 127,3 318,3 636,6
2 0,816 1,061 1,386 1,886 2,92 4,303 6,965 9,925 14,09 22,33 31,6
3 0,765 0,978 1,25 1,638 2,353 3,182 4,541 5,841 7,453 10,21 12,92
4 0,741 0,941 1,19 1,533 2,132 2,776 3,747 4,604 5,598 7,173 8,61
5 0,727 0,92 1,156 1,476 2,015 2,571 3,365 4,032 4,773 5,893 6,869
6 0,718 0,906 1,134 1,44 1,943 2,447 3,143 3,707 4,317 5,208 5,959
7 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,499 4,029 4,785 5,408
8 0,706 0,889 1,108 1,397 1,86 2,306 2,896 3,355 3,833 4,501 5,041
9 0,703 0,883 1,1 1,383 1,833 2,262 2,821 3,25 3,69 4,297 4,781
10 0,7 0,879 1,093 1,372 1,812 2,228 2,764 3,169 3,581 4,144 4,587
11 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 3,497 4,025 4,437
12 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 3,428 3,93 4,318
13 0,694 0,87 1,079 1,35 1,771 2,160 2,650 3,012 3,372 3,852 4,221
14 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 3,326 3,787 4,14
15 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 3,286 3,733 4,073
16 0,69 0,865 1,071 1,337 1,746 2,12 2,583 2,921 3,252 3,686 4,015
17 0,689 0,863 1,069 1,333 1,74 2,11 2,567 2,898 3,222 3,646 3,965
18 0,688 0,862 1,067 1,33 1,734 2,101 2,552 2,878 3,197 3,61 3,922
19 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,174 3,579 3,883
20 0,687 0,86 1,064 1,325 1,725 2,086 2,528 2,845 3,153 3,552 3,85
21 0,686 0,859 1,063 1,323 1,721 2,08 2,518 2,831 3,135 3,527 3,819
22 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,119 3,505 3,792
23 0,685 0,858 1,06 1,319 1,714 2,069 2,5 2,807 3,104 3,485 3,767
24 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,091 3,467 3,745
25 0,684 0,856 1,058 1,316 1,708 2,06 2,485 2,787 3,078 3,45 3,725
26 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,067 3,435 3,707
27 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771 3,057 3,421 3,69
28 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763 3,047 3,408 3,674
29 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,038 3,396 3,659
30 0,683 0,854 1,055 1,31 1,697 2,042 2,457 2,75 3,03 3,385 3,646
40 0,681 0,851 1,05 1,303 1,684 2,021 2,423 2,704 2,971 3,307 3,551
50 0,679 0,849 1,047 1,299 1,676 2,009 2,403 2,678 2,937 3,261 3,496
60 0,679 0,848 1,045 1,296 1,671 2 2,39 2,66 2,915 3,232 3,46
80 0,678 0,846 1,043 1,292 1,664 1,99 2,374 2,639 2,887 3,195 3,416
100 0,677 0,845 1,042 1,29 1,66 1,984 2,364 2,626 2,871 3,174 3,39
120 0,677 0,845 1,041 1,289 1,658 1,98 2,358 2,617 2,86 3,16 3,373
∞ 0,674 0,842 1,036 1,282 1,645 1,96 2,326 2,576 2,807 3,09 3,291
12