Vous êtes sur la page 1sur 10

Epreuve

EP 09

ICN Année universitaire 2021-2022

À compléter par l’étudiant

NOM :…………………………………….. Prénom :………………………………..

Décembre 2021

PGE3/ MSc2/ Alt

Session 1

Semestre 1

- Analyse de données -

Durée : 24 h
D. FILALI, S. IVANAJ, K. AFAWUBO, E. KOUDOU, H. MAVOORI

Consignes :

• Vous devez soumettre vos réponses avant 9h, le 15 décembre sur MyICN dans le dépôt
«EXAMEN SEMESTRE 1 SESSION 1 - FR Analyse de données -…»
• Calculatrice ou tableur (Excel ou équivalent) autorisé(e) pour les calculs
• Aucun plagiat ne sera toléré et les étudiants acceptent de suivre sur l’honneur ces
instructions
• Cet examen est strictement personnel
Sujet : voir page suivante

IMPORTANT:

Cet examen est strictement individuel et votre copie est susceptible d'être analysée
par un logiciel anti-plagiat.

En remettant votre copie, vous vous engagez à rendre un travail individuel et


réalisé dans les règles précisées sur le présent sujet d'examen.

La détection de plagiat et/ou le non respect des règles conduira à l'attribution de la


note de zéro aux copies concernées et un conseil de discipline pourra être organisé.

1
PARTIE I : CHOISISSEZ LA BONNE REPONSE (UNE SEULE)

Merci de surligner la bonne réponse pour chaque question

Q01 : Dans le cadre d’un essai pilote pour tester un questionnaire, lequel des conseils
suivants n’est pas pertinent ?
A. Les répondants de l'essai pilote doivent être tirés de la même population que celle
ciblée pour l’étude
B. La taille de l'échantillon de l'essai pilote est généralement faible - entre 15 et 30
répondants.
C. Les essais pilotes devraient être administrés dans un contexte différent de celui de
l'enquête.

Q02 : Laquelle des affirmations suivantes est vraie ?

A. Une séquence d'entretien est établie avec des questions prédéterminées


B. Une recherche exploratoire est utilisée lorsque le chercheur n'a pas assez
d'informations sur des phénomènes particuliers
C. Les membres d’un focus-group peuvent se sentir intimidés les uns par les autre et ainsi
restreindre et limiter leurs réponses aux questions du modérateur
D. Tout ce qui précède
E. Aucune de ces réponses

Q03 : Dans cette technique d'analyse quantitative, une analyse des tableaux de
contingence comprend souvent l'examen des profils de lignes et de colonnes et le
test d'indépendance via la statistique du chi carré.

A. Analyse en composantes principales


B. ANOVA
C. Analyse factorielle des correspondances
D. Régression linéaire simple
E. Régression linéaire multiple

Q04 : Quel type de problème à éviter un facteur d'inflation à variance (VIF) élevée
signale-t-il ?

A. Non-linéarité des corrélations


B. Multi-colinéarité en régression linéaire simple
C. Sphéricité dans l'analyse en composantes principales

2
D. Multi-colinéarité dans la régression linéaire multiple
E. Aucune des réponses ci-dessus

Q05 : Le test ANOVA compare les moyennes en fonction de quelle distribution ?


A. Student t
B. Distribution du
C. Distribution de
D. Distribution no
E. Aucune des ré

Q06 : Une bonne revue de la littérature donne :


A. Une collection
B. Analyse et syn
C. Votre opinion
D. Présentation d
E. Une combinais

Q07 : Laquelle des affirmations suivantes est vraie ?

A. La recherche inductive (exploratoire) utilise toujours un modèle conceptuel comme


point de départ
B. La recherche déductive (confirmatoire) part d'un modèle conceptuel proposé à
partir de la littérature existante
C. Les concepts d'un modèle conceptuel peuvent être mesurés à l'aide d'un ensemble
de questions ou d'éléments inter-corrélés appelés "échelles"
D. B et C à la fois
E. A et C à la fois

Q08 : Quelle technique d'analyse de données vous permet d'examiner graphiquement la


relation entre plus de deux variables nominales dans un espace multidimensionnel ?
A. Analyse des correspondances multiples
B. Analyse en composantes principales
C. ANOVA
D. Régression linéaire simple
E. Régression linéaire multiple

3
Q09 : Une méthode de recherche qualitative pourrait être :

A. Une étude de recherche ethnographique.


B. Un groupe de discussion (focus group).
C. Un entretien.
D. Une étude projective.
E. Toutes les affirmations ci-dessus sont correctes.

Q10 : Les questions qu'un chercheur doit se poser pour formuler les objectifs de la
recherche sont les suivantes :

A. Quelle est la nature du projet ?


B. Quel est le plan de projet envisagé ?
C. Quels cadres théoriques/conceptuels sont pertinents ?
D. Quelle est la posture épistémologique ?
E. A, B et D
F. Toutes ces questions sont correctes

4
PARTIE II: REPONDRE AUX QUESTIONS SUIVANTES EN QUELQUES
PHRASES

Q11. Quelles sont les conditions d’utilisation d’une analyse factorielle des
correspondances simples, symbolisée AFC ?

Q12. Lors d’une étude de littérature, quelles sont les étapes principales de l’approche
systématique ?

Q13. Que signifient le KMO et Sphericité de Bartlett? Comment les interprète-t-


on pendant une ACP ?

Q14. Dans l'analyse des correspondances multiples (AMC), qu'indiquent les valeurs
plus élevées des scores de contribution (CTR) ?

Q15. Décrivez les différences entre les corrélations paramétriques et non paramétriques.

Q16. Énumérez toutes les étapes de recherche clés utilisées pour le projet de classe sur
les comportements de consommation durables dans la nouvelle normalité. Indiquez
lesquelles de ces étapes étaient qualitatives/quantitatives, exploratoires/confirmatoires et
inductives/déductives.

Q17. Qu'est-ce que la standardisation des variables et quand est-elle utile ?

Q18. Quelle est l’hypothèse nulle du test d’homogénéité réalisé lors de l’ANOVA ?
Quelle est l’hypothèse alternative ?

Q19. Décrivez les étapes impliquées dans l'exécution d'une régression linéaire multiple.
Quels contrôles a priori et post hoc pouvez-vous utiliser pour vous assurer de la validité
des résultats ?

Q20. Que représente l’« inertie » dans le résultat d’une analyse AFC ?
5
PARTIE III: INTERPRETEZ LES RESULTATS, EFFECTUER DES CALCULS SI
NECESSAIRE ET REPONDEZ AUX QUESTIONS

REGRESSION LINEARE MULTIPLE


Une enquête a été effectuée dans 79 pays développés afin de déterminer les facteurs qui
expliqueraient le tourisme (nombre de touristes reçus par chaque). Les facteurs expliquant le
tourisme sont la croissance économique (Croissance), le niveau des prix (Prix), le degré
d’ouverture (Ouverture), et le nombre de personnes utilisant internet (Internet).

Récapitulatif du modèle
Modèle R R-deux R-deux ajusté Erreur standard de l'estimation
1 ,687a ,635 ,417 21,285
a. Prédicteurs : (Constante), Internet , Ouverture, Croissance, Prix
b. Variable dépendante : Touristes

ANOVAa
Somme des
Modèle carrés ddl Carré moyen F Sig.
1 Régression 1217,405 4 304,351 67,2 ,014b
de Student 33525,982 74 453,054
Total 34743,387 78
a. Variable dépendante : Touristes
b. Prédicteurs : (Constante), Internet , Ouverture, Croissance, Prix

Coefficientsa
Coefficients non Coefficients Intervalle de confiance à Statistiques de
standardisés standardisés 95,0% pour B colinéarité
Erreur Borne Borne
Modèle B standard Bêta t Sig. inférieure supérieure Tolérance VIF
1 (Constante) 60,707 32,840 1,849 ,069 -4,728 126,142
Prix ,199 1,515 ,016 ,131 ,006 -3,218 2,820 ,007 4,102
Croissance ,731 1,042 ,082 ,701 ,005 -2,806 1,345 ,002 4,051
Ouverture ,023 ,035 ,075 ,648 ,519 -,047 ,092 ,002 4,029
Internet ,516 ,355 ,174 1,455 ,010 -1,223 ,191 ,001 4,098
a. Variable dépendante : Touristes

Q21. Que représente le R-deux ? Interpréter le.

6
Q22. Que représente la statistique de Fisher (F) ? Est-elle significative ? Interpréter la.

Q23. Quelle variable n’explique pas significativement le variable « Touristes »? 

Q24. Interpréter les coefficients significatifs de la régression.

Q25. Avions-nous de fortes impressions dans l’estimation des coefficients que la


colinéarité affecte les variables ? Expliquer pourquoi.

7
ACP
La perception de l’auto-efficacité est considérée par la littérature comme un facteur très
important du comportement du consommateur responsable. Le questionnaire que nous avons
administré auprès des consommateurs français a mesuré l’auto-efficacité (variable latente) à
l’aide échelle de Likert de 5 points et comportant 5 items :
Q20 Je suis convaincu que : (1=Pas du tout d'accord à 5=Très d'accord)
A. Mes actions personnelles ont une influence sur le développement durable
B. Les membres de ma communauté prennent des mesures pour faire face au changement
durable.
C. Mes actions visant à réduire les effets du réchauffement planétaire et du changement
climatique dans ma communauté encourageront les autres à réduire les effets du
réchauffement planétaire par leurs propres actions.
D. Je ne peux rien faire pour aider à contrôler la pollution de l'environnement.
E. Mon comportement peut avoir un effet positif sur le développement durable

Le tableau ci-dessous donne les coefficients de corrélation entre les facteurs (composantes)
extraits et les 5 items initiaux (Matrice des composantes)
Corrélations entre les facteurs et les items (Matrice des composantes)
Composantes ou facteurs
ITEMS
1 2 3 4 5
Q20A 0,816 -0,016 0,219 0,465 -0,262
Q20C 0,807 0,209 -0,092 -0,432 -0,332
Q20E 0,790 -0,228 0,406 -0,180 0,356
Q20B 0,734 0,390 -0,451 0,150 0,288
Q20D -0,290 0,900 0,324 -0,002 0,038

alors que le tableau ci-dessous donne les carrés des coefficients de corrélation entre les
facteurs (composantes) extraits et les 5 items initiaux.

Corrélations entre les facteurs et les items (Matrice des composantes)


Composantes ou facteurs
ITEMS
1 2 3 4 5
Q20A 0,666 0.000 0,048 0,216 0,069

Q20C 0,651 0,044 0,008 0,187 0,11

Q20E 0,624 0,052 0,165 0,032 0,127

Q20B 0,539 0,152 0,203 0,023 0,083

Q20D 0,084 0,81 0,105 0.000 0,001

Valeur propre 2,564 1,058 0,530 0,390


Pourcentage 51,29 21,164 10,594 7,802

Il vous est demandé de répondre aux questions suivantes :


Q26 Quel est le nombre de facteurs à retenir pour le modèle ? Argumentez votre choix.
A. 1
B. 2
C. 3
D. 4

8
E. 5

Q27 Supposons que nous retenons 3 facteurs. De combien est la qualité de représentation (la
part de la variance expliquée par le modèle à trois facteurs) pour l’item Q20C ?
A. 47,5 %
B. 52,7 %
C. 60,1 %
D. 70,3%
E. 83,05 %

Q28 Que vaut la valeur propre du facteur 4 ? Expliquer la démarche.


A. 0,256
B. 0,287
C. 0,458
D. 0,548
E. 0,687

Q29 Supposons que nous ne retenons que 2 facteurs. De combien est la variance
« expliquée » par le modèle retenu ?
A. 29,154 %
B. 35,254 %
C. 61,458, %
D. 98,831 %
E. 72,454 %

En supposant que le modèle est monodimensionnel (1 seul facteur retenu) nous avons calculé
la fiabilité de l’échelle (alpha de Cronbach) : α =0 , 579. Le tableau ci-dessous donne l’Alpha
de Cronbach en cas de suppression de l'élément.

Statistiques de total des éléments


Moyenne de l'échelle en Variance de l'échelle en Corrélation complète Alpha de Cronbach en
cas de suppression d'un cas de suppression d'un des éléments cas de suppression de
élément élément corrigés l'élément
Q20A 13,13 6,138 ,525 ,413
Q20B 13,46 6,118 ,573 ,390
Q20C 13,35 6,004 ,598 ,374
Q20D 14,44 9,778 -,178 ,802
Q20E 12,91 6,825 ,426 ,478

Q30 Que pensez-vous de la fiabilité (cohérence) de cette échelle? En d’autres mots, est-ce
que les 5 items que nous avons choisis pour mesurer l’auto-efficacité sont cohérents?
Sinon, est-il possible d’améliorer la fiabilité de l’échelle et si oui, comment?

9
Valeur critiques de t

ν t 0 ,25 t 0 ,20 t 0 ,15 t 0 ,10 t 0 ,05 t 0 ,025 t 0 ,01 t 0 ,005 t 0 ,0025 t 0 ,001 t 0 ,0005
1 1 1,376 1,963 3,078 6,314 12,71 31,82 63,66 127,3 318,3 636,6
2 0,816 1,061 1,386 1,886 2,92 4,303 6,965 9,925 14,09 22,33 31,6
3 0,765 0,978 1,25 1,638 2,353 3,182 4,541 5,841 7,453 10,21 12,92
4 0,741 0,941 1,19 1,533 2,132 2,776 3,747 4,604 5,598 7,173 8,61
5 0,727 0,92 1,156 1,476 2,015 2,571 3,365 4,032 4,773 5,893 6,869
6 0,718 0,906 1,134 1,44 1,943 2,447 3,143 3,707 4,317 5,208 5,959
7 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,499 4,029 4,785 5,408
8 0,706 0,889 1,108 1,397 1,86 2,306 2,896 3,355 3,833 4,501 5,041
9 0,703 0,883 1,1 1,383 1,833 2,262 2,821 3,25 3,69 4,297 4,781
10 0,7 0,879 1,093 1,372 1,812 2,228 2,764 3,169 3,581 4,144 4,587
11 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 3,497 4,025 4,437
12 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 3,428 3,93 4,318
13 0,694 0,87 1,079 1,35 1,771 2,160 2,650 3,012 3,372 3,852 4,221
14 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 3,326 3,787 4,14
15 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 3,286 3,733 4,073
16 0,69 0,865 1,071 1,337 1,746 2,12 2,583 2,921 3,252 3,686 4,015
17 0,689 0,863 1,069 1,333 1,74 2,11 2,567 2,898 3,222 3,646 3,965
18 0,688 0,862 1,067 1,33 1,734 2,101 2,552 2,878 3,197 3,61 3,922
19 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,174 3,579 3,883
20 0,687 0,86 1,064 1,325 1,725 2,086 2,528 2,845 3,153 3,552 3,85
21 0,686 0,859 1,063 1,323 1,721 2,08 2,518 2,831 3,135 3,527 3,819
22 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,119 3,505 3,792
23 0,685 0,858 1,06 1,319 1,714 2,069 2,5 2,807 3,104 3,485 3,767
24 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,091 3,467 3,745
25 0,684 0,856 1,058 1,316 1,708 2,06 2,485 2,787 3,078 3,45 3,725
26 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,067 3,435 3,707
27 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771 3,057 3,421 3,69
28 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763 3,047 3,408 3,674
29 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,038 3,396 3,659
30 0,683 0,854 1,055 1,31 1,697 2,042 2,457 2,75 3,03 3,385 3,646
40 0,681 0,851 1,05 1,303 1,684 2,021 2,423 2,704 2,971 3,307 3,551
50 0,679 0,849 1,047 1,299 1,676 2,009 2,403 2,678 2,937 3,261 3,496
60 0,679 0,848 1,045 1,296 1,671 2 2,39 2,66 2,915 3,232 3,46
80 0,678 0,846 1,043 1,292 1,664 1,99 2,374 2,639 2,887 3,195 3,416
100 0,677 0,845 1,042 1,29 1,66 1,984 2,364 2,626 2,871 3,174 3,39
120 0,677 0,845 1,041 1,289 1,658 1,98 2,358 2,617 2,86 3,16 3,373
∞  0,674 0,842 1,036 1,282 1,645 1,96 2,326 2,576 2,807 3,09 3,291

Remarque  : la dernière ligne du tableau ci-dessus correspond aux grandes valeurs de k. Il


s’agit d’un cas limite pour lequel la loi de Student est équivalente à la loi normale centrée et
réduite.

10

Vous aimerez peut-être aussi