Vous êtes sur la page 1sur 12

Epreuve

EP 09

ICN Année universitaire 2021-2022

À compléter par l’étudiant

NOM : OMAR AGHA Prénom : Chantal

Décembre 2021

PGE3/ MSc2/ Alt

Session 1

Semestre 1

- Analyse de données -

Durée : 24 h
D. FILALI, S. IVANAJ, K. AFAWUBO, E. KOUDOU, H. MAVOORI

Consignes :

• Vous devez soumettre vos réponses avant 9h, le 15 décembre sur MyICN dans le dépôt
«EXAMEN SEMESTRE 1 SESSION 1 - FR Analyse de données -…»
• Calculatrice ou tableur (Excel ou équivalent) autorisé(e) pour les calculs
• Aucun plagiat ne sera toléré et les étudiants acceptent de suivre sur l’honneur ces
instructions
• Cet examen est strictement personnel
Sujet : voir page suivante

IMPORTANT:

Cet examen est strictement individuel et votre copie est susceptible d'être analysée
par un logiciel anti-plagiat.

En remettant votre copie, vous vous engagez à rendre un travail individuel et


réalisé dans les règles précisées sur le présent sujet d'examen.

La détection de plagiat et/ou le non respect des règles conduira à l'attribution de la


note de zéro aux copies concernées et un conseil de discipline pourra être organisé.

1
PARTIE I : CHOISISSEZ LA BONNE REPONSE (UNE SEULE)

Merci de surligner la bonne réponse pour chaque question

Q01 : Dans le cadre d’un essai pilote pour tester un questionnaire, lequel des conseils
suivants n’est pas pertinent ?
A. Les répondants de l'essai pilote doivent être tirés de la même population que celle
ciblée pour l’étude
B. La taille de l'échantillon de l'essai pilote est généralement faible - entre 15 et 30
répondants.
C. Les essais pilotes devraient être administrés dans un contexte différent de celui de
l'enquête.

Q02 : Laquelle des affirmations suivantes est vraie ?

A. Une séquence d'entretien est établie avec des questions prédéterminées


B. Une recherche exploratoire est utilisée lorsque le chercheur n'a pas assez
d'informations sur des phénomènes particuliers
C. Les membres d’un focus-group peuvent se sentir intimidés les uns par les autre et ainsi
restreindre et limiter leurs réponses aux questions du modérateur
D. Tout ce qui précède
E. Aucune de ces réponses

Q03 : Dans cette technique d'analyse quantitative, une analyse des tableaux de
contingence comprend souvent l'examen des profils de lignes et de colonnes et le
test d'indépendance via la statistique du chi carré.

A. Analyse en composantes principales


B. ANOVA
C. Analyse factorielle des correspondances
D. Régression linéaire simple
E. Régression linéaire multiple

Q04 : Quel type de problème à éviter un facteur d'inflation à variance (VIF) élevée
signale-t-il ?

A. Non-linéarité des corrélations


B. Multi-colinéarité en régression linéaire simple
C. Sphéricité dans l'analyse en composantes principales

2
D. Multi-colinéarité dans la régression linéaire multiple
E. Aucune des réponses ci-dessus

Q05 : Le test ANOVA compare les moyennes en fonction de quelle distribution ?


A. Student t
B. Distribution du
C. Distribution de
D. Distribution no
E. Aucune des ré

Q06 : Une bonne revue de la littérature donne :


A. Une collection
B. Analyse et syn
C. Votre opinion
D. Présentation d
E. Une combinais

Q07 : Laquelle des affirmations suivantes est vraie ?

A. La recherche inductive (exploratoire) utilise toujours un modèle conceptuel comme


point de départ
B. La recherche déductive (confirmatoire) part d'un modèle conceptuel proposé à
partir de la littérature existante
C. Les concepts d'un modèle conceptuel peuvent être mesurés à l'aide d'un ensemble
de questions ou d'éléments inter-corrélés appelés "échelles"
D. B et C à la fois
E. A et C à la fois

Q08 : Quelle technique d'analyse de données vous permet d'examiner graphiquement la


relation entre plus de deux variables nominales dans un espace multidimensionnel ?
A. Analyse des correspondances multiples
B. Analyse en composantes principales
C. ANOVA
D. Régression linéaire simple
E. Régression linéaire multiple

3
Q09 : Une méthode de recherche qualitative pourrait être :

A. Une étude de recherche ethnographique.


B. Un groupe de discussion (focus group).
C. Un entretien.
D. Une étude projective.
E. Toutes les affirmations ci-dessus sont correctes.

Q10 : Les questions qu'un chercheur doit se poser pour formuler les objectifs de la
recherche sont les suivantes :

A. Quelle est la nature du projet ?


B. Quel est le plan de projet envisagé ?
C. Quels cadres théoriques/conceptuels sont pertinents ?
D. Quelle est la posture épistémologique ?
E. A, B et D
F. Toutes ces questions sont correctes

4
PARTIE II: REPONDRE AUX QUESTIONS SUIVANTES EN QUELQUES
PHRASES

Q11. Quelles sont les conditions d’utilisation d’une analyse factorielle des
correspondances simples, symbolisée AFC ?

Les conditions d’utilisation d’une analyse factorielle des correspondances simples,


symbolisée AFC sont axées vers l’analyse qui permet d’étudier l’association entre plusieurs
variable notamment deux variables quantitatives et elles sont basés sur l’inertie. Ce but de
l’analyse factorielle des correspondances c’est de pouvoir représenter le plus grand nombre de
l’inertie totale sur le premier axe factoriel, sur le second axe un maximum de l’inertie
résiduelle et ce jusqu’à la dernière dimension.

On constate qu’il est essentiel de sélectionner les axes car elles sont significatives (la valeur
maximale de variance sur l’axe doit être supérieure au nombre de rendre compte de toute
l’inertie, soit le nombre de modalités moins une, de la variable la plus courte).

Enfin, pour qu’un modèle soit intéressant le plus petit nombre de dimensions rendent compte
de la plus grande part de l’inertie et pour qu’un modèle soit conforme les axes sélectionnés
rendent compte avec une grande moitié de l’inertie. (Exemple : (> 50%)

Q12. Lors d’une étude de littérature, quelles sont les étapes principales de l’approche
systématique ?

Il est important de noter que la revue systémique est définie par un rassemblement, une
évaluation et une synthèse des résultats des investigations initiales.
L’objectif est d’établir un résumé qualitatif.

Lors d’une étude de littérature, les étapes principales de l’approche systémique sont les
entrées en premier lieu, dans un second temps il s’agit du traitement puis pour finir les
résultats.

Cette revue systémique est décomposée est plusieurs parties (8) :


1. La définition de la question de recherche et des critères d’inclusion des études 
2. Récupérer les études 
3. Sélectionner les études et recueillir les données 
4. Évaluer le risque de biais dans les études 
5. Analyser les données 
6. Évaluer les biais de la revue systématique  
7. Présenter les résultats et les tableaux 
8. Interpréter les résultats et en tirer des conclusions

Par ailleurs, il est primordial de noter que l’étude de littérature implique quelques étapes lors
de la réalisation de l’approche systémique en commençant par l’input (sélectionner de
documents utilisés en fonction du thème, du sujet), le processing (collecte et évaluation de
l’information) puis l’output (analyse des documents, permettant de tirer les conclusions)

Enfin, il reste 6 principales étapes permettant la réalisation de l’approche systémique étant


l’interconnexion, la synthèse, l’émergence, la boucle de rétroaction, la causalité puis la
cartographie.

5
Q13. Que signifient le KMO et Sphericité de Bartlett? Comment les interprète-t-
on pendant une ACP ?

Le KMO est un indice défini par Kaiser-Mayer-Olkin. L’indice KMO varie entre 0 et 1 s’il est
proche de 0, les corrélations partielles sont identiques aux corrélations brutes c’està-àdire
qu’une compression efficace n’est pas possible.

La sphéricité de Barlett est un test, représentant des outils qui permettent de mesurer la
pertinence de l’échantillon. Ce test est statistique relatif à l’indépendance globale des
composantes d’un vecteur complétement aléatoires. Celui-ci est basé sur le déterminant d’une
estimation de la matrice de corrélation.
L’objectif de la sphéricité de Barlett (permettant une mesure globale en s’appuyant sur des
données statistiques) de détecter dans quelle mesure la matrice de corrélation calcule diverge
de la matrice unité.

Il est important de les distinguer car le KMO est un indice de solution factorielle indiquant
l’ensemble des variables retenu étant un ensemble cohérent qui va nous permettre de
constituer une mesure adéquate de certains concepts.

Pour les interpréter durant une ACP, il faut utiliser la matrice de corrélation. En effet, la
Sphéricité de Barlett permet d’avoir un test à l’utilisateur afin de connaitre les corrélations
nulles (si possible). Lors d’une ACP, l’indice KMO quant à lui permet de savoir si un lien de
corrélation existe.

Q14. Dans l'analyse des correspondances multiples (AMC), qu'indiquent les valeurs
plus élevées des scores de contribution (CTR) ?

Q15. Décrivez les différences entre les corrélations paramétriques et non paramétriques.

Lors d’une corrélation paramétrique, les variables doivent être continues ou sur des valeurs
d'intervalle. Les variables sont normalement distribuées avec Pearson.

Dans une corrélation non paramétrique, les variables doivent être ordinales, discrètes et n'ont
pas besoin d'être distribuées normalement

Q16. Énumérez toutes les étapes de recherche clés utilisées pour le projet de classe sur
les comportements de consommation durables dans la nouvelle normalité. Indiquez
lesquelles de ces étapes étaient qualitatives/quantitatives, exploratoires/confirmatoires et
inductives/déductives.

Les étapes de recherches clés utilisées pour le projet de classe sur les comportements de
consommation durables dans la nouvelle normalité sont composé de 6 étapes. En effet :
- Collecte d’informations
- Modèle conceptuel (déductif)
- Hypothesis (inductive)

6
- Création de guide d’interview (qualitative)
- Sondage (questionnaire, quantitative cette fois-ci)
- Réponse du sondage (quantitative et qualitative)

Q17. Qu'est-ce que la standardisation des variables et quand est-elle utile ?

La standardisation des variables amène à la transformation de la variable aléatoire afin de la


ramener à une véritable distribution centrée réduite.
Elle permet de créer des nouvelles variables qui permettent d’augmenter la connaissance de la
distribution pour utiliser les tables de distribution.

Q18. Quelle est l’hypothèse nulle du test d’homogénéité réalisé lors de l’ANOVA ?
Quelle est l’hypothèse alternative ?

Q19. Décrivez les étapes impliquées dans l'exécution d'une régression linéaire multiple.
Quels contrôles a priori et post hoc pouvez-vous utiliser pour vous assurer de la validité
des résultats ?

Q20. Que représente l’« inertie » dans le résultat d’une analyse AFC ?

L’inertie dans le résultat d’une analyse AFC est un indicateur de dispersion de nuage de point.
L’inertie permet donc de mesurer la lésion entre deux variables qualitatives.

7
PARTIE III: INTERPRETEZ LES RESULTATS, EFFECTUER DES CALCULS SI
NECESSAIRE ET REPONDEZ AUX QUESTIONS

REGRESSION LINEARE MULTIPLE


Une enquête a été effectuée dans 79 pays développés afin de déterminer les facteurs qui
expliqueraient le tourisme (nombre de touristes reçus par chaque). Les facteurs expliquant le
tourisme sont la croissance économique (Croissance), le niveau des prix (Prix), le degré
d’ouverture (Ouverture), et le nombre de personnes utilisant internet (Internet).

Récapitulatif du modèle
Modèle R R-deux R-deux ajusté Erreur standard de l'estimation
1 ,687a ,635 ,417 21,285
a. Prédicteurs : (Constante), Internet , Ouverture, Croissance, Prix
b. Variable dépendante : Touristes

ANOVAa
Somme des
Modèle carrés ddl Carré moyen F Sig.
1 Régression 1217,405 4 304,351 67,2 ,014b
de Student 33525,982 74 453,054
Total 34743,387 78
a. Variable dépendante : Touristes
b. Prédicteurs : (Constante), Internet , Ouverture, Croissance, Prix

Coefficientsa
Coefficients non Coefficients Intervalle de confiance à Statistiques de
standardisés standardisés 95,0% pour B colinéarité
Erreur Borne Borne
Modèle B standard Bêta t Sig. inférieure supérieure Tolérance VIF
1 (Constante) 60,707 32,840 1,849 ,069 -4,728 126,142
Prix ,199 1,515 ,016 ,131 ,006 -3,218 2,820 ,007 4,102
Croissance ,731 1,042 ,082 ,701 ,005 -2,806 1,345 ,002 4,051
Ouverture ,023 ,035 ,075 ,648 ,519 -,047 ,092 ,002 4,029
Internet ,516 ,355 ,174 1,455 ,010 -1,223 ,191 ,001 4,098
a. Variable dépendante : Touristes

8
Q21. Que représente le R-deux ? Interpréter le.

Le R-deux représente un coefficient de détermination. Celui-ci permet de juger de la qualité


d’une régression linéaire. Cela veut dire que le R-deux de à,635 démontre la corrélation entre
la dépendance des facteurs, d’ouverture et la croissance sur le tourisme.

Q22. Que représente la statistique de Fisher (F) ? Est-elle significative ? Interpréter la.

La statistique de Fisher (F), représente l’hypothèse nulle de deux lois normales ayant la
variante. Cette statistique est significative car l’hypothèse nulle est rejetée car le sigma
(0,014) est proche de 0 alors que F (Fisher) est de 67,2 est complétement supérieure à 0.
Cette justification est faite car on retrouve au moins un facteur qui ont eu un effet sur le
tourisme.

Q23. Quelle variable n’explique pas significativement le variable « Touristes »? 

La variable qui n’explique pas significativement la variable « tourisme » est la variable


Ouverture ayant un sigma de 0,519 supérieur au seuil de 5%. Donc, cette variable n’a pas
beaucoup d’influence sur la variable touristes.

Q24. Interpréter les coefficients significatifs de la régression.

Q25. Avions-nous de fortes impressions dans l’estimation des coefficients que la


colinéarité affecte les variables ? Expliquer pourquoi.

9
ACP
La perception de l’auto-efficacité est considérée par la littérature comme un facteur très
important du comportement du consommateur responsable. Le questionnaire que nous avons
administré auprès des consommateurs français a mesuré l’auto-efficacité (variable latente) à
l’aide échelle de Likert de 5 points et comportant 5 items :
Q20 Je suis convaincu que : (1=Pas du tout d'accord à 5=Très d'accord)
A. Mes actions personnelles ont une influence sur le développement durable
B. Les membres de ma communauté prennent des mesures pour faire face au changement
durable.
C. Mes actions visant à réduire les effets du réchauffement planétaire et du changement
climatique dans ma communauté encourageront les autres à réduire les effets du
réchauffement planétaire par leurs propres actions.
D. Je ne peux rien faire pour aider à contrôler la pollution de l'environnement.
E. Mon comportement peut avoir un effet positif sur le développement durable

Le tableau ci-dessous donne les coefficients de corrélation entre les facteurs (composantes)
extraits et les 5 items initiaux (Matrice des composantes)
Corrélations entre les facteurs et les items (Matrice des composantes)
Composantes ou facteurs
ITEMS
1 2 3 4 5
Q20A 0,816 -0,016 0,219 0,465 -0,262
Q20C 0,807 0,209 -0,092 -0,432 -0,332
Q20E 0,790 -0,228 0,406 -0,180 0,356
Q20B 0,734 0,390 -0,451 0,150 0,288
Q20D -0,290 0,900 0,324 -0,002 0,038

Alors que le tableau ci-dessous donne les carrés des coefficients de corrélation entre les
facteurs (composantes) extraits et les 5 items initiaux.

Corrélations entre les facteurs et les items (Matrice des composantes)


Composantes ou facteurs
ITEMS
1 2 3 4 5
Q20A 0,666 0.000 0,048 0,216 0,069

Q20C 0,651 0,044 0,008 0,187 0,11

Q20E 0,624 0,052 0,165 0,032 0,127

Q20B 0,539 0,152 0,203 0,023 0,083

Q20D 0,084 0,81 0,105 0.000 0,001

Valeur propre 2,564 1,058 0,530 0,390


Pourcentage 51,29 21,164 10,594 7,802

Il vous est demandé de répondre aux questions suivantes :


Q26 Quel est le nombre de facteurs à retenir pour le modèle ? Argumentez votre choix.
A. 1
B. 2
C. 3
D. 4

10
E. 5

Q27 Supposons que nous retenons 3 facteurs. De combien est la qualité de représentation (la
part de la variance expliquée par le modèle à trois facteurs) pour l’item Q20C ?
A. 47,5 %
B. 52,7 %
C. 60,1 %
D. 70,3%
E. 83,05 %

Q28 Que vaut la valeur propre du facteur 4 ? Expliquer la démarche.


A. 0,256
B. 0,287
C. 0,458
D. 0,548
E. 0,687

Q29 Supposons que nous ne retenons que 2 facteurs. De combien est la variance
« expliquée » par le modèle retenu ?
A. 29,154 %
B. 35,254 %
C. 61,458, %
D. 98,831 %
E. 72,454 % ((pourcentage 51,29 + 21,164).

En supposant que le modèle est monodimensionnel (1 seul facteur retenu) nous avons calculé
la fiabilité de l’échelle (alpha de Cronbach) : α =0 , 579. Le tableau ci-dessous donne l’Alpha
de Cronbach en cas de suppression de l'élément.

Statistiques de total des éléments


Moyenne de l'échelle en Variance de l'échelle en Corrélation complète Alpha de Cronbach en
cas de suppression d'un cas de suppression d'un des éléments cas de suppression de
élément élément corrigés l'élément
Q20A 13,13 6,138 ,525 ,413
Q20B 13,46 6,118 ,573 ,390
Q20C 13,35 6,004 ,598 ,374
Q20D 14,44 9,778 -,178 ,802
Q20E 12,91 6,825 ,426 ,478

Q30 Que pensez-vous de la fiabilité (cohérence) de cette échelle? En d’autres mots, est-ce
que les 5 items que nous avons choisis pour mesurer l’auto-efficacité sont cohérents?
Sinon, est-il possible d’améliorer la fiabilité de l’échelle et si oui, comment?

11
Valeur critiques de t

ν t 0 ,25 t 0 ,20 t 0 ,15 t 0 ,10 t 0 ,05 t 0 ,025 t 0 ,01 t 0 ,005 t 0 ,0025 t 0 ,001 t 0 ,0005
1 1 1,376 1,963 3,078 6,314 12,71 31,82 63,66 127,3 318,3 636,6
2 0,816 1,061 1,386 1,886 2,92 4,303 6,965 9,925 14,09 22,33 31,6
3 0,765 0,978 1,25 1,638 2,353 3,182 4,541 5,841 7,453 10,21 12,92
4 0,741 0,941 1,19 1,533 2,132 2,776 3,747 4,604 5,598 7,173 8,61
5 0,727 0,92 1,156 1,476 2,015 2,571 3,365 4,032 4,773 5,893 6,869
6 0,718 0,906 1,134 1,44 1,943 2,447 3,143 3,707 4,317 5,208 5,959
7 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,499 4,029 4,785 5,408
8 0,706 0,889 1,108 1,397 1,86 2,306 2,896 3,355 3,833 4,501 5,041
9 0,703 0,883 1,1 1,383 1,833 2,262 2,821 3,25 3,69 4,297 4,781
10 0,7 0,879 1,093 1,372 1,812 2,228 2,764 3,169 3,581 4,144 4,587
11 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 3,497 4,025 4,437
12 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 3,428 3,93 4,318
13 0,694 0,87 1,079 1,35 1,771 2,160 2,650 3,012 3,372 3,852 4,221
14 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 3,326 3,787 4,14
15 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 3,286 3,733 4,073
16 0,69 0,865 1,071 1,337 1,746 2,12 2,583 2,921 3,252 3,686 4,015
17 0,689 0,863 1,069 1,333 1,74 2,11 2,567 2,898 3,222 3,646 3,965
18 0,688 0,862 1,067 1,33 1,734 2,101 2,552 2,878 3,197 3,61 3,922
19 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,174 3,579 3,883
20 0,687 0,86 1,064 1,325 1,725 2,086 2,528 2,845 3,153 3,552 3,85
21 0,686 0,859 1,063 1,323 1,721 2,08 2,518 2,831 3,135 3,527 3,819
22 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,119 3,505 3,792
23 0,685 0,858 1,06 1,319 1,714 2,069 2,5 2,807 3,104 3,485 3,767
24 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,091 3,467 3,745
25 0,684 0,856 1,058 1,316 1,708 2,06 2,485 2,787 3,078 3,45 3,725
26 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,067 3,435 3,707
27 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771 3,057 3,421 3,69
28 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763 3,047 3,408 3,674
29 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,038 3,396 3,659
30 0,683 0,854 1,055 1,31 1,697 2,042 2,457 2,75 3,03 3,385 3,646
40 0,681 0,851 1,05 1,303 1,684 2,021 2,423 2,704 2,971 3,307 3,551
50 0,679 0,849 1,047 1,299 1,676 2,009 2,403 2,678 2,937 3,261 3,496
60 0,679 0,848 1,045 1,296 1,671 2 2,39 2,66 2,915 3,232 3,46
80 0,678 0,846 1,043 1,292 1,664 1,99 2,374 2,639 2,887 3,195 3,416
100 0,677 0,845 1,042 1,29 1,66 1,984 2,364 2,626 2,871 3,174 3,39
120 0,677 0,845 1,041 1,289 1,658 1,98 2,358 2,617 2,86 3,16 3,373
∞  0,674 0,842 1,036 1,282 1,645 1,96 2,326 2,576 2,807 3,09 3,291

Remarque  : la dernière ligne du tableau ci-dessus correspond aux grandes valeurs de k. Il


s’agit d’un cas limite pour lequel la loi de Student est équivalente à la loi normale centrée et
réduite.

12

Vous aimerez peut-être aussi