Académique Documents
Professionnel Documents
Culture Documents
Au-delà de ces deux principes essentiels, qui visent à accroître la validité interne,
3099
il est également possible d’augmenter le nombre de cas afin d’améliorer la validité
externe. Ces nouveaux cas seront alors sélectionnés de manière à faire varier le
8459
contexte d’observation (par exemple, localisation géographique, type
d’organisation…). Par ailleurs, le nombre d’éléments d’un échantillon destiné à un
8:16
traitement qualitatif pourra tenir compte des critères de crédibilité habituels dans la
9.10
communauté à laquelle le chercheur appartient.
3 0.21
Section 96.7
Démarches de constitution
17:1
d’un échantillon
8208
elles peuvent être rattachées à deux démarches génériques, qui seront présentées dans
un premier temps : la démarche traditionnelle, caractéristique d’un échantillonnage
5753
constitution d’un échantillon inclut également les traitements effectués après le recueil
des données. Ces traitements ex post de l’échantillon seront présentés dans la dernière
ont:2
253
.scho
Partie 2 ■ Mettre en œuvre
3099
Démarche traditionnelle Démarche itérative
Définition de la population Définition de l’unité d’analyse
8459
8:16
Choix d’une méthode
Choix d’une unité d’observation
de constitution de l’échantillon
9.10
Détermination de la taille
Collecte et analyse des données
0.21
de l’échantillon
Définition de l’univers
Échantillon utile
1108
étape peuvent amener à reconsidérer des choix antérieurs (Henry, 1990). Par exemple,
si la taille de l’échantillon nécessaire apparaît trop importante compte tenu des coûts
:Gro
254
.scho
Échantillon(s) ■ Chapitre 8
3099
sélections successives, Glaser et Strauss (1967) recommandent d’étudier tout
d’abord des unités similaires, de manière à faire émerger une théorie substantive
8459
avant d’étendre la collecte à des unités présentant d’autres caractéristiques. Le
processus s’achève lorsque l’on est parvenu à la saturation théorique. Contrairement
8:16
à la démarche classique, la taille et la composition de l’échantillon ne sont pas
prédéterminées mais au contraire résultent du processus itératif de choix successifs
9.10
d’éléments. Ces choix sont guidés par l’observation et la théorie en construction.
L’univers de généralisation des résultats s’élabore progressivement au cours de la
0.21
démarche et est défini de manière théorique à l’issue du processus.
les critères de segmentation d’un échantillon stratifié. De même, dans les recherches
qualitatives, le cas pilote (Yin, 2014) permet de déterminer la composition et la taille
1108
la taille avant de collecter les données. Une autre approche consiste à collecter des
données jusqu’à ce qu’on ait atteint le degré de précision ou le seuil de signification
:Gro
255
.scho
Partie 2 ■ Mettre en œuvre
effet, déterminer une taille minimale a priori conduit généralement à des échantillons
plus grands que ce qui est nécessaire. Souvent, par mesure de précaution, le
chercheur retient les estimations les plus pessimistes pour calculer la taille de
l’échantillon, ce qui conduit fréquemment à le surdimensionner.
Cette démarche, qui permet de réduire les coûts de collecte de données, n’est
malheureusement pas toujours utilisable. Considérons, à titre d’illustration, une étude
cherchant à analyser l’impact d’un événement non reproductible, tel que la fusion de
deux entreprises, sur une variable – par exemple, la motivation des cadres. Dans une
étude de ce type, qui repose sur la collecte de données avant et après l’événement
considéré, il n’est pas possible d’augmenter progressivement le nombre d’éléments de
3099
l’échantillon. Par conséquent, il est indispensable de recourir à la démarche classique,
qui conduit à déterminer a priori la taille de l’échantillon.
8459
De plus, même s’il est possible de constituer progressivement un échantillon, il
demeure intéressant d’en estimer la taille a priori. Sans estimation préalable, le
8:16
risque encouru est que l’échantillon ne puisse être étendu, par exemple pour des
contraintes budgétaires, et qu’il se révèle trop petit pour atteindre la précision ou le
9.10
seuil de signification souhaités.
0.21
Dans tous les cas, déterminer la taille de l’échantillon a priori permet d’évaluer le
caractère réalisable des objectifs que le chercheur souhaite atteindre. Procéder de la
96.7
sorte permet ainsi d’éviter des efforts qui auraient abouti à des résultats peu
satisfaisants et d’envisager suffisamment tôt un autre design de recherche, qui soit
17:1
Lorsqu’on étudie des phénomènes en situation réelle, que les phénomènes sont
rares, difficilement identifiables ou accessibles, ou que la population étudiée est mal
5753
management sur l’apparition d’une crise. Étant donné la faible occurrence des crises
et la difficulté d’accès aux données, la constitution de l’échantillon d’entreprises
ont:2
ayant connu des crises sera constitué en fonction des opportunités qui se présentent.
Pour pouvoir effectuer un test, l’échantillon de contrôle est alors construit a
Clerm
posteriori (Schlesselman, 1981). À cet effet, un groupe témoin est prélevé dans la
population de référence en respectant une procédure d’échantillonnage aléatoire, de
ESC
telle sorte que la structure du groupe de contrôle reproduise celle du groupe observé.
En reprenant l’exemple précédent, l’échantillon de contrôle sera formé d’entreprises
upe
similaires à celles de l’échantillon d’entreprises ayant connu des crises, par exemple
en termes de secteur, de taille, de période… Cette procédure appelée case-control
:Gro
2012).
larvo
256
.scho
Échantillon(s) ■ Chapitre 8
Il est souvent possible de corriger a posteriori des biais non liés à l’échantillonnage
tels que les non-réponses et les erreurs de réponse. Rappelons, cependant, que le
redressement des données ne constitue qu’une solution de repli, et qu’il est
préférable de chercher à éviter les biais.
3099
Les non-réponses peuvent engendrer des biais de représentativité de l’échantillon.
Afin de détecter ce type de biais, on peut comparer la structure de l’échantillon de
8459
répondants avec celle de la population dont il est issu, à partir de variables
susceptibles d’influencer le phénomène étudié. Si un écart apparaît, il est probable
8:16
qu’un biais de représentativité existe. Il conviendra alors, dans la mesure du possible,
de le corriger. Trois procédures de redressement des non-réponses peuvent être
9.10
mises en œuvre à cet effet.
0.21
• L’interrogation d’un sous-échantillon de non-répondants
Parmi les non-répondants de l’échantillon, un sous-échantillon est désigné par
96.7
tirage aléatoire, le chercheur devant alors s’efforcer d’obtenir une réponse de
17:1
l’intégralité des éléments appartenant à ce sous-échantillon (Droesbeke et al., 1987).
Les réponses obtenues seront ensuite comptées plusieurs fois, de manière à retrouver
8208
stratification (taille, effectifs, secteur d’activité pour une population d’entreprises, par
exemple) pour chacun des éléments de la population. Il suffit, en effet, de connaître
Clerm
la distribution globale de ces caractères sur la population. Les réponses des éléments
de l’échantillon sont alors affectées de coefficients de telle sorte que l’on retrouve la
structure de la population. Par exemple, si la proportion d’entreprises appartenant à
ESC
un secteur d’activité donné est de 20 % dans la population, et que l’on constate a
posteriori qu’elle est de 15 % dans l’échantillon observé, il conviendra, lors du
upe
1987). En outre, elle peut être mise en œuvre dans deux autres situations : lorsqu’une
larvo
257
.scho
Partie 2 ■ Mettre en œuvre
stratification a priori n’a pu être réalisée pour des raisons techniques (base de
sondage non disponible ou insuffisamment renseignée), ou encore lorsque l’on ne
découvre que tardivement, durant la phase d’exploitation des données, une nouvelle
variable de stratification. Dans tous les cas, effectuer une stratification a posteriori
permet d’augmenter la précision des estimations effectuées sur l’échantillon observé.
• Le remplacement des individus défaillants
Si l’on ne dispose pas d’informations sur l’ensemble de la population, il reste
possible de remplacer les éléments défaillants. Pour ce faire, il faut tout d’abord
essayer d’identifier certaines caractéristiques observables des non-répondants. Par
exemple, si une entreprise a refusé de répondre à une enquête, on pourra essayer de
3099
connaître certaines de ses caractéristiques à partir d’informations publiques (secteur
d’activité, chiffre d’affaires). Deux solutions sont ensuite possibles. La première
8459
consiste à identifier, parmi les répondants, des éléments qui présentent des
caractéristiques identiques à celles des défaillants, et à leur affecter un coefficient de
8:16
pondération pour compenser les non-réponses. Une autre solution conduit, pour
chaque non-répondant, à inclure dans l’échantillon un répondant supplémentaire,
9.10
aussi semblable que possible au non-répondant. Cette méthode peut également être
0.21
utilisée pour redresser les réponses manquantes lorsque les individus n’ont que
partiellement répondu aux questions posées (Droesbeke et al., 1987).
96.7
Si, à l’issue de ces procédures de redressement, il n’a pas été possible d’obtenir
17:1
des données sur certains sous-groupes bien identifiés de l’échantillon, il conviendra
de redéfinir la population de référence ou, du moins, d’indiquer cette limite de
8208
l’étude.
• Les erreurs de réponses
0:88
Il est alors très difficile de détecter le biais correspondant et, a fortiori, de le corriger.
Clerm
Malgré toutes les précautions prises, il arrive que la taille de l’échantillon se révèle
insuffisante après traitement pour obtenir la précision ou le seuil de signification
upe
souhaités. Dans ce cas, la meilleure solution consiste à faire une nouvelle vague de
recueil de données qui viendra grossir l’échantillon. Toutefois, cette solution n’est
:Gro
pas toujours possible. C’est le cas, par exemple, lorsqu’on travaille sur des fichiers
de données secondaires, lorsque le fichier a été entièrement exploité ou lorsque les
x.com
258
.scho
Échantillon(s) ■ Chapitre 8
3099
davantage de confiance.
8459
Le bootstrap fonctionne selon un principe relativement proche mais la constitution
des échantillons est différente. Les échantillons sont obtenus par un tirage aléatoire
8:16
avec remise dans l’échantillon de départ et comportent le même nombre d’éléments
(n) que l’échantillon de départ. Le nombre d’échantillons tirés de l’échantillon
9.10
initial par bootstrap peut être très élevé. Il ne dépend pas de la taille de l’échantillon
de départ.
0.21
Les méthodes jackknife et bootstrap sont applicables aussi bien sur des statistiques
de base telles que la moyenne ou la variance que sur des méthodes plus complexes 96.7
telles que LISREL ou PLS (cf. exemple d’utilisation).
17:1
8208
Dans une recherche concernant les relations entre la stratégie de l’entreprise, la structure du
marché, et la rentabilité et le risque, Cool, Dierickx et Jemison (1989) testent leur modèle
5753
sur un petit échantillon de 21 banques commerciales avec une méthode PLS. En plus des
résultats fournis par PLS, ils utilisent également le jackknife pour évaluer les résultats sta-
1108
tistiques. Vingt échantillons sont extraits de l’échantillon initial. Les analyses sont prati-
© Dunod – Toute reproduction non autorisée est un délit.
quées sur ces nouveaux échantillons. Le test de différence entre les résultats de PLS et ceux
obtenus avec le jackknife conduisent les auteurs à rejeter une de leur hypothèse et à confor-
ont:2
Conclusion
upe
que les démarches générales qu’il est possible de mettre en œuvre. Chacune des
méthodes présente des avantages et des inconvénients, qui s’expriment notamment en
larvo
259
.scho
Partie 2 ■ Mettre en œuvre
3099
Pour aller plus loin
8459
8:16
Charmaz K. ; Constructing Grounded Theory : A Practical Guide Through
Qualitative Analysis. London : Sage, 2006.
9.10
Droesbeke J.J., Ficher B., Tassi P. (éd.), Les sondages, Paris, Economica, 1987.
0.21
Henry G. T., Practical Sampling, Newbury Park, CA, Sage, 1990.
Saporta, G., Probabilités, analyse des données et statistique, 3e éd, Paris, Technip,
2011. 96.7
Shadish W.R., Cook T.D., Campbell D.T. Experimental and Quasi-Experimental
17:1
Designs for Generalized Causal Inference, Boston, MA : Houghton Mifflin, 2002.
8208
Yin R.K. Case Study Research : Design and Methods, 4e éd., Thousand Oaks, CA :
Sage, 2014.
0:88
5753
1108
ont:2
Clerm
ESC
upe
:Gro
x.com
larvo
260
.scho