Académique Documents
Professionnel Documents
Culture Documents
1
Cours 1
CHAPITRE I
BUTS
1. OBJET ET METHODES DES STATISTIQUES
2. S’INITIER AUX TYPES DE VARIABLES
3. APPRENDRE A DECRIRE UN PLAN DE
RECUEIL DES DONNEES
1. OBJET ET MÉTHODES DES STATISTIQUES
3
► La statistique inférentielle: méthodes permettant de tester si un résultat
observé dans un échantillon pourrait être le simple fait du hasard, ou s’il
correspond à un phénomène réel.
▪ Terminologie et notations
La statistique s’intéresse à des populations c’est-à-dire à des
multiplicités.
7
LORS DE LA REALISATION D’UNE ETUDE STATISTIQUE DEUX
CAS SONT À ENVISAGER ;
1er cas consiste à prendre en compte toute la population qui fait l’objet
de l’étude.
9
LES TYPES DE VARIABLES UTILISES EN STATISTIQUE
Les variables en statistique servent à préciser les aspects de la
population ou de l’échantillon qui seront analysés.
TYPES DE VARIABLES
11
variable
qualitative quantitative
s8 x
13
Terminologie
► Le nombre d'observations : 8
s1 x
s2 x
s3 x
… … … … …
s10 x
17
La valeur associée à chaque individu est un nombre qui a valeur de
mesure.
ATTENTION
19
1. Un thème et une question initiale
2. La recherche bibliographique et la mise en place d’une
problématique
3. La formulation du problème et l’hypothèse théorique
4. Le choix des méthodes
• Population
• Échantillonnage
• Unité statistique
• Plan expérimental
5. La formulation de l’hypothèse opérationnelle
6. La confrontation de l’hypothèse à la réalité
7. Le traitement des données
8. L’interprétation des résultats
9. La communication des résultats obtenus
20
Le cycle simplifié de la recherche expérimentale
Interprtation 1. Hypothèse de
des résulats recherche
Définition d'un
plan de recueil
Analyse
des données en
statistique des
spécifiant les
données
variables
pertinentes
Recueil des
données
21
En statistique, les variables peuvent avoir deux statuts possibles :
22
VI
VD
VI
23
Un plan de recueil de données s’écrit en précisant les facteurs pris en
compte ainsi que les relations entre ces facteurs.
Les sujets sont désignés par la lettre S. Ce facteur doit toujours être
présent dans l’écriture du plan.
24
Relations de croisement entre facteurs
Définition. On dit que deux facteurs sont croisés si chaque modalité
d’un facteur apparaît en conjonction avec chacune des modalités
de l’autre facteur.
La relation d’emboîtement est notée par les symboles < >. Ainsi A est
emboîté dans B s’écrit A <B> qui se lit A emboîté dans B ou A dans B. A
25
est le facteur emboîté et B le facteur emboîtant. La relation
n’emboîtement n’est pas symétrique.
26
▪ 1er exemple de plan de recueil de données
Une seule Variable Indépendante : LES SUJETS
Variable Dépendante : Note sur 10 au test de motricité
Variable Indépendante: S5
Variable dépendante : note obtenue au test
Plan de recueil: S5
29
- DEGRÉ D'ALPHABÉTISATION Notation a deux modalités a1
et a2
► Un sujet est soit analphabète soit en cours d’alphabétisation qui
s’écrit S5<A2> et se lit "S5 emboîté A2“
► Il y a 5*2=10 observations
► Si les groupes sont déséquilibrés (c’est-à-dire que les effectifs des
groupes sont ≠ )
S<A2>
"S emboîté A2"
30
Dans notre exemple, le degré d’alphabétisation est un facteur INTER.
31
Scores obtenus
condition c1 condition c2
avant après
médication médication
s1 2.5 5.0
s2 3.0 5.5
s3 4.5 7.0
s4 3.5 6.5
s5 5.0 5.0
s6 3.0 6.0
32
Variable
indépendante :
Avant ou après
c1 : avant c2 : après
médication médication
1er mesure 2ème mesure
s1 2.5 5.0
s2 3.0 5.5
s3 4.5 7.0
s4 3.5 6.5
s5 5.0 5.0
33
s6 3.0 6.0
Lorsque l’on a une structure croisée S*T, on parle de MESURES
REPETEES cela signifie qu’un même sujet est évalué plusieurs fois
successivement. On dit aussi que les conditions sont appariées.
34
À RETENIR
Pour construire le plan de recueil de données, il convient de suivre trois
étapes :
1. Déterminer la ou les variables indépendantes
2. Identifier les relations entre les VI prises deux par deux
3. Ecrire le plan de recueil de données: c’est une formule qui permet de
retrouver le nombre d'observations ("plan") et où figurent toutes les VI
(pas les VD) et leurs relations.
► Relations binaires:
S10 * C2 (chaque sujet lit les deux textes successivement)
S5 < E2 > (deux groupes indépendants de 5 sujets)
(chaque groupe lit les deux textes)
36
Groupe Complexité faible du Complexité forte du
texte (info. explicite) Texte (info. implicite)
s1 e1 550 675
s2 e1 540 670
s3 e1 500 650
s4 e1 510 645
s5 e1 525 665
s6 e2 525 890
s7 e2 510 860
s8 e2 520 875
s9 e2 575 845
s10 e2 560 885
38
Structure d’un plan S < A * B >
39
SEXE HANDICAP Score
4 GROUPES
INDEPENDANTS S1 x1 h1 2.5
S2
DE 3 SUJETS S3 x1 h1 1.5
x1 h1 3.0
S4 x1 h2 3.5
S5
S6 x1 h2 4.0
x1 h2 4.0
S7 x2 h1 4.5
S8
S9 x2 h1 5.0
x2 h1 4.5
S10 x2 h2 7.0
S11
S12 x2 h2 7.5
x2 h2 6.5
40
Plan de recueil des données S3 < X2 * H2 >
• hommes • femmes
handicap handicap
lourd lourd
• x1h1 • x2h1
3 3
sujets sujets
3 3
• femmes
sujets sujets handicap
• hommes léger
handicap
léger • x2h2
• x1h2
41
Plan S * A < B >
On demande à 10 sujets de noter (sur 10) 8 films (facteur F8). 4 films de
science fiction et 4 comédies (facteur T2 type de film : t1=SF,
t2=comédie)
VD : note sur 10
► VI: S10 (10 sujets)
F8 film (8 films)
T2 2 types de films
► Relations binaires entre les VI :
► S10 * F8(les 10 sujets regardent les 8 films)
► S10 * T2 (les 10 sujets regardent deux types de films) F4 < T2 > (4 films
par type)
► Plan de recueil des données
Chaque sujet regarde 8 films répartis en deux types de quatre films. Au
total, 80 observations (10 * 4 * 2)
42
Films de SF (t1) Comédies (t2)
f1 f2 f3 f4 f5 f6 f7 f8
s1 2 2 9 5 6 9 8 2
s2 3 3 6 9 3 6 7 6
s3 7 6 8 4 9 3 5 9
s4 4 6 4 8 5 8 9 7
VI
SUJET s5 6 8 2 3 4 2 5 5
s6 9 9 5 8 8 5 5 6
s7 5 5 7 2 2 4 8 8
s8 1 8 8 7 1 1 4 9
s9 8 1 9 1 6 2 9 4
s10 3 6 5 5 8 6 5 6
S10 * F4 < T2 >
43
44