Académique Documents
Professionnel Documents
Culture Documents
1 DONNÉES STATISTIQUES 3
1.1 Un peu de vocabulaire . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 Démarches statistiques . . . . . . . . . . . . . . . . . . . . . . . . . . 6
4 Analyse bi-variée 28
4.1 Tableau de contingence, distributions marginales, distributions condi-
tionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.1.1 Tableau de contingence . . . . . . . . . . . . . . . . . . . . . . 28
4.1.2 Distributions marginales . . . . . . . . . . . . . . . . . . . . . 29
1
TABLE DES MATIÈRES 2
DONNÉES STATISTIQUES
Exemple 1.1.1 Ensemble des ménages d’une ville. Un "ménage" est un individu. Le
nombre total de ménages est la taille de la population. On peut extraire les ménages
d’un quartier pour avoir un échantillon.
Définition 1.1.2 Une variable ou un caractère est une propriété commune aux
individus de la population que l’on souhaite étudier.
Exemple 1.1.2 Couleur préférée ; Niveau d’étude ; nombre d’enfants ; âge sont des
variables que l’on peut étudier sur une population d’employés.
Définition 1.1.3 Les modalités d’une variable sont les "valeurs" possibles de cette
variable.
3
CHAPITRE 1. DONNÉES STATISTIQUES 4
1. Une variable qualitative est une variable dont les modalités ne sont pas des
nombres(non mesurable). Exemple : Couleur préférée, niveau d’étude.
(a) S’il est possible d’ordonner les modalités, on dit que la variable est qua-
litative ordinale. Exemple : Niveau d’étude.
(b) Si non, on dit qu’elle est qualitative nominale. Exemple :Couleur pré-
férée.
2. Une variable quantitative est une variable dont les modalités sont des nombres(mesurable).
Exemple : Nombre d’enfants, âge.
(a) Si les valeurs sont des nombres entiers ou "isolés" (en nombre fini), on
dit que la variable est discrète. Exemple : Nombre d’enfants.
(b) Si par contre la variable est susceptible de prendre n’importe quelle valeur
dans un intervalle de R, on dit qu’elle est continue. Exemple :âge.
Définition 1.1.5 Une série statistique est un ensemble de couples {(Mi , ni )}1≤i≤p
ou {(xi , ni )}1≤i≤p où
– p est le nombre de modalités ou valeurs de la variable ;
– les Mi sont les modalités ;
– les xi sont les valeurs de la variable ;
– ni est le nombre d’individus qui présentent la modalité Mi ou la valeur xi .
1.2 Notations
Terminologie Notation
Taille de la population N
Population P = {1, . . . N }
Individu u∈P
Variable ou caractère X, Y, . . .
Valeur de la variable X pour l’individu u X(u)
Série statistique simple brute pour X {X(1), X(2), . . . X(N )}
Série statistique double brute pour X et Y {(X(1), Y (1)) , . . . (X(N ), Y (N ))}
(pas d’ordre)
Variable qualita ve
(possibilité d’ordonner)
Caractère ou variable
sta s que
(valeurs précises)
Variable quan ta ve
Employés 1 2 3 4 5 6 7 8 9 10
Tableau 1.2.1
Marque C R C N P P P R C N
Le but de la statistique est d’organiser des données chiffrées sur de grands en-
sembles, de les synthétiser et de les interpréter. Dans le traitement de ces données,
la méthode statistique présente deux approches :
• La statistique inférentielle
C’est la méthode statistique pour laquelle il est possible de déduire les carac-
téristiques quantitatives de toute une population à partir d’une étude sur un
échantillon issu de celle-ci. Elle nécessite des méthodes d’échantillonnage et
des méthodes probabilistes.
ORGANISATION DES
DONNÉES
Dans le chapitre précédent nous avons vu des exemples de séries statistiques simples
dont les données sont écrites sous forme brute : {X(1), X(2), . . . X(N )}. Dans la
pratique, le nombre d’individus étant typiquement très grand, il faut réorganiser ces
données en les regroupant. On dit qu’on fait un dépouillement. La première étape
consiste :
–
– pour une variable qualitative ou quantitative discrète : à identifier les modali-
tés/valeurs prises par la variable, c’est-à-dire à identifier X(P) ;
Terminologie Notation
Nombre de modalités/valeur/classes pour X p
Modalités d’une variable qualitative X X(P) = {m1 , . . . mp }
Valeurs prises par une variable discrète X X(P) = {x1 , . . . xp }
Intervalles pour une variable continue X X(P) = {[a0 ; a1 [, . . . [ap−1 ; ap [}
On a toujours p ≤ N .
7
CHAPITRE 2. ORGANISATION DES DONNÉES 8
Exemple 2.1.1 Si nous reprenons l’exemple 1.2.1 : p = 4, les modalités sont :m1 =
P , m2 = R, m3 = C et m4 = N
A l’aide ces quantités, on peut construire un tableau qui permet de résumer ces
données.
Exemple 2.2.3 Revenus moyens (en milliers de F) des ménages d’un quartier.
Revenus [75; 100[ [100; 150[ [150; 200[ [200; 300[ [300; 500[ Total
Tableau 2.2.3 Nbre ménages 12 24 36 6 2 80
Fréquences 0,15 0,3 0,45 0,075 0,025 1
– si elle est quantitative discrète, les valeurs sont classées en ordre croissant :
x1 < x2 < · · · < xp ;
– si elle est quantitative continue, les intervalles suivent un ordre croissant na-
turel : [a0 ; a1 , [a1 ; a2 , . . . [ap−1 ; ap [.
Définition 2.2.2 Soit k ∈ {1 . . . p}
1. L’effectif cumulé croissant (respectivement décroissant) de la modalité mk /valeur
xk / classe [ak−1 ; ak [, est la somme des effectifs n1 . . . nk (respectivement nk . . . np ).
k
X p
X
νk = nj et νek = nj (2.2)
j=1 j=k
Remarque 2.2.1
ν1 = n 1
νk+1 = νk + nk+1 ∀k ∈ {1 . . . p − 1} (2.4)
νp = N
νep = np
νek−1 = νek + nk−1 ∀k ∈ {1 . . . p − 1} (2.5)
νe1 = N
φ1 = f1
φk+1 = φk + fk+1 ∀k ∈ {1 . . . p − 1} (2.6)
φp = 1
φep = fp
φek−1 = φek + fk−1 ∀k ∈ {1 . . . p − 1} (2.7)
φe1 = 1
INTERPRÉTATIONS
1. CAS D’UNE VARIABLE DISCRÈTE
(a) L’effectif cumulé croissant (νk ) d’une valeur xk représente le nombre d’in-
dividus de la population dont la valeur de la variable est inférieure ou égale à xk ;
(b) L’effectif cumulé décroissant (νek ) d’une valeur xk représente le nombre
d’individus de la population dont la valeur de la variable est supérieure ou égale à xk ;
(c) La fréquence cumulée croissante (φk ) d’une valeur xk représente le pourcentage
d’individus de la population dont la valeur de la variable est inférieure ou égale à xk ;
(d) La fréquence cumulée décroissante (φek ) d’une valeur xk représente le pourcentage
d’individus de la population dont la valeur de la variable est supérieure ou égale à xk ;
Revenus [75; 100[ [100; 150[ [150; 200[ [200; 300[ [300; 500[ Total
Nbre ménages 12 24 36 6 2 80
Fréquences 0,15 0,3 0,45 0,075 0,025 1
Tableau 2.2.5 νk 12 36 72 78 80
νek 2 8 44 68 80
φk
φek
APPLICATIONS
6%
14%
36%
Marié
Célibataire
Divorcé
44%
Veuf(ve)
Diagrammes en barres
Pour obtenir un diagramme en barres, on trace un repère formé d’un axe hori-
zontal non gradué et d’un axe vertical gradué.
- Sur l’axe horizontal, on trace des rectangles de même largeur, représentant les
modalités, que l’on place à des distances régulières les uns des autres ;
- Les hauteurs des rectangles sont proportionnelles aux effectifs ou aux fréquences
des modalités.
fi
li di = li = fi
li
Exemple 2.3.4
REPRÉSENTATION GRAPHIQUE
REPRÉSENTATION GRAPHIQUE