Académique Documents
Professionnel Documents
Culture Documents
3
1 CHAPITRE 1 : INTRODUCTION GÉNÉRALE
1.1 But de la statistique
La statistique est une discipline qui s’inspire au profondément de la méthode scientifique : c’est une
science fondée sur la mathématique.
La statistique permet de somatiser les masses considérables des données. De cerner et décrire cer-
taines relations pourtant obscures entre les variables.
La statistique traite l’information imparfaite obtenue le plus souvent par échantillonnage et par
conséquent la statistique est la science de l’incertitude et des erreurs.
La statistique est un art (elle est capable de communiquer les résultats obtenus).
La statistique s’applique à tous les faits dont la multiplicité des causes, leurs complicités et leurs
enchevêtrements interdisent de la méthode expérimentale.
1
1.2.2 Phase de l’analyse des données
Ici, on résume ou réduit les données en substituant à l’ensemble de celle-ci un petit nombre de
résultats numériques.
— on compare les résultats numériques aux résultats théoriques établis à l’aide des calculs de
probabilité ;
— on formule des hypothèses par conduction à l’aide des résultats numériques obtenus ;
— on vérifie par déduction à partir des résultats obtenus en supposant les hypothèses vraies.
2
2 CHAPITRE 2 : VOCABULAIRE STATISTIQUE
2.1 Généralité
Nous distinguons deux sortes de statistique :
— La statistique : ce sont celles qui ont pour objet de fixer à une époque donnée, la répartition
dans l’espace de tous les faits de même nature ;
— La statistique de mouvement : ce sont celles qui ont pour objet l’enregistrement des varia-
tions dans le temps d’un seul fait.
Exemple : On étudie la couleur des yeux des étudiants de Math 1 promotion 2021-2022.
a) Quelle est la population étudiée ?
— Unité statistique ou individu : c’est un élément ou nombre de la population.
b) Quel est l’unité statistique de l’exemple ci-dessus ?
— Echantillon : c’est une partie de la population ou groupe de la population.
c) Déterminer l’échantillon de l’exemple ci-dessus ?
— Caractère : c’est le caractère étudié dans la population ou c’est le trait commun à tous les
unités sur lesquels on porte attention.
Il existe deux types de caractère :
- Caractère quantitatif ;
Exemple : poids, sexe, taille, couleur.
- Caractère qualitatif.
Un caractère est dit quantitatif si ses modalités sont mesurables.
Un caractère est dit quantitatif discret lorsque ses modalités sont des nombres isolés.
Réponses :
a) La population étudiée : C’est l’ensemble des couleurs des yeux.
b) L’unité statistique est : une couleur.
c) L’échantillon : les étudiants de Math 1 promotion 2021-2022.
d) - Le caractère étudié est : la couleur des yeux.
- La nature : qualitative ; justification car ce sont des valeurs non mesurables.
2.3 Notation
1. Un caractère statistique sera désigné par une lettre majuscule notée X.
3
2. Les modalités d’un caractère seront désignés par des lettres minuscules avec un indice permettant
de leur compter : x1 , x2 , ..., xn
3. La taille d’une population sera désignée par N ou n.
4. L’effectif de la modalité xi du caractère X sera désigné par ni .
5. La fréquence absolue de la modalité xi du caractère X n’est autre que l’effectif de la modalité
xi .
ni
6. La fréquence relative sera désignée par fi = tel que
N
n
X
fi = 1
i=1
ni
7. La population sera notée Pi = 100 × fi = 100 ×
N
ei + ei+1
8. Le centre (de [ei , ei+1 [) sera noté ci =
2
9. L’amplitude de la classe sera notée ai = ei+1 − ei
ni
10. La densité ou la hauteur de la classe sera notée di = hi =
ai
4
3 CHAPITRE 3 : REPRESENTATION GRAPHIQUE
3.1 Tableau statistique
L’objectif d’un tableau statistique est de représenter de la manière la plus simple l’ensemble des
données de l’étude.
Dans le cas d’un tableau statistique, celui-ci établi la correspondance entre les modalités d’un
caractère et des effectifs de cette modalité. Il peut être présenté verticalement ou horizontalement.
Exemple :
1)La représentation verticale
X ni X ni
x1 n1 [e1 , e2 [ n1
x2 n2 [e2 , e3 [ n2
. . . .
ou
. . . .
. . . .
xn nn [en−1 , en [ nn
T otal N T otal N
3.2 Classes
3.2.1 Classes contigue
Lorsque les données sont en classe, ces classes doivent être contigues c’est-à-dire que chaque individu
doit se retrouver dans une et une seule classe (jamais dans les deux).
Les classes doivent être deux à deux distincts c’est-à-dire leurs intersection est égale à l’ensemble
vide (ex : [1; 5[ ∪ [5; 10[ = φ )
Exemple :
— Classe contigue
X n i ai d i
[65, 70[ 9 5 1, 8
[70, 75[ 13 5 2, 6
[75, 80[ 8 5 1, 6
T otal 30 15 6
— Classe non contigue
5
X ni Limites réels ci ai di
[155; 159[ 3 [154, 5; 159, 5[ 157 5 0, 6
[160; 164[ 12 [159, 5; 164, 5[ 162 5 2, 4
[165; 169[ 18 [154, 5; 159, 5[ 167 5 3, 6
[170; 179[ 25 [169, 5; 179, 5[ 167, 5 10 2, 5
[180; 184[ 15 [179, 5; 184, 5[ 182 5 3
[155; 159[ 2 [154, 5; 159, 5[ 187 5 0, 4
T otal 25 1029 35 12, 5
Principe de construction
Proportionnalité des aires avec les effectifs ou les fréquences des modalités.
Exemple : On désire étudier la couleur des yeux des étudiants de maths 1, promo 20212022. On a
le tableau statistique suivant :
X ni
Noir 50
Bleu 30
Rouge 20
Total 100
6
2. Diagramme en secteur
4. Diagramme figuratif
5. Cartogramme
C’est la représentation d’une grande figure sur une échelle réduite.
7
3.3.2 Cas d’un caractère quantitatif
Ici, on utilise deux sortes de représentation :
— Diagramme différenciel (diagramme en baton)
— Diagramme intégrale (courbe des fréquences cumulées)
a) Principe de construction du diagramme différenciel
On met les modalités sur l’axe des abscisses et à partir de chaque modalité, on élève un baton
proportionnel à l’effectif.
Après avoir construit le diagramme en baton, lorsqu’on joint les sommets des batons on obtient le
polygone des fréquences.
b) Principe de construction du diagramme intégrale
— On obtient les fréquences cumulées croissantes ou décroissantes ;
— On établi la correspondance entre la modalité et la fréquence cumulée.
Exemple : Faire le diagramme intégrale de la distribution statistique suivant :
X ni Fi
0
7 3
3
8 2
5
10 3
8
12 1
9
14 7
16
T otal 16
8
4 CHAPITRE 4 :ANALYSE STATISTIQUE A UNE DIMEN-
SION
Introduction
En statistique, l’étude des événements se résument à l’étude de ses paramètres. Il existe trois types
de paramètres à savoir :
— Paramètre de position ou de tendance centrale
— Paramètre de dispersion
— Paramètre de forme
4.1.1 Le mode
Le mode est la série statistique ayant le plus grand effectif (cas d’un caractère quantitatif discret).
Dans le cas d’un caractère quantitatif continu avec les données représentées en intervalles ou classes,
on parle de la classe modale : c’est la classe qui a la plus grande densité.
Le mode est désigné par M0 . Ce distribution statistique peut avoir plusieurs modes : c’est une
distribution statistique pluri-modale (bi, tri-modale)
4.1.2 La médiane
La médiane est la valeur du caractère ou de la modalité qui partage l’ensemble de la population en
deux parties égales. Elle se note Me .
a- Détermination analytique de la médiane
Ici, on passe par le calcule de FCC (Fréquence Cumulé Croissante) ou FCD (Fréquence Cumulé
Décroissante) et l’on peut être appelé à faire des interprétations linéaires.
c- Exemple d’application
i- Déterminer la médiane de la distribution statistique suivante
X ni Fi
0
[20; 25[ 15
15
[25; 30[ 5
20
[30; 40[ 20
40
[40; 45[ 25
65
T otal 65
9
N
On a : N = 65 ⇒ = 32, 5
2
Or 35, 5 ∈ [20; 40[. On procède par interprétation linéaire.
30 → 20
Me − 30 32, 5 − 20
Me → 32, 5 ⇒ = ⇒ Me = 36, 25
40 − 30 40 − 20
40 → 40
N
Fi − Fi−1 − Fi−1
= 2
ei − ei−1 Me − ei−1
4.1.3 La moyenne
Soit X une distribution statistique.
- Pour un caractère quantitatif discret, la moyenne arithmétique est définie par :
n
1 X
X= n i xi
N i=1
10
4.2.2 Les Déciles
Ce sont des valeurs du caractère qui divisent l’ensemble de la population en 10 parties égales. Il
existe 09 déciles : D1 , D2 , ..., Dn
La détermination des déciles obéit au même principe que celle de la détermination de la médiane.
4.2.4 L’Etendu
C’est la différence entre la plus grande et la plus petite modalité. Elle est notée :
eX = Xmax − Xmin
4.2.5 Le Semi-interquartile
Il est noté eQ . Il mesure la déviation moyenne des données par rapport à la médiane et est défini
1
par : eQ = (Q3 − Q1 )
2
11
4.2.9 La variance et l’écart-type
- La variance d’une distribution statistique ou VS (Variance Statistique) est la moyenne arithmétique
d’écart par rapport à la moyenne. Elle se note V (X) et est définie par :
n
1 X
V (X) = ni (xi − X)2 (1)
N i=1
- L’écart-type noté σ (sigma) est la racine carré de la variance. Il est défini par :
p
σ = V (X) avec V (X) > 0
L’écart-type permet d’avoir une appréciation de la variabilité des données par rapport à la moyenne.
Il mesure de combien les observations sont éloignées de la moyenne.
FORMULE DE KOENIG
La variance est encore définie par :
n
1 X 2
V (X) = ni x2i − X (2)
N i=1
4.2.11 Le Scart
Le score d’un individu détermine à combien l’écart-type se trouve en dessous ou au-dessus de la
xi − X
moyenne. Il est noté s et est définie par : s =
σ
Remarque : Si une distribution statistique suit une loi normale on a :
68,3% des observations qui se trouvent dans l’intervalle [x − σ; x + σ] ;
95,5% des observations qui se trouvent dans l’intervalle [x − 2σ; x + 2σ] ;
99,7% des observations qui se trouvent dans l’intervalle [x − 3σ; x + 3σ] ;
Exemple : La moyenne générale des étudiants de L1 est x = 16 et l’écart type est σ = 1. Quel est
le scart des étudiants ORNELA et AÏSATOU qui ont respectivement 16 et 10 comme note ?
16 − 13 3 10 − 13 3
s1 = = et s2 = =−
2 2 2 2
Exemple : La moyenne d’âge des étudiants de L1 est x = 20 et l’écart type est σ = 3. Dans quel
intervalle se compris l’âge de ces étudiants si cette distribution statistique suit la loi normale ?
x − σ = 20 − 3 = 17 et x + σ = 20 + 3 = 23
Donc il y a 68,3% des observations qui se trouvent dans l’intervalle ]17; 23[.
x − 2σ = 20 − 2 × 3 = 14 et x + 2σ = 20 + 2 × 3 = 26
Donc il y a 95,5% des observations qui se trouvent dans l’intervalle ]14; 26[.
12
4.2.12 Le moment
I Le moment non centré d’ordre r d’une distribution statistique est noté µr et est défini par :
n
X ni
µr = fi xri avec fi =
i=1
N
I Le moment centré d’ordre r par rapport à x0 d’une distribution statistique est noté µr,x0 et est
défini par :
n
1 X
µr,x0 = ni (xi − x0 )r
N i=1
— Si r = 1 et x0 = x, alors µr,x0 = 0
— Si r = 2 et x0 = x, alors µr,x0 = V (x)
DTAF : Démontrer que ces deux dernières affirmations sont vraies.
— Si γ1 > 0, alors on a une distribution étalée vers les petites valeurs et on a la figure suivante :
13
4.3.2 Le coefficient d’aplatissement
Il est noté γ2 . C’est le moment centré d’ordre 4 sur l’écart-type puissance 4 le tout moins 3. et est
définit comme suit :
µ4,x
γ2 = 4 − 3
σ
Ce coefficient permet de comparer une série statistique d’une distribution dite normale qui a la
même moyenne et le même écart-type.
— Si γ2 = 0, alors la courbe se confond a‘ celle de la loi normale.
14
4.4 Généralisation de la moyenne
4.4.1 Définition
La ϕ-moyenne
2. Moyenne quadratique
ϕ : x 7→ ϕ(x) = x2
n
1 X
ϕ(xϕ ) = ni ϕ(xi )
N i=1
n
1 X
x2Q = ni x2i
N i=1
Donc v
u n
u1 X
xQ = t ni x2i
N i=1
3. Moyenne harmonique
1
ϕ : x 7→ ϕ(x) =
x
n
1 X
ϕ(xϕ ) = ni ϕ(xi )
N i=1
n
1 1 X 1
= ni
xH N i=1 xi
Donc
1
xH = n
1 P 1
ni
N i=1 xi
4. Moyenne géométrique
ϕ : x 7→ ϕ(x) = ln x
n
1 X
ϕ(xϕ ) = ni ϕ(xi )
N i=1
n
1 X
ln xρ = ni ln(xi ) Or ln ab = b ln a
N i=1
15
Ainsi !
n
1 Y
ln xρ = ln xni i
N i=1
Donc ! N1
n
Y
xρ = xni i
i=1
Nij représente l’effectif des individus de la population qui à la fois la valeur xi de la variable X et de
la valeur yj de la variable Y .
16
5.2.2 Notation
a)
l
X
Ni• = Nij = Ni1 + Ni2 + Ni3 + ... + Nil
j=1
Ni• représente le total des effectifs de la ligne i c’est-à-dire l’effectif total des individus qui représentent
la valeur xi de la variable X (indépendant de variable Y)
b)
k
X
N•j = Nij = N1j + N2j + N3j + ... + Nkj
i=1
N•j représente le total des effectifs de la valeur j c’est-à-dire l’effectif total des individus représente la
valeur yj
c)
k X
X l k
X l
X
N = N•• = Nij = Ni• = N•j
i=1 j=1 i=1 j=1
17
— Distribution marginale de X :
18
Y Ef f ectif s conditionnels Fréquences conditionnelles
y1 Ni1 F1/i
y2 Ni2 F2/i
... ... ...
yi Nij Fi/i
... ... ...
yk Nil Fk/i
T otal Ni• 1
19