Vous êtes sur la page 1sur 15

Université Ibn Zohr d’Agadir

Ecole Supérieure de Technologie de Laâyoune

Filière: G.I. et M.D.M.

Elément: Statistique descriptive & Biostatistique

Réalisé par: Mohamed Ali Hafdi

Année: 2019
2
Table des matières

Table des matières 3

1 Distribution et représentation de séries univariées. 5


1.1 Introduction. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.1 Vocabulaires et définitions. . . . . . . . . . . . . . . . . . . . . 5
1.1.2 Typologie des caractères. . . . . . . . . . . . . . . . . . . . . . 6
1.2 Représentation d’une série statistique. . . . . . . . . . . . . . . . . . 6
1.2.1 Cas qualitatif. . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.2 Cas quantitatif. . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2 Eléments caractéristiques des séries statistiques 9


2.1 Paramètres de position ou de tendance centrale. . . . . . . . . . . . . 9
2.1.1 Le mode. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.1.2 La médiane. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.3 La médiale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.1.4 La moyenne. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2 Pramètres de dispersion. . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2.1 L’étendue. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2.2 Quartiles, déciles et percentiles. . . . . . . . . . . . . . . . . . 13
2.2.3 L’écart absolu moyen. . . . . . . . . . . . . . . . . . . . . . . 14
2.2.4 Variance, écart-type, coefficient de variation et moments. . . . 15

3
4 TABLE DES MATIÈRES
Chapitre 1

Distribution et représentation de
séries univariées.

1.1 Introduction.
La statistique est l’étude de la collecte de données, leur analyse, leur traitement,
l’interprétation des résultats et leur présentation afin de rendre les données compréhensibles.
C’est à la fois une science, une méthode et un ensemble de techniques. L’analyse des
données est utilisée pour d’écrire les phénomènes étudiés, faire des pré- visions et
prendre des décisions à leur sujet. En cela, la statistique est un outil essentiel pour
la compréhension et la gestion des phénomènes complexes. Les données étudiées peu-
vent être de toute nature, ce qui rend la statistique utile dans tous les champs disci-
plinaires et explique pourquoi elle est enseignée dans toutes les filières universitaires,
de l’économie à la biologie en passant par la psychologie et bien sûr les sciences de
l’ingénieur.
La statistique consiste à :

- Recueillir des données.

- Présenter et résumer ces données.

- Tirer des conclusions sur la population étudiée et d’aider à la prise de décision.

Les statistiques descriptives visent à étudier les caractéristiques d’un ensemble d’observations
comme les mesures obtenues lors d’une expérience. L’expérience est l’étape préliminaire
à toute étude statistique. Il s’agit de prendre ”contact” avec les observations.

1.1.1 Vocabulaires et définitions.


1- Epreuve statistique: est une expérience que l’on provoque.

2- Population: est l’ensemble sur lequel porte notre étude statistique, notée Ω.

3- Individus ou unité statistique: sont les éléments de la population.

5
6 CHAPITRE. 1 : Distribution et représentation de séries univariées

4- Caractère ou variable statistique: (notée V.S) est une application

X : Ω −→ C.

L’ensemble C est l’ensemble des valeurs du caractère X (c’est ce qui est mesuré
ou observé sur les individus) (cette notion est similaire à celle d’une variable
aléatoire en probabilité).

5- Modalités: sont les différentes valeurs que peut prendre une variable statistique.

6- Série statistique: c’est la suite des valeurs prises par une variable sur les unités
d’observation.

1.1.2 Typologie des caractères.


Nous distinguons deux types des caractères:

1- Caractère qualitatif: ses modalités sont des catégories


(exemple: type de voiture, groupe sanguin, couleur des yeux, mention du diplôme,
stade d’une maladie,... ). Il est soit:
- nominal: si ses modalités ne peuvent pas être ordonnées (exemple: type de
voiture, groupe sanguin, couleur des yeux).
- ordinale: si les modalités peuvent être ordonnées (exemple: mention du diplôme,
stade d’une maladie).

2- Caractère quantitatif: si toute ses valeurs possibles sont numériques


(exemple: nombre d’enfants par famille, taille, poids, ...). Il est soit:
- discréte: si l’ensemble des valeurs possibles est dénombrable (exemple: nombre
d’enfants par famille).
- continue: si l’ensemble des valeurs possibles est continu (exemple: taille, poids).

1.2 Représentation d’une série statistique.


1.2.1 Cas qualitatif.
On considère une série statistique: (M1 , n1 ), (M2 , n2 ),...,(MN , nN ), où les Mi sont les
modalités du caractère qualitatif X, et les ni sont les effectifs correspondants. Cette
peut être présenter par deux diagrammes:

1- Diagramme en tuyaux d’orgue:


1.2 Représentation d’une série statistique 7

2- Diagramme en secteurs:

1.2.2 Cas quantitatif.


1- Diagramme en bâtons (caratère discrète):
8 CHAPITRE. 1 : Distribution et représentation de séries univariées

2- Histogramme (caratère continu):

Application:
On considère une classe de 40 étudiants avec leurs mentions de Bac:
Mention de Bac Passable Assez-bien Bien Trés bien
Effectif 18 16 4 2

1- Représenter par un diagramme en tuyaux d’orgue.


2- Calculer les fréquences de cette série.
3- Représenter cette série par un diagramme sectoriel.
Chapitre 2

Eléments caractéristiques des


séries statistiques

2.1 Paramètres de position ou de tendance cen-


trale.
Les paramètres de position, mode (pour tout caractère) , médiane, et moyenne (seule-
ment pour les caractères quantitatifs)), permettent de savoir autour de quelle valeur
se situent les valeurs d’une variable statistique.

2.1.1 Le mode.
Définition 2.1.1

1)- Le mode, noté M0 , est la modalité qui admet le plus grand effectif ou fréquence.

2)-
ˆ Dans le cas d’un caractère quantitatif continu, on parle d’une classe modale.
ˆ Si la classe modale est [xi , xi+1 [, alors le mode M0 vérifie:

M0 − xi xi+1 − M0 xi+1 − xi
= = , (2.1)
∆1 ∆2 ∆1 + ∆2
où ∆1 = N0 −Ni et ∆2 = N0 −Ni+1 avec N0 , Ni , et Ni+1 sont respectivement les
effectifs associés à la classe modale, à la classe précedente et à la classe suivante
de la classe modale.
∆1
ˆ De l’équation (3.1) le mode sera donc: M0 = xi + (xi+1 − xi ) .
∆1 + ∆2
Exemples:

1)- On considère la série statistique suivante:

xi 3 6 8 15 20
ni 1 8 3 5 2

9
10 CHAPITRE. 2 : Eléments caractéristiques des séries statistiques

Le mode de cette série est M0 = 6 car il correspond à l’effectif le plus élevé


(=8).
2)- On considère un caractère quantitatif continu dont les modalités et les effectifs
correspondants sont les suivants:

Ii [5, 20[ [20, 35[ [35, 50[ [50, 65[


ni 20 26 30 10
Il est clair que la classe modale est [35, 60[. Calculons le mode M0 de cette série.
On a:
∆1
M0 = 35 + (50 − 35),
∆1 + ∆2
avec ∆1 = 30 − 26 = 4 et ∆2 = 30 − 10 = 20. Ce qui donne:
15
M0 = 35 + × 15 = 44.375
4 + 20
2.1.2 La médiane.
N
Définition 2.1.2 La médiane Me est la modalité qui correspond à l’effectif , telle
2
que N est le nombre des unités statistiques.
En d’autres tèrmes: c’est la modalité qui permet de couper une série statistique en
deux groupes contenant le même nombre d’individus.

Comment calculer la médiane d’une série?

a- Cas d’un caractère discrét.


Soit n le nombre d’individus dont les modalités sont ordonnées dans l’ordre croissant.
- si n est impaire, (n = 2k + 1), alors Me est la modalité d’ordre k + 1.
- si n est paire (n = 2k), alors
M1 + M2
Me = ,
2
telle que M1 et M2 sont les modalités d’ordres k et k + 1.
Exemples:

1- On considère la série de notes d’une classe: 15-2-7-8-4-11-18-10-3-2-4-4-1.


La série ordonnée est: 1-2-2-3-4-4-4-7-8-10-11-15-18. Alors Me = 4.
2- On considère la série de valeurs suivantes: 7.2-1.5-8.5-4.8-0.5-9.8.
4.8 + 7.2
La série ordonnée est: 0.5-1.5-4.8-7.2-8.5-9.8. Alors Me = = 6.
2
Remarque 2.1.1 On peut utiliser les effectifs cumulés pour déterminer Me . Me sera
N
la modalité qui correspond au premier effectif cumulé qui dépasse .
2
2.1 Paramètres de position ou de tendance centrale 11

b- Cas d’un caractère continu.


1- En calculant les effectifs cumulés, on détermine la classe médiane Ie . On a Me ∈ Ie .

2- Par interpolation linéaire, l’expression suivante nous permet le calcul de Me :

N/2 − Ni−1
Me = xi + (xi+1 − xi ) ,
Ni − Ni−1

telle que:

- Ii = [xi , xi+1 [ est la classe médiane.


- N est l’effectif total.
- Ni−1 est l’effectif cumulé de la classe Ii−1 .
- Ni est l’effectif cumulé de la classe Ii .

2.1.3 La médiale.
Définition 2.1.3 La médiale,
P notée Ml , n’est que la
Pmédiane qui correspond à 50%
de la masse totale s = ni xi (cas discret) ou = ni ci (cas continu) où ci est le
i i
entre de la classe Ii .

Exemple: Les classes des salaires des employés d’une entreprise, ainsi que leurs
effectifs, sont données dans le tableau suivant:

Ii [1000, 2000[ [2000, 3000[ [3000, 4000[ [4000, 5000[


ni 20 40 30 10

Calculons la médiane, ainsi que la médiale, de cette série.

2.1.4 La moyenne.
Le calcul d’une moyenne permet de résumer l’information chiffrée dont on dispose.
Dans ce paragraphe on verra quatre types de moyennes.

a- La moyenne arithmétique.
Définition 2.1.4

1)- On dispose d’une série de p valeurs: x1 ,...xp d’une variable statistique discrète
X.
Le réel
p
1 1X
ma = (x1 + ... + xp ) = xi ,
p p i=1
la moyenne arithmétique de cette série.
12 CHAPITRE. 2 : Eléments caractéristiques des séries statistiques

2)- Si les valeurs x1 ,...,xp sont affectées respectivement des effectifs n1 ,...,np telles
que n1 + ... + np = N, alors la moyenne
p
1 1 X
X̄ = ma = (n1 x1 + ... + np xp ) = ,
N N i=1

est appelée la moyenne arithmétique pondérée de cette série.


3)- Si X est continue, alors les xi utilisées pour calculer la moyenne de X, sont les
centres des modalités de X.
Exemples:
1)- La moyenne arithmétique de la série: 11-14-8-9, est
1 42
m = (11 + 14 + 8 + 9) = = 10.5
4 4
2)- Soit X la variable des salaires des employés (exemple précédent). Calculons sa
moyenne.
On a
1
m= (20 × 1500 + 40 × 2500 + 30 × 3500 + 10 × 4500) = 2800.
100
a- La moyenne géométrique.
Définition 2.1.5
1- Soit x1 ,...,xp les valeurs, supposées strictement positives, d’une série.
La moyenne géométrique mg de cette série, est:
p
! p1
1 Y
mg = (x1 × ... × xp ) p = xi .
i=1

2- Si les valeurs xi sont affectées des effectifs ni telle que n1 + ... + np = N, alors
p
! N1 p
Y Y
mg = xini
= xfi i ,
i=1 i=1
ni
où fi = .
N
Exemple: Calculons la moyenne géométrique de la série: 11-14-8-9.
On a:
1
mg = (11 × 14 × 8 × 9) 4 ≃ 10.26156
On remarque que mg est proche de ma = 10.5.

Application:
Une quantité positive Q0 évolue de 5% une anne puis de 7% l’année suivante.
Calculer le taux moyen annuel d’évolution de Q0 .
2.2 Pramètres de dispersion 13

a- La moyenne harmonique.
Définition 2.1.6
1- Soit x1 ,...,xp les valeurs, supposées non nulles, d’une série.
La moyenne harmonique mh de cette série, est:
p p
mh = =P .
1 1 p 1
+ ... + i=1
x1 xp xi

2- Si les valeurs xi sont affectées des effectifs ni telle que n1 + ... + np = N, alors
N p
mh = n1 np = Pp ni .
+ ... + i=1
x1 xp xi
ni
où fi = .
N
Exemple: Calculons la moyenne harmramètres de dispersion sont calculonique de la
série: 11-14-8-9.

Application:
Une voiture parcourt la distance d entre deux villes A et B à une vitesse de 100km/h,
mais au retour, et à cause du brouillard, le conducteur a baissé la vitesse à 60km/h.
Calculer sa vitesse moyenne sue le trajet aller-retour.

2.2 Pramètres de dispersion.


Les paramètres de dispersion sont calculés pour les variables statistiques quantitatives.

2.2.1 L’étendue.
Définition 2.2.1 Soit X un caractère quantitatif discrét. L’étendue w de X , est la
différence entre la plus grande valeur et la plus grande valeur de X.
On a: w = xmax − xmin .

2.2.2 Quartiles, déciles et percentiles.


Définition 2.2.2 Soit X un caractère quantitatif. On appelle Quartiles les nombres
réels Q1 , Q2 , et Q3 qui partagent l’étendue w en quatres intervalles qui ont le même
effectif N/4.
L’intervalle interquartile est la différenceentre Q3 et Q1 (Q3 − Q1 ).
Propriétés 2.2.1
1- Q1 , Q2 , et Q3 sont respectivement les valeurs de X qui correspondent aux effectifs
N/4, N/2, et 3N/4 (ou aux fréquences 0.25, 0.5, et 0.75).
14 CHAPITRE. 2 : Eléments caractéristiques des séries statistiques

2- Le deuxième quartile Q2 n’est que la médiane de la série statistique.

3- L’intervalle [Q1 , Q3 ] contient 50% des valeurs de X.

Exemple: On considère la série statistique suivante:

xi 2 5 6 9 10
ni 3 2 6 7 2

Calculons les quartiles Q1 , Q2 , et Q3 .

Définition 2.2.3

1- Les déciles D1 , D2 ,..., D9 sont les réels qui partagent l’étendue en dix intervalles
de même effectif.

2- Les percentiles P1 , P2 ,..., P99 sont les réels qui partagent l’étendue en 100 inter-
valles de même effectif.

Remarque 2.2.1

1- D1 , D2 ,..., D9 correspondent respectivement aux effectifs N/10, 2N/10,..., 9N/10.

2- P1 , P2 ,..., P99 correspondent respectivement aux effectifs N/100, 2N/100,..., 99N/100.

2.2.3 L’écart absolu moyen.


Définition 2.2.4

1- Soit X = {(xi , ni )}i=1,...,p une variable statistique quantitative. On appelle écart


absolu moyen de X, la valeur
p
1 X
e= ni |xi − ma |, (2.2)
N i=1

où ma est la moyenne arithmétique de X.

2- Si la variable statistique est continue, on remplace les xi dans (3.2) par les centres
des classes.

Exemple: On considère la série statistique de l’exemple précedent. Calculons l’écart


absolu moyen.
On a:
1
ma = (3 × 2 + 2 × 5 + 6 × 6 + 7 × 9 + 2 × 10) = 6.75,
20
alors
1
e = (3 × |3 − 6.75| + 2 × |5 − 6.75| + 6 × |6 − 6.75| + 7 × |9 − 6.75| + 2 × |10 − 6.75|)
20
= 2.225
2.2 Pramètres de dispersion 15

2.2.4 Variance, écart-type, coefficient de variation et mo-


ments.
Définition 2.2.5
1- Soit X = {(xi , ni )}i=1,...,p une variable statistique quantitative.
i- On appelle variance de X, le nombre
p p
!
2 1 X 2 1 X
S (X) = ni (xi − ma ) = ni xi − m2a .
2
(2.3)
N i=1 N i=1
p
ii- L’écart-type de X est S(X) = S 2 (X).
iii- Le coefficient de variation de X est le nombre
S(X)
c= .
ma
2- Si la variable statistique est continue, alors sa variance (par consequent son écart-
type et son coefficient de variation) se calcule en remplaçant les xi dans (3.3)
par les centres des classes.
Exemple: La variance de la variable X de l’exemple précedent est
1
S 2 (X) = 3 × 22 + 2 × 52 + 6 × 62 + 7 × 92 + 2 × 102 − 6.752 = 6.6875

20
Donc l’écart-type de X est

S(X) = 6.6875 ≃ 2.58602
et son coefficient de variation est
2.58602
c= ≃ 0.3831
6.75
.
Définition 2.2.6 Soit X = {(xi , ni )}i=1,...,p une variable statistique quantitative.
1- On appelle moment d’ordre r de X, la quantité
p
1 X
mr = ni xri .
N i=1

2- On appelle moment centré d’ordre r de X, la quantité


p
1 X
µr = ni (xi − ma )r .
N i=1

Remarque 2.2.2
- Pour r = 0, m0 = µ0 = 1.
- Pour r = 1, m1 = ma et µ1 = 0.
- Pour r = 2, µ2 = S 2 (X) = m2 − m21 .
Exemple: Calculons m3 et µ3 de X de l’exemple précedent.

Vous aimerez peut-être aussi