Académique Documents
Professionnel Documents
Culture Documents
2
1. Définition:
La statistique est un ensemble de méthodes
permettant de décrire et d’analyser, de façon
quantifiée, des phénomènes repérés éléments
nombreux, de même nature, susceptibles d’être
dénombrés et classés.
3
Population Phénomène
Caractère
Échantillon
Données brutes-
Séries statistiques Méthodes - Récolter
Tester une
Analyser
Organiser: hypothèse
Tableau. Estimer:
Graphe. Paramètres de Position.
Paramètres de dispersion.
STATISTIQUE
STATISTIQUE DESCRIPTIVE
INFERENTIELLE
STATISTIQUE GÉNÉRALE 4
2. Vocabulaire et notation standard de la statistique:
2.1. Population (P): Ensemble des individus présentant un caractère
commun.
Exemple: Les étudiants de faculté de SESNV-Université Tébessa
5
2.4. Caractère (Variable statistique) (X): Ce qu’on observe
(caractéristiques, propriétés), sur chacun des individus de la
population.
Exemple: Les étudiants de faculté de SESNV-Université Tébessa
Sexe, Taille, Spécialité, Origine, Age, Moyenne , etc.
Contrairement à une constante, une variable (un caractère) comporte
nécessairement plus d’une modalité ou plus d’un valeur.
2.5. Modalités et valeurs (xi): Les différentes catégories que peut
présenter un caractère (ou bien une variable) précédemment défini.
Exemple 01:
Caractère - Variable Modalités - Valeurs
Sexe Male/Femelle
Age Moins 20 ans; 20 ans; plus 20ans
Spécialité Biologie, Maths, physique
Taille 1,60 m ; 1,70m ; 1,80 m
6
Les modalités (les valeurs) d’un caractère (une variable) doivent être à la fois :
Exhaustives: car elles décrivent toutes les valeurs ou états possibles d’un
caractère (une variable).
Incompatibles: car un individu ne peut pas avoir plus d’une modalité (une
valeur).
2.6. Série statistique: On appelle série statistique une liste de N observations
(mesures) faites pour un caractère étudié dans une population donnée.
Exemple 02: Pour 10 étudiants :
N° 1 N°2 N°3 N°4 N°5 N°6 N°7 N°8 N°9 N°10
Sexe garçon fille garçon fille fille garçon fille garçon fille fille
Age 20 19 18 21 20 19 21 18 20 19
2.7. Classe : Il est fréquent qu’ une population soit divisée en sous-ensembles
cohérents construits à partir de critères déterminés de façon à réduire la taille
des tableaux de données et à en faciliter la lecture, l’analyse et l’interprétation.
Cette division induit une regroupement des individus et la formation de classes
rassemblant chacune des individus présentant des caractères similaires.
7
Selon la nature de critère étudié
Il existe deux types de critères
1. Caractères qualitatifs : Les modalités s’expriment par des qualités et
pas par des valeurs numériques.
9
La fréquence relative s’exprime généralement en pourcentage.
Le numérateur fait obligatoirement une partie du dénominateur.
10
2.11. Ratio: Est le rapport des fréquences (effectifs ou fréquences relatives)
de deux modalités d’une même variable.
Il faut bien remarquer que le numérateur et le dénominateur réfèrent à
deux catégories mutuellement exclusives d’une même variable même si celle-
ci a plus de deux modalités.
11
2.12. Taux: Est le ratio d’une quantité par unité (de temps, de surface, de
poids, etc.)
Exemple 07: Dans une cantine fréquentée par 300 personnes, pendant 24
heures 30 personnes présentent des signes d’intoxication alimentaire.
Le taux de maladie: 30/300= 0,1= 10% pendant 24 heures.
Le taux de malade sexe masculin: 10/30= 0,33 =33,33%.
2.13. Indice: Est le rapport de deux effectifs qui sont de nature différente.
Exemple 08:
12
3. Description des données (Tableaux et graphes):
La mise en ordre des données est l’étape qui suit immédiatement celle du
récolte des valeurs de la(ou des) variable (s) étudiée (s). Les Tableaux et
graphiques constituent les deux moyens principaux de présentation des
données statistiques.
3.1. Tableaux:
3.1.1. Tableau brut de données: Le tableau brut est le tableau élémentaire de
travail. Toutes les données y figurent, unité par unité et variable par
variable. Les individus ou unités statistiques sont en ligne, les variables en
colonnes. Un tableau brut est peut présentable.
3.1.2. Tableaux d’effectifs ou distribution des fréquences:
les lignes du tableau correspondent aux modalités de la variable étudiée (Pour
une variable continue, une discrétisation est nécessaire). Dans ce cas de
figure, les cellules du tableau contiennent alors les effectifs relatifs à chaque
modalité.
13
3.1.2.1. Tableaux de données qualitatives:
Les modalités d’un caractère qualitatif doivent épuiser toutes les
possibilités et ne pas empiéter les unes sur les autres.
La première ligne (colonne) indique les modalités de caractère étudié.
La deuxième ligne (colonne) indique l’effectif de chaque modalité.
Exemple 09:
Modalités (xi) Male Femelle Total
Effectif (ni) 4 6 10
Fréquence relative (fi) 4/10=0,4 6/10=0,6 1
Pourcentage % 40% 60% 100%
Fréquence relative 0,4 0,4+0,6=1
cumulée (f cum)
14
3.1.2.2. Tableaux de données quantitatives:
3.1.2.2.1. Tableau de variable quantitative discontinue:
Exemple 10: On interroge 100 familles sur le nombre d’enfants de leur
famille. La variable «nombre d’enfants» est quantitative discrète. On obtient
le tableau ci-dessous, où xi représente le nombre d’enfant et ni les effectifs
correspondants :
Nbre Fréquence
Effectifs Fréquences Pourcentages
d’enfants relative
(ni) relatives (fi) (pi)
(xi) cumulée
0 5 5/100=0,05 0.05 0.05*100=5%
1 15 15/100=0,15 0.05+0.15=0.2 0.15*100=15%
2 30 30/100=0,3 0.2+0.3=0.5 0.3*100=30%
3 22 22/100=0,22 0.5+0.22=0.72 0.22*100=22%
4 20 20/100=0,2 0.72+0.2=0.92 0.2*100=20%
5 8 8/100=0,08 0.92+0.08=1 8*100=8%
15
3.1.2.2. 2. Tableau de variable quantitative continue:
Dans ce cas là , l’établissement du tableau de fréquences implique
d’effectuer au préalable une répartition en classes des données. Cela nécessite
de définir:
Le nombre de classes attendu.
L’amplitude associée (Intervalle de classe).
Nombre de classes: Divers formules empiriques permettent d’établir le
nombre de classes pour un échantillon de taille n.
La règle de STURGE:
La règle de YULE:
x x
D’où: max et min respectivement la plus grande et la plus petite valeur de x
dans la série statistique.
16
Exemple 11: On a relevé le poids de 19 étudiants, les résultats sont les
suivants:
76.34 kg 60.40 kg 68.28 kg 57.74 kg 64.99 kg
81.9 kg 79.65 kg 64.10 kg 72.88 kg 69.12 kg
59.79 kg 61.82 kg 61.82 kg 76.36 kg 66.33 kg
52.2 kg 70.56 kg 70.13 kg 65.45 kg
Le tableau d’effectifs peut être présenté comme suit:
Nombre de classes:
Règle de STURGE: 1+ (3.3 log19) = 1+ (3.3*1.278) = 5 classes
Règle de YULE:
Intervalle de classes: (81.9 – 52.2) / 5 = 6 kg
Tableau de fréquences:
Classes (xi) [52 - 58[ [58 - 64[ [64 - 70[ [70 - 76[ [76 - 82[
Effectifs (ni) 2 4 6 3 4
Fréquences (fi) 0.105 0.210 0.315 0.157 0.210
17
Remarques:
La création de classes est presque un art. A ce propos, les règles
conseillées sont:
1. En générale, on choisit un regroupement par classes
d’amplitudes égales.
2. Observer les classes la série de la variable et la diviser en
classes de taille (effectif) à peu prés égale.
18
3.2. Représentations graphiques:
3.2.1. Représentations graphiques des caractères qualitatifs:
Les modalités d’un caractère qualitatif n’étant pas ordonnées, on les
représente généralement par des graphiques qui utilisent des surfaces.
3.2.1.1. Diagramme en barres:
Barres verticales (horizontales) disjointes.
Les ordonnées représentent les effectifs (Fréquences, pourcentages) de la
distribution.
En abscisse figurent les modalités en barres de largeur identique.
19
Exemple 12: Les groupes sanguins
Groupes sanguins A B AB O Total
Effectifs (ni) 30 25 29 16 100
Fréquences (fi) 0,3 0,25 0,29 0,16 1
30
effectifs
16%
20 30%
10
29%
0
A B AB O 25%
A B AB O
20
3.2.2. Représentations graphiques des variables quantitatives:
21
Exemple 13: La variable «nombre d’enfants» est quantitative discrète.
Nombre d’enfants 0 1 2 3 4 5
Nombre de familles (ni) 5 15 30 22 20 8
35 Diagramme en barres
35 Polygone
30
30
25 25
20 20
15 15
10 10
5 5
0
0
1 2 3 4 5 6
1 2 3 4 5 6
22
3.2.2.2. Représentations graphiques de variables continues:
3.2.2.2.1. Histogramme :
23
Exemple 14:
6
5
4
3
2
1
0
[52 - 58[ [58 - 64[ [64 - 70[ [70 - 76[ [76 - 82[
Effectifs (ni) 2 4 6 3 4
24
3.3. Mesures en statistique :
Le dernier niveau de description statistique d’une variable quantitative
est le résumé numérique d’une distribution statistique par des indicateurs
numériques ou paramètres caractéristiques.
3.3.3.1. La médiane:
3.3.3.1.1. Définition:
La médiane d’une série est la valeur qui partage cette série,
préalablement classée (rangée), en deux série aux effectifs égaux (d’où 50% des
valeurs sont supérieures et 50% des valeurs sont inférieures).
25
3.3.3.1.2. Modes de calcul:
Le mode de calcul dépend de type de données.
Données non groupées: On doit classer (ranger) les données
1. Si n est impair: Localiser la valeur qui partage l’effectif total en
deux sous effectifs égaux en appliquant la formule (n+1)/2.
2. Si n est pair: La médiane n’est pas une valeur de la série. La
médiane est une valeur quelconque entre xm et xm+1.
Données groupées :
1. Effectifs groupés par valeurs
2. Effectifs groupés par classes : Le calcul de la médiane nécessite
d’appliquer la formule suivante:
xm : Limite inferieure de la classe médiane.
ai : Intervalle de classe.
n : Taille de l’échantillon.
Ni : Effectif cumulé inférieur à xm
ni : Effectif de la classe médiane.
26
3.3.3.2. Le mode: Le mode d’une série statistique est la valeur du caractère
la plus fréquente ou dominant dans l’échantillon.
27
3.3.3.3. La moyenne arithmétique: est la plus connue et la plus précise
des mesures de paramètres de position.
La formule pour calculer la moyenne arithmétique des n valeurs:
28
Exemple 14.a: Calcul de médiane
Données brutes: Données classées:
76.34 kg 52.20 kg
81.9 kg 57.74 kg
59.79 kg 59.79 kg
52.2 kg 60.40 kg
60.40 kg 61.82 kg Données brutes:
79.65 kg 61.82 kg n est impair: dixième position
61.82 kg 64.10 kg (n+1/2) ; la médiane = 66.33kg.
70.56 kg 64.99 kg
68.28 kg 65.45 kg
64.10 kg 66.33 kg Si on ajoute la valeur 82.00 kg
61.82 kg 68.28 kg ; n est pair : la médiane =
70.13 kg 69.12 kg (66.33+68.28)/2= 67.30 kg.
57.74 kg 70.13 kg
72.88 kg 70.56 kg
76.36 kg 72.88 kg
65.45 kg 76.34 kg
64.99 kg 76.36 kg
69.12 kg 79.65 kg
66.33 kg 81.90 kg
29
Exemple 14. b: Calcul de médiane ; les données groupées par classes:
30
Exemple 15: Les mêmes données pour calculer le mode:
Classes (xi) [52-58[ [58-64[ [64-70[ [70-76[ [76-82[ Total
Effectifs (ni) 2 4 6 3 4 19
Effectifs cumulés 2 6 12 15 19
A.N :
31
Exemple15.a: Les mêmes données pour calculer la moyenne arithmétique:
1. Dans le cas des données non groupées:
76.34 kg 60.40 kg 68.28 kg 57.74 kg 64.99 kg
81.9 kg 79.65 kg 64.10 kg 72.88 kg 69.12 kg
59.79 kg 61.82 kg 61.82 kg 76.36 kg 66.33 kg
52.2 kg 70.56 kg 70.13 kg 65.45 kg
La formule:
A.N:
32
Exemple 15. b: Les mêmes données pour calculer la moyenne arithmétique:
2. Dans le cas des données groupées:
Centres de classes 55 61 67 73 79
Classes [52 - 58[ [58 - 64[ [64 - 70[ [70 - 76[ [76 - 82[
Effectifs () 2 4 6 3 4
La formule:
A.N:
33
3.3.3.4. Les quartiles:
34