Vous êtes sur la page 1sur 34

‫بسم هللا الرحمان الرحيم‬

Université de Tébessa Faculté de sciences exactes et


sciences de nature et de la vie

Année Universitaire: 2015-2016


1. Définition
2. Vocabulaire et notation standard de la statistique
3. Description des données (Tableaux et graphiques)
4. Mesures en statistique
 Paramètres de position
 Paramètres de dispersion

2
1. Définition:
La statistique est un ensemble de méthodes
permettant de décrire et d’analyser, de façon
quantifiée, des phénomènes repérés éléments
nombreux, de même nature, susceptibles d’être
dénombrés et classés.

3
Population Phénomène

Caractère
Échantillon

Individu (unité statistique) Modalités

Données brutes-
Séries statistiques Méthodes - Récolter

Tester une
Analyser
Organiser: hypothèse
Tableau. Estimer:
Graphe. Paramètres de Position.
Paramètres de dispersion.
STATISTIQUE
STATISTIQUE DESCRIPTIVE
INFERENTIELLE
STATISTIQUE GÉNÉRALE 4
2. Vocabulaire et notation standard de la statistique:
2.1. Population (P): Ensemble des individus présentant un caractère
commun.
Exemple: Les étudiants de faculté de SESNV-Université Tébessa

L’effectif total d’une population noté N


2.2. Unité statistique (individu) (i):Élément de base constitutif de la
population à laquelle il appartient.
Individu = Étudiant (Faculté SESNV)

2.3. Échantillon (s): Sous-ensemble construit et représentatif d’une


population donnée.
Exemple: Un échantillon de 100 étudiants

5
2.4. Caractère (Variable statistique) (X): Ce qu’on observe
(caractéristiques, propriétés), sur chacun des individus de la
population.
Exemple: Les étudiants de faculté de SESNV-Université Tébessa
Sexe, Taille, Spécialité, Origine, Age, Moyenne , etc.
Contrairement à une constante, une variable (un caractère) comporte
nécessairement plus d’une modalité ou plus d’un valeur.
2.5. Modalités et valeurs (xi): Les différentes catégories que peut
présenter un caractère (ou bien une variable) précédemment défini.
Exemple 01:
Caractère - Variable Modalités - Valeurs
Sexe Male/Femelle
Age Moins 20 ans; 20 ans; plus 20ans
Spécialité Biologie, Maths, physique
Taille 1,60 m ; 1,70m ; 1,80 m
6
Les modalités (les valeurs) d’un caractère (une variable) doivent être à la fois :
Exhaustives: car elles décrivent toutes les valeurs ou états possibles d’un
caractère (une variable).
Incompatibles: car un individu ne peut pas avoir plus d’une modalité (une
valeur).
2.6. Série statistique: On appelle série statistique une liste de N observations
(mesures) faites pour un caractère étudié dans une population donnée.
Exemple 02: Pour 10 étudiants :
N° 1 N°2 N°3 N°4 N°5 N°6 N°7 N°8 N°9 N°10
Sexe garçon fille garçon fille fille garçon fille garçon fille fille
Age 20 19 18 21 20 19 21 18 20 19

2.7. Classe : Il est fréquent qu’ une population soit divisée en sous-ensembles
cohérents construits à partir de critères déterminés de façon à réduire la taille
des tableaux de données et à en faciliter la lecture, l’analyse et l’interprétation.
Cette division induit une regroupement des individus et la formation de classes
rassemblant chacune des individus présentant des caractères similaires.
7
Selon la nature de critère étudié
Il existe deux types de critères
1. Caractères qualitatifs : Les modalités s’expriment par des qualités et
pas par des valeurs numériques.

1.1. Caractères qualitatifs ordinales: Exemple:


(classes ordonnées). Niveau d’étude: Primaire, secondaire,
supérieur
1.2. Caractères qualitatifs nominales: Exemple:
(catégories sont nommées et pas ordonnées). Groupe sanguin: A, B, O, AB.

2. Variables quantitatives : c’est un critère dont les variables s’expriment


par des valeurs numériques.
2.1. Variables quantitatives continues: Exemple:
peuvent prendre n’importe quelle valeur Poids: 56, 41 kg.
numérique dans l’intervalle des observations.

2.2. Variables quantitatives discontinues: Exemple:


Les valeurs s’expriment par des nombres Nombre d’enfants par famille: 3
entiers. 4 enfants.
8
2.8. Effectifs (Fréquence absolue) (ni): L’effectif d’une modalité xi d’un
caractère x est le nombre d’individus présentant cette modalité.
Exemple 03: Pour 10 étudiants :
Age 18 19 20 21 Total (N)
Effectif (ni) 2 3 3 2 10

2.9. Fréquence relative (Pourcentage): est le rapport de l’effectif de la


classe sur le total de la série étudiée.
Exemple 04: Pour 10 étudiants :
Age 18 19 20 21 Total
Effectif (ni) 2 3 3 2 10
Fréquence (fi) 2/10=0,2 3/10=0, 3 3/10=0, 3 2/10=0,2 10/10=1

9
La fréquence relative s’exprime généralement en pourcentage.
Le numérateur fait obligatoirement une partie du dénominateur.

2.10. Effectifs et Fréquences cumulés: On fait un cumul descendant


à partir de la première classe: les fréquences (effectifs) sont
additionnées au fur et à mesure.
Exemple 05: Pour 10 étudiants :
Age 18 19 20 21 Total
Effectif (ni) 2 3 3 2 10
Fréquence (fi) 0,2 0,3 0,3 0,2 1
Effectif cumulé 2 2+3=5 5+3=8 8+2=10
Fréquence 0,2 0,2+0,3=0,5 0,5+0,3=0,8 0,8+0,2=1
cumulée (fcum)

10
2.11. Ratio: Est le rapport des fréquences (effectifs ou fréquences relatives)
de deux modalités d’une même variable.
Il faut bien remarquer que le numérateur et le dénominateur réfèrent à
deux catégories mutuellement exclusives d’une même variable même si celle-
ci a plus de deux modalités.

Exemple 06: Pour 10 étudiants :


Garçon Fille Total
Effectif (ni) 4 6 10
Fréquence relative (fi) 4/10=0,4 6/10=0,6 1

Sex-ratio= (effectif des garçons)/(effectif des filles)= 4/6 = 0,67 (67%).


Cela signifie que pour 67 garçons, il y a 100 filles.
Un ratio s’exprime par un nombre sans unités.

11
2.12. Taux: Est le ratio d’une quantité par unité (de temps, de surface, de
poids, etc.)
Exemple 07: Dans une cantine fréquentée par 300 personnes, pendant 24
heures 30 personnes présentent des signes d’intoxication alimentaire.
Le taux de maladie: 30/300= 0,1= 10% pendant 24 heures.
Le taux de malade sexe masculin: 10/30= 0,33 =33,33%.

2.13. Indice: Est le rapport de deux effectifs qui sont de nature différente.
Exemple 08:

Indice: Nombre de… Exemple: Expression d’indice:


Lits d’hôpital/médecin 850 lits, 10 85 lits pour médecin
médecins
Étudiants/ classe 900 étudiants, 30 30 étudiants pour classe
classes

12
3. Description des données (Tableaux et graphes):
La mise en ordre des données est l’étape qui suit immédiatement celle du
récolte des valeurs de la(ou des) variable (s) étudiée (s). Les Tableaux et
graphiques constituent les deux moyens principaux de présentation des
données statistiques.
3.1. Tableaux:
3.1.1. Tableau brut de données: Le tableau brut est le tableau élémentaire de
travail. Toutes les données y figurent, unité par unité et variable par
variable. Les individus ou unités statistiques sont en ligne, les variables en
colonnes. Un tableau brut est peut présentable.
3.1.2. Tableaux d’effectifs ou distribution des fréquences:
les lignes du tableau correspondent aux modalités de la variable étudiée (Pour
une variable continue, une discrétisation est nécessaire). Dans ce cas de
figure, les cellules du tableau contiennent alors les effectifs relatifs à chaque
modalité.

13
3.1.2.1. Tableaux de données qualitatives:
Les modalités d’un caractère qualitatif doivent épuiser toutes les
possibilités et ne pas empiéter les unes sur les autres.
 La première ligne (colonne) indique les modalités de caractère étudié.
 La deuxième ligne (colonne) indique l’effectif de chaque modalité.

Exemple 09:
Modalités (xi) Male Femelle Total
Effectif (ni) 4 6 10
Fréquence relative (fi) 4/10=0,4 6/10=0,6 1
Pourcentage % 40% 60% 100%
Fréquence relative 0,4 0,4+0,6=1
cumulée (f cum)

14
3.1.2.2. Tableaux de données quantitatives:
3.1.2.2.1. Tableau de variable quantitative discontinue:
Exemple 10: On interroge 100 familles sur le nombre d’enfants de leur
famille. La variable «nombre d’enfants» est quantitative discrète. On obtient
le tableau ci-dessous, où xi représente le nombre d’enfant et ni les effectifs
correspondants :
Nbre Fréquence
Effectifs Fréquences Pourcentages
d’enfants relative
(ni) relatives (fi) (pi)
(xi) cumulée
0 5 5/100=0,05 0.05 0.05*100=5%
1 15 15/100=0,15 0.05+0.15=0.2 0.15*100=15%
2 30 30/100=0,3 0.2+0.3=0.5 0.3*100=30%
3 22 22/100=0,22 0.5+0.22=0.72 0.22*100=22%
4 20 20/100=0,2 0.72+0.2=0.92 0.2*100=20%
5 8 8/100=0,08 0.92+0.08=1 8*100=8%

15
3.1.2.2. 2. Tableau de variable quantitative continue:
Dans ce cas là , l’établissement du tableau de fréquences implique
d’effectuer au préalable une répartition en classes des données. Cela nécessite
de définir:
Le nombre de classes attendu.
L’amplitude associée (Intervalle de classe).
 Nombre de classes: Divers formules empiriques permettent d’établir le
nombre de classes pour un échantillon de taille n.
La règle de STURGE:
La règle de YULE:

 Intervalle de classe (Amplitude): est obtenu ensuite de la manière suivante:

x x
D’où: max et min respectivement la plus grande et la plus petite valeur de x
dans la série statistique.
16
Exemple 11: On a relevé le poids de 19 étudiants, les résultats sont les
suivants:
76.34 kg 60.40 kg 68.28 kg 57.74 kg 64.99 kg
81.9 kg 79.65 kg 64.10 kg 72.88 kg 69.12 kg
59.79 kg 61.82 kg 61.82 kg 76.36 kg 66.33 kg
52.2 kg 70.56 kg 70.13 kg 65.45 kg
Le tableau d’effectifs peut être présenté comme suit:
Nombre de classes:
Règle de STURGE: 1+ (3.3 log19) = 1+ (3.3*1.278) = 5 classes
Règle de YULE:
Intervalle de classes: (81.9 – 52.2) / 5 = 6 kg
Tableau de fréquences:

Classes (xi) [52 - 58[ [58 - 64[ [64 - 70[ [70 - 76[ [76 - 82[
Effectifs (ni) 2 4 6 3 4
Fréquences (fi) 0.105 0.210 0.315 0.157 0.210

17
Remarques:
La création de classes est presque un art. A ce propos, les règles
conseillées sont:
1. En générale, on choisit un regroupement par classes
d’amplitudes égales.
2. Observer les classes la série de la variable et la diviser en
classes de taille (effectif) à peu prés égale.

 Le centre de classe est la valeur située au milieu de classe.

18
3.2. Représentations graphiques:
3.2.1. Représentations graphiques des caractères qualitatifs:
Les modalités d’un caractère qualitatif n’étant pas ordonnées, on les
représente généralement par des graphiques qui utilisent des surfaces.
3.2.1.1. Diagramme en barres:
Barres verticales (horizontales) disjointes.
Les ordonnées représentent les effectifs (Fréquences, pourcentages) de la
distribution.
En abscisse figurent les modalités en barres de largeur identique.

3.2.1.2. Diagramme sectoriel (camembert, pie chart en anglais) :


Utiliser surtout si le nombre de modalités soit faible.
Chaque secteur représente une modalité de caractère étudié.
La surface du secteur est proportionnelle à l’effectif ni (la fréquence fi)de
la modalité.

19
Exemple 12: Les groupes sanguins
Groupes sanguins A B AB O Total
Effectifs (ni) 30 25 29 16 100
Fréquences (fi) 0,3 0,25 0,29 0,16 1

Diagramme: Répartition Répartition des groupes


des groupes sanguins sanguins
40 A B AB O

30
effectifs

16%
20 30%
10
29%
0
A B AB O 25%

A B AB O
20
3.2.2. Représentations graphiques des variables quantitatives:

3.2.2.1. Représentations graphiques de variables discrètes:

3.2.2.1.1. Diagramme en bâtons (en barres):


On trace sur l’axe des ordonnées: les valeurs du variable étudiée xi .
Sur l’axe des abscisses: l’effectifs (la fréquences) ni.
La hauteur de bâton tracé est proportionnelle à la fréquence de cette valeur.

3.2.2.1.2.Polygone des fréquences:


Ligne brisée joignant les bâtons.

21
Exemple 13: La variable «nombre d’enfants» est quantitative discrète.
Nombre d’enfants 0 1 2 3 4 5
Nombre de familles (ni) 5 15 30 22 20 8

35 Diagramme en barres
35 Polygone
30
30
25 25

20 20
15 15
10 10
5 5
0
0
1 2 3 4 5 6
1 2 3 4 5 6

22
3.2.2.2. Représentations graphiques de variables continues:

3.2.2.2.1. Histogramme :

Est un diagramme à barres (rectangles) accolées deux à deux .


Lorsque les classes sont d’amplitude égale:
Les hauteurs des barres sont proportionnelles aux effectifs.
L’amplitude a étant constante.
 On peut tracer sur un histogramme, lorsque les classes sont d’amplitude
égale, un polygone de fréquences simples. Il suffit pour cela de joindre les
milieux du bord supérieur de chaque barre par des segments de droite.

23
Exemple 14:

Histogramme: Distribution du poids chez 19 étudiants

6
5
4
3
2
1
0
[52 - 58[ [58 - 64[ [64 - 70[ [70 - 76[ [76 - 82[
Effectifs (ni) 2 4 6 3 4

24
3.3. Mesures en statistique :
Le dernier niveau de description statistique d’une variable quantitative
est le résumé numérique d’une distribution statistique par des indicateurs
numériques ou paramètres caractéristiques.

3.3.3. Paramètres de position:

3.3.3.1. La médiane:

3.3.3.1.1. Définition:
La médiane d’une série est la valeur qui partage cette série,
préalablement classée (rangée), en deux série aux effectifs égaux (d’où 50% des
valeurs sont supérieures et 50% des valeurs sont inférieures).

25
3.3.3.1.2. Modes de calcul:
Le mode de calcul dépend de type de données.
 Données non groupées: On doit classer (ranger) les données
1. Si n est impair: Localiser la valeur qui partage l’effectif total en
deux sous effectifs égaux en appliquant la formule (n+1)/2.
2. Si n est pair: La médiane n’est pas une valeur de la série. La
médiane est une valeur quelconque entre xm et xm+1.
 Données groupées :
1. Effectifs groupés par valeurs
2. Effectifs groupés par classes : Le calcul de la médiane nécessite
d’appliquer la formule suivante:
xm : Limite inferieure de la classe médiane.
ai : Intervalle de classe.
n : Taille de l’échantillon.
Ni : Effectif cumulé inférieur à xm
ni : Effectif de la classe médiane.

26
3.3.3.2. Le mode: Le mode d’une série statistique est la valeur du caractère
la plus fréquente ou dominant dans l’échantillon.

On peut utiliser la formule suivante pour calculer le mode:

27
3.3.3.3. La moyenne arithmétique: est la plus connue et la plus précise
des mesures de paramètres de position.
La formule pour calculer la moyenne arithmétique des n valeurs:

Si les données en k valeurs (classes):

28
Exemple 14.a: Calcul de médiane
Données brutes: Données classées:
76.34 kg 52.20 kg
81.9 kg 57.74 kg
59.79 kg 59.79 kg
52.2 kg 60.40 kg
60.40 kg 61.82 kg Données brutes:
79.65 kg 61.82 kg  n est impair: dixième position
61.82 kg 64.10 kg (n+1/2) ; la médiane = 66.33kg.
70.56 kg 64.99 kg
68.28 kg 65.45 kg
64.10 kg 66.33 kg Si on ajoute la valeur 82.00 kg
61.82 kg 68.28 kg ; n est pair : la médiane =
70.13 kg 69.12 kg (66.33+68.28)/2= 67.30 kg.
57.74 kg 70.13 kg
72.88 kg 70.56 kg
76.36 kg 72.88 kg
65.45 kg 76.34 kg
64.99 kg 76.36 kg
69.12 kg 79.65 kg
66.33 kg 81.90 kg

29
Exemple 14. b: Calcul de médiane ; les données groupées par classes:

Classes (xi) [52-58[ [58-64[ [64-70[ [70-76[ [76-82[ Total


Effectifs (ni) 2 4 6 3 4 19
Effectifs cumulés 2 6 12 15 19

Calcul la médiane par la formule suivante:

La classe médiane est la troisième classe, d’où xm= 64 kg, ai = 6 kg , ni = 6 et


Ni = 6.
A.N:

30
Exemple 15: Les mêmes données pour calculer le mode:
Classes (xi) [52-58[ [58-64[ [64-70[ [70-76[ [76-82[ Total
Effectifs (ni) 2 4 6 3 4 19
Effectifs cumulés 2 6 12 15 19

Pour calculer le mode utilisez la formule suivante:

A.N :

31
Exemple15.a: Les mêmes données pour calculer la moyenne arithmétique:
1. Dans le cas des données non groupées:
76.34 kg 60.40 kg 68.28 kg 57.74 kg 64.99 kg
81.9 kg 79.65 kg 64.10 kg 72.88 kg 69.12 kg
59.79 kg 61.82 kg 61.82 kg 76.36 kg 66.33 kg
52.2 kg 70.56 kg 70.13 kg 65.45 kg

La formule:

A.N:

32
Exemple 15. b: Les mêmes données pour calculer la moyenne arithmétique:
2. Dans le cas des données groupées:
Centres de classes 55 61 67 73 79
Classes [52 - 58[ [58 - 64[ [64 - 70[ [70 - 76[ [76 - 82[
Effectifs () 2 4 6 3 4

La formule:

A.N:

33
3.3.3.4. Les quartiles:

34

Vous aimerez peut-être aussi