Académique Documents
Professionnel Documents
Culture Documents
Cours Stat Univariée
Cours Stat Univariée
Statistique descriptive
Sommaire
Préliminaires et Vocabulaire
Représentations graphiques
Paramètres de Position
Paramètres de dispersion
Pr. Abderrahmane Moussi Statistique descriptive
Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do
Définitions
Définitions
Définitions
On écrit:
card(Ω) = N .
Remarque 1.1
Notons qu’une partie d’une population est appelée Échantillon.
Dans ce cas, le nombre d’éléments est noté n.
Définitions
Définitions
Exemple 1.2
Définitions
Définitions
Remarque 1.3
Définitions
Exemple 1.4
Définitions
Notations
Notation
signification
cas d’une population cas d’un échantillon
Effectif total N n
Moyenne µ x̄ ou x̄n
Variance σ2 S 2 ou Sn2
Écart-type σ S ou Sn
Définitions
On note:
x(Ω) = {x1 , x2 , · · · , xp } .
Definition 1
- L’effectif (ou fréquence absolue) d’une modalité est le
nombre noté ni d’individus présentant cette modalité. On a:
p
X
ni = n1 + n2 + · · · + np = N
i=1
Exemple 3.1
On souhaite étudier le nombre d’appels téléphoniques reçues par le standard de la
Faculté pendant la période matinale pendant 60 jours.
Nombre d’appels 0 1 3 4 6 7
Effectifs 2 10 16 20 9 3
x1 = 0, x2 = 1, x3 = 3, x4 = 4, x5 = 6, x6 = 7 .
Definition 2
ni
I la fréquence fi de la classe ci est le rapport .
N
I la fréquence cumulée Fi de la classe ci est la somme des
fréquences de cette classe et des classes précédentes:
Fi = f1 + f2 + · · · + fi .
I Quand les classes sont d’amplitudes différentes, on
considère la densité de la classe au lieu de considérer la
fréquence. En effet, pour ci (la classe i), la densité est le
rapport suivant:
fi
di =
ai − ai−1
Remarque 4.1
Exemple 4.2
Les données suivantes correspondant aux poids de 20
étudiants:
60 80 65 70 72
89 82 67 73 63
62 79 64 68 78
66 77 88 83 79
Exemple 4.3
La valeur minimale est 60, la valeur maximale est de 89. Par
conséquent, la première classe doit contenir la valeur 60 et la
dernière doit contenir la valeur 89.
En appliquant la règle de Sturges, on trouve que q ≈ 5 . Donc
les classes qui peuvent être choisies sont:
[60, 66[; [66, 72[; [72, 78[; [78, 84[; [84, 90[ .
Ainsi, le tableau statistique avec les données groupées en
classe est le suivant:
Classes Effectifs
[60,66[ 5
[66,72[ 4
[72,78[ 3
[78,84[ 6
[84,90[ 2
Nombre de pièces 1 2 3 4 5
Effectifs (ni ) 300 180 270 200 50
Fréquences (fi ) 0,3 0,18 0,27 0,2 0,05
Fréquences cumulées (Fi ) 0,3 0,48 0,75 0,95 1
Effectifs cumulés (Ni ) 300 480 750 950 1000
Histogramme:
Histogramme des effectifs: Il s’agit d’un graphe composé de
rectangles dont les bases sont les classes de la variable
statistique et les hauteurs sont les effectifs corrigés:
Effectif ni
ni∗ = = .
Amplitude ai − ai−1
Si l’amplitude est la même pour toutes les classes, les auteurs
les rectangles correspondent simplement aux effectifs ni .
Courbe cumulative:
Definition 3
On appelle fonction de répartition d’une série statistique, la
fonction notée F, définie pour tout x ∈ R par:
Remarque 5.1
Pour a < b , on a F (b) − F (a) = Proportion des observations
dans l’intervalle ]a, b] .
Proposition 5.2
Soit F la fonction de répartition d’une variable statistique. On a:
Fi − Fi−1
F (x) = Fi−1 + (x − ai−1 ) , pour tout x ∈]ai−1 , ai ] .
ai − ai−1
où, Fi = F (ai ) = f1 + f2 + · · · + fi est la fréquence cumulée de
ai .
Definition 4
Le mode d’une série statistique (noté Mod) est la modalité ou
la valeur qui a le plus grand effectif ou encore, la valeur qui
correspond à la fréquence maximale.
Remarque 6.1
La moyenne
La moyenne
Definition 5
La moyenne notée µ d’une série quantitative est donnée par:
n1 x1 + n2 x2 + · · · + np xp
µ=
n1 + n2 + · · · + np
p p
1X X
= ni xi = fi xi ,
N
i=1 i=1
La moyenne
La moyenne
Les quantiles
Definition 6
La médiane (notée M ou encore Me) est le nombre ou la
modalité qui partage en deux parties égales l’effectif total d’une
série statistique (i.e: 50% des valeurs de la série statistique
sont plus grandes (ou plus petites) que la valeur médiane).
Les quantiles
En pratique:
Pour une variable statistique discrète:
I Pour calculer la médiane, la série statistique doit être
rangée en ordre croissant ou décroissant.
I si le nombre d’éléments de la série (N) est un nombre
impair, alors ce nombre peut être écrit sous forme de 2k+1.
Dans ce cas, la valeur (la modalité) du (k+1)ème élément
est la médiane.
Pour une liste paire, on peut écrire le nombre d’éléments
sous la forme 2k. La médiane dans ce cas correspond à:
k ème él ément + (k + 1)ème él ément
M= .
2
Les quantiles
En pratique:
Pour une variable statistique continue:
I Dans le cas de variables statistiques continues (en
classes), on parle de classe médiane cm = [ai−1 , ai [ : c’est
la première classe dont l’effectif cumulé dépasse la valeur
N
.
2
I La valeur médiane est une valeur particulière dans la
classe médiane.
I La détermination de la valeur médiane se fait par
interpolation linéaire:
N
− Ncm−1
M = ai−1 + (ai − ai−1 ) × 2 .
Ncm − Ncm−1
Les quantiles
Definition 7
Soit α ∈]0, 1[ . On appelle quantile d’ordre α la valeur xα de
la variable telle que au moins 100 α% des observations sont
inférieures ou égales à xα , autrement, 100 (1-α)% des
observations qui sont supérieures ou égales à xα .
Les quantiles
Les quantiles
Les quantiles
Les quantiles
Les quantiles
Remarque 6.2
La détermination de déciles ainsi que n’importe quel quantile
d’ordre α se fait en utilisant la même démarche que celle
utilisée pour les quartiles.
L’étendue
EI = Q3 − Q1 .
D9 − D1 , D8 − D2 , D7 − D3 , D6 − D4 .
La variance
La variance
Remarque 7.1
L’écart-type
Le coefficient de variation
Definition 8
Soit x une variable statistique. On appelle moment centré
d’ordre k (k ∈ N∗ ) la quantité suivante:
p p
X 1X
mk = fi (xi − µ)k = ni (xi − µ)k .
N
i=1 i=1