Académique Documents
Professionnel Documents
Culture Documents
Statistique
Discipline ayant pour objet l’analyse
de données ainsi que la prévision
Statistiques
I. Séries à une variable
I.1. Généralités
But
Terminologie
I.2. Grandeurs caractéristiques d’une série statistique
Caractéristiques de position
Caractéristiques de dispersion
I.3. Mise en forme des données
I.1. Généralités
But
Terminologie
Critères de position
Effectifs / fréquences
Mode
Médiane
Moyennes
Quartiles
Critères de dispersion
Étendue
Écarts
Critères de position
Effectif - fréquence
L'effectif total d'une population est le nombre d'individus observés, noté n.
Cas d’une variable discrète (la variable ne prend qu'un nombre fini de valeurs)
Soit {x1, x2, …, xm} les valeurs distinctes prises pas la variable X.
Notes 1 2 3 4 5
Effectifs 3 9 2 3 6
Effectifs cumulés croissants 3 12 14 17 23
Effectifs cumulés décroissants 23 20 11 9 6
fi = ni/n fi =1
(généralement donnée en pourcentage)
Les fréquences cumulées croissantes cumulent les fréquences
associées aux valeurs du caractère ≤ xi.
Les fréquences cumulées décroissantes cumulent les fréquences
associées aux valeurs du caractères ≥ xi.
Exemple:
Lors d’une interrogation sur 5 points, les résultats de 23 élèves ont été :
1 ; 2 ; 4 ; 5 ; 2 ; 3 ; 5 ; 5 ; 2 ; 1 ; 5 ; 2 ; 2 ; 1 ; 4 ; 2 ; 5 ; 2 ; 2 ; 3 ; 5 ; 2 et 4
Notes 1 2 3 4 5
Fréquences 13% 39% 9% 13% 26%
Fréquences cumulées croissantes 13 % 52 % 61 % 74 % 100 %
Fréquences cumulées 100 % 87 % 48 % 39 % 26%
décroissantes
Critères de position
Cas d’une variable continue (la variable prends ses valeurs dans un intervalle)
La classe [xi, xi+1[ est souvent désignée par (ci, ni) où ci est le centre de
classe.
On définit également:
• l’amplitude ai de la classe définie par ai=xi+1-xi
• La densité di définie par ni/ai
Critères de position
La fonction de répartition (fonction cumulative)
Relativement à la modalité xi :
F est une fonction en escalier nulle sur ] -, x1] et égale à 1 sur [x1, +[
Exemple
Lors de l’interrogation sur 5 points, les résultats de 23 élèves ont été :
1 ; 2 ; 4 ; 5 ; 2 ; 3 ; 5 ; 5 ; 2 ; 1 ; 5 ; 2 ; 2 ; 1 ; 4 ; 2 ; 5 ; 2 ; 2 ; 3 ; 5 ; 2 et 4
9+3=12
Propriétés
𝑚 𝑚
1 2 1 2 2
𝑉 ( 𝑋 ) = ∑ 𝑛𝑖 ( 𝑥𝑖 − ´𝑥 ) 𝑉 ( 𝑋 ) = ∑ 𝑛𝑖 𝑥𝑖 − ´𝑥
𝑛 𝑖=0 𝑛 𝑖=0
xi 8 12
Moyenne de la série x = (8+8+12+12)/4 = 10
ni 2 2
2 2
𝑉 ( 𝑋 ) = 2 ( 8 − 10 ) +2 ( 12− 10 ) =4 =2
4
Exercices
• Répartition des effectifs par année d’ancienneté
Nombre d’années
1 2 3 4 5 6 7 8 9 10
d’ancienneté
Effectifs 3 4 4 1 3 3 1 1 3 2
I.1. Généralités
But
Terminologie
Diagramme en bâtons
on trace un segment proportionnel à
ni, à partir du point d’abscisse xi
Polygones
Variable continue
Histogramme
bande rectangulaire ayant la largeur de
chaque classe et la hauteur proportionnelle
à l’effectif de la classe.
Rq: Dans le cas d’intervalle de largeurs
différentes, la hauteur sera proportionnelle
à la densité (di=ni/ai=ni/(xi+1-xi) )
Mise en forme des données
Courbe cumulative croissante
Variable continue
Mise en forme des données
Courbe cumulative décroissante
C'est le tracé de la fonction N' qui à tout x associe N' ( x ) = nombre
d'observations x. Il s'obtient au moyen des effectifs cumulés décroissants.
Variable continue
Variable discrète
Statistiques
I. Séries à une variable
I.1. Généralités
But
Terminologie
Mises en forme des données
Exemple
Données groupées
Regrouper les données en classes de largeur Nuage de points
2 et affecter à chaque classe la valeur
centrale de l'intervalle.
Série à deux variables
Toute série statistique à 2 variables peut être donnée sous 2 formes de
tableaux d’effectifs.
Exemple
Une usine produit des bobines Teneur en carbone (%) xi 0,6 0,61 0,62 0,64 0,65
de fil d’acier, une étude sur la
Charge de rupture (kg) yi 65 70 70 75 75
charge du rupture de l’acier en
fonction de sa teneur en
carbone a donné les résultats
yi / xi 0,60 0,61 0,62 0,64 0,65
suivants :
65 X
70 X X
75 X X
Série à deux variables
II.1 Ajustement linéaire
a.X+b
X
Série à deux variables
Méthode de la règle
On trace au jugé une droite D passant au plus prés possible
des points en s’efforçant d’équilibrer le nombre de points au
dessus et au dessous de la droite.
Y
a.x+b
X
Série à deux variables
Méthode de Mayer :
On partage le nuage en deux nuages de même effectif (à une
unité près).
On cherche pour chacun leur point moyen notés
respectivement G1 et G2 .
La droite (G1G2) est la droite d'ajustement selon la méthode
de Mayer.
Y
G2
a.x+b
G1
X
Série à deux variables
II.2 Droite de régression : Méthode des moindres carrées
De même, la droite de
régression de X en Y notée DX/Y
A pour équation
𝜎 2𝑦
𝑦= ( 𝑥 − 𝑥´ ) + ´𝑦
𝑐𝑜𝑣 ( 𝑥 , 𝑦 )
avec Ou encore
Série à deux variables
II.3 Corrélation linéaire
On appelle covariance des variables X et Y le réel
Les droites seront alors d'autant plus proches l'une de l'autre que le
rapport r sera proche de 1.
On a : –1 r 1
X X X
Corrélation nulle Corrélation positive Corrélation négative
Si x alors y Si x alors y
0 r² 3/4 3/4 r² 1 I r I =1
Y Y Y
X X X
Faible corrélation Forte corrélation Corrélation parfaite
Probabilités
I. Introduction
A B P( A B) 0
P ( A B ) P ( A) P( B)
Probabilités sur un ensemble fini
Equiprobabilité
C’est le cas où tous les événements ont la même probabilité
Pour tout événement A :
Factorielle
Le factorielle n, noté n!, est le nombre obtenu par le produit
de tous les nombres entiers de 1, ..., n
n
n! 1 2 3 ... (n 1) n m
m 1
Arrangements
(n p )!
p
Le nombre d’arrangements avec répétition est : n
Probabilités sur un ensemble fini
Exemple
Il s’agit de choisir 4 lettres distinctes, dans un ordre précis, parmi 26 lettres (tirage
sans remise, ordonné : pour un mot de passe, l’ordre est nécessaire)
26!
Il y a donc A
4
26 358 800 possibilités
(26 4)!
Si l’on s’autorise la répétition des lettres (tirage avec remise, ordonné), on obtient:
Exemple
Soit un ensemble E = {a, b, c}. On peut écrire tous les triplets obtenus à
l’aide des éléments de E
(a, b, c), (a, c, b), (b, a, c), (b, c, a), (c, a, b) et (c, b, a)
n!
C
n
p
p!(n p )!
Exemple
Si P(A) 0 P( A B)
PA ( B)
P ( A) PA(B) : probabilité de B sachant A
Si P(A) 0 et P(B) 0
P( A B) PA ( B).P( A) PB ( A).P( B )
P ( A ).P( A )
j 1
B j j
Probabilités
II. Variables aléatoires – Lois de probabilités
II.1. Variables aléatoire
Notions (discrète finie, discrète infinie, continue)
xi 1 2 3 4 5 6 7 8 9 10 11 12
P(X=xi) 0 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
F ( x) P( X x) avec xi x xi 1 F ( x) P( X x j )
j 1
x xn F ( x) Pi 1
i 1
Variable aléatoire – loi de probabilité
Étant donnée une v.a. discrète X prenant les valeurs x1, x2,…,xn avec les
probabilités respectives P1, P2,…,Pn.
V ( X ) E ( X ²) ( E ( X ))²
L'écart type d'une v.a. X est le réel positif noté défini par :
(X ) V (X )
Variable aléatoire – loi de probabilité
Variable aléatoire continue
Une variable aléatoire est continue si elle peut prendre toutes les valeurs
dans un intervalle donné (borné ou non borné).
En règle générale, toutes les variables qui résultent d'une mesure sont de type
continu
x x
a b
Variable aléatoire – loi de probabilité
Définition
Étant donnée une v.a. continue X, de densité de probabilité f(x) prenant
des valeurs comprises dans l'intervalle [a,b]
L'écart type d'une v.a. X est le réel positif noté défini par :
(X ) V (X )
Lois de probabilité
Lois de probabilité discrètes finies
Loi uniforme
X () x1 , x2 ,..., xn
1
i 1,2,..., n P ( X xi ) Pi
n
Exemple
Loi de Bernoulli
E( X ) p et V ( X ) pq
Exemple
Dans ce cas, on a :
E ( X ) np et V ( X ) npq np(1 p )
Exemple
Loi géométrique
X () i P( X i ) p q i p (1 p ) i
q 1 p q (1 p )
E( X ) et V (X )
p p p² p²
Exemple
On lance une pièce de monnaie : X est égale au nbre de piles obtenus avant
l’apparition du premier face
Lois de probabilité
Lois de probabilité discrètes infinies
Loi de Poisson
X () i
*
i P ( X i ) e .
i!
Exemple
On admet que n i i
P( X i) C p q
i
n
i
e .
i!
On appelle variable uniforme sur [a, b], une variable aléatoire continue dont la
fonction de densité de probabilité est :
1
f ( x) x a, b ab (b a ) 2
ba E( X ) et V (X )
f ( x) 0 x a, b 2 12
f(x)
Fonction de densité F(x) Fonction de répartition
a b a b
Lois de probabilité
Lois de probabilité continues
Loi normale ou loi de Laplace - Gauss
Une variable aléatoire continue X est distribuée selon une loi normale N (m,s²)
si sa densité de probabilité est :
où m est la moyenne de X
σ est l'écart-type de X
E( X ) m et V (X ) 2
Lois de probabilité
Lois de probabilité continues
Points d’inflexions
m- m+
La cloche de Gauss
Lois de probabilité
Lois de probabilité continues
(X - m) t a pour moyenne 0,
t et pour écart-type 1
Cette loi est notée N(m=0, =1) et dite loi normale centrés réduite
t x
1 2
Sa fonction de répartition est : (t )
2
.e .dx
a b t
f(t)
On utilise également la fonction (t)
F (t ) = P (t ) - 0,5
t
P(T t ) f (t ).dt (t ) 0,5 (t )
t
Lois de probabilité
Lois de probabilité continues
Lois de probabilité
Lois de probabilité continues
n est grand n 0
Si
p ni proche de 0 et ni proche de 1 tel que np(1-p) >10
Où m n. p et ( X ) n. p.(1 p)
1 k m 2
1
2
On admet que P( X k ) .e
2
Probabilités
II. Variables aléatoires – Lois de probabilités
II.1. Variables aléatoire
Notions (discrète finie, discrète infinie, continue)
II.2. Espérance mathématique, variance, écart type
Population mère
La théorie de l’échantillonnage consiste à
déterminer des propriétés sur des échantillons {I1, I2, ..., IN}
prélevés dans une population dont on connaît déjà
X caractères
des propriétés.
Xi variables aléatoires
m,
Estimation est le problème inverse de
Echantillon
l’échantillonnage, c’est à dire connaissant des
renseignements sur un on plusieurs échantillons, on Xe
cherche à en déduire des informations sur la
population totale. Pour un échantillon i :
xi , i
Echantillonnage - Estimation
Loi d’échantillonnage
Pour n assez grand, X suit approximativement N (m, )
n
n
Si les tirages sont sans remise (exhaustifs) X N (m, 1 )
n N
Echantillonnage - Estimation
Estimation
Échantillon prélevé au hasard dans la
Estimation ponctuelle population
n : son effectif
e² : sa variance
Moyenne
n
On choisit . e2 comme estimation de la variance ² de la
n 1 population
e n
Ecart type . 1
n N
Echantillonnage - Estimation
Estimation par intervalle de confiance
On commence par :
Pour n 30 la distribution d’échantillonnage N (m, )
n
n
Donc la variable aléatoire T .( X e m) N (0, 1)
Alors si t 0, p(t T t ) 2 (t ) 1
Echantillonnage - Estimation
donc, lorsqu’on prélève un échantillon de taille n, il y a 95% de chance que sa
moyenne soit dans l’intervalle :
m 1,96 ; m 1,96
n n
On peut aussi écrire : X e 1,96 m X e 1,96
n n
Donc après avoir prélevé un échantillon de taille n, on peut estimer qu’il y’a 95%
de chances que la moyenne de la population soit dans l’intervalle
X e 1,96 ; X e 1,96
n n
Cas général : p X e t m X e t 1 avec 2 (t )
n n