Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
6 avril 2017
Plan
Définition
La Statistique, c’est l’étude des variations observables. C’est une
méthode qui consiste à réunir des données chiffrées sur des
ensembles nombreux, puis à les analyser et à les interpréter.
I) Méthodes Statistiques
Représentation graphique
Une première façon de se faire une idée d’une série de chiffres est de les
représenter graphiquement, il y a différentes façons de faire,
1) Caractères quantitatifs discrets :
Définition (Diagrammes en bâtons)
Un diagramme en bâtons est un moyen de représenter une série statistique
dont le caractère est quantitatif discret.
Si x1 , . . . , xp sont les valeurs possibles prises par le caractère et si les effectifs
correspondants sont n1 , . . . , np , il est constitué par les segments qui relient le
point (xk , 0) au point (xk , nk ).
Exemple : Dans une classe, les notes obtenues du QCM à un devoir sont
Notes 1 2 3 4 5 6 7 8 9 10
Effectif 2 1 6 5 2 9 7 1 0 1
Représentation graphique
Exemple(Histogramme)
Caractères Qualitatifs
3)Caractères Qualitatifs :
Définition (Diagrammes circulaires)
Un diagramme circulaire est un moyen de représenter une série statistique
dont le caractère est qualitatif. Il est obtenu en découpant un disque en
secteurs dont les mesures d’angle sont proportionnelles à l’effectif.
Exemple(Diagramme circulaire)
Définition (Fréquence)
On appelle fréquence le rapport entre l’effectif d’une valeur et l’effectif total.
Si N = n1 + n2 + · · · + nt , alors fi = nNi .
Notes 1 2 3 4 5 6 7 8 9 10
Effectif 2 1 6 5 2 9 7 1 0 1
Fréquence 0.059 0.029 0.176 0.147 0.059 0.265 0.206 0.029 0 0.029
Fréquence 0.059 0.088 0.264 0.411 0.47 0.735 0.941 0.970 0.970 1
cumulée
Exemple
F IGURE – Graphique
La moyenne arithmétique
La moyenne arithmétique est égale à la somme des valeurs divisées par leur
nombre. Elle donne une idée sur la localisation.
Cas de données énumérées Dans ce cas, le calcul de la moyenne est
très simple. Pour les exemples précédents, on obtient des moyennes
respectives de 9 et 2009.
Cas de données qualitatives . La formule de la moyenne pondérée
s’écrit pour les valeurs x1 , . . . , xk de la variable
n1 x1 + · · · + nk xk
x= = f1 x1 + · · · + fk xk
n1 + · · · + nk
Notes 1 2 3 4 5 6 7 8 9 10
Effectif 2 1 6 5 2 9 7 1 0 1
2 × 1 + 1 × 2 + 6 × 3 + · · · + 1 × 10
La moyenne est = 5, 09
34
La médiane
La médiane d’une série statistique, généralement notée x1/2 , est le nombre
qui sépare la série (ordonnée en valeurs croissantes) en deux groupes de
même effectif. Pour trouver cette médiane, quand la série est discrète, on écrit
la liste de toutes les valeurs de la série par ordre croissant, chacune d’entre
elles étant répétée autant de fois que son effectif.
x n+1 si n est impair
( 2 )
La médiane x1/2 :=
x n + x( n2 +1)
(2) si n est pair
2
I. MAHFOUDHI & T. MOULAHI ENIM-2016
Échantillons et Histogrammes
Sommaire Statistique à deux dimensions
Chapitre 1 : Statistiques descriptives Corrélation linéaire
Régression linéaire
L’étendue
L’étendue d’une série statistique est la différence entre les deux valeurs
extrêmes. Pour les séries précédentes S1 et S2 , on obtient respectivement 20 et
2020.
I. MAHFOUDHI & T. MOULAHI ENIM-2016
Échantillons et Histogrammes
Sommaire Statistique à deux dimensions
Chapitre 1 : Statistiques descriptives Corrélation linéaire
Régression linéaire
La variance
On appelle variance de la série statistique (xk , nk ) le nombre :
L’écart-type
√
L’écart-type σ est la racine carrée de la variance : σ = V Dans les
séries précédentes, on a respectivement σ = ... et σ = ....
1 X
N
L’écart moyen absolu est défini par eN = |xk − x|.
N
k=1
1 XN
L’écart médian absolu est défini par e∗N = |xk − x1/2 |.
N
k=1
xk 1 2 3 4 5 10 11 12 15 Somme
|xk − x|
|xk − x1/2 |
Les quartiles
Les quartiles permettent de séparer une série statistique en quatre groupes de
même effectif (à une unité près) :
1 . Un quart des valeurs sont inférieures au premier quartile Q1 .
2 . Un quart des valeurs sont supérieures au troisième quartile Q3 .
l’intervalle interquartile
On appelle intervalle interquartile l’intervalle ]Q1 ; Q3 [. On appelle écart
interquartile la différence Q3 − Q1 . Pour déterminer les quartiles Q1 et Q3
d’une série de N valeurs, on procède de la façon suivante : On calcule la
quantité N4 . Deux cas sont possibles :
1. Cas 1 : le résultat est entier.
N
- Q1 est la nième valeur de la série où n = 4
.
′ ième ′ 3N
- Q3 est la n valeur de la série où n = 4 .
Exemple
Exemple :
Prenons
les valeurs rangées dans l’ordre croissant S1 :=
1; 3; 3; 3; 5; 5; 6; 7; 7; 8; 8; 8; 9; 9; 10; 10; 10; 10; 11; 11; 12; 13; 13; 13; 14; 15; 16; 19 .
Déterminer Q1 et Q3
Exemple
Exemple :
Prenons
les valeurs rangées dans l’ordre croissant S1 :=
1; 3; 3; 3; 5; 5; 6; 7; 7; 8; 8; 8; 9; 9; 10; 10; 10; 10; 11; 11; 12; 13; 13; 13; 14; 15; 16; 19 .
Il y a N = 28 valeurs et N4 = 7. Le résultat est un entier =⇒
- Pour Q1 = 6 (la 7ième valeur de la série rangée dans l’ordre croissant).
- Pour Q3 = 12 (la 21ième valeur de la série rangée dans l’ordre croissant).
Interprétation des quartiles :
Si on connait les quartiles Q1 et Q3 d’une série, on peut en déduire les
renseignements suivants sur la série statistique :
1 Au moins un quart (25%) des valeurs sont inférieures ou égales à Q1 .
2 Au moins trois quarts (75%) des valeurs sont inférieures ou égales à Q3 .
3 Environ la moitié des valeurs se trouvent dans l’intervalle interquartile
[Q1 ; Q3 ].
Cadre et Objectifs
Covariance
Covariance :
n
1X
Cov(x, y) = E [X − E(X)][Y − E(Y)] = xi − x yi − y .
n
i=1
Propriétés :
Cov(X, Y) = E(XY) − E(X)E(Y)
Cov(X, Y) = Cov(Y, X)
Cov(aX + b, cY + d) = acCov(X, Y)
X et Y indépendants −→ Cov(X, Y) = 0, la réciproque
étant fausse.
Coefficient du corrélation
Définition
Pour deux variables X et Y, le coef de corrélation linéaire r = ρ(X, Y) vaut :
Cov(X, Y)
ρ(X, Y) = ∈ [−1, 1]
σX σY
ρ est une mesure symétrique qui mesure le lien linéaire entre X et Y :
Propriété
Coefficient du corrélation
Régression linéaire
La régression simple
Objectif : On souhaite expliquer les variations de la variable Y à partir des
valeurs observées pour la variable X : on cherche une relation entre X et Y.
Régression linéaire
On cherche les valeurs a et b qui minimisent la somme des carrés des résidus,
i.e. les écarts entre les observations (Yi ) et les prédictions (axi + b) du modèle.
n
X 2
min f (a, b) = min yi − axi − b ; a, b
a,b a,b
i=1
cov(x, y)
b = y − ax et a =
V(x)
Exercice 1 (Corrélation)
Exemple
√
F IGURE – Y = X; corr = 0, 988 F IGURE – Y = X2 ; corr = 0, 973
I. MAHFOUDHI & T. MOULAHI ENIM-2016