Académique Documents
Professionnel Documents
Culture Documents
STATISTIQUES 1
I - Statistiques
Statistique vient du latin status, qui signifie État. La statistique était, dans l'antiquité la tenue à
jour et l'analyse de données, principalement économiques. Maintenant le sens de ce mot s'est
élargi, on pourrait plus généralement le définir par l'Art de faire parler les chiffres. C'est-à-
dire comment tirer des conclusions à partir de chiffres. Les statistiques trouvent des
applications dans des domaines très variés : médecine, biologie, marketing, économie,
productique, sondage, etc.
II - Définition et terminologie :
1 - Population, individu, échantillon :
La population est l'ensemble que l'on étudie. Cette population est composée d'individus(ou
unité statistique)
Ce caractère est quantitatif s'il est possible de le mesurer, donc de le représenter par un
nombre .
3 - Discret, continu :
Dans le cas où les modalités d'un caractère quantitatif sont des valeurs réelles, on dit que ce
caractère est continu.
Si au contraire les modalités sont des valeurs isolées, par exemple des valeurs entières, alors
le caractère est discret.
COURS STATISTIQUES 1
p k
N = n j le nombre d'individus observés c’est l’effectif global ou total. Nk = n j est
j =1 j =1
l’effectif cumulé croissante en xk
2 - Fréquence :
𝑛
Étant donnée une série statistique, la fréquence f de la modalité xi est définie par 𝑓𝑖 = 𝑁𝑖 .
i
k
Fréquence cumulée croissante en xk : Fk = f j .
j =1
3 - Le pourcentage
𝑛
Le pourcentage de la valeur x est le nombre 𝑝𝑘 = 100 × 𝑓𝑘 = 100 × 𝑁𝑘 en pourcentage.
k
IV - Représentation graphique
1 - Représentations graphiques pour une distribution statistique discrète :
a - Diagramme en bâtons :
Le diagramme en bâtons des effectifs ( resp. des fréquences …) d’une distribution statistique
discrète est constitué d’une suite de segments verticaux d’abscisses x dont la longueur est
i
proportionnelle à l’effectif (resp. la fréquence) de x .
i
b - Polygone des effectifs ou des fréquences :
- Le polygone des effectifs (resp. des fréquences) d’une distribution statistique discrète est
obtenu à partir du diagramme en bâtons des effectifs (resp. des fréquences) en joignant
par un segment les sommets des bâtons.
COURS STATISTIQUES 2
V - Paramètres de position :
Étant donné une série statistique
( x 1, n1);( x 2, n2 );...;( x p , n p ) .
1 - Moyenne
1 p
La moyenne x est donnée par la formule suivante : x = ni xi
N i =1
2 - Médiane
La médiane M e est la valeur qui sépare les individus en deux groupes de même effectif .
Selon le type de variable et l'effectif, il peut y avoir plusieurs façons de procéder ,pour fixer
les idées on définit la médiane par :
La médiane est la plus petite modalité ayant l’effectif cumulé supérieur ou égal à la moitié de
l’effectif total
Dans le cas continu ;on utilisera l’histogramme des effectifs cumulés pour déterminer la
médiane voir TD.
3 - Mode :
Le mode est la modalité dont l'effectif est le plus élevé dans le cas discret .
La classe modale est la classe dont l'effectif est le plus élevé et le mode dans ce cas sera le
milieu de cette classe.
VI - Caractéristiques de dispersion :
Les paramètres de dispersion permettent de chiffrer la variation des valeurs observées autour
d’un paramètre de position. Les principaux paramètres de dispersion sont : L’écart absolu
moyen, la variance, l’écart-type .
1 - Etendue :
L’étendue, notée𝑒(𝑋), est la différence entre la plus grande et la plus petite des valeurs prises
par le caractère, donc :𝑒(𝑋) = max(𝑋) − min(𝑋).
2 - Variance et écart-type :
La variance d’une distribution statistique discrète est définie par :
1 𝑝 2 1 𝑁 2
𝑉(𝑋) = 𝑁 ∑𝑖=1 𝑛𝑖 (𝑥𝑖 − 𝑋̅) si la série statistique est pondérée et 𝑉(𝑋) = 𝑁 ∑𝑖=1(𝑥𝑖 − 𝑋̅)
dans le cas non pondéré c’est-à-dire lorsque on a pour tout 𝑖 , 𝑛𝑖 =1 .
Proposition1 :
1 𝑝
𝑉(𝑋) = 𝑁 ∑𝑖=1 𝑛𝑖 𝑥𝑖2 − 𝑋̅ 2 = ̅̅̅
𝑋 2̅ − 𝑋̅ 2 : Le carré de la moyenne des valeurs du caractère
ôté du carré de la moyenne des carrées des valeurs.
COURS STATISTIQUES 3
3 - Ecart moyen :
L’écart absolu moyen d’une distribution statistique à caractère quantitatif discret est le
nombre réel positif :
𝑝 𝑝
1
𝑒 = ∑ 𝑛𝑖 |𝑥𝑖 − 𝑋̅| = ∑ 𝑓𝑖 |𝑥𝑖 − 𝑋̅|
𝑁
𝑖=1 𝑖=1
VII - Tableaux :
1 - Caractère quantitatif discret :
Lorsque l'on étudie un caractère quantitatif discret, il est usuel d'utiliser un tableau mettant en
correspondance les modalités de la variable avec les effectifs (ou les fréquences).
Exercice1 On a relevé la puissance de 80 voitures d’une entreprise de location (en CV) :
1) Dresser puis compléter le tableau statistique suivant :
Puissance en CV : 𝑥𝑖 4 5 7 8 10 Totaux Moyennes
Effectifs : 𝑛𝑖 12 14 21 24 9 N=
Eff. cumulés : 𝑁𝑖
Fréquences :𝑓𝑖
𝑛𝑖 . 𝑥𝑖 𝑋=
𝑛𝑖 . (𝑥𝑖 )2 𝑋2 =
|𝑥𝑖 − 𝑋|
𝑛𝑖 . |𝑥𝑖 − 𝑋| 𝑒𝑚 =
2) Construire le diagramme en bâtons des effectifs puis le polygone des effectifs de cette
série statistique .
3) Construire le diagramme en bâtons des effectifs cumulés puis le polygone des effectifs
cumulés de cette série statistique.
4) Déterminer les paramètres de position de cette série statistique.
la moyenne , la médiane et le mode.
5) Déterminer les paramètres de dispersion de cette série statistique. La variance ,l’écart-
type et l’écart-moye
6) Calculer le pourcentage de voiture ayant une puissance dans [𝑋 − 𝜎, 𝑋 + 𝜎] .
COURS STATISTIQUES 4
VIII - Séries statistiques 2 :
Une série statistique à deux variables se forme en étudiant simultanément deux caractères sur
la population. Par exemple, considérons l'expérience consistant à choisir 10 vaches à mesurer
leurs tailles et leurs poids, nous obtenons une série statistique à deux variables car les deux
caractères observés sont la taille et le poids.
1 - Point moyen
Soit une série statistique à deux variables 𝑋 et 𝑌 le point du plan 𝐺(𝑋̅, 𝑌̅) est appelé point
moyen.
2 - La covariance
̅̅̅̅ = 1 ∑ 𝑥𝑖 𝑦𝑖
̅̅̅̅ − 𝑋̅𝑌̅ où 𝑋𝑌
Proposition1 :On a 𝐶𝑜𝑣(𝑋, 𝑌) = 𝑋𝑌 𝑁
4 - Ajustement affine :
Si r x i une estimation convenable
est proche de 1, alors il est possible d'obtenir à partir de
de y i . A partir de x i , on approche y i avec une formule de la forme ax i + b . Cela
s'appelle une régression linéaire, ou encore un ajustement affine. Graphiquement, cela
signifie qu'il existe une droite d'équation y = ax + b passante près de chaque point du
nuage de points. On calcule 𝑎 et 𝑏 en utilisant les formules suivantes :
𝐶𝑜𝑣(𝑋,𝑌)
Formules : 𝑎 = et 𝑏 = 𝑌 − 𝑎𝑋
𝑉(𝑋)
Les valeurs ci-dessus permettent d'effectuer la régression linéaire de 𝑌 en 𝑋 .Si on veut celle
de 𝑋 en 𝑌 on change les rôles 𝑋 et 𝑌.
COURS STATISTIQUES 5
Exercice 3:
Sur un échantillon de 5 étudiants d’une classe de BTS , on a relevé la note X de contrôle
continu , ainsi que la note Y de l’examen , comme l’indique le tableau suivant:
Note de CC : x 6 9 12 13 15
i
Note de l’examn : yi 7 10 14 15 17
Température( en d° Celsius) x i 21 17 24 25 13
Nombre de glaces vendues : yi 25 20 30 35 10
COURS STATISTIQUES 6