Vous êtes sur la page 1sur 6

Lycée Allaymoun Rabat 𝟐è𝒎𝒆 Bâtiment

Année 2023 /2024 Cours : Statistiques 1 et 2

STATISTIQUES 1

I - Statistiques
Statistique vient du latin status, qui signifie État. La statistique était, dans l'antiquité la tenue à
jour et l'analyse de données, principalement économiques. Maintenant le sens de ce mot s'est
élargi, on pourrait plus généralement le définir par l'Art de faire parler les chiffres. C'est-à-
dire comment tirer des conclusions à partir de chiffres. Les statistiques trouvent des
applications dans des domaines très variés : médecine, biologie, marketing, économie,
productique, sondage, etc.

II - Définition et terminologie :
1 - Population, individu, échantillon :
La population est l'ensemble que l'on étudie. Cette population est composée d'individus(ou
unité statistique)

2 - Caractère quantitatif, qualitatif


Sur chacun des individus sondés, on observe un caractère (ou variable).

Ce caractère est quantitatif s'il est possible de le mesurer, donc de le représenter par un
nombre .

Il est qualitatif dans le cas contraire.

Une valeur prise par une variable s'appelle une modalité.

3 - Discret, continu :
Dans le cas où les modalités d'un caractère quantitatif sont des valeurs réelles, on dit que ce
caractère est continu.

Si au contraire les modalités sont des valeurs isolées, par exemple des valeurs entières, alors
le caractère est discret.

III - Série statistique à une variable :


1 - définition
Une série statistique à une variable est un ensemble de couples

( )( ) ( 
)  
 x 1, n1 ; x 2 , n 2 ;...; x p , n p  (modalités,effectifs) x 1, x 2 ,...x p sont les
 
modalités prises par le caractère observé. Les composantes n1 , n2 ,...n p sont les effectifs. Pour
chaque , ni est le nombre d'individus sur lesquels on a observé la modalité x i . On pose

COURS STATISTIQUES 1
p k
N =  n j le nombre d'individus observés c’est l’effectif global ou total. Nk =  n j est
j =1 j =1
l’effectif cumulé croissante en xk

2 - Fréquence :
𝑛
Étant donnée une série statistique, la fréquence f de la modalité xi est définie par 𝑓𝑖 = 𝑁𝑖 .
i

f i est la proportion d'individus sur lesquels on a observé la modalité x i .

remarque : la somme des fréquences doit être égale à .

k
Fréquence cumulée croissante en xk : Fk =  f j .
j =1

3 - Le pourcentage
𝑛
Le pourcentage de la valeur x est le nombre 𝑝𝑘 = 100 × 𝑓𝑘 = 100 × 𝑁𝑘 en pourcentage.
k
IV - Représentation graphique
1 - Représentations graphiques pour une distribution statistique discrète :

a - Diagramme en bâtons :
Le diagramme en bâtons des effectifs ( resp. des fréquences …) d’une distribution statistique
discrète est constitué d’une suite de segments verticaux d’abscisses x dont la longueur est
i
proportionnelle à l’effectif (resp. la fréquence) de x .
i
b - Polygone des effectifs ou des fréquences :
- Le polygone des effectifs (resp. des fréquences) d’une distribution statistique discrète est
obtenu à partir du diagramme en bâtons des effectifs (resp. des fréquences) en joignant
par un segment les sommets des bâtons.

c - Polygone des effectifs (resp. des fréquences) cumulés :


- Le polygone des effectifs cumulés (resp. des fréquences cumulées) d’une distribution
statistique discrète est obtenu à partir du diagramme en bâtons des effectifs cumulés
(resp. des fréquences cumulées) en joignant par un segment les sommets des bâtons.

2 - Représentations graphiques pour une distribution statistique continu:


Histogramme :
L’histogramme est la représentation graphique d’une distribution statistique groupée.
Cet histogramme est constitué de rectangles dont la largeur est égale l’amplitude de la
classe ( a = x − x i ) , et la hauteur égale à ni .
i +1

COURS STATISTIQUES 2
V - Paramètres de position :

Étant donné une série statistique 

( x 1, n1);( x 2, n2 );...;( x p , n p ) .
1 - Moyenne
1 p
La moyenne x est donnée par la formule suivante : x =  ni xi
N i =1
2 - Médiane
La médiane M e est la valeur qui sépare les individus en deux groupes de même effectif .
Selon le type de variable et l'effectif, il peut y avoir plusieurs façons de procéder ,pour fixer
les idées on définit la médiane par :

La médiane est la plus petite modalité ayant l’effectif cumulé supérieur ou égal à la moitié de
l’effectif total

Dans le cas continu ;on utilisera l’histogramme des effectifs cumulés pour déterminer la
médiane voir TD.

3 - Mode :
Le mode est la modalité dont l'effectif est le plus élevé dans le cas discret .

La classe modale est la classe dont l'effectif est le plus élevé et le mode dans ce cas sera le
milieu de cette classe.

VI - Caractéristiques de dispersion :
Les paramètres de dispersion permettent de chiffrer la variation des valeurs observées autour
d’un paramètre de position. Les principaux paramètres de dispersion sont : L’écart absolu
moyen, la variance, l’écart-type .
1 - Etendue :
L’étendue, notée𝑒(𝑋), est la différence entre la plus grande et la plus petite des valeurs prises
par le caractère, donc :𝑒(𝑋) = max(𝑋) − min(𝑋).
2 - Variance et écart-type :
La variance d’une distribution statistique discrète est définie par :
1 𝑝 2 1 𝑁 2
𝑉(𝑋) = 𝑁 ∑𝑖=1 𝑛𝑖 (𝑥𝑖 − 𝑋̅) si la série statistique est pondérée et 𝑉(𝑋) = 𝑁 ∑𝑖=1(𝑥𝑖 − 𝑋̅)
dans le cas non pondéré c’est-à-dire lorsque on a pour tout 𝑖 , 𝑛𝑖 =1 .
Proposition1 :
1 𝑝
𝑉(𝑋) = 𝑁 ∑𝑖=1 𝑛𝑖 𝑥𝑖2 − 𝑋̅ 2 = ̅̅̅
𝑋 2̅ − 𝑋̅ 2 : Le carré de la moyenne des valeurs du caractère
ôté du carré de la moyenne des carrées des valeurs.

L’écart-type est égal à :𝜎(𝑋) = √𝑉(𝑋).


Proposition2 :
Si la variable 𝑌 = 𝑎𝑋 + 𝑏 alors 𝑌̅ = 𝑎𝑋̅ + 𝑏 , 𝑉(𝑌) = 𝑎2 𝑉(𝑋) et 𝜎(𝑌) = |𝑎|𝜎(𝑋).

COURS STATISTIQUES 3
3 - Ecart moyen :
L’écart absolu moyen d’une distribution statistique à caractère quantitatif discret est le
nombre réel positif :
𝑝 𝑝
1
𝑒 = ∑ 𝑛𝑖 |𝑥𝑖 − 𝑋̅| = ∑ 𝑓𝑖 |𝑥𝑖 − 𝑋̅|
𝑁
𝑖=1 𝑖=1

VII - Tableaux :
1 - Caractère quantitatif discret :
Lorsque l'on étudie un caractère quantitatif discret, il est usuel d'utiliser un tableau mettant en
correspondance les modalités de la variable avec les effectifs (ou les fréquences).
Exercice1 On a relevé la puissance de 80 voitures d’une entreprise de location (en CV) :
1) Dresser puis compléter le tableau statistique suivant :
Puissance en CV : 𝑥𝑖 4 5 7 8 10 Totaux Moyennes

Effectifs : 𝑛𝑖 12 14 21 24 9 N=

Eff. cumulés : 𝑁𝑖

Fréquences :𝑓𝑖

𝑛𝑖 . 𝑥𝑖 𝑋=

𝑛𝑖 . (𝑥𝑖 )2 𝑋2 =

|𝑥𝑖 − 𝑋|

𝑛𝑖 . |𝑥𝑖 − 𝑋| 𝑒𝑚 =

2) Construire le diagramme en bâtons des effectifs puis le polygone des effectifs de cette
série statistique .
3) Construire le diagramme en bâtons des effectifs cumulés puis le polygone des effectifs
cumulés de cette série statistique.
4) Déterminer les paramètres de position de cette série statistique.
la moyenne , la médiane et le mode.
5) Déterminer les paramètres de dispersion de cette série statistique. La variance ,l’écart-
type et l’écart-moye
6) Calculer le pourcentage de voiture ayant une puissance dans [𝑋 − 𝜎, 𝑋 + 𝜎] .

2 - Caractère quantitatif continu


Lorsque l'on étudie un caractère quantitatif continu , les modalités de la variable sont les
milieux des classes.

COURS STATISTIQUES 4
VIII - Séries statistiques 2 :
Une série statistique à deux variables se forme en étudiant simultanément deux caractères sur
la population. Par exemple, considérons l'expérience consistant à choisir 10 vaches à mesurer
leurs tailles et leurs poids, nous obtenons une série statistique à deux variables car les deux
caractères observés sont la taille et le poids.

Nous noterons x i la modalité du premier caractère prise par l'individu et y i la modalité du


deuxième caractère prise par cet individu. Alors X et Y sont les moyennes respectivement
des x et des y .
i i
Il est usuel de représenter une série à deux variables dans le plan, on obtient ainsi un nuage de
points.

1 - Point moyen
Soit une série statistique à deux variables 𝑋 et 𝑌 le point du plan 𝐺(𝑋̅, 𝑌̅) est appelé point
moyen.
2 - La covariance

La covariance de la série formée par l'observation simultanée des caractères et


1 𝑛
est définie par : 𝐶𝑜𝑣(𝑋, 𝑌) = 𝑁 ∑𝑖=1(𝑥𝑖 − 𝑋̅)(𝑦𝑖 − 𝑌̅).

̅̅̅̅ = 1 ∑ 𝑥𝑖 𝑦𝑖
̅̅̅̅ − 𝑋̅𝑌̅ où 𝑋𝑌
Proposition1 :On a 𝐶𝑜𝑣(𝑋, 𝑌) = 𝑋𝑌 𝑁

Proposition2 :Si la variables𝑋 = 𝑎𝑈 + 𝑏 et Si 𝑌 = 𝑎, 𝑉 + 𝑏 , alors 𝑐𝑜𝑣(𝑋, 𝑌) = 𝑎𝑎, 𝑐𝑜𝑣(𝑈, 𝑉)


.

Remarque 𝐶𝑜𝑣(𝑋, 𝑋) = 𝑉(𝑋).

3 - Coefficient de corrélation affine :


On définit le coefficient de corrélation affine par :
𝐶𝑜𝑣(𝑋,𝑌)
𝑟= . On a 𝑟 ∈ [−1,1] c’est-à-dire que |𝑟| ≤ 1.
𝜎(𝑋)𝜎(𝑌)

4 - Ajustement affine :
Si r x i une estimation convenable
est proche de 1, alors il est possible d'obtenir à partir de
de y i . A partir de x i , on approche y i avec une formule de la forme ax i + b . Cela
s'appelle une régression linéaire, ou encore un ajustement affine. Graphiquement, cela
signifie qu'il existe une droite d'équation y = ax + b passante près de chaque point du
nuage de points. On calcule 𝑎 et 𝑏 en utilisant les formules suivantes :

𝐶𝑜𝑣(𝑋,𝑌)
Formules : 𝑎 = et 𝑏 = 𝑌 − 𝑎𝑋
𝑉(𝑋)
Les valeurs ci-dessus permettent d'effectuer la régression linéaire de 𝑌 en 𝑋 .Si on veut celle
de 𝑋 en 𝑌 on change les rôles 𝑋 et 𝑌.

COURS STATISTIQUES 5
Exercice 3:
Sur un échantillon de 5 étudiants d’une classe de BTS , on a relevé la note X de contrôle
continu , ainsi que la note Y de l’examen , comme l’indique le tableau suivant:
Note de CC : x 6 9 12 13 15
i

Note de l’examn : yi 7 10 14 15 17

1. Compléter le tableau ci-dessous :


Totaux Moyennes
X 6 9 12 13 15
Y 7 10 14 15 17
𝑋2
𝑌2
X.Y

2. Déterminer les coordonnées de point moyen G


3. Calculer l’écart-type des notes de cc et de l’examen.
4. Calculer le coefficient de corrélation du couple (X,Y). Conclure .
5. Déterminer l’équation de la droite de régression de Y en X.
Exercice 4
On cherche s’il existe une relation entre la température et le nombre de glaces vendues par
un épicier. Les informations sont données par le tableau suivant :

Température( en d° Celsius) x i 21 17 24 25 13
Nombre de glaces vendues : yi 25 20 30 35 10

1. Calculer les coordonnées du point moyen G et calculer le coefficient de


corrélation linéaire.
Peut-on envisager une relation linéaire entre les deux variables x et y ?
2. Déterminer l’équation de la droite de régression linéaire au sens des
moindres carrées de y en x .
3. Quel serait alors le nombre de glaces vendues s’il faisait 30 degrés ?
4. Pour quelle température vendrait-on 62 glaces ?

COURS STATISTIQUES 6

Vous aimerez peut-être aussi