Vous êtes sur la page 1sur 17

BTS 2-SRI & 2-DSI 2017/2018

Chapitre VIII : Statistiques descriptives


I- But du chapitre :
1-Séries statistiques à une seule variable :
 Représentation graphique d’une série statistique à une seule variable ;
 Détermination des caractéristiques de position (mode, médiane, moyenne) ;
 Détermination des caractéristiques de dispersion (variance, écart-type, écart moyen)
 Choix des résumés numériques ou graphiques adaptés à une problématique.
2-Séries statistiques à deux variables :
 Représentation du nuage de points ;
 Calcul des coordonnées du point moyen d’un nuage de points ;
 Calcul et interprétation de la covariance et du coefficient de corrélation linéaire ;
 Exploitation de l’ajustement affine par la méthode de Mayer et par la méthode des
moindres carrés pour faire des prévisions.
II- Séries statistiques à une seule variable
1. Vocabulaire statistique
 Population ou univers : L’ensemble de référence, l’ensemble des unités étudiées ou
observées.
 Individu ou unité statistique : Tout élément de la population cible
 Caractère: C’est l’aspect particulier auquel on s’intéresse, la statistique se réfère à
deux grandes catégories de caractères :
 Qualitatif : couleur des yeux, nationalité,….
 Quantitatif : nombre d’étudiant, nombre de pièces fabriquées,……..
 Modalité (xi) : les différentes rubriques associées à un caractère, le nombre de
modalité est généralement noté k .Exemple : pour le caractère état matrimonial, on
pourra avoir 4 modalités (k=4) qui sont : célibataire, marié, divorcé, et veuf.
 Effectif ou fréquence absolue (ni) : C’est le nombre de fois que la modalité xi est
k
observée n
i 1
i N

 Effectif relative (fi) : C’est le pourcentage des individus ayant la modalité i dans la
k
ni
population étudiée on a : fi 
N
et f
i 1
i 1

Mme. BENAZZOU Salma 1


BTS 2-SRI & 2-DSI 2017/2018

2. Représentation graphique d’une série statistique à une seule variable


2.1. Diagrammes différentiels
a. Cas d’une variable qualitative :
 Diagramme en tuyaux d’orgues
5

4,5
n1
4

3,5
n3
3

2,5
n2
2

1,5

0,5

0
x1 x2 x3 x4

 Diagramme circulaire
 N  360 n
   i  360  i  360  fi
 ni   i N

 Exemple
La répartition des candidats convoqués pour participer au test d’admissibilité à la formation
en management pour l’accession à l’ENCG d’Agadir, selon la série de bac se présente comme
suit :
La série de Bac (xi) Le nombre des candidats (ni)
Science économique 250
Science mathématique 200
Science expérimentale 400
T.G.A 50
T.G.C 100

1- Déterminer la population, le caractère, les modalités et leurs nombre


2- Tracer le diagramme en tuyaux d’orgues
3- Tracer le diagramme circulaire

Mme. BENAZZOU Salma 2


BTS 2-SRI & 2-DSI 2017/2018

b- Cas d’une variable quantitative discrète ou discontinue


 Diagramme en bâtons
3,5

2,5

1,5

0,5

0
0 1 2 3 4 5 6

Remarque :
Dans l’axe des X on représente les xi et dans l’axe des Y on représente les fi ou ni

Mme. BENAZZOU Salma 3


BTS 2-SRI & 2-DSI 2017/2018

 Polygone de fréquence simple


Il est construit en joignant par une ligne brisée, les sommets des bâtons formants le
diagramme en bâtons
 Exemple
Tracer le diagramme en bâtons et le polygone de fréquences simple de la série statistique
suivante :
xi ni
3 5
4 15
6 15
7 10
8 5

c- Cas d’une variable quantitative continue


 Histogramme
Se compose de rectangles dont les bases sont égales aux amplitudes des classes ai et les
hauteurs sont proportionnelle :
 Soit aux effectifs ni, si toutes les classes ont la même amplitude
aN
 Soit aux effectifs corrigés nicor= ni . avec aN l’amplitude normale c'est-à-dire
ai
ni
l’amplitude qui se répète le plus ou aux densités di=
ai
 Polygone de fréquence
 Le polygone de fréquence joint les points :
 (ci, nicor) pour les classes ayant une amplitude ai ≤aN
aN a
 (Borne infi+ , nicor) et (Borne supi - N , nicor) pour toutes les
2 2
classes ayant une amplitude ai>aN

Mme. BENAZZOU Salma 4


BTS 2-SRI & 2-DSI 2017/2018

 Le polygone de fréquence pour une variable continue, doit être toujours fermé avec
l’axe des abscisses en prenant deux points aux deux extrémités de l’histogramme, ces
aN a
deux points sont : (Borne inf1- , 0) et (Borne supk+ N , 0)
2 2
 Exemple
Le tableau suivant représente la distribution de 50 étudiants en fonction de leurs tailles.
Tracez l’histogramme et le polygone de fréquence de cette série statistique.
Taille en cm : xi Nombre d’étudiant : ni
150-160 16
160-165 6
165-170 12
170-175 14
175-180 2

Mme. BENAZZOU Salma 5


BTS 2-SRI & 2-DSI 2017/2018

2.2. Diagramme intégral ou cumulatif


 Appelé polygone de fréquences cumulées, ne concerne que les variables
quantitatives
 Le diagramme intégral correspond à la représentation de la fonction cumulative
croissante ou décroissante ou ce qu’on appel fonction de répartition, mais cette
représentation prend deux formes différentes selon qu’on est face à une variable
discrète ou continue.
a- Cas d’une variable discrète ou discontinue
Les deux polygones de fréquences cumulées sont les représentations des deux fonctions en
escaliers suivantes :
 0 X x1  N X  x1
 N1  n1 x1  X x2  N1  N  n1 x1 X  x2
 
 N 2  n1  n2 x2  X x3  N 2  N  n1  n2 x2 X  x3
 N(X )   Et  N ( X )  
... ... ... ...
 N k 1  n1  ...  nk 1 xk 1  X xk  N k 1  N  n1  ...  nk 1 xk 1 X  xk
 
 N k  N X  xk  N k  0 X xk

Exemple :
Donner la représentation graphique des fonctions cumulative croissante et décroissante de la
série statistique suivante :
xi ni
3 5
4 15
6 15
7 10
8 5

Mme. BENAZZOU Salma 6


BTS 2-SRI & 2-DSI 2017/2018

Représentation graphique des fonctions Représentation graphique des fonctions


cumulatives croissante : cumulatives décroissante :

b- Cas d’une variable continue


 Le polygone de fréquences cumulées croissantes est une fonction continue qui joint les
points d’abscisses des bornes supérieurs de la classe i et d’ordonnées  Ni  BSi ,  Ni 

 Le polygone des fréquences cumulés décroissantes est une fonction continue qui joint
les points d’abscisse les ornes inferieurs de classe i et d’ordonnées  Ni  BI ,  N 
i i

Exemple :
Tracer le polygone de fréquences cumulées croissant et décroissant de la série statistique
suivante :
xi ni
150-160 15
160-165 5
165-170 10
170-175 18
175-180 2

Mme. BENAZZOU Salma 7


BTS 2-SRI & 2-DSI 2017/2018

Polygone de fréquences cumulées Polygone de fréquences cumulées décroissant


croissant

3. Caractéristiques de position
3.1. La moyenne
3.1.1. Définition
C’est la valeur centrale et il y’en a 4 :

Moyenne Moyenne Moyenne quadratique Moyenne géométrique


arithmétique harmonique
1
1 k
 ni xi ² X g  ( x x ..........x )
n1 n2 nk
Xq 
N
k
1 N
 ni xi
1 2 k
X Xh  k
N i 1
ni
N i 1

i 1 xi

Mme. BENAZZOU Salma 8


BTS 2-SRI & 2-DSI 2017/2018

BSi  BI i
 Lorsque la variable étudiée est continue, il faut remplacer xi par ci=
2
 La moyenne harmonique est utilisée dans les questions traitant des taux (∝/β), des
vitesses (km/h), des productivités (pièces/ouvrier ou pièces/heure).
3.1.2. Exemples
 Exemple 1
Calculer la moyenne de la série statistique suivante :
Taille en cm (xi) Nombre d’étudiants (ni)
150-160 8
160-165 6
165-170 12
170-175 14
175-180 10

 Exemple 2
Calculer la moyenne de la série statistique suivante :
Vitesse (km/h) (xi) Distance parcourus (ni)
40 20
30 15
10 10
5 5

Mme. BENAZZOU Salma 9


BTS 2-SRI & 2-DSI 2017/2018

3.2. La médiane
3.2.1. Cas d’une série statistique simple
Avant de déterminer la valeur de la médiane, il faut classer la série statistique par ordre
croissant. Deux cas de figure peuvent se présenter :
 Le nombre d’observation est impair : N=2p+1
Dans ce cas la médiane est numéro (p+1) : Me=xp+1
Exemple : Calculez la médiane de la série statistique suivante :

19,17,20,18,17,17,20,19,15,16,20,23,22,14,15.

 Le nombre d’observation est pair : N=2p


Dans ce cas, on n’a pas une valeur médiane mais simplement une classe médiane [xp, xp+1]
x p  x p 1
et on prend comme valeur médiane le centre de cette classe Me=
2
Exemple : Calculez la médiane de la série statistique suivante :

19,17,20,18,17,17,20,19,15,16,20,23,22,14,15,24

3.2.2. Cas d’une distribution groupée


 La détermination analytique de la médiane
 Etape 1 : La détermination de la classe médiane
La classe médiane est la première classe dont l’effectif cumulé croissant est
supérieur ou égale à N/2
 Etape 2 : La détermination de la médiane
Soit i l’indice de la classe médiane, on a alors :
N
 Ni 1
Me= BI i  ( BSi  BI i ). 2
Ni  Ni 1

Mme. BENAZZOU Salma 10


BTS 2-SRI & 2-DSI 2017/2018

 La détermination graphique de la médiane


Il suffit de projeter N/2 sur la courbe cumulative croissante et l’abscisse de ce point, c’est
la médiane.
Exemple : Trouvez la médiane de la série statistique suivante en utilisant la solution
analytique et graphique :
Taille en cm (xi) Nombre d’étudiant (ni)
150-160 15
160-165 5
165-170 10
170-175 18
175-180 2

Solution analytique Solution graphique

Interprétation :

Mme. BENAZZOU Salma 11


BTS 2-SRI & 2-DSI 2017/2018

3.3. Le mode
a- Caractère qualitatif ou quantitatif discret
La modalité dont l’effectif ni est le plus grand est le mode Mo=xi
b- Caractère quantitatif continue
La classe modale i est celle dont l’effectif ni est le plus grand et on a :
ni  ni 1
M o  BI i  ai .
(ni  ni 1 )  (n i  n i 1 )

Remarque : Si les classes ont des amplitudes différentes, on travaillera avec les nicor ou
avec les densités di au lieu des ni
c- Exemple
Déterminez la valeur modale de la série statistique suivante :
Taille en cm (xi) Nombre d’étudiant (ni)
150-165 15
165-170 6
170-175 10
175-185 16
185-200 3

Mme. BENAZZOU Salma 12


BTS 2-SRI & 2-DSI 2017/2018

4. Caractéristiques de dispersion
Il y en a 4 :

La variance L’écart type


1 k
Var(X)=  ni ( xi  X )² =
N i 1  x  var( X ) =
1 k
 ni ( xi  X )²
N i 1
k

 f ( x  X )²
i 1
i i
k
1 k
1 k =  fi ( xi  X )² =  ni xi ²  ( X )²
Var(X)=  ni xi ²  ( X )²
N i 1
i 1 N i 1

k k
=  fi xi ²  ( X )²
i 1
=  f x ²  ( X )²
i 1
i i

Le coefficient de variation Les écarts absolus moyens

x  Ecart absolue moyen par rapport à la


C.V= 100
X moyenne :

 Si le coefficient de variation tend


1 k
vers 0, on dit que la dispersion est
E. A.M( X )   ni ci  X
N i 1
faible et donc la population est
homogène  Ecart absolue moyen par rapport à la
médiane
 Si le coefficient de variation est
1 k
grand, on dit que la dispersion est E. A.M (Me)   ni ci  Me
N i 1
forte et donc la population est
hétérogène  Ecart absolue moyen par rapport au
mode

1 k
E. A.M (Mo)   ni ci  Mo
N i 1

Mme. BENAZZOU Salma 13


BTS 2-SRI & 2-DSI 2017/2018

III- Séries statistiques à deux variables


1. Position du problème
Le problème qui se pose dans les séries statistiques à deux variables est principalement celui
du lien qui existe ou non entre chacune des variables.
Exemple : Le tableau suivant donne l’évolution du nombre d’adhérents d’un club du rugby de
2001 à 2006.
Année 2001 2002 2003 2004 2005 2006
Rang (xi) 1 2 3 4 5 6
Nombre 70 90 115 140 170 220
d’adhérents
(yi)
Le but est d’étudier cette série statistique à 2 variables (rang xi et le nombre d’adhérents yi)
afin de prévoir l’évolution du nombre d’adhérents pour les années suivantes.
1-1- Nuage de points :
La première étape consiste à réaliser un graphique qui traduit les deux séries statistiques.
Soit X et Y deux variables statistiques numériques observées sur n individus.
Dans un repère orthogonal (O, i, j), l’ensemble de n points de coordonnées (xi, yi) forme le
nuage de points associé à cette série statistique.
Dans notre exemple, si on place le rang en abscisses, et le nombre d’adhérents en ordonnées ,
on peut représenter par un point chaque valeur, on obtient ainsi une succession de point, dont
les coordonnées sont (1,70) , (2,90) , (3,115) , (4,140) , (5,170) , (6,220) formant un nuage de
points.
250

200

150

100

50

0
0 1 2 3 4 5 6 7

Mme. BENAZZOU Salma 14


BTS 2-SRI & 2-DSI 2017/2018

1-2- Point moyen


Soit une série statistique à deux variables X et Y dont les valeurs sont les couples (xi, yi)
On appelle point moyen de la série, le point G de coordonnées :
x1  x2  .....  xn y  y  .....  yn
xG  Et yG  1 2
n n
Question : déterminer les coordonnées des points moyens suivants :
 G1 : des années allant de 2001 à 2003
 G2 : des années allant de 2004 à 2006
 G : le point moyen de tout le nuage de point étudiée

2. Ajustement
2.1. La méthode de Mayer
Consiste à déterminer la droite passant par 2 points moyen de nuage de points (le
nuage est partagé suivant les valeurs croissantes des xi en 2 nuages d’égale
importance).
Exemple : Déterminer la droite de Mayer dans l’exemple d’évolution des nombre
d’adhérant dans un club de rugby.

Mme. BENAZZOU Salma 15


BTS 2-SRI & 2-DSI 2017/2018

2.2. La méthode des moindres carrées


3,5
Q1
3 M2

2,5
M1

2 Q2
Valeur des Y
1,5 Q3 Linéaire (Valeur des Y)

0,5 M3

0
0 0,5 1 1,5 2 2,5 3 3,5

n
Objectif : On cherche à minimiser  (M Q )²
i 1
i i

Dans le plan muni d’un repère orthonormé, on considère un nuage de n points de coordonnées
(xi, yi). La droite (D) d’équation y=ax+b est appelée droite de régression de y en x de la série
statistique si et seulement la quantité suivante est minimale.
n n

 (M iQi )²   ( yi  (axi  b))²


i 1 i 1
n
Remarque1 : La droite qui minimise la quantité  ( x  (ay  b))² est appelée la droite de
i 1
i i

régression de x en y.
Définition : On appel covariance de la série statistique double de variable x et y, le nombre
1 n 1 n
réel : cov( x, y)   xy   ( xi  x)( yi  y) ou cov( x, y)   xi yi  x y
n i 1 n i 1
Remarque2 : On a var( X )  cov( x, x)   x ²  ( x )²

Propriétés :
 xy
 La droite de régression (D) de y en x a pour équation y=ax+b où a  et b vérifie
( x )²
l’équation y  ax  b
 Le point G appartient à la droite de régression de y en x
Exemple
Calculer la droite de régression dans l’exemple d’évolution du nombre d’adhérents d’un club
du rugby.

Mme. BENAZZOU Salma 16


BTS 2-SRI & 2-DSI 2017/2018

3. Le coefficient de corrélation linéaire :


 xy
 Le coefficient de corrélation linéaire est définit par la relation suivante : r 
 x  y
 Plus le coefficient est proche de 1 en valeur absolue, meilleur est l’ajustement linéaire
 Lorsque r=1 ou r=-1, la droite de régression passe par tous les points du nuage
 Lorsque la corrélation est forte, le nuage de point peut être approximer par la droite de
régression
 Lorsque la corrélation est faible, le nuage de point ne peut pas être ajusté par une
droite mais il se peut qu’une autre courbe permette un bon ajustement.

Mme. BENAZZOU Salma 17

Vous aimerez peut-être aussi