Académique Documents
Professionnel Documents
Culture Documents
I- But du chapitre :
1-Séries statistiques à une seule variable :
Représentation graphique d’une série statistique à une seule variable ;
Détermination des caractéristiques de position (mode, médiane, moyenne) ;
Détermination des caractéristiques de dispersion (variance, écart-type, écart moyen)
Choix des résumés numériques ou graphiques adaptés à une problématique.
2-Séries statistiques à deux variables :
Représentation du nuage de points ;
Calcul des coordonnées du point moyen d’un nuage de points ;
Calcul et interprétation de la covariance et du coefficient de corrélation linéaire ;
Exploitation de l’ajustement affine par la méthode de Mayer et par la méthode des
moindres carrés pour faire des prévisions.
II- Séries statistiques à une seule variable
1. Vocabulaire statistique
Population ou univers : L’ensemble de référence, l’ensemble des unités étudiées ou
observées.
Individu ou unité statistique : Tout élément de la population cible
Caractère: C’est l’aspect particulier auquel on s’intéresse, la statistique se réfère à
deux grandes catégories de caractères :
Qualitatif : couleur des yeux, nationalité,….
Quantitatif : nombre d’étudiant, nombre de pièces fabriquées,……..
Modalité (xi) : les différentes rubriques associées à un caractère, le nombre de
modalité est généralement noté k .Exemple : pour le caractère état matrimonial, on
pourra avoir 4 modalités (k=4) qui sont : célibataire, marié, divorcé, et veuf.
Effectif ou fréquence absolue (ni) : C’est le nombre de fois que la modalité xi est
k
observée n
i 1
i N
Effectif relative (fi) : C’est le pourcentage des individus ayant la modalité i dans la
k
ni
population étudiée on a : fi
N
et f
i 1
i 1
1
2. Représentation graphique d’une série statistique à une seule variable
2.1. Diagrammes différentiels
a. Cas d’une variable qualitative :
Diagramme en tuyaux d’orgues
5
4,5
n1
4
3,5
n3
3
2,5
n2
2
1,5
0,5
0
x1 x2 x3 x4
Diagramme circulaire
N 360 n
i 360 i 360 fi
ni i N
Exemple
La répartition des candidats convoqués pour participer au test d’admissibilité à la formation
en management pour l’accession à l’ENCG d’Agadir, selon la série de bac se présente comme
suit :
La série de Bac (xi) Le nombre des candidats (ni)
Science économique 250
Science mathématique 200
Science expérimentale 400
T.G.A 50
T.G.C 100
2
b- Cas d’une variable quantitative discrète ou discontinue
Diagramme en bâtons
3,5
2,5
1,5
0,5
0
0 1 2 3 4 5 6
Remarque :
Dans l’axe des X on représente les xi et dans l’axe des Y on représente les fi ou ni
3
Polygone de fréquence simple
Il est construit en joignant par une ligne brisée, les sommets des bâtons formants le
diagramme en bâtons
Exemple
Tracer le diagramme en bâtons et le polygone de fréquences simple de la série statistique
suivante :
xi ni
3 5
4 15
6 15
7 10
8 5
4
Le polygone de fréquence pour une variable continue, doit être toujours fermé avec
l’axe des abscisses en prenant deux points aux deux extrémités de l’histogramme, ces
aN a
deux points sont : (Borne inf1- , 0) et (Borne supk+ N , 0)
2 2
Exemple
Le tableau suivant représente la distribution de 50 étudiants en fonction de leurs tailles.
Tracez l’histogramme et le polygone de fréquence de cette série statistique.
Taille en cm : xi Nombre d’étudiant : ni
150-160 16
160-165 6
165-170 12
170-175 14
175-180 2
5
2.2. Diagramme intégral ou cumulatif
Appelé polygone de fréquences cumulées, ne concerne que les variables
quantitatives
Le diagramme intégral correspond à la représentation de la fonction cumulative
croissante ou décroissante ou ce qu’on appel fonction de répartition, mais cette
représentation prend deux formes différentes selon qu’on est face à une variable
discrète ou continue.
a- Cas d’une variable discrète ou discontinue
Les deux polygones de fréquences cumulées sont les représentations des deux fonctions en
escaliers suivantes :
0 X x1 N X x1
N1 n1 x1 X x2 N1 N n1 x1 X x2
N 2 n1 n2 x2 X x3 N 2 N n1 n2 x2 X x3
N(X ) Et N ( X )
... ... ... ...
N k 1 n1 ... nk 1 xk 1 X xk N k 1 N n1 ... nk 1 xk 1 X xk
N k N X xk N k 0 X xk
Exemple :
Donner la représentation graphique des fonctions cumulative croissante et décroissante de la
série statistique suivante :
xi ni
3 5
4 15
6 15
7 10
8 5
6
Représentation graphique des fonctions Représentation graphique des fonctions
cumulatives croissante : cumulatives décroissante :
Le polygone des fréquences cumulés décroissantes est une fonction continue qui joint
les points d’abscisse les ornes inferieurs de classe i et d’ordonnées Ni BI , N
i i
Exemple :
Tracer le polygone de fréquences cumulées croissant et décroissant de la série statistique
suivante :
xi ni
150-160 15
160-165 5
165-170 10
170-175 18
175-180 2
7
Polygone de fréquences cumulées Polygone de fréquences cumulées décroissant
croissant
3. Caractéristiques de position
3.1. La moyenne
3.1.1. Définition
C’est la valeur centrale et il y’en a 4 :
8
BSi BI i
Lorsque la variable étudiée est continue, il faut remplacer xi par ci=
2
La moyenne harmonique est utilisée dans les questions traitant des taux (∝/β), des
vitesses (km/h), des productivités (pièces/ouvrier ou pièces/heure).
3.1.2. Exemples
Exemple 1
Calculer la moyenne de la série statistique suivante :
Taille en cm (xi) Nombre d’étudiants (ni)
150-160 8
160-165 6
165-170 12
170-175 14
175-180 10
Exemple 2
Calculer la moyenne de la série statistique suivante :
Vitesse (km/h) (xi) Distance parcourus (ni)
40 20
30 15
10 10
5 5
9
3.2. La médiane
3.2.1. Cas d’une série statistique simple
Avant de déterminer la valeur de la médiane, il faut classer la série statistique par ordre
croissant. Deux cas de figure peuvent se présenter :
Le nombre d’observation est impair : N=2p+1
Dans ce cas la médiane est numéro (p+1) : Me=xp+1
Exemple : Calculez la médiane de la série statistique suivante :
19,17,20,18,17,17,20,19,15,16,20,23,22,14,15.
19,17,20,18,17,17,20,19,15,16,20,23,22,14,15,24
10
La détermination graphique de la médiane
Il suffit de projeter N/2 sur la courbe cumulative croissante et l’abscisse de ce point, c’est
la médiane.
Exemple : Trouvez la médiane de la série statistique suivante en utilisant la solution
analytique et graphique :
Taille en cm (xi) Nombre d’étudiant (ni)
150-160 15
160-165 5
165-170 10
170-175 18
175-180 2
Interprétation :
11
3.3. Le mode
a- Caractère qualitatif ou quantitatif discret
La modalité dont l’effectif ni est le plus grand est le mode Mo=xi
b- Caractère quantitatif continue
La classe modale i est celle dont l’effectif ni est le plus grand et on a :
ni ni 1
M o BI i ai .
(ni ni 1 ) (n i n i 1 )
Remarque : Si les classes ont des amplitudes différentes, on travaillera avec les nicor ou
avec les densités di au lieu des ni
c- Exemple
Déterminez la valeur modale de la série statistique suivante :
Taille en cm (xi) Nombre d’étudiant (ni)
150-165 15
165-170 6
170-175 10
175-185 16
185-200 3
12
4. Caractéristiques de dispersion
Il y en a 4 :
f ( x X )²
i 1
i i
k
1 k
1 k = fi ( xi X )² = ni xi ² ( X )²
Var(X)= ni xi ² ( X )²
N i 1
i 1 N i 1
k k
= fi xi ² ( X )²
i 1
= f x ² ( X )²
i 1
i i
1 k
E. A.M (Mo) ni ci Mo
N i 1
13
III- Séries statistiques à deux variables
1. Position du problème
Le problème qui se pose dans les séries statistiques à deux variables est principalement celui
du lien qui existe ou non entre chacune des variables.
Exemple : Le tableau suivant donne l’évolution du nombre d’adhérents d’un club du rugby de
2001 à 2006.
Année 2001 2002 2003 2004 2005 2006
Rang (xi) 1 2 3 4 5 6
Nombre 70 90 115 140 170 220
d’adhérents
(yi)
Le but est d’étudier cette série statistique à 2 variables (rang xi et le nombre d’adhérents yi)
afin de prévoir l’évolution du nombre d’adhérents pour les années suivantes.
1-1- Nuage de points :
La première étape consiste à réaliser un graphique qui traduit les deux séries statistiques.
Soit X et Y deux variables statistiques numériques observées sur n individus.
Dans un repère orthogonal (O, i, j), l’ensemble de n points de coordonnées (xi, yi) forme le
nuage de points associé à cette série statistique.
Dans notre exemple, si on place le rang en abscisses, et le nombre d’adhérents en ordonnées ,
on peut représenter par un point chaque valeur, on obtient ainsi une succession de point, dont
les coordonnées sont (1,70) , (2,90) , (3,115) , (4,140) , (5,170) , (6,220) formant un nuage de
points.
250
200
150
100
50
0
0 1 2 3 4 5 6 7
14
1-2- Point moyen
Soit une série statistique à deux variables X et Y dont les valeurs sont les couples (xi, yi)
On appelle point moyen de la série, le point G de coordonnées :
x1 x2 ..... xn y y ..... yn
xG Et yG 1 2
n n
Question : déterminer les coordonnées des points moyens suivants :
G1 : des années allant de 2001 à 2003
G2 : des années allant de 2004 à 2006
G : le point moyen de tout le nuage de point étudiée
2. Ajustement
2.1. La méthode de Mayer
Consiste à déterminer la droite passant par 2 points moyen de nuage de points (le
nuage est partagé suivant les valeurs croissantes des xi en 2 nuages d’égale
importance).
Exemple : Déterminer la droite de Mayer dans l’exemple d’évolution des nombre
d’adhérant dans un club de rugby.
15
2.2. La méthode des moindres carrées
3,5
Q1
3 M2
2,5
M1
2 Q2
Valeur des Y
1,5 Q3 Linéaire (Valeur des Y)
0,5 M3
0
0 0,5 1 1,5 2 2,5 3 3,5
n
Objectif : On cherche à minimiser (M Q )²
i 1
i i
Dans le plan muni d’un repère orthonormé, on considère un nuage de n points de coordonnées
(xi, yi). La droite (D) d’équation y=ax+b est appelée droite de régression de y en x de la série
statistique si et seulement la quantité suivante est minimale.
n n
régression de x en y.
Définition : On appel covariance de la série statistique double de variable x et y, le nombre
1 n 1 n
réel : cov( x, y) xy ( xi x)( yi y) ou cov( x, y) xi yi x y
n i 1 n i 1
Remarque2 : On a var( X ) cov( x, x) x ² ( x )²
Propriétés :
xy
La droite de régression (D) de y en x a pour équation y=ax+b où a et b vérifie
( x )²
l’équation y ax b
Le point G appartient à la droite de régression de y en x
Exemple
Calculer la droite de régression dans l’exemple d’évolution du nombre d’adhérents d’un club
du rugby.
16
3. Le coefficient de corrélation linéaire :
xy
Le coefficient de corrélation linéaire est définit par la relation suivante : r
x y
Plus le coefficient est proche de 1 en valeur absolue, meilleur est l’ajustement linéaire
Lorsque r=1 ou r=-1, la droite de régression passe par tous les points du nuage
Lorsque la corrélation est forte, le nuage de point peut être approximer par la droite de
régression
Lorsque la corrélation est faible, le nuage de point ne peut pas être ajusté par une
droite mais il se peut qu’une autre courbe permette un bon ajustement.
17