Académique Documents
Professionnel Documents
Culture Documents
COURS DE STATISTIQUE
APPLIQUEE 1
SOMMAIRE
I- ANALYSE UNIVARIEE................................................................................2
1-Analyse sur variables quantitatives..............................................................2
a-Indicateurs de position...........................................................................2
b-Indicateurs de dispersion.......................................................................5
2-Analyse sur variables qualitatives......................................................................9
3-Représentations graphiques................................................................................9
a-Caractère quantitatif..............................................................................9
b-Caractère qualitatif..............................................................................12
II - ANALYSE BIVARIEE.................................................................................13
1-Tableaux croisés (quali x quali).................................................................13
2-Tableaux de moyennes (quali x quanti).....................................................15
3-Corrélation (quanti x quanti)......................................................................15
I. ANALYSES UNIVARIEES
Les analyses univariées concernent le traitement d’une seule variable. Elles ont pour
objet de synthétiser et d’analyser les informations disponibles sur cette variable. Elles
dépendent du type de variables ou de données en présence.
Dans le cadre d’un questionnaire, des données quantitatives apparaissent chaque fois
que la personne interrogée se voit demander la valeur (mesure, quantité) qu’elle donne à la
variable concernée. La synthèse de ces données peut être réalisée à travers le calcul de divers
indicateurs qui sont regroupés en deux grandes catégories : les indicateurs de position et les
indicateurs de dispersion.
Le mode
Le mode est la valeur de la variable qui présente l’effectif le plus élevé (ou la
fréquence la plus élevée).
La classe modale est [60,5 ; 63,5[ car elle présente le rapport le plus élevé (24).
L’intérêt du mode est évident puisqu’il désigne la valeur de la variable qui revient le
plus souvent à l’occasion des observations faites.
que si l’effectif correspondant est nettement supérieur aux effectifs présentés par les
autres valeurs de la variable.
La médiane
La médiane est la valeur de la variable telle que le total des effectifs correspondant à
des valeurs de la variable inférieures à cette médiane, soit égal au total des effectifs
correspondant à des valeurs de la variable supérieures à cette médiane.
Variable discrète
Un candidat a obtenu les notes suivantes, sur 20, à l’occasion des épreuves qu’il a dû
subir.
Notes Cœfficient
14 1
8 1
11 1
12 3
10 1
7 2
Total 9
Rangeons dans l’ordre croissant (ou décroissant) les notes obtenues par ce candidat, la
note sept dont le coefficient est 2, étant écrite deux fois, la note 12 dont le coefficient 3, étant
écrite 3 fois, les autres notes étant écrite une fois.
7 7 8 10 11 12 12 12 14
Dans la série écrite qui compte 9 termes (nombre impair) étant la somme des
cœfficients, ou somme des effectifs, la note médiane est 11.
6 7 7 8 10 11 12 12 12 14
Les notes étant cette fois au nombre de 10 (nombre paire) on obtient un intervalle
médian [10 ; 11] ou la rigueur à une médiane égale à 10,5.
Variable continue
Pour l’illustration de cette partie reprenons des 250 ouvriers d’une entreprise
classés d’après leur salaire horaire.
Effectifs Effectifs cumulés Effectifs cumulés
Salaire horaire
(ni) croissants décroissants
[47,50 ; 52,50[ 10 10 250
[52,50 ; 57,50[ 30 40 240
[57,50 ; 60,50[ 60 100 210
[60,50 ; 63,50[ 72 172 150
[63,50 ; 67,50[ 40 212 78
[67,50 ; 73,50[ 24 236 38
[73,50 ; 80,50[ 14 250 14
Total 250
60,50 Me 63,50
Me = 61,54 F
La moyenne
La moyenne est le rapport de la somme des valeurs prises par la variable pondéré de
leur effectif par l’effectif total.
Exemple :
Nombre d’enfants (xi) Effectifs (ni) xi.ni
0 4 0
1 15 15
2 29 58
3 18 54
4 10 40
5 3 15
6 1 6
Total 80 188
enfants
L’étendu est la différence entre la valeur la plus élevée et la valeur la plus faible prise
par une variable.
L’intervalle interquartile
40 125 100
57,50 Q1 60,50
Ecart moyen
total obtenu par l’effectif de la population. On obtient ainsi l’écart moyen (em) :
ou
Variance, Ecart-type
La variance est la moyenne arithmétique des carrés des écarts des valeurs de la
variable à leur moyenne arithmétique. On désigne par (lire "sigma carré"), ou par
Coefficient de variation
Les indicateurs présentés précédemment s’exprime dans la même unité que la variable
étudiée. Ils ne sont pas adéquats pour comparer la dispersion de deux distributions qui ne
s’exprime pas dans la même unité. Le coefficient de variation supprime ce défaut. Il se calcul
comme le rapport de l’ecart-type à la moyenne.
L’analyse sur données qualitatives se fait par détermination des pourcentages des
individus appartenant aux différentes modalités.
La distribution des 250 élèves en fonction des années de préparations du concours est
la suivante :
%tage Angle (°)
Années Effectif (ni)
(%)
Divorcés 29 11,6 42
Célibataires 112 44,8 161
Mariés 96 38,4 138
Veufs 13 5,2 19
Total 250 100 360
1. Représentation graphique
a. Caractère qualitatif
Exemple
Exemple
Le diagramme en barres
Exemple
b. Caractère quantitatif
La représentation graphique d’un caractère quantitatif se fait selon le fait qu’il soit
discret ou continue. Ainsi utilise-on le diagramme en bâton lorsqu’il est discret,
l’histogramme et les polygones cumulatifs croissant ou décroissant s’il est continu.
Le diagramme en bâton
En chacun des points correspondant aux valeurs prisent par la variable, on trace
parallèlement à l’axe des ordonnées un bâtons de longueur proportionnelle à l’effectif
correspondant. Nous obtenons ainsi un diagramme en bâton.
Exemple
Un histogramme est un ensemble de rectangles accolées dont les bases sont les
amplitudes des classes et les hauteurs les différents rapports Effectifs / amplitudes relatifs.
Exemple
Amplitude Effectifs Effectif Effectif /
(Base des Effectifs Cumulés cumulés amplitude
Salaire horaire (xi)
rectangles) (ni) croissants décroissants (hauteur des
rectangles)
[47,50 ; 52,50[ 5 10 10 250 2
[52,50 ; 57,50[ 5 30 40 240 6
[57,50 ; 60,50[ 3 60 100 210 20
[60,50 ; 63,50[ 3 72 172 150 24
[63,50 ; 67,50[ 4 40 212 78 10
[67,50 ; 73,50[ 6 24 236 38 4
[73,50 ; 80,50[ 7 14 250 14 2
Total 250
Il a le même principe de construction que celui qui précède à la seule différence que
les abscisses sont égales aux bornes inférieure des classes, sauf pour le dernier point et dont
les ordonnées sont les effectifs cumulés décroissants correspondants.
1) Tableau croisé
Ce tableau croisé et son analyse diffèrent selon que l’on choisisse de les établir selon
les pourcentages en ligne, en colonne ou au total.
c. Pourcentage en colonne
Les pourcentages étant établir sur des pourcentages en colonne on obtient un tableau
de la sorte :
d. Pourcentage au total
Les pourcentage étant établir sur des pourcentage au total on obtient un tableau de la
sorte :
2) Tableau de moyenne
On obtient ce type de tableau en croisant une variable fermée nominale avec une
ou plusieurs variables numériques. Observons l’exemple suivant :
DEPENSE
CARBURANT
3) Corrélation
Si les deux variables numériques sont x et y alors r est donné par la formule suivante :
Si :
- r est proche de 1 alors, forte relation positive entre les deux variables.
- r est proche de -1 alors, forte relation négative entre les deux variables.
- r est proche de o alors, faible relation entre ces deux variables.
Lorsque dans un repère orthonormé, on représente toutes les observations ayant pour
abscisse x et pour ordonnée y, on parle de nuage de points.
; et .
Exemple :
; et .
et