Académique Documents
Professionnel Documents
Culture Documents
OUAARAB 1
A. OUAARAB 2
Population : groupe ou ensemble d'individus que l'on analyse.
Recensement : étude de tous les individus d'une population
donnée.
Sondage : étude d'une partie seulement d'une population
appelée échantillon.
A. OUAARAB 3
Variables : ensemble de caractéristiques d'une population.
◦ quantitatives: nombres sur lesquels les opérations usuelles
(somme, moyenne,...) ont un sens ; elles peuvent être :
discrètes (ex : nombre d'éléments dans un ensemble) ou
continues (ex: prix, taille) ;
◦ qualitatives: appartenance a une catégorie donnée ; elles peuvent
être :
nominales (ex : sexe, CSP) ou
ordinales quand les catégories sont ordonnées (ex : très
résistant, assez résistant, peu résistant).
A. OUAARAB 4
Définition
On appelle variable un vecteur x de taille n.
Chaque coordonnée xi correspond a un individu.
Représentation
histogramme en découpant
les valeurs de la variable en classes.
Résumés
on dispose d'une série d'indicateurs qui ne donne qu'une vue partielle des données
: effectif, moyenne, médiane, variance, écart type, minimum, maximum, 1er
quartile, 3eme quartile, ...
Ces indicateurs mesurent principalement la tendance centrale et la dispersion. On
utilisera principalement la moyenne, la variance et l'écart type.
A. OUAARAB 5
C'est la valeur observée d'effectif maximum : la valeur dominante.
La valeur la plus fréquente d'une série statistique
Exemple : un mode de la série suivante est 5 car il a le plus grand
nombre d'occurrences.
4 6 5 6 8 4 6 5 10 5
A. OUAARAB 6
La médiane d'une série statistique rangée dans l'ordre croissant
(x1 , x2 , x3 , x4 , ....., xn) est le nombre M = Q2 ( parce qu'on l'appelle
aussi deuxième quartile ) défini de la façon suivante :
◦ Si n = 2p est pair , M est le centre de l'intervalle [xp ; xp+1]
◦ Si n est impair, M est le nombre xp où p = (n + 1)/2 .
4 6 5 6 8 4 6 5 10 5
Après tri :
4 4 5 5 5 6 6 6 8 10
A. OUAARAB 7
Si xi sont les observations d'une variable, la moyenne est
simplement donnée par 1 n
x=
n
x
i =1
i
8 A. OUAARAB
la moyenne arithmétique est une mesure de tendance centrale qui est
sensible aux valeurs extrêmes.
La moyenne ne décrit rien sur l’étendue de la série :
◦ deux séries de même moyenne peuvent être très différentes, l’une
regroupée autour de cette moyenne et l’autre au contraire très
dispersée.
La moyenne arithmétique conserve les changements d'échelle et
d'origine
µ(ax + b) = aµ(x) + b
9 A. OUAARAB
Ce sont des caractéristiques de position.
Il y a 1 médiane Mé qui sépare les observations en 2 groupes d'effectifs égaux
3 quartiles Q1, Q2, Q3 qui séparent les observations en 4 groupes d'effectifs
égaux 4 4 5 5 5 6 6 6 8 10
◦ Q1= 5; Q2=5,6; Q3=6
9 déciles D1, D2, ..., D9 qui séparent les observations en 10 groupes
d'effectifs égaux
99 centiles C1, C2, ..., C99 qui séparent les observations en 100 groupes
d'effectifs égaux
A. OUAARAB 10
Comme leur nom l'indique, ces caractéristiques essayent de
synthétiser par une seule valeur numérique la dispersion de toutes
les valeurs observées.
1) ÉTENDUE
C'est la différence entre la plus grande et la plus petite observation
2) INTERVALLE INTER-QUARTILE
C'est la différence entre le troisième et le premier quartile
A. OUAARAB 11
Définition
la variance de x est définie par
i =1 i
n
( x − x ) 2
x =
2
n
L'écart type σx est la racine carrée de la variance.
12 A. OUAARAB
La variance est « la moyenne des carres moins le carre de la moyenne ».
On utilise plus couramment l'écart-type qui est une mesure de dispersion et
qui a l'avantage d'être un nombre de même dimension que les données
La variance est un paramètre de dispersion plus utilisé que les autres de par ses
propriétés algébriques:
Variance globale
Changement d’échelle et d’origine
◦ Var (ax + b) = a2Var (x)
A. OUAARAB 13
C'est un coefficient qui permet de relativiser l'écart-type en
fonction de la taille des valeurs.
Il permet ainsi de comparer la dispersion de séries de mesures
exprimées dans des unités différentes
Le coefficient de variation est défini par :
CV= σ/µ
A. OUAARAB 14
But : mettre en évidenceles relations qui existent entre
deux séries d’observations.
A. OUAARAB 15
Définition :
On considère une population d'effectif n, si on étudie deux caractères X
et Y de des individus de cette population, on dit que l'on étudie une
série statistique double.
Chaque individu est désigné par un nombre compris entre 1 et n.
A chaque individu i ( 1≤ i≤ n) correspond un couple (xi ; yi) , ou xi est la
modalité du caractère X et yi est la modalité du caractère Y associé à
l'individu i.
L’ensemble des couples (xi ; yi) définit une série statistique à deux
variables.
A. OUAARAB 16
Le tableau ci-dessous donne, pour chaque ville, le nombre moyen
d’heures d’ensoleillement dans l’année, ainsi que la température
moyenne :
Ville Ajaccio Lyon Marseille Brest Lille Paris Strasbourg
A. OUAARAB 17
Le tableau ci-dessous permet de suivre l'évolution de l'espérance
de vie à la naissance (en années) en France de 1990 à 1999 pour
les femmes:
Année 1990 1991 1992 1993 1994 1995 1996 1997 1998
Espérance de 80,9 81,1 81,3 81,4 81,8 81,9 82,0 82,3 82,4
vie
A. OUAARAB 18
Exemple 3 : Chaque mois, une entreprise consacre une somme à
des opérations publicitaires. On met en regard le montant des
ventes chaque mois. Une étude portant sur 8 mois a donné les
résultats suivants exprimés en millions d’euros.
A. OUAARAB 19
X=Frais de pub 0,24 0,3 0,25 0,32 0,35 0,2 0,18 0,3
Y=Ventes 38 42 39 40 45 35 34 41
A. OUAARAB 20
De la donnée de la série statistique double, on peut déduire les séries
statistiques simples décrivant séparément les caractères X et Y :
X=Frais de pub 0,18 0,2 0,24 0,25 0,3 0,3 2 0,35
Effectifs 1 1 1 1 2 1 1
Y=Ventes 34 35 38 39 40 41 42 45
Effectifs 1 1 1 1 1 1 1 1
A. OUAARAB 21
Soit X̅ =0,26la moyenne de la série (xi), et Y̅=39,25 la moyenne de
la série (yi).
Le point G de coordonnées ( X̅;Y̅ ) est appelé point moyen du
nuage de points associé à cette série statistique double.
A. OUAARAB 22
Pour mesurer « l’étendue en surface » du nuage, on calcule la
covariance des deux séries.
A. OUAARAB 23
Le signe de la covariance renseigne sur le fait que les deux séries
varient dans le même sens ou en sens opposé :
Une covariance positive indique que l’une augmente quand l’autre
augmente ou diminue quand l’autre diminue.
A. OUAARAB 24
Définition : On appelle coefficient de corrélation linéaire du
couple (X, Y), le nombre réel, noté r(X, Y) tel que :
Cov( x, y )
r ( x, y ) =
x y
A. OUAARAB 25
Le coefficient de corrélation linéaire est un équivalent de la
covariance qui est indépendant des unités dans lesquelles ont été
exprimé les deux séries de mesures.
On peut montrer qu’il est toujours compris entre −1 et +1.
On dit que les deux séries sont faiblement corrélées lorsque r(x, y)
est proche de zéro. Dans ce cas le nuage a une forme très dispersée.
Si r(x, y) est proche de −1 ou +1, les deux séries sont dites fortement
corrélées (positivement si r(x, y) > 0 et négativement si r(x, y) < 0).
Dans ce cas le nuage est regroupé le long d’une droite (de pente
positive si r(x, y) ≃ +1 et de pente négative si r(x, y) ≃ −1).
A. OUAARAB 26