Vous êtes sur la page 1sur 22

Cours de statistique 1

ENSEIGNANT : Dr. Didier Alain DJAMEN


P h.D. in Applied M athematics
Table de valeur :
1 CHAPITRE 1 : INTRODUCTION GÉNERALE 1
1.1 But de la statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Intérêt de la statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2.1 La phase de la collecte et la description . . . . . . . . . . . . . . . . . . . . . . . 1
1.2.2 Phase de l’analyse des données . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2.3 Phase d’interprétation des données . . . . . . . . . . . . . . . . . . . . . . . . . 2

2 CHAPITRE 2 : VOCABULAIRE STATISTIQUE 3


2.1 Généralité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Définition et désignation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.3 Notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

3 CHAPITRE 3 : REPRESENTATION GRAPHIQUE 5


3.1 Tableau statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.2 Classes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.2.1 Classes contigue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.2.2 Classes non contigue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.3 Représentation graphique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.3.1 Cas d’un caractère qualitatif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.3.2 Cas d’un caractère quantitatif . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

4 CHAPITRE 4 :ANALYSE STATISTIQUE A UNE DIMENSION 9


4.1 Paramètre de position . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.1.1 Le mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.1.2 La médiane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.1.3 La moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.2 Paramètre de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.2.1 Les quartiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.2.2 Les Déciles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.2.3 Les Pércentiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.2.4 L’Etendu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.2.5 Le Semi-interquartile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.2.6 L’intervalle interquartile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.2.7 L’écart moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.2.8 L’écart médian . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.2.9 La variance et l’écart-type . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
4.2.10 Le coefficient de variation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
4.2.11 Le Scart . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
4.2.12 Le moment . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
4.3 Paramètre des formes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
4.3.1 Le coefficient d’asymétrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
4.3.2 Le coefficient d’aplatissement . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
4.4 Généralisation de la moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
4.4.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
4.4.2 Quelques cas particuliers : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
5 CHAPITRE 5 : ANALYSE STATISTIQUE A DEUX DIMENSIONS 16
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
5.2 Représentation générale des tableaux statistiques à double entrée . . . . . . . . . . . . 16
5.2.1 Distribution conjointe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
5.2.2 Notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
5.2.3 Fréquence (ou pourcentage) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
5.3 Distribution marginale et conditionnelle . . . . . . . . . . . . . . . . . . . . . . . . . . 17
5.3.1 Distribution marginale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
5.3.2 distribution conditionnelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
5.3.3 Propriétés des fréquences marginales conditionnelles . . . . . . . . . . . . . . . . 19

3
1 CHAPITRE 1 : INTRODUCTION GÉNÉRALE
1.1 But de la statistique
La statistique est une discipline qui s’inspire au profondément de la méthode scientifique : c’est une
science fondée sur la mathématique.

La statistique permet de somatiser les masses considérables des données. De cerner et décrire cer-
taines relations pourtant obscures entre les variables.

La statistique traite l’information imparfaite obtenue le plus souvent par échantillonnage et par
conséquent la statistique est la science de l’incertitude et des erreurs.

La statistique est un art (elle est capable de communiquer les résultats obtenus).

La statistique doit pouvoir produire des réponses claires et précises.

La statistique s’applique à tous les faits dont la multiplicité des causes, leurs complicités et leurs
enchevêtrements interdisent de la méthode expérimentale.

1.2 Intérêt de la statistique


La statistique est une méthode (démarche raisonnée et non théorie). Cette méthode est dite quan-
titative.
La démarche statistique comporte trois (3) phases :
— La phase de la collecte et la description de données ;
— La phase d’analyse ;
— La phase d’interprétation.

1.2.1 La phase de la collecte et la description


Il s’agit de collecter les données, les représenter sous la forme condensée, accessible pour résumer
l’essentiel de l’information contenue de ces données.

Outils de collecte des données

Pour la collecte des données, il faut :


— un questionnaire (précise et claire) ;
— un dépouillement puis apurement (classer par catégorie) ;
— un dénombrement ou comptage ;
— une présentation des résultats (dans un tableau ou sous forme graphique) : voir chapitre 3. Cette
phase est appelée phase de mise en évidence logique des données.
Les questions posées dans les questionnaires doivent être précises et choisies. Il faut bien définir le
critère à utiliser.
Exemple : poids ; genre ; garçon ou fille ; sexe : M ou F.

1
1.2.2 Phase de l’analyse des données
Ici, on résume ou réduit les données en substituant à l’ensemble de celle-ci un petit nombre de
résultats numériques.

— on compare les résultats numériques aux résultats théoriques établis à l’aide des calculs de
probabilité ;
— on formule des hypothèses par conduction à l’aide des résultats numériques obtenus ;
— on vérifie par déduction à partir des résultats obtenus en supposant les hypothèses vraies.

1.2.3 Phase d’interprétation des données


Ici, on tire des conclusions de travail d’analyse des données. Cette phase conduit à prendre des
décisions et détermine l’action (il faut beaucoup faire attention. Après l’interprétation on fait la
prévision : c’est une conclusion purement inductible.

NB : Il faut toujours préciser ce qui induit, que de ne rien faire.


Il faut toujours savoir l’esprit critique en statistique.

2
2 CHAPITRE 2 : VOCABULAIRE STATISTIQUE
2.1 Généralité
Nous distinguons deux sortes de statistique :
— La statistique : ce sont celles qui ont pour objet de fixer à une époque donnée, la répartition
dans l’espace de tous les faits de même nature ;
— La statistique de mouvement : ce sont celles qui ont pour objet l’enregistrement des varia-
tions dans le temps d’un seul fait.

2.2 Définition et désignation


— Population ou univers statistique : c’est l’ensemble soumis à une étude Exemple : statis-
tique. Il peut être formé d’un être humain(étudiant) ou d’objet(pile) ou des êtres vivants ou des
regroupements. C’est un ensemble ni (dont on peut compter).

Exemple : On étudie la couleur des yeux des étudiants de Math 1 promotion 2021-2022.
a) Quelle est la population étudiée ?
— Unité statistique ou individu : c’est un élément ou nombre de la population.
b) Quel est l’unité statistique de l’exemple ci-dessus ?
— Echantillon : c’est une partie de la population ou groupe de la population.
c) Déterminer l’échantillon de l’exemple ci-dessus ?
— Caractère : c’est le caractère étudié dans la population ou c’est le trait commun à tous les
unités sur lesquels on porte attention.
Il existe deux types de caractère :
- Caractère quantitatif ;
Exemple : poids, sexe, taille, couleur.
- Caractère qualitatif.
Un caractère est dit quantitatif si ses modalités sont mesurables.
Un caractère est dit quantitatif discret lorsque ses modalités sont des nombres isolés.

Exemple : 1 ;2 ;3 ;10 ;11 ;12 ;...


Jamais sous la forme 1,5 ;3,5 ;.... ;10,5 ;200,7.
Un caractère est dit quantitatif continue lorsque ses modalités sont sous forme d’intervalle ou
des classes [ei , ei+1 [ .
Un caractère est dit qualitatif si ses modalités sont no mesurables.
d) Quel est le caractère étudie dans l’exemple 1 ? déterminer sa nature puis justifier votre
réponse.
— Etendue : c’est la différence entre la plus grande distance et la plus petite distance. Elle est
notée E et est définie par E = Xmax − Xmin

Réponses :
a) La population étudiée : C’est l’ensemble des couleurs des yeux.
b) L’unité statistique est : une couleur.
c) L’échantillon : les étudiants de Math 1 promotion 2021-2022.
d) - Le caractère étudié est : la couleur des yeux.
- La nature : qualitative ; justification car ce sont des valeurs non mesurables.

2.3 Notation
1. Un caractère statistique sera désigné par une lettre majuscule notée X.

3
2. Les modalités d’un caractère seront désignés par des lettres minuscules avec un indice permettant
de leur compter : x1 , x2 , ..., xn
3. La taille d’une population sera désignée par N ou n.
4. L’effectif de la modalité xi du caractère X sera désigné par ni .
5. La fréquence absolue de la modalité xi du caractère X n’est autre que l’effectif de la modalité
xi .
ni
6. La fréquence relative sera désignée par fi = tel que
N
n
X
fi = 1
i=1

ni
7. La population sera notée Pi = 100 × fi = 100 ×
N
ei + ei+1
8. Le centre (de [ei , ei+1 [) sera noté ci =
2
9. L’amplitude de la classe sera notée ai = ei+1 − ei
ni
10. La densité ou la hauteur de la classe sera notée di = hi =
ai

4
3 CHAPITRE 3 : REPRESENTATION GRAPHIQUE
3.1 Tableau statistique
L’objectif d’un tableau statistique est de représenter de la manière la plus simple l’ensemble des
données de l’étude.
Dans le cas d’un tableau statistique, celui-ci établi la correspondance entre les modalités d’un
caractère et des effectifs de cette modalité. Il peut être présenté verticalement ou horizontalement.
Exemple :
1)La représentation verticale

X ni X ni
x1 n1 [e1 , e2 [ n1
x2 n2 [e2 , e3 [ n2
. . . .
ou
. . . .
. . . .
xn nn [en−1 , en [ nn
T otal N T otal N

2)La représentation horizontale

X x1 x2 ... xn T otal X [e1 , e2 [ [e2 , e3 [ ... [en−1 , en [ T otal


ou
ni n1 n2 ... nn N ni n1 n2 ... nn N

3.2 Classes
3.2.1 Classes contigue
Lorsque les données sont en classe, ces classes doivent être contigues c’est-à-dire que chaque individu
doit se retrouver dans une et une seule classe (jamais dans les deux).

Les classes doivent être deux à deux distincts c’est-à-dire leurs intersection est égale à l’ensemble
vide (ex : [1; 5[ ∪ [5; 10[ = φ )

3.2.2 Classes non contigue


Lorsque les classes ne sont pas contigue, on calcule les limites réelles.

Exemple :

— Classe contigue

X n i ai d i
[65, 70[ 9 5 1, 8
[70, 75[ 13 5 2, 6
[75, 80[ 8 5 1, 6
T otal 30 15 6
— Classe non contigue

5
X ni Limites réels ci ai di
[155; 159[ 3 [154, 5; 159, 5[ 157 5 0, 6
[160; 164[ 12 [159, 5; 164, 5[ 162 5 2, 4
[165; 169[ 18 [154, 5; 159, 5[ 167 5 3, 6
[170; 179[ 25 [169, 5; 179, 5[ 167, 5 10 2, 5
[180; 184[ 15 [179, 5; 184, 5[ 182 5 3
[155; 159[ 2 [154, 5; 159, 5[ 187 5 0, 4
T otal 25 1029 35 12, 5

3.3 Représentation graphique


Il existe deux types de représentations graphiques selon le cas : Cas qualitatif et cas quantitatif.

3.3.1 Cas d’un caractère qualitatif


Il existe plusieurs types de diagrammes dans le cas d’un caractère qualitatif :
— Diagramme en baton
— Diagramme en secteur
— Représentation en tuyau d’orgue
— Diagramme figuratif
— Cartogramme

Principe de construction
Proportionnalité des aires avec les effectifs ou les fréquences des modalités.

Exemple : On désire étudier la couleur des yeux des étudiants de maths 1, promo 20212022. On a
le tableau statistique suivant :

X ni
Noir 50
Bleu 30
Rouge 20
Total 100

Faire la représentation graphique de cette distribution.


1. Diagramme en baton

6
2. Diagramme en secteur

On détermine les angles αi en utilisant la règle de trois.


100 → 350
ni → α i
X ni αi
Noir 50 180
Bleu 30 108
Rouge 20 72
Total 100 360

3. Représentation en tuyau d’orgue

4. Diagramme figuratif

5. Cartogramme
C’est la représentation d’une grande figure sur une échelle réduite.

7
3.3.2 Cas d’un caractère quantitatif
Ici, on utilise deux sortes de représentation :
— Diagramme différenciel (diagramme en baton)
— Diagramme intégrale (courbe des fréquences cumulées)
a) Principe de construction du diagramme différenciel
On met les modalités sur l’axe des abscisses et à partir de chaque modalité, on élève un baton
proportionnel à l’effectif.

Après avoir construit le diagramme en baton, lorsqu’on joint les sommets des batons on obtient le
polygone des fréquences.
b) Principe de construction du diagramme intégrale
— On obtient les fréquences cumulées croissantes ou décroissantes ;
— On établi la correspondance entre la modalité et la fréquence cumulée.
Exemple : Faire le diagramme intégrale de la distribution statistique suivant :

X ni Fi
0
7 3
3
8 2
5
10 3
8
12 1
9
14 7
16
T otal 16

8
4 CHAPITRE 4 :ANALYSE STATISTIQUE A UNE DIMEN-
SION
Introduction
En statistique, l’étude des événements se résument à l’étude de ses paramètres. Il existe trois types
de paramètres à savoir :
— Paramètre de position ou de tendance centrale
— Paramètre de dispersion
— Paramètre de forme

4.1 Paramètre de position


Il existe trois types de paramètres de position ‘a savoir :
— Le mode ou la dominante
— La médiane
— La moyenne

4.1.1 Le mode
Le mode est la série statistique ayant le plus grand effectif (cas d’un caractère quantitatif discret).
Dans le cas d’un caractère quantitatif continu avec les données représentées en intervalles ou classes,
on parle de la classe modale : c’est la classe qui a la plus grande densité.
Le mode est désigné par M0 . Ce distribution statistique peut avoir plusieurs modes : c’est une
distribution statistique pluri-modale (bi, tri-modale)

4.1.2 La médiane
La médiane est la valeur du caractère ou de la modalité qui partage l’ensemble de la population en
deux parties égales. Elle se note Me .
a- Détermination analytique de la médiane
Ici, on passe par le calcule de FCC (Fréquence Cumulé Croissante) ou FCD (Fréquence Cumulé
Décroissante) et l’on peut être appelé à faire des interprétations linéaires.

b- Détermination effet de la médiane ‘


Ici, on utilise le diagramme d’histogramme ou le couple cumulative ou le diagramme intégrale.

c- Exemple d’application
i- Déterminer la médiane de la distribution statistique suivante

X ni Fi
0
[20; 25[ 15
15
[25; 30[ 5
20
[30; 40[ 20
40
[40; 45[ 25
65
T otal 65

9
N
On a : N = 65 ⇒ = 32, 5
2
Or 35, 5 ∈ [20; 40[. On procède par interprétation linéaire.
30 → 20
Me − 30 32, 5 − 20
Me → 32, 5 ⇒ = ⇒ Me = 36, 25
40 − 30 40 − 20
40 → 40

ii- Généralisation de l’interprétation linéaire


Le schéma ci-dessous nous permet de généraliser la formule de la médiane(Me ) :

N
Fi − Fi−1 − Fi−1
= 2
ei − ei−1 Me − ei−1

4.1.3 La moyenne
Soit X une distribution statistique.
- Pour un caractère quantitatif discret, la moyenne arithmétique est définie par :
n
1 X
X= n i xi
N i=1

- Pour un caractère quantitatif continu, la moyenne arithmétique est définie par :


n
1 X
X= n i ci
N i=1

4.2 Paramètre de dispersion


Il existe plusieurs paramètres de dispersions dont les plus connus sont :

4.2.1 Les quartiles


Les quartiles sont les valeurs de la modalité qui divisent l’ensemble de la population en quatre
parties égales. Il existe trois quartiles : Q1 , Q2 et Q3 La détermination des quartiles obéit au même
principe que celle de la détermination de la médiane mais en utilisant uniquement la fréquence cumulée
croissante (FCC).

10
4.2.2 Les Déciles
Ce sont des valeurs du caractère qui divisent l’ensemble de la population en 10 parties égales. Il
existe 09 déciles : D1 , D2 , ..., Dn
La détermination des déciles obéit au même principe que celle de la détermination de la médiane.

4.2.3 Les Pércentiles


Ce sont des valeurs du caractère qui divisent l’ensemble de la population en 100 parties égales. Il
existe 99 pércentiles.

4.2.4 L’Etendu
C’est la différence entre la plus grande et la plus petite modalité. Elle est notée :

eX = Xmax − Xmin

4.2.5 Le Semi-interquartile
Il est noté eQ . Il mesure la déviation moyenne des données par rapport à la médiane et est défini
1
par : eQ = (Q3 − Q1 )
2

4.2.6 L’intervalle interquartile


Il est noté : IQ = [Q1 ; Q2 ]

4.2.7 L’écart moyenne


Il est noté Eou EX
C’est la moyenne arithmétique des valeurs absolues des écarts par rapport au moyenne X. Il est défini
par :
n
1 X
E= n i | xi − X |
N i=1

4.2.8 L’écart médian


C’est la moyenne arithmétique des valeurs absolues par rapport à la médiane Me . Il est défini par :
n
1 X
EMe = ni | x1 − Me |
N i=1

11
4.2.9 La variance et l’écart-type
- La variance d’une distribution statistique ou VS (Variance Statistique) est la moyenne arithmétique
d’écart par rapport à la moyenne. Elle se note V (X) et est définie par :
n
1 X
V (X) = ni (xi − X)2 (1)
N i=1

- L’écart-type noté σ (sigma) est la racine carré de la variance. Il est défini par :
p
σ = V (X) avec V (X) > 0

L’écart-type permet d’avoir une appréciation de la variabilité des données par rapport à la moyenne.
Il mesure de combien les observations sont éloignées de la moyenne.

FORMULE DE KOENIG
La variance est encore définie par :
n
1 X 2
V (X) = ni x2i − X (2)
N i=1

DTAF : Démontrer que (1)=(2)

4.2.10 Le coefficient de variation


Il est noté CV , c’est l’écart type par unité de moyenne. Il est défini par :

4.2.11 Le Scart
Le score d’un individu détermine à combien l’écart-type se trouve en dessous ou au-dessus de la
xi − X
moyenne. Il est noté s et est définie par : s =
σ
Remarque : Si une distribution statistique suit une loi normale on a :
68,3% des observations qui se trouvent dans l’intervalle [x − σ; x + σ] ;
95,5% des observations qui se trouvent dans l’intervalle [x − 2σ; x + 2σ] ;
99,7% des observations qui se trouvent dans l’intervalle [x − 3σ; x + 3σ] ;

Exemple : La moyenne générale des étudiants de L1 est x = 16 et l’écart type est σ = 1. Quel est
le scart des étudiants ORNELA et AÏSATOU qui ont respectivement 16 et 10 comme note ?
16 − 13 3 10 − 13 3
s1 = = et s2 = =−
2 2 2 2
Exemple : La moyenne d’âge des étudiants de L1 est x = 20 et l’écart type est σ = 3. Dans quel
intervalle se compris l’âge de ces étudiants si cette distribution statistique suit la loi normale ?

x − σ = 20 − 3 = 17 et x + σ = 20 + 3 = 23

Donc il y a 68,3% des observations qui se trouvent dans l’intervalle ]17; 23[.

x − 2σ = 20 − 2 × 3 = 14 et x + 2σ = 20 + 2 × 3 = 26

Donc il y a 95,5% des observations qui se trouvent dans l’intervalle ]14; 26[.

12
4.2.12 Le moment
I Le moment non centré d’ordre r d’une distribution statistique est noté µr et est défini par :
n
X ni
µr = fi xri avec fi =
i=1
N

I Le moment centré d’ordre r par rapport à x0 d’une distribution statistique est noté µr,x0 et est
défini par :
n
1 X
µr,x0 = ni (xi − x0 )r
N i=1
— Si r = 1 et x0 = x, alors µr,x0 = 0
— Si r = 2 et x0 = x, alors µr,x0 = V (x)
DTAF : Démontrer que ces deux dernières affirmations sont vraies.

Corollaire : La formule de Koënig


n
X
V (x) = fi x2i − x2 ⇒ V (x) = µ2,x − µ21
i=1

DTAF : Démontrer ce corollaire.

4.3 Paramètre des formes


On a deux principales paramètres de forme permettent d’apprécier la forme d’une série statistique.
Ce sont :
— Le coefficient d’asymétrie ;
— Le coefficient d’aplatissement

4.3.1 Le coefficient d’asymétrie


Il est noté γ1 et est définit comme suite :
µ3,x
γ1 =
σ3
— Si γ1 = 0, alors on a une distribution parfaitement symétrique et on a la figure suivante :

— Si γ1 > 0, alors on a une distribution étalée vers les petites valeurs et on a la figure suivante :

— Si γ1 < 0, alors on a une distribution étalée vers la droite et on a la figure suivante :

13
4.3.2 Le coefficient d’aplatissement
Il est noté γ2 . C’est le moment centré d’ordre 4 sur l’écart-type puissance 4 le tout moins 3. et est
définit comme suit :
µ4,x
γ2 = 4 − 3
σ
Ce coefficient permet de comparer une série statistique d’une distribution dite normale qui a la
même moyenne et le même écart-type.
— Si γ2 = 0, alors la courbe se confond a‘ celle de la loi normale.

— Si γ2 > 0, alors la courbe est effilée que la courbe de la loi normale.

— Si γ2 < 0, alors la courbe s’aplatit par rapport à la courbe de la loi normale.

14
4.4 Généralisation de la moyenne
4.4.1 Définition
La ϕ-moyenne

Elle est notée xϕ et est obtenue de la manière suivante :


n
1 X
ϕ(xϕ ) = ni ϕ(xi )
N i=1

4.4.2 Quelques cas particuliers :


1. Moyenne arithmétique
ϕ : x 7→ ϕ(x) = x
Donc n
1 X
xρ = ni xi
N i=1

2. Moyenne quadratique
ϕ : x 7→ ϕ(x) = x2
n
1 X
ϕ(xϕ ) = ni ϕ(xi )
N i=1
n
1 X
x2Q = ni x2i
N i=1
Donc v
u n
u1 X
xQ = t ni x2i
N i=1

3. Moyenne harmonique
1
ϕ : x 7→ ϕ(x) =
x
n
1 X
ϕ(xϕ ) = ni ϕ(xi )
N i=1
n
1 1 X 1
= ni
xH N i=1 xi
Donc
1
xH = n
1 P 1
ni
N i=1 xi
4. Moyenne géométrique
ϕ : x 7→ ϕ(x) = ln x
n
1 X
ϕ(xϕ ) = ni ϕ(xi )
N i=1
n
1 X
ln xρ = ni ln(xi ) Or ln ab = b ln a
N i=1

15
Ainsi !
n
1 Y
ln xρ = ln xni i
N i=1

Donc ! N1
n
Y
xρ = xni i
i=1

5 CHAPITRE 5 : ANALYSE STATISTIQUE A DEUX DI-


MENSIONS
5.1 Introduction
Pour l’étude des certaines phénomènes complexes, il s’avère insuffisant de prendre en compte un
seul caractère. Naturellement, l’analyse des tableaux correspondants et leurs représentation graphiques
deviennent plus difficile. Le statistique descriptive à deux dimensions a essentiellement pour but de
mettre en évidence les relations qui existent entre deux séries d’observation considérées simultanément.
Ces données peuvent être de nature qualitatives ou quantitatives. Il sera envisagé dans ce chapitre :
— L’élaboration des tableau statistiques permettant de condenser des données sous forme de dis-
tribution des fréquences à deux dimensions ou distribution conjointe
— La représentation graphique des observations
— La mesure de la liaison entre deux variables

5.2 Représentation générale des tableaux statistiques à double entrée


Les observations relatives à deux variables dans N individus se présente le plus simplement sous la
forme de série statistique à double entrés à savoir une suite de N doublés. , à savoir une suite N couple
de valeurs observées (xi , yi ) avec 1 < i < n.

5.2.1 Distribution conjointe


De façon générale, si on étudie simultanément deux caractères X et Y sur une population de taille N
et X et Y ont respectivement les modalités x1 , x2 , ..., xk et y1 , y2 , ..., yl , alors le tableau de la distribution
conjointe se représente de façon suivante :
X/Y y1 y2 ... yj ... yl T otal
x1 N11 N12 N1j N1l N1•
x2 N21 N22 N2j N2l N2•
... ... ... ... ... ...
xi Ni1 Ni2 Nij Nil Ni•
... ... ... ... ... ...
xk Nk1 Nk2 Nkj Nkl Nk•
T otal N•1 N•2 ... N•j ... N•l N

Nij représente l’effectif des individus de la population qui à la fois la valeur xi de la variable X et de
la valeur yj de la variable Y .

16
5.2.2 Notation
a)
l
X
Ni• = Nij = Ni1 + Ni2 + Ni3 + ... + Nil
j=1

Ni• représente le total des effectifs de la ligne i c’est-à-dire l’effectif total des individus qui représentent
la valeur xi de la variable X (indépendant de variable Y)

b)
k
X
N•j = Nij = N1j + N2j + N3j + ... + Nkj
i=1

N•j représente le total des effectifs de la valeur j c’est-à-dire l’effectif total des individus représente la
valeur yj

c)
k X
X l k
X l
X
N = N•• = Nij = Ni• = N•j
i=1 j=1 i=1 j=1

5.2.3 Fréquence (ou pourcentage)


Nij
a) La fréquence du couple (xi ; yj ) est fij =
N
Nij
b) La fréquence conjointe est fij =
N
c) Le total des fréquences conjointes de la ligne i est
l
Ni• X
fi• = = f ij
N j=1

d) Le total des fréquences conjointes de la colonne j est


k
N•j X
f•j = = f ij
N i=1

5.3 Distribution marginale et conditionnelle


5.3.1 Distribution marginale
Les sommes des effectifs ou des fréquences en ligne définissent la distribution marginale (d’effectif
ou de fréquence) de la variable X. C’est la distribution définit par la colonne << T otal >> du tableau
de distribution conjointe c’est une distribution à une dimension puisque la variable conjointe c’est une
distribution à une dimension puisque la variable Y n’intervient pas.

On définit de la même façon la distribution marginale de la variable Y.


On a donc les distributions marginales suivantes.

17
— Distribution marginale de X :

X Ef f ectif s marginaux Fréquences marginales


x1 N1• F1•
x2 N2• F2•
... ... ...
xi Ni• Fi•
... ... ...
xk Nk• Fk•
T otal N 1
— Distribution marginale de Y :

Y Ef f ectif s marginaux Fréquences marginales


y1 N•1 F•1
y2 N•2 F•2
... ... ...
yi N•j F•j
... ... ...
yk N•l F•l
T otal N 1
Avec les tableaux obtenus en a) et b) ci-dessus on peut aisément calculer les caractéristiques de
tendance centrale (mode, médiane, moyenne) ou de dispersion (variance, écart-type, . . . ) pour chacun
des variables à partir des distributions marginales.

5.3.2 distribution conditionnelle


Lorsqu’on ne considère qu’une colonne (colonne Y ) On obtient une distribution conjointe de X et
Y , on obtient une dimension appelée distribution conditionnelle ou liée à X, sachant Y = yi , xi en
sachant yi .
xi
On définit la fréquence conditionnelle par : fi/j =
yj
- Tableau de distribution conditionnelle de X sachant yi

X Ef f ectif s conditionnels Fréquences conditionnelles


x1 N1j F1/j
x2 N2j F2/j
... ... ...
xi Nij Fi/j
... ... ...
xk Nkj Fk/j
T otal N•j 1
De même, on définit la distribution conditionnelle de Y liée à xi (ou distribution de Y sachant xi )
en considérant la ligne du tableau de distribution conjointe.
yj
La fréquence conditionnelle yi sachant xi est : fj/i =
xi
- Tableau de distribution conditionnelle de Y sachant xi est donné par :

18
Y Ef f ectif s conditionnels Fréquences conditionnelles
y1 Ni1 F1/i
y2 Ni2 F2/i
... ... ...
yi Nij Fi/i
... ... ...
yk Nil Fk/i
T otal Ni• 1

5.3.3 Propriétés des fréquences marginales conditionnelles


Propriété 1 : fij = f•j × (fxi /yj ) = f•j (fi/j )

Propriété 2 : fij = fi• × (fyj /xi ) = fi• (fj/i )


Ces propriétés découlent initialement des formules qui définissent les fréquences conditionnelles de X
et Y .

19

Vous aimerez peut-être aussi