Cours Complet de Statistique

Cours de statistique 1
ENSEIGNANT : Dr. Didier Alain DJAMEN

P h.D. in Applied M athematics
Table de valeur :
1 CHAPITRE 1 : INTRODUCTION GÉNERALE 1
1.1 But de la statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Intérêt de la statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2.1 La phase de la collecte et la description . . . . . . . . . . . . . . . . . . . . . . . 1
1.2.2 Phase de l’analyse des données . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2.3 Phase d’interprétation des données . . . . . . . . . . . . . . . . . . . . . . . . . 2
2 CHAPITRE 2 : VOCABULAIRE STATISTIQUE 3

2.1 Généralité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Définition et désignation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.3 Notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3 CHAPITRE 3 : REPRESENTATION GRAPHIQUE 5

3.1 Tableau statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.2 Classes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.2.1 Classes contigue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.2.2 Classes non contigue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.3 Représentation graphique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.3.1 Cas d’un caractère qualitatif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.3.2 Cas d’un caractère quantitatif . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
4 CHAPITRE 4 :ANALYSE STATISTIQUE A UNE DIMENSION 9

4.1 Paramètre de position . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.1.1 Le mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.1.2 La médiane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.1.3 La moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.2 Paramètre de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.2.1 Les quartiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.2.2 Les Déciles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.2.3 Les Pércentiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.2.4 L’Etendu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.2.5 Le Semi-interquartile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.2.6 L’intervalle interquartile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.2.7 L’écart moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.2.8 L’écart médian . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.2.9 La variance et l’écart-type . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
4.2.10 Le coefficient de variation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
4.2.11 Le Scart . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
4.2.12 Le moment . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
4.3 Paramètre des formes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
4.3.1 Le coefficient d’asymétrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
4.3.2 Le coefficient d’aplatissement . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
4.4 Généralisation de la moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
4.4.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
4.4.2 Quelques cas particuliers : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
5 CHAPITRE 5 : ANALYSE STATISTIQUE A DEUX DIMENSIONS 16
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
5.2 Représentation générale des tableaux statistiques à double entrée . . . . . . . . . . . . 16
5.2.1 Distribution conjointe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
5.2.2 Notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
5.2.3 Fréquence (ou pourcentage) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
5.3 Distribution marginale et conditionnelle . . . . . . . . . . . . . . . . . . . . . . . . . . 17
5.3.1 Distribution marginale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
5.3.2 distribution conditionnelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
5.3.3 Propriétés des fréquences marginales conditionnelles . . . . . . . . . . . . . . . . 19
3
1 CHAPITRE 1 : INTRODUCTION GÉNÉRALE
1.1 But de la statistique
La statistique est une discipline qui s’inspire au profondément de la méthode scientifique : c’est une
science fondée sur la mathématique.
La statistique permet de somatiser les masses considérables des données. De cerner et décrire cer-
taines relations pourtant obscures entre les variables.
La statistique traite l’information imparfaite obtenue le plus souvent par échantillonnage et par
conséquent la statistique est la science de l’incertitude et des erreurs.
La statistique est un art (elle est capable de communiquer les résultats obtenus).
La statistique doit pouvoir produire des réponses claires et précises.
La statistique s’applique à tous les faits dont la multiplicité des causes, leurs complicités et leurs
enchevêtrements interdisent de la méthode expérimentale.
1.2 Intérêt de la statistique

La statistique est une méthode (démarche raisonnée et non théorie). Cette méthode est dite quan-
titative.
La démarche statistique comporte trois (3) phases :
— La phase de la collecte et la description de données ;
— La phase d’analyse ;
— La phase d’interprétation.
1.2.1 La phase de la collecte et la description

Il s’agit de collecter les données, les représenter sous la forme condensée, accessible pour résumer
l’essentiel de l’information contenue de ces données.
Outils de collecte des données
Pour la collecte des données, il faut :

— un questionnaire (précise et claire) ;
— un dépouillement puis apurement (classer par catégorie) ;
— un dénombrement ou comptage ;
— une présentation des résultats (dans un tableau ou sous forme graphique) : voir chapitre 3. Cette
phase est appelée phase de mise en évidence logique des données.
Les questions posées dans les questionnaires doivent être précises et choisies. Il faut bien définir le
critère à utiliser.
Exemple : poids ; genre ; garçon ou fille ; sexe : M ou F.
1
1.2.2 Phase de l’analyse des données
Ici, on résume ou réduit les données en substituant à l’ensemble de celle-ci un petit nombre de
résultats numériques.
— on compare les résultats numériques aux résultats théoriques établis à l’aide des calculs de
probabilité ;
— on formule des hypothèses par conduction à l’aide des résultats numériques obtenus ;
— on vérifie par déduction à partir des résultats obtenus en supposant les hypothèses vraies.
1.2.3 Phase d’interprétation des données

Ici, on tire des conclusions de travail d’analyse des données. Cette phase conduit à prendre des
décisions et détermine l’action (il faut beaucoup faire attention. Après l’interprétation on fait la
prévision : c’est une conclusion purement inductible.
NB : Il faut toujours préciser ce qui induit, que de ne rien faire.

Il faut toujours savoir l’esprit critique en statistique.
2
2 CHAPITRE 2 : VOCABULAIRE STATISTIQUE
2.1 Généralité
Nous distinguons deux sortes de statistique :
— La statistique : ce sont celles qui ont pour objet de fixer à une époque donnée, la répartition
dans l’espace de tous les faits de même nature ;
— La statistique de mouvement : ce sont celles qui ont pour objet l’enregistrement des varia-
tions dans le temps d’un seul fait.
2.2 Définition et désignation

— Population ou univers statistique : c’est l’ensemble soumis à une étude Exemple : statis-
tique. Il peut être formé d’un être humain(étudiant) ou d’objet(pile) ou des êtres vivants ou des
regroupements. C’est un ensemble ni (dont on peut compter).
Exemple : On étudie la couleur des yeux des étudiants de Math 1 promotion 2021-2022.
a) Quelle est la population étudiée ?
— Unité statistique ou individu : c’est un élément ou nombre de la population.
b) Quel est l’unité statistique de l’exemple ci-dessus ?
— Echantillon : c’est une partie de la population ou groupe de la population.
c) Déterminer l’échantillon de l’exemple ci-dessus ?
— Caractère : c’est le caractère étudié dans la population ou c’est le trait commun à tous les
unités sur lesquels on porte attention.
Il existe deux types de caractère :
- Caractère quantitatif ;
Exemple : poids, sexe, taille, couleur.
- Caractère qualitatif.
Un caractère est dit quantitatif si ses modalités sont mesurables.
Un caractère est dit quantitatif discret lorsque ses modalités sont des nombres isolés.
Exemple : 1 ;2 ;3 ;10 ;11 ;12 ;...

Jamais sous la forme 1,5 ;3,5 ;.... ;10,5 ;200,7.
Un caractère est dit quantitatif continue lorsque ses modalités sont sous forme d’intervalle ou
des classes [ei , ei+1 [ .
Un caractère est dit qualitatif si ses modalités sont no mesurables.
d) Quel est le caractère étudie dans l’exemple 1 ? déterminer sa nature puis justifier votre
réponse.
— Etendue : c’est la différence entre la plus grande distance et la plus petite distance. Elle est
notée E et est définie par E = Xmax − Xmin
Réponses :
a) La population étudiée : C’est l’ensemble des couleurs des yeux.
b) L’unité statistique est : une couleur.
c) L’échantillon : les étudiants de Math 1 promotion 2021-2022.
d) - Le caractère étudié est : la couleur des yeux.
- La nature : qualitative ; justification car ce sont des valeurs non mesurables.
2.3 Notation
1. Un caractère statistique sera désigné par une lettre majuscule notée X.
3
2. Les modalités d’un caractère seront désignés par des lettres minuscules avec un indice permettant
de leur compter : x1 , x2 , ..., xn
3. La taille d’une population sera désignée par N ou n.
4. L’effectif de la modalité xi du caractère X sera désigné par ni .
5. La fréquence absolue de la modalité xi du caractère X n’est autre que l’effectif de la modalité
xi .
ni
6. La fréquence relative sera désignée par fi = tel que
N
n
X
fi = 1
i=1
ni
7. La population sera notée Pi = 100 × fi = 100 ×
N
ei + ei+1
8. Le centre (de [ei , ei+1 [) sera noté ci =
2
9. L’amplitude de la classe sera notée ai = ei+1 − ei
ni
10. La densité ou la hauteur de la classe sera notée di = hi =
ai
4
3 CHAPITRE 3 : REPRESENTATION GRAPHIQUE
3.1 Tableau statistique
L’objectif d’un tableau statistique est de représenter de la manière la plus simple l’ensemble des
données de l’étude.
Dans le cas d’un tableau statistique, celui-ci établi la correspondance entre les modalités d’un
caractère et des effectifs de cette modalité. Il peut être présenté verticalement ou horizontalement.
Exemple :
1)La représentation verticale
X ni X ni
x1 n1 [e1 , e2 [ n1
x2 n2 [e2 , e3 [ n2
. . . .
ou
. . . .
. . . .
xn nn [en−1 , en [ nn
T otal N T otal N
2)La représentation horizontale
X x1 x2 ... xn T otal X [e1 , e2 [ [e2 , e3 [ ... [en−1 , en [ T otal

ou
ni n1 n2 ... nn N ni n1 n2 ... nn N
3.2 Classes
3.2.1 Classes contigue
Lorsque les données sont en classe, ces classes doivent être contigues c’est-à-dire que chaque individu
doit se retrouver dans une et une seule classe (jamais dans les deux).
Les classes doivent être deux à deux distincts c’est-à-dire leurs intersection est égale à l’ensemble
vide (ex : [1; 5[ ∪ [5; 10[ = φ )
3.2.2 Classes non contigue

Lorsque les classes ne sont pas contigue, on calcule les limites réelles.
Exemple :
— Classe contigue
X n i ai d i
[65, 70[ 9 5 1, 8
[70, 75[ 13 5 2, 6
[75, 80[ 8 5 1, 6
T otal 30 15 6
— Classe non contigue
5
X ni Limites réels ci ai di
[155; 159[ 3 [154, 5; 159, 5[ 157 5 0, 6
[160; 164[ 12 [159, 5; 164, 5[ 162 5 2, 4
[165; 169[ 18 [154, 5; 159, 5[ 167 5 3, 6
[170; 179[ 25 [169, 5; 179, 5[ 167, 5 10 2, 5
[180; 184[ 15 [179, 5; 184, 5[ 182 5 3
[155; 159[ 2 [154, 5; 159, 5[ 187 5 0, 4
T otal 25 1029 35 12, 5
3.3 Représentation graphique

Il existe deux types de représentations graphiques selon le cas : Cas qualitatif et cas quantitatif.
3.3.1 Cas d’un caractère qualitatif

Il existe plusieurs types de diagrammes dans le cas d’un caractère qualitatif :
— Diagramme en baton
— Diagramme en secteur
— Représentation en tuyau d’orgue
— Diagramme figuratif
— Cartogramme
Principe de construction
Proportionnalité des aires avec les effectifs ou les fréquences des modalités.
Exemple : On désire étudier la couleur des yeux des étudiants de maths 1, promo 20212022. On a
le tableau statistique suivant :
X ni
Noir 50
Bleu 30
Rouge 20
Total 100
Faire la représentation graphique de cette distribution.

1. Diagramme en baton
6
2. Diagramme en secteur
On détermine les angles αi en utilisant la règle de trois.

100 → 350
ni → α i
X ni αi
Noir 50 180
Bleu 30 108
Rouge 20 72
Total 100 360
3. Représentation en tuyau d’orgue
4. Diagramme figuratif
5. Cartogramme
C’est la représentation d’une grande figure sur une échelle réduite.
7
3.3.2 Cas d’un caractère quantitatif
Ici, on utilise deux sortes de représentation :
— Diagramme différenciel (diagramme en baton)
— Diagramme intégrale (courbe des fréquences cumulées)
a) Principe de construction du diagramme différenciel
On met les modalités sur l’axe des abscisses et à partir de chaque modalité, on élève un baton
proportionnel à l’effectif.
Après avoir construit le diagramme en baton, lorsqu’on joint les sommets des batons on obtient le
polygone des fréquences.
b) Principe de construction du diagramme intégrale
— On obtient les fréquences cumulées croissantes ou décroissantes ;
— On établi la correspondance entre la modalité et la fréquence cumulée.
Exemple : Faire le diagramme intégrale de la distribution statistique suivant :
X ni Fi
0
7 3
3
8 2
5
10 3
8
12 1
9
14 7
16
T otal 16
8
4 CHAPITRE 4 :ANALYSE STATISTIQUE A UNE DIMEN-
SION
Introduction
En statistique, l’étude des événements se résument à l’étude de ses paramètres. Il existe trois types
de paramètres à savoir :
— Paramètre de position ou de tendance centrale
— Paramètre de dispersion
— Paramètre de forme
4.1 Paramètre de position

Il existe trois types de paramètres de position ‘a savoir :
— Le mode ou la dominante
— La médiane
— La moyenne
4.1.1 Le mode
Le mode est la série statistique ayant le plus grand effectif (cas d’un caractère quantitatif discret).
Dans le cas d’un caractère quantitatif continu avec les données représentées en intervalles ou classes,
on parle de la classe modale : c’est la classe qui a la plus grande densité.
Le mode est désigné par M0 . Ce distribution statistique peut avoir plusieurs modes : c’est une
distribution statistique pluri-modale (bi, tri-modale)
4.1.2 La médiane
La médiane est la valeur du caractère ou de la modalité qui partage l’ensemble de la population en
deux parties égales. Elle se note Me .
a- Détermination analytique de la médiane
Ici, on passe par le calcule de FCC (Fréquence Cumulé Croissante) ou FCD (Fréquence Cumulé
Décroissante) et l’on peut être appelé à faire des interprétations linéaires.
b- Détermination effet de la médiane ‘

Ici, on utilise le diagramme d’histogramme ou le couple cumulative ou le diagramme intégrale.
c- Exemple d’application
i- Déterminer la médiane de la distribution statistique suivante
X ni Fi
0
[20; 25[ 15
15
[25; 30[ 5
20
[30; 40[ 20
40
[40; 45[ 25
65
T otal 65
9
N
On a : N = 65 ⇒ = 32, 5
2
Or 35, 5 ∈ [20; 40[. On procède par interprétation linéaire.
30 → 20
Me − 30 32, 5 − 20
Me → 32, 5 ⇒ = ⇒ Me = 36, 25
40 − 30 40 − 20
40 → 40
ii- Généralisation de l’interprétation linéaire

Le schéma ci-dessous nous permet de généraliser la formule de la médiane(Me ) :
N
Fi − Fi−1 − Fi−1
= 2
ei − ei−1 Me − ei−1
4.1.3 La moyenne
Soit X une distribution statistique.
- Pour un caractère quantitatif discret, la moyenne arithmétique est définie par :
n
1 X
X= n i xi
N i=1
- Pour un caractère quantitatif continu, la moyenne arithmétique est définie par :

n
1 X
X= n i ci
N i=1
4.2 Paramètre de dispersion

Il existe plusieurs paramètres de dispersions dont les plus connus sont :
4.2.1 Les quartiles

Les quartiles sont les valeurs de la modalité qui divisent l’ensemble de la population en quatre
parties égales. Il existe trois quartiles : Q1 , Q2 et Q3 La détermination des quartiles obéit au même
principe que celle de la détermination de la médiane mais en utilisant uniquement la fréquence cumulée
croissante (FCC).
10
4.2.2 Les Déciles
Ce sont des valeurs du caractère qui divisent l’ensemble de la population en 10 parties égales. Il
existe 09 déciles : D1 , D2 , ..., Dn
La détermination des déciles obéit au même principe que celle de la détermination de la médiane.
4.2.3 Les Pércentiles

Ce sont des valeurs du caractère qui divisent l’ensemble de la population en 100 parties égales. Il
existe 99 pércentiles.
4.2.4 L’Etendu
C’est la différence entre la plus grande et la plus petite modalité. Elle est notée :
eX = Xmax − Xmin
4.2.5 Le Semi-interquartile
Il est noté eQ . Il mesure la déviation moyenne des données par rapport à la médiane et est défini
1
par : eQ = (Q3 − Q1 )
2
4.2.6 L’intervalle interquartile

Il est noté : IQ = [Q1 ; Q2 ]
4.2.7 L’écart moyenne

Il est noté Eou EX
C’est la moyenne arithmétique des valeurs absolues des écarts par rapport au moyenne X. Il est défini
par :
n
1 X
E= n i | xi − X |
N i=1
4.2.8 L’écart médian

C’est la moyenne arithmétique des valeurs absolues par rapport à la médiane Me . Il est défini par :
n
1 X
EMe = ni | x1 − Me |
N i=1
11
4.2.9 La variance et l’écart-type
- La variance d’une distribution statistique ou VS (Variance Statistique) est la moyenne arithmétique
d’écart par rapport à la moyenne. Elle se note V (X) et est définie par :
n
1 X
V (X) = ni (xi − X)2 (1)
N i=1
- L’écart-type noté σ (sigma) est la racine carré de la variance. Il est défini par :
p
σ = V (X) avec V (X) > 0
L’écart-type permet d’avoir une appréciation de la variabilité des données par rapport à la moyenne.
Il mesure de combien les observations sont éloignées de la moyenne.
FORMULE DE KOENIG
La variance est encore définie par :
n
1 X 2
V (X) = ni x2i − X (2)
N i=1
DTAF : Démontrer que (1)=(2)
4.2.10 Le coefficient de variation

Il est noté CV , c’est l’écart type par unité de moyenne. Il est défini par :
4.2.11 Le Scart
Le score d’un individu détermine à combien l’écart-type se trouve en dessous ou au-dessus de la
xi − X
moyenne. Il est noté s et est définie par : s =
σ
Remarque : Si une distribution statistique suit une loi normale on a :
68,3% des observations qui se trouvent dans l’intervalle [x − σ; x + σ] ;
95,5% des observations qui se trouvent dans l’intervalle [x − 2σ; x + 2σ] ;
99,7% des observations qui se trouvent dans l’intervalle [x − 3σ; x + 3σ] ;
Exemple : La moyenne générale des étudiants de L1 est x = 16 et l’écart type est σ = 1. Quel est
le scart des étudiants ORNELA et AÏSATOU qui ont respectivement 16 et 10 comme note ?
16 − 13 3 10 − 13 3
s1 = = et s2 = =−
2 2 2 2
Exemple : La moyenne d’âge des étudiants de L1 est x = 20 et l’écart type est σ = 3. Dans quel
intervalle se compris l’âge de ces étudiants si cette distribution statistique suit la loi normale ?
x − σ = 20 − 3 = 17 et x + σ = 20 + 3 = 23
Donc il y a 68,3% des observations qui se trouvent dans l’intervalle ]17; 23[.
x − 2σ = 20 − 2 × 3 = 14 et x + 2σ = 20 + 2 × 3 = 26
Donc il y a 95,5% des observations qui se trouvent dans l’intervalle ]14; 26[.
12
4.2.12 Le moment
I Le moment non centré d’ordre r d’une distribution statistique est noté µr et est défini par :
n
X ni
µr = fi xri avec fi =
i=1
N
I Le moment centré d’ordre r par rapport à x0 d’une distribution statistique est noté µr,x0 et est
défini par :
n
1 X
µr,x0 = ni (xi − x0 )r
N i=1
— Si r = 1 et x0 = x, alors µr,x0 = 0
— Si r = 2 et x0 = x, alors µr,x0 = V (x)
DTAF : Démontrer que ces deux dernières affirmations sont vraies.
Corollaire : La formule de Koënig

n
X
V (x) = fi x2i − x2 ⇒ V (x) = µ2,x − µ21
i=1
DTAF : Démontrer ce corollaire.
4.3 Paramètre des formes

On a deux principales paramètres de forme permettent d’apprécier la forme d’une série statistique.
Ce sont :
— Le coefficient d’asymétrie ;
— Le coefficient d’aplatissement
4.3.1 Le coefficient d’asymétrie

Il est noté γ1 et est définit comme suite :
µ3,x
γ1 =
σ3
— Si γ1 = 0, alors on a une distribution parfaitement symétrique et on a la figure suivante :
— Si γ1 > 0, alors on a une distribution étalée vers les petites valeurs et on a la figure suivante :
— Si γ1 < 0, alors on a une distribution étalée vers la droite et on a la figure suivante :
13
4.3.2 Le coefficient d’aplatissement
Il est noté γ2 . C’est le moment centré d’ordre 4 sur l’écart-type puissance 4 le tout moins 3. et est
définit comme suit :
µ4,x
γ2 = 4 − 3
σ
Ce coefficient permet de comparer une série statistique d’une distribution dite normale qui a la
même moyenne et le même écart-type.
— Si γ2 = 0, alors la courbe se confond a‘ celle de la loi normale.
— Si γ2 > 0, alors la courbe est effilée que la courbe de la loi normale.
— Si γ2 < 0, alors la courbe s’aplatit par rapport à la courbe de la loi normale.
14
4.4 Généralisation de la moyenne
4.4.1 Définition
La ϕ-moyenne
Elle est notée xϕ et est obtenue de la manière suivante :

n
1 X
ϕ(xϕ ) = ni ϕ(xi )
N i=1
4.4.2 Quelques cas particuliers :

1. Moyenne arithmétique
ϕ : x 7→ ϕ(x) = x
Donc n
1 X
xρ = ni xi
N i=1
2. Moyenne quadratique
ϕ : x 7→ ϕ(x) = x2
n
1 X
N i=1
n
1 X
x2Q = ni x2i
N i=1
Donc v
u n
u1 X
xQ = t ni x2i
N i=1
3. Moyenne harmonique
1
ϕ : x 7→ ϕ(x) =
x
n
1 X
N i=1
n
1 1 X 1
= ni
xH N i=1 xi
Donc
1
xH = n
1 P 1
ni
N i=1 xi
4. Moyenne géométrique
ϕ : x 7→ ϕ(x) = ln x
n
1 X
N i=1
n
1 X
ln xρ = ni ln(xi ) Or ln ab = b ln a
N i=1
15
Ainsi !
n
1 Y
ln xρ = ln xni i
N i=1
Donc ! N1
n
Y
xρ = xni i
i=1
5 CHAPITRE 5 : ANALYSE STATISTIQUE A DEUX DI-

MENSIONS
5.1 Introduction
Pour l’étude des certaines phénomènes complexes, il s’avère insuffisant de prendre en compte un
seul caractère. Naturellement, l’analyse des tableaux correspondants et leurs représentation graphiques
deviennent plus difficile. Le statistique descriptive à deux dimensions a essentiellement pour but de
mettre en évidence les relations qui existent entre deux séries d’observation considérées simultanément.
Ces données peuvent être de nature qualitatives ou quantitatives. Il sera envisagé dans ce chapitre :
— L’élaboration des tableau statistiques permettant de condenser des données sous forme de dis-
tribution des fréquences à deux dimensions ou distribution conjointe
— La représentation graphique des observations
— La mesure de la liaison entre deux variables
5.2 Représentation générale des tableaux statistiques à double entrée

Les observations relatives à deux variables dans N individus se présente le plus simplement sous la
forme de série statistique à double entrés à savoir une suite de N doublés. , à savoir une suite N couple
de valeurs observées (xi , yi ) avec 1 < i < n.
5.2.1 Distribution conjointe

De façon générale, si on étudie simultanément deux caractères X et Y sur une population de taille N
et X et Y ont respectivement les modalités x1 , x2 , ..., xk et y1 , y2 , ..., yl , alors le tableau de la distribution
conjointe se représente de façon suivante :
X/Y y1 y2 ... yj ... yl T otal
x1 N11 N12 N1j N1l N1•
x2 N21 N22 N2j N2l N2•
... ... ... ... ... ...
xi Ni1 Ni2 Nij Nil Ni•
... ... ... ... ... ...
xk Nk1 Nk2 Nkj Nkl Nk•
T otal N•1 N•2 ... N•j ... N•l N
Nij représente l’effectif des individus de la population qui à la fois la valeur xi de la variable X et de
la valeur yj de la variable Y .
16
5.2.2 Notation
a)
l
X
Ni• = Nij = Ni1 + Ni2 + Ni3 + ... + Nil
j=1
Ni• représente le total des effectifs de la ligne i c’est-à-dire l’effectif total des individus qui représentent
la valeur xi de la variable X (indépendant de variable Y)
b)
k
X
N•j = Nij = N1j + N2j + N3j + ... + Nkj
i=1
N•j représente le total des effectifs de la valeur j c’est-à-dire l’effectif total des individus représente la
valeur yj
c)
k X
X l k
X l
X
N = N•• = Nij = Ni• = N•j
i=1 j=1 i=1 j=1
5.2.3 Fréquence (ou pourcentage)

Nij
a) La fréquence du couple (xi ; yj ) est fij =
N
Nij
b) La fréquence conjointe est fij =
N
c) Le total des fréquences conjointes de la ligne i est
l
Ni• X
fi• = = f ij
N j=1
d) Le total des fréquences conjointes de la colonne j est

k
N•j X
f•j = = f ij
N i=1
5.3 Distribution marginale et conditionnelle

5.3.1 Distribution marginale
Les sommes des effectifs ou des fréquences en ligne définissent la distribution marginale (d’effectif
ou de fréquence) de la variable X. C’est la distribution définit par la colonne << T otal >> du tableau
de distribution conjointe c’est une distribution à une dimension puisque la variable conjointe c’est une
distribution à une dimension puisque la variable Y n’intervient pas.
On définit de la même façon la distribution marginale de la variable Y.

On a donc les distributions marginales suivantes.
17
— Distribution marginale de X :
X Ef f ectif s marginaux Fréquences marginales

x1 N1• F1•
x2 N2• F2•
... ... ...
xi Ni• Fi•
... ... ...
xk Nk• Fk•
T otal N 1
— Distribution marginale de Y :
Y Ef f ectif s marginaux Fréquences marginales

y1 N•1 F•1
y2 N•2 F•2
... ... ...
yi N•j F•j
... ... ...
yk N•l F•l
T otal N 1
Avec les tableaux obtenus en a) et b) ci-dessus on peut aisément calculer les caractéristiques de
tendance centrale (mode, médiane, moyenne) ou de dispersion (variance, écart-type, . . . ) pour chacun
des variables à partir des distributions marginales.
5.3.2 distribution conditionnelle

Lorsqu’on ne considère qu’une colonne (colonne Y ) On obtient une distribution conjointe de X et
Y , on obtient une dimension appelée distribution conditionnelle ou liée à X, sachant Y = yi , xi en
sachant yi .
xi
On définit la fréquence conditionnelle par : fi/j =
yj
- Tableau de distribution conditionnelle de X sachant yi
X Ef f ectif s conditionnels Fréquences conditionnelles

x1 N1j F1/j
x2 N2j F2/j
... ... ...
xi Nij Fi/j
... ... ...
xk Nkj Fk/j
T otal N•j 1
De même, on définit la distribution conditionnelle de Y liée à xi (ou distribution de Y sachant xi )
en considérant la ligne du tableau de distribution conjointe.
yj
La fréquence conditionnelle yi sachant xi est : fj/i =
xi
- Tableau de distribution conditionnelle de Y sachant xi est donné par :
18
Y Ef f ectif s conditionnels Fréquences conditionnelles
y1 Ni1 F1/i
y2 Ni2 F2/i
... ... ...
yi Nij Fi/i
... ... ...
yk Nil Fk/i
T otal Ni• 1
5.3.3 Propriétés des fréquences marginales conditionnelles

Propriété 1 : fij = f•j × (fxi /yj ) = f•j (fi/j )
Propriété 2 : fij = fi• × (fyj /xi ) = fi• (fj/i )

Ces propriétés découlent initialement des formules qui définissent les fréquences conditionnelles de X
et Y .
19

Cours Complet de Statistique

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Cours Complet de Statistique

Transféré par

Droits d'auteur :

Formats disponibles

Cours de statistique 1

ENSEIGNANT : Dr. Didier Alain DJAMEN

2 CHAPITRE 2 : VOCABULAIRE STATISTIQUE 3

3 CHAPITRE 3 : REPRESENTATION GRAPHIQUE 5

4 CHAPITRE 4 :ANALYSE STATISTIQUE A UNE DIMENSION 9

La statistique doit pouvoir produire des réponses claires et précises.

1.2 Intérêt de la statistique

1.2.1 La phase de la collecte et la description

Outils de collecte des données

Pour la collecte des données, il faut :

1.2.3 Phase d’interprétation des données

NB : Il faut toujours préciser ce qui induit, que de ne rien faire.

2.2 Définition et désignation

Exemple : 1 ;2 ;3 ;10 ;11 ;12 ;...

2)La représentation horizontale

X x1 x2 ... xn T otal X [e1 , e2 [ [e2 , e3 [ ... [en−1 , en [ T otal

3.2.2 Classes non contigue

3.3 Représentation graphique

3.3.1 Cas d’un caractère qualitatif

Faire la représentation graphique de cette distribution.

On détermine les angles αi en utilisant la règle de trois.

3. Représentation en tuyau d’orgue

4.1 Paramètre de position

b- Détermination effet de la médiane ‘

ii- Généralisation de l’interprétation linéaire

- Pour un caractère quantitatif continu, la moyenne arithmétique est définie par :

4.2 Paramètre de dispersion

4.2.1 Les quartiles

4.2.3 Les Pércentiles

4.2.6 L’intervalle interquartile

4.2.7 L’écart moyenne

4.2.8 L’écart médian

DTAF : Démontrer que (1)=(2)

4.2.10 Le coefficient de variation

Corollaire : La formule de Koënig

DTAF : Démontrer ce corollaire.

4.3 Paramètre des formes

4.3.1 Le coefficient d’asymétrie

— Si γ1 < 0, alors on a une distribution étalée vers la droite et on a la figure suivante :

— Si γ2 > 0, alors la courbe est effilée que la courbe de la loi normale.

— Si γ2 < 0, alors la courbe s’aplatit par rapport à la courbe de la loi normale.

Elle est notée xϕ et est obtenue de la manière suivante :

4.4.2 Quelques cas particuliers :

5 CHAPITRE 5 : ANALYSE STATISTIQUE A DEUX DI-

5.2 Représentation générale des tableaux statistiques à double entrée

5.2.1 Distribution conjointe

5.2.3 Fréquence (ou pourcentage)

d) Le total des fréquences conjointes de la colonne j est

5.3 Distribution marginale et conditionnelle

On définit de la même façon la distribution marginale de la variable Y.

X Ef f ectif s marginaux Fréquences marginales

Y Ef f ectif s marginaux Fréquences marginales

5.3.2 distribution conditionnelle

X Ef f ectif s conditionnels Fréquences conditionnelles

5.3.3 Propriétés des fréquences marginales conditionnelles

Propriété 2 : fij = fi• × (fyj /xi ) = fi• (fj/i )

Vous aimerez peut-être aussi