Vous êtes sur la page 1sur 145

Statistiques

Appliquées
PROF : ZAKARIA BENJOUID
3ÈRE ANNÉE S5 GROUPES : 4 & 8

Année Universitaire : 2022 / 2023


Objectifs 2

 Connaître les grands aspects de la statistique ainsi


que son utilité ;
 Familiariser l'étudiant à la statistique en insistant
davantage sur le mode de raisonnement
statistique que sur les aspects mathématiques.
 Être capable de mettre en œuvre ces techniques
de manière appropriée dans un contexte donné.
Références 3

 B. Goldfarb et C. Pardoux : « Introduction à la


méthode statistique » Dunod.
 Fourdrinier D. : « Statistiques inférentielles »
Dunod.
 Lejeune M. : « Statistiques, la théorie et ses
applications » Springer.
 Shao J. « Matimatical statistics » Springer.
 …
Choix pédagogiques 4

 Ne pas traiter les fondements de statistique


(théorie de la mesure) ;
 Un
enseignement différent de celui que vous
avez connu :
 Moins de démonstrations, plus d’applications
 Apprentissage de savoir-faire (compétences)
Moyens pédagogiques 5

• Modalités :
– Cours
– TD
• Evaluation :
– Contrôle / Projet à faire
– Examen en fin de semestre
Plan 6

Probabilité et
Echantillonnage Estimation
lois usuelles
Statistiques Descriptives 7
Pourquoi étudier les statistiques ? 8

 Savoir présenter, décrire des données.

 Savoir tirer des conclusions sur des populations à partir de calculs conduits

sur des échantillons.

 Savoir faire de “bonnes” prévisions.


Le matériau de départ
NUMERO SALAIRE SEXE AGE ANC NIVEAU
9
1 129472 F 42 3 B
2 212696 M 54 10 B
3 210888 M 47 10 A
4 213692 M 47 1 B
5 202408 M 44 5 B
6 196132 M 42 10 A
7 97580 M 30 5 A
8 97580 F 52 6 A
9 172496 M 48 8 A
10 95900 F 58 4 A
11 212696 M 46 4 C
12 234060 M 36 8 C
13 225176 M 49 10 B
14 197532 F 55 10 B
15 179536 M 41 1 A
16 213716 F 52 5 B
17 186296 M 57 8 A
18 235872 F 61 10 B
19 212696 M 50 5 A
20 214508 M 47 10 B
21 196132 M 54 5 B
22 219924 M 47 7 A
23 250120 M 50 10 B
24 110100 F 38 3 A
25 97580 M 31 5 A
26 227536 M 47 10 A

Un tableau de données…
DÉFINITIONS, TYPOLOGIE ET REPRÉSENTATIONS
GRAPHIQUES

Statistiques Appliquées 2022-2023 10


I- Définitions et vocabulaires

1-1- Statistique descriptive


• La statistique descriptive est l'ensemble des
méthodes et techniques mathématiques
permettant de présenter, de décrire et de
résumer des données nombreuses et variées.
• La statistique descriptive s’applique à la
plupart des disciplines :Agronomie, Biologie,
Démographie, Economie, Sociologie,…

Statistiques Appliquées 2022-2023 11


I- Définitions et Vocabulaire
Exemple:
_ Considérons les 100 familles d’une région donnée ;
- On tire au hasard 20 familles parmi ces 100 familles ;
- on interroge ces 20 familles tirées pour connaitre leur nombre d’enfants.

Les 100 familles Population


Famille Nombre Famille Nombre
de la région : statistique
d’enfants d’enfants
F1 1 F11 0 Les 20 familles Echantillon
F2 2 F12 1 tirées au hasard :
F3 3 F13 2
Une Famille: individu
F4 2 F14 1
F5 0 F15 2 Nombre d’enfant: Caractère
F6 2 F16 2
F7 4 F17 0 0
1
F8 1 F18 2 Modalités
2
F9 1 F19 2 3
F10 2 F20 3 4
12
Statistiques Appliquées 2022-2023
I- Définitions
1-7- Effectif et fréquence

On appelle effectif d’une modalité , le nombre de fois que cette


modalité apparait.

On définit la fréquence d’une modalité comme le rapport de son


effectif à l’effectif total .
Modalités Effectif Pourcentage (F)

0 3 15% (3/20)
1 5 25% ( 5/20)
2 9 45% (9/20)
Un tableau 3 2 10% ( 2/20)
d’effectifs 4 1 5% (1/20)
Total 20 100% (1)
13
Statistiques Appliquées 2022-2023
Application
Afin de connaître le nombre actuel d’étudiants par classe
pour l’ensemble des classes d’une certaine école, on
note ce nombre pour 30 d’entre elles choisies au
hasard .
L’ensemble de ces observations se présente comme suit :
30 27 30 30 27 30 26 28 32 31
32 30 26 30 32 31 27 30 30 27
32 28 31 27 28 32 26 27 30 32

– Identifier : la population ,l’échantillon, l’individu ,le


caractère étudié , les modalités ,les effectifs et les
fréquences (pourcentages).

Statistiques Appliquées 2022-2023 14


Réponse

▪ La population : l’ensemble des classes de l’école.


▪ Un individu : chacune de ces classes
▪ L’échantillon observé: 30 classes choisies au hasard
▪ Le caractère étudié : le nombre actuel d’étudiants par
classe
Modalités 26 27 28 30 31 32 Total
Effectifs 3 6 3 9 3 6 30
Pourcentage 10% 20% 10% 30% 10% 20% 100%

Statistiques Appliquées 2022-2023 15


Présentations graphiques 16
Présentations graphiques 17
II- Typologie du caractère( variable) statistique
Caractère statistique

Caractère quantitatif Caractère qualitatif

Caractère Caractère Caractère Caractère


discret continu nominal ordinal

Nbre d’enfants Age Sexe Satisfaction


Pièces par habitation Poids Situation familiale Préférence
Nbre d’employés Salaire Profession (petit, moyen,
… Revenu Couleur grand)
PIB ….. …..
Rendement
….

Statistiques Appliquées 2022-2023 18


PARAMÈTRES STATISTIQUES

Statistiques Appliquées 2022-2023 22


Paramètres Statistiques

Statistiques Appliquées 2022-2023 23


Paramètres Statistiques
Les paramètres statistiques ont pour but de résumer, à
partir de quelques nombres clés, l'essentiel de
l'information relative à l'observation d'une variable.

Statistiques Appliquées 2022-2023 24


Mesures de tendance centrale

Mesures de position

Mesures de dispersion

Statistiques Appliquées 2022-2023 25


I- Paramètres de tendance centrale :

Statistiques Appliquées 2022-2023 26


I- Paramètres de tendance centrale :
1-1-le Mode
• Le mode est la valeur distincte correspondant à l’effectif le
plus élevé
• Exemple1: Cas d’un caractère qualitatif nominal

→ Le mode est la modalité: Marié


27
Statistiques Appliquées 2022-2023
I- Paramètres de tendance centrale :
1-1-le Mode
• Exemple2: Cas d’un caractère qualitatif Ordinal
Mention Effectifs Fréquences
ni fi
Passable 20 0,2
Assez Bien 30 0,3
Bien 15 0,15
Très Bien 20 0,2
Excellent 15 0,15
Total 100 1

→ Le mode est la modalité: « La mention Assez Bien »

Statistiques Appliquées 2022-2023 28


I- Paramètres de tendance centrale :
1-1-le Mode
• Exemple3: Cas d’une variable quantitative discrète

Nombre d’enfant Effectifs (nᵢ) Fréquences (fi)


par famille (Xᵢ)
0 10 0,1
1 15 0,15
2 40 0,4
3 20 0,2
4 15 0,15
Total 100 1
→ Le mode est la modalité: 2 enfants

Statistiques Appliquées 2022-2023 29


I- Paramètres de tendance centrale :
1-1-le Mode
Exemple 4 : Cas d’une variable quantitative continue
a- Les amplitudes sont égales
Classes de valeurs Effectifs (nᵢ) Ci
[0 ; 10[ 2 5
[10 ; 20[ 7 15
[20 ; 30[ 5 25
[30 ; 40[ 8 35
[40 ; 50[ 3 45
On peut définir une classe modale dont l’effectif est le
plus élevé → [30 ; 40)
NB : il serait possible de trouver plus d’un mode à l’intérieur d’une
distribution
Statistiques Appliquées 2022-2023 30
I- Paramètres de tendance centrale :
1-1-le Mode
Exemple 4 : Cas d’une variable quantitative continue
b- Les amplitudes sont inégales
Classes Effectifs (nᵢ) Ai Effectifs
Corrigés
[0 ; 10[ 2 10 2
[10 ; 20[ 6 10 6
[20 ; 40[ 8 20 4
[40 ; 60[ 1O 20 5
[60 ; 70[ 4 10 4
Total 30
La classe modale dont l’effectif corrigé le plus élevé est donc
la classe [10 ; 20[
Le mode doit être déterminer algébriquement.
Statistiques Appliquées 2022-2023 31
I- Paramètres de tendance centrale :
1-1-le Mode

Statistiques Appliquées 2022-2023 32


I- Paramètres de tendance centrale :
1-1-le Mode
Exemple

Classes Effectifs

0-5 3
5-10 10
10-50 20
50-100 1

Statistiques Appliquées 2022-2023 33


I- Paramètres de tendance centrale :
1-1-le Mode

Statistiques Appliquées 2022-2023 34


I- Paramètres de tendance centrale :
1-1-le Mode

Statistiques Appliquées 2022-2023 35


I- Paramètres de tendance centrale :
1-1-le Mode

Statistiques Appliquées 2022-2023 36


I- Paramètres de tendance centrale :
1-1-le Mode

Statistiques Appliquées 2022-2023 37


I- Paramètres de tendance centrale :
1-2-la médiane

• La médiane d'une série statistique est le nombre qui sépare la


série (ordonnée en valeurs croissantes) en deux groupes de
même effectif.
• Ce paramètre est utile pour donner la répartition du caractère
étudié, car 50% environ de la population étudiée a une
modalité inférieure à la médiane et 50% a une modalité
supérieure à la médiane.

Statistiques Appliquées 2022-2023 38


I- Paramètres de tendance centrale :
1-2-la médiane

39
Statistiques Appliquées 2022-2023
I- Paramètres de tendance centrale :
1-2-la médiane
A- Cas d’une variable discrète (les données sont
individualisées)

40
Statistiques Appliquées 2022-2023
I- Paramètres de tendance centrale :
1-2-la médiane
A- Cas d’une variable discrète (les données sont
individualisées)
- Si l'effectif total n est un nombre impair, la médiane est
toujours parfaitement déterminé : elle est donc le terme
de rang (n+1)/2
Exemple : soit la série : { 0, 6, 1,3,2,5,4}
la série ordonnée est: { 0,1,2,3,4,5,6}

n=7 , implique ((n+1)/2)= 4 , alors la médiane est :


Me=3
41
Statistiques Appliquées 2022-2023
I- Paramètres de tendance centrale :
1-2-la médiane
A- Cas d’une variable discrète (les données sont
individualisées)
Si l'effectif total n est un nombre pair, on ne peut définir qu’un
intervalle médian à l’intérieur duquel la médiane n’est pas
déterminée .
L'intervalle médian est formé par les termes de rang n/ 2 et le
rang (n/2)+1) :
Exemple : soit la série : {0, 6, 1,3,2,5,4,7}
la série ordonnée est: {0,1,2,3,4,5,6,7}
implique le rang ((n/2 )) = 4 et le rang ( (n/2) +1) = 5 , alors
l’intervalle médian est :[3 , 4]
La Médiane n’est que : (3+4)/2 = 3,5
42
Statistiques Appliquées 2022-2023
Courbe des ECD
FCC(FCD) /ECC(ECD)
1 50
0,9 45
0,8 40
0,7 35
O,6 30 Courbe des ECC
0,5 25
0,4 20
0,3 15
0,2 10
0,1 5
150 155 160 165 170 175

Statistiques Appliquées 2022-2023 43


I- Paramètres de tendance centrale :
1-2-la médiane

44
Statistiques Appliquées 2022-2023
I- Paramètres de tendance centrale :
1-3- La moyenne
• La moyenne est l'indicateur le plus simple pour
résumer l'information fournie par un ensemble
de données statistiques
• La moyenne ne peut être définie que sur une
variable quantitative.
1er Cas : les données sont individualisées
– La moyenne est la somme des valeurs observées
divisée par leur nombre:

Statistiques Appliquées 2022-2023 45


I- Paramètres de tendance centrale :
1-3- La moyenne
2ème Cas les données ne sont pas individualisées
- La moyenne est calculée à partir des valeurs distinctes et des
effectifs comme suit:

Ce qui implique :
Avec n : l’effectif total
ni: l’effectif de la modalité xj
fi: la fréquence de la modalité xi

Statistiques Appliquées 2022-2023 46


II- Paramètres de position :
2-1- Les quantiles

• on cherche une valeur de la variable


partageant la série en
– quatre sous-ensembles égaux → les quartiles
– dix sous-ensembles égaux → les déciles
– cent sous-ensembles égaux → les centiles
– ….

Statistiques Appliquées 2022-2023 47


a) Les quartiles
• Ce sont les valeurs du caractère (xi) qui partagent la série en
quatre sous-ensembles égaux .
• Ils sont donc au nombre de trois : Q1,Q2,Q3
• Les intervalles qu’ils définissent contient chacun 25% des
observations ,soit un quart de l’effectif(n/4).
• L’intervalle interquartile [Q1,Q3] contient 50% des observations

0 n
n/4 n/4 n/4 n/4

0,25 0,25 0,25 0,25


Q1 Q2 Q3
0 1
Intervalle interquartile: 50%

48
Statistiques Appliquées 2022-2023
a) Les quartiles

On note que :

- Q1 laisse 25% des observations « AVANT » et 75% «


APRES »

- Q2 laisse 50% des observations « AVANT » et 50 % «


APRES » c’es t la médiane

- Q3 laisse 75 % des observations « AVANT » et 25% «


APRES »

49
Statistiques Appliquées 2022-2023
III- Paramètres de dispersion:

Deux distributions peuvent, tout en ayant des caractéristiques


de tendance centrale voisines, être très différentes.

Il est donc nécessaire de mesurer la dispersion des valeurs


autour des tendances centrales.

Statistiques Appliquées 2022-2023 50


III- Paramètres de dispersion:

Statistiques Appliquées 2022-2023 51


III- Paramètres de dispersion:

Statistiques Appliquées 2022-2023 52


III- Paramètres de dispersion:
2-1- L’´etendue
• L'étendue (ou amplitude) d'une série
statistique est la différence entre la valeur
maximum et la valeur minimum de la série.
• E = Maximum (X) - Minimum (X)
• Facile à déterminer, l'étendue ne dépend que
des 2 observations extrêmes qui sont parfois
le fait de situations exceptionnelles.
• Il est donc difficile de considérer l'étendue
comme une mesure stable de la dispersion.

Statistiques Appliquées 2022-2023 53


III- Paramètres de dispersion:
2-1- L’´etendue
L’´etendue est la différence entre la plus grande et la
plus petite valeur observée.
Classe des Effectifs (nᵢ) Effectifs
Xᵢ Effectifs Effectifs Cumulés
(nᵢ) Cumulés valeurs
croissants
croissants
[15 ;20 ) 8 8
18 12 12
19 25 37 [20 ;25 ) 18 26
20 32 69 [25 ;30 ) 23 49
21 27 96 [30 ;35 ) 16 65
22 8 104 [35 ;40 ) 10 75
L’étendu est 22 – 18 = 4 L’étendu est 40 – 15 = 25

Statistiques Appliquées 2022-2023 54


III- Paramètres de dispersion
2-3- La variance σ²
• La variance est la somme des carrés des écarts à la moyenne
divisée par le nombre d’observations

Statistiques Appliquées 2022-2023


55
III- Paramètres de dispersion
2-3- La variance σ²

Statistiques Appliquées 2022-2023


56
III- Paramètres de dispersion
2-4- Écart-type (σ)
• Écart-type (σ ) = Racine carrée de la variance
• L'écart-type est la mesure de dispersion la plus
couramment utilisée en statistique lorsqu'on
emploie la moyenne pour calculer une
tendance centrale.

Statistiques Appliquées 2022-2023 57


III-Paramètres de dispersion
2-5- Coefficient de variation
• le coefficient de variation de X est un indice noté et
défini comme suit

• Le coefficient de variation est un indicateur du degré


d’homogénéité des valeurs de la distribution ;
• Le coefficient de variation est indépendant des unités
choisies, il est utile pour comparer des distributions qui
ont des unités différentes.

Statistiques Appliquées 2022-2023


58
III-Paramètres de dispersion

La variance, l'écart-type et le coefficient de


variation sont les paramètres de dispersion les
plus utilisés.

En particulier, le coefficient de variation permet


de comparer la variabilité relative de plusieurs
distributions qui diffèrent fortement par leur
ordre de grandeur et éventuellement même
par leur unité de mesure
Statistiques Appliquées 2022-2023
59
Comparons le salaire moyen dans 2
entreprises

Entreprise A :
1/ 3 de femmes , salaire moyen 8000Dh
2/3 hommes, salaire moyen 11000

Entreprise B :
2/ 3 de femmes , salaire moyen 9000Dh
1/3 hommes, salaire moyen 12000

La quelle des deux entreprise a le salaire


moyen le plus élevé ?

Statistiques Appliquées 2022-2023 60


Comparons le salaire moyen dans 2
entreprises

Entreprise A :
1/ 3 de femmes , salaire moyen 8000Dh
2/3 hommes, salaire moyen 11000
Dans l'entreprise A le salaire moyen est de : ….

Entreprise B :
2/ 3 de femmes , salaire moyen 9000Dh
1/3 hommes, salaire moyen 12000
Dans l'entreprise B le salaire moyen est de : ….
Statistiques Appliquées 2022-2023 61
• On constate donc que le salaire moyen
de B est égal à celui de A. Pourtant le
salaire moyen des hommes est
supérieur en B à celui des hommes en
A. Il en est de même pour les femmes.
• D'où vient ce résultat paradoxal ?

Statistiques Appliquées 2022-2023 62


• Il s'agit d'un effet de structure : cela vient du fait que les
femmes (au salaire plus bas) sont plus nombreuses en B
qu'en A.
• Cela montre aussi qu'une moyenne ne résume pas
bien une population hétérogène, comprenant des
sous-populations différentes vis à vis du caractère
étudié (ici le salaire).

Statistiques Appliquées 2022-2023 63


Synthèse
En plus des tableaux et graphiques, on résume
l'observation d'une variable quantitative par un petit
nombre de paramètres.

Statistiques Appliquées 2022-2023 64


65
Statistique descriptive
Organisation, présentation et analyse
des données en mettant les points
importants en évidence.

Statistique inférentielle
Raisonner par inférence, prendre des
décisions sur une population à partir
d’un échantillon.
Probabilité et lois
usuelles
Théories des probabilités : 67

La théorie des probabilités est la partie la


plus abstraite de la statistique. Elle traite
des phénomènes aléatoires et s’est
développée dans des salles de jeu, ce qui
explique le fait que la majorité des
exemples retenus sont empruntés aux jeux
de hasard.
68

La théorie des probabilités est


l’intermédiaire entre la statistique
descriptive qui traite des séries
statistiques directement, et
l’inférence statistique qui comprend
les valeurs statistiques comme les
indicateurs indirects de valeurs
vraies mesurées par
échantillonnage
Théories des probabilités 69

 But de la théorie des probabilités :


développer un formalisme adapté à
l’étude des phénomènes dans lequel le
hasard intervient.
« aléatoire » vient de « alea » signifiant «
jeu de dés » en latin.
Expérience Aléatoire 70

 Exemples :
 On jette un dé et l'on observe le résultat obtenu.
 Sion lance trois fois de suite une pièce de
monnaie, on peut distinguer 8 résultats possibles :
PPP, PPF, ....,FFF.
 On jette une pièce de monnaie jusqu'à ce que
le côté face sorte pour la première fois.
Expérience Aléatoire 71

 Définition :
 Une expérience est dite aléatoire ou
stochastique s'il est impossible de prévoir avec
certitude son résultat.
 En principe, on admet qu'une expérience
aléatoire peut être répétée indéfiniment dans
des conditions identiques son résultat peut donc
varier d'une réalisation à l'autre.
Expérience Aléatoire 72

 Définition :
 Une expérience est dite donc aléatoire si :
 a-On ne peut pas prédire avec certitude son
résultat
 b-
On peut décrire l'ensemble de tous les résultats
possibles.
Expérience Aléatoire 73

 Exemples :
 Si on jette un dé : Ω = {1;2;3;4;5;6} et card(Ω) = 6
A est l’événement "un nombre pair est tiré" alors A = {2;4;6}
B est l’événement "un nombre impair est tiré" alors B =
{1;3;5}
C est l’événement "un nombre ≥ 4" alors C = {4;5;6}
D est l’événement élémentaire "le plus petit nombre" alors
D = {1}
74

Variables aléatoires
Variables aléatoires 75

 Définition :
 Dans de nombreuses expériences aléatoires,
nous sommes amenés à attacher un nombre
réel à chaque issue de l'univers Ω.
 Une telle application X de Ω vers R est appelée
variable aléatoire.
Variables aléatoires discrètes 76

 Exemple 1 :
 On jette une pièce de monnaie deux fois de
suite.
 L'univers est : Ω = {(p ; p) ; (p ; f) ; (f ; p) ; (f ; f)}
 Notons X la variable aléatoire indiquant le
nombre de « faces » obtenues.
Variables aléatoires discrètes 77

 Exemple 1 :

 X peut prendre diverses valeurs : il s'agit donc


bien d'une variable.
 Comme la valeur que prend X dépend de l'issue
réalisée donc du hasard, X est donc aléatoire.
Variables aléatoires discrètes 78

 Exemple 2 :
 Une urne contient trois boules numérotées 2 ; 3 et 5. On
tire successivement avec remises deux boules de cette
urne.
 Ω = {(2 ; 2) ; (2 ; 3) ; (2 ; 5) ; (3 ; 2) ; (3 ; 3) ; (3 ; 5) ; (5 ; 2) ;
(5 ; 3) ; (5 ; 5)}
 Notons Y la variable aléatoire indiquant la somme des
points obtenus.
 Y : (j ; k) → j + k
Variables aléatoires discrètes 79

 Remarque :
 Dans ces exemples, il est possible de calculer la
probabilité que la variable aléatoire prenne une
valeur donnée.
 Par exemple, la probabilité que X prenne la
valeur 0 est 1/4.
Variables aléatoires discrètes 80

 Définition :
 On dit qu'une variable aléatoire est discrète si
elle ne peut prendre qu'un nombre fini ou
dénombrable de valeurs.
Variables aléatoires discrètes 81

 En général :
 Considérons Ω l'univers attaché à une expérience aléatoire et
X une variable aléatoire pouvant prendre un nombre fini de
valeurs.
 Si à chacune de ces valeurs nous associons la probabilité de
l'événement correspondant, nous obtenons alors la loi de
probabilité ou la distribution de probabilité de la variable
aléatoire X.
Variables aléatoires discrètes 82

 Notation :
 La variable X peut prendre les valeurs x1 ; x2 ; ... ; xn.
 p1 est la probabilité que X prenne la valeur x1 : p1 = P(X = x1)
 p2 est la probabilité que X prenne la valeur x2 : p2 = P(X = x2)
 ...
 pn est la probabilité que X prenne la valeur xn : pn = P(X = xn)
 Ces valeurs peuvent être présentées dans un tableau appelé
tableau de distribution de X :
Variables aléatoires discrètes 83

 Notation :

X x1 x2 … xn
P p1 p2 … pn
Variables aléatoires discrètes 84

 Remarques :
 Dans un tableau de distribution,

 Il est possible de visualiser ces distributions à


l'aide de diagrammes en bâtons.
Moyenne ou espérance 85

mathématique
 On lance un dé une fois.
 Notons X la variable aléatoire indiquant le nombre
de points affiché par le dé.
X 1 2 3 4 5 6
P 1/6 1/6 1/6 1/6 1/6 1/6

 En lançant un très grand nombre de fois le dé, quelle


sera en moyenne le nombre de points obtenus ?
Moyenne ou espérance 86

mathématique
 Définition :
 Considérons X une variable aléatoire pouvant
prendre les valeurs x1 ; x2 ; ... ; xn avec des
probabilités respectives p1 ; p2 ; ... ; pn.
 L'espérance mathématique de X est :
Moyenne ou espérance 87

mathématique
 Pour le dé :
Variance et écart-type 88

 Considérons trois variables aléatoires dont les


distributions sont représentées ci-dessous.
89
Variance et écart-type 90

 La variance de X, notée V(X) est, en notant m =


E(X) :

 L'écart-type de X, noté σ(X) est : σ(X) = 𝑽(𝒙)


Variance et écart-type 91

 On utilise souvent la formule suivante :


92
Exemple :
93
Soit une agence immobilière qui désire se
lancer dans la location à la journée de studios
meublés. Elle étudie la demande journalière
possible x de location durant les mois de juillet
et août. Elle obtient les résultats suivants :

xi 0 1 2 3 4 5 6

P (xi) 0.05 0.01 0.2 0.3 0.25 0.1 0.09

Déterminer l’espérance et la variance de cette variable


aléatoire.
Exercice 1 94

 On jette une pièce de monnaie trois fois


successivement.
 1) Quel est l'univers Ω ? Décrire la variable
aléatoire X associant à chaque évènement
de Ω, le nombre de faces se présentant à
l‘épreuve.
 2)En faire la distribution de probabilité.
Déterminer l'espérance mathématique, la
variance et l‘écart-type.
Exercice 2 95

 On jette une pièce de monnaie trois fois


successivement.
 1) Quel est l'univers Ω ? Décrire la variable
aléatoire X associant à chaque évènement
de Ω, le nombre de faces moins le nombre
de piles.
 2)En faire la distribution de probabilité.
Déterminer l'espérance mathématique, la
variance et l‘écart-type.
Une VA peut être discrète ou 96

continue :
 Une VA est dite discrète si l'ensemble des
valeurs qu'elle est susceptible de prendre
est dénombrable.
 Une VA est dite continue si elle peut
prendre toute valeur à l'intérieur d'un
intervalle donné.
Moyenne (moment d’ordre 1) : 97
loi discrète : E( x ) =  xi.p(X = xi)
i
+
loi continue : E( x ) =
 x . f(x)dx
−
Variance
loi discrète : V(X) =  (xi − )2 p(X = x i)
i
+

V(X) =
 (x − μ x ) f(x)dx
2
loi continue :
−

V(X) = E(X2) - E(X)2


Les caractéristiques d’une variable 98

aléatoires continue
 Fonction de répartition : Soit X une VA
continue et f sa densité de probabilité. La
fonction de répartition de X est la fonction
F telle que:
F : IR [0,1]
x
X P(X  x) =  f(x)dx
−
Les caractéristiques d’une variable 99

aléatoires continue
Lois Usuelles
Lois Usuelles 101

 Loi de probabilité  élément central de la statistique inférentielle

 Avant tout, il faut bien définir la VA d’étude

 La détermination de la loi de probabilité suivie par une variable va


servir :

 - aux calculs de probabilité de réalisation d'évènements,

 - à la déduction

 - à l'inférence statistique
102
Une loi de probabilité

est entièrement définie par l’ensemble des valeurs

possibles prises par la variable aléatoire et les

probabilités d’apparition de chacune de ces valeurs.


103

Dans le cas d’une variable aléatoire X discrète, une

loi de probabilité est entièrement définie par

l’ensemble des couples (k, p[X=k]) (k Entier, en

général)

p[X=k] a un sens!
104

Dans cas d’une Variable Aléatoire X continue, une loi

de probabilité est définie l’ensemble des valeurs (e ,

p[X< e]) (e Réel)

p[X= e] = 0 !

Prendre p[X>e] dans la définition reviendrait au

même
Lois de probabilité : 105

Il existe de nombreuses lois de


probabilités, chacune s'appliquant
dans des conditions bien
particulières.
Loi de BERNOULLI 106

La variable de BERNOULLI est une variable


qui prend les valeurs 0 et 1 avec les
probabilités respectives q et p (p + q =1).
La valeur 1 est associé à la réalisation de
l’événement considéré ‘succès’ et la valeur
0 à sa non réalisation ‘échec’
107

Caractéristiques :

E ( X ) =  xi pi = p  E ( X ) = p
2 ( )
V ( X ) =  xi pi −  xi pi = p − p = p(1 − p ) = p.q
2 2

 V ( X ) = p.q
108
Loi BINOMIALE
Une variable aléatoire est dite binomiale si
elle représente le nombre de succès obtenus
dans une expérience de n épreuves où
la probabilité de succès reste constante.
La fonction de probabilité d’une telle fonction
est donnée par :
P( X = k ) = Cnk p k q n−k On note X → (n, p )
109

La variable binomiale est entièrement


spécifiée par la connaissance de n et p.

La variable de BERNOULLI est un cas


particulier de la variable binomiale : n=1.
La loi Binomiale 110

 Considérons une situation où chaque épreuve


ne possède que deux issues possibles et que le
résultat d’une épreuve n’influence pas la
suivante (épreuves successives indépendantes).
La loi Binomiale 111

n = nombre de répétitions de l’épreuve


 k = nombre de succès parmi les n épreuves (0 ≤
k ≤ n)

p = probabilité de succès (S) lors d’une épreuve


 q = 1 − p = probabilité d’échec (E) lors d’une
épreuve
La loi Binomiale 112

Conditions d’application de la variable binomiale :


1ère condition : L’expérience consiste en une suite
d’épreuves se soldant à chaque fois soit par un
succès soit par un échec.
2ème condition : Les épreuves se répètent de manière
identique et dans les mêmes conditions.
3ème condition : La probabilité de succès reste
constante tout au long des n épreuves.
La loi Binomiale 113

 Exemples :
 1 - Quelle est la probabilité d’obtenir 7 piles en
lançant 10 fois une pièce de monnaie ?
 2 - Quelle est la probabilité d’obtenir deux fois
un 6 en jetant 5 fois un dé ?
La loi Binomiale 114

 Notons X la variable aléatoire indiquant le nombre k de


réalisations de l'événement A dans la série de n épreuves.
 Nous savons que :

 Question :
 Quelle est l'espérance mathématique, la variance et l’écart-
type d’une variable aléatoire X qui suit une loi binomiale ?
La loi Binomiale 115

 Exemple :
 Dans une famille de n = 4 enfants, on admet
que la probabilité d’avoir un garçon est de
p = 1/2.
 Si X représente le nombre de garçons parmi
les 4 enfants, déterminer la loi de probabilité
de X et calculer ses caractéristiques.
La loi Binomiale 116

 Exemple :
La loi Binomiale 117

 Proposition :
 Dans le cas de la loi binomiale on a :
118
Approximation de la loi binomiale :

 1er
cas :lorsque n est élevé et p n’est ni
proche de 1 ni de 0, la loi binomiale est
approché par la loi normale
 2ème cas :Lorsque n est élevé et p est
faible (p<0.1) la loi binomiale est approché
par la loi de poisson
Exemple 1 119

L’agence immobilière dispose d’un parc de 5


studios. La probabilité de louer chacun d’eux au
mois de juin est de 0.6. L’agence désire étudier
la probabilité de location de ce parc.
1- Quelle est la loi de probabilité suivie par cette
variable aléatoire ? Quels en sont ses
paramètres ?
2- Calculer la probabilité de louer 0, 1, 2 studios?
Exemple 2 120

Dans une population, la proportion


d’individu qui ont l’intention de voter lors
des prochaines élections législatives est de
15%. Calculer la probabilité pour que 25%
des individus d’un échantillon d’effectif 16
votent ?
Exemple 3 121

 On considère un test constitué de QCM pour lesquelles


cinq réponses sont présentées dont une seule est correcte.
Le test comprend n = 6 questions.
Quelle est :
 - La loi de probabilité de X et ses caractéristiques
 - la probabilité d’avoir au moins 4 bonnes réponses en
répondant au hasard,
 - la probabilité d’avoir moins de 4 bonnes réponses en
répondant au hasard,
122
Loi de Poisson 123

 C’est la loi des événements rares (événements se


produisant peu souvent).
 Ceci se traduit par une probabilité p faible
 Cette loi peut se déduire de la loi binomiale.
 Définition : une loi de probabilité suit une loi de
Poisson si

−  k
P( X = k ) = e
k!
Loi de Poisson 124

La distribution de probabilité d’une V.A.


X est dite distribution de POISSON
si elle est définie par les couples (xi , pi)
où x prend les valeurs 0, 1, 2, ……
avec les probabilités respectives données par :
−  k
P( X = k ) = e
k!
 est un paramètre réel positif. Notation : X → P( )
125

 Caractéristiques

E( X ) = 

V(X)=.
Conditions d’application de la loi de 126
Poisson :
 Soit une approximation de la loi binomiale:
lorsque n est élevé et p très faible (proche de 0).
Généralement l'approximation est valable dés que n
> 50 et p < 0.1
X --> B(n;p) --> Po(= n.p)
 Soit une résultante d’un processus aléatoire
particulier , le processus de Poisson
127

La loi de POISSON s'applique en


particulier dans le cas d'événements
se réalisant de façon aléatoire dans
le temps ou l'espace (pannes de
machines, arrivées de clients à un
comptoir, appels téléphoniques sur
une ligne ……).
Exemple 1: 128

L’arrivé des clients à un supermarché est


considérée comme un processus de POISSON.
On sait que le nombre moyen de clients arrivant
par minute au supermarché est égale à 2.
Calculer la probabilité pour que pendant une
période particulière de 5 minutes il arrive 12
clients.
Exemple 2: 129

Une entreprise utilise des pots de peinture


dont 0.2% sont défectueux.
Quelle est la probabilité que sur les 1000 pots
qu’il utilise , il en trouve au plus un
défectueux?
130
Loi Normale 131

De nombreuses variables aléatoires ont pour fonction de densité une courbe en


forme de cloche, appelée courbe Normale ou courbe de Laplace-Gauss
(Pierre Simon de Laplace 1749-1827 ;Karl Friederich Gauss 1777-1855)

 la loi statistique la plus répandue et la plus utile

 de nombreuses lois de probabilités peuvent souvent être approchées


par la loi Normale

 dérivée : loi Log-Normale


Loi Normale 132

 distribution continue et symétrique

 caractérisée par sa moyenne  et son écart-type


s
 associée à une variable aléatoire X quantitative
continue

X → N ( , s)
 x-μ  2
133
- 1   X N (  , s) POPULATION
2  σ 
f(x) =
1
σ 2π
e
1
• courbe symétrique par rapport à x = 
σ 2π
• P( X <  ) = P(X  ) = 0.5

• P(  − s < X <  + s ) = 0.68

• P(  − s < X <  + s ) = 0.95

• P(X >  + 3s ) < 0.0015

X
−s  +s
Loi Normale Centrée - Réduite

Z N ( , ) 134
1 2
1 -2z • La variable centrée réduite Z=(X-)/s
f(z) =

e
a pour moyenne 0 et 1 pour écart-type
1 • courbe symétrique par rapport à Z =0

• P( Z  0 ) = P( Z > 0 ) = 0.5

• P( -1  Z  1 ) = 0.68

• P( -1.96  Z  1.96 ) = 0.95

• P( Z > 3 ) < 0.0015

Z
-1,96 −   1,96
Calcul des probabilités 135

 Pour une VA continue, on s'intéresse


surtout à une probabilité d'intervalle. La
fonction de densité étant compliquée,
des tables ont été prévues pour faciliter
ce calcul.
Calcul des probabilités 136

 Toutefois, étant donnée qu'il existe une


infinité de lois normales distinctes par leurs
paramètres, une seule variable normale
est tabulée et sert de référence pour les
autres : il s'agit de la loi normale centrée
réduite.
Le passage de la loi normale à la loi
normale centrée réduite s'effectue à
l'aide du changement de variable
suivant :
X −
Z=
s
La loi normale centrée réduite à
pour paramètre : µ = 0 et s = 1
Propriétés : 138

 Le graphique de la fonction de densité de


probabilité de la LNCR est une courbe en
cloche symétrique par rapport au point
d'abscisse z= 0
Propriétés : 139

 La droite verticale z= 0 divise l'aire


comprise entre la courbe et l'axe des
abscisses en deux parties égales P(Z<0) =
0,5 et P(Z>0) = 0,5.
 La grande partie des observations se situe
dans l'intervalle -3 ;3.
Utilisation de la table N(O; 1) 140

Cette table nous donne les


probabilités de trouver une valeur
inférieure à z
Remarque : 141

la table ne donne que les valeurs


p(Z ≤ z) . Il se peut que l'on cherche
p(Z ≥z). Il faut utiliser alors les deux propriétés
suivantes:
- la surface totale de la courbe est égale à 1;
- la courbe est symétrique par rapport à l'axe des
ordonnées.
142
143
Exemple : 144

X suit une loi normale N(345; 167)


On souhaite connaître la probabilité
pour que X soit inférieur à 500.
On effectue le changement de variable:

X − X − 345
Z= =
s 167
On cherche p(X < 500)=

500 − 345
p(X < 500)= p( Z  ) = p( Z  0.93) = 0.8238
167

145
Loi de Student 146

Statistiques Appliquées 2022-2023


Conçue historiquement pour modéliser les petits
échantillons Gaussiens à variance inconnue.
Elle est définie comme le quotient d’une loi normale centrée
réduite et la racine carrée d’une loi khi-deux divisée par son
nombre de degrés de liberté.
Soit U une loi normale centrée et réduite et  (n)

U
T =
On note T~ t(n). 2
n
Loi de Student 147

 Elle intervient en estimation, notamment


l’estimation de la moyenne quand la variance de la
population mère est inconnue.
148

Merci pour votre aimable


attention

Vous aimerez peut-être aussi