Vous êtes sur la page 1sur 37

COURS DE

STATISTIQUE
DECISIONNELLE

Pr. Abdeslam EL Moudden


elmoud@yahoo.com
A.U 2019/2020
Plan Du Cours

I- Rappel sur les lois de probabilités usuelles


▪ Lois discrètes
▪ Lois continues

II-Méthodes et techniques de sondage


▪ sondage - Enquêtes - Questionnaire
▪ Analyse descriptive des résultats.

III-Estimation
▪ Notions et propriétés d’estimateurs,
▪ Estimation ponctuelle de la moyenne, de la proportion et de la variance,
▪ Estimation par intervalle de confiance de la moyenne, de la proportion et de
la variance,
▪ Détermination de la taille de l’échantillon pour une précision fixées.
2
III- A- Analyse statistique de données à l’aide
de tests d’hypothèses.

1. Analyse statistique univariée

a - Tests paramétriques:
* Test de comparaison à une norme,
* Test de comparaison entre deux paramètres,
* Choix entre deux paramètres :
i - Application à la moyenne,
ii - Application à la proportion
iii - Application à la variance

2. Tests non paramétriques.


Test d’ajustement à une loi de probabilité ou à une forme de distribution
3
III- B- Analyse statistique de données à l’aide de
tests d’hypothèses.
1. Analyse statistique bivariée
* Analyse de la corrélation,
* Analyse de la régression linéaire simple,
* Analyse des tableaux de contingence – Test d’indépendance

2. Analyse statistique à plusieurs dimensions


* Analyse de la corrélation et de la régression linéaire multiple,
* Analyse de la variance (ANOVA).

3. Projets d’application statistique : Etude de cas

4
Chapitre I:

Rappel sur les lois des probabilités


usuelles

A. A- Lois de probabilités discrètes

B. B - Lois de probabilités continues


A. Lois de probabilités discrètes :

1. Loi de Bernoulli
2. Loi Binomiale
3. Loi de poisson

B. Loi de probabilités continues :

1. Loi Normale
2. Loi de khi-deux
3. Loi de Student
4. Loi de Fisher

6
A. Lois de probabilités discrètes :
1. Loi de Bernoulli : Jacques Bernoulli (1654-1705)
Définition :
Un caractère statistique possède une loi de Bernoulli comme
étant une loi de probabilités s’il est issu d’une expérience
aléatoire à deux résultats possibles.

Remarque :
Soit

La probabilité d’avoir « succès » est notée « «p », donc l’ « échec


» est de probabilité « q =1-p ».
On note cette loi de probabilités : X B(p)

7
Exemple :

i - Application dans le domaine de contrôle de qualité :


* Une machine qui fabrique des pièces de rechange donne une loi
de
Bernoulli modélisée comme suit :
* On considère un caractère X tel que :

* Si on déclare le taux d’ordre une valeur de 2%, alors p=0.02 .


* Donc X B(0.02).

8
ii - Application dans le domaine du marketing :

* Etude de l’impact d’une campagne publicitaire pour un nouveau

produit.
Question : l’individu a-t-il été touché par la campagne?
* On considère alors un caractère statistique X tel que:

* Donc X B(p).
9
Propriétés :
Soit X B(p) , alors on a :
- E(X) = p
-V(X) = pq = p(1-p)

Démonstration :
à faire

10
2. Loi Binomiale : (suite des travaux de J. B)
Définition :
Une loi binomiale est définie comme étant la loi de probabilités
d’une expérience aléatoire qui résume la répétition indépendante de
n expériences de Bernoulli de même paramètre « p ».

Remarque :
Soient Xi , i=1,2,…,n des caractères statistiques de même loi B(p),
alors
le caractère résultant X= X1+X2+…..+Xn admet comme loi de
probabilités la loi Binomiale de paramètres n et p. On note : X
B(n,p).

11
Le schéma d’une loi binomiale :

la probabilité d’avoir k succès est donc (à démontrer) :

12
Propriété :
Si X B(n,p), alors on :
- E(X) = np.
- V(X) = npq .

Démonstration : à faire !!

Exemple d’application:
Supposons que 5 % des pièces en sortie d’une chaine de production
soient
défectueuses. On souhaite connaitre la probabilité qu’un échantillon
de 20
pièces issues de cette chaine ne contienne aucune pièce défectueuse.
On peut traiter cet exemple en utilisant soit la loi Binomiale!
13
3. Loi de Poisson : Siméon Denis Poisson (1781-1840)

Définition :
La loi de poisson est une loi de probabilités qui modélise l’apparition
réitéré d’un phénomène dans un intervalle de temps avec une fréquence
moyenne donnée.

Remarque :

Si X désigne le caractère statistique en question, alors sa loi de poisson


s’écrie comme suit :

k=0,1,2,3,………….

où k représente le nombre de fois la réalisation du phénomène est


observée.
On note cette loi par .

14
Exemple d’application:

Les données collectées d’un guichet automatique d’une banque


indiquent que en moyenne 10 personnes viennent pour se servir au
bout d’un intervalle de temps d’une heure. Quelle est la probabilité que
50 personnes viennent dans un intervalle de 4 heures pour se servir au
prés de ce guichet ?

On doit alors utiliser la loi de poisson !!

15
Propriété :

Soit X un caractère qui suit une loi de poisson de paramètre ,


alors on a :
1. E(X) = .
2. V(X) = .

Démonstration:
à faire !!!

16
Utilisation des lois binomiales comme une loi de poisson :

Théorème d’approximation :

Soit X un caractère qui suit une loi binomiale B(n,p), on a:


si n + et p 0 tel que np , alors :
X suit approximativement la loi de poisson .

N.B. Dans la pratique on utilise cette approximation dés que n


dépasse 50 et
p soit inférieure à 0.1.

17
Application :
Lors d’un sondage portant sur un grand nombre de personnes, on
sait que
2% des personnes interrogées acceptent de ne pas rester
anonymes. Sachant que l’un des sondeurs a interrogé 250
personnes (en les choisissant de manière indépendante), calculer la
probabilité :
i - que ces 250 personnes souhaitent rester anonymes.
ii - que 3 personnes acceptent de ne pas rester anonymes.
iii - plus de 10 personnes acceptent de ne pas rester anonymes.
Réponse: soit X un caractère statistique qui représente le nombre de
personnes accepte de ne pas rester anonyme ; alors X est une
binomiale de paramètre n = 250 et p = 0.02 (n >50 et p<0.1), donc :
i – P(X= 0) = 0.0067.
ii - P(X= 3) = 0.14,
18
iii - P(X ≥10) = 1- P(X ≤ 9) 1-( + …+ )=1- 0,968
0.0318.
B. Loi de probabilités continues :
1. Loi Normale
Définition :
Une variable aléatoire X continue, définie sur IR, suit une loi normale si
sa fonction de densité est de la forme:

on note alors,

Propriétés :
on a les propriétés suivantes:
i- E(X) = µ
ii- V(X) =

19
Remarque :
Dans la pratique on fait souvent appel à la variable centrée réduite :
la fonction de densité est donc :

20
Utilisation de la table statistique :
u est le quantile d’ordre p tel que: F(u)=P(Z≤ u)= p =

21
Remarque :
a - Si la valeur du quantile u est négative alors F(u) ≤ 0.5, on
doit alors utiliser la relation suivante :
F(u) = 1- F(-u)
exemple: pour u = -1.05 on a:
F(-1.05) = P(Z ≤ -1.05) =
P(Z ≥1.05) = 1-P(Z<1.05)=1-0.8531=0.1469.

b- Si la valeur de « p » ou de « u » n’est pas sur la table


statistique on utilise alors la méthode d’interpolation!!

22
2. Loi de khi-deux:
Définition :
Une caractère statistique X continue, définie sur a une loi de khi-deux
comme étant une loi de probabilités à « n » degrés de liberté, et on note : X
(n) , si ce caractère peut être exprimé comme étant une somme des carrés
de n caractères normales indépendants centrés et réduits tels que :

Représentation graphique :
La fonction de densité de la loi de khi-deux est
de la forme :

où ( . ) est la fonction gamma, telle que :

23
Utilisation de la table statistique :

Soit :

P( (n) ≥ u)= α .

Exemple : P( (1) ≥ 0.0002) = 0.99


P( (10) ≥ 3.25) = 0.975

24
Propriétés :
Les caractéristiques de la loi de khi-deux sont données comme suit :
1. E(X) = n ,
2. V(X) = 2 n .
3. Si X et Y sont deux caractères indépendants qui suivent respectivement la
loi (n) et (m), alors le caractère résultant X+Y suit la loi (n+m).

Théorème 1 :(T.C.L)
Si le caractère X suit la loi (n), alors on a :

Remarque :
On peut utiliser ce théorème pour déterminer la probabilité ou la quantile
d’une khi-deux à un degrés de liberté très élevé !!
25
3. Loi de Student:
Définition :
Un caractère statistique X défini sur suit une loi student de degrés de
liberté « n », si sa fonction de densité peut s’écrire sous la forme :

on note alors : X t(n)


Remarque :
En pratique on fait souvent appel à l’identification structurelle de la loi de
student comme suit :
on dit que X suit une loi de sudent si elle peut s’écrire comme :

où Z et Y sont deux caractères statistiques indépendantes qui sont


respectivement une normale centrée réduite et une khi-deux à n degrés de 26
liberté.
Propriétés :
Soit X un caractère statistique qui suit une loi de Student, alors on a :
1. E(X ) = 0, si n > 1.
2. V(X ) = , si n > 2.

Remarque :
Pour n = 1, la loi de student de degrés 1 devient la loi de cauchy :

Utilisation de la table :
Voir table statistique
Exp.
P( t(10) ≥ 1.812) = 0.05 ( q= 0.05) 27
ou de même : P( t(10) ≤ 1.812) = 0.95 (p= 0.95)
Comportement asymptotique :
Pour un degrés de liberté n très élevé on peut utiliser l’approximation
asymptotique suivante :

4. Loi de Fisher:
Définition :
Un caractère statistique X défini sur suit une loi de Fisher à « m » et « n
» degrés de liberté si ce caractère peut s’écrire sous la forme :

On note alors : X F (m,n).


28
Utilisation de la table statistique :
voir tables statistiques
Exp.
soit X F (5,8) alors pour α = 0.05 on trouve :
c.à.d P( X > 3.69 ) = 0.05.

Propriétés:
Si X F (m,n), alors on a :

Démonstration :
À faire !!!
Application :
Pour calculer , on a
alors =
29
Exercices :
Ex1:
soit X un caractère statistique suivant une loi normale centrée et réduite N(0,1),
1. calculer P( -2.57 ≤ X≤ 2.57).
2. calculer P( X ≥ -1.256).
Ex2:
Soit X un caractère statistique suivant une loi normale N(20,4),
1. calculer P( 18 ≤ X≤ 21).
2. calculer P( X ≥ -21).
Ex3:
Soit X un caractère statistique suivant une loi normale centrée et réduite N(0,1),
Déterminer la valeur de z telle que :
1. P( > z ) = 0.90
2. P( X > z ) = 0.55
Ex 4 : Soit X un caractère statistique suivant une loi de student t(10).
Déterminer la valeur de a telle que : P( < a ) = 0.95 , P( < a ) = 0.98 , 30
P( X < a ) = 0.99
CHAPITRE II

Méthodes Et Techniques
De Sondage

A-Sondage - Enquêtes - Questionnaire

B- Echantillonnage .
A-Sondage - Enquêtes - Questionnaire
I- Introduction et Généralités :
1.Introduction :

Objectif : explorer la fluctuation d’un caractère des individus d’une population.


Recensement : une opération statistique de dénombrement d’une population par le biais
d’un questionnement de tout individu de la population.

Sondage : une méthode statistique permettant l’évaluation des caractéristiques d’un


caractère des individus d’une population en se basant sur une partie restreinte dite «
échantillon ».
32
Limites :
- Pour un recensement : plus d’informations permettant une évaluation correcte
des caractéristiques du caractères étudié, toutefois, ceci nécessite plus de temps
et d’efforts !!!

- Pour un sondage : moins d’informations, donc une évaluation moins précise, mais
ça peut nécessiter moins de temps et d’efforts !!!

- Solution : procéder adéquatement au choix des éléments de l’échantillon !!!

2. Techniques d’échantillonnage :
Définition 1 : on appelle échantillon une partie représentative de la population mère qui
l’objet d’une étude statistique.

Définition 2 : on appelle taux de sondage le rapport entre la taille de l’échantillon et celle


de la population.

Définition 3 : on appelle base de sondage une « carte intermédiaire » permettant une


sélection objective des éléments de la population pour construire un échantillon.
33
Remarque : pour arriver à cette représentativité on doit suivre les techniques
d’échantillonnage statistique.
Le prélèvement ou le choix d’échantillon sont généralement de deux types :
- Choix au hasard (probabiliste) : qui donne un échantillon aléatoire.
- Choix raisonné : qui génère un échantillon dont les éléments sont empiriques.

2.1. Echantillonnage aléatoire :

2.1.1. Echantillonnage aléatoire simple :

la construction d’un échantillon aléatoire simple de taille n est réalisé par un


tirage au hasard avec remise de n individus de la population.
2.1.2. Echantillonnage stratifié :
Cette technique concerne les population peu homogènes. Elle est pratiquée en
deux étapes :
1ère étape « stratification »: partitionner la population mère en k-populations
homogènes, appelés strates.
2ème étape « choix » : prélever dans chaque strates un échantillon aléatoire
simple. L’ensemble de ces échantillons forme un échantillon stratifié.
34
2.2. Echantillonnage raisonné :

Dans ce genre d’échantillonnage, la base de sondage n’existe pas toujours, c’est le cas,
par exemple, pour une entreprise qui cherche des informations sur sont environnement
extérieur. La technique la plus utilisée dans ce contexte est bien la technique
d’échantillonnage par quotas.

2.2.1 Echantillonnage par quotas :

Cette technique consiste à constituer un modèle réduit de la population, en tenant


compte d’un nombre restreint de spécificités des individus de la population en question.
Pour chaque spécificité on fait attribuer une proportion ( un quota ).

35
Exemple :
Une population se compose de 48% d’hommes et de 52% de femmes.
Les hommes sont repartis comme suit :
30% d’ouvriers - 20% de fonctionnaires ou employés - 20% d’artisans -
10% des chômeurs - 20% des professions libérales.
Les femmes sont de même reparties comme suit :
60% de femmes au foyer – 20% fonctionnair.es ou employées –
10% ouvrières – 10% au chômage.
- La population est donc composée de :
• 14.4 % d’hommes ouvriers.
• 9.6% d’hommes fonctionnaires ou employés.
• 4.8% de chômeurs
• ….
- Un échantillon par quotas de 1000 individus de cette population doit comporter :
• 144 hommes ouvriers.
• 96 hommes fonctionnaires ou employés.
• ….. 36
II- Enquête- Questionnaire
Définition 1:
Une enquête statistique est une enquête au cours de laquelle on applique des outils et
des techniques statistiques de collecte et d'analyse de données afin d'établir les
résultats.
Définition 2:
Un questionnaire est un ensemble de questions qui visent un certain nombre d’individus
d’une population lors d’une étude statistique.
Remarque :
Les questions d’un questionnaire sont de différents formats :
• Question fermée unique : une seule réponse est à choisir.
• Question fermée multiple : plusieurs réponse peuvent être choisies au même temps.
• Question fermée ordonnée : les réponses multiples sont à classées.
• Question fermée échelonnée (selon une échelle) : les réponses sont en général à une
mesure
prés: Très satisfait – Satisfait – Moins satisfait – Pas satisfait
• Question ouverte numérique : la réponse est en nombre non nécessairement fixé.
(votre âge ?)
• Question ouverte texte : aucune modalité de réponse n’est proposée (votre sport
préféré?) .
37

Vous aimerez peut-être aussi