Vous êtes sur la page 1sur 28

STATISTIQUES APPLIQUEES

ETUDE DE PROBABILITES
V.A Evènements

définition Etude de chance de réalisation


Loi de Etude de Résultats
Univers
probabilité probabilité possibles
Formules / Techniques / Démarchent)

Calcul (%)
Varient/définissent

Variable Comment
Action
Aléatoire définir?
Expérience (V.A)
Poser les questions

Ce qu'on
Ce qu'on a? Ce qu'on fait?
observe?
Ce qu'on
Où on est?
étudie?
Définir des VA qui peuvent être associées aux actions ou expériences
suivantes:

EXPRERIENCES VARIABLES ALEATOIRES


Vendre un produit - VA associé au C.A
- VA associé au nombre de clients
- VA associé au nombre de produit vendu
Etude des factures - VA associé au montant de la facture
- VA associé au contenu de la facture
- VA associé à l’existence de remise
Etude d’activités d’un caissier - VA associé au nombre de clients qui passent
- VA associé au paiement des clients
- VA associé au montants >500,000 Ar
- VA associé au mode de paiement des clients
LOIS DES
PROBABILITES

2- Loi
1- Loi 6- Loi de Chi-
Binomiale 3- Loi de 4- Loi normale 5- Loi de 7- Loi de
Uniforme deux (x²) ou ...
(loi de Poisson (GAUSS) STUDENT FISHER
(loi classique) PEARSON
Bernoulli)
1- Loi Uniforme ( loi Classique)
Définition:
𝑁𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑐𝑎𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠
Probabilité=
𝑁𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑐𝑎𝑠 𝑝𝑜𝑠𝑠𝑖𝑏𝑙𝑒𝑠
Conditions:
• Nombre de résultats possibles connus
• Résultats possibles dénombrables
2- Loi Binomiale (Loi de Bernoulli)
Conditions:
Répétition d'épreuves identiques à 2 résultats complémentaires généralement appelés

𝑥 ↝ 𝛽 𝑛; 𝑝
n: nombre de répétition SUCCES ECHEC
p: probabilité de succès

Exemple:
Compter le nombre de facture de montant <500.000 Ar parmi 40 factures

𝑥 ↝ 𝛽 𝑛; 𝑝
n: 40 et p: probabilité de succès
3-Loi de POISSON
Conditions
Compter le nombre de réalisation d'un évènement ou d'un résultat RARE pendant une
période fixée ou un endroit précis
Résultat RARE = Résultat souhaité ou non souhaité mais difficilement réalisable.
Exemple: gagner à un jeu, accident, promotion …
𝑥↝𝑃 𝑚
𝒎 : nombre moyen de réalisation de l’évènement rare.
Exemple:
Compter le nombre d’employés avertis en 1 an

𝑥 ↝ 𝑃 𝑚 avec 𝑚 =3,5, → 𝑥 ↝ 𝑃 3,5 , 𝑃 𝑋 = 2


4- Loi normale (GAUSS)
Conditions:
Etude: Description des Résultats possibles à condition que Mode = Médiane = Moyenne.
D'où l’allure graphique des résultats en forme d'une cloche

X VA associée au montant des factures:


𝑿 ↝ 𝓝(𝒎; 𝝈)
𝒎 = montant moyen des factures
𝝈 = écart-type
5- Loi de STUDENT
Conditions:
C'est un cas particulier de la loi de Normale. Dans ce cas, on travaille dans un petit
échantillon constitué de moins de 30 individus
Cette loi est associée à un paramètre appelé degré de liberté (ddl)
Dans ce cas, la probabilité de réalisation de l’évènement est connu. Mais c’est ce
dernier plus précisément l’évènement qui est à chercher.
Problèmes de distribution d’échantillonage
Globalement, ce problème est: "la recherche des informations des
échantillons aléatoires prélevée dans une population dont on connait déjà
l'information".
On remarque que les informations des échantillons de taille fixe n, prélevés
dans la même population varient , donc forment une variable aléatoire
appelée désormais: distribution d'échantillonage (D.E)

Exemple:
Population:{2,5,7,6}
2 + 5 + 7 + 6 20
𝑀𝑜𝑦𝑒𝑛𝑛𝑒 = = =5
4 4
m=5
Problèmes de distribution d’échantillonage
Prélevons des échantillons de taille 2 dans la population sus-définie
2+7
Ech 1= { 2,7} 𝑥 1= 𝑥 1=4,5
2

2+5
Ech 2= { 2,5} 𝑥2= 𝑥2=3,5
2

2+6
Ech 3= { 2,6} 𝑥3= 𝑥 3=4
2

7+5
Ech 4= { 7,5} 𝑥 4= 𝑥 4=6
2
Distribution d’Echantillonage (D.E) de
MOYENNE
On a une population dont on connait la moyenne m et l'écart-type 𝛔
On cherche les moyennes 𝒙i de l'échantillon i de taille n prélevé au hasard dans la
population.
Les moyennes 𝒙i varient et forment une variable aléatoire appelée:
DISTRIBUTION D'ECHANTILLONAGE DES MOYENNES noté 𝑿
La loi de probabilité est définié par:
𝝈
𝑿 ↝ 𝓝(𝒎; )
𝒏
Distribution d’Echantillonage (D.E) de
POURCENTAGE
On a une population dont on connait le pourcentage « p » des individus qui vérifie une
certaine propriété. (ex: % des filles dans une classe)
On cherche le % « f » des individus d'un échantillon de taille fixe n prélevé au hasard dans
la population. Les % « f » des échantillons varient et forment donc une V.A (Variable
Aléatoire) appelée: DISTRIBUTION D'ECHANTILLONAGE DES POURCENTAGES noté F

𝒑𝒙(𝟏 − 𝒑)
𝑭 ↝ 𝓝(𝒑;
𝒏
Exemple:
On sait que l’âge moyen des employés d’une Entreprise est de 31,8 ans avec un écart-type (𝝈) de 4,7.
Calculer la probabilité pour que dans un échantillon de 30 employés, on ait:
a- une moyenne d’âge <30 ans
b- une moyenne d’âge >34 ans

Solutions:
Ce qu’on a: les employés d’une Entreprise
Ce qu’on fait: on prend des échantillons de 30 employés
Ce qu’on étudie: la moyenne d’âge des employés de l’échantilllon
La moyenne d’âge des employés varient, donc définie une Variable Aléatoire (VA)
→ Distribution d’échantillonage (DE) de moyenne
Soit 𝑿 la VA associée aux moyennes d’âges des échantillons de taille 30, on a:

𝝈 𝝈 𝟒,𝟕 𝟒,𝟕
𝑿 ↝ ℵ(𝒎; ) avec m= 31,8 , = , → 𝑿 ↝ ℵ(𝟑𝟏, 𝟖; )
𝒏 𝒏 𝟑𝟎 𝟑𝟎

P(𝑿<30) ou P(𝑿>34) = à lire sur Excel


Exemple:
Le pourcentage des employés Cadres dans cette Entreprise est de 10%. Calculer la probabilité pour que le % de
employés Cadres de l’échantillon soit:
a- <8%
b- >14%
C- comprise entre 8% et 12%
Solutions:
Ce qu’on a: les employés d’une Entreprise
Ce qu’on fait: on prend des échantillons de 30 employés
Ce qu’on étudie: le % des employés Cadres de l’échantillon
Le % des employés Cadres varient, donc définie une Variable Aléatoire (VA)
→ Distribution d’échantillonnage (DE) de pourcentage
𝒑𝒙(𝟏−𝒑)
𝑭 ↝ 𝓝(𝒑; ) avec p=0,1 et n=30
𝒏

a- P( F<0,08)
b- P( F>0,14)
c- P(0,08< F <0,12)
Autres Distributions d’Echantillonage (D.E)
La DE de pseudo variance notée S (ou X² la VA).
𝑛 𝛔′²
On prend comme valeur la quantité: ∗
𝑛−1 𝛔²
Avec
𝛔′²: variance de l’échantillon (inconnue)
𝛔2 : variance de la population (connue)

La VA associée suit la loi de 𝑿𝟐 ou PEARSON avec un degré de liberté (ddl) n-1. Cette VA est
notée par 𝓢² ou 𝑿².
On a 𝑿𝟐 ↝ 𝑿𝟐 (n-1)
Les valeurs prises pour la VA 𝑿𝟐 sont notées par 𝑿𝟐𝜶 où 𝛼 est la probabilité de réalisation
de l’évènement.
Donc: 𝑷 𝑿𝟐 ≥ 𝑿𝟐𝜶 = 𝜶
Autres Distributions d’Echantillonage (D.E)
La DE de rapport de 2 variances
Il s’agit ici d’étudier un caractère quantitatif dans 2 populations A et B dont on connait la variance
𝜎𝐴2 et 𝜎𝐵2
La VA qui prend comme valeur le rapport des variances des échantillons de taille nA
et nB dans les 2 populations suit la loi de FISHER avec les 2 degré de liberté (ddl)
ddl1 = nA – 1
ddl2 = nB – 1

On note 𝐹 ↝ 𝐹(𝛼, ddl1; ddl2)

𝑋 2 n−1
DE 𝜎12
↝ 𝐹ddl1; ddl2
𝜎22
INFERENCE STATISTIQUES
Vaste

Information
Etude Population
inconnue

Restriction Inférence statistique


Statistique Inférentielle

Information
Partie de la
connue de
population
l'échantillon
(échantillon) (partielle/incomplète)
INFERENCE STATISTIQUES
Recherche d'informations de la population à partir de l'échantillon
Généralisation de l'information de l'échantillon dans la population

Méthode

TESTS
ESTIMATION
STATISTIQUES
Recherche de la valeur du paramètre Techniques qui permet de vérifier qu'un
(x ̅ ², σ², %, …) de la population à partir de information appelée HYPOTHESE nulle notée
celles de l'échantillon Ho est vraie ou fausse dans la population

Techniques

❶ ❷ ❶ ❷
Estimation Estimation
Test non Test
ponctuelle par intervalle
paramétrique paramétrique
de confiance
(IC)
Base
Information population = Information Echantillon
(Proportionnel)
INFERENCE STATISTIQUE - ESTIMATION
1- Estimation ponctuelle
Information population = Information de l’échantillon
(ou Proportionnelle)
Exemple:
Estimation de la moyenne de la population: 𝐸 𝑚 = 𝒙
Estimation du pourcentage: 𝐸 𝑝 = 𝒇
2 𝑛
Estimation de la variance: 𝐸 𝜎 = ∗ 𝜎 ′2 = 𝑠², 𝜎 ′2 étant
𝑛−1
la variance de l’échantillon
Désormais la variance de l’échantillon est considéré par s
𝑛
Estimation de l′écart type:𝐸 𝜎 = ∗ 𝜎′ = 𝑠
𝑛−1
INFERENCE STATISTIQUES - ESTIMATIONS
2- Estimation par intervalle de confiance (IC)
C’est un intervalle du type I = a; b qui a une certaine chance de contenir la valeur d’un
paramètre (m, σ², %, …) de la population avec un niveau de confiance (NC) ou une
probabilité fixée connue (90%, 95% ou 99%)
NC: chance de ne pas se tromper ≠ Risques d’erreur (𝛼)

Exemple:
A l’issu de l’étude d’un échantillon, l’IC de la moyenne d’âge des étudiants est de
21,7; 28,8 avec un NC 95%.
Donc, à 95% de chance, la moyenne d’âge des étudiants est entre 21,7 ans et 28,8 ans.
INFERENCE STATISTIQUES - TEST
1- TEST NON PARAMETRIQUE

Ho n’est pas la fonction d’un paramètre, c’est une propriété de la population.


On définit l’hypothèse alternative notée Ha, le contraire de Ho
Exemple:
La motivation des employés d’une entreprise varie selon la Direction d’appartenance
INFERENCE STATISTIQUES - TEST
2- TEST PARAMETRIQUE

Si Ho est fonction des paramètres (m; %; …)


Exemple:
Montrer que les étudiants sont jeunes
- Info: Ho = m âge
Il y a plus de femme dans une entreprise
- Info: Ho = P femme
Le PV1 et plus performant que le PV2
- Info: Ho = CA PV1> CA PV2
INFERENCE STATISTIQUES - TEST
TEST STATISTIQUES
Echantillon VRAI
quelconque
A vérifier
Données secondaire Ho Population
(documentation)
Information

Observation FAUX

Ho: Information : Pourcentage femme > 50%


Ho: m = salaire moyen > 2M
CONSTRUCTION D’UN TEST STATISTIQUE
La réalisation d’un test statistique est généralement divisé en 2 ou 3 étapes:
1- Formulation des hypothèses:
- Définir Ho
- Parallèlement définir Ha, le contraire de Ho appelé hypothèse alternative qu’on considère dans le cas où Ho
est fausse.
Remarque:
Dans le cas d’un test non paramétrique, Ho est une phase simple (S+V+C); Ha est la négation de Ho
Dans le d’un test paramétrique, Ho est exprimée toujours sous forme d’équation ou égalité
Ex: Ho = m âge = 20
L’hypothèse alternative Ha peut être formulée de 3 façons:
- Ha « ≠ » : c’est un test bilateral
- Ha « > » : c’est un test unilateral à droite
- Ha « < » : c’est un test unilateral à gauche
NB: le choix du type de test dépend de l’information à vérifier
CONSTRUCTION D’UN TEST STATISTIQUE
2- Recherche de la région critique ou la zone de non acceptation de
Ho:

- On fixe le risque d’erreur 𝜶 à 10% ou 5% ou 1%


- On détermine la loi de probabilité associée au test qui donne globalement le type de
test. Ainsi, si on utilise:
• La loi normale, on dit qu’on a un Z-test
• La loi de Student, on dit qu’on a un T-Test
• La loi de Chi-deux, on dit qu’on a un 𝑿𝟐 -test
• La loi de Fisher, on dit qu’on a un F-test
• ………
CONSTRUCTION D’UN TEST STATISTIQUE
3- Décision:
Comparer la valeur théorique (VT) calculée à partir de la loi de probabilité associé au test et
valeur empirique (VE) calculé à partir de l’échantillon du test.
Ou p-Value (chance de se tromper alors que c’est vraie) avec le risque d’erreur 𝛼 fixé
généralement à 10% (résultat peu significatif) ou 5% (résultat significatif) ou 1% (résultat
très significatif).
Règle:
* Si P-value ≥ 𝛼 ou VE < VT alors Ho est vraie et Ha est fausse
• Si P-value < 𝛼 ou VE > VT alors Ho est fausse et Ha est vraie
TEST\REALITE VRAI FAUX
VRAI Bonne Décision Erreur (2ème espèce)
FAUX Erreur (1ère espèce) Bonne Décision
Z-test
Comparaison de 𝒙 ou %
• Exemple 1: Monter que la moyenne d’âge des étudiants est inférieure à 20 ans ie m<20 ans
Ho: m=20
Ha: m<20
• Exemple 2: Montrer que le CA moyen du point de vente 1 est supérieur à celui du point de vente
2.
Ho: 𝐶𝐴 PV1 = 𝐶𝐴 PV2
Ha: 𝐶𝐴 PV1 > 𝐶𝐴 PV2
T-Test
Comparaison + validation de la dépendance entre 2 VQT
Ex: Montrer qu’il exite une dépendance significative entre les notes de statistique et de français
Ho: r=o ⇒ Il n’a pas de dépendance significative
Ha: r≠0 ⇒ Il existe de dépendance significative
𝐗 𝟐 -test
Pour monter la dépendance entre 2 VQL
Exemple: Monter que le choix de la série du BACC dépend du sexe

Vous aimerez peut-être aussi