Vous êtes sur la page 1sur 238

La Probabilité

1
Définitions, axiomes et propriétés
Avant de donner des définitions formelles, essayons
de comprendre la signification du mot probabilité.
Considérons les expériences suivantes :

1) On lance une pièce de monnaie. Intuitivement,


on sait que la probabilité d’obtenir FACE est ½.

Quelle est l’interprétation de P(FACE)=1/2?

Source: David Haziza, Notes de Cours STT1700, Introduction à la statistique 2


Définitions, axiomes et propriétés
2) Le lecteur de météo au téléjournal nous dit que
demain, il y a 35% de chance de précipitations;
c’est-à-dire, la probabilité qu’il pleuve demain est
35%.

Comment interpréter cette affirmation?

3
Définitions, axiomes et propriétés
3) On lance un dé équilibré. On sait que la
probabilité d’obtenir 2 est 1/6.

Quelle est l’interprétation de P(obtenir 2)=1/6?

4
Définitions
Expérience aléatoire:
Une expérience aléatoire est une expérience dont
on ne peut pas prédire les résultats avec certitude.

Espace échantillon:
L'ensemble des résultats possibles d'une expérience
aléatoire est appelé espace échantillon. Il sera
dénoté par Ω.

5
Définitions
Événement:
Un événement A est un sous-ensemble de l'espace
échantillon Ω.

Événement élémentaire:
Un événement élémentaire est un événement qui
ne peut être décomposé.

Remarque :
Les définitions d’événement et d’événement
élémentaire implique qu’un événement est une
union d’événements élémentaires.
6
Définitions
En jetant un dé :
- "obtenir un six " est un évènement

- "ne pas obtenir de six " ou "obtenir un non-six" est


l’évènement contraire du précèdent

- "obtenir un nombre entier compris entre 1 e t 6"


est un évènement certain

- "obtenir un sept" est un évènement impossible

On voit que la notion d’évènement est liée à la


notion intuitive d‘expérience aléatoire.
7
Définitions
II s'agit d’un évènement qui ne sera réalisé que par un
seul résultat de l’expérience aléatoire.

- "obtenir un six " en jetant un dé, est un évènement


élémentaire

- "obtenir un nombre pair" en jetant un dé, n’est pas


un évènement élémentaire, car il peut être réalisé par
plusieurs résultats de l’expérience aléatoire qui sont :
"obtenir deux"
"obtenir quatre"
"obtenir six ".
8
Exemple 1:
On tire une personne aléatoirement dans la
population et on recueille son groupe sanguin.

On a Ω = {A, B, AB, 0}.

Les événements:

E1 = {A}, E2 = {B} , E3 = {AB} et E4 = {0} sont les


événements élémentaires.

9
Exemple 2:
Expérience : Lancer deux pièces de monnaie.
Ω = {PP , PF , FP , FF}.

Les quatre événements élémentaires sont :


E1 = {PP}, E2 = {PF} , E3 = {FP} et E4 = {FF}

Événement Signification courante


{PP, PF} Le premier lancer donne une pile
{PP, PF, FP} Obtenir au moins une pile
{PF, FP} Obtenir exactement une pile

10
Exemple 2:
Expérience : Lancer un dé. Ω = {1,2,3,4,5,6}

Événement Signification courante


{1,2,3} Le résultat est inférieur ou égal à 3
{2,4,6} Le résultat est pair
{1,5} Obtenir "1" ou "5"

11
Combinaisons d'événements

12
Combinaisons d'événements

13
Combinaisons d'événements

14
Combinaisons d'événements
Événement impossible et événement certain.
L'ensemble vide φ et l'ensemble Ω sont
respectivement, l’événement impossible et
l’événement certain.

Événements disjoints ou incompatibles


Deux événements A et B sont dits disjoints ou
mutuellement exclusifs, ou incompatibles, s'ils ne
peuvent pas se produire en même temps.

Formellement, A et B sont dits incompatibles si


A∩B = Ø.
15
Evénement Mutuellement Exclusif
Les événement mutuellement exclusif sont des choses qui ne
peuvent pas se produire en même temps. Par exemple, vous
ne pouvez pas courir en avant et en arrière simultanément.
Les actions “courir en avant” et “courir en arrière” sont
mutuellement exclusives.

Tirer à pile ou face peut également vous donner ce type


d’événement. Vous ne pouvez pas tirer à pile ou face et
obtenir un résultat à la fois positif et négatif. Les actions “pile
ou face” et “face” s’excluent donc mutuellement. Parmi les
autres exemples, citons la capacité de payer votre loyer si
vous n’êtes pas payé ou d’éteindre la télévision si vous n’en
avez pas.
Source: https://datascience.eu/fr/mathematiques-et-statistiques/evenement-mutuellement-exclusif-definition-exemples-syndicats 16
Evénement Mutuellement Exclusif
La probabilité de base (P) qu’un événement se produise (en oubliant
l’événement mutuellement exclusif pendant un moment) est :
P = nombre de façons dont l’événement peut se produire/nombre total
de résultats.
Exemple: La probabilité de lancer un 5 lorsque vous lancez un dé est de
1/6 car il y a un 5 sur un dé et il y a six résultats possibles.

Si nous appelons la probabilité de lancer un 5 “Événement A”, alors


l’équation est la suivante:
P(A) = nombre de façons dont l’événement peut se produire/nombre
total de résultats: P(A) = 1/6.

Il est impossible de faire un 5 et un 6 ensemble ; les événements


s’excluent mutuellement.
Les événements sont écrits comme ceci: P(A et B) = 0

Source: https://datascience.eu/fr/mathematiques-et-statistiques/evenement-mutuellement-exclusif-definition-exemples-syndicats 17
Source: http://webapps.fundp.ac.be/umdb/biostats2017/biostat/modules/module30/module.php# 18
Source: http://webapps.fundp.ac.be/umdb/biostats2017/biostat/modules/module30/module.php# 19
Combinaisons d'événements
Exemple:
On tire au hasard une personne au hasard dans une
certaine population.
Considérons les événements suivants:
A : La personne choisie a les yeux bleus
B : La personne choisie a les cheveux blonds
C : La personne choisie a les yeux verts

Source: David Haziza, Notes de Cours STT1700, Introduction à la statistique 20


Combinaisons d'événements
Exemple:
A : La personne choisie a les yeux bleus
B : La personne choisie a les cheveux blonds
C : La personne choisie a les yeux verts

21
Axiomes
Définition:
Une fonction P qui fait correspondre à chaque
événement A ⊂ Ω un nombre réel P(A) est appelée
une probabilité si elle satisfait les axiomes suivants:

A1. P(A) ≥0 pour tout événement A

A2. Si A1, A2, ..., Ak sont des événements disjoints


deux à deux, alors
P(A1∪ A2∪...∪ Ak) = P(A1) + P(A2) + ... + P(Ak)

A3. P(Ω) = 1 22
Propriétés
1. P( Ac ) =1− P(A)
2. P(φ) = 0 : la probabilité de l'événement
impossible est 0
3. P(A) = P(A∩B) + P(A∩Bc )
4. Si B ⊂ A, alors P(B) ≤ P(A)
5. P(A) ≤ 1 pour tout événement A ⊂ Ω
6. P(A - B) = P(A) - P(A∩B)
7. P(A∪B) = P(A) + P(B) - P(A∩B)

23
Probabilités conditionnelles - Indépendance
Une expérience aléatoire est une expérience dont le
résultat dépend du hasard.
• Chacun des résultats possibles s’appelle une
éventualité (ou une issue).
• L’ensemble Ω de tous les résultats possibles d’une
expérience aléatoire s’appelle l’univers de l’expérience.
• On définit une loi de probabilité sur Ω en associant, à
chaque éventualité xi , un réel pi compris entre 0 et 1 tel
que la somme de tous les pi soit égale à 1.
• Un événement est un sous-ensemble de Ω.

Soruce: https://www.maths-cours.fr/cours/evenements-probabilites/ 24
Probabilités conditionnelles - Indépendance
Le lancer d’un dé à six faces est une expérience
aléatoire d’univers comportant 6 éventualités : =
{1;2;3;4;5;6}

L’ensemble E1 = {2;4;6} est un événement. En


français, cet événement peut se traduire par la
phrase : « le résultat du dé est un nombre pair »

L’ensemble E2 = {1;2;3} est un autre événement. Ce


second événement peut se traduire par la phrase :
« le résultat du dé est strictement inférieur à 4 ».

Soruce: https://www.maths-cours.fr/cours/evenements-probabilites/ 25
Probabilités conditionnelles - Indépendance
Ces événements peuvent être représentés par un
diagramme de Venn :

Soruce: https://www.maths-cours.fr/cours/evenements-probabilites/ 26
Probabilités conditionnelles - Indépendance
• l’événement contraire de A noté 𝐴ҧ est l’ensemble
des éventualités de qui n’appartiennent pas à A.

• l’événement A∪B (lire « A union B » ou « A ou B »)


est constitué des éventualités qui appartiennent soit à
A, soit à B, soit aux deux ensembles.

• l’événement A∩B (lire « A inter B » ou « A et B » est


constitué des éventualités qui appartiennent à la fois à
A et à B.

Soruce: https://www.maths-cours.fr/cours/evenements-probabilites/ 27
Probabilités conditionnelles - Indépendance
On reprend l’exemple précédent :
E1 = {2;4;6}, E2 = {1;2;3}
• 𝐸ത 1 = {1;3;5} : cet événement peut se traduire par « le
résultat est un nombre impair »

28
Probabilités conditionnelles - Indépendance
On reprend l’exemple précédent :
E1 = {2;4;6}, E2 = {1;2;3}
• E1∪E2 = {1;2;3;4;6} : cet événement peut se traduire
par « le résultat est pair ou strictement inférieur à 4 ».

29
Probabilités conditionnelles - Indépendance
On reprend l’exemple précédent :
E1 = {2;4;6}, E2 = {1;2;3}
• E1∩E2 = {2} : cet événement peut se traduire par
« le résultat est pair et strictement inférieur à 4 ».

30
Probabilités conditionnelles - Indépendance
On dit que A et B sont incompatibles si et seulement
si A∩B = ∅

Deux événements contraires sont incompatibles mais


deux événements peuvent être incompatibles
sans être contraires.

Exemple:
«Obtenir un chiffre inférieur à 2 » et « obtenir un
chiffre supérieur à 4 » sont deux événements
incompatibles.

31
Probabilités conditionnelles - Indépendance
Propriétés:

• p(∅) = 0
• p(Ω) = 1
• p(𝐴) = 1 − p(A)
• p(A∪B) = p(A) + p(B) − p(A∩B).
Si A et B sont incompatibles, la dernière égalité
devient :
• p(A∪B) = p(A) + p(B).

32
Arbre
Lorsqu’une expérience aléatoire comporte plusieurs
étapes, on utilise souvent un arbre pondéré pour la
représenter.
Exemple:
Dans une classe de Terminale, 52% de garçons et 48%
de filles étaient candidats au baccalauréat. 80% des
garçons et 85% des filles ont obtenu leur diplôme.
On choisit un élève au hasard et on note :
G : l’événement « l’élève choisi est un garçon » ;
F : l’événement « l’élève choisie est une fille » ;
B : l’événement « l’élève choisi(e) a obtenu son
baccalauréat ». 33
Arbre
On peut représenter la situation à l’aide de l’arbre
pondéré ci-dessous :
On choisit un élève au hasard et on note :
G : l’événement « l’élève choisi est un garçon » ;
F : l’événement « l’élève choisie est une fille » ;
B : l’événement « l’élève choisi(e) a obtenu son
baccalauréat ».

Dans une classe de Terminale, 52% de garçons et


48% de filles étaient candidats au baccalauréat.
80% des garçons et 85% des filles ont obtenu leur
diplôme. 34
Arbre
Le premier niveau indique le genre de l’élève (G ou F)
ഥ).
et le second indique l’obtention du diplôme (B ou B

On inscrit les probabilités sur chacune des branches.


La somme des probabilités inscrites sur les branches
partant d’un même nœud est toujours égale à 1.

35
Probabilités Conditionnelles
Soit A et B deux événements tels que p(A) ≠ 0, la
probabilité de B sachant A est le nombre :

On peut aussi noter cette probabilité p(B/A).

36
Probabilités Conditionnelles
Exemple:
On reprend l’exemple du lancer d’un dé. La
probabilité d’obtenir un chiffre pair sachant que
le chiffre obtenu est strictement inférieur à 4 est
(en cas d’équiprobabilité) :

E1 = {2;4;6}, E2 = {1;2;3}

37
Probabilités Conditionnelles
Remarques:
L’égalité précédente s’emploie souvent sous la forme :

pour calculer la probabilité de A∩B.

• Attention à ne pas confondre pA(B) et p(A∩B) dans


les exercices. On doit calculer pA(B) lorsque l’on sait
que A est réalisé.

38
Probabilités Conditionnelles
Remarques:
Avec un arbre pondéré, les probabilités conditionnelles
figurent sur les branches du second niveau et des
niveaux supérieurs (s’il y en a).

La probabilité inscrite sur la branche reliant A à B est


pA(B).

Typiquement, un arbre binaire à deux niveaux se


présentera ainsi :

39
Probabilités Conditionnelles
Remarques:

40
Probabilités Conditionnelles
Remarques:
La formule p(A∩B) = p(A)×pA(B) s’interprète alors de la
façon suivante :

« La probabilité de l’événement A∩B s’obtient en faisant


le produit des probabilités inscrites sur le chemin
passant par A et B ».

41
Probabilités Conditionnelles
Remarques:

42
Evénements Indépendants
Remarques:
Deux événements A et B sont indépendants si et
seulement si :

A et B sont indépendants si et seulement si :

Comme A∩B = B∩A, A et B sont interchangeables


dans cette formule et on a également :

43
Evénements Indépendants
Exemple 1:
On rappelle qu’un jeu de 32 cartes est composé des
cartes 7, 8, 9, 10, valet, dame, roi et as, déclinées en
quatre couleurs : trèfle, pique, coeur et carreau.

Source: http://aiguerande.fr/blogs/maths/en-autonomie/notions/probabilites-et-
statistiques/probabilites/exercice-2-avec-un-jeu-de-32-cartes/ 44
Evénements Indépendants
Exemple 1:

Source: http://aiguerande.fr/blogs/maths/en-autonomie/notions/probabilites-et-
statistiques/probabilites/exercice-2-avec-un-jeu-de-32-cartes/ 45
Evénements Indépendants
Exemple 1:

Source: http://aiguerande.fr/blogs/maths/en-autonomie/notions/probabilites-et-
statistiques/probabilites/exercice-2-avec-un-jeu-de-32-cartes/ 46
Evénements Indépendants
Exemple 1:

47
Evénements Indépendants
Exemple 1:

48
Evénements Indépendants
Exemple 1:

49
Evénements Indépendants
Exemple 2:

Montrer les indépendances ci-dessus.

Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 50
Evénements Indépendants
Exemple 2:

Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 51
Probabilités
Univers, issues et événements

Source: http://www.apprendre-en-ligne.net/MADIMU2/PROBA/PROBA2.PDF 52
Probabilités
Univers, issues et événements

53
Probabilités
Univers, issues et événements

54
Probabilités
Univers, issues et événements

55
Probabilités
Exemple

56
Probabilités
Exemple

*Un nombre premier est un entier naturel qui admet exactement deux diviseurs
distincts entiers et positifs.

57
Probabilités
Exemple

58
Probabilités
Exemple

59
Vocabulaire propre aux évènements

60
Probabilité

61
Probabilité

1
2
Example 1:

Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 3
Example 1:

Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 4
5
Example 2:

Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 6
Example 2:

Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 7
Example 3:

Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 8
Example 3:

Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 9
Example 4:

Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 10
Example 4:

Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 11
Source: http://webapps.fundp.ac.be/umdb/biostats2017/biostat/modules/module30/module.php# 12
Source: http://webapps.fundp.ac.be/umdb/biostats2017/biostat/modules/module30/module.php# 13
Example 5:
A, B, C sont trois événements d’un espace
d’épreuves Ω. Exprimer à l’aide de A, B, C, les
événements suivants :

1. A, B, C se produisent simultanément.

2. Au moins un des trois événements se produit.

3. Parmi A, B, C, seul C se produit.

4. Aucun des trois événements ne se produit.

Source: http://helios.mi.parisdescartes.fr/~jdelon/enseignement/cogmaster 14
Example 5:

Source: http://helios.mi.parisdescartes.fr/~jdelon/enseignement/cogmaster 15
Example 5-1:
Exemple:
Soit A et B deux événements tels que
P(A) = 0,3, P(B) = 0,5 et P(A∪B) = 0,7.

Déterminer:
a) P(A∩B)
b) P(Ac∩Bc)
c) P(B∩Ac).

Source: David Haziza, Notes de Cours STT1700, Introduction à la statistique 16


Example 5-1:
Exemple:
Soit A et B deux événements tels que
P(A) = 0,3, P(B) = 0,5 et P(A∪B) = 0,7.

Solution:
a) P(A∩B) = P(A)+P(B) - P(A∪B) = 0,3+0,5-0,7=0,10
b) P(Ac∩Bc) = P(A∪B)c = 1 - P(A∪B) = 0,30
c) P(B∩Ac) = 0,40

Source: David Haziza, Notes de Cours STT1700, Introduction à la statistique 17


Example 6:
A et B sont deux événements d'une même expérience
aléatoire tels que:
ҧ
P(𝐴)=0,44 ത
; P(𝐵)=0,63 ; P(𝐴𝑈𝐵)=0,32.

Calculer P(A∩B)

Source: https://www.ilemaths.net/sujet-probabilites-niveau-seconde-583818.html 18
Example 6:
A et B sont deux événements d'une même expérience
aléatoire tels que:
ҧ
P(𝐴)=0,44 ത
; P(𝐵)=0,63 ; P(𝐴𝑈𝐵)=0,32.

Calculer P(A∩B)

Solution:
P(A∩B)=P(A)+P(B)-P(AUB)
=(1 - P(𝐴)ҧ ) + (1 - P(𝐵))
ത - (1 - P(𝐴𝑈𝐵))
=0,56 + 0,37 – (1- 0,32)
=0,93-0,68
P(A∩B)=0,25
Source: https://www.ilemaths.net/sujet-probabilites-niveau-seconde-583818.html 19
Example 7:
A et B sont deux évènements d’une expérience
ഥ l’évènement contraire de B.
aléatoire. On note B

On sait que:
P(A) = 0,6
P(B) = 0,5 et
P(A∩B) = 0,42

Calculer
ഥ)
P(AUB), PA(B), PB(A), et P(A∩B

Source: https://www.freemaths.fr/annales-mathematiques/bac-es-mathematiques-antilles-guyane-
2017-specialite-corrige-exercice-1.pdf 20
Example 7:
P(A) = 0,60
P(B) = 0,50 et
P(A∩B) = 0,42

Solution:
P(AUB) =P(A)+P(B)-P(A∩B)=0,60+0,50-0,42=0,68

PA(B) = P(A∩B) / P(A) = 0,42/0,60 = 0,70

PB(A) = P(A∩B) / P(B) = 0,42/0,50 = 0,84

ഥ) = 0,6-0,42 = 0,18
P(A∩B
Source: https://www.freemaths.fr/annales-mathematiques/bac-es-mathematiques-antilles-guyane-
2017-specialite-corrige-exercice-1.pdf 21
Example 8:

Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 22
Example 8:

Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 23
Example 9:
A et B sont deux événements tels que P(A∩B)=0,4,
P(AUB)=0,7 et PA(B)=0,8

Calculer P(A) et P(B). En déduire la probabilité de


l’événement A sachant que l’événement B est réalisé
(PB(A)).

Source: https://nosdevoirs.fr/devoir/1936360 24
Example 9:

Source: https://nosdevoirs.fr/devoir/1936360 25
Example 10:
En 1999, 23% des ménages étaient équipés d’un
ordinateur et 28% d’un téléphone portable. Ils
étaient 70% à n’avoir ni ordinateur ni téléphone
portable.

1. Quelle est la probabilité pour un ménage pris au


hasard d’être équipé d’un ordinateur et d’un
téléphone portable ?

2. Ces chiffres sont contestés et on prétend qu’ils


étaient en fait 73% à n’avoir ni ordinateur ni
téléphone portable. Est-ce possible ?
Source: http://helios.mi.parisdescartes.fr/~jdelon/enseignement/cogmaster/TD1_corrige.pdf 26
Example 10:
Notons A l’évènement « un ménage tiré au hasard
possède un ordinateur » et B l’évènement
« un ménage tiré au hasard possède un téléphone
portable ».
En 1999, 23% des ménages étaient équipés d’un
ordinateur et 28% d’un téléphone portable. Ils étaient
70% à n’avoir ni ordinateur ni téléphone portable.

D’après l’énoncé, on a
P(A) = 0.23 et
P(B) = 0.28 et
P(Ac∩Bc) = 0.7

Source: http://helios.mi.parisdescartes.fr/~jdelon/enseignement/cogmaster/TD1_corrige.pdf 27
Example 10:
1. Quelle est la probabilité pour un ménage pris au
hasard d’être équipé d’un ordinateur et d’un
téléphone portable ?

L’évènement «un ménage tiré au hasard est équipé


d’un téléphone portable et d’un ordinateur» peut
s’écrire A∩B. Remarquons d’abord que

P(A∪B) = 1 - P((A∪B)c) = 1 - P(Ac∩Bc) = 0.3


Donc A∩B a pour probabilité
P(A∩B) = P(A)+P(B)-P(A∪B) = 0.23+0.28-0.3 = 0.21

Source: http://helios.mi.parisdescartes.fr/~jdelon/enseignement/cogmaster/TD1_corrige.pdf 28
Example 10:
2. Ces chiffres sont contestés et on prétend qu’ils
étaient en fait 73% à n’avoir ni ordinateur ni téléphone
portable. Est-ce possible ?

Si P(Ac∩Bc) = 0.73, alors P(A∪B) = 0.27 alors que


P(B) = 0.28

C’est donc impossible.

Source: http://helios.mi.parisdescartes.fr/~jdelon/enseignement/cogmaster/TD1_corrige.pdf 29
Exemple 10-1:
En étudiant une population, on a remarqué que,
durant un mois, 40% des individus sont allés au
cinéma, 25% sont allés au théâtre, et 12, 5% sont
allés au cinéma et au théâtre.

On considère une personne tirée au hasard parmi


cette population et on note les événements suivants :

C ="elle est allée au cinéma",

T ="elle est allée au théâtre".

30
Exemple 10-1:
Calculer la probabilité que cette personne

1. soit allée au cinéma ou au théâtre

2. ne soit pas allée au cinéma

3. ne soit allée ni au cinéma ni au théâtre

4. soit allée au cinéma mais pas au théâtre

31
Exemple 10-1:
Correction D’après l’énoncé, on a
P(C) = 0,40 P(T) = 0,25 et P(C∩T) = 0,125

Ainsi,

1. P(C∪T) = P(C)+P(T)-P(C∩T) = 0,40+0,25-0,125=0,525

2. P(Cc) = 1 - P(C) = 0,60

3. P(Cc∩Tc) = P((C∪T)c) = 1 - P(C∪T) = 1 - 0,525 = 0,475

4. P(C∩Tc) = P(C) - P(C∩T) = 0,40 - 0,125 = 0,275


32
Example 11:
Voici les résultats d’un sondage effectué au début de
l’année 1998 auprès de 1000 personnes, à propos
d’Internet :
• 40% des personnes interrogées déclarent être
intéressées par Internet ;
• 35% des personnes interrogées ont moins de 25 ans
et, parmi celles-ci, 80% déclarent être intéressées par
Internet ;
• 30% des personnes interrogées ont plus de 50 ans et,
parmi celles-ci, 85% ne sont pas intéressées par
Internet.

Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 33
Example 11:
1. Reproduire et compléter le tableau suivant :

Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 34
Example 11:
2. On choisit au hasard une personne parmi les 1000
interrogées. On suppose que toutes les personnes ont
la même probabilité d’être choisies. On considère les
événements :

A : "la personne interrogée est intéressée par Internet"


B : "la personne interrogée a moins de 25 ans"

Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 35
Example 11:
A : "la personne interrogée est intéressée par Internet"
B : "la personne interrogée a moins de 25 ans"

(a) Calculer les probabilités P(A) et P(B).


(b) Définir par une phrase l’événement contraire de B,
puis calculer sa probabilité.
(c) Définir par une phrase l’événement A∩B, puis
calculer P(A∩B). En déduire P(A∪B).
(d) On sait maintenant que la personne interrogée
n’est pas intéressée par Internet. Quelle est la
probabilité qu’elle ait moins de 50 ans ?

Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 36
Example 11:
Solution:

Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 37
Example 11:
Solution:

Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 38
Example 12:

39
Example 12:
Dans un atelier, deux machines M1 et M2 découpent
des pièces métalliques identiques. M1 fournit 60% de
la production (parmi lesquelles 6, 3% sont
défectueuses), le reste étant fourni par M2 (dont 4%
de la production est défectueuse).

La production du jour est constituée des pièces


produites par les deux machines, et on en tire en fin
de soirée une pièce au hasard (tous les prélèvements
sont supposés équiprobables).

Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 40
Example 12:
1. Utilisation des formules des probabilités
conditionnelles.

(a) Quelle est la probabilité de prélever une pièce


défectueuse, sachant qu’elle est produite par M1 ?

(b) Quelle est la probabilité de prélever une pièce


défectueuse, sachant qu’elle est produite par M2 ?

(c) Quelle est la probabilité de prélever une pièce


défectueuse ?

Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 41
Example 12:

Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 42
Example 12:
2. Utilisation d’un tableau on suppose maintenant que la
production est composée de 10000 pièces.
(a) Reproduire et compléter le tableau suivant qui décrit la
production du jour :

(b) Quelle est la probabilité de prélever une pièce défectueuse,


sachant qu’elle est produite par M1 ?
(c) Quelle est la probabilité de prélever une pièce défectueuse,
sachant qu’elle est produite par M2 ?
(d) Quelle est la probabilité de prélever une pièce défectueuse ?
43
Example 12:

Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 44
Example 12:
3. Utilisation d’un arbre des probabilités
conditionnelles
(a) Dresser un arbre des probabilités conditionnelles
relatif à la situation proposée.
(b) Quelle est la probabilité de prélever une pièce
défectueuse, sachant qu’elle est produite par M1 ?
(c) Quelle est la probabilité de prélever une pièce
défectueuse, sachant qu’elle est produite par M2 ?
(d) Quelle est la probabilité de prélever une pièce
défectueuse ?
Source: http://mathematiques.daval.free.fr/IMG/pdf/BTS_Cours_1_Probabilites.pdf 45
Example 12:

46
Example 13:

Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 47
Example 13:

Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 48
Example 13:

Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 49
Example 13:

Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 50
Example 13:

Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 51
Example 14:

Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 52
Example 14:

Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 53
Example 14:

Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 54
Example 15:

Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 55
Example 15:

Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 56
Example 15:

Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 57
Example 15:

Source: https://www.maths-cours.fr/qcm/evenements-probabilites/ 58
La Corrélation

1
Introduction
Fondamentalement, une corrélation est un nombre compris entre –1 et +1 qui
résume la relation entre deux variables, que nous appellerons X et Y.

Une corrélation peut être positive ou négative.

Une corrélation positive signifie que lorsque X augmente, Y augmente.

Une corrélation négative signifie que lorsque X augmente, Y diminue.

Dans les livres de statistiques, cette partie de la relation est appelée la direction
de la relation (c'est-à-dire qu'elle est positive ou négative).

Source: Quirk, T. (2016). Excel 2016 for Social Sciences Statistics. 2


Introduction
La corrélation nous indique également l'ampleur de la relation entre X et Y.

À mesure que la corrélation se rapproche de +1, nous disons que la relation est
forte et positive.

À mesure que la corrélation se rapproche de –1, nous disons que la relation est
forte et négative.

Une corrélation nulle signifie qu'il n'y a pas de relation entre X et Y. Cela signifie
que ni X ni Y ne peuvent être utilisés comme prédicteur de l'autre.

3
Introduction
Une bonne façon de comprendre ce que signifie une corrélation est de voir une
«image» du nuage de points de points produit dans un graphique par les points de
données.

Supposons que vous vouliez savoir si la variable X peut être utilisée pour prédire la
variable Y. Nous placerons la variable prédictive X sur l'axe des x (l'axe horizontal
d'un graphique) et la variable de critère Y sur l'axe des y (la verticale axe d'un
graphique).

4
Introduction
La figure montre le nuage de points pour une corrélation positive parfaite de
r = + 1,0.
Cela signifie que vous pouvez parfaitement prédire chaque valeur y à partir de
chaque valeur x car les points de données se déplacent «vers le haut et vers la
droite» le long d'une ligne droite parfaitement ajustée.

5
Introduction
La figure montre le nuage de points pour une corrélation modérément positive de
r = + 0,53.
Cela signifie que chaque valeur x peut prédire modérément bien chaque valeur y,
car vous pouvez dessiner une image d'un «ballon de football» à l'extérieur des
points de données qui se déplacent vers le haut et vers la droite, mais pas le long
d'une ligne droite ligne.

6
Introduction
La figure montre le nuage de points pour une corrélation faible et positive de
r = + 0,23.
Cela signifie que chaque valeur x est un mauvais prédicteur de chaque valeur y
parce que «l'image» que vous pourriez dessiner autour de l'extérieur des points
de données se rapproche d'un cercle en forme.

7
Introduction
Nous n'avons pas montré de figure d'une corrélation nulle car il est facile
d'imaginer à quoi cela ressemble en tant que nuage de points. Une corrélation
nulle de r = 0,00 signifie qu'il n'y a pas de relation entre X et Y et que «l'image»
dessinée autour des points de données serait un cercle parfait en forme, indiquant
que vous ne pouvez pas utiliser X pour prédire Y parce que ces deux variables ne
sont pas corrélés les uns aux autres.

8
Introduction
La figure montre le nuage de points pour une faible corrélation négative de
r = - 0,22 ce qui signifie que chaque X est un mauvais prédicteur de Y dans une
relation inverse, ce qui signifie que lorsque X augmente, Y diminue. Dans ce cas, il
s'agit d'une corrélation négative car le «football» que vous pourriez dessiner
autour des points de données est incliné vers le bas et vers la droite.

9
Introduction
La figure montre le nuage de points pour une corrélation négative modérée de
r = - 0,39 ce qui signifie que X est un prédicteur moyennement bon de Y, bien qu'il
existe une relation inverse entre X et Y (c'est-à-dire que lorsque X augmente, Y
diminue). Dans ce cas, il s'agit d'une corrélation négative car le «football» que
vous pourriez dessiner autour des points de données est incliné vers le bas et vers
la droite.

10
Introduction
La figure montre une corrélation négative parfaite de r = -1,00, ce qui signifie que
X est un prédicteur parfait de Y, bien que dans une relation inverse telle que
lorsque X augmente, Y diminue. Les points de données s'adaptent parfaitement le
long d'une ligne droite en pente descendante.

11
Les Coefficients de Corrélation
Les coefficients de corrélation sont des indices numériques de la relation entre
deux variables. Ils forment la base de nombreuses procédures statistiques et sont
largement utilisés dans les sciences sociales.

La taille numérique du coefficient de corrélation va de 0 (non relation) à 1 (une


relation parfaite); cependant, ce coefficient peut être positif ou négatif selon que
les deux ensembles de scores augmentent ensemble (corrélation positive) ou si un
ensemble augmente à mesure que l'autre diminue (corrélation négative).

La corrélation de Pearson est utilisée pour les variables de score (bien qu'elle
puisse être utilisée lorsqu'une variable est une variable nominale avec seulement
deux catégories). La corrélation de Spearman est utilisée lorsque les scores sont
classés du plus petit au plus grand (c'est-à-dire non paramétrique -n'impliquant
aucune hypothèse quant à la forme ou aux paramètres d'une distribution de fréquence).
Source: Norris, G., Qureshi, F., Howitt, D. and Cramer, D. (2013). Introduction to Statistics with SPSS for Social Sciences. 12
Les Coefficients de Corrélation
Il faut prendre grand soin d’inspecter le diagramme de dispersion entre les deux
variables en question afin de s’assurer que la «ligne de meilleur ajustement» est
droite plutôt qu’une courbe.

La façon la plus simple de comprendre les coefficients de corrélation est de les


concevoir comme un seul indice numérique qui résume certaines des
informations vitales dans un diagramme de dispersion ou un nuage de points. Le
coefficient de corrélation n'est en réalité qu'un indice de la répartition des points
de données autour de la ligne droite la mieux ajustée.

Les coefficients de corrélation vont de valeurs absolues de 1,00 au plus à 0,00 au


moins. Une corrélation de 1,00 signifie que tous les points de données s'ajustent
parfaitement sur la ligne droite, tandis qu'une corrélation de 0,00 signifie que les
points de données correspondent très mal à la ligne droite.
13
Les Coefficients de Corrélation
Bien que le scattergramme soit un outil statistique important pour montrer les
relations entre deux variables, il prend de la place. Pour de nombreuses raisons, il
est plus pratique d'avoir les caractéristiques principales de l'scattergramme
exprimé en un seul indice numérique - le coefficient de corrélation - et ceci est
simplement un indice numérique qui résume quelques-uns, mais pas tous, des
principales caractéristiques d'un diagramme de dispersion.

Le coefficient de corrélation le plus courant est la corrélation de Pearson,


également connue plus largement et plus obscurément sous le nom de coefficient
de corrélation produit-moment de Pearson.

14
Les Coefficients de Corrélation
Positive correlation between two variables

15
Les Coefficients de Corrélation
Negative correlation between two variables

16
Les Coefficients de Corrélation
Perfect correlation between two variables

17
Les Coefficients de Corrélation
Near-zero correlation between two variables

18
Liaison Entre 2 Variables Quantitatives

Source: https://eric.univ-lyon2.fr/~ricco/cours/cours/Analyse_de_Correlation.pdf 19
Liaison Entre 2 Variables Quantitatives

20
Coefficient de Corrélation de Pearson
Le coefficient de corrélation linéaire simple, dit de Bravais-Pearson (ou de
Pearson), est une normalisation de la covariance par le produit des écarts-type
des variables.

21
Covariance
L'objectif de la covariance est de quantifier la liaison entre deux variables X et Y,
de manière à mettre en évidence le sens de la liaison et son intensité.

La covariance est égale à l'espérance du produit des variables centrées.

COV (X, Y) = E{[X − E(X)][Y − E(Y)]}

On peut aussi l'écrire comme l'espérance du produit des variables, moins le


produit des espérances.
COV (X, Y) = E[XY] − E[X]E[Y]

Signification: La covariance mesure la tendance des deux variables à être


simultanément au dessus ou en dessous de leurs espérances respectives. Elle
modélise une liaison monotone. 22
Covariance
Quelques remarques:
1. La référence est donc l'espérance mathématique, on veut savoir si : lorsque X
est supérieur a son espérance, Y a tendance à être supérieur (ou inférieur) à son
espérance.

2. On peut maintenant quantifier le sens de la liaison


COV (X, Y) > 0 : la relation est positive c.-à-d. lorsque X est plus grand que son
espérance, Y a tendance à l'être également;

COV (X, Y) = 0 : absence de relation monotone;

COV (X, Y) < 0 : la liaison est négative c.-à-d. lorsque X est plus grand que son
espérance, Y a tendance à être plus petit que sa propre espérance.
23
Covariance
Quelques remarques:
3. La covariance d'une variable avec elle-même est la variance, la relation est
toujours positive. En effet,

COV (X,X) = E{[X − E(X)][X − E(X)]}


= E{[X − E(X)]2}
= V (X)
>0

24
Covariance
Propriétés
1. Symétrie. COV (X, Y) = COV (Y, X)
2. Distributivité. COV (X, Y +Z) = COV (X, Y ) +COV (X, Z) (... ne pas oublier que
E[X +Y] = E[X] + E[Y])
3. Covariance avec une constante.
COV (X, a) = 0
4. Covariance avec une variable transformée. (Transformation affine)
COV (X, a + b × Y ) = b × COV (X, Y)
5. Variance de la somme de deux variables aléatoires.
V (X + Y) = V (X) + V (Y) + 2 × COV (X, Y )
6. Covariance de 2 variables indépendantes.
X, Y independants ⇒ COV (X, Y) = 0
25
Covariance
La covariance est définie dans l'ensemble des réels c.-à-d. −∞ < COV (.) < +∞.

Il permet de se rendre compte du sens de la liaison. Plus sa valeur est élevée (en
valeur absolue), plus la liaison est forte. Mais nous ne savons pas quelle est la
limite. Nous ne pouvons pas non plus comparer la covariance d'une variable X
avec deux autres variables Y et Z.

Dans la pratique, nous préférerons donc une mesure normalisée : le coefficient


de corrélation répond à ces spécifications.

Sur un échantillon de taille n, la covariance empirique est définie de la


manière suivante :

26
Covariance: Détails des calculs sur un exemple
Pour préciser les idées, détaillons les calculs dans le tableur EXCEL. Nous
cherchons à calculer la covariance entre la cylindrée et la puissance de 28
véhicules.

Illustrons maintenant l'impossibilité de comparer des covariances lorsque les


variables sont exprimées dans des unités différentes. Nous souhaitons travailler
sur un fichier de 28 véhicules décrites à l'aide de la cylindrée, la puissance, le
poids et la consommation.

La covariance empirique de la variable "consommation" avec les autres


variables nous donne respectivement : cylindrée = 1197.6 ; puissance = 61.7 ;
poids = 616.3. Manifestement, les valeurs ne se situent pas sur la même
échelle, toute comparaison n'a aucun sens.
27
Covariance: Détails des calculs sur un exemple

28
Covariance: Détails des calculs sur un exemple

29
Coefficient de Corrélation de Pearson

Propriétés:

1. Il est de même signe que la covariance, avec les mêmes interprétations.

2. X et Y sont indépendants, alors r = 0. La réciproque est fausse, sauf cas


particulier que nous précisons maintenant.

30
Coefficient de Corrélation de Pearson
Propriétés:
3. Lorsque le couple de variables (X, Y) suit une loi normale bi-variée, et
uniquement dans ce cas, nous avons l'équivalence r = 0 ⇔ X et Y sont
indépendants. Dans ce cas, le coefficient de corrélation caractérise parfaitement
la liaison entre X et Y . Dans les autres cas, le coefficient de corrélation constitue
une mesure parmi les autres de l'intensité de la corrélation.

4. Le coefficient de corrélation constitue une mesure de l'intensité de liaison


linéaire entre 2 variables. Il peut être égal à zéro alors qu'il existe une liaison
fonctionnelle entre les variables. C'est le cas lorsque la liaison est non
monotone.

5. La corrélation d'une variable avec elle même est rxx = 1.


31
Coefficient de Corrélation de Pearson
Le coefficient de corrélation est indépendant des unités de mesure des variables,
ce qui autorise les comparaisons. La mesure est normalisée, elle est définie
entre
−1 ≤ r ≤ +1
Lorsque :

r = +1, la liaison entre X et Y est linéaire, positive et parfaite c.-à-d. la


connaissance de X nous fournit la valeur de Y (et inversement).

r = −1, la liaison est linéaire et négative.

32
Exemples Numériques
Reprenons les variables cylindrée (X) et puissance (Y) de notre fichier "voitures".
Nous détaillons les calculs dans la feuille EXCEL.

33
Exemples Numériques

34
Exemples Numériques
Nuage de points
Il y a une forte liaison linéaire entre "cylindrée" et "puissance", ce que confirme
le graphique nuage de points. On notera aussi, et le coefficient de corrélation ne
sait pas traduire ces informations, que 2 points semblent s'écarter des autres,
mais pas de la même manière :

35
Exemples Numériques
Nuage de points
- La "Lancia K 3.0 LS" est une grosse cylindrée, très puissante. Elle s'écarte du
nuage certes, mais elle est dans la lignée de la liaison entre les deux variables.
- La "Hyundai Sonata 3000" est aussi une grosse cylindrée, mais elle est
relativement anémique. Le point est un peu à l'écart des autres, tout comme la
Lancia, mais elle ne respecte pas, apparemment, l'apparente liaison (visuelle et
numérique) entre cylindrée et puissance. Si on retire cette observation, la
corrélation est renforcée, elle passe à 0.9635.

36
Exemples Numériques
Influence des valeurs aberrantes sur une corrélation

37
Exemples Numériques
Comparaison de coefficients de corrélation.

Maintenant, nous pouvons comparer les coecients de corrélation calculés sur


différentes variables. Reprenons notre exemple des voitures, calculons le
coefficient de corrélation de consommation avec les autres variables, nous
obtenons respectivement : cylindrée = 0.892, puissance = 0.888 et poids = 0.926.

La variable "consommation" est singulièrement corrélée avec l'ensemble des


variables. Le lien avec poids semble plus élevé que le lien avec puissance. Mais
sans l'arsenal de l'inférence statistique, nous ne pouvons pas affirmer s'il est
significativement plus élevé que les autres.

38
Causalité
On soutient généralement qu'une corrélation ne prouve pas la causalité. Le fait
que deux variables soient liées l'une à l'autre n'est pas une raison de dire autre
chose que le fait qu'elles sont liées. L'analyse statistique est fondamentalement
incapable de prouver qu'une variable a influencé directement l'autre variable.

Les questions telles que celle de savoir si une variable a affecté l'autre sont
traitées principalement par la nature de votre conception de recherche et non
par l'analyse statistique en tant que telle.

De manière conventionnelle, les chercheurs se sont tournés vers des expériences


dans lesquelles les variables pouvaient être systématiquement manipulées par le
chercheur afin de pouvoir renforcer leur confiance en faisant des interprétations
causales sur les relations entre les variables.

39
Causalité
Il existe cependant toute une gamme de problèmes statistiques où l'on s'intéresse
à la relation entre plusieurs variables.

Exemples:
Les individus les plus grands sont-ils les plus lourds ?
Le revenu d'une famille a-t-il une influence sur les résultats scolaires des enfants ?
Y a-t-il une relation entre le tabagisme et les cancers du poumon ?
Le rendement en céréales dépend-il de la quantité d'engrais utilisée ?
La productivité d'une entreprise est-elle liée au salaire des ouvriers ou employés ?
Dans ces questions, nous désirons savoir si le comportement d'une variable est
influencé par la valeur d'une autre variable:
Source: http://www.astro.ulg.ac.be/cours/magain/STAT/Stat_Main_Fr/Chapitre7.html 40
Causalité

La relation peut être causale ou non.

41
Causalité
Exemple:

Relation entre la taille et le poids des individus.

Pour chaque individu de l'échantillon, on porte sur un graphique:

sa taille en abscisse

son poids en ordonnée

chaque individu est donc, dans ce graphique, représenté par un point (point
représentatif).

42
Causalité
Exemple:
Soit un individu mesurant 172 cm et pesant 66 kg:

43
Causalité
Exemple:
Dans le graphe, il y aura donc autant de points qu'il y a d'individus dans
l'échantillon.

44
Causalité
Exemple:
Relation entre le poids et la taille dans un échantillon de 30 individus:

On peut (par la pensée ou réellement) tracer une droite qui passe au mieux par
ces points (au milieu du "nuage" de points).

Si cette droite "monte", on dira qu'il y a corrélation positive entre les deux
variables.

Si elle "descend", c'est une corrélation négative.

Si elle est "horizontale", ou si on ne peut pas décider, c'est qu'il y a absence de


corrélation.
45
Corrélation

46
Corrélation

47
Corrélation

48
Corrélation

49
Corrélation

50
Corrélation

51
Corrélation

52
Corrélation
a) r=0,60

b) r=1,00

c) r=-0,80

d) r=-1,00

e) r=0,00

f) r=0,00

53
Corrélation
Corrélation entre le poids et la taille pour les garçons de 2ème candidature
communication (1998).

On constate une augmentation du


poids avec la taille (corrélation
positive): les garçons les plus grands
sont généralement les plus lourds.

Mais la dispersion des points est


assez grande: la corrélation est assez
faible.

54
Corrélation
Corrélation entre le poids et la taille pour les filles de 2ème candidature
communication (1998).

On ne constate pas de relation entre


du poids et la taille (abscence de
corrélation): le poids des filles est
pratiquement indépendant de leur
taille.

(les filles les plus grandes sont donc


les plus minces)

55
Exemple: Peur du Crime et Confiance dans la Police
Nos données pour ce calcul proviennent de scores mesurant la relation entre la
peur du crime et la confiance dans la police.
Il est toujours judicieux de dessiner le scattergramme pour tout coefficient de
corrélation que vous calculez. Pour ces données, le scattergramme sera comme
la figure. Notez que la pente du scattergramme est négative, comme on aurait
pu le déduire de la tendance de ceux qui obtiennent un score élevé au
questionnaire sur la peur du crime à avoir de faibles scores de confiance dans
l'enquête policière.
Vous pouvez également voir non seulement qu'une ligne droite est un très bon
moyen de décrire les tendances des points sur le diagramme de dispersion, mais
que les points correspondent raisonnablement bien à la ligne droite. Il faut donc
s'attendre à une corrélation négative assez élevée du coefficient de corrélation.
Source: Norris, G., Qureshi, F., Howitt, D. and Cramer, D. (2013). Introduction to Statistics with SPSS for Social Sciences. 56
Exemple: Peur du Crime et Confiance dans la Police

57
Exemple: Peur du Crime et Confiance dans la Police

58
Exemple: Peur du Crime et Confiance dans la Police

59
Exemple: Peur du Crime et Confiance dans la Police

Les moyennes arithmétiques:


𝑛
𝑛 1
1 𝑌ത = ෍ 𝑌𝑖
𝑋ത = ෍ 𝑋𝑖 𝑛
𝑛 𝑖=1
𝑖=1

8+3+9+7+2+3+9+8+6+7
2+6+4+5+7+7+2+3+5+4 𝑌ത =
𝑋ത = 10
10
62

45 𝑌ത =
𝑋= 10
10
𝑌ത = 6,2
𝑋ത = 4,5

60
Exemple: Peur du Crime et Confiance dans la Police

ഥ )(𝒀 − 𝒀
= σ(𝑿 − 𝑿 ഥ)
= 2 − 4,5 ∗ (8 − 6,2) + 6 − 4,5 ∗ (3 − 6,2) + 4 − 4,5 ∗ (9 − 6,2) + 5 − 4,5 ∗ (7 − 6,2) +
7 − 4,5 ∗ (2 − 6,2) + 7 − 4,5 ∗ (3 − 6,2) + 2 − 4,5 ∗ (9 − 6,2) + 3 − 4,5 ∗ (8 − 6,2) +
5 − 4,5 ∗ (6 − 6,2) + 4 − 4,5 ∗ (7 − 6,2)

= −2,5 ∗ (1,8) + 1,5 ∗ (−3,2) + −0,5 ∗ (2,8) + 0,5 ∗ (0,8) + 2,5 ∗ −4,2
+ 2,5 ∗ (−3,2) + −2,5 ∗ (2,8) + −1,5 ∗ (1,8) + 0,5 ∗ (−0,2) + −0,5 ∗ (0,8)

= −4,5 + −4,8 + −1,4 + 0,4 + −10,5 + −8 + −7 + −2,7 + −0,1 + −0,4

ഥ )(𝒀 − 𝒀
෍(𝑿 − 𝑿 ഥ ) = −39
61
Exemple: Peur du Crime et Confiance dans la Police

Les Ecart-Types:

(2 − 4,5)2 +(6 − 4,5)2 +(4 − 4,5)2 +(5 − 4,5)2 +(7 − 4,5)2 +(7 − 4,5)2 +(2 − 4,5)2 +(3 − 4,5)2 +(5 − 4,5)2 +(4 − 4,5)2
𝑆𝑋 =
10 − 1

(6,25) + (2,25) + (0,25) + (0,25) + (6,25) + (6,25) + (6,25) + (2,25) + (0,25) + (0,25)
𝑆𝑋 =
9

30,5
𝑆𝑋 = = 3,38889 = 1,840894
9
62
Exemple: Peur du Crime et Confiance dans la Police

Les Ecart-Types:

(8 − 6,2)2 +(3 − 6,2)2 +(9 − 6,2)2 +(7 − 6,2)2 +(2 − 6,2)2 +(3 − 6,2)2 +(9 − 6,2)2 +(8 − 6,2)2 +(6 − 6,2)2 +(7 − 6,2)2 +
𝑆𝑌 =
10 − 1

(3,24) + (10,24) + (7,84) + (0,64) + (17,64) + (10,24) + (7,84) + (3,24) + (0,04) + (0,64)
𝑆𝑌 =
9

61,6
𝑆𝑌 = = 6,877777 = 2,616189
9
63
Exemple: Peur du Crime et Confiance dans la Police

1
∗(−39)
10−1
r=
(1,840894)∗(2,616189)

1
∗(−39)
9
r=
4,816127

r= −0,89975
64
Exemple: Peur du Crime et Confiance dans la Police
Interprétation du résultat:

Ainsi, la valeur obtenue pour le coefficient de corrélation est égale à −0,90. Cette
valeur est conforme à ce que nous avons suggéré à propos du scattergramme qui
sert de vérification approximative à notre calcul. Il existe une relation négative
très importante entre la peur du crime et la confiance dans la police.

En d'autres termes, les personnes qui avaient le plus peur du crime avaient le
moins confiance en la police, et vice versa. On ne prétend pas qu’ils ont peur du
crime parce qu’ils n’ont pas confiance en la police, mais simplement qu’il existe
une association inverse entre les deux.

65
Exemple: Peur du Crime et Confiance dans la Police
Communication des résultats:

Nous écrivions quelque chose comme: «Il a été constaté que la peur du crime
était inversement liée à la confiance dans la police. Le coefficient de corrélation de
Pearson était de - 0,90, ce qui est statistiquement significatif au niveau de 5% avec
une taille d'échantillon de 10.

Remarque: Normalement, lors de la déclaration d'un coefficient de corrélation, il


est habituel de déclarer sa signification statistique.

66
La Corrélation

1
Introduction
La corrélation statistique est une technique statistique qui s'utilise pour voir si
deux variables sont liées.

Par exemple, considérez le revenu et les dépenses d'une famille comme variables.
Il est bien connu que l'augmentation ou la diminution des revenus et des
dépenses, se passent au même temps. Ainsi, ils sont liés tous les deux dans le sens
où le changement dans une de ces deux variables est accompagné d'un
changement dans l'autre variable.

Encore une fois des prix et de la demande de produits sont des variables
connexes; lorsque la demande des hausses de prix ont tendance à diminue et vice
versa.

Source: https://explorable.com/fr/la-correlation-statistique 2
Introduction
Si le changement dans une variable est accompagnée d'un changement dans
l'autre, puis les variables sont dites d'être corrélées. Nous pouvons donc dire que
le revenu familial et les dépenses, - le prix et la demande- sont corrélés.

Relation entre les variables:

La corrélation peut vous dire quelque chose au sujet de la relation entre les
variables. Il est utilisé pour comprendre:

- si la relation est positive ou négative


- la force de la relation.

La corrélation est un outil puissant qui fournit ces éléments d'information


essentiels.
3
Introduction
Dans le cas de revenus et les dépenses de la famille, il est facile de voir qu'ils
évoluent en augmentant ou tombant ensemble dans la même direction. C'est ce
qu'on appelle une corrélation positive.

Dans le cas du prix et de la demande, le changement se produit dans la direction


opposée de façon que si une augmentation se produit dans une variable, elle est
accompagné par une diminution de l'autre. C'est ce qu'on appelle une corrélation
négative.

4
Introduction
Coefficient de Corrélation

La corrélation statistique est mesurée par ce qu'on appelle le Le coefficient de


corrélation (r). Sa valeur numérique varie de 1,0 à -1,0. Cela nous donne une
indication de la force de la relation.

En général, r> 0 indique une relation positive, r <0 indique une relation négative
tandis que r = 0 indique l'absence de relation (ou que les variables sont
indépendantes et non liées). Ici, r = +1,0 décrit une corrélation positive parfaite et
r = -1,0 décrit une corrélation négative parfaite.

Si les coefficients sont plus proche de +1,0 et -1,0, plus grande est la force de la
relation entre les variables.

5
Introduction
Coefficient de Corrélation

En règle générale, les lignes directrices suivantes sur la force de la relation sont
souvent utiles (bien que de nombreux experts sont plutôt en désaccord sur le
choix des limites).

Valeur de r Force de la relation


-1,0 À -0,5 ou 1,0 à 0,5 Fort
-0,5 À -0,3 ou 0,3 à 0,5 Modéré
-0,3 À -0,1 ou 0,1 à 0,3 Faible
-0,1 À 0,1 Absente ou très faible

6
Introduction
La corrélation est seulement approprié pour examiner la relation entre les
données significatives quantifiables (par exemple l'air sous pression, température)
plutôt que des données catégoriques tels que le sexe, la couleur préférée, etc.

7
Introduction
Inconvénients
Alors que 'r' (coefficient de corrélation) est un outil puissant, il doit être manipulé
avec soin.

- Les coefficients de corrélation les plus utilisés ne mesurent relation linéaire. Il est
donc parfaitement possible que s'il existe une forte relation non linéaire entre les
variables, r est proche de 0 ou même est 0. Dans un tel cas, un diagramme de
dispersion peut grossièrement indiquer l'existence ou non d'une relation non
linéaire.

- Il faut être prudent dans l'interprétation de la valeur de «r». Par exemple, on


pourrait calculer «r» entre la taille de la chaussure et de l'intelligence des
individus, des hauteurs et des revenus. Indépendamment de la valeur de «r», cela
n'a aucun sens et est donc appelée corrélation hasard ou sans-sens.
8
Introduction
Inconvénients
Alors que 'r' (coefficient de corrélation) est un outil puissant, il doit être manipulé
avec soin.

- «R» ne doit pas être utilisé pour dire quelque chose à propos de relation de
cause à effet. Autrement dit, en examinant la valeur de «r», on pourrait conclure
que les variables X et Y sont liées. Cependant, la même valeur de «r» ne nous dit
pas si X influences Y ou l'inverse. Corrélation statistique ne doit pas être le
principal outil utilisé pour étudier la causalité, à cause du problème avec des
tierces variables.

9
Corrélation et Causalité
Corrélation et causalité, étroitement liée à des facteurs de confusion, est
l'hypothèse erronée que parce quelques choses se corrélées, il ya une relation de
cause à effet.

La causalité est le domaine des statistiques qui est le plus souvent mal utilisé, et
mal interprété par des non-spécialistes. Des sources médiatiques, des politiciens
et des groupes de pression souvent sautent sur une corrélation perçue, et
l'utilisent pour «prouver» leurs propres croyances. Ils ne comprennent pas que,
simplement parce que les résultats montrent une corrélation, il n'existe aucune
preuve d'un lien de causalité sous-jacente.

Beaucoup de gens pensent que parce qu'un sondage ou une statistique, contient
beaucoup de nombres, il doit être scientifique, et donc correcte.

Source: https://explorable.com/fr/corr%C3%A9lation-et-causalit%C3%A9 10
Corrélation et Causalité
Les modèles de causalité dans l'esprit

Malheureusement, l'esprit humain est construit pour essayer inconsciemment


établir des liens entre de nombreuses pièces contrastées de l'information. Le
cerveau essaie souvent de construire des modèles qui viennent de l'hasard, et
donc il saute aux conclusions, et suppose qu'il existe une relation.

Surmonter cette tendance s'inscrit dans le cadre de la formation académique des


étudiants et des universitaires dans la plupart des domaines, de la physique à l'art.
La capacité d'évaluer objectivement les données, est absolument essentielle à la
réussite scolaire.

11
Corrélation et Causalité: un exemple
La meilleure façon de voir l'abus de corrélation et causalité est de regarder un
exemple précis:

Une enquête, tel que rapporté dans un journal britannique, consistait à interroger
un groupe d'adolescents sur leur comportement, et déterminer si leurs parents
fument. Le journal a rapporté, en effet, que les enfants dont les parents fument
sont plus susceptibles de manifester des comportements délinquants.

Les résultats semblent montrer une corrélation entre les deux variables, de sorte
que le papier imprimé le titre: «Le tabagisme parental entraîne les enfants à mal
se conduire." Le professeur chargé de l'enquête a déclaré que les paquets de
cigarettes doivent porter des alertes aux questions sociales, aux côtés des
avertissements de santé importants.

12
Corrélation et Causalité: un exemple
Cependant, il y a un certain nombre de problèmes avec cette hypothèse. La
première est que les corrélations peuvent souvent fonctionner en sens inverse.
Par exemple, il est parfaitement possible que les parents fument à cause du stress
de s'occuper d'enfants délinquants.

Une autre cause peut être que la classe sociale provoque la corrélation, les classes
inférieures sont généralement plus susceptibles de fumer, et sont plus
susceptibles d'avoir des enfants délinquants. Par conséquent, le tabagisme des
parents et de la délinquance sont à la fois les symptômes du problème de la
pauvreté, et pourrait bien avoir aucun lien direct entre eux.

13
Corrélation et Causalité: un exemple
Préjudgés Émotives Influences causalité

Cet exemple met en évidence une autre raison derrière les erreurs de corrélation
et causalité, parce que le professeur était fortement anti-tabac. Il a été l'espoir de
trouver un lien qui appuierait son propre jugement. Cela ne veut pas dire que ses
résultats étaient inutiles, car ils ont montré qu'il ya une cause profonde des
problèmes de délinquance et de la probabilité de fumer. Ceci, cependant, n'est
pas la même chose qu'une relation de cause à effet, et il a permis à ses émotions
obscurcir son jugement. Le tabagisme est un sujet très émotif, mais les
universitaires doivent rester à l'écart et sans biais si la validité interne est de rester
intact.

14
Exemple 1 : Longueur de la tige d'une fleur et longueur de ses pétales

Source: http://svt4vr.e-monsite.com/pages/6eme/colonisation-
plante/la-formation-des-graines.html

Source: https://fr.khanacademy.org/math/be-5eme-secondaire2h2/x741278364a599ec1:statistiques/x741278364a599ec1:nuage-de-points-et-correlation/a/constructing-
and-interpreting-a-scatterplot. 15
Exemple 1 : Longueur de la tige d'une fleur et longueur de ses pétales

Question 1) Représenter les données à l'aide d'un nuage de points.

16
Exemple 1 : Longueur de la tige d'une fleur et longueur de ses pétales

Question 1) Voici le nuage de points:

17
Exemple 1 : Longueur de la tige d'une fleur et longueur de ses pétales

Question 2) Que peut-on dire de la relation entre la longueur de la tige et la longueur des pétales de ses fleurs ?

18
Exemple 1 : Longueur de la tige d'une fleur et longueur de ses pétales

Question 2) Que peut-on dire de la relation entre la longueur de la tige et la longueur des pétales de ses fleurs ?

19
Exemple 1 : Longueur de la tige d'une fleur et longueur de ses pétales

Question 3) Quelle est la phrase vraie ?

20
Exemple 1 : Longueur de la tige d'une fleur et longueur de ses pétales

Question 3) Quelle est la phrase vraie ?

21
Exemple 2 : Âge d'un conducteur et nombre d'accidents

22
Exemple 2 : Âge d'un conducteur et nombre d'accidents

23
Exemple 2 : Âge d'un conducteur et nombre d'accidents

24
Exemple 2 : Âge d'un conducteur et nombre d'accidents

25
Exemple 2 : Âge d'un conducteur et nombre d'accidents

26
Exemple 3 : Pointure et note au contrôle de maths

Pointure: Nombre qui indique la dimension des chaussures, des chapeaux, des gants. 27
Exemple 3 : Pointure et note au contrôle de maths

28
Exemple 3 : Pointure et note au contrôle de maths

29
Exemple 3 : Pointure et note au contrôle de maths

30
Exemple 3 : Pointure et note au contrôle de maths

31
Exemple 4
Robin a noté pendant six jours la durée, en minutes, de sa méditation du soir
et son nombre d'heures de sommeil.

32
Exemple 4

33
Exemple 5

34
Exemple 5

35
Exemple 6

36
Exemple 6

37
Exemple 7

38
Exemple 7

39
Exemple 8
Supposons un échantillon aléatoire de 4 firmes pharmaceutiques présentant
les dépenses de recherche X et les profits Y suivants (en millions de dollars)

Source: http://www.astro.ulg.ac.be/cours/magain/STAT/Stat_Main_Fr/Chapitre7.html 40
Exemple 8

Les moyennes arithmétiques:


𝑛
𝑛 1
1 𝑌ത = ෍ 𝑌𝑖
𝑋ത = ෍ 𝑋𝑖 𝑛
𝑛 𝑖=1
𝑖=1

50 + 60 + 40 + 50
40 + 40 + 30 + 50 𝑌ത =

𝑋= 4
4
200
160 𝑌ത =
𝑋ത = 4
4
𝑌ത = 50
𝑋ത = 40

41
Exemple 8

ഥ )(𝒀 − 𝒀
= σ(𝑿 − 𝑿 ഥ)
= 40 − 40 ∗ (50 − 50) + 40 − 40 ∗ (60 − 50) + 30 − 40 ∗ (40 − 50) + 50 − 40 ∗ (50 − 50)

= 0 + 0 + −10 ∗ (−10) + 0

= +100

ഥ )(𝒀 − 𝒀
෍(𝑿 − 𝑿 ഥ ) = 100

42
Exemple 8

Les Ecart-Types:

(40 − 40)2 +(40 − 40)2 +(30 − 40)2 +(50 − 40)2


𝑆𝑋 =
4−1

(0) + (0) + (100) + (100)


𝑆𝑋 =
3

200
𝑆𝑋 = = 66,7 = 8,167
3
43
Exemple 8

Les Ecart-Types:

(50 − 50)2 +(60 − 50)2 +(40 − 50)2 +(50 − 50)2


𝑆𝑌 =
4−1

(0) + (100) + (100) + (0)


𝑆𝑌 =
3

200
𝑆𝑌 = = 66,7 = 8,167
3
44
Exemple 8

1
∗(100)
4−1
r=
(8,167)∗(8,167) La corrélation est positive et de qualité moyenne.
1
∗(100)
3
r=
66,7

r= 0,499 = 0,50

45
Exemple 8

46
Exemple 8

𝑋ത = 40 𝑌ത = 50

47
Exemple 9
Pointure des chaussures (X) et quotient intellectuel (Y) de 10 enfants d'âge
scolaire

Pour illustrer l'usage de ces coefficients, on partira de l'exemple (fictif) d'une


étude de psychosociobiologie visant à examiner s'il existe une relation entre la
taille des pieds des enfants et leur intelligence. Partant d'un échantillon de 10
enfants (notés A, B, ...J) on examinera s'il existe une corrélation, linéaire ou non,
entre la pointure de leurs chaussures (X) et leur quotient intellectuel (Y). Les
données de l'analyse sont rassemblées dans le tableau, ci-dessous

Source: http://grasland.script.univ-paris-diderot.fr/STAT98/stat98_6/stat98_6.htm 48
Exemple 9

49
Exemple 9

On se propose d'examiner s'il existe une relation entre la capacité à épeler et la taille
des pieds : il y a quatre réponses possibles :
- plus la taille des pieds est importante, plus la capacité à épeler est importante
(RELATION POSITIVE)
- plus la taille des pieds est importante, moins la capacité à épeler est important
(RELATION NEGATIVE)
- la taille des pieds est liée au quotient intellectuel par une relation complexe
comportant au moins un maximum et un minimum (RELATION NON MONOTONE)
- la taille des pieds n'est pas liée à la capacité à épeler (RELATION NULLE)

50
Exemple 9

51
Exemple 9

52
Exemple 9
La covariance de X et Y étant égal à 64.1, on obtient le coefficient de corrélation
de X et de Y en divisant la covariance par le produit de l'écart-type de X et de
l'écart-type de Y :
r(X,Y) = 64.1 / (2.4 * 32) = +0.83

Nous sommes en présence d'une corrélation positive forte, qui semble indiquer
qu'il existe une relation linéaire (de type Y=aX+b) reliant le quotient intellectuel
des enfants et la taille de leurs pieds.

Toutefois, le coefficient de corrélation ne nous indique pas (1) si la relation


observée est significative (fruit du hasard ou non) et (2) si elle correspond à
une relation de cause à effet entre les deux facteurs X et Y étudiés. De plus,
l'importance de la corrélation linéaire ne préjuge pas de l'existence d'un
meilleur ajustement, qui serait quant à lui de type non-linéaire.
53

Vous aimerez peut-être aussi