Vous êtes sur la page 1sur 130

Département de Mathématiques | Option : Module M233, S3

Faculté des Science et Technique Mohammedia

Comment accéder à l’essentiel en statistique


« Bio-Stat »
Génie Minéral

Section : par : Radouan Morchadi


The Winers morchadi@hotmail.com

2016/2017
«Un but dans la vie est la
seule richesse qui mérite d’être
trouvée.»
• « Quelqu’un à aimer;
• Un objectif à réaliser;
• Un but à visualiser. »
La clé c’est planifier
« Mieux comprendre » et « Mieux
résoudre ». n’est pas toujours évident.
Sauf lorsqu’on a la chance d’avoir des
fiches de révisions claires, complètes et
pratiques comme celles que je vous
propose !, elles n’ont qu’un seul
objectif : vous aider à réussir
Au Menu Projet de fin d’études

Statistiques Descriptives Uni-varié


Tableaux et Graphiques
Paramètre de positions et de Dispersions

Statistiques Descriptives Bi-varié


Table de contingence et Nuage de points
Distributions marginales et Conditionnelles
Ajustement linéaire
Modèles paramétriques
Calcul de probabilités
Variables aléatoires Discrètes et Continues
INTRODUCTION The Winers

Les études statistiques envahissent notre vie

Qu’est ce
que les ?
Statistiques Résumer des
Présenter et décrire données Faire des prévision à partir
souvent très d’un échantillon et prendre
des décisions
nombreuses
The Winers

Les 2 aspects de la statistique


A savoir ?

Descriptives
Inférentielle
Vocabulaires de Base

Toute étude statistique Passe par:


Vocabulaires de Base

Echantillon Pourquoi ?
Vocabulaires de Base

Important Faire la différence entre :

Recensement : enquête dans laquelle les


observations (mesures, questions…) portent sur
la population entière.

Sondage : enquête dans laquelle les observations


portent sur un échantillon de la population.
Vocabulaires de Base

Etude de Séries
statistiques On distingue 4 types de
variables:

Measurable Non measurable


Vocabulaires de Base

Etude de Séries Pourquoi regrouper une série


statistiques discrète en classes?

Dans le cas d’un caractère quantitatif discret, lorsque le


nombre des modalités est élevé (supérieur à 15), pour faciliter
l’étude et l’interprétation, on est amené à regrouper les
valeurs en « classes », rassemblant chacune des individus
présentant des caractères similaires. les nouvelles modalités
étant les différentes classes (regroupées).
Réalisation de l’étude statistique
Revenir à la
population
Estimations Inférentielle
Statistique
et prévisions
descriptive
Population Echantillonnage
MERE
Que faire pour étudier une série statistique

Tableaux Diagrammes Courbes cumulatives


Ils facilitent donc l’analyse des données
Selon le type du caractère, on utilise
différentes représentations graphiques
Qualitatif nominal
A bandes
En secteur
ou
Camembert
Qualitatif Ordinal

A bande
Calcul de l’angle en degré:
𝒏𝒊
𝜶𝒊 = * 360 = 𝒇𝒊 * 360
𝑵
Diagramme à bande
Exemple
Graphique en bâtons ou en
tiges

Courbe cumulative en
escalier
Discrète
Polygone : relier les
têtes des tiges
Graphique histogramme

Courbe cumulative
Discrète continue
regroupée Continue
Polygone : relier les
milieux des côtes hautes
des rectangles
Traitement de séries statistique peut se faire par des logiciels

Traitement
Brin de calcul

A vos maths prêt partez


Série statistique Nominale
1- Tableau 2- Information résumée

Noms Couleur des yeux Modalités Effectifs Fréquences %


M. Alberro Vert
M. Hondarrague Noir Bleu 60 0,200 20,0
Mme Claverotte Noir Noir 160 0,533 53,3
Melle Lopez Noisette
M. Paulien Bleu Noisette 40 0,133 13,3
M. Guillou Noir Vert 40 0,133 13,3
M. Lahitette Noisette
Mme Vigouroux Noir
Total : 300 1 100
Melle Maleig Bleu
M. Duclos Vert
M. Carricaburu Bleu
Mme Vidal Noir
…. ….
Ce qu’on peut faire
Modalités Effectifs Fréquences % Modalités Effectifs Fréquences %
Bleu 60 0.200 20,0
modalité 1 n1 f1= n1/n f1×100 Noir 160 0,533 53,3
Noisette 40 0,133 13,3
… … … Vert 40 0,133 13,3
modalité i ni fi= ni/n fi ×100 Total : 300 1 100

… … …
modalité k nk fk= nk/n f k ×100
Total :  n i = n  fi =1 100
Graphique
Diagramme circulaire ou camembert
180
160
Vert 160
Bleu
13% 140
20%
120
100
Noisette
80
13% 60
60
40 40
40
20

0
Bleu Noir Noisette Vert

Noir
54%

𝜶𝒊 = 𝒇𝒊 * 360 (180 ou 90)


Série statistique Ordinale
1- Tableau

130 personnes ont été interrogées sur leur addiction au


chocolat
Modalités Effectifs = Nombre de personnes
Pas du tout (A) 10
Un peu (B) 25
Beaucoup (C) 40
Passionnément (D) 32
A la folie (E) 23

Les modalités sont présentées dans un


ordre logique
Ce qu’on peut faire
45

Modalités Effectifs Fréquences % 40

35
40

32

modalité 1 n1 f1= n1/n f1×100 30

25
25
23

… … …
20

15
10
10

modalité i ni fi= ni/n fi ×100 5

… … … A B C D E

modalité k nk fk= nk/n f k ×100


Total :  n i = n  fi =1 100
Série statistique Discrète
1- Tableau Illustration

Nbre de produits financiers Effectif Fréquence


xi ni fi
0 103 0,286
1 115 0,319
2 95 0,264
3 35 0,097
4 10 0,028 Nombre de chats
5 2 0,006
Ce qu’on peut faire

Valeurs de la Effectif Effectifs cumulés Effectifs cumulés


variable croissants décroissants
xi ni Ni N’i
x1 n1 N1= n1 N’1= nk+ ….+ n1= n
x2 n2 N2= n1+ n2 N’2= nk+ ….+ n2
x3 n3 N3= n1+ n2+ n3 N’3= nk+ ….+ n3
… … …. ….
xk-1 nk-1 Nk-1= n1+ ….+ nk-1 N’k-1= nk+ nk-1
xk nk Nk= n1+ ….+ nk= n N’k= nk
Total : n
Interprétation de la fréquence cumulée
Graphique –diagramme en bâton-

Diagramme en bâtons
140

120

100

80

60

40

20

0
0 1 2 3 4 5 6
Graphique- Polygone-
Graphique-Courbe cumulative en escalier-
Courbe des fréquences cumulées

100

90

80

70

60

50

40

30

20

10

0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Graphique-Courbe cumulative en escalier-
Série statistique Continue
1- Tableau
Augmentation Effectif
(€)
0 257
18 38 10 35 0 4 1 318
2 255
4 11 27 2 41 16 3 307
2 25 43 22 26 11 Après comptage 4 308
5 159
34 34 1 28 5 5 on obtient 6 140
7 84
21 0 2 30 1 8 8 72
9 55
9 37 22 39 11 0 10 22
36 16 6 42 42 1 11 13
12 9
8 33 31 33 4 4 13 7
14 8
9 19 15 2 21 0 15 21
12 18 …. …. …. …. 16
17
6
2
….. ….
Total 2125
Série statistique Continue
1- Tableau regroupée Illustration

Augmentation (€) Effectifs


[0 – 3[ 830 Classes Effectifs
[3 – 5[ 615 [e1 – e2[ n1
[5 – 10[ 510 [e2 – e3[ n2
[10 – 20[ 92 …. ….
[20 – 30[ 63 [ek – ek+1[ nk
[30 – 50[ 15
Remarque : Il est préférable de prendre des
classes d’amplitudes égales. Exp: Taille d’une
personne
Ce qu’il faut savoir sur la prése

Une série continue ou discrète regroupée en classes


s’illustre comme
Cequ ’il faut savoir sur la classe

Borne inférieure Borne supérieure


A quoi faut –il faire attention

Aux amplitudes des classes

Amplitudes égales:
facile
Amplitudes différentes: passer aux effectifs
et fréquences courrigés
Qu’est ce que effectif ou fréquence
corrigé

Effectif de la classe
𝑒𝑓𝑓𝑒𝑐𝑡𝑖𝑓 𝒄𝒐𝒓𝒓𝒊𝒈é
𝐴𝑚𝑝𝑙𝑖𝑜𝑡𝑢𝑑𝑒 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑠𝑒

Se dit densité d’effectif ou densité de fréquence


Graphique –diagramme est un histogramme-

Ensemble de rectangles contigus dont la base est l’amplitude


de la classe
et dont la hauteur est à définir selon la nature
des amplitudes des classes
Un histogramme
Comment faire pour calculer la hauteur du
rectangle relative à une classe

𝑓𝑖
ℎ𝑖 𝐶 ∗
𝑎𝑖
𝑪 = PGCD{𝒂𝒊 }
Plus grand diviseur commun des amplitudes des classes
Sur l’exemple
Classes Effectifs Amplitude Effectifs
ni ai rectifiés
ni /ai
[0 – 3[ 830 3 276,7
[3 – 5[ 615 2 307,5
[5 – 10[ 510 5 102,0
[10 – 20 [ 92 10 9,2
[20 – 30[ 63 10 6,3
[30 – 50[ 15 20 0,75
Graphique- Polygone-
Graphique-Courbe cumulative continue-

Variable observée:
augmentation
moyenne mensuelle
du salaire, en €,
des employés d’une
multinationale au
cours de l’année
2015.
Interprétation
Il y a 1445 employés dont l’augmentation est strictement
inférieure à 5

Il y a 170 employés dont l’augmentation est supérieure ou


égale à 10

Combien y-a-t-il d’employés dont l’augmentation est


inférieure à 17 ? (Interpolation)
En général
Remarque

On passe aux effectifs cumulés en multipliant les


fréquence cumulées par l’effectif total de la population

G(x) = N* F(x)
Interpolation
Quelle est la proportion p d’employés dont l’augmentation est
inférieure à 17 € ?
Résumé
Paramètres de position

Sont dits aussi Paramètres de tendance centrale ou


de localisation,
Paramètres de position
Mode = à la mode
Le mode correspond à l'abscisse du maximum,
c.à.d. la valeur la plus fréquente
Paramètres de position
La lecture s’effectue sur le diagramme en bâtons ou
l'histogramme.
100
140 90
80
120
70
100
60
80 50
60 40
30
40
20
20
10
0 0
0 1 2 3 4 5 6
900 1400 1900 2400 2900 3500 ou plus...
Mode
Mode Classe modale
Paramètres de position

• Si la distribution présente 2 ou plus maxima


relatifs, on dit qu'elle est bimodale ou
plurimodale.
• La population est composée de plusieurs sous-
populations ayant des caractéristiques de
tendance centrale différentes.
Population Hétérogène
Paramètres de position
Paramètres de position
Si la série est continue
Paramètres de position

Le mode peut être déterminé pour tout les


caractères : Nominal, Discret, Continu
Paramètres de position
La médiane ne peut être calculer que pour une série
quantitative ordonnée croissante
Paramètres de position

La médiane ne peut être calculer


que pour une série :
 Quantitative discrète
 Quantitative continue
Paramètres de position
Pour une série discrète
Paramètres de position
Le calcul

Effectif total Impair Effectif total pair


Paramètres de position
En général
Paramètres de position
En général
Paramètres de position
A partir d’un tableau

L’effectif total de la série ordonnée est de 51

La médiane est la 26 ième valeur de la série


Paramètres de position

On cumule les effectifs jusqu’ on atteigne ou dépasse le rang 26

La médiane est donc 14


Paramètres de position
Pour une série Continue
Dans ce cas de la courbe des Pourcentages Cumulés ( ou
fréquences cumulées ou celle des effectifs), la médiane est
l’abscisse du point d’intersection de la droite horizontale
𝒏
passant par 50% (0,5 ou )de l’axe des ordonnées,
𝟐
et le polygone ainsi obtenu.
Polygones des effectifs cumulés

640
600
560
520
480
440
Effectifs cumulés

400
360
320
280
240
200
160
120
80
40
0
0 4 8 12 16 20 24 28 32
Durée(h)
Paramètres de position

Le calcul se fait par interpolation

Comment se fait l’interpolation ?


 On commence tout d’abord par
déterminer la classe médiane
A partir d’un exemple
Paramètres de position
Dans le cas général
Paramètres de position

Voici mes notes de contrôles: 12; 7; 20; 14


Paramètres de position

Calcul de la moyenne arithmétique d’une série discrète


Paramètres de position

Calcul de la moyenne arithmétique d’une série continue


Comment faire la moyenne de plusieurs
populations ?

Population P1 Population P2
Effectif n1 Effectif n2
Moyenne x1 Moyennex 2

Population P = P1 P2
Effectif n = n1+ n2
Moyenne x?

n1x1 + n 2 x 2
x=
n Moyenne globale = moyenne des
moyennes
Paramètres de position
Propriétés de la moyenne
Paramètres de position
Inconvénients de la moyenne

Elle est très sensible aux valeurs « extrêmes ». Elle


est très sensible et donc peu robuste : l’ajout de
quelques valeurs aberrantes peut la
modifier sensiblement. C’est pourquoi elle
ne signifie parfois rien du tout
Paramètres de position
Coefficient d’asymétrie de Pearson
Paramètres de position
Interprétation du Coefficient d’asymétrie de Pearson

• Si : p = 0 on asymétrie parfaite
• Si p > 0 : oblique à gauche (ou étalement à
droite) = dissymétrie à droite
• Si p < 0 : oblique à droite (ou étalement à
gauche) = dissymétrie à gauche
Paramètres de dispersion

En quoi la dispersion est –elle importante


!!!!
Paramètres de dispersion

L’étendue
e = Maximum (X) - Minimum (X)

l’écart entre la plus grande et la plus petite valeur


observée d’une série statistique quantitative.

Très sensible aux valeurs extrêmes


Paramètres de dispersion

Les Quartiles
Afin de diminuer l'influence des valeurs
extrêmes on partage la longueur de la série en
4,
Les quartiles permettent de séparer une série
statistique (ordonnée croissante) en quatre
groupes de même effectif (à une unité près).
Paramètres de dispersion

Les Quartiles

On appelle intervalle


interquartile l'intervalle [Q1 ; Q3].

On appelle écart interquartile l'amplitude de


l'intervalle [Q1; Q3], c'est-à-dire le nombre
Q3 – Q1
Paramètres de dispersion

Les Quartiles
Paramètres de dispersion
Les Quartiles 𝑄1 et 𝑄3 - Discret-
On commence par ranger ses valeurs dans l’ordre
croissant. Puis …
 Cas ou n est divisible par 4
Paramètres de dispersion
Les Quartiles 𝑄1 et 𝑄3 - Discret-
 Cas ou n n’est pas divisible par 4

Q1 sera égal à xi, où i est le plus petit entier


supérieur ou égal à n/4.

 Q3 sera égal à xi, où i est le plus petit entier


supérieur ou égal à 3n/4.
Paramètres de dispersion
Les Quartiles 𝑄1 et 𝑄3 - Continu -

•Comme pour la médiane le calcul des


quartiles se fait par interpolation
•Sur le graphique qui représente les «effectifs
cumulés croissants», Q1 est le point dont
l’ordonné est
•(N/4, 0,25 ou 25%)
En utilisant la courbe cumulative
Paramètres de dispersion

Boite à moustache, pour visualiser et


comparer des séries statistiques
Paramètres de dispersion

La taille de la boîte représente l’étendue


la position de la médiane est un bon
indicateur de la symétrie de la distribution,
Paramètres de dispersion
Écart absolu

1
e   ni xi  x
n i
1
e'   ni xi  M e
n i
Paramètres de dispersion
La variance - V -

Vx   ni  xi   x
1
n i
2

2
x x2 2

n x  n x  n x  ...  n x
2 2 2 2

V  1 1 2 2 3
x3 p p 2

N
Paramètres de dispersion
L’écart type

 V
Paramètres de dispersion
L’écart type

La variance et l’écart-type, mesurent la


dispersion des valeurs autour de leur
moyenne

l’écart-type est exprimé avec la même


échelle que les observations
Paramètres de dispersion

Si la série est continue, alors: les


𝒙𝒊 𝒔𝒆𝒓𝒐𝒏𝒕 𝒓𝒆𝒎𝒑𝒍𝒂𝒄é𝒔 𝒑𝒂𝒓 𝒍𝒆𝒔 𝒄𝒆𝒏𝒕𝒓𝒆𝒔
𝒅𝒆𝒔 𝒄𝒍𝒂𝒔𝒔𝒆𝒔

1
V ( x) 
n
 ni(ci  x)²
Paramètres de dispersion
Traitement d’une variable discrète
Paramètres de dispersion
Traitement d’une variable regroupée en
classes
Paramètres de dispersion
Interprétation de l’écart type

Homogénéité
Paramètres de dispersion
Propriétés de la variance
Paramètres de dispersion
Propriétés de la variance
Paramètres de dispersion
A quoi faut – il faire attention
INDICES DE DISPERSION
Une perte de 10 kg a-
t-elle une variabilité plus
grande chez les sumos
que chez les danseuses
de ballet ?
Comment on Compare la
dispersion de deux séries
Les observations ne sont pas exprimées dans la
même unité (par exemple des euros et des dollars)

0n utilise le rapport suivant, appelé


« coefficient de variation » :
Le coefficient de variation

On l’exprime souvent en pourcentage.


Plus grand est le coefficient de variation, plus
grande est la dispersion.
Comment utiliser le coefficient
de variations

On désire comparer les distributions


(groupées) des bénéfices nets hebdomadaires
en euros de 2 magasins, sur 100 semaines
comprenant toutes 6 jours d'ouverture.
Remarque
Mais, en y regardant de plus près

Une perte ou un gain de 1000 euros, n'a pas le même


impact pour le premier magasin (pour lequel le bénéfice
hebdomadaire moyen n'est que de 2900 euros) que
pour le second (pour lequel le bénéfice hebdomadaire
moyen s'élève à 13000 euros)
La solution est donnée par le
coefficient de variation

Plus le coefficient de variation est


petit plus la variabilité est faible
Mesurer la dispersion d’une série
statistique

1. La première manière d'aborder la dispersion est simple et visuelle :


la boîte à moustaches est toujours très utile et facile à construire.
2. La variance et l'écart-type – éventuellement complétés par le
coefficient de variation

Ces valeurs typiques doivent parfois être interprétées avec


prudence (notamment en présence de valeurs extrêmes).
MERCI
de votre attention
https://www.kartable.fr/terminale-s

http://www.youscribe.com/page/mediane

Vous aimerez peut-être aussi