Sopport Cours Statistiques Partie1-F Initial

Statistiques
Introduction
Ensemble des méthodes et procédés à partir desquelles
on recueille, organise, résume et analyse des données, et
qui permettent d’en tirer des conclusions et de prendre
des décision judicieuses.
Statistiques descriptives Statistiques inductives
1
Définitions
Statistique descriptive
C’est la phase analytique qui consiste à réduire les données à un
nombre limité de paramètres caractéristiques susceptibles de décrire
la série statistique.
Statistique inductive
C’est une phase qui permet de déduire des résultats obtenus sur un
échantillon afin de prendre des conclusions relatives à l’ensemble de
la population entière.
2
Quelques terminologies de la statistique
Population (univers):
Tout ensemble étudié en statistique s’appelle population. Les éléments sont
appelés individus.
Échantillon:
C’est un sous- ensemble d’une population.
Effectif : ( ni )
L’effectif est associé à une variable: c’est le nombre de fois que cette
variable se répète.
Fréquence: ( fi )
Le rapport entre l’effectif et le nombre d’effectif total.
Modalité: La valeur prise par une variable X.
3
Quelques terminologies de la statistique
Variable:
Elle est définie comme étant une quantité ou caractéristique qui peut
varier d’un individu à un autre.
Ex: taille, poids, nationalité…
Variable quantitative: Variable qualitative:

Elle prend des valeurs numériques Elle ne prend ni valeur numérique et
et peut être discrète ou continue ni un ordre naturel (ex: profession)
4
Les premiers traitement de l’information
C’est la phase initiale où il s’agit de rassembler des données, de les

regrouper et les présentés sous forme de :
- Tableaux
Ou
- Graphiques
Le tableau établit la correspondance entre deux séries de

nombres, l’une est constituée par les valeurs de la variable
étudiée ( Modalités ), l’autre par les effectifs
correspondants ( ou d’autres : fréquences,….)
Exemples:
5
Les premiers traitement de l’information
Exemple 1:
L’équipe de contrôle de qualité d’une maison d’alimentation doit vérifier le poids d’un produit
devant être vendu en format de 20 g. Pour ce faire, on pèse le contenu de 75 pots de ce produit,
sélectionnés au hasard. On obtient la distribution suivante :
-Cette distribution est-elle celle d’une population ou celle d’un échantillon?
- Quelle est le caractère étudié? Identifier le type.
- Compléter le tableau.
Poids (en g) 19 20 21 22 23 24
Nbre de pots 1 7 31 24 11 1
Exemple 2:
On veut étudier la longueur des tiges d’acier d’un certaine production. Pour cela on a extrait
un lot dont les résultats sont donnés dans le tableau ci-dessous.
Faire une étude descriptive.
L(en mm) 115-125 125-135 135-145 145-155 155-165 165-175 175-185
Nbre de tiges 3 5 9 12 5 4 2
6
Présentations graphiques
Diagramme en bâtons (variable discrète):

Lorsque la variable est discrète, on utilise le diagramme en bâtons, tel que les
modalités sont portées sur l’axe des abscisses et les fréquences (ou effectifs) sur
l’axe des ordonnées.
Si l’on joint les sommets des bâtons, on obtient le polygone des fréquences
Histogramme (variable continue):
Histogramme est formé de bandes rectangulaires ayant la largeur de chaque
classe et dont la hauteur est proportionnelle à l’effectif de la classe considérée.
Le polygone des effectifs (fréquences) s’obtient en joignant les divers points
(ci, ni)
Diagramme circulaire (variable qualitative): i = fi*360°
7
Calcul des éléments caractéristiques d’une série statistique
C’est une phase analytique qui consiste à réduire les données à un nombre
limité de paramètres caractéristiques.
Paramètres de position Paramètres de dispersion

(moyenne, médiane…) (écart type, variance…)
Permettre de se rendre compte Préciser le degré de dispersion

sur l’ordre de grandeur de des différentes observations
l’ensemble des observations et autour d’une valeur centrale.
de localiser la zone des
fréquences maximale
8
Paramètres de position
Mode:
La valeur de la variable correspondant à l’effectif le plus grand.
Lorsqu’il s’agit de la classe on dit classe modale.
Médiane:
la valeur de la variable statistique qui partage la population en deux effectifs
égaux.
Deux méthodes sont à considérer selon qu’il s’agit de variable statistiques
discrètes ou continues.
Variable discrète- variable continue

9
Variable discrète
Représentation graphique point d’intersection des courbes cumulées f
n/2 Me
Variable continue
On cherche la classe médiane

( Voir Démonstration )
10
Les moyennes:
i) La moyenne arithmétique:
Soit une variable X x 1, x2………………, xi, xn
On appelle moyenne arithmétique le rapport:
x = 1/n∑ ni xi
ii) La moyenne géométrique:
Lorsqu’une variable croit suivant une progression géométrique.
x1 = x0*r
x2 = x1*r
g = x0 r n/2
xn = xn-1*r
11
iii) Moyenne harmonique:

Soit x (x 1……… xn) (1/x 1, 1/x2………., 1/xn)
n
H 
n 1

i 1 x i
iv) Moyenne quadratique:
x ( x 1, x2………xn) (x21, x22…………, x2n)
1 n 2
q 
n
 xi
i 1
12
Paramètres de dispersion
Les paramètres de position sont insuffisants pour caractériser complètement

une série
Ex : m1= m2 de deux séries différentes
la répartition ≠
Dev. xi – X
Ecart |xi - X|
Etendue Xmax – xmin
…………
13
Etendue :
W = X max – X min
Ecart moyen arithmétique:

C’est la moyenne arithmétique des écarts / à la X (MA)
E = 1/n ∑ ni |xi - X|
Variance V :
C’est la moyenne arithmétique des carrées des écarts / X (MA)
Écart- type  :
L’écart type (ou écart quadratique moyen = rms) est la √V
 = √V
14
Covariance:
Cov(X,Y) = 1/n ∑ (xi – X) (yi – Y)
Coefficient de variation CV :
CV = s/X *100
- CV donne une très bonne idée sur le degré d’homogénéité
d’une distribution statistique ( CV < 15%).
- Comparaison de deux distribution.
15
Ajustement linéaire & corrélation
Cas générale:
L’ajustement du nuage obtenu consiste à déterminer une fonction de liaison
entre X & Y.
y = ax + b ou y = a ebx
16
y= a log x + b
17
Y= a/x+ b
18
D’une manière générale, l’ajustement consiste à rechercher une fonction

f(x) dont la graphe se rapproche le plus possible des points du
digramme.
On a toujours:
yi = f(xi) + εi εi = yi- f(xi)

La méthode d’ajustement consiste à déterminer les paramètres de f(x) qui
minimisent ces écarts.
i
2
  ( y f ( xi ))
2
∑ | εi| ou bien i
i i
C’est la méthode des moindres carrées

19
Droite de régression:
 y  ax 
n 2
il s’agit de déterminer a et b pour S a, b   i b soit

i
minimale. i 1
a 
x y i i
 nx y
a 
 x y  nx y
i i
 x  x 
n 2
x
2
i
 nx 2
i
i 1
La droite de régression passe par le point (x,y)
20
Cœfficient de corrélation:
Le coefficient de corrélation permet de mesurer la précision de l’ajustement
Cov  X , Y 
r X , Y  
 x y
Cas extrêmes:
r= -1 il y’a relation linéaire parfaite y=ax+b avec a<0
r= 1 il y’a relation linéaire parfaite y=ax+b avce a>0
r≠0 il n’existe aucune relation linéaire entre X&Y
21
Loi normale (loi de Laplace- Gauss)
Cette loi occupe une place privilégiée en calcul statistique.
Soit X une variable aléatoire continue. On dit que X suit une loi
normale (ou loi de Laplace- Gauss) si la densité de probabilité est :
f (x) = (1/ √2π). e-1/2 ((x- m)/)2
Tracer f(x):
m
•  définit la largeur à mi-hauteur de la courbe :
• Plus  est grand plus le max est faible et plus la courbe est large 22
Faire varier les paramètres m et 
23
Calculer : Prob ( m – x0 ≤ X ≤ m + x0 )
 l’aire de la courbe de Gauss comprise entre m- x 0 et m+ x0
m – x0 m m + x0
Changement de variable : t = (x-m)/ ( voir démonstration )
 La loi centrée réduite de paramètre m = 0 &  = 1

24
Utilisation de la table
Prob (m – x0 ≤ X ≤ m + x0) = Prob (-t0 ≤ T ≤ t0)
t 0.01 0.02 0.06 0.09

0.0
0.1
t = 1.96
1.9 0.475
3.8
3.9 0 t
25
Calculer : Prob (m – ≤ X ≤ m +  )
Prob (m – 2≤ X ≤ m + 2 )
Prob (m – 3≤ X ≤ m + 3 )
26
Loi Normale (Loi De Laplace- Gauss)
Exemple:
La taille des pièces d’une production suit une distribution N (150, 20).
Si la production journalière est de N= 1000 pièces , calculer :
1. Qu’elle est le nombre de pièces ayant une taille comprise entre 140 & 160 ?
4. Qu’elle est le nombre de pièces ayant une taille supérieure à 170 ?
5. Qu’elle est le nombre de pièces ayant une taille inférieure à 130 ?
6. Qu’elle est le nombre de pièces ayant une taille inférieure à 175 ?
7. Qu’elle est le nombre de pièces ayant une taille supérieure à 135 ?
27
Loi Binomiale
Définition
Soit une série de n épreuves successives et indépendantes ( épreuve de
Bernoulli)dont l’issue de chaque épreuve est soit « succès » avec une
probabilité p, soit « insuccès »avec une probabilité q= 1-p, alors la
probabilité d’avoir x succès en n épreuves est donnée par l’expression:
Pr ob X  x  
n x
C p q
x
n
x
B (n,p)
Conditions d’application:
• Les résultats de l’expérience ne comporte que 2 résultats possibles: succès ou insuccès
• On répète l’expérience n fois
• La probabilité de réalisation de l’événement succès est la même à chaque essai notée p.
• Les essais sont indépendantes et non exhaustifs ( ou n/N ≤ 0.10 ) .
28
Loi Binomiale
Propriétés:
Les paramètres de la loi binomiale sont n et p ( n > 0 et 0 < p < 1)
La moyenne et la variance sont: M=np & σ² = n p(1-p)
Les valeurs tabulées:
n k p
0.10 0.20 0.30 0.40 0.50
0 0.8100 0.6400 0.4900 0.3600 0.2500
2 1 0.1800 0.3200 0.4200 0.4800 0.5000
2 0.0100 0.0400 0.0900 0.1600 0.2500
0 0.7290
3 1 0.2430
2 0.0270
3 0.0010
29
Loi Binomiale
La loi binomiale permet d’évaluer la probabilité de tirer x produits
défectueux dans un échantillon de n produits provenant d’un lot important
contenant p% de défectueux.
Exemple:
Soit un lot contenant une proportion de 10% de produits défectueux.
On prélève un échantillon de 8 produits sans remise. Calculer la probabilité de
tirer dans un échantillon:
un ou zéro produit non- conforme

au moins deux produits non- conformes
Au plus un produit non- conforme
30
Loi de Poisson
Définition:
On dit qu’une variable aléatoire X suit une loi de poisson, si elle est
successible de prendre toutes les valeurs entières 0, 1, 2, 3,…..n…,
la probabilité que X soit égale à k étant:
 e
k
Pr ob X  k  

k
Conditions d’application:
La loi de poisson s’appelle encore la loi des petites probabilités. Elle est
utilisée pour présenter des phénomènes rares:nombres d’accidents,
nombre de défauts, de déchets….
Propriétés:
La moyenne et la variance sont: E(X)= λ & σ²= λ
31
Loi de Poisson
Les valeurs tabulées:
λ
K 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
0 λ
1
Pr ob X  k 
2 k
3
λ
k 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0
0
1 32
Loi de Poisson
La loi de poisson est largement utilisée pour décrire les défauts
compatibles par unité ( exemple, le nombre de ponts de soudure sur un
circuit imprimé, pannes de machines, appels téléphoniques sur une ligne,
arrivées de clients à comptoir……)
Exemple 1:
Supposons que les défauts “ pont de soudure“ sur un circuit imprimé soit
distribué selon une loi de poisson avec un paramètre λ= 2.
Calculer la probabilité qu’un circuit contienne un pont de soudure au moins.
Exemple 2:
Si la probabilité pour qu’un individu ait une mauvaise réaction d’un certain
sérum est de 0.001, déterminer la probabilité pour que sur 2000 individus :
-3
- plus de 2
aient une réaction dangereuse.
33
Echantionnage
&
Estimation
34
Echantillonnage
INTRODUCTION
L’échantillonnage a pour objectif d’étudier le lien entre la distribution
statistique d’une variable X dans une population P et les distributions de
cette variable dans différents échantillons.
Pop :
? Echantillons i : n, mi, i
N, M, 
Echantillonage aléatoire = Les individus ont même Probabilité
Exhaustif Non-exhaustif
35
Echantillonnage
Distribution des moyennes d’échantillons
Soit une Population P X N, M,  : E(X) = M &  = (X)
soient tous les Echantillons i : n ( k échantillons )
1 ( n, m1, 1)
2 ( n, m2, 2) L’ensemble :
m (m1,m2,…,mi,…..mk) constitue une
i ( n, mi, i) série statistique d’effectif k appelée
Distribution des Moyennes.
k ( n, mk, k)
36
Echantillonnage
Distribution des moyennes d’échantillons
Pop :
Echantillons i : n, mi, i
N, M, 
Non-Exhaustif Exhaustif
E(X) = M E(X) = M
  N n
 m

n  m

n N 1
37
Echantillonnage
Distribution des fréquences d’échantillons
1
Soit une Population P N X
0
p = proportions d’éléments ayant X = 1
On désigne par
q = proportions d’éléments ayant X = 0
tq : p+q=1 , 0<p<1 & 0<q<1
E(X) = p
La population P de taille est caractérisée par :
 =√ p*q
38
Echantillonnage
Soit une Population P X N, F, F : E(F) = p & F = √ p*q
soient tous les Echantillons i : n ( k échantillons )
1 ( n, f1, 1)
2 ( n, f2, 2) L’ensemble :
m (f1,f2,…,fi,…..fk) constitue une série
i ( n, fi, i) statistique d’effectif k appelée
Distribution des Fréquences.
k ( n, fk, k)
39
Echantillonnage
Pop :
Echantillons i : n, fi, i
N, F, F
Non-Exhaustif Exhaustif
E(f) = p E(f) = p
p*q N n
 m( f ) 
p*q
 m( f )  n N 1
n
40
Echantillonnage
Autres distributions d’échantillonnage
On peut définir d’autres distributions pour toutes variables susceptibles
d’être variable d’un échantillon à l’autre ( , Me, V,…..).
Distributions
N, M, 
t ²
n < 30 Ajustement d’une distribution

théorique et expérimentale
41
Echantillonnage
Distribution t:
Distribution X Loi normale N (M, )
N, M, 
soit un échantillon de taille n (n, m i, i)
mi  M
ti  Ecart Réduit
 n
42
Echantillonnage
Distribution ²
Pop :
Echantillons i : n, mi, i
N, M, 
n
 ( xij  mi ) 2
2 j 1
i 
2
La série (²1, ²2……, ²i…… ²n) constitue une distribution de ²
43
Estimation
Introduction
Si l’échantillonnage étudié les relations existants entre une population et tous
les échantillons de même taille n, l’estimation vise à étudier la représentativité
de la population par un échantillon.
IL s’agit d’attribuer une valeur à un paramètre inconnu de la population à

partir de la connaissance d’un échantillon extrait de cette population.
Il y a deux types d’estimation :

• Estimation ponctuelle : Attribuer une valeur unique
• Estimation par intervalle de confiance ( IC ) : Donner un
intervalle susceptible de recouvrir la valeur recherchée
avec une probabilité donnée.
44
Estimation
Estimation Ponctuelle
Pop : N, M,  Echantillons i : n, mi, i’
( M,  sont inconnus )
1. Estimation Ponctuelle de la moyenne : M = E(X) = m

2. Estimation Ponctuelle d’ une variance :
' n
   n 1
'
 X  n  1
3. Estimation ponctuelle d’une variance d’un échantillon ( s ) :
2 1 2
s (n  1)  ( xi  X )
45
Estimation
Estimation par Intervalle de confiance ( IC )
L’estimation par IC d’un paramètre  consiste à calculer, à partir d’un estimateur
choisi , un intervalle dans lequel il est vraisemblable que la valeur correspondante
du paramètre s’y trouve.
L’IC est défini par deux limites auxquelles est associée une certaine probabilité,
fixée à l’avance et aussi élevée qu’on désire, de contenir la valeur vraie du
paramètre inconnu :
Prob ( LI ≤  ≤ LS ) = 1 - 
Avec (1-) = Probabilité associée à
l’intervalle d’encadrer la vraie valeur 1-
/2 /2
46
Estimation
Estimation par Intervalle de confiance ( IC )
On peut écrire aussi :
Prob (  - k ≤  ≤  + k ) = 1 - 
La quantité k dépend de la distribution d’échantillonnage spécifiée de l’estimateur
et de la probabilité associée (  = risque d’erreur ) ( voir schéma )
Applications :
• Estimation par IC d’une moyenne
• Estimation par IC d’une proportion
47
Estimation
Estimation par IC d’une moyenne
Il y a 3 cas possibles :
1. Si  est connu :
Prob ( m - tm ≤ M ≤ m + tm ) = 1 - 
2. Si  est inconnu et n  30 :
Prob ( m - tm ≤ M ≤ m + tm ) = 1 - 
3. Si  est inconnu et n < 30 :
Prob ( m - tm ≤ M ≤ m + tm ) = 1 - 
m est l’écart type de la distribution échantillonnage
t valeur extrait de la table N(0,1)
t valeur extrait de la table de la loi de Student (,) 48
Estimation
Estimation par IC d’une proportion
Dans le cas de l’estimation d’une proportion on a seul cas car  est
connu et donné par :
2 = p*( 1- p )
Alors IC est donné par :
Prob ( m - tm ≤ M ≤ m + tm ) = 1 - 

Avec m est l’écart type de la distribution échantillonnage :  m  n
49
Estimation
Remarques
1. Echantillonnage exhaustif :
  N n
 m

n
 m

n N 1
2. Encadrement de la moyenne de échantillon:

Prob ( M - tm ≤ m ≤ M + tm ) = 1 - 
3. Utilisation de la table de Student :


0.9 0.5 0.4 0.01 0.001
1
1-
 2
/2 /2
3
 -t t
50

Sopport Cours Statistiques Partie1-F Initial

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Sopport Cours Statistiques Partie1-F Initial

Transféré par

Droits d'auteur :

Formats disponibles

Statistiques

Statistiques descriptives Statistiques inductives

Variable quantitative: Variable qualitative:

C’est la phase initiale où il s’agit de rassembler des données, de les

Le tableau établit la correspondance entre deux séries de

Diagramme en bâtons (variable discrète):

Paramètres de position Paramètres de dispersion

Permettre de se rendre compte Préciser le degré de dispersion

Variable discrète- variable continue

Représentation graphique point d’intersection des courbes cumulées f

On cherche la classe médiane

iii) Moyenne harmonique:

Les paramètres de position sont insuffisants pour caractériser complètement

Ecart moyen arithmétique:

Cov(X,Y) = 1/n ∑ (xi – X) (yi – Y)

D’une manière générale, l’ajustement consiste à rechercher une fonction

yi = f(xi) + εi εi = yi- f(xi)

C’est la méthode des moindres carrées

il s’agit de déterminer a et b pour S a, b   i b soit

La droite de régression passe par le point (x,y)

 l’aire de la courbe de Gauss comprise entre m- x 0 et m+ x0

Changement de variable : t = (x-m)/ ( voir démonstration )

 La loi centrée réduite de paramètre m = 0 &  = 1

t 0.01 0.02 0.06 0.09

un ou zéro produit non- conforme

Echantillonage aléatoire = Les individus ont même Probabilité

Soit une Population P X N, M,  : E(X) = M &  = (X)

soient tous les Echantillons i : n ( k échantillons )

tq : p+q=1 , 0<p<1 & 0<q<1

Soit une Population P X N, F, F : E(F) = p & F = √ p*q

soient tous les Echantillons i : n ( k échantillons )

n < 30 Ajustement d’une distribution

soit un échantillon de taille n (n, m i, i)

La série (²1, ²2……, ²i…… ²n) constitue une distribution de ²

IL s’agit d’attribuer une valeur à un paramètre inconnu de la population à

Il y a deux types d’estimation :

1. Estimation Ponctuelle de la moyenne : M = E(X) = m

2. Encadrement de la moyenne de échantillon:

3. Utilisation de la table de Student :

Vous aimerez peut-être aussi