Vous êtes sur la page 1sur 68

PARTIE 2: Statistique

La statistique recouvre deux parties:

 La statistique descriptive

 La statistique infèrentielle ( ou mathématique)

A. MBARKI ENSA-OUJDA
Statistique descriptive: Classer des données, représenter des
graphiques, calculer des caractéristiques statistiques,
interprétations des résultats.
Si la taille des données est grandes (plusieurs caractères), on fait
recours à l'analyse des données.

Statistique infèrentielle: étudier les caractéristiques d'un


échantillon pour tirer des conclusion sur toute la population.
Ici les concepts probabilistes sont indispensable

A. MBARKI ENSA-OUJDA
Chapitre: Rappel de la statistique
descriptive

• Dans ce chapitre, nous faisons un rappel de la


méthode statistique pour un seul caractère:

A. MBARKI ENSA-OUJDA
I- Vocabulaire
• 1- Population: ensemble d'objets ou de
personnes d'une étude statistique

• 2- Individu: un élément de la population

• 3- Echantillon: une partie de la population. Le


prélèvement des éléments de l'échantillon peut
être effectué avec remise ou bien sans remise.

• 4- Caractère: objet de l'étude statistique. Il est


de deux types:
A. MBARKI ENSA-OUJDA
I- Vocabulaire
 caractère quantitatif: les mesures sont des valeurs
numériques
i- discret: valeurs isolées
ii- continu: valeurs dans intervalle de R

Exemple
i. nombre d'enfants dans une famille : c.q.d.
ii. taille d'un individu :c. q. c.

 caractère qualitatif: les mesures ne sont pas des


nombres; ce sont des modalités:
Exemple: Niveau social d'un individu

A. MBARKI ENSA-OUJDA
I- Vocabulaire
5-Effectif total n : nombre d'individus total de
l'échantillon
6-Effectif d'une valeur caractère : nombre
d'individus possédant ce caractère.
7-Fréquence d'une valeur caractère: effectif
de cette valeur divisé par l'effectif total:

8- Pourcentage d'une valeur caractère:


fréquence de ce caractère multiplie par cent:

A. MBARKI ENSA-OUJDA
II- Caractère quantitatif discrets

Tels que les sont distinctes et ordonnées et effectif

total égale:

A. MBARKI ENSA-OUJDA
Représentation graphique:
On représente les caractère discrets sous forme
de diagramme en bâtons des effectifs ou des
fréquences

A. MBARKI ENSA-OUJDA
2- Caractéristiques :
a- Le mode : la valeur du caractère qui a plus grand effectif.
b- La moyenne arithmétique:

c- La variance arithmétique:

La formule suivantes est plus pratique pour le calcul de V:

d- L'écart- type est donne par la formule :


A. MBARKI ENSA-OUJDA
Caractère quantitatifs continus
On regroupe les données dans des classes adjacentes d'amplitudes pas
forcement égales

A. MBARKI ENSA-OUJDA
Représentation graphique:
Elle se fait grâce un histogramme dont les rectangles
sont de largeur l'amplitude de la classe et de longueur
l'effectif ou la fréquence.

Caractéristiques : Pour calculer la moyenne et la variance on utilise les

formules connues avec sont les centres des classes.

A. MBARKI ENSA-OUJDA
Chapitre : Caractéristiques usuelles
d'un échantillon

Présentation : Considérons population dans laquelle on


étudie un caractère X qui est une v. a. possédant une loi de
probabilité P d'espérance mathématique m et de variance .
On appelle échantillon de taille n issu de la loi P, une suite de
V.a. indépendantes et de même loi de probabilité
P. Une réalisation de l'échantillon est .
La théorie de l'échantillonnage se propose d'étudier certaines
caractéristiques de l'échantillon à la base de la
loi P (suppose connu), et de chercher leurs comportements
lorsque la taille n est élevée.

A. MBARKI ENSA-OUJDA
Une caractéristique de l'échantillon
est une statistique T qui s'exprime
en fonction de : i.e. il existe f telle que

A. MBARKI ENSA-OUJDA
Expressions empiriques
1- La moyenne empirique : La moyenne empirique
de l'échantillon est la quantité :
Sa réalisation est

On a:

la loi faibles des grands nombres donne:

le T. C .L. donne :

Ce résultat est applicable si ..


Notons que si la loi P est normale, alors le résultat précèdent est vrai,
(additivité de la loi normale.)
A. MBARKI ENSA-OUJDA
2-La variance empirique: La variance empirique de l‘échantillon

on montre que :

Ainsi:

un calcul long montre que:

qui peut être approchée par

D'un autre coté, il est facile de voir que:

A. MBARKI ENSA-OUJDA
D'après la loi faible des grands nombres,

et

A. MBARKI ENSA-OUJDA
3-La variance empirique corrigée: La variance
empirique corrigée de l'échantillon est la quantité

Il est très clair que:

Par suite, toutes les ptés de découlent de celles de .


Ainsi

De plus:

A. MBARKI ENSA-OUJDA
4- Fréquence empirique: on note par
la fréquence (ou proportion) des individus possédant un
caractère A donné ’’ i.e. P(X=A)’’.
Considérons un échantillon et soit Y ce nbre de
réalisation du caractère A. On a

La fréquence empirique du caractère A est la quantité:


On a

la loi faible des grands nombres


.
Le T. C. L. donne

en pratique A. MBARKI ENSA-OUJDA


III- Cas d'un échantillon de loi normale

Dans cette section, on suppose que la loi de probabilité qui


gouverne la v. a . X est une loi

1- Loi de L'additivité de la loi normale donne:

ou encoure

A. MBARKI ENSA-OUJDA
2- On peut montrer que:

En divisant par variance, on a:

Or pour

et sont indépendants, alors

A. MBARKI ENSA-OUJDA
De plus

Ainsi

Remarquons que:

est égal à

A. MBARKI ENSA-OUJDA
Théorème:

- Conséquence: Nous donnons un résultat important

Théorème (Fischer): La loi de Probabilité P est normale


ssi sont indépendantes.

On déduit, d'après tout ce qui précède, que

ou encore
Ce résultat est extrêmement utile car il ne dépend pas de et servira
donc chaque fois que A. MBARKI ENSA-OUJDA
est inconnu
Remarque : Les résultats ci-dessus restent vrais
pour n assez grand, sans supposer
que la loi de probabilité P est normale.
Le T. C. L. les confirme d'une façons claire.

A. MBARKI ENSA-OUJDA
Chapitre 7. Estimation
C'est le problème inverse de l'échantillonnage; c'est à dire
connaissant des renseignement sur un ou plusieurs
échantillons, on cherche à en déduire des informations sur la
population totale.
Précisément, soit un paramètre inconnu de loi
de probabilité P; exemple: ou une proportion
l'estimation consiste à donner des valeurs approchées au
paramètre à l'aide d'un échantillon issu de la population
considérée.
Deux types d'estimation seront étudiés dans ce chapitre:
1- Estimation ponctuelle
2- Estimation par intervalle de confiance.
A. MBARKI ENSA-OUJDA
1-Estimation ponctuelle
Définition : On appelle estimateur ponctuel d'un paramètre
de la loi de probabilité P, toute fonction dépendante de
l'échantillon on le note c- à- d:

EXEMPLE :
1- l'espérance de la loi P. On l'estime par la moyenne
empirique de l'échantillon.

2- sont deux estimateurs de la variance de la


population
A. MBARKI ENSA-OUJDA
Le biais b(ô) d'un estimateur ô est b(ô) =E(ô) - o
L ' erreur quadratique moyenne d'un estimateur Ó de O est

Proprieties Soit un estimateur de

i- est dit sans biais si


ii- est dit convergent si
iii- soit un autre estimateur de est dit plus
efficace que si

L'idéal est de trouver un estimateur de qui vérifie


i, ii et iii A. MBARKI ENSA-OUJDA
Estimateurs habituellement utilisés:
Le tableau suivant résume les ptés des estimateurs
courants. L'estimation se fait à la base d'un échantillon
de taille n.

A. MBARKI ENSA-OUJDA
Estimation par intervalle de
confiance

Principe: Soit un paramètre inconnu d'une loi de


Probabilité P. Au lieu d'estimer par un nombre
on va donner un intervalle qui couvre
avec une grand probabilité:
On fixe (très petit) et on cherche vérifiant:

sont les limites de confiance


- est le niveau de confiance.
Pour déterminer deux choix sont possibles pour
les intervalles de confiance:
A. MBARKI ENSA-OUJDA
Intervalle bilatéral: c'est de type

On a

ou encore:

On peut prendre (connus),

avec

- se calculent à partir des tables statistiques.

- Si l'intervalle est dit bilatéral symétrique.


A. MBARKI ENSA-OUJDA
Intervalle unilatéral:
unilatéral á droite. se calcule à partir

des tables statistique en utilisant

unilatéral à gauche. se calcule à partir

des tables statistique en utilisant

A. MBARKI ENSA-OUJDA
Intervalle de confiance pour
l'espérance m d'une loi normale.
- l'hypothèse: la loi de probabilité est normale d'espérance
m (à estimer) et de variance
- Variance connue : L'espérance inconnue de la loi P est
notée m.
On sait que si l'échantillon est Alors moyenne empirique
est un estimateur ponctuel de m et que

Exacte.

Avant de cité une propriété remarquable de la loi N(0, 1),


nous donnons la définition suivante
A. MBARKI ENSA-OUJDA
Définition: Soit X une v. a. de fonction de répartition F,
on appelle quantile d'ordre de F le réel noté
tel que
Proposition Soient un niveau de probabilité
et N une v. a. normale centrée réduite,
alors

ou est le quantile (Fractile) d'ordre

de N. c- à- d:

Avec la fonction de répartition de N.


A. MBARKI ENSA-OUJDA
Appliquons la dernière proposition à

Alors

est un intervalle de confiance de l'espérance m.

Exemple: alors
(Table stat.)
L'intervalle de confiance de l'espérance m est:
A. MBARKI ENSA-OUJDA
Remarque: Les résultats précédents s'appliquent à n
assez grand sans supposer la normalité de la loi P
(dès que .)

Variance inconnue
On utilise le fait que

En appliquant une propriété de la loi student, (Semblable à


celle donnée pour la loi normale.) on montre que.

A. MBARKI ENSA-OUJDA
L'intervalle de confiance de l'espérance m est

Exemple alors

(Table stat.) (si n=10). L'intervalle de confiance de


l'espérance m est:

Remarque: Les résultats précédents s'appliquent à n


assez grand sans supposer la normalité de la loi P
(dès que ) A. MBARKI ENSA-OUJDA
. Intervalle de confiance pour la variance
d'une loi normale

Hypothèse: La loi de probabilité est normale


d'espérance m et de variance à estimer.
 m inconnue. On sait que

En appliquant une pté remarquable de loi khi deux,


on a:

Un intervalle de confiance de la variance est :

A. MBARKI ENSA-OUJDA
m connue. Un bon estimateur de la variance est

. Il est clair que

Il est alors aisé de trouver l'intervalle de confiance pour

A. MBARKI ENSA-OUJDA
Intervalle de confiance pour une proportion
Un estimateur ponctuel d'un proportion
(Possèdent un certain caractère) est

Où Y nombre d'individus possèdent la


caractère étudié dans l'échantillon.

Pour n assez grand (en pratique ) le T. C. L. donne.

Or, un estimateur de l'écart type

A. MBARKI ENSA-OUJDA
Ainsi un intervalle de confiance est:

A. MBARKI ENSA-OUJDA
Chapitre 8. Les tests d'hypothèses
Principe des tests
Partons d'un exemple. Une machine fabrique des tiges d'acier.
Si la machine est réglée correctement l'utilisateur obtient une
population de tiges de longueurs moyenne m et d‘écarts -type. .
On désire savoir si cette machine se dérègle. Ainsi on
prélèvera à intervalles réguliers, des échantillons
pour mesurer la longueur effective des tiges.
Nous faisons alors l'hypothèse dite hypothèse nulle que la
machine est bien réglée. On teste alors cette hypothèse: deux
cas se présentent:
1- La machine est bien réglée on accepte
2- La machine est mal réglée on rejette et donc on accepte
dite hypothèse alternative.
A. MBARKI ENSA-OUJDA
Définition :Un test statistique est une méthode permettant de
prendre une décision à partir d'informations fournies par un
échantillon, cette décision dépend donc de l'échantillon. Ainsi
qu'elle que soit la décision prise on court deux sortes de risques:
1- Le risque dit de 1ère espèce noté :est la probabilité de
rejeter l'hypothèse nulle alors qu'elle est vraie en réalité:

2- Le risque dit de 2ème espèce noté : est la probabilité de


accepter l'hypothèse nulle alors qu'elle est fausse en réalité:

Le terme s'appelle la puissance du test.


Un test est bon si on arrive à minimiser:

A. MBARKI ENSA-OUJDA
Type de test:

On distingue deux types de test:


1- Tests paramétrique: ils portent sur les paramètres de la loi
de probabilité:
2- Tests non paramétriques: ils concernent le type de la loi
de probabilité est l'indépendance de deux v. a.

A. MBARKI ENSA-OUJDA
Tests paramétriques

Test de la moyenne (variance connue): Soit P une loi de


probabilité d'espérance m et de variance (connue).
un échantillon de taille issu de P.

1- Test bilatéral: on veut tester (valeur spécifiée)


contre c'est un test bilatéral.

Un estimateur de m est

On sait que pour alors,

A. MBARKI ENSA-OUJDA
Par suite sous l'hypothèse on a et

On fixe un seuil de signification (un risque) (5% ou 1%),


on a,

où encoure

A. MBARKI ENSA-OUJDA
Règle de décision du test:

Si on accepte
avec le risque

 Sinon on rejette et donc on accepte avec


le risque

Puissance du test
un calcul long montre que:
Si on pose Alors,

A. MBARKI ENSA-OUJDA
Remarque: Dans les cas usuels : si

Tests unilatéraux: ce sont des tests de la forme

Règles de décision:
Test 1:

Si

 Sinon on rejette et donc on accepte.


A. MBARKI ENSA-OUJDA
Test 2
Si

 Sinon on rejette et donc on accepte .

Remarque: Dans les cas usuels : si

A. MBARKI ENSA-OUJDA
Test de la moyenne (Variance inconnue)

On estime Sous
Règles de décision du test bilatéral

Si

 Sinon on rejette et donc on accepte .

Remarque: On adapte des formules similaires pour les tests


unilatéraux.
A. MBARKI ENSA-OUJDA
Test de variance
Soit la variance de la population

Test bilatérale:

Un estimateur de

On fixe un seuil de signification (un risque) ,on a:

A. MBARKI ENSA-OUJDA
Règles de décision

Si

Sinon on rejette et donc on accepte


Remarque: Pour le test unilatéral
la règle de décision est :

Si

Sinon on rejette et donc on accepte

A. MBARKI ENSA-OUJDA
On a supposé que la moyenne est inconnue. Dans le cas
contraire, on utilise un procédé plus simple en remarquant que

A. MBARKI ENSA-OUJDA
Test de la proportion
Soit la proportion d'individus possèdent un caractère
donné. On veut tester, au seuil de signification

Un estimateur de est la fréquence empirique :


où Y est le nbre d'individus dans
l'échantillon possèdent la caractère.
Sous

pour n assez grand. On a

A. MBARKI ENSA-OUJDA
Règles de décision

Si

Sinon on rejette et donc on accepte

Examiner les tests unilatéraux !! ?? !!

A. MBARKI ENSA-OUJDA
Test non paramétriques
Test d'ajustement

Le test d'ajustement (d'adéquation) ou


test" Karl Pearson" consiste à définir une règle de
décision de rejeter l'hypothèse:
distribution observée de l'échantillon égale à
une distribution théorique T.

A. MBARKI ENSA-OUJDA
Principe
Supposons qu'on observe k résultats différents avec des
effectifs observées , les effectifs théoriques de
ces résultats sont
On souhaite savoirs s'il y a une différence significative
entre les La statistique du test est

Qui suit approximativement, pour n grand, une loi khi-


deux à k-1-r degré de liberté; où r est le nbre des
paramètre inconnus (estimés) de la loi théorique T.

Si k-1-r=1, on peut pratiquer la correction de Yates :

A. MBARKI ENSA-OUJDA
Remarques
1- Pour assurer la convergence de D vers la loi il
faut grouper les classes voisines de sorte que
2- Dans ce type de test, l'alternative n'est pas formulée:
est acceptée pour les petites valeurs de D
est rejetée pour les grandes valeurs de D

4- Règles de décision.
 Si on accepte au seuil

 Sinon on rejette .

3- On montre que formule plus pratique

où n est l’effectif total.

A. MBARKI ENSA-OUJDA
Exemples

Maintenant, on applique les résultats ci-dessus á deux


exercice, le premier traite le cas où la distribution théorique
T est discrète, le second traite le cas où la distribution
théorique est continue

A. MBARKI ENSA-OUJDA
Exemple 1

On a enregistré pendant n=1000 jours le nbre d'appels


reçus par un standard. on a obtenu les résultats suivants

1- Déterminer la moyenne et variance de l'échantillon.


2- Tester, au seuil de signification 5%, l'hypothèse "le nbre
d'appel suit une loi de Poisson."
A. MBARKI ENSA-OUJDA
solution

2- L'idée d'un ajustement par la loi de Poisson vient du


fait que On estime le paramètre de la loi
théorique par
Alors les effectifs théoriques

Avec

lecture dans la table


statistique de la loi de
Poisson du paramètre 4

A. MBARKI ENSA-OUJDA
On groupe les deux dernières classes, ainsi k=11. On a

on a estimé un seul paramètre si (i.e. r=1); alors le nbre


de degré de liberté est k-1-r=11-1-1=9. Et puisque le
quantile d'ordre d'une khi-deux à
9 ddl > D. On accepte l'hypothèse d'ajustement au
seuil

A. MBARKI ENSA-OUJDA
Exemple 2

On étudie la taille de 500 individus tirés au hasard à partir


d'une population très étendue. On obtient les résultats
suivants.

1- Calculer la moyenne et l'écart-type.


2-Test, au seuil de signification 5%, l'hypothèse " la taille
A. MBARKI ENSA-OUJDA
suit une loi normal
solution

2- la loi théorique est supposée N(170,86; 3,6).


On regroupe les données dans des classes.

A. MBARKI ENSA-OUJDA
Avec

On a

et k=10: nbre de classes. Donc le nbre de degrés


de liberté est 10-1-2=7 (car on a estimé deux
paramètre de la théorique).
Le quantile d'ordre d'une khi-deux à 7 ddl
est . Puisque On rejette
l'hypothèse d'ajustement au seuil

A. MBARKI ENSA-OUJDA
Test d'indépendance
le test d'indépendance consiste à définir une règle de
décision pour accepter ou rejeter l'hypothèse

"Deux caractères A et B (quantitatifs ou qualitatifs)


sont indépendants."
On dispose d'un échantillon de n unité prélevées d'une
population selon deux caractères A et B, ayant
respectivement I et J classes

A. MBARKI ENSA-OUJDA
nbre d'observation présentant à la fois les
modalités
On pose

On désire tester si les deux caractères A et B sont


indépendants, le test est basé sur la statistique
A. MBARKI ENSA-OUJDA
qui suit, pour n grand; une loi khi-deux à
(I-1)(J-1) degrés liberté.
Soit un seuil de signification

règle de décision
 -Si on accepte l'hypothèse
(d'indépendance) au seuil

Sinon on rejette
A. MBARKI ENSA-OUJDA
EXEMPLE

On désire savoir si un certain vaccin protège contre


une maladie ou non au seuil de 5%. on a testé 200
personnes et on a obtenu les résultats suivants.

A. MBARKI ENSA-OUJDA
Solution

On a

le nbre de degré de liberté est (2-1)(2-1)=1.


impliques que
Donc

Ainsi, on accepte l'indépendance des deux


caractères; c'est-à-dire qu‘ être vacciné et être
atteint par la maladie sont deux caractères
indépendants. A. MBARKI ENSA-OUJDA

Vous aimerez peut-être aussi