Académique Documents
Professionnel Documents
Culture Documents
Cours
Mathématique \Statistique
Chargé du module
H. BELARBI
Cours
Mathématiques Statistiques
Nombre de crédits
2
Introduction
Problématique
Objectifs du cours
Chapitre 1
Chapitre 1
Vocabulaire de base
1.1. Introduction
Dans l’étude de phénomènes portant sur un nombre important de personnes, animaux, d’objets,
etc, on ne peut pas avoir accès à tous les résultats possibles pour l’ensemble de la population. Le
rôle des statistiques est de rendre compte le mieux possible de la composition de toute la
population à partir d’un nombre restreint d’observations qui constituent un échantillon.
- de tirer des conclusions sur la population étudiée (sa structure, sa composition), d’aider à la
prise de décision judicieuses; en présence de données dépendant du temps, de faire de la
prévision.
En distingue généralement :
Elle a pour but de résumer et de présenter les données observées sous la forme la plus accessible
(simplification et réduction des données, à la fois visuelle et conceptuelle);
Les statistiques descriptives peuvent se résumer par le schéma (Figure 1.1) suivant :
ECHANTILLON Caractéristiques de
POPULATION
l’échantillon
Echantillonnage Déduire
Aléatoire
C’est l’ensemble des méthodes permettant de formuler en termes probabilistes un jugement sur
une population, à partir des résultats observés sur un échantillon extrait au hasard de cette
population. Les méthodes statistiques les plus classiques sont celles de l’estimation (estimation
par domaine de confiance) et celles de tests d’hypothèses (Figure 1.2).
Inférence
Echantillon Population
La population statistique est l’ensemble des éléments sur lesquels porte l’étude.
Exemple :
Remarque
- Les étudiants ;
Les éléments de la population sont appelés individus statistiques ou unités statistiques (ou
objet).
Exemple :
Exemple :
Population
Individus
Echantillon
Remarque
On dira qu’un échantillon est exhaustif lorsque la taille est celle de la population. Par exemple,
en hydro-climatologie, les populations sont généralement infinies et par conséquent, les
échantillons sont non exhaustifs.
Pour recueillir des informations sur une population statistique, l’on dispose de deux méthodes :
L’échantillonnage représente l’ensemble des opérations qui ont pour objet de prélever un
certain nombre d’individus dans une population donnée. Pour que les résultats observés lors
d’une étude soient généralisables à la population statistique, l’échantillon doit être représentatif
de cette dernière.
L’échantillonnage aléatoire simple est une méthode qui consiste à prélever au hasard et de
façon indépendante n individus ou unités d’échantillonnage d’une population à N individus.
Chaque individu possède ainsi la même probabilité de faire partie d’un échantillon de n
individus et chacun des échantillons possibles de taille n possède la même probabilité d’être
constitué. Ainsi, l’échantillonnage aléatoire simple assure l’indépendance des erreurs, c’est-à-
dire l’absence d’auto-corrélations parmi les données relatives à un même caractère. Cette
indépendance est indispensable à la validité de plusieurs tests statistiques.
Remarque
C’est la propriété ou l’aspect particulier que l’on se propose d’observer dans la population ou
l’échantillon. Un caractère qui fait le sujet d’une étude porte aussi le nom de variable statique.
Chaque individu d’une population peut être décrit relativement à un ou plusieurs caractères ou
variables statistiques. Il existe deux types de caractères.
Un caractère est dit qualitatif, s’il est repérable sans être mesurable.
Exemple :
- Lieu de naissance ;
Exemple :
- Le poids ;
Dans l’utilisation que nous ferons de la statistique, nous aurons toujours affaire à des
caractères quantitatifs.
Il est discontinu, s’il prend que des valeurs isolées les unes des autres. Autrement dit ; un
caractère quantitatif discontinu qui ne prend que des valeurs entières est dit discret.
Exemple :
- Nombre d’enfants ;
Il est dit continu lorsqu’il peut prendre toutes les valeurs d’un intervalle fini ou infini.
Exemple :
- Diamètre de pièces ;
- Surface ;
- Altitude, etc.
Remarque
Lorsque la variable statistique continue, les données sont regroupées par classes, c’est-à-dire par
intervalles¿ x i−α i , x i+ α i ¿ ¿, Le nombre x i est le centre de la classe. L’amplitude de la classe
est un compromis : la valeur α i doit être assez petite pour conserver une information suffisante,
mais assez grande pour avoir des données condensées et des calculs raisonnables. Les classes
sont aussi notées ¿ x i−1 , x i ¿ ¿ lorsqu’on s’intéresse plus précisément aux extrémités.
C. Modalité
Exemple :
Le caractère couleur des yeux peut prendre comme Modalités : Noir, Marron, Bleu,…
Les modalités d’un caractère doivent être incompatibles et exhaustives, tout individu doit
présenter une et une seule modalité.
Exemple :
Enquête sur l’état matrimonial d’un groupe d’individu. Pour satisfaire la condition
d’exhaustivité on doit avoir quatre modalités du caractère état matrimonial : Célibataire, marié,
veuf et divorcé
Incompatible chaque individu doit pouvoir être classé dans une seule et une seule modalité du
caractère
Exemple :
Chaque individu d’un caractère doit pouvoir être classé dans une et une seule Modalité
Population
Individu
Echantillon
Discret Continue
Tableaux
Exemple d’application
On souhaite connaître l’état des maisons. Choix entre trois types de caractère.
{
Population : Maisons ( 100 )
Individu : Unemaison parmi ces 100 maisons
Caractère qualitatif
Caract è ℜ: l' é tat de la maison
Modalit é s : Petite , moyenne , grande
{
Population : Maisons ( 100 )
Individu : Unemaison parmi ces 100 maisons
Caractère quantitatif discret
Caract è ℜ: Nombre de pi è ces
Modalit é s :1,2,3,4,5
{
Population: Maisons ( 100 )
Individu : Une maison parmi ces100 maisons
Caract è ℜ quantitatif conti nu
Caract è ℜ: Surfaces(not é S)
Modalit é s : S ∈ [ 60,200 ] m
2
Exercice d’application
Une compagnie achète 10 000 ampoules électriques d’un fabricant qui affirme que ses ampoules
fonctionnent durant au moins 1 000 heures (1 mois et 11 jours, sans arrêt). Cette compagnie
vérifie 15 ampoules et, suite à ces résultats doit décider si elle garde ou non les 10000 ampoules.
Identifier la population, l’individu, le caractère et les modalités ?
Solution
Les concepts qui viennent d’être présentés sont les homologues de concepts du calcul des
probabilités et il est possible de disposer en regard les concepts homologues (voir table ci-
dessous).
Probabilités Statistique
Espace fondamental Population
Epreuve Tirage (d’un individu), expérimentation
Evènement élémentaire Individu, observation
Variable aléatoire Caractère
Epreuves répétées Echantillonnage
Nombre de répétitions d’une
Taille de l’échantillon, effectif total
épreuve
Probabilité Fréquence observée
Loi de probabilité Distribution observée ou loi empirique
Espérance mathématique Moyenne observée
Variance Variance observée
Chapitre 2
Chapitre 2
Il existe plusieurs niveaux de description statistique, la représentation brute des données, des
représentations par tableaux numériques, des représentations graphiques et des résumés
numériques fournis par un petit nombre de paramètres caractéristiques. Pour la représentation
des données on a recours à :
Une série statistique correspond aux différentes modalités d’un caractère sur un échantillon
d’individus appartenant à une population.
Exemple :
Selon que la variable est discrète ou continue. Les tableaux se présentent de la façon suivante :
A. Tableau concernant une variable discrète
Exemple
Du moment que le caractère est quantitatif continu alors l’idée consiste à établir des classes.
Exemple
Nombre de Effectifs
Lecture du tableau :
colis (xi) (ni)
¿ 20 Nous avons 20 fois reçu des livraisons contenant des colis entre
[6-11] 30 1 et 6.
[11-16] 60
[16-21] 50
[21-31] 30
[31-36] 10
Remarque
Lorsque les données sont groupées, il faut porter attention aux crochets (les signes dans la
classe. Par exemple, dans le tableau ci-dessus, le groupe [1-6[inclut un seul colis durant 20
livraisons (c’est le signe « qui marque l’inclusion, mais exclut des livraisons qui ont 6 colis
pièces (c’est le signe « [ »).
Effectifs
Classe Nombre de colis (xi)
(ni)
1 [1.5-2.5] 3
2 [2.5-3.5] 1
3 [3.5-4.5] 1
4 [4.5-5.5] 2
5 [5.5-6.5] 1
6 [6.5-7.5] 1
7 [7.5-8.5] 1
Total : 10
Effectifs
Classe Nombre de colis (xi)
(ni)
1 [1.5-3] 3
2 [3-4.5] 2
3 [4.5-6] 3
4 [6-7.5] 1
5 [7.5-9] 1
Total : 10
Effectifs
Classe Nombre de colis (xi)
(ni)
1 [1.5-4.5] 5
2 [4.5-7.5] 4
3 [7.5-10.5] 1
Total : 10
Donc ;
Pour une amplitude ou un pas de classe égale 1 on a 7 classes
Par la suite,
Est-ce que le choix du pas à une importance dans le traitement des données ? Si oui
Le nombre de classes ne doit pas être trop petite, perte d’informations, ni trop grande, le
regroupement en classes est alors inutile de plus, certaines classes pourraient avoir des effectifs
trop faibles.
Exemple d’application
Dans une étude statistique, on vérifié le poids de 10 Zèbres enfermés dans un zoo après leurs
capture pour voir leur adaptation au niveau milieu, l’étude nous donne les valeurs suivantes :
80.5 - 79 - 86.6 - 72 - 101.5 - 120 - 115.5 - 95.5 - 120 - 121.99.
Solution
1. Population Les Zébres du zoo
Individu Le Zébre
Le caractère (variable) poids de type quantitatif continu poids ∈ [ 72 , 122 ]
3.
- Tableau statistique avec la formule de Sturge k =1+3.3 log 10 (n)
122−72
a i= =10
5
Valeurs du ni
poids
[72 - 82] 3
[82 - 92] 1
[92 - 102] 2
[102 - 112] 1
[112 - 122] 3
Total= 10
k =2.5 √4 10 k=4.4∨k ∈ N ⇒ k =5
122−72
a i= =10
5
Valeurs du ni
poids
[72 - 82] 3
[82 - 92] 1
[92 - 102] 2
[102 - 112] 1
[112 - 122] 3
Total= 10
La fréquence relative f i est calculée en divisant chaque fréquence absolue par l’effectif total
ni n
f i= ; ∑ f ii=1
n i=1
En autres, la fréquence est exprimée en valeurs relatives multipliée 100 donne le pourcentage.
Exemple :
Les fréquences simples, qu’elles soient absolues ou relatives, indiquent comment se distribue la
variable par rapport aux différentes modalités ;
Les fréquences cumulées, qu’elles soient absolues ou relatives, indiquent comment se rapport
aux différentes modalités. Il existe deux catégories de fréquences cumulées. Les fréquences
cumulées croissantes qui indiquent combien d’unités de la population sont caractérisées par une
valeur inférieure et les fréquences cumulées décroissantes qui indiquent combien d’unités de la
population sont caractérisées par une valeur supérieure ;
Lecture du tableau
80% des livraisons comportent moins 21 colis et 45% des livraisons comportent plus de 16 colis
Remarque
En générale, les fréquences relatives et les fréquences cumulées relatives peuvent être utilisées
pour comparer deux ou plusieurs populations.
– Le contrôle on perçoit mieux les anomalies sur un graphique que dans un tableau
Une série de données peut être résumée par quelques valeurs numériques appelées
caractéristiques des séries statistiques, classées en quatre grandes catégories:
– Caractéristiques de tendance centrale ;
– Caractéristiques de dispersion ;
– Caractéristiques de forme ;
– Caractéristiques de concentration.
- Médiane,
- Médiale,
2.4.1.1 Moyennes
A. Moyenne Arithmétique
Soit la série statistique de données brutes : x 1 , x 2 , … , x n, sa moyenne arithmétique a pour
expression :
( x 1+ x 2 +…+ x n ) 1
n
x=
n
⇒ x= ∑x
n i=1 i
Remarque
Lorsqu’on a une variable statistique continue, on ne connaît pas les valeurs exactes prises par la
variable, mais seulement le nombre d’observations à l’intérieur de chaque classe. Pour calculer
la moyenne arithmétique d’une telle variable, on ramène chaque observation au centre de sa
classe, ceci en raison de l’hypothèse d’équirépartition à l’intérieur des classes, et cela revient à
Propriétés
– La moyenne permet de résumer par un seul nombre la série statistique ;
– Elle est sensible aux valeurs extrêmes, il est parfois nécessaire de supprimer les valeurs
extrêmes ou « aberrantes » ;
n
– La somme des écarts à la moyenne est égale à zéro. ∑ ( xi −x ) =0
i=1
B. Moyenne géométrique
La moyenne géométrique G de la série de valeurs x 1 , … , x j , … , x n supposées toutes positives
(strictement), est définie ainsi :
√
n n
n 1
G= ∏ x i ⟹ ln ( G )= ∑ ln ( xi )
n i=1
i =1
Lorsque la distribution de la variable statistique est donnée par les k couples( x i ,n i ), les x i étant
tous positifs ; la moyenne géométrique a pour expression :
√
k k k
n
G= ∏ x in =∏ x if ⟹ ln (G ) =∑ f i ln ( x i )
i i
i =1 i=1 i=1
C. Moyenne harmonique
La moyenne harmonique est l’inverse de la moyenne arithmétique des inverses des valeurs.
n 1
H= ou H =
n k
f
∑ x1 ∑ xi
i=1 i i =1 i
L’égalité de deux de ces moyennes entre elles entraînent leur égalité dans leur ensemble, et dans
ce cas, toutes les valeurs x i sont égales.
Définition
Le mode est la valeur de la variable statistique la plus fréquente que l’on observe dans une série
d’observations.
Si la variable est une variable discrète, le mode se définit donc à l’aide du tableau de
distribution ou du diagramme en bâtons.
Si la variable est une variable continue, on définit une classe modale, par une interpolation
linaire on peut obtenir la valeur exacte du mode :
M 0−bi bi +1−M 0
=
∆1 ∆2
Propriétés
- Le mode a une signification concrète, qui rend son usage nécessaire dans un certain nombre
de problèmes appliqués, par exemple la connaissance des heures de pointe dans la gestion
des transports urbains ; les jours d’affluence pour les commerces ; les routes les plus
fréquentées (points noirs dans le réseau routier), etc.
- Le mode n’existe pas toujours et quand il existe, il n’est pas toujours unique ;
- Si après regroupement des données en classes, on trouve deux ou plusieurs modes différents,
on doit considérer que l’on est en présence de deux ou plusieurs populations distinctes ayant
chacune leurs caractéristiques propres (figure )
2.4.1.3 Médiane Me
La médiane est plutôt une moyenne de position. La médiane n’est qu’une forme particulière de
quantile (appelés aussi fractile).
La médiane est la valeur, observée ou possible, dans la série des données classées par ordre
croissant (ou décroissant) qui partage cette série en deux parties comprenant exactement le
même nombre de données de part et d’autre de Me.
- On repère l’élément qui partage la distribution en deux parties égales: soit l’élément qui a le
rang (n+1)/2 pour le caractère X ;
- Si la distribution a un nombre impair d’éléments on trouve une valeur unique qui est la
médiane ;
Exemple
Si 29 éléments = (29+1)/2 = 15 : la médiane correspond à la valeur du caractère X pour
l’élément au 15ème range.
Exemple
– soit par interpolation linéaire à l’intérieur de la classe centrale (voir la formule ci-dessous), si
le nombre de classes est impair ;
– soit en prenant la moyenne des deux classes « centrales », si le nombre de classes est pair.
Pour faire ce calcul, on suppose implicitement que la distribution est uniforme à l’intérieur de
chaque classe.
F(x)
F()
F(50)
F()
Propriétés
- La médiane est influencée par le nombre des données mais non par leurs valeurs, elle ne peut
donc pas être utilisée en théorie de l’estimation ;
- Si la variable statistique est discrète, la médiane peut ne pas exister ; elle correspond
seulement à une valeur possible de cette variable ;
2.4.1.4 Quantiles
Les quantiles sont des indicateurs de position. Le quantile d’ordre α ( 0≤ α ≤ 1 ), noté x α est tel
qu’une proportion α des individus ait une valeur du caractère X inférieure ou égale à x α .
Le quartile d’ordre x 0.5.est égale à la médiane.
On utilise couramment les quantiles d’ordre 1/4, 1/2et 3/4. Ils sont ainsi notés et nommés :
Q1= premier quartile=x 0.25
Q2=deuxième quartile=médiane=x0.5
Q1=troisième quartile=x 0.75
Dans le cas d’une variable statistique continue, on a F (Q¿¿ 1)=0.25¿ et F (Q¿¿ 3)=0.7 5 ¿
et on calcule les quartiles par interpolation linéaire.
Remarque : les déciles et les centiles sont également d’usage relativement courant.
2.4.2 Paramètres de dispersion
Le calcul de l’étendue interquartile a l’avantage par rapport à celui de l’étendue d’écarter les
valeurs extrêmes.
[ ]
n n
1 1
Var ( X )= ∑
n i=1
( x i−x )2= ∑ ( x i) 2 −( x )2
n i=1
Ou
k k
Var ( X )=∑ f i ( x i−x )2=∑ f i ( xi )2 −( x )
2
i=1 i=1
Si β 1< 0 La distribution est étalée sur la gauche, on observe la succession moyenne, médiane,
mode et la dissymétrie est négative;
Si β 1=0 La distribution n’est pas forcement symétrique (mais si la distribution est symétrique,
on a β 1=0 ).
Remarque
β 1 est un estimateur peu robuste si n est petit (limité à quelques dizaines).
σx μ24 x
Si β 2> 0 La distribution est moins aplatie que la distribution normale, la distribution est dite
leptocurtique;
Si β 2< 0 La distribution est plus aplatie que la distribution normale, la distribution est dite
platicurtique;
Si β 2=0 L’aplatissement est même que pour la loi normale et la courbe est dit mésocurtique.
Remarque
Là encore, si l’échantillon est petit, il est peu robuste est surtout très sensible aux valeurs
extrêmes.