Académique Documents
Professionnel Documents
Culture Documents
L1 SCIENCES TECHNOLOGIQUES
2 décembre 2021
Généralités
Statistiques
Le terme Statistiques désigne un ensemble de données
d’observations. Les statistiques sont donc des séries de chiffres
(données numériques) qui sont obtenues grace à des observations
faites sur des faits nombreux et relatifs à un phénomène.
Statistique
Le terme Statistique désigne l’activité qui consiste au recueil,
traitement et interprétation des données chiffrées en vue de prendre
des décisions. Il s’agit de la science qui étudie les différentes
techniques et méthodes pour la collecte, le traitement et
l’interprétation des statistiques.
Il s’agit de trier ces données, les décrire, les résumer sous forme de
tableaux, de graphiques, et sous forme d’un petit nombre de
paramètres-clés (moyenne, médiane par exemple).
Définitions
Les observations sont prélevées sur un grand ensemble dit population
statistique. Une population est un ensemble d’objets, d’etres vivants
ou d’objets abstraits de meme nature. Une population peut donc etre
réelle ou fictive, finie ou infinie, dénombrable ou non dénombrable.
Chacun des éléments de cet ensemble est un individu ou une unité
statistique. Chacune des caractéristiques de chacun de ces individus
de cette population est dite variable statistique ou caractère.
Le but de l’étude statistique est de voir comment cette variable varie
sur la population : ses valeurs sont-elles comparables ou très
différentes, et dans quelle mesure ?
L’ensemble de valeurs ou modalités que prend une variable statistique
est appelé série statistique brute.
Définitions
Les observations sont prélevées sur un grand ensemble dit population
statistique. Une population est un ensemble d’objets, d’etres vivants
ou d’objets abstraits de meme nature. Une population peut donc etre
réelle ou fictive, finie ou infinie, dénombrable ou non dénombrable.
Chacun des éléments de cet ensemble est un individu ou une unité
statistique. Chacune des caractéristiques de chacun de ces individus
de cette population est dite variable statistique ou caractère.
Le but de l’étude statistique est de voir comment cette variable varie
sur la population : ses valeurs sont-elles comparables ou très
différentes, et dans quelle mesure ?
L’ensemble de valeurs ou modalités que prend une variable statistique
est appelé série statistique brute.
Variables quantitatives
Il existe deux sortes de variables quantitatives.
Une variable quantitative est discrète si elle ne peut prendre que des
valeurs isolées, généralement entires.
Exemple : Nombre de frères, Années de travail etc.
Elle est continue si ses valeurs peuvent être n’importe lesquelles d’un
intervalle réel.
Exemple : Poids, taille etc.
Variables quantitatives
La nature (quantitative ou qualitative) d’une variable est une propriété
intrinsèque, qui ne dépend pas de la facon dont on note ses modalités ou
valeurs. On parlera des valeurs possibles prises par une variable quantitative
mais on préférera le terme de modalités pour une variable qualitative. Il
existe deux sortes de variables qualitatives.
Lorsque ses modalités possèdent un ordre naturel, la variable est
qualifiée d’ordinale.
Exemple : Niveau d’, Etat civil etc.
Lorsqu’il n’y a pas d’ordonnancement possible des modalités, on parle
de variable nominale.
Exemple : Sexe, Couleurs des cheveux, Marque de véhicules,
Commune d’habitation, Profession etc.
Plan du cours :
Ce cours comprend 3 parties reparties comme suit :
1 La premème partie du cours traite de la statistique descriptive
2 La deuxième partie du cours traite des éléments de probabilités, des
variables aléatoires et des distributions de probabilités.
3 La troisième partie du cours, c’est la statistique inférentielle. Nous y
présenterons la théorie statistique de l’estimation.
Figure : Distribution par âge et par sexe des cas de cancer de poumons au
cours d’une année dans les hôpitaux de Kindu.
Figure : Répartition par âge, par sexe et par groupe de malade des patients
ayant reçu des soins ambulatoires dans un centre de santé
Figure : Distribution des fréquences des ouvriers d’une clinique suivant leur
l’âge.
Sur 250 étudiants entrès à la suite d’un concours à la faculté des sciences
1 13 soit 5.2% ont préparés le concours pendant 3 ans ; 96 soit 38.4%
2 192 soit 44.8% pendant 1 an et 29 soit 11.6% n’ont pas préparés. pendant 2 ans
Introduction
Après avoir étudié comment collecter et présenter les données récoltées,
les objectifs poursuivis dans ce chapitre sont :
Résumer l’information contenue dans une série statistique.
Pour ce faire, on calcule des valeurs statistiques ou des paramètres
statistiques clés.
NOTA : En plus des tableaux et graphiques, les paramètres
statistiques ont pour but de résumer, à partir de quelques nombres
clés l’essentiel de l’information relative à l’observation d’une variable
quantitative.
Définition et Exemples
Les paramètres de tendance centrale, appelés aussi paramètres de position,
sont des paramètres qui ont tendance à se positionner au centre d’une
distribution (série) statistique.
Exemples :
Les moyennes (arithmétique, géométrique, harmonique) ;
Le Mode ;
La Médiane ;
Les Fractiles (quartiles, déciles, centiles).
Avec
xi = milieu de la classe i donné par xi = ai +b
2 ;
i
xi =milieu de la classe i ;
ni = effectif de la classe i ;
n = ki=1 ni
P
Exemple
Calculer la moyenne harmonique de la série : 7, 8, 13, 18, 24
Solution
5
H= = 11, 31
( 71 + 1
8 + 1
13 + 1
18 + 1
24 )
Remarques sur H
La moyenne harmonique n’est pas d’usage courant.
Elle est une bonne mesure de tendance centrale quand les valeurs de la
série sont des taux.
Exemple : Supposons qu’une dactylographe peut taper 40 lettres par heure,
60 factures par heure, 80 cartes de voeux par heure. Quel est le nombre
moyen des documents peut-elle dactylographier par heure ?
Solution : Si l’on appliquait la formule de la moyenne arithmétique, la
moyenne serait : X̄ = 40+60+80
3 = 60
Remarque
Cette moyenne ne fournit pas une information correcte car elle suppose que
la vitesse pour dactylographier une lettre est la même que celle requise
pour taper une facture ou une carte.
Ce qui n’est pas vrai.
H < G < X̄
Remarques sur le Mo
Une série peut ou ne pas avoir de mode.
Une série peut être sans mode, elle est dite amodale
Une série peut avoir un seul mode, elle est dite unimodale
Une série peut avoir 2 modes, elle est dite bimodale
Une série peut avoir plusieurs modes, elle est dite multimodale
Avec
La classe modale correspond à celle ayant le plus grand effectif ;
ai = borne inférieure de la classe modale ;
hi = l’amplitude de la classe modale ;
∆1 =effectif de la classe modale-effectif de la classe précédent la classe
modale (ni − ni−1 )
∆2 =effectif de la classe modale-effectif de la classe suivant la classe
Prof. Apollinaire NDONDO ( L1 SCIENCES
Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 50 / 74
Exemple :
Déterminer le Mode
Tranche d’âge [10,20[ [20,30[ [30,40[ [40,50[ [50,60[ [60,70[
Effectif 4 5 6 12 8 6
1 Détermination de la classe modale : classe ayant le plus grand effectif :
[40, 50[
2 Par suite, on a :
ai = 40, hi = 50 − 40 = 10, ∆1 = 12 − 6 = 6, ∆2 = 12 − 8 = 4
6
3 D’où Mo = 40 + 10 6+4 = 46
Exemple
Age (ans) 18 19 20 21 22
Effectif 12 15 32 10 14
Cumul observ. 1-12è 13è- 27è 28è-59è 60è-69è 70è-83è
Me = X n+1 = X 83+1 = X42 = 20 ans
2 2
Prof. Apollinaire NDONDO ( L1 SCIENCES
Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 52 / 74
Exemples :
Exemple 1 :
Déterminer la médiane de la série : 12, 12, 13, 25, 24, 28, 20, 18,15, 10, 14
Solution :
Ordonnant la série : 10, 12, 12, 13, 14, 15, 18, 20, 24, 25, 28
n = 11 impair donc, Me = X 11+1 = X6 = 15
2
Exemple 2 :
Déterminer la médiane de la série : 12, 12, 13, 25, 24, 28, 20, 18,10, 14
Solution :
Ordonnant la série : 10, 12, 12, 13, 14, 18, 20, 24, 25, 28
n = 10 pair donc,
(X 10 )+(X 10 +1 )
(X5 )+(X5+1 ) X5 +X6 14+18
Me = 2
2
2
= 2 = 2 = 2 = 16
Avec
ne
La classe médiane est celle où se trouve la 2 observation ;
ai = borne inférieure de la classe médiane ;
hi = l’amplitude de la classe médiane ;
P
n= ni = taille de l’échantillon ;
Ni−1 =effectif cumulé de la classe précédent la classe médiane
ni =effectif simple de la classe médiane
Déterminer la médiane
Tranche d’âge [10,20[ [20,30[ [30,40[ [40,50[ [50,60[ [60,70[
Effectif 4 5 6 12 18 6
Cumul observ. 1er-4è 5è- 9è 10è-15è 16è-27è 28è-45è 46è-51è
ne
1 Détermination de la classe médiane : classe où se trouve la 2
e
observation, cad la 51 e
2 = 26 observation : [40, 50[
2 Par suite, on a :
ai = 40, hi = 50 − 40 = 10, n2 = 51
2 = 25, 5 , Ni−1 = 15, n1 = 12
3 D’où Mo = 40 + 10 25,5−15
12 = 48, 75
Paramètres de dispersion
On appelle paramètres de dispersion, des valeurs qui mesurent les écarts de
différentes valeurs de la série par rapport à la valeur centrale ( la Moyenne
arithmétique ).
Parmi les paramètres de dispersion les plus répandus ,nous pouvons citer :
l’Etendue ;
la Variance ;
l’Ecart-type (déviation standard) et
le coefficient de variation
1. L’Etendue
On appelle Etendue d’une série statistique donnée, la valeur notée E
représentant la différence entre la plus grande valeur et la plus petite valeur
de cette série statistique.
où Val max est la plus grande valeur de la série et Val min la valeur plus
petite de la série statistique.
Cette formule est utilisée aussi bien pour les séries des données groupées
que pour les séries des données discrètes.