Vous êtes sur la page 1sur 74

Cours de PROBABILITE ET STATISTIQUE

Prof. Apollinaire NDONDO

L1 SCIENCES TECHNOLOGIQUES

2 décembre 2021
Généralités

Statistiques
Le terme Statistiques désigne un ensemble de données
d’observations. Les statistiques sont donc des séries de chiffres
(données numériques) qui sont obtenues grace à des observations
faites sur des faits nombreux et relatifs à un phénomène.

Statistique
Le terme Statistique désigne l’activité qui consiste au recueil,
traitement et interprétation des données chiffrées en vue de prendre
des décisions. Il s’agit de la science qui étudie les différentes
techniques et méthodes pour la collecte, le traitement et
l’interprétation des statistiques.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 2 / 74
Les grandes parties de la Statistique

Il existe deux grandes partie de la science Statistique : Il s’agit de la


1 Statistique Descriptive (ou Statistique déductive).
2 Statistique Inférentielle (ou Statistique inductive ou Statistique
mathématique ou Inférence Statistique).

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 3 / 74
La Statistique descriptive
La Statistique descriptive est l’ensemble des méthodes et
techniques mathématiques permettant de présenter, décrire, résumer
de telles données. Son but n’est pas d’expliquer mais simplement de
décrire avec des outils appropriés, de dégager l’essentiel, de réaliser des
synthèses en opérant des mesures.
Faire acquérir les notions essentielles de la statistique descriptive
revient à apprendre comment décrire de facon claire et concise
l’information apportée par des observations nombreuses et variées sur
un phénomène donné.

Il s’agit de trier ces données, les décrire, les résumer sous forme de
tableaux, de graphiques, et sous forme d’un petit nombre de
paramètres-clés (moyenne, médiane par exemple).

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 4 / 74
La Statistique inférentielle
L’interprétation des résumés obtenus, leur extrapolation éventuelle à
un ensemble plus vaste, et leur utilisation afin d’étendre les propriétés
des données décrites sur un échantillon à une population entière, et
d’infirmer ou de confirmer des hypothèses sur le phénomène décrit
pour prendre des décisions sur la population entière à partir de
l’échantillon constituent le domaine de la Statistique dit Statistique
inférentielle.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 5 / 74
Définition de quelques concepts de base

Définitions
Les observations sont prélevées sur un grand ensemble dit population
statistique. Une population est un ensemble d’objets, d’etres vivants
ou d’objets abstraits de meme nature. Une population peut donc etre
réelle ou fictive, finie ou infinie, dénombrable ou non dénombrable.
Chacun des éléments de cet ensemble est un individu ou une unité
statistique. Chacune des caractéristiques de chacun de ces individus
de cette population est dite variable statistique ou caractère.
Le but de l’étude statistique est de voir comment cette variable varie
sur la population : ses valeurs sont-elles comparables ou très
différentes, et dans quelle mesure ?
L’ensemble de valeurs ou modalités que prend une variable statistique
est appelé série statistique brute.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 6 / 74
Définition de quelques concepts de base

Définitions
Les observations sont prélevées sur un grand ensemble dit population
statistique. Une population est un ensemble d’objets, d’etres vivants
ou d’objets abstraits de meme nature. Une population peut donc etre
réelle ou fictive, finie ou infinie, dénombrable ou non dénombrable.
Chacun des éléments de cet ensemble est un individu ou une unité
statistique. Chacune des caractéristiques de chacun de ces individus
de cette population est dite variable statistique ou caractère.
Le but de l’étude statistique est de voir comment cette variable varie
sur la population : ses valeurs sont-elles comparables ou très
différentes, et dans quelle mesure ?
L’ensemble de valeurs ou modalités que prend une variable statistique
est appelé série statistique brute.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 7 / 74
Types de variables statistiques

Variables quantitatives et variables qualitatives


La nature des variables conditionne les études ultérieures. On distingue les
variables quantitatives et les variables qualitatives.
Les variables quantitatives ou numériques s’expriment par des
nombres entiers ou réels sur lesquels les opérations arithmétiques
courantes (somme, moyenne . . .) ont un sens. Exemple : les variables
age, poids, taille, nombre de frères et soeurs sont quantitatives.
Les variables qualitatives sont celles dont les modalités sont des
expressions littérales (des mots) ou des qualités sur lesquelles les
opérations arithmétiques courantes n’ont aucun sens. Exemple : le
sexe, profession, état civil, Niveau d’études sont des variables
qualitatives.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 8 / 74
Variables quantitatives

Variables quantitatives
Il existe deux sortes de variables quantitatives.
Une variable quantitative est discrète si elle ne peut prendre que des
valeurs isolées, généralement entires.
Exemple : Nombre de frères, Années de travail etc.
Elle est continue si ses valeurs peuvent être n’importe lesquelles d’un
intervalle réel.
Exemple : Poids, taille etc.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 9 / 74
Variables qualitatives

Variables quantitatives
La nature (quantitative ou qualitative) d’une variable est une propriété
intrinsèque, qui ne dépend pas de la facon dont on note ses modalités ou
valeurs. On parlera des valeurs possibles prises par une variable quantitative
mais on préférera le terme de modalités pour une variable qualitative. Il
existe deux sortes de variables qualitatives.
Lorsque ses modalités possèdent un ordre naturel, la variable est
qualifiée d’ordinale.
Exemple : Niveau d’, Etat civil etc.
Lorsqu’il n’y a pas d’ordonnancement possible des modalités, on parle
de variable nominale.
Exemple : Sexe, Couleurs des cheveux, Marque de véhicules,
Commune d’habitation, Profession etc.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 10 / 74
Bref apercu du Cours

Plan du cours :
Ce cours comprend 3 parties reparties comme suit :
1 La premème partie du cours traite de la statistique descriptive
2 La deuxième partie du cours traite des éléments de probabilités, des
variables aléatoires et des distributions de probabilités.
3 La troisième partie du cours, c’est la statistique inférentielle. Nous y
présenterons la théorie statistique de l’estimation.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 11 / 74
Partie 1 : Statistique descriptive

Chapitre 1 : Collecte et Présentation des données statistiques


Une opération de collecte des données peut porter sur l’ensemble des
unités statistiques (population) ou sur une partie de ces unités
statistiques (échantillon).
Necessité de choisir un échantillon qui soit représentatif de la
population mère d’où il est extrait à cause des difficultés liés à une
collecte sur toute la population.
Un échantillon est dit représentatif s’il renferme toutes les
caractéristiques de la population.
Chaque élément de la population a une meme chance d’appartenir à
l’échantillon. Les unités statistiques doivent etre tirées au hasard
(échantillon aléatoire).

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 12 / 74
Méthodes d’échantillonnage

Types de méthodes d’échantillonnage


Il existe deux types de méthodes :
1 Les méthodes d’échantillonnage aléatoires ou probabilistes ;
2 Les méthodes non aléatoires ou à choix raisonné.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 13 / 74
Méthodes d’échantillonnage

Les méthodes d’échantillonnage aléatoires ou probabilistes


Elles consistent à analyser une fraction de la population supposée
représentative de la population d’étude et tirée de facon aléatoire. Il y a
1 Cas où la population est homogène ;
2 Cas où la population est hetérogène

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 14 / 74
Les méthodes d’échantillonnage aléatoires ou probabilistes

Cas où la population est homogène


Il s’agit de tirer les individus avec remise ou sans remise. On distingue :
1 Méthode d’échantillonnage aléatoire simple ;
2 Méthode d’échantillonnage aléatoire systématique

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 15 / 74
Méthode d’échantillonnage aléatoire à choix raisonné

Méthode des Quotas


L’échantillon obtenu par choix raisonné est constitué d’unités statistiques
ne sont pas tirées au hasard.
De ce fait, elles n’ont pas la meme chance d’appartenir à un échantillon.
On constitue un échantillon de manière à ce que certaines proportions
observées dans la population se retrouvent dans l’échantillon.
Dans les limites qui lui seront fixées, l’enqueteur reste libre
d’interroger les unités statistiques qu’il veut.
Il devra respecter les quotas qui lui sont imposés.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 16 / 74
1.2. Tableaux statistiques
Tableau du premier ordre

Ce type de tableau comprend une seule variable.

Figure : Cause de décès chez les malades dans un centre hospitalier


Prof. Apollinaire NDONDO ( L1 SCIENCES
Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 17 / 74
Tableaux statistiques
Tableau du deuxième ordre à double entrée

Ce type de tableau comprend une deux variable.

Figure : Distribution par âge et par sexe des cas de cancer de poumons au
cours d’une année dans les hôpitaux de Kindu.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 18 / 74
Tableaux statistiques
Tableau du deuxième ordre à triple entrée

Ce type de tableau comprend une deux variables.

Figure : Répartition par âge, par sexe et par groupe de malade des patients
ayant reçu des soins ambulatoires dans un centre de santé

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 19 / 74
Tableaux de contingence
Tableau à 2 variables ayant chacune un certain nombre des classes.

Ce type de tableau comprend une deux variables.

Figure : Etat nutritionnel et résultats scolaire de 70 élevés d’une secondaire


de Kinshasa.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 20 / 74
Tableaux de distribution de fréquences
Variable discrète

Ce tableau est construit en mettant dans la première colonne diverses


valeurs que prend la variable, en ordre croissant ; et dans la seconde
colonne, les effectifs correspondants (ou fréquences).

Figure : Distribution des fréquences du personnel d’un centre de santé


d’après le nombre d’enfants en charge

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 21 / 74
Tableaux de distribution de fréquences
Variable continue

Dans ce cas on regroupe les données en classes.

Figure : Distribution des fréquences des ouvriers d’une clinique suivant leur
l’âge.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 22 / 74
Tableaux des effectifs cumulés

1 En discret les effectifs cumulés sont les nombres d’observations


inférieure ou égale à une valeur donnée de la variable.
2 En continue les effectifs cumulés sont les nombres d’observations
inférieures ou égales aux limites supérieures d’une classe.

Les Ni sont les effectifs cumulés ou fréquences absolue cumulée.


Prof. Apollinaire NDONDO ( L1 SCIENCES
Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 23 / 74
Tableaux des effectifs cumulés

Figure : Tableau statistique générale de présentation des données

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 24 / 74
Représentation graphique des données
Cas discret : Polygone des fréquances

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 25 / 74
1.3. Représentation graphique des données
Cas discret : Polygone des fréquences

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 26 / 74
Représentation graphique des données
Cas continu : Histogramme des (effectifs) fréquences

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 27 / 74
Représentation graphique des données
Graphique en secteurs (circulaire)

Sur 250 étudiants entrès à la suite d’un concours à la faculté des sciences
1 13 soit 5.2% ont préparés le concours pendant 3 ans ; 96 soit 38.4%
2 192 soit 44.8% pendant 1 an et 29 soit 11.6% n’ont pas préparés. pendant 2 ans

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 28 / 74
Diagramme à colonnes
Diagramme à colonnes

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 29 / 74
1.4. Regroupement des données brutes en classes

Règles à suivre pour un regroupement de données en classes


Lorsque le nombre de valeurs est élevé, la prśentation sous forme de
tableau requiert de longs calculs.
On évite cette situation en effectuant un groupement des données en
classes.
Pour construire ces classes, on respecte les règles suivantes :
1 Le nombre de classes est compris en général entre 6 et 12
2 Les amplitudes des classes sont généralement égales.
3 Chaque classe (sauf la dernière) contient sa borne inférieure mais pas
sa borne supérieure.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 30 / 74
Regroupement des données brutes en classes

Procédure à suivre pour un regroupement de données en classes


1 Dt́ermination du nombre k des classes ;
2 La formule de Sturges donne le nombre de classes k à considérer :
k = 1 + 3, 3 × log10 n où n est la taille de la série statistique
3 Calcul de l’Etendue de la série statistique : E = valeurmax − valeurmin
4 L’ Amplitude d’une classe est donné par :
Etendue valeurmax − valeurmin
h= =
k k
5 Déterminer
 les classes ainsi que leur milieu :
bornesup + borneinf
Xi =
2
Si le nombre de classes est déterminé à l’avance, on ne le calcule plus.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 31 / 74
Exercices d’Application

1. Lors d’une etude, on a prélevé le poids (kgs) d’un échantillon de 50


étudiants souffrant des maux de tête. On a obtenu les résultats suivants :
47 82 61 46 76 80 48 74 80 73
75 69 67 45 79 90 65 40 73 84
44 79 71 76 84 92 84 41 72 73
75 97 77 44 54 87 71 81 56 59
60 51 86 76 98 82 59 51 49 88

Regrouper ces données en utilisant des classes de poids d’amplitude


10kgs du type suivant : [40, 50] ; [50, 60] ; . . .
Construire l’histogramme et l’ogive des fréquences cumulées de cette
distribution

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 32 / 74
Exercices d’Application

2. On prélève la taille de 60 étudiants inscrits à l’UNILU. Les résultats


trouvés (en cm) sont consignés dans le tableau suivant :
158 172 166 170 168 175 152 190 191 157
163 160 149 186 183 172 173 184 181 180
172 169 171 173 171 180 198 167 175 177
170 173 168 167 169 180 181 178 166 164
159 168 166 162 170 182 183 190 167 169
170 160 171 188 168 169 172 157 149 180

1 Grouper ces données par classes d’amplitude 5 cm


2 Construire l’histogramme et le polygone des fréquences
3 Construire la courbe des fréquences cumulées croissantes

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 33 / 74
Exercices (suite)

1 Je veux tirer un échantillon de 30 personnes au hasard dans une salle


de 110 étudiants (N = 110). Si je dois faire un tirage systématique,
quelles sont les étapes pour y arriver ?
2 Dans une population de 300 personnes je souhaite interroger 15
personnes. La population est composée de 200 hommes et 100
femmes. Tirez en un échantillon représentatif ?
3 Dans une ville qui compte 2 000 élèves en Classe de 6è primaire qui se
répartissent à 80% dans des écoles publiques et 20% dans des écoles
privées, vous souhaitez travailler sur les modalités d’apprentissage de
la lecture. Or une de partie de vos hypothèses se réfère au clivage
privé/public. Les moyens disponibles permettent d’interroger au
maximum 200 élèves. Comment allez-vous faire pour avoir un
échantillon représentatif ?

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 34 / 74
Chapitre 2 : Série statistique univariée

Introduction
Après avoir étudié comment collecter et présenter les données récoltées,
les objectifs poursuivis dans ce chapitre sont :
Résumer l’information contenue dans une série statistique.
Pour ce faire, on calcule des valeurs statistiques ou des paramètres
statistiques clés.
NOTA : En plus des tableaux et graphiques, les paramètres
statistiques ont pour but de résumer, à partir de quelques nombres
clés l’essentiel de l’information relative à l’observation d’une variable
quantitative.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 35 / 74
Chapitre 2 : Série statistique univariée

Les paramètres statistiques sont répartis en 3 grandes catégories


Catégories de paramètres statistiques
1 les paramètres dits de tendance centrale,
2 les paramètres dits de dispersion .
3 les paramètres dits de forme : asymétrie et aplatissement de la courbe
des fréquences

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 36 / 74
Paramètres de tendance centrale (ou de position)

Définition et Exemples
Les paramètres de tendance centrale, appelés aussi paramètres de position,
sont des paramètres qui ont tendance à se positionner au centre d’une
distribution (série) statistique.
Exemples :
Les moyennes (arithmétique, géométrique, harmonique) ;
Le Mode ;
La Médiane ;
Les Fractiles (quartiles, déciles, centiles).

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 37 / 74
Paramètres de tendance centrale (ou de position)
1. Les Moyennes
1.1 Moyenne arithmétique ou Moyenne X̄
La moyenne (arithmétique) est une valeur représentative d’un ensemble de
données, qui a tendance à se situer au milieu de cet ensemble. Elle
s’exprime dans les mêmes unités que les observations.
Calcul de la moyenne arithmétique d’une distribution discrète
Soit x1 , x2 , · · · , xn , n valeurs observées d’une série statistique, on a :
n
x1 + x2 + x3 + · · · + xn 1 X
X̄ = = xi
n n
i=1

Si les valeurs observées xi sont au nombre k et chacune avec sa fréquence


absolue ni , on utilise la formule pondérée :
k
n1 x1 + n2 x2 + n3 x3 + · · · + nk xk 1 X
ni xi où n = ki=1 ni
P
X̄ = =
n n
i=1
Prof. Apollinaire NDONDO ( L1 SCIENCES
Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 38 / 74
Exemples
Une étude sur la fréquentation d’une bibliothèque par les étudiants a
donnée les résultats contenus dans le tableau ci-dessous :
J1 J2 J3 J4 J5 J6 J7
10 12 15 25 8 16 4
Déterminer le nombre moyen d’étudiants qui fréquentent cette
bibliothèque par jour.

Déterminer le nombre moyen d’enfants en charge des employers dette


entreprise.
Prof. Apollinaire NDONDO ( L1 SCIENCES
Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 39 / 74
Moyenne Arithmétique

Cas de données groupées en classes


Il s’agit du cas où les données sont présentées sous forme des classes
(intervalles) de la forme [ai , bi [ auxquelles sont associés des effectifs ni .
Calcul de la moyenne arithmétique d’une distribution groupée
Dans ce cas, on a : on utilise la formule pondérée :
k
n1 x1 + n2 x2 + n3 x3 + · · · + nk xk 1 X
X̄ = = ni x i
n n
i=1

Avec
xi = milieu de la classe i donné par xi = ai +b
2 ;
i

ni =effectif de la classe i et n = ki=1 ni et


P

k = nombre des classes.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 40 / 74
Exemple :

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 41 / 74
Moyenne géométrique

Cas d’une série discrète

Calcul de la moyenne géométrique G


La moyenne géométrique notée G d’une série statistique des n valeurs
positives x1 , x2 , · · · , xn est la racine neme de leur produit et on a :

G= n
x1 .x2 . · · · .xn

Exemple : Calculer la moyenne géométrique de la série statistique : 5, 13,


18, 23, 35 √ √
Solution : G = 5 5 × 13 × 18 × 23 × 35 = 5 941850 = 15, 66

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 42 / 74
Moyenne géométrique

Cas d’une série groupée

Calcul de la moyenne géométrique G


Dans le cas d’une série des données groupées et on a :
G = n x1n1 .x2n2 . · · · .xnnn
p

xi =milieu de la classe i ;
ni = effectif de la classe i ;
n = ki=1 ni
P

Exemple : Calculer la moyenne géométrique de la série statistique :

Tranche d’âge [20,30[ [30,40[ [40,50[ [50,60[


Effectif 4 5 6 5

20
Solution : G = 254 × 355 × 456 × 555 = 39, 50 ≈ 40

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 43 / 74
Moyenne géométrique

Dans quel cas utilisé la moyenne géométrique G


Il est recommandé d’utiliser la moyenne arithmétique en lieu et place de la
moyenne arithmétique lorsqu’il s’agit de calculer la moyenne des taux de
croissance, par exemple.
NOTA : Dans tous les cas, on a toujours : G < X̄
Exemple Calculer le taux de croissance moyen de revenu / habitant entre
1985 et 1990.

Année 1985 1986 1987 1988 1989 1990


Revenu/hab 457 461 477 497 518 545
taux de croiss -0,88% 3,47% 4,19% 4,23% 5,21 %

Solution : G = 5 0, 88 × 3, 47 × 4, 19 × 4, 23 × 5, 21 = 3, 091%
X̄ = 51 (0, 88 + 3, 47 + 4, 19 + 4, 23 + 5, 21) = 17, 98%/5 = 3, 596%

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 44 / 74
Moyenne Harmonique H

Calcul de la moyenne harmonique H


La moyenne harmonique notée H d’une série de n valeurs est le nombre
dont l’inverse est égale à la moyenne arithmétique des inverses des n
valeurs.
n
H=P  
n 1
i=1 xi

Exemple
Calculer la moyenne harmonique de la série : 7, 8, 13, 18, 24
Solution
5
H= = 11, 31
( 71 + 1
8 + 1
13 + 1
18 + 1
24 )

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 45 / 74
Moyenne Harmonique H

Remarques sur H
La moyenne harmonique n’est pas d’usage courant.
Elle est une bonne mesure de tendance centrale quand les valeurs de la
série sont des taux.
Exemple : Supposons qu’une dactylographe peut taper 40 lettres par heure,
60 factures par heure, 80 cartes de voeux par heure. Quel est le nombre
moyen des documents peut-elle dactylographier par heure ?
Solution : Si l’on appliquait la formule de la moyenne arithmétique, la
moyenne serait : X̄ = 40+60+80
3 = 60
Remarque
Cette moyenne ne fournit pas une information correcte car elle suppose que
la vitesse pour dactylographier une lettre est la même que celle requise
pour taper une facture ou une carte.
Ce qui n’est pas vrai.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 46 / 74
Moyenne Harmonique H

Remarques sur H (suite)


L’utilisation de la moyenne harmonique donnerait :
3
H= 1 1 1
= 55, 38
( 40 + 60 + 80 )

La dactylographe peut taper en moyenne 55 documents par heure.


Remarque
Dans tous les cas, on a toujours :

H < G < X̄

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 47 / 74
2. Le Mode Mo
Dans plusieurs séries statistiques, certaines valeurs apparaissent plusieurs
fois. C’est d’ailleurs le sens même de la notion de fréquence. La valeur qui
apparaît le plus grand nombre de fois dans la série est le mode.
Le mode est la valeur correspondant à la fréquence la plus élevée.
Calcul du Mode
Cas d’une distribution discrète
Soit donnée une série statistique de n valeurs discrètes x1 , x2 , · · · , xn
1 Construire la distribution de fréquence de la série ;
2 Repérer la valeur ayant la fréquence la plus élevée ;
3 Cette valeur correspond au Mode de la série.
Age (ans) 18 19 20 21 22
Exemple
Effectif 12 15 32 10 14
Dans ce cas, l’age modal est Mo = 20 ans

Le Mode s’exprime dans les mêmes unités que les observations


Prof. Apollinaire NDONDO ( L1 SCIENCES
Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 48 / 74
Remarques sur le Mode Mo

Remarques sur le Mo
Une série peut ou ne pas avoir de mode.
Une série peut être sans mode, elle est dite amodale
Une série peut avoir un seul mode, elle est dite unimodale
Une série peut avoir 2 modes, elle est dite bimodale
Une série peut avoir plusieurs modes, elle est dite multimodale

12, 13, 15, 11, 16, 20, 21, 14 : Série amodale


14, 15, 16, 15, 16, 16, 13, 11, 14, 17 : Série unimodale (Mo = 16)
14, 13, 15, 16, 15, 14, 17,12 : Série bimodale (Mo1 = 14, Mo2 = 15)
14, 12, 15, 14, 15, 12, 13, 16, 17, 16 : Série multimodale

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 49 / 74
le Mode Mo
Cas de données groupées en classes
Il s’agit du cas où les données sont présentées sous forme des classes
(intervalles) de la forme [ai , bi [ auxquelles sont associés des effectifs ni .
Calcul du Mode d’une distribution groupée
Dans ce cas, on a : on utilise la formule d’extrapolation :
 
∆1
Mo = ai + hi
∆1 + ∆ 2

Avec
La classe modale correspond à celle ayant le plus grand effectif ;
ai = borne inférieure de la classe modale ;
hi = l’amplitude de la classe modale ;
∆1 =effectif de la classe modale-effectif de la classe précédent la classe
modale (ni − ni−1 )
∆2 =effectif de la classe modale-effectif de la classe suivant la classe
Prof. Apollinaire NDONDO ( L1 SCIENCES
Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 50 / 74
Exemple :

Déterminer le Mode
Tranche d’âge [10,20[ [20,30[ [30,40[ [40,50[ [50,60[ [60,70[
Effectif 4 5 6 12 8 6
1 Détermination de la classe modale : classe ayant le plus grand effectif :
[40, 50[
2 Par suite, on a :
ai = 40, hi = 50 − 40 = 10, ∆1 = 12 − 6 = 6, ∆2 = 12 − 8 = 4
 
6
3 D’où Mo = 40 + 10 6+4 = 46

Si la classe modale est la première alors ni−1 = 0,


Si la classe modale est la dernière alors ni+1 = 0,
S’il existe deux classes modales, alors, il y aura deux modes.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 51 / 74
3. La Médiane Me ou X1/2
La médiane est la valeur qui divise la série en deux parties de taille égale.
La Médiane s’exprime dans les mêmes unités que les observations
Calcul de la Médiane
Cas d’une distribution discrète
1 Classer les valeurs de la série en ordre croissant ;
2 Si le nombre d’observations est impair, la médiane est la valeur juste
au milieu de la série ordonnée ( Me = X n+1 ) ;
2
3 Si le nombre d’observations est pair, la médiane est le point milieu des
X n +X n +1
deux valeurs au centre de la série (Me = 2
2
2
).

Exemple
Age (ans) 18 19 20 21 22
Effectif 12 15 32 10 14
Cumul observ. 1-12è 13è- 27è 28è-59è 60è-69è 70è-83è
Me = X n+1 = X 83+1 = X42 = 20 ans
2 2
Prof. Apollinaire NDONDO ( L1 SCIENCES
Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 52 / 74
Exemples :

Exemple 1 :
Déterminer la médiane de la série : 12, 12, 13, 25, 24, 28, 20, 18,15, 10, 14
Solution :
Ordonnant la série : 10, 12, 12, 13, 14, 15, 18, 20, 24, 25, 28
n = 11 impair donc, Me = X 11+1 = X6 = 15
2

Exemple 2 :
Déterminer la médiane de la série : 12, 12, 13, 25, 24, 28, 20, 18,10, 14
Solution :
Ordonnant la série : 10, 12, 12, 13, 14, 18, 20, 24, 25, 28
n = 10 pair donc,
(X 10 )+(X 10 +1 )
(X5 )+(X5+1 ) X5 +X6 14+18
Me = 2
2
2
= 2 = 2 = 2 = 16

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 53 / 74
La Médiane Me

Cas de données groupées en classes


Calcul du Mode d’une distribution groupée
Dans ce cas, on a : on utilise la formule d’extrapolation :
n
2 − Ni−1

Me = ai + hi
ni

Avec
ne
La classe médiane est celle où se trouve la 2 observation ;
ai = borne inférieure de la classe médiane ;
hi = l’amplitude de la classe médiane ;
P
n= ni = taille de l’échantillon ;
Ni−1 =effectif cumulé de la classe précédent la classe médiane
ni =effectif simple de la classe médiane

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 54 / 74
Exemple :

Déterminer la médiane
Tranche d’âge [10,20[ [20,30[ [30,40[ [40,50[ [50,60[ [60,70[
Effectif 4 5 6 12 18 6
Cumul observ. 1er-4è 5è- 9è 10è-15è 16è-27è 28è-45è 46è-51è
ne
1 Détermination de la classe médiane : classe où se trouve la 2
e
observation, cad la 51 e
2 = 26 observation : [40, 50[
2 Par suite, on a :
ai = 40, hi = 50 − 40 = 10, n2 = 51
2 = 25, 5 , Ni−1 = 15, n1 = 12
 
3 D’où Mo = 40 + 10 25,5−15
12 = 48, 75

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 55 / 74
Calcul de la Médiane

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 56 / 74
4. Les Fractiles

Lorsque le nombre d’observations est très élevé, on s’intéresse parfois à des


valeurs qui divisent la série en quelques parties égales.
On appelle fractiles d’ordre n certaines valeurs qui divisent (fractionnent)
la série en n parties égales.
On distingue :
1 Les Quartiles (Q1, Q2 , Q3 ) ou (Q1/4 , Q1/2 , Q3/4 )
2 Les Déciles (D1 , D2 , · · · , D9 )
3 Les Centiles (C1 , C2 , · · · , C99 )

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 57 / 74
4.1 Les Quartiles

4.1 Les Quartiles


On appelle Quartiles les 3 valeurs notées Q1 , Q2 et Q3 qui divisent la
série statistique en 4 parties égales.
On les note parfois Q1/4 ou Q25 , Q1/2 ou Q50 et Q3/4 ou Q75 .
Notez que Q1/2 correspond à la médiane.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 58 / 74
4.1. Les Quartiles

Calcul des Quartiles


De manière générale, on a la formule suivante pour calculer le quartile
d’ordre k : !
n.k
4 − N i−1
Qk = ai + hi
ni

La classe de Qk est celle où se trouve la ( n.k e


4 ) observation ;
ai = borne inférieure de la classe de Qk ;
hi = l’amplitude de la classe de Qk ;
n = taille de l’échantillon ;
Ni−1 =effectif cumulé de la classe précédent la classe de Qk
ni =effectif simple de la classe de Qk
k ∈ {1, 2, 3}

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 59 / 74
4.1. Les Quartiles

Calcul des Quartiles


Plus explicitement, on a :
n
4 − Ni−1

Q1 = ai + hi Recherchez la (n/4)e observation
ni
n
2 − Ni−1

Q2 = ai + hi Recherchez la (n/2)e observation
ni
!
3n
4 − N i−1
Q3 = ai + hi Recherchez la (3n/4)e observation
ni

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 60 / 74
Calcul des quartiles

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 61 / 74
4.2. Les Déciles
Calcul des Déciles
On appelle Déciles les 9 valeurs notées D1 , D2 , · · · , et D9 qui divisent la
série statistique en 10 parties égales.
De manière générale, on a la formule suivante pour calculer le décile
d’ordre k : !
n.k
10 − N i−1
Dk = ai + hi
ni

La classe de Dk est celle où se trouve la (n.k)e observation ;


ai = borne inférieure de la classe de Dk ;
hi = l’amplitude de la classe de Dk ;
n = taille de l’échantillon ;
Ni−1 =effectif cumulé de la classe précédent la classe de Dk
ni =effectif simple de la classe de Dk
k ∈ {1, 2 , 3, · · · 8, 9}
Prof. Apollinaire NDONDO ( L1 SCIENCES
Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 62 / 74
4.2. Les Déciles

Calcul des Déciles


Plus explicitement, on a :
 n
10 − Ni−1

D1 = ai + hi Recherchez la (n/10)e observation
ni
!
2n
− N i−1
D2 = ai + hi 10 Recherchez la (2n/10)e observation
ni
!
kn
− N i−1
Dk = ai + hi 10 Recherchez la (kn/10)e observation
ni
.. .. ..
. . .
!
9n
10 − Ni−1
D9 = ai + hi Recherchez la (9n/10)e observation
ni

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 63 / 74
4.3. Les Centiles
Calcul des Centiles
On appelle Centiles les 99 valeurs notées C1 , C2 , · · · , et C99 qui divisent
la série statistique en 100 parties égales.
De manière générale, on a la formule suivante pour calculer le décile
d’ordre k : !
n.k
− N i−1
Ck = ai + hi 100
ni

La classe de Ck est celle où se trouve la (n.k)e observation ;


ai = borne inférieure de la classe de Ck ;
hi = l’amplitude de la classe de Ck ;
n = taille de l’échantillon ;
Ni−1 =effectif cumulé de la classe précédent la classe de Ck
ni =effectif simple de la classe de Ck
k ∈ {1, 2 , 3, · · · 98, 99}
Prof. Apollinaire NDONDO ( L1 SCIENCES
Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 64 / 74
II. Paramètres de dispersion

Paramètres de dispersion
On appelle paramètres de dispersion, des valeurs qui mesurent les écarts de
différentes valeurs de la série par rapport à la valeur centrale ( la Moyenne
arithmétique ).
Parmi les paramètres de dispersion les plus répandus ,nous pouvons citer :
l’Etendue ;
la Variance ;
l’Ecart-type (déviation standard) et
le coefficient de variation

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 65 / 74
Paramètres de dispersion

1. L’Etendue
On appelle Etendue d’une série statistique donnée, la valeur notée E
représentant la différence entre la plus grande valeur et la plus petite valeur
de cette série statistique.

E = Val max − Val min

où Val max est la plus grande valeur de la série et Val min la valeur plus
petite de la série statistique.
Cette formule est utilisée aussi bien pour les séries des données groupées
que pour les séries des données discrètes.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 66 / 74
Paramètres de dispersion
2. La Variance
On définit la Variance, notée S 2 ou σ 2 ou parfois SD2 d’une série
statistique donnée comme étant la moyenne des carrés des écarts de
diverses valeurs de la série statistique vis-à-vis de la moyenne arithmétique.
Cas des données discrètes
Soit donnée une série statistique de n données discrètes : x1 , x2 , x3 , · · · xn
de moyenne arithmétique X , on a :
n
2 (x1 − X )2 + (x2 − X )2 + · · · + (xn − X )2 + 1 X
S = = (xi − X )2
n n
i=1

Exemple : Déterminer la variance de la série : 10, 15, 5, 25, 15


10 + 15 + 5 + 25 + 15
Solution : X = = 14 et Par suite,
5
(10 − 14)2 + (15 − 14)2 + (5 − 14)2 + (25 − 14)2 + (15 − 14)2
S2 = ≈
5
20
Prof. Apollinaire NDONDO ( L1 SCIENCES
Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 67 / 74
Paramètres de dispersion

2. La Variance (cas continu)


Cas des données continues (groupées)
n
1 X
S2 = ni (xi − X )2
n
i=1

ni est l’effectif de la classe i
n = ki=1 ni
P

xi est le milieu de la classe i,


Exemple :
Tranche d’âge [10,20[ [20,30[ [30,40[ [40,50[ [50,60[ [60,70[
Effectif 13 5 6 12 18 6

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 68 / 74
Paramètres de dispersion

3. L’Ecart-type (Déviation standard)


On appelle Ecart-type ou Déviation standard la racine carrée positive de
la variance. Il est noté S ou σ ou SD .
Dansrle cas, d’une série des données discrètes, on a :
1 Pn 2
S= i=1 (xi − X )
n
Dansrle cas, d’une série des données continues (groupées), on a :
1 Pn 2
S= i=1 ni (xi − X )
n
Exemple :
Tranche d’âge [10,20[ [20,30[ [30,40[ [40,50[ [50,60[ [60,70[
Effectif 13 5 6 12 18 6

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 69 / 74
Paramètres de dispersion

4. Coefficient de variation (C.V)


On appelle Coefficient de variation noté C .V le rapport
S
C .V =
X

S est l’écart-type ;
X la moyenne arithmétique ;
NOTA : le C .V est une quantité pure (sans unité), elle permet de
comparer la dispersion entre 2 ou plusieurs séries distinctes.
Si CV1 > CV2 , la série 1 est plus dispersée que la série 2.
Si C .V ≥ 17% la série est fortement dispersée ;
Si C .V < 17% la série est faiblement dispersée ;

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 70 / 74
III. Paramètres de Forme

Ce sont des paramètres qui caractérisent la forme de la courbe de


fréquences. Ils permettent d’étudier l’asymétrie et l’aplatissement de la
courbe.
III.1. Coefficients d’asymétrie.
X − M0
A. Coefficient d’Asymétrie de SKEWNESS noté SK = ;
S
Si SK = 0, la distribution est symétrique ;
Si SK > 0, la distribution est dissymétrique à droite ;
Si SK < 0, la distribution est dissymétrique à gauche ;
NOTA :
SK = 0 si , X = M0 , la distribution est symétrique ;
SK > 0, si X > M0 , la distribution est dissymétrique à droite ;
SK < 0, si X < M0 , la distribution est dissymétrique à gauche.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 71 / 74
III. Paramètres de Forme

III.1. Coefficients d’asymétrie (suite)


m3
A. Coefficient d’asymétrie de FISHER noté g1 = ; avec
S3
1 Pn 3
m3 = i=1 ni (xi − X ) , moment centré d’ordre 3 ;
n
r !3
1 n
S3 = 2
P
i=1 ni (xi − X ) ,
n
NOTA :
Si g1 = 0, la distribution est symétrique ;
g1 > 0, la distribution est dissymétrique à droite ;
g1 < 0, la distribution est dissymétrique à gauche.

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 72 / 74
III. Paramètres de Forme
Quid de l’asymétrie (ou dissymétrie)
Une distribution est asymétrique si une de ses queues (ses étalements)
est plus longue que l’autre ;
Une distribution asymétrique positive est telle qu’elle a une longue
queue dans la direction positive, dans ce cas, elle est aussi dite
distribution asymétrique à droite ;
Une distribution asymétrique négative est telle qu’elle a une longue
queue dans la direction négative. Elle est aussi dite distribution
asymétrique à gauche ;
Une distribution symétrique n’a pas de queue. Les étalements à
gauche et à droite de la moyenne sont symétriques.
Lorsque les trois paramètres de position mode, médiane et moyenne
sont à peu près alignés sur la même valeur ou la même classe, cela
indique généralement une distribution relativement symétrique des
observations.
Prof. Apollinaire NDONDO ( L1 SCIENCES
Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 73 / 74
III. Paramètres de Forme

III.2. Coefficients d’aplatissement.


m4
Coefficient d’Aplatissement de FISHER noté b2 = ; avec
S4
1 Pn 4
m4 = i=1 ni (xi − X ) , moment centré d’ordre 4 ;
n
r !4
1 n
S4 = 2
P
i=1 ni (xi − X ) ,
n
NOTA :
Si b2 = 3, la distribution est normale ou mésocurtique ;
Si b2 > 3, la distribution est aiguë ou leptocurtique ;
Si b2 < 3, la distribution est aplatie ou platycurtique ;

Prof. Apollinaire NDONDO ( L1 SCIENCES


Cours
TECHNOLOGIQUES)
de PROBABILITE ET STATISTIQUE 2 décembre 2021 74 / 74

Vous aimerez peut-être aussi