Vous êtes sur la page 1sur 48

Statistique descriptive à un caractère

Introduction générale à la statistique

5 octobre 2022

Filière: Orientation

1/48
Plan du cours

1. Statistique descriptive à un caractère (S1 )


• Population et Unités Statistiques
• Différents types de caractères et de Variables statistiques
• Tableaux et graphes des distributions à un caractère
• Caractéristiques de tendance centrale
• Caractéristiques de dispersion
• Caractéristiques de forme et de concentration
2. Statistique descriptive à deux caractères (S2 )
• Distributions à deux caractères et présentation des données
• Étude de la liaison entre deux variables : régression, ajustement,
corrélation
3. Probabilités et variables aléatoires (S2 )
• Notion fondamentale des probabilités
• Probabilité conditionnelle
• Théorème de Bayes
• Variables aléatoires : Définitions, loi de probabilité, Fonction de
répartition, Espérance mathématique, variance
2/48
TD, TP et évaluation

TD et TP
□ Exercices
□ Logiciel statistique SPSS

Modalités d’évaluation
□ Partiel : 50% vers le mois de février
□ Examen de passage : 50% vers le mois de juin

3/48
Chapitre 1 : Définitions
fondamentales et concepts usuels

4/48
1. Définitions fondamentales

1.1. la statistique :
La statistique est un ensemble de méthodes et techniques permettant
de décrire et d’ analyser, de façon quantifiée, des phénomènes repérées
par des éléments nombreux, de même nature, susceptibles d’être
dénombrés et classés.

5/48
1. Définitions fondamentales

Remarques :
• Il s’agit des méthodes dites statistiques, plutôt que théorie ou
modèle idéal ; c’est l’utilisateur qui porte un jugement sur le
phénomène ; la statistique n’est qu’un outil préalable d’investigation.
• Ces méthodes statistiques permettent de passer de la donnée à la
connaissance, et relèvent essentiellement des mathématiques et font
appel a l’outil informatique. Elles portent sur le traitement, l’analyse
et la transmission :

6/48
1. Définitions fondamentales

Remarques :
✓ Identifier le problème.
✓ Collecter les données.
✓ Classer et synthétiser les données.
✓ Présenter les données.
✓ Analyser les données.
✓ Interpréter les résultats obtenus afin de prendre la
meilleure décision.

7/48
1. Définitions fondamentales

Remarques :
Ï On distingue habituellement entre deux grandes parties dans
l’enseignement de la statistique :
✓ la première se fait généralement en première année du
COPE , et est consacrée à la statistique descriptive, dont
le but est de décrire de façon formalisée des informations
collectées de façon exhaustive, à travers :
• leur présentation numérique la plus commode
possible,
• Leur présentation graphique,
• Le calcul de caractéristiques numériques.

8/48
1. Définitions fondamentales

Remarques :
✓ La seconde que l’on enseigne en général en deuxième
année du COPE, concerne la statistique inférentielle (ou
mathématique) qui s’appuie sur la première pour formuler
des lois de comportement à partir d’observations
incomplètes. Son rôle est essentiellement explicatif et
prévisionnel (estimations, tests, échantillonnages,
sondages).

9/48
2. Terminologie de base

On va présenter ici des termes statistiques très courants qui concernent la


collecte d’information et sa transformation en chiffres et données
quantifiées et que relèvent d’une terminologie précise
a. Population :
C’est le champ de l’étude de la statistique, ou l’ensemble concerné par
de telles études.

Exemples :
• Les stagiaires du COPE de la promotion 2022, issues du cycle
primaire ;
• Flux : Les demandes d’emplois déposées à l’Anapec au cours du
mois de septembre 2022 ;
• Les élèves du tronc commun ayant une orientation technologique ;

10/48
2. Terminologie de base

Exemples :
• Ensemble de biens matériels : l’ensemble des PME des Maroc au
cours de l’année 2022 ;
• Ensemble de biens immatériels : les consultations annuelles de tel
médecin généraliste ;
• Ensembles non concrets : les intentions de vote à telle élection, les
accidents de la route dûs à l’excès de vitesse ;
• Stocks d’objets concrets : les classes multimédia dans une direction
durant l’année courante

11/48
2. Terminologie de base

b. Unité statistique :
L’unité statistique n’est qu’un élément de l’ensemble que le statisticien
veut étudier. les unités statistiques peuvent être aussi bien des individus,
que des ensembles d’objets comme les écoles, les équipements, etc...

Exemples :
• Un stagiaire du COPE de la promotion 2022 issu du cycle primaire ;
• Un stagiaire du COPE de la promotion 2022, ayant licence en
mathématiques ;
• Un élève du tronc commun ayant une orientation bac professionnel ;
• Une PME du Maroc au cours de l’année 2022 ;
• Une classe multimédia de la direction de Fès-médina au cours de
l’année courante.

12/48
2. Terminologie de base

c. échantillon :
Tout sous ensemble aussi ∽ représentatif ∼ que possible de la
population.

Exemples :
• Un stagiaire du COPE de la promotion 2022 de la direction de
Rabat ;
• Les élèves de la troisième année collégiale redoublant et ayant moins
de 18 ans ;
• Les PME de la région de Casablanca, au cours de l’année 2022 ;
• Les stagiaires des COPE sexe féminin issus du cycle collégial de la
promotion 2022.

13/48
2. Terminologie de base

d. Taille de l’échantillon :
C’est le cardinal de l’échantillon, ie le nombre d’individus qu’il contient
noté généralement par n.

Exemples :
Echantillon de taille 30 , de taille 100, etc...

14/48
2. Terminologie de base

e. Enquête :
C’est l’opération technique qui consiste à élaborer les statistiques, et
prend des noms différents, selon la manière dont on mène l’enquête.

f. Recensement :
C’est une enquête dans laquelle l’échantillon observé et en fait la
population tout entière. On dira également : enquête exhaustive.

15/48
2. Terminologie de base

Remarque :
Il faut distinguer entre recensement et dénombrement.
Ce dernier n’est que le comptage des individus de la population. Le
recensement, par contre, consiste à chiffrer ou du moins à coder les
données pour chaque individu ou unité statistique de la population
enquêtée sur tel ou tel aspect de sa constitution (âge, état matrimonial,
chiffre d’affaires, ... ).
Au Maroc, on organise, de façon plus ou moins régulière, le
recensement général de la population, qui est une opération coûteuse et
demandant une organisation très structurée.

16/48
2. Terminologie de base

g. Sondage ou enquête partielle :


c’est une enquête dans laquelle l’échantillon observé est un
sous-ensemble strict aussi représentatif que possible de la population.
On l’appelle aussi : enquête partielle ou non exhaustive. La qualité des
sondages dépend dans une large mesure du choix de cet échantillon.

17/48
2. Terminologie de base

h. les caractères :
Pour décrire une population, on repère et on classe les individus en
sous-ensembles appelés caractères. Il arrive souvent que l’on confonde
unité statistique et son caractère. En effet ce dernier n’est que l’aspect
de l’unité statistique que l’on retient dans l’analyse.

Exemples :
• Chaque stagiaire du COPE peut être considéré du point de vue d’un
ou de plusieurs caractères : sexe, âge, formation antérieure, cycle,
salaire, nombre d’enfants à charge ;
• La population statistique des écoles peut être décrite suivant les
caractères : Salles superficie, chaises, capacité d’accueil,...

18/48
2. Terminologie de base

i. Modalités :
Chacun des caractères étudiés peut présenter deux ou plusieurs
situations différentes qu’on appelle modalités.

Exemples :
• Le caractère sexe comporte en lui même deux modalités qui sont
masculin ou féminin ;
• Le caractère cycle professionnel d’un stagiaire peut se décomposer
en quatre modalités cycle primaire cycle collégial, cycle qualifiant,
cycle d’agrégation ;
• Le caractère état matrimonial peut se décomposer en quatre
modalités : marié, célibataire, veuf ou divorcé.

19/48
2. Terminologie de base

Remarques :
✓ Les différentes modalités d’un caractère doivent être incompatibles,
exhaustives et sans ambiguïté.
✓ Lors du classement des unités statistiques d’une population, on
envisage fréquemment des ∽ non-réponses ∼ on des cas ambigus,
on les Classe donc dans une modalité∽ divers ∼ ou ∽non
déclarées ∼ à condition que la part de cette dernière ne fausse pas
l’interprétation des résultats.

20/48
2. Terminologie de base

j. Typologie des caractères :


On peut distinguer deux types de variables :

j-1. Caractère qualitatif :


Un caractère est dit qualitatif Lorsque ses modalités ne sont pas
numériques, ou bien, ne sont pas mesurables, elles traduisent
simplement un "état".
Exemples :
Couleur, catégorie socioprofessionnelle, sexe, nationalité...

21/48
2. Terminologie de base

Remarque :
Il existe deux types de caractères qualitatifs :

• Ordinal : Un caractère est dit qualitatif ordinal quand les modalités


peuvent être ordonnées ;
Exemples : Mention au bac, taille d’un vêtement. . .
• Nominal : Le caractère est dit qualitatif nominal quand les modalités
ne peuvent pas être ordonnées.
Exemples : Secteur d’activités, état civil, sexe. . .

22/48
2. Terminologie de base

j-2. Caractère quantitatif :


Un caractère est dit quantitatif si les modalités qui est le caractérisent
sont mesurables. le caractère quantitatif prend alors le nom de variable
statistique et ses différentes modalités sont les valeurs possibles de la
variable.
Exemples : Nombre d’enfants par ménage, taille, poids, salaire

23/48
2. Terminologie de base

Remarque :
Il existe deux types de variables statistiques :

• Variable statistique discrète : une variable statistique est dite


discrète si les valeurs qu’elle peut prendre sont des nombres isolés,
finis, entiers. Les modalités des caractères ( ou, ce qui revient au
même : les valeurs de la variable) seront, soit des valeurs exactes
(0 ;1 ; 2 ; 3 ;. . .), soit des regroupements de valeur en classe (moins
de 2 enfants ; de 2 à 4 enfants ; de 4 à 6 enfants etc . . .)
Exemples : Nombre d’années d’études après le bac, nombre
d’enfants par ménage...

24/48
2. Terminologie de base

Remarque :
• Variable statistique continue : une variable statistique est dite
continue lorsque les modalités qui lui sont associées ne prennent pas
des valeurs numériques précises, mais sont des valeurs en nombre
infini à l’intérieur des intervalles dans R appelés classes.
Exemples : Les grandeurs liées au temps (âge, vitesse), à la
monnaie (salaire ,chiffre d’affaires), à l’espace (longueur, surface),
etc, sont des variables statistiques continues.

25/48
2.1 Exercices

Exercice 1
Identifier l’unité statistique, la population statistique, le caractère,
modalités, et le type de variable

Personnel d’un établissement scolaire selon le sexe


Masculin
Féminin

Exercice 2
Pour chacune des variables suivantes, préciser si elle est qualitative,
quantitative discrète ou quantitative continue :
(a) Revenu annuel (b) Citoyenneté. c) Distance
(d) Taille (e) Lieu de résidence (f) Âge
(g) Couleur des yeux (h) Nombre de langues parlées

26/48
2.1 Exercices

Exercice 3
Pour les sujets d’étude qui suivent, spécifie : l’unité statistique, la
variable statistique et son type :
1. Étude du temps de validité des lampes électriques.
2. Étude de l’absentéisme des ouvriers, en jours, dans une usine.
3. Répartition des étudiants d’une promotion selon la mention obtenue
sur le diplôme du Bac.

27/48
2.1 Exercices

Exercice 4
1. Proposer des exemples de variable quantitative transformée en
variable qualitative. Préciser les modalités de cette dernière.
2. Est ce qu’on peut faire l’inverse ? Si la réponse est affirmative,
donner des exemples concrets.

28/48
3. Notations et symboles et rappel de notions mathéma-
tiques :

3.1 Notations indicées


Par simplicité, on notera une variable statistique par une lettre :
X , Y , Z ....
Soit X une variable observée sur les individus d’une population, (ou
échantillon), de taille n. Il est indispensable de pouvoir présenter
symboliquement la valeur de la variable X correspondant à chacun des
n individus étudiés.
On distingue par la valeur de la variable X relative à l’individu i. La
lettre i est appelée indice.
Cet indice peut prendre n’importe laquelle des valeurs :

1, 2, 3, ....., j − 1, j , j + 1....., n,

29/48
3. Notations et symboles et rappel de notions mathéma-
tiques :

3.1 Notations indicées


auxquelles correspondent, respectivement, les valeurs :

x1 , x2 , x3 , ....., xj −1 , xj , xj +1 , ....., xn .

La notation xj −1 < xj se lit xj −1 précède xj et xj +1 > xj se lit xj +1 suit xj .

30/48
3. Notations et symboles et rappel de notions mathéma-
tiques :

3.2 Les opérateurs «somme» et «Produit» : et


P Q

L’opérateur :
P

Pour raccourcir une écriture qui comporte la somme des valeurs xi


d’une variable X , on utilise le symbole . Ainsi, au lieu d’écrire
P

x1 + x2 + x3 + ..... + xn ,
iX
=n
il est plus commode d’écrire xi , qui est par définition :
i =1

iX
=n
xi = x1 + x2 + x3 + ...... + xn .
i =1

31/48
3. Notations et symboles et rappel de notions mathéma-
tiques :

3.2 Les opérateurs «somme» et «Produit» : et


P Q

L’opérateur :
P

On peut écrire aussi :


iX
=n n
X n
X
xi = xi = xi .
i =1 i =1 1

32/48
3. Notations et symboles et rappel de notions mathéma-
tiques :

3.2 Les opérateurs «somme» et «Produit» : et


P Q

Propriétés du symbole :
P

- Si chaque terme est multiplié par une constante << a >>, on peut la
mettre en facteur commun :

ax1 + ax2 + . . . + axi + . . . + axn = a (x1 + x2 + . . . + x1 + . . . + xn )

Donc ni=1 axi = a ni=1 xi


P P

Ï Décomposition des sommes : Si, pour tout i , xi = yi + zi + wi , alors :


n
X n
X n
X n
X n
X
xi = (yi + zi + wi ) = yi + zi + wi
i =1 i =1 i =1 i =1 i =1

33/48
3. Notations et symboles et rappel de notions mathéma-
tiques :

3.2 Les opérateurs «somme» et «Produit» : et


P Q

Propriétés du symbole :
P

Si ∃b tel que 1 < b < n, alors :


b
X n
X n
X
xi + xi = xi
i =1 i =b +1 i =1

Applications :
n
Ï Sommation d’une constante a : a = |a + a + a{z+ . . . + a} = n · a Donc
X
i =1
n fois
n
X n
X
(xi + a) = xi + n · a
i =1 i =1
n n
et
X X
axi = a xi
i =1 i =1

34/48
3. Notations et symboles et rappel de notions mathéma-
tiques :

3.2 Les opérateurs «somme» et «Produit» : et


P Q

Ï Application des «identités remarquables» :


n n n
(xi + a)2 ≡ xi2 + n · a2 + 2a xi
X X X
i =1 i =1 i =1

n n n n
et (xi + yi )2 ≡ xi2 + yi2 + 2 xi yi
X X X X
i =1 i =1 i =1 i =1

35/48
3. Notations et symboles et rappel de notions mathéma-
tiques :

3.2 Les opérateurs «somme» et «Produit» : et


P Q

L’opérateur :
Q

Ï Définition : Quand une variable statistique prend les valeurs


x1 , x2 , x3 , . . . , xn , on symbolise leur produit par :
n
Y
x1 .x2 .x3 . . . ..xn = xi
i =1

Ï Propriétés du symbole ::
Q

n n
axi = an
Y Y
xi :
i =1 i =1

la constante «sortie» du symbole est élevée à la puissance ”n”.


36/48
3. Notations et symboles et rappel de notions mathéma-
tiques :

3.2 Les opérateurs «somme» et «Produit» : et


P Q

L’opérateur :
Q

b n n
si b < n
Y Y Y
xi · xi = xi
i =1 i =b +1 i =1
n
et : a = an
Y
i =1
n n n
de même
Y Y Y
xi yi = xi × yi
i =1 i =1 i =1

37/48
3. Notations et symboles et rappel de notions mathéma-
tiques :

Exercices
Exercice 5
1. Effectuer les sommes suivantes en détaillant chaque terme :
6 4 n
(a) xi (b) (xi − 3)2 (c) (k = constante )
X X X
k
i =1 i =1 i =1
2. Ecrire les expressions suivantes à l’aide de l’opérateur :
X

(a) a1 b1 + a2 b2 + . . . .. + a50 b50 ; (b) x1 + y1 + x2 + y2 + . . . .. + xn + yn

38/48
3. Notations et symboles et rappel de notions mathéma-
tiques :

Exercices
Exercice 6
xi yi
2 −3
Soit le tableau suivant : −5 −8 Les calculs de sommes seront notés
4 10
−8 6
n n
xi ou yi , pour simplifier la notation évidente xi ou yi Ainsi :
X X X X
i =1 i =1

xi = 2 + (−5) + 4 + (−8) = −7
X

yi = (−3) + (−8) + (10) + 6 = 5


X

X 2
Calculez les valeurs de : (a) xi yi ; (b) xi ; (c) yi2 ; (d) xi yi ;
X X X X
39/48
(e) xi yi2 ; (f) (xi + yi )(xi − yi ).
X X
3. Notations et symboles et rappel de notions mathéma-
tiques :

Exercices
Réponses :
Exercice 5 :
1. Effectuer les sommes suivantes en détaillant chaque terme :
6
(a)
X
xi = x1 + x2 + x3 + x4 + x5 + x6
i =1
4
(b) (xi − 3)2 = (x1 − 3)2 + (x2 − 3)2 + (x3 − 3)2 + (x4 − 3)2 ou :
X
i =1
4 4 4 4 4
xi2 + 32 − 2 xi · 3 = xi2 + (4 × 9) − 6 xi
X X X X X
=
i =1 i =1 i =1 i =1 i =1
= x12 + x22 + x32 + x42 − 6(x1 + x2 + x3 + x4 ) + 36

40/48
3. Notations et symboles et rappel de notions mathéma-
tiques :

Exercices
Réponses :
Exercice 5 :
n
(c)
X
k = k + k + k + . . . .. + k = n · k
i =1
2. Ecrire les expressions suivantes à l’aide de l’opérateur :
X

50
(a) a1 b1 + a2 b2 + . . . .. + a50 b50 =
X
ai bi
i =1
n n n
(b) x1 + y1 + x2 + y2 + . . . .. + xn + yn =
X X X
xi + yi = (xi + yi )
i =1 i =1 i =1

41/48
3. Notations et symboles et rappel de notions mathéma-
tiques :

Exercices
Réponses :
Exercice 6 :
(a) xi yi = 26
X

(b) xi2 = 109


X
X 2
(c) yi = 209
(d) xi yi = (−7)(5) = −35 [ce qui est différent de xi yi = 26 ]
X X X

(e) xi yi2 = −190 [seuls les³ yi sont ´élevés au carré !]


X
X 2
(f) (xi + yi )(xi − yi ) = xi − yi 2 = xi 2 − yi 2 = 109 − 209 = −100
X X X

42/48
3. Notations et symboles et rappel de notions mathéma-
tiques :

3.3 Notion de série statistique :


Les données statistiques "brutes" ; c’est à dire à peine recueillies ; sont
le plus souvent unitilisables et non intérprétables immédiatement. On
doit les "mettre en ordre".
Ainsi La constitution d’une série qualitative, revient à regrouper les
unités statistiques présentant les mêmes modalitès sous un même
numéro d’ordre. Ce regroupement commence par le dépouillement des
données en comptabilisant le nombre de fois que chaque modalité
apparaît dans la base de données considérées.
Une fois mise en ordre, on formera une distribution statistique ou
série statistique, qui est donc : l’ensemble des modalités et des
effectifs d’un caractère :

Distribution statistique = {xi ;ni }


43/48
3. Notations et symboles et rappel de notions mathéma-
tiques :

3.3 Notion de série statistique :


♣ Si on a par exemple, une série statistique relative à une seule variable
qualitative, elle est dite série statistique qualitative simple.
Exemple : Un statisticien est intéressé par l’étude des enseignants du
premier cycle ayant au plus quatre enfants et dont le plus âgé à moins
de sept ans. Après dépouillement le nombre d’enfants par enseignani
retenu dans l’analyse est :
0/1/0/3/4/2/3/2/0/1/3/2/0/4/3/1/2/4/0/0/1/1/2/3/4/2/3/2/1/0/
1) Étudier et constituer la série statistique suivant le nombre d’enfants.

44/48
3. Notations et symboles et rappel de notions mathéma-
tiques :

3.3 Notion de série statistique :


Réponse :
i) Il s’agit d’une série statistique discrète car :
• L’intervalle de variation est de [0.1.2.3.4]
• Les valeurs prises sont isolées, finies et entières (on ne peut pas avoir
un enfant et demi)
• Les trente enseignants sont étudiés suivant le caractère "au plus
quatre enfants de moins de 7 ans" et dont les modalités sont 0.1.2.3.4
enfants.

45/48
3. Notations et symboles et rappel de notions mathéma-
tiques :

3.3 Notion de série statistique :


Réponse :
ii) Pour constituer la série statistique, nous devons tout d’abord faire
correspondre à chaque modalité xi le nombre correspondant ni des
individus présentant cette modalité en considérant que tous les
stagiaires ayant le même nombre d’enfants sont équivalents.
Ainsi, on aura la série statistique discrète suivante :
{x1 = 0;n1 = 7} , {x2 = 1;n2 = 6} , {x3 = 2;n3 = 7},
{x4 = 3;n4 = 6} , {x5 = 4;n5 = 4}

46/48
3. Notations et symboles et rappel de notions mathéma-
tiques :

3.3 Notion de série statistique :


Exercices
Exercice 7 :
Après une enquête réalisée auprès de 20 étudiants sur leurs ”mention”
au bac, on a obtenu les résultats suivants :

P P B AB AB AB TB P B AB
E P B B E P P AB AB B

On note, P : Passable, AB : Assez-bien, B : bien, TB : Très-bien, E :


Excellent.
Remarque : On peut donner les codes suivants :

P = 0, AB = 1, B = 2, TB = 3, E = 4.
47/48
3. Notations et symboles et rappel de notions mathéma-
tiques :

3.3 Notion de série statistique :


Exercices
Exercice 7 :
1. Déterminer la population, l’unité statistique, le caractère, les
modalités, et le type de variable
2. Constituer la série statistique convenable.

48/48

Vous aimerez peut-être aussi