Vous êtes sur la page 1sur 54

Par Tatsinkou

INS
PLAN DE L’EXPOSE
I - Utilité de la Statistique
II - Différence entre Recensement et sondage
aléatoire
III- Quelques définitions
IV - Principales caractéristiques de tendances
centrales
V - Résumés visuels en statistique
VI- Exercices d’application

I- Utilité de la Statistique
La statistique est conçue comme une aide
à la décision en environnement incertain.
Son objectif est donc de fournir des
prévisions à partir d’un modèle
mathématique qui rend compte des
variations du phénomène étudié.
I- Utilité de la Statistique
 La statistique est dialectique dans son
approche: elle part du concret des données à
l’abstrait du modèle pour faire des prévisions
concrètes. L’utilisation pertinente de la
statistique passe donc non seulement par la
connaissance des différents modèles et leurs
propriétés mais aussi par l’apprentissage de leur
mise en œuvre. Ce module de présentation vise
à nous familiariser avec quelques notions de
statistiques pour leur mise en œuvre.
II- Différence entre Recensement et
sondage aléatoire
Recensement
Le recensement est une opération de
collecte exhaustive sur l’ensemble Ω
(univers) de la population étudiée.
Ω (Univers)

Populations
Le sondage

Échantillon

Le sondage permet de produire de l’information


sur un domaine donné à partir de l’observation
d’une partie de ce domaine
III- Quelques définitions
Univers:
Il désigne le domaine étudié ou population (population d’individu,population de
village,de champs d’évènement (naissance, décès, migration…) etc)
Unité statistique:
Ce sont les éléments composant l’univers ou la population (individu au sens du
terme,village, ménage, parcelle etc)
Echantillon:
C’est un sous ensemble d’unités statistiques prélevés dans l’univers
Notion de caractère
Les caractères observés sur la population
ou l’échantillon apparaissent
généralement sous deux formes :
 les caractères qualitatifs (sexe, grade,
profession) dont on observe généralement
des modalités,
 et les caractères quantitatifs (mesurables :
poids, taille âge, revenu, …).
Notion de variable discrète,continue, et de
série chronologique
 Une variable discrète est une variable qui ne prend que
des valeurs entières (exemple le nombre d’enfants par
ménage).

 Une variable continue X est une variable qui peut


prendre n’importe quelle valeur réelle. C-à-d un nombre
avec autant de chiffres après la virgule que cela est
nécessaire appartenant à un intervalle donné (exemple
soit X le poids en kg des enfants présents à l’hôpital
provincial de Maroua le 19/12/2005. On a relevé les
valeurs suivantes pour chaque enfant: 2,000; 2,005;
2,203; 3,001; 4,000. Cette variable X est une var
continue)
Série chronologique

 Une série chronologique est une suite


ordonnée en fonction du temps: effectif
annuel de la population,chiffre annuel de
la production intérieure brute, nombre de
personnes présentant les symptômes du
paludisme par mois…
1 - Les variables qualitatives

Ces types de variable ne présntent que


les modalités qu’il faut inventorier les
fréquences d’apparition.
Exemple:
Le sexe (deux modalités: 1 masculin; 2 feminin);
Assiduité du personnel sanitaire de l’HPM au
22/12/2004 (deux modalités: 1:Personnels
présents; 2: personnels absents)
Rubriques Présent Absent Total

Masculin 20 1 21

Feminin 13 2 15

T 33 3 36
2- Les variables quantitatives

Ces variables peuvent se compter ou se


mesurer. (le poids de chaque patient
présent à l’HPM le 12/11/2005) Ces
résumés sont tributaires de la nature des
données collectées..
IV. LA TENDANCE CENTRALE
Les valeurs d’une série statistique sont
variables. Mais cette variabilité connaît
certaines limites et ceci porte à croire qu’il
existe une forme de stabilité sous-jacente
qu’il est intéressante de mettre à jour.
C’est l’objectif des caractéristiques de
tendance centrale comme la médiane, la
moyenne et le mode
Caractéristiques de tendance
centrale
i- La moyenne
 C’est une caractéristique de tendance
centrale qui résume le mieux le
phénomène étudié. Elle représente la
valeur d’une répartition équitable d’un
phénomène donné.
 Pour symboliser considérons que le grand
Nord (GN) compte 30 médecins en 2005.
Alors le GN étant divisé en 3 provinces, on
peut dire qu’il y a en moyenne 10
médecins par province (obtenu en divisant
le total des médecins par le nombre de
provinces):

30
Moyenne   10 Médecins par province
3
 Pour généraliser, supposons une
population ou un échantillon de n
observations notées x1, x2, …, xn
 La moyenne symbolise par X est obtenu
en calculant la somme et en la divisant par
le total.

1
Moyenne X  ( x1  x2  ...  xn )
n
ii- La médiane
Définition
Pour les variables quantitatives, la notion
d’ordre a un sens. La médiane est la
valeur qui scinde la population classée
dans l’ordre croissant en deux sous
populations de taille égale.
ii- La médiane
Formule de calcul
 Pour une série ordonnée n = 2p+1, la médiane est M=
(n+1)/2
(exemple soit le série 1,2,3,4,5,6,7. M= (7+1)/2 soit 4)
 Pour une série ordonnée n= 2p, M est un intervalle
médian. Exemple soit la série 1,2,3,4,5,6 M= 3,5 qui
appartient bien à [3, 4]
 Pour une série de données groupées selon le tableau
suivant on procède par interpolation.
i- La médiane
Formule de calcul
Pour une série de données groupées selon le tableau
suivant on procède par interpolation.

Classe Effectif Fréquence Fréquence cumulée


a0 - a1 n1 f1 F1
a1-a2 n2 f2 F2
……. .. .. ..
ai-1 – ai ni fi Fi
….. .. .. ..
ak-1 – ak nk fk Fk

50  Fi 1
a
M = i 1  ( ai  ai 1 )
Fi  Fi 1
iii Le mode

Le mot français mode désigne la valeur


la plus fréquente, la plus en « vogue ».

En statistique le mode représente la


valeur la plus fréquente d’une série
d’observation. Il est intéressant pour les
statistiques de prix par exemple.
Exemple: Illustration de moyenne,
médiane, mode et écart-type
 Le tableau ci-dessous donne le nombre total mensuel
de patients à l’HPM observé aux mois d’avril et de
mai (1980-1997).

Années Avril Mai Années Avril Mai Années Avril Mai


1980 600 512 1986 307 241 1992 209 215
81 227 211 87 390 253 93 230 297
82 487 469 88 364 408 94 424 309
83 560 370 89 284 233 95 528 303
84 521 363 90 415 245 96 258 196
85 423 272 91 255 199 97 242 166
 On se propose de mettre en ordre ces données et d’en faire l’analyse.
 1)      On ordonne les observations en les répartissant dans des
classes d’amplitude 50. On a le tableau de fréquence ci-dessous.

F cumulée F cumulée
fi absolues fi relatives croissante fi absolues fi relative croissante
Classes avril avril avril mais mai mai
150 à moins de 200 0 0 0 3 16,67 16,67
200 --- 250 4 22,22 22,22 5 27,78 44,45
250 --- 300 3 16,67 38,89 3 16,67 61,11
300 --- 350 1 5,56 44,44 2 11,11 72,23
350 --- 400 2 11,11 55,56 2 11,11 83,34
400 --- 450 3 16,67 72,22 1 5,56 88,89
450 --- 500 1 5,56 77,78 1 5,56 94,45
500 --- 550 2 11,11 88,89 1 5,56 100,00
550 --- 600 2 11,11 100,00 0 0 100,00
Total 18 100 // 18 100 //
Xi fi fixi fixi2 yi fi fiyi fiyi2
175 0 0 0 175 3 525 91875
225 4 900 202500 225 5 1125 253125
275 3 825 226875 275 3 825 226875
325 1 325 105625 325 2 650 211250
375 2 750 281250 375 2 750 281250
425 3 1275 541875 425 1 425 180625
475 1 475 225625 475 1 475 225625
525 2 1050 551250 525 1 525 275625
575 2 1150 661250 575 0 0 0
18 6750 2796250 18 5300 1746250

ai1ai
CentredeclasseXi=
2
RUBRIQUES Formules Valeuravril Valeur mai
18

f X i i
Moyennes i1 375 294
f i1
i

Médianes/ 50Fi1
(intervalles médians) ai1 (ai ai1) 375 / (350---400) 267/ (250---300)
Fi Fi1
Sur legraphiqueoudans le
tableaude fréquences on
Modes 200--250
apprécie la modalité (classe
modale) laplus représentative
18

f X
2
i i
Ecart-types i1
m2 121 102
fi1
i
 Interprétation:
 En moyenne,294 patients ont été reçus à l’HPM
au mois de mai contre 375 au mois d’avril.
 L’écart-type du mois de mai (102) est très
inférieur à celui du moi d’avril (121). Cette faible
dispersion pour le moi de mai montre que: les
patients de mai dont l’effectif chaque année est
plus proches de la moyenne sont les plus
réguliers par rapport à ceux du mois d’avril.
V - Résumés visuels en statistique
Une série statistique peut être envisagée selon
deux points de vue: celui de la variabilité et celui
de la stabilité de ses valeurs autour d’une valeur
centrale.
Variabilité ou stabilité ne sont pas toujours
clairement perceptibles au niveau des données
numériques et il peut être utile alors de tenter de
les faire apparaître au travers d’un graphique
approprié.
Le graphique est étroitement lié à la nature de la
variable et de la forme des données qu’il illustre.
V - Résumés visuels en
statistique
a)- Variables qualitatives
Les représentations graphiques que l’on
rencontre avec les variables qualitatives
sont assez nombreuses. Les trois plus
courantes, qui sont aussi les plus
appropriées, sont :
 le diagramme en colonne,
 le diagramme en barre,
 le diagramme en secteur.
a.1 Diagramme en colonne
Le diagramme en colonne est constitué de
colonnes de largeurs égales, de hauteurs
proportionnelles aux fréquences
d’apparition de chacune des modalités de
la variable.
répartition des enfants selon leur poids à la
naissance

50%

40%
pourcentage d'enfants

30%
effectifs
20%

10%

0%
<3 3 à 3,5 3,5 à 4 4 et +
poids
a.2 Diagramme en barre

Le diagramme en barre est constitué


d’une seule barre verticale. Cette barre est
subdivisée selon le nombre de modalités
de la variable et la surface occupée par
chaque modalité est proportionnelle aux
fréquences d’apparition.
Répartition des enfants selon leur poids à la
naissance

100%
11%
90%
80%
22%
70%
60%
50%
40% 39%
30%
20%
10% 17%
0%
<3 3 à 3,5 1 3,5 à 4 4 et +
a.3 Diagramme en secteur

Il est similaire au diagramme en barre, la


seule différence est que ce n’est plus un
rectangle qui est subdivisé mais un cercle.
Répartition des enfants selon leur poids à la
naissance

4 et + <3
13% 19%

3,5 à 4
25%

3 à 3,5
43%
b)- Variables quantitatives
Trois graphiques permettent de faire un
résumé visuel d’un caractère quantitatif :
 L’HISTOGRAMME
b.2 L’Histogramme
 Dans le cas d’un échantillon, on cherche à
approcher par une estimation empirique le
graphe de la densité de la loi théorique
associée à la population.
L’histogramme en est un exemple. Une
fois déterminée un découpage en classes
de l’ensemble des valeurs et les
fréquences d’occurrences de ces classes,
un histogramme est la juxtaposition de
rectangles dont les aires valent la
fréquence de la classe correspondante
Diagramme en bâtons
Le diagramme en bâton permet d’illustrer la variabilité d’une série
aux données groupées issue de l’observation d’une variable
quantitative discrète.
Le graphique ci-dessous représente la répartition du nombre
d’enfants par employé dans l’Hôpital provincial de Maroua en 2004

Nbre 9
d’enfants 8
7
6
5
4 HPM
3
2
1
0
Employés
a b c d e j t u s o n q
Diagramme de dispersion
 Le diagramme de dispersion permet d’illustrer la variabilité d’une série
ponctuelle issue de l’observation d’une variable quantitative discrète.
 L’exemple ci-contre représente le nombre N de naissances par
mois dans le service de maternité de l’Hôpital provincial de Maroua
en 2004
Nbre de naissance

100

80
O
60

40
O
20 O

0
J F M A M J J A S O N D Mois
Exercices d’application
Les exercices sont constitués de QCM
Le principe consiste à cocher la case
correspondant à la bonne réponse
1- On note T la tension artérielle systolique, en
mm de mercure des 65 patients présents le
13/01/91 dans le service de cardiologie de
l’hôpital de district de Maroua. La population P
étudiée est formée par:
a l’ensemble des malades
b l’ensemble des cardiaques
c les 65 patients présents le 13/01/91 dans le
service de cardiologie de l’hôpital de district de
Maroua.
3- on observe le poids à la naissance de 10 bébés, poids
consignés dans le tableau ci-dessous

i 1 2 3 4 5 6 7 8 9 10
P 3.1 2.7 2.5 3.9 4.0 4.1 3.9 3.3 3.6 3.7

Pour illustrer la variabilité de la série précédente on peut proposer:


a) Diagramme de dispersion,
b) diagramme circulaire,
c) histogramme,
d) diagramme en bâtons.
4- le tableau de fréquences suivant donne la répartition du
nombre d’enfants par employé dans une entreprise
donnée:
Nombre d’enfants 0 1 2 3 4

pourcentage 23 27 38 10 2

Pour illustrer la variabilité de cette série on peut proposer:

a) Diagramme de dispersion, b) diagramme circulaire c) histogramme d) diagramme en


bâtons
5- une caractéristiques de tendance centrale sert à :

a) Résumer l’information
b) Caractériser l’aspect stable,
c) Caractériser l’aspect variable.

6- Si on suspecte une série statistique de comporter des valeurs


erronées, la meilleure Caractéristique est:

a) La moyenne arithmétique;
b) la médiane;
c) l’écart- type;
d) la variance.
Le tableau suivant donne la répartition en F des
revenus dans une population P déterminée.

Tranche de revenu Fréquence


0 à 25 0.12
25 à 50 0.14
50 à 100 0.45
100 à 200 0.28
200 à 500 0.01
Pour illustrer la variabilité de cette série on peut proposer:
a) Diagramme de dispersion, c) histogramme

b) diagramme circulaire d) diagramme en bâtons


corrigé
1 C, aucune précision n’étant donnée sur les
objectifs de l’étude, il faut considérer que
la population est formée par les 65
patients présents le 13-01-91
3- a- car la variable est quantitative discrète
et les données présentées sous forme
individuelle
4- d- variable quantitative discrète et
données groupées.
5- a et b une caractéristique de
tendance centrale sert à caractériser
l’aspect stable d’une série statistique
mais sert aussi de résumé de la série
6- c car variable quantitative
continue et données groupées.

Vous aimerez peut-être aussi