Vous êtes sur la page 1sur 7

ANALYSE STATISTIQUE

(Talnan H Evrard : 07433051 Email : detalman225@yahoo.fr)

Chapitre1 : LA statistique, collecte des informations, tableau et graphique


1- La statistique : définition et vocabulaire

C’est une méthode scientifique qui consiste à réunir des données chiffrées sur des ensembles
nombreux, puis à analyser, à commenter et à critiquer ces données.

Cette science n’a pas pour objet la connaissance des éléments des ensembles dans ce qui fait
leur individualité, mais au contraire, dans ce qu’ils ont en commun : il s’agit d’obtenir des
résultats globaux. Ainsi, une enquête statistique portant sur des personnes n’a pas besoin de
faire intervenir leurs noms mais seulement les renseignements que l’on désire étudier : Elle
permet de connaitre la répartition des personnes par âge, sexe, couleurs de cheveux, professions
ou groupe sanguin…Les ensembles, objets de la statistique doivent être bien déterminés au sens
de la théorie des ensembles : il doit toujours être possible de savoir si un élément appartient à un
ensemble. Cela implique en général des précisions de lieux de temps, de lieu, de définition.

Pour que la statistique puisse s’appliquer à un ensemble, il suffit que l’on puisse du point de vue
de l’objet de l’étude réaliser une partition de cet ensemble, c’est-à-dire pouvoir classer les
éléments dans des sous-ensembles disjoints dont la réunion constitue l’ensemble lui-même : on
détermine ainsi les classes disjointes et exhaustives.

Rq : IL ne faut pas confondre la statistique qui est la science qu’on a définie et une statistique qui
est l’ensemble de données chiffrées sur un objet précis. (Inflation : augmentation générale et
continue du prix).

Comme toute science, la statistique fait appel à un vocabulaire spécialisé. Les premières
statistiques correctement élaborées ont été celles des recensements démographiques. Ce fait a
laissé des traces : Le vocabulaire statistique est essentiellement celui de la démographie.

Les ensembles sont appelés populations. Comme un ensemble, une population statistique doit
être clairement définie.

Les éléments de la population sont appelés individus ou unités statistiques, que ce soit des
hommes, des pays, des animaux des automobiles, des portables……

Exemple : Si l’on dresse une statistique du personnel d’une entreprise d’après l’ancienneté de ces
membres ; la population est ce personnel et l’unité statistique est chaque membre de ce
personnel.

La population est étudiée selon 1 ou plusieurs caractères : ce sont les facettes que présentent les
individus de la population.

Exemple : dans l’exemple précédent, le caractère statistique est l’ancienneté de chacun de ces
membres.

Un caractère permet de déterminer une partition (découpage en page exhaustive et disjointe) de


la population selon ces diverses modalités. Ainsi, le sexe est un caractère à 2 modalités M ou F.
Lorsque les modalités du caractère sont des nombres, le caractère est dit Quantitatif, on lui
donne souvent le nom de variable statistique. Une variable statistique peut être discrète si elle
ne prend que des valeurs isolées ou continue si elle peut prendre n’importe quelle valeur
intermédiaire entre deux valeurs données.

NB  : <<Discret>> ne signifie pas <<entier>>. Le nombre de parts attribué à un contribuable peut
prendre les valeurs 1 ;1,5 ;2…. : Il n’est pas entier mais il est discret car entre 2 valeurs 1 et 1,5 il
n’existe aucune valeur correspondant à un nombre de part.

Lorsque les modalités du caractère ne sont pas mesurables, il est dit qualitatif. Les modalités
d’un caractère qualitatif peuvent faire l’objet d’une nomenclature ou énumération. La
nomenclature doit en principe être courte (Une dizaine de modalité pour une étude statistique
simple), mais les exigences de l’étude sont parfois telles que la nomenclature occupe des
volumes entiers : c’est le cas des nomenclatures codées des catégories socio-professionnelles et
des professions.

2- Collecte des informations


Le premier de la méthode statistique est de réunir les informations avant de les traiter.
2.1- Objectif de l’information. Enquête.
Il importe dès le départ de bien définir l’objectif ou les objectifs de l’étude, avant de réaliser
l’enquête (au sens large, la collecte des statistiques) si un élément est oublié dans les
premières recherches, il risque d’être long et couteux de le rechercher ensuite.
2.2- Quantité d’information
Il ne faut pas être trop ambitieux. IL ne doit pas y avoir de lacune dans l’information, mais il
ne doit pas non plus y avoir trop d’informations. L’on est souvent submergé par des
kilogrammes de tableaux sortis d’un ordinateur, intéressant en principe, mais trop abondants
pour qu’ils soit question d’en tirer une synthèse ou même de les lire.
2.3- Collecte des données
Elles sont recueillies soit par observation directe soit indirectement.
-S’il s’agit d’observation directe, l’enquête est menée par les statisticiens et à des fins
uniquement statistiques. D’une manière ou d’une autre, cette enquête a abouti à des
questionnaires que le statisticien est ensuite amené à dépouiller. Ces questionnaires
portent soit sur chaque unité statistique ou un groupe d’unités statistiques ; dans ce dernier
cas, les résultats sont sous forme de tableau.
La réalisation des questionnaires est délicate. Autant que possible, il ne doit pas être trop
long pour avoir plus de chances d’être rempli correctement. Cepdt il doit contenir toute
l’information désirée. Par ailleurs, il ne doit présenter aucune ambiguïté (aucune qtion qui
pourrait être mal comprise.) Il est souvent nécessaire de tester le questionnaire sur quelques
personnes avant de le lancer.
- Les statistiques recueillies par observation indirecte sont des sous-produits d’autres
travaux : Statistiques d’une entreprise tirée de sa comptabilité, des naissances et des décès
tirés de l’état civil… ce moyen est beaucoup plus économique que le précédent et a souvent
l’avantage de recourir avec certitude toute la population à étudier. Cependant, dans bien des
entreprises, il est nécessaire de faire faire prendre conscience à tous de l’importance et de
l’utilité des statistiques, de façon à ce qu’il n’y ait aucune réticence pour la transmission des
informations.
2.4- différents modes de collecte des informations

2-4) Différents mode de collecte d’information


- Les résultats statistiques peuvent être obtenus à partir d’une enquête exostive instantané
(dénombrement instantané) ou d’un relevé continu.
- De même l’enquête peut être exostive ou partielle. L’enquête exostive porte sur toutes les
unités de la population ; elle est utile mais souvent couteuse. C’est pourquoi l’on a souvent
recours à des enquêtes partielles faites sur un échantillon de la population : il s’agit alors
d’un sondage. Un échantillon est un groupe restreint ou sous-ensemble issus de la
population. La méthode des sondages consiste a déterminé un échantillon représentatif, de
manières que les résultats statistiques trouvé sur échantillon soient voisins de ceux que l’on
aurait obtenu si l’on avait étudié la population entière.

Échantillon aléatoire : les résultats recueillis sur sous-ensemble doivent pouvoir être étendu c.-à-
d. inférer à la population entière.

2-5) Dépouillement des observations

Lorsque des informations ont été obtenu, indirectement ou par enquête, elles doivent être classé
et exploité. Auparavant, une critique des réponses reçus doit être faite, afin d’éliminé les
contradictions et les invraisemblances. Pour chaque caractère à étudier on définit un certain
nombre de classes selon les modalités puis on fait le tri des observations c.-à-d. une répartition
entre les classes

candidat Dépouillement Nbre de voix


A 16
B 13
C 13
42

CHAPITRE 2 : PRESENTATION DES RESULTAT

1) Tableau a simple entré


a) Tableau stat le plus simple sera celui où figureront deux colonnes réservé respectivement :
- La première à l’inscription des valeurs du caractère désigné par X
- La seconde à l’inscription des effectifs correspondant désigné par n i

Exemple : distribution stat du personnel d’une entreprise d’après le nombre d’enfants à charge

nombre d’enfants a charge xi Effectifs ni


0 5
1 17
2 31
3 20
4 11
5 4
6 1
Somme des ni=N= 89
Dans cet exemple la variable est discrète et prend les sept(7) valeurs : x1=0 ; x2=1 ; x3=2 ; x4=3 ;
x5=4 ; x6=5 ; x7=6, a chacune de ces valeurs correspond un effectif n 1=5 ; … ; n7=1

La série stat est donc l’ensemble des 7 couples (x 1 ; n1), …, (x7, n7)
Soit (0,5), …, (1 ; 17) et nous dirons la série ( Xi ; ni ) l’indice i prenant les valeurs 1 ;2 ;.. ;7. La
somme des effectifs ni est l’effectif totale N de la population étudier

N= n1+…+n7 ce que l’on note

b) Dans le cas d’une variable continue il est commode d’utilisé des classes d’amplitudes égales
de préférence, nous auront la disposition suivante :
Exemple : distribution stat, a une certaine date, des ouvriers d’une entreprise en fonction de
leur Age .

Age classes ( unité année) Effectifs


9
27
36

Dans cette entreprise 9 ouvriers ont un âge supérieur ou égale à 20ans mais inferieur
25ans , 27 ont un âge supérieur ou égale a 25ans mais inferieur a 30ans , …
Les valeurs 22.5 ;27.5 ; 32.5 ; 37.5 ; 42.5 ; 52.5 ; 57.5 sont appelé valeurs centrales des
classes (ou centre des classes), (22.5= 20+25/2 ; 27.5=25+30 ;…)
c) Fréquence le rapport de l’effectif ni attaché a la valeur xi du caractère, a l’effectif totale N est
la fréquence de la valeur xi du caractère :
Par exemple au tableau précédent nous ajouterons une colonne fréquences ou seront
portés les fréquences de chaque classe
Exemple : 9/150= 0.06 ; ... ; 3/150=0.02

Dont la somme est 1.

En multipliant la fréquence ni sur N par 100 on obtient le taux du pourcentage de N que represente n i

d) Effectif cumulée

Les effectifs peuvent données lieu a la présentation de colonne d’effectif cumulé (cumulé
croissant ou décroissant) permettant de répondre au deux types de questions suivantes dans le
cas précédent :

- Quel est le nbre d’ouvriers ayant moins de 35ans


- Quel est le nbre d’ouvriers au moins 35ans ? ( 35ans ou plus de 35ans)

On aura le tableau suivant

Age Effectifs Fréquenc Frequence Effetif Effectifs Effectifs effecti


classes ¿ en cumulé en % cumulé
eN
croissant cumulé decroissant
croissant
9 0.06 6 9 6 150
27 0.18 18% 36 24 123
36 0.24 24% 72 48 87
45 0.3 30% 117 78 42
18 0.12 12% 135 90 24
9 0.06 6% 144 96 15
3 0.02 2% 147 98 6
3 0.02 2% 150 100 3

150 1 100

Les fréquences peuvent données lieu aussi à la présentation de colonne de fréquence


cumulé
 Indication concernant le calcul des cumules figurants dans les colonnes 5,6,7 et 8 :
- Colonne 5 : premier cumule=1er effectifs de la colonne 2
2eme cumule= somme des deux 1ers effectifs de la colonne 2
3eme cumule= a somme des trois1ers effectifs de la colonne 2(ou somme du 2eme cumule
de la colonne et du 3eme effectif de la colonne 2 et ainsi de suite, le dernier cumule de la
colonne de la colonne 5 étant égale a l’effectif totale de la population
- Colonne 6 : même calcule que pour la colonne 5, la colonne 4 remplaçant la colonne 2 et le
dernier cumule étant égale à 100
- Colonne 7 : 1er cumule = effectif totale de la population
2e cumule= 1er cumule de la colonne 7 – 1er effectif de la colonne 2
3e cumule= 2e cumule de la colonne 7 – 2e effectif de la colonne 2 et ainsi de suite
- Colonne 8 : même calcule que pour la colonne 7, le 1 er cumule étant 100 et la colonne 4
remplaçant la colonne 2
 Interprétation des cumules figurants dans les colonnes 5, 6, 7 et 8 :
- Colonne 5 : ses cumules donnes les réponses au questions du 1 er type :
9 ouvriers ont moins de 25ans
36 ouvriers ont moins de 30
72 ouvriers ont moins 35ans …
- Colonne 6 : combien d’ouvriers ont moins 25ans ?
6% des ouvriers ont moins de 25ans
48% des ouvriers ont moins de 35ans
- Colonne 7 : ses cumules donnes les réponses au questions du 2 e type

Combien d’ouvriers ont au moins 20ans ?

150 ouvriers ont au moins 20ans

141 ouvriers ont au moins 25ans

- Colonne 8 : 52% des ouvriers ont au moins 35ans

2-Tableau statistique à double entrée


IL est souvent possible que, sur une même unité, on observe deux ou plusieurs caractères. La
traduction par un tableau de l’observation de deux caractères sur une unité statistique se
fera à l’aide d’un tableau à double entrée.
Exemple : répartition des enfants d’une école maternelle d’après leurs âges et leurs poids
*Interprétation des nombres du tableau
19 enfants âgés de 3 à –de 4 ans pèsent moins de 15 kilogrammes
3- Règle relative à la présentation matérielle des tableaux statistiques

[3 ;4] [4 ;5] [5 ;6] Totaux

Inférieur à 15 19 7 1 27

[15 ;20] 32 21 12 65

20 ;25[] 3 18 28 49

[25 ;30] 1 1

totaux 54 40 42 142

4- a- Titre et sous-titre du tableau

indique le contenu du tableau et se place tjrs au-dessus de celui-ci

b- les titres doivent être aussi court que possibles

c- unités

les unités doivent être choisies de façon à tirer le plus de renseignement possibles de et es mesures obtenues
mais aussi de façon à ce que les nombres écrits ne comportent pas trop de chiffres.

d- Sources

La source d'un tableau statistique doit tjrs être indiquée grlement au bas du tableau, lorsque cette source est
étrangère au service qui publie la statistique en question. Cette indication permet au lecteur du tableau qui
désirerait un complément d'informations de se reporter à l'origine des informations données.

4-La présentation des résultats sous forme graphique

4-1- Cas des distributions quantitatives

LEs trafics correspondants à des distributions quantitatives sont normalement réalisés en portant en abscisse la
variable observée et en ordonnée l'effectif ou les fréquences.

-dans le cas d'une variable discrète, le graphique représentant la répartition est un diagramme à bâton:
l'effectif ou la fréquence est représenté par un segment de droite; ainsi, apparait-il la discontinuité entre
deux valeurs de la variable.

Exple: Repreno,s l'exple du nombre d'enfants à charge d'un personnel d'une entreprise.

(A tracer)
Dans le cas d'une variable continue, le graphique est appelé histogramme. Et chaque sous population relative à
une modalité est représentée par un rectangle. La représentation est donc effectuée comme si la distribution
était uniforme à l'intérieur d'une classe. La surface limitée par l'histogramme doit être proportionnelle à
l'effectif ou à la fréquence. IL convient de prendre garde à l'amplitude des classes : On se ramène à la plus
petite amplitude ( Amplitude élémentaire ou unité d'amplitude) et on divise la hauteur du rectangle par la
mesure de l'amplitude de la classe par rapport à cette amplitude élémentaire.

Exemple: reprenons l'exemple déjà utilisé portant sur l’âge des ouvriers d'une entreprise et dans lequel les
classes ont même amplitude.

4.2- Cas de distribution qualitative

IL n'est plus alors possible d'utiliser un diagramme cartésien, puisque les données ne sont pas numériques.
Diverses méthodes sont possibles.

On peut réaliser des diagrammes en bande. IL est également possible de réaliser des diagrammes à secteur
appelés diagrammes circulaire et camembert.

Les effectifs ou les fréquences des diverses modalités sont représentés par des secteurs d'un cercle ou d'un
demi-cercle.

CHAPITRE 3: ETUDE DES SERIES STATISTIQUES SIMPLES

1-Introduction

UN tableau statistique ou un graphique est parfois long à consulter, sans permettre d'avoir une idée
suffisamment concise de la distribution statistique observée. On cherche alors à résumer celle-ci par une
caractéristique de tendance centrale c'est à dire par un seul nombre destiné à caractérisé l'ensemble d'une
façon objective et impersonnelle.