Vous êtes sur la page 1sur 30

STATISTIQUES DESCRIPTIVES

STATISTIQUES DESCRIPTIVES SOMMAIRE LECON 1 : DEFINITION ET REPRESENTATION GRAPHIQUES LECON 2 : LE MODE ; LA MEDIANE ; LA MOYENNE LECON 3 : LA VARIANCE ; L ECART-TYPE DEVOIR LECON 1 : DEFINITION ET REPRESENTATION GRAPHIQUES A) Dfinition : B) Prsentation des rsultats sous forme de tableaux statistiques : Cest la prsentation la plus commode du point de vue statistique.

Un tableau statistique est un tableau regroupant tous les chiffres obtenus partir dune Enqute ou tout un travail de collecte de linformation chiffre sur un phnomne quelconque.
a) Tableau statistique simple entre (ou une entre) :

Le tableau le plus simple sera celui o figureront deux colonnes rserves respectivement : - La premire, linscription des valeurs du caractre dsign par Xi. - La seconde, linscription des effectifs correspondants dsigns par ni ; Exemple : distribution statistique de 40 agents de la division administrative Casablanca daprs le nombre denfants charge. Nombre denfants charge xi Effectifs ni 0 2 1 7 2 14 3 10 4 4 5 2 6 1 Somme de ni = N= 40 Dans cet exemple la variable est discrte ( ou discontinue) et prend les 7 valeurs : X1 = 0 ; X 2 = 1 ; X3 = 2 ; X4 = 3 ; X5 = 4 ; X6=5 ;X7=6 A chacune des valeurs correspond un effectif : N1=2 ; n2=7 ; n3=14 ; n4=10 ; n5=4 ; n6=2 ; n7=1 La srie statistique (ou distribution statistique) est donc lensemble des 7 couples : (x1 , n1) ; (x2 , n2) (x7 , n7) et nous dirons la srie (xi, ni) , lindice i prenant les valeurs 1,2,3,4,5,6 et 7. La somme des effectifs ni est leffectif total N de la population tudie. N = n1 + n2 + n3..+ n7 Ce que lon note N = ni Et ce qui ce lit somme de i galant 7 des n indice i Dans le cas dune variable continu on procde un regroupement des donnes par classes. Ceci dans le but de simplifier aussi bien la reprsentation de la srie que les calculs. Exemple : Si on tudie la population des 40 agents de DA/AC de point de vue leur salaire (taux horaire) on obtient la srie suivante. 4,75 6,46 4,35 7,75 5,19 9,40 5,62 4,96 5,01 4,55 5,10 7,75 6,81 5,79 5,19 5,12 8,14 7,31 7,10 5,54 4,35 4,55 5,80 5,17 6,28 8,27 4,96 5,15 6,37 4,74 5,45 4,35 6,64 ; 6,64 4,90 7,95 6,28 7,31 5,62 6,37 Les valeurs ont t arrondies 2 chiffres aprs la virgule
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 1 sur 30

STATISTIQUES DESCRIPTIVES

Il est bien certain que dans pareil cas, pour pouvoir dresser une statistique, il faudra diviser le domaine de la variable, ici de 4,35 9,40 en classes de prfrence damplitude constante. On appelle effectif dune classe de valeurs comprises dans cette classe. Classes Effectif Amplitude 1 DH 3,50 4,50 3 4,50 5,50 15 5,50 6,50 10 6,50 7,50 6 7,50 8,50 5 8,50 9,50 1 Total 40 On a pralablement dcid que la limite suprieure de la classe ne fait pas partie de la classe. Les classes sont donc : 3,50 moins de 4,50 4,50 moins de 5,50 . etc. Le choix du nombre de classe et de lamplitude dune classe, varie avec la statistique quon doit tablir. Un nombre trop petit de classes conduit regrouper des valeurs observes de la variable que prsentent entre elles des diffrences sensibles et donc enlverait beaucoup de prcision la statistique obtenue. Un trop grand nombre de classes donnerait sans doute des renseignements assez prcis, mais entranerait aussi un grand nombre de calculs. En rgle gnral il peut tre recommand de ne pas dpasser si possible, 15 20 classes et de ne pas descendre au del de 6 classes. Les lments dune classe : (exemple la classe 3,50 4,50) On appelle limite (ou borne) dune classe le nombre entre lesquels on renonce tudier sparment les valeurs du caractre :

Ici : limite infrieure = 3,50 limite suprieure = 4,50 - On appelle amplitude (ou intervalle) dune classe la longueur du segment form par ses limites Ici : lamplitude = 4,50 3,50 = 1 - On appelle centre de classe le milieu du segment form par ses limites Ici : le centre de classe = (3,50 + 4,50) / 2 = 4 Le tableau des effectifs ou distribution statistique Salaire Classe (Amplitude 1 DH ) 3,50 4,50 4,50 5,50 5,50 6,50 6,50 7,50 7,50 8,50 8,50 9,50 Total Remarque : Dans le tableau prcdent on a incorpor le centre de classe, ceci est dans le but de reprsenter chaque classe par son centre.
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 2 sur 30

Centre de classes 4 5 6 7 8 9 -

Effectifs 3 15 10 6 5 1 40

STATISTIQUES DESCRIPTIVES

Frquence (frquence relative) Le rapport de leffectif ni attach la valeur xi du caractre, leffectif total est la frquence de la valeur xi du caractre : fi = ni/N = ni/ni Par exemple au tableau prcdent, nous ajoutons une colonne frquence o seront portes les frquences de chaque classe, cest dire les nombres : 3/40 = 0,075 ; 15/40 = 0,38 ; 10/40 = 0,25 ; 6/40 = 0,15 ; 5/40 = 0,12 ; 1/40 = 0,025 dont la somme est 1 car 3/40 + 15/40 + 10/40 + 6/40 + 5/40 + 1/40 = 1 En multipliant la frquence ni par 100 on obtient le taux du pourcentage de N que reprsente ni Effectifs cumuls : Les effectifs peuvent donner lieu la prsentation de colonnes deffectifs cumuls (cumuls croissants ou dcroissants) permettant de rpondre aux deux types de questions suivantes dans le cas prcdents : - Quel est le nombre dagents touchant moins de 6,50 DH ? - Quel est le nombre dagents touchant au moins de 6,50 DH (6,5 dh ou plus de 6,5dh) ? On aura le tableau suivant : Col 3 Col 4 Col 5 Col 6 Col 7 Col 8 Frque % Effectifs Frquence Effectifs Frquence nce Frquenc cumuls en % cumuls en % fi = es croissants cumules dcroissants cumules ni/N ni/N 100 croissantes dcroiss 3,50 4,50 3 0,075 7,5 3 7,5 40 100 4,50 5,50 15 0,380 38 18 45,5 37 92,5 5,50 6,50 10 0,250 25 28 70,5 22 54,5 6,50 7,50 6 0,150 15 34 85,5 12 29,5 7,50 8,50 5 0,120 12 39 97,5 6 14,5 8,50 9,50 1 0,025 2,5 40 100 1 2,5 TOTAL = N 40 1,000 100 Interprtation des cumuls figurant dans les colonnes 5,6,7 et - Colonne 5 : ses cumuls donnent les rponses aux questions du premier type : 3 agents touchant moins de 4,50 dh 18 agents touchants moins de 5,50 dh 28 agents touchants moins de 6,50 dh - Colonne 6 : 8% des agents touchant moins de 4,50dh - Colonne 7 : ses cumuls donnent les rponses aux questions du second type : 40 agents touchent au moins de 3,50dh 37 agents touchent au moins de 4,50dh 12 agents touchent au moins de 6,50dh - Colonne 8 : 55% des agents touchent au moins 5,50 dh b) Tableau statistique double entre (2 caractres) Nous nous sommes jusquici limit dans ltude des units statistiques lobservation sur chaque unit, dun seul caractre . Or, il est souvent possible sur une mme unit dobserver deux ou plusieurs caractres. La traduction, par un tableau, de lobservation de deux caractres sur uni unit statistique se fera laide dun tableau double entre : Exemple : Rpartition des 40 agents de DA/AC selon leur salaire et le nombre denfants charge. Colonne 1 Salaire Classe (unit 1 dh) Col 2 Effecti f ni

Nombre denfants charge Salaire 3,50 4,50 4,50 5,50 5,50 6,50 6,50 7,50 7,50 8,50 8,50 9,50 TOTAL
ISTA Beni Mellal

0 1 2 1 1 2

4 5 6 TOTAL 2 2 4 1 1 2 1 1 3 15 10 6 5 1 40
Page 3 sur 30

2 5 8 1 - 5 5 - 1 2 - - 2 - 7 14 10

Interprtation des nombres ports dans le tableau :


STATISTIQUES DESCRIPTIVES I

STATISTIQUES DESCRIPTIVES

- 1 agent dont le salaire est compris entre 3,50 et 4,50 a 0 enfants charge. - 8 agents dont le salaire est compris entre 4,50 et 5,50 ont 2 enfants charge. C) Les lments dun tableau statistique : Les lments dun tableau statistique sont les suivants : - Le titre il indique lobjet du tableau, le titre gnralement utilis est le suivant : cest la rpartition dun ensemble statistique selon un ou plusieurs caractres . - Titres des lignes et des colonnes : il prcise le contenu du tableau cest dire les donnes fournies par ce tableau ( les effectifs ou frquences absolues, les donns en pourcentage ou frquences relatives). - Des notes ou remarques pour faciliter la lecture des chiffres aux non statisticiens. - La source : elle indique lorigine ou la rfrence de linformation chiffre fourni par un tableau. Cette indication permet au lecteur du tableau qui dsirerait un complment dinformation de se reporter lorigine des informations. - Prsentation : la prsentation matrielle du tableau statistique dpend pour beaucoup de ses dimensions. (nombre de lignes ou de colonnes). On veillera la clart, qualit essentielle. On rendra la lecture facile laide dune typographie soigne. II- Reprsentation graphique : Lune des mthodes de prsentation des rsultats est la prsentation graphique qui consiste schmatiser les donnes numriques obtenues par de grandeurs ou des figures gomtriques. Lintrt de cette mthode de prsentation est de fournir, par simple examen visuel une ide gnrale sur la variation du phnomne tudi. Un graphique permet aussi de faire un contrle des rsultats partir des anomalies ou discontinuit qui peut se prsenter cest aussi un moyen de comparaison de variation dun mme caractre entre deux ensemble diffrents. Par ailleurs son inconvnient est quil nglige certains dtails et ne permet pas de donner avec prcision le mme enseignement que peut fournir un tableau statistique ; ce qui limite lutilisation des graphiques dans des analyses trs pousses. Un bon graphique doit tre simple et claire pour ne pas donner une fausse impression visuelle donc une fausse interprtation. Un graphique doit porter les lments suivants : - Un titre indiquant la nature du phnomne quil reprsente . - Des indications ( lgende, chelle, etc .) prcisant la correspondance entre les lments du graphique et la nature du caractre. Selon cette nature nous distinguons diffrentes reprsentations graphiques : DIFFERENTES CATEGORIES DE GRAPHIQUES Types de variables ou caractres de distribution Graphiques utilisables barres verticales, horizontales diagrammes en btons Distributions secteur - Caractre qualitatif figures cartes - Caractre quantitatif Discontinu (ou discret) Continu diagrammes en btons diagrammes en segments cumulatifs histogrammes, pyramides polygones de distribution Polygones de cumuls barres verticales graphiques cartsiens graphiques semi-logarithmiques

Sries chronologiques

A/ CARACTERES QUALITATIFS : 1- Graphiques en barre et diagrammes en btons Rpartition du chiffre d'affaires de la Socit VENTOUT au 31/12/1988 Rgions Montant (en milliers de francs) Nord 2 000 Est 1 200 Centre 1 400 Sud 600 Ouest 1 200
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 4 sur 30

STATISTIQUES DESCRIPTIVES

Montant (milliers de

B arres verticales
2 0 50 2 0 00 DH) 1 0 50 1 0 00 5 00 0 N ord E st C tre en R gion s Sd u O est u

Ba rre s horizonta le s
Ouest Rgions Centre Nord 0 500 1000 1500 2000 2500

M ontant ( m illie r s de DH)


Rgions OuestSudCentreEstNord0 Montant (en milliers de DH) 2000 1500 1000 500 0 Nord
ISTA Beni Mellal

Btons horizontaux

500 1000 1500 2000 Btons verticaux

Montants (en milliers de DH)

Est

Centre Sud Ouest

Rgions
Page 5 sur 30

STATISTIQUES DESCRIPTIVES I

STATISTIQUES DESCRIPTIVES

Les graphiques en btons sont bien adapts au tableau de rpartition. La langueur dun bton est proportionnelle au chiffre daffaires correspondant. Les graphiques en barres sont moins bien reprsentatifs du cas tudi ; en effet, une barre doit tre interprte par la surface et non par la longueur ; pourtant les graphiques en barres, tant plus esthtiques, sont davantage utiliss. Pour quils significatifs, il faut prendre la prcaution dattribuer la mme largeur chaque barre. Cette prcaution nest cependant pas suffisante : pour que les chiffres daffaires puissent tre interprts par lintermdiaire de la longueur des barres, il faut que la largeur de chaque barre soit gale lunit de mesure (souvent 1 centimtre, 1 millimtre). A-2 Graphiques en secteurs Les graphiques en secteurs font partie de la famille des graphiques ferms, cest dire des graphiques associs un ensemble fini dont les sous-ensembles sont reprsents par des zones proportionnelles leffectif correspondant. Un secteur est un sous-ensemble centr sur le milieu dun cercle (graphique circulaire) ou dun demi-cercle (graphique semi-circulaire), dont la profondeur (rayon) est constante (rayon du cercle ou du demi-cercle) et dont la longueur de la larc est proportionnelle un angle et une surface dfinissant un sous-ensemble. B Rayons du secteur (8,5 cm) Trac dun secteur 40,97gr Angle AOB= 36,873 (ou i ) 0,643555rd Longueur de larc (5,47cm)

Profondeur du secteur = OA = OB (= 8,5 cm sur le schma) Angle AOB : dpend de limportance dun sous-ensemble reprsenter et du choix entre le cercle et le demi-cercle.

Conseils pratiques pour tracer un secteur - calculer la frquence relative de la classe statistique reprsenter (ou effectif relatif particulier dfini antrieurement). Frquence absolue (ou effectif absolu particulier) Frquence relative = Effectif absolu total ni fi = N ni fi =
k

ni = n1+n2+..+nk

nj j=1 calculer la valeur de langle du secteur (en grades ou en degrs ou en radians) partir de fi et de la valeur de langle du demi-cercle ( ou du cercle selon le type dhypothse choisie). A= 180 ou 200gr ou radians, pour un demi-cercle i = fi x A avec A= 360 ou 400gr ou 2 radians, pour un cercle

ISTA Beni Mellal

STATISTIQUES DESCRIPTIVES I

Page 6 sur 30

STATISTIQUES DESCRIPTIVES

Tracer le rayon infrieur du secteur ( OA par exemple) dont la longueur est de prfrence un nombre entier dunits de mesure (choix proposs : 10 centimtres ou 5 centimtres). - Utiliser un rapporteur permettant de tracer le point suprieur du secteur partir du point infrieur ( point B partir du point A dont le secteur AOB). Application au chiffre d'affaires de la Socit VENTOUT, au 31/12/1988 : Rgions Nord Est Centre Sud Ouest Totaux Montant (en milliers de DH) n1 = 2 000 n2 = 1 200 n3 = 1 400 n4 = 600 n5 = 1 200 N= 6 400 Frquences relatives f1 = 2 000/ 6 400 = 0,31250 f2 = 1 200/6 400 = 0,18750 f3 = 1 400/6 400 = 0,21875 f4 = 600/ 6 400 = 0,09375 f5 = 1 200/6 400 = 0,18750 1 Angles i en demi-cercle En grades 1 = 200 x 0,31250 = 692,5 gr 2 = 200 x 0,18750 = 37,5 gr 3 = 200 x 0,21875 = 43,75 gr 4 = 200 x 0,09375 = 18,75 gr 5 = 200 x 0,18570 = 37,5 gr 200gr En degrs 662,5 x 0,9 = 56,25 37,5 x 0,9 = 33,75 43,75 x 0,9 = 39,375 18,75 x 0,9 = 16,875 37,5 x 0,9 = 33,75 180

*0,9 = 180/200. Pour calculer les angles i dans un cercle, il suffit de multiplier les frquences (fi) par 400 grades ou 360 degrs, ce qui reprsente deux fois les valeurs des angles (i) calcules en demi-cercle. Le rayon des secteurs tracs ci-aprs mesure 5 cm ( demi-cercle) ou 2,5 cm (cercle). Les secteurs peuvent tre coloris, hachurs, etc.

Comparaison avec les graphiques en barres Les graphiques en barres sont ralisable en effectifs absolus ou relatifs et permettent des comparaisons Chronologiques en valeurs absolues se qui nest ralisable quen valeurs relatives en graphiques circulaires ou semi-cerculaires. deux barres adjacenttes donnent une vision compartive mieux perceptible que deux cercles cte cte.

Ouest 19% Nord 31% Nord Sud 9% Est Centre Sud Ouest

Centre 22%
B/ CARACTERES QUANTITATIFS :

Est 19%

Caractres discrets (ou discontinus) Diagramme en btons Rparation des notes sur 20 dun devoir de mathmatiques dans une classe de 25 lves.
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 7 sur 30

STATISTIQUES DESCRIPTIVES

Notes 8 9 10 11 13 18 Total :

Nombre dlves 2 5 8 5 3 2 25

8 Nombre dlves 5-

Frquences absolues

3218 9 10 11 12 13 14 15 16 17 18 19 20 Notes Passage aux segments cumulatifs (fonction de rparation) Alors que le diagramme en btons permet de connatre le nombre dlve ayant obtenu une note prcise, la fonction en segments cumulatifs rpond la question : combien dlves ont obtenu une note infrieure telle note ? . Le tableau prcdent peut apporter la rponse moyennant un calcul. Ainsi, le nombre dlves ayant obtenu une note strictement infrieure 10 est gal : 2 + 5 = 7. La plupart des fonctions en segments cumulatifs sont associes des frquences cumules croissantes. Notes Frquence Frquences Frquences relatives Frquences cumules s relatives cumule croissantes croissantes absolues LARGES STRICTES 8 2 2/25 = 0,08 0,08 0 9 5 5/25 = 0,20 0,08 + 0,20 = 0,28 0 + 0,08 = 0,08 10 8 8/25 = 0,32 0,28 + 0,32 = 0,60 0,08 + 0,20 = 0,28 11 5 5/25 = 0,20 0,60 + 0,20 = 0,80 0,28 + 0,32 = 0,60 13 3 3/25 = 0,12 0,80 + 0,12 = 0,92 0,60 + 0,20 = 0,80 18 2 2/25 = 0,08 0,92 + 0,08 = 1 0,80 + 0,12 = 0,92 Totaux 25 1

ISTA Beni Mellal

STATISTIQUES DESCRIPTIVES I

Page 8 sur 30

STATISTIQUES DESCRIPTIVES

Frquences Relatives 0,32 stricte (FCS)


>

Frquences relatives cumules Diagramme en btons Frquences relatives 0,900,800,700,600,500,40>

Fonction cumulative 1> > Frquences croissantes


>

0,20cumules strictes 0,120,0818 19 20

0,300,200,10-

>

10 11

13

8 9 10 11 12 13 14 15 16 17 18 Notes Notes N.B : Les ordonnes des deux graphiques ci-dessous sont construites avec deux chelles diffrentes. Chaque segment horizontal contient le correspondant la borne suprieure, sans contenir le point de la borne infrieure : Signification : > Point infrieur exclu La FCS permet de connatre la frquence de notes infrieures une valeur ; soit la frquence relative de notes infrieures : 9 est gale 0,08 9,5 est gale 0,28 15 est gale 0,92 19 est gale 1 Pour connatre ces frquences, il suffit de reprer labscisse et de dtecter lordonne correspondante grce la FCS. Caractres continus Il sagit des caractres pouvant prendre toutes valeurs entre des limites finies. Histogramme Lhistogramme est sans doute le mode de reprsentation le plus pratiqu. Il sadapte des classes statistiques dfinies quantitativement par deux bornes numriques (minimum et maximum) dont la diffrence sappelle amplitude. Un lment quelconque de lensemble tudi ne peut appartenir qu une seule classe. Les classes statistiques sont des sous-ensembles formant une partition de lensemble. Exemple : Les tailles (en centimtres) des 25 lves sont les suivantes : 161,5 166 167 181 171 184 177 182 171 178,5 171 178 178,5 169,5 179 171 164 172 179 167 174 173 162 172 169 Tableau ralis partir dune amplitude de classe gale 5 cm Tailles (en cm) Nombre dlves correspondants [160 ; 165[ 3 5 [165 ; 170[ [170 ; 175[ [175 ; 180[ [180 ; 185[ Total
ISTA Beni Mellal

8 6 3 25
STATISTIQUES DESCRIPTIVES I Page 9 sur 30

STATISTIQUES DESCRIPTIVES

8Nombre dlves 653-

Histogramme

160 165 170 175 180 185

tailles en cm

Remarque : - Lhistogramme se compose de rectangles adjacents. La base dun rectangle reprsente lamplitude de la classe statistique correspondante. - Sur le graphique et dans le tableau prcdent, les classes ont toutes la mme amplitude. Comment interprter un histogramme ? Lhistogramme ne doit surtout pas tre interprt comme un diagramme en btons, cest--dire partir des hauteurs. Les rectangles sont tracs de telle faon que leurs surfaces sont proportionnelles aux effectifs correspondants. En consquence, leffectif total est reprsent par la somme des surfaces des rectangles.

Comment btir un histogramme lorsque les amplitudes varient dune classe une autre ? A partir des tailles des 25 lves, un autre tableau statistique peut tre construit : Tailles (en cm) [161; 165[ [165; 177[ [177; 185[ Amplitudes 165 - 161 = 4 177 - 165 = 12 185 - 177 = 8 Total: Nombre d'lves 3 13 9 25

Histogramme Nombre Dlves 4,5-----------------------------4,1/3--------3--1- S=3 0 161 165 u 3u 177 2u


STATISTIQUES DESCRIPTIVES I Page 10 sur 30

S=13

S=9

185

tailles en cm

ISTA Beni Mellal

STATISTIQUES DESCRIPTIVES

Explications : U est une unit de mesure des bases des rectangles de lhistogramme ; u est gale PGSD (Plus Grand Commun Diviseur) des amplitudes : 4= 2 x 2 = 4 U= PGSD (4 ;12 ;8) = 4 puisque 12= (2 x 2) x 3 = 4 x 3 8 = (2 x 2) x 2 = 4 x 2 ( la recherche du PGSD ncessite la dcomposition de chaque amplitude sous forme dun produit de facteurs premiers, puis la recherche des facteurs communs). S signifie surface. Dans le premier rectangle : S = 3 et base = 1 ( puisque 1x u), donc la hauteur h slve : S=bxh h = S/b = 9/2 = 4,5. Polygones de distribution Ils se tracent partir dun diagramme en btons ou dun histogramme : - en reliant les sommets des btons ; - en reliant les centres des sommets des rectangles dun histogramme amplitudes de classes constantes. Frquences Polygone

Valeur du Caractre Polygone

Valeur du Caractre Le total des surfaces hacures ( au-dessus du plygone) est au total des surfaces colories ( en dessous du polygone). Donc: la surface entre le polygone et laxe des abscisses est gale celle de lhistogramme, cest--dire leffectif total. Que faire, face des amplitudes ingales? Frquences Polygone

u u

3u

2u

u u

Valeurs du caractre

ISTA Beni Mellal

STATISTIQUES DESCRIPTIVES I

Page 11 sur 30

STATISTIQUES DESCRIPTIVES

Polygones de cumuls Les polygones de cumuls se construisent partir dhistogrammes de cumuls eux-mmes btis partir de tableaux de frquences (absolues ou relatives) cumules ( croissantes ou dcroissantes). A partir du tableau des tailles (cf. histogramme) avec amplitudes constamment gales 5 cm, le tableau suivant des frquences est dtermin :
Frquences Frquences absolues n i relatives f i Frquences cumules Absolues Croissantes Dcroissantes 3 25 3+5=8 25 - 3 = 22 8 + 8 = 16 22 - 5 = 17 16 + 6 = 22 17 - 8 = 9 22 + 3 = 25 9-6=3 Relatives Croissantes Dcroissantes 3/25 = 0,12 8/25 = 0,32 16/25 = 0,64 22/25 = 0,88 25/25 = 1

Tailles (en cm)

[160; [165; [170; [175; [180;

165[ 170[ 175[ 180[ 185[

n1 = 3 n2 = 5 n3 = 8 n4 = 6 n5 = 3 N = 25

F1 F2 F3 F4 F5 1

= = = = =

3/25 5/25 8/25 6/25 3/25

= = = = =

0,12 0,20 0,32 0,24 0,12

25/25 = 1 22/25 = 0,88 17/25 = 0,68 9/25 = 0,36 3/25 = 0,12

Il s'agit de frquences larges au sens tudi au diagramme en btons. Les frquences cumules croissantes strictes seraient calcules comme suit: Frquenc Frquence Frquences cumules croissantes strictes es s relatives Absolues Relatives absolues f i ni n1 = 3 f1 = 0,12 0 0 n2 = 5 f2 = 0,20 0+3=3 0 + 0,12 = 0,12 n3 = 8 f3 = 0,32 3 + 5 =8 0,32 + 0,20 = 0,32 n4 = 6 f4 = 0,24 8 + 8 = 16 0,32 + 0,32 = 0,64 n5 = 3 f5 = 0,12 16 + 6 = 22 0,64 + 0,24 = 0,88 N = 25 1 Les frquences cumules croissantes relatives sont gales aux frquences cumules croissantes absolues divises par N = 25. Les frquences cumules croissantes strictes (FCCS) sont gales, aprs dcalage d'une ligne, aux frquences cumules croissantes larges (FCCS): fccs = fccsi-1, i >1 fccs = 0 La surface trame reprsente l'histogramme des frquences cumules croissantes (cf. p. 170). Les points A1, A2, A3, A4, A5 reprsentent les frquences cumules croissantes larges. Les points A0, A1, A2, A3, A4, concernant les frquences cumules croissantes strictes. Les points B0, B1, B2, B3, B4, sont associs aux frquences cumules dcroissantes. Les polygones sont construits d'aprs l'hypothse d'une rpartition rgulire des informations dans chaque classe statistique. Frquences Cumules - 1 --------25- -----B0----------------------------------------------------A5 B1 - 0,80----- 20---------- A4 -0,60 ----- 15---------- A3 0,50-- 12,5 ------------------->---------------0,40 ----- 10B3 Cumul ----------- A2 -0,20 ---- 5 - croissant -----------A1 0 0 A0 160 165 170 175
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I

Cumul dcroissant B4 B5 180 185 Tailles (en cm)


Page 12 sur 30

STATISTIQUES DESCRIPTIVES

Mdiane = 172,8125 Comment lire un polygone de frquences cumules? Cumul croissant: 1- Interprtation du points A3 de coordonnes: taille = 175 cm, frquence cumule croissante = 16 (ou 0,64): 16 lves (ou 64% des lves) ont une taille strictement infrieure 175 cm. 2- Au point A4: 22 lves (ou 88 % des lves) ont une taille strictement infrieure 180 cm. 3- Au point A0: aucun lve n'a une taille strictement infrieure 160 cm. Cumul dcroissant: 1- Interprtation du point B2 de coordonnes: taille = 170 cm, frquence cumule = 17 (ou 0,68): 17 lves (ou 68% des lves) ont une suprieure ou gale 170 cm. 2- Au point B3: 9 lves (ou 36 % des lves) ont une taille suprieure ou gale 175 cm. 3- Au point B5: aucun lves n'a une taille suprieure ou gale 185 cm. Montant (en milliers de DH) 2000 1500 1000 500 0 Nord Est Centre Sud Ouest Rgions Les graphiques en btons sont bien adapts au tableau de rpartition. La langueur dun bton est proportionnelle au chiffre daffaires correspondant. Les graphiques en barres sont moins bien reprsentatifs du cas tudi ; en effet, une barre doit tre interprte par la surface et non par la longueur ; pourtant les graphiques en barres, tant plus esthtiques, sont davantage utiliss. Pour quils significatifs, il faut prendre la prcaution dattribuer la mme largeur chaque barre. Cette prcaution nest cependant pas suffisante : pour que les chiffres daffaires puissent tre interprts par lintermdiaire de la longueur des barres, il faut que la largeur de chaque barre soit gale lunit de mesure (souvent 1 centimtre, 1 millimtre).

Btons verticaux

Leon 2 : Le mode, la mdiane, la moyenne Une srie statistique est labore en vue dtre analyse ou compare dautre srie. Cette comparaison ou cette analyse se fait laide de certains caractristiques parmi lesquelles nous retenons pour linstant les caractristiques de tendance centrale. Pour se faire il faut caractriser chaque srie statistique par un nombre unique qui rsume la srie en question et donne une ide sur lordre de grandeur ou le niveau gnral du caractre tudi. Le choix de ce nombre unique appel valeur type peut tre fait arbitrairement. Seulement dans ce cas il ne permet pas de donner un bon jugement du caractre tudi. Cest ainsi quune valeur type doit rpondre certains nombre de conditions connues sous le nom de conditions de YULE. 1/ 2/ 3/ 4/ 5/ La valeur type doit tre objective. Elle doit tenir compte de toutes les observations. Avoir une signification concrte, simple concevoir. Etre simple calculer. Etre peu sensible aux fluctuations dchantillonnages.
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 13 sur 30

STATISTIQUES DESCRIPTIVES

6/ Se prter au calcul Algbrique. Les caractristiques de tendance centrale quon tudiera sont les mesures de position : Le mode, la mdiane, et les moyennes. SECTION 1 : LE MODE

Le mode est la valeur du caractre la plus frquente, cest--dire la valeur laquelle correspond leffectif le plus lev. Le mode est appel aussi dominante. Cas du mode dans un caractre discret (exemple du nombre denfants charge).

Nb d'enfant charge xi 0 1 2 3 4 5 6

Effectif ni 2 7 14 10 4 2 1

ni 16 12 -

Le mode est 2 car leffectif correspondant (14) est le plus grand de tous les effectifs observs. Lorsque le caractre considr est continu La valeur mode ne peut pas tre le centre de la classe modale cest--dire celle qui correspond leffectif le plus lev tant donn que le mode est attir du ct de la classe voisine qui a le plus grand effectif. Lexpression analytique du mode dun point de vue thorique sobtient en cherchant lintersection des segments AB et CD cette expression est B2 la suivante : B1 D

C
ISTA Beni Mellal

B Mo = X2 + (

B1

) x C
Page 14 sur 30

STATISTIQUES DESCRIPTIVES I

STATISTIQUES DESCRIPTIVES

B1 + B2 Exemple : xi 10 - 15 15 - 20 20 - 25 ni 3 7 6

X1

X2

X3

X4

La classe modale est 15 20 X2 = 15 B1 = 7 3 = 4 B2 = 7 6 = 1 Donc Mo = 15 + ( 4 ) x 5 = 19 4+1 Ce qui est diffrent du centre du classe = 17,5

Avantage du mode : La dtermination est immdiate aussi bien par le graphique qu laide du tableau statistique. Sa signification est vidente car il est intressant ce connatre la valeur de la variable qui revient le plus souvent au cours dobservation.

Inconvnients du mode : - Le calcul du mode ncessite les classes de mmes amplitudes - Lorsque la rpartition est multi - modale (plusieurs modes). Le mode perd alors toute signification, il est rejet comme mesure de tendance centrale. - La classe modale doit correspondre un effectif nettement plus lev que les autres effectifs. Pour ces raisons le mode est peu utilis comme caractristique de tendance centrale. SECTION 2 : LA MEDIANE La mdiane dune srie est la valeur Me du caractre tel que ; les observations classes dans un ordre, le nombre dunits statistiques prsentant des valeurs infrieures Me est gale au nombre dunit statistique prsentant des valeurs suprieures Me. a)Variable discrte : Un candidat un examen a obtenu les notes suivantes, sur 20 au cours des preuves quils a d subir : Notes 14 8 11 12 10 7 Coefficients 1 1 1 3 1 2 9 Rangeons dans lordre croissant les notes obtenues par ce candidat, la note 7 (coefficient 2) tant crite deux fois et la note 12 (coefficient 3) tant crite 3 fois :
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 15 sur 30

STATISTIQUES DESCRIPTIVES

7 - 7 - 8 - 10 - 11 - 12 - 12 - 12 - 14 Dans la srie ainsi crite et qui compte neuf termes, 9 tant la somme des coefficients, on dira que la note mdiane est 11 car les notes infrieures 11 sont au nombre de quatre et les notes suprieures 11 sont galement au nombre de quatre. Si le candidat en question avait subi une preuve supplmentaire avec coefficient 1, et obtenu cette preuve la note 6 lordre des notes : 6 - 7 -7 - 8 - 10 - 11 - 12 - 12 - 12 - 14 Les notes tant cette fois au nombre de 10 on aura un intervalle mdian (10, 11) , o la rigueur une mdiane gale 10,5 centre de lintervalle mdian ( 10 + 11 ) = 10,5 2 supposons maintenant que le candidat ait subi une autre preuve, avec coefficient 3, ce qui porte 13 la somme des coefficients et quil ait obtenu cette preuve la note 17. la srie des notes se prsentent alors comme suit : 6 - 7 - 7 - 8 - 10 - 11 - 12 - 12 - 12 - 14 - 17 - 17 - 17 Le nombre des notes tant 13, nous sommes conduits chercher la note de 7me rang, qui laisse 6 notes gauche et 6 notes droite. Cette note est 12. Cependant 12 nes pas la note mdiane car si nous avons bien 6 notes infrieures 12 nous navons pas 6 notes suprieures 12, en effet parmi les notes crites droite de 12 seules 4 notes sont suprieures 12. Nous pouvons en conclure que, lorsque la variable statistique est discontinue, il ny a pas, en gnral, de valeur mdiane. Ainsi dans lexemple des enfants charge, les nombres denfants peuvent tre crits.
0

0 2 4 4

, ,

1 1 1 7 5 , 2

2 2 2 14
6

3 3 3 , 10

Le 20me est un 2, nombre qui ne rpond pas la dfinition de la mdiane.

b) Variable continue :
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 16 sur 30

STATISTIQUES DESCRIPTIVES

nous allons reprendre lexemple de 40 agents de DA/AC classs saprs leur salaire, et utiliser dabord la colonne des coefficients cumuls croissants. SALAIRE xi 3,5 4,5 4,5 5,5 5,5 6,5 6,5 7,5 7,5 8,5 8,5 9,5 EFFECTIFS EFFECTIF ni cumul 3 3 15 18 10 28 6 34 5 39 1 40

40

La lecture de ce tableau nous montre que 18 agents ont un salaire infrieur 5,5 DH, et 28 ont un salaire infrieur 6,5 DH ; pour chercher le salaire du 20me agent ( 20 = 40 / 2 ).Nous pouvons dj affirmer que le salaire mdian cherch se situe entre 5,5 et 6,5. Pour donner un rsultat plus prcis ; formulons lhypothse que les salaires des 10 agents qui touchent au plus 6,5 DH se rpartissent uniformment sur lintervalle 5,5 6,5 Nous avons alors le schma suivant : 28 agents 10 agents 18 agents 18 19 20 5,5 21 22 23 24 25 26 27 28 6,5

La valeur mdiane sera alors donne par interpolation par parties proportionnelles ou interpolation linaire lintrieur de lintervalle 5,5 6,5 et nous obtenons : Mdiane = 5,5 + ( 6,5 5,5 ) 20 18 28 18 = 5,5 + 1 x 2 = 5,70 10

Nous pouvons schmatiser le calcul de la mdiane de la faon suivante : 10 Effectifs Cumuls 18 2 1 x correspondantes 5,5 Me = 5,5 + 0,2 = 5,7 fic en % 100 %
ISTA Beni Mellal

20

28

10 = 1 2 x

6,5

x= 2x1 10

Valeurs x = 0,2

nic 40
STATISTIQUES DESCRIPTIVES I Page 17 sur 30

STATISTIQUES DESCRIPTIVES

90 % 75 % 50 % 25 % 10 % 3,5 Avantage de la mdiane : La mdiane est dun calcul assez facile, puisque en fait elle rsulte presque dune lecture aprs classement des observations. Elle donne une ide statistique de la tendance centrale dune srie statistique, elle nest pas influence par les valeurs aberrantes qui pourraient figurer dans la srie. Inconvnients de la mdiane : La mdiane a des inconvnients de ses avantages. Dpendant plus de rang des units statistiques observes que des valeurs de la variable elle nest pas calcule suivant une formule mathmatique. SECTION 3 : LA MOYENNE 4,5 5,5 Me 6,5 7,5 8,5 9,5 30 20 10

1/ La moyenne arithmtique Exemple 1 : Soient, rangs par ordre croissant , les salaires horaires de 10 agents de DA/AC : 4,35 4,55 4,75 4,36 5,01 5,12 5,19 6,46 7,75 9,40 La moyenne arithmtique des salaires ci-dessus est : 4,35,+ 4,55 + 4,75 + 4,36 + 5,01+5.12 + 5,19 + 6,46 + 7,75 + 9,40 = 5,694 10 dans lanalyse statistique les termes dune srie statistique sont habituellement prsents par le symboles : x1, x2, x3 xi, xn. ntant le nombre de termes de la srie. La moyenne arithmtique de ces termes est alors reprsente par le symbole et la somme x1 + x2 + x3 + .. + xi xn par le symbole xi ou de faon plus prcise par xi (somme des xi pour i variant de 1 n ) avec ces conventions on peut crire : x = xi n

Exemple 2 : A partir de la srie statistique portant sur le nombre denfants charge de 40 agents de DA/AC ; cherchons calculer le nombre moyen denfants par agent. Rsolution : Le raisonnement est le suivant : 2 agents ont chacun 0 enfant, soit en tout 0 enfant 7 agents ont chacun 1 enfant, soit en tout 7 enfants
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 18 sur 30

STATISTIQUES DESCRIPTIVES

14 agents ont chacun 10 agents ont chacun 4 agents ont chacun 2 agents ont chacun 1 agents ont chacun

2 enfants, soit en tout 28 enfants 3 enfants, soit en tout 30 enfants 4 enfants, soit en tout 16 enfants 5 enfants, soit en tout 10 enfants 6 enfants, soit en tout 6 enfants 97 enfants = 2,42 40

40 agents ont ensemble

le nombre moyen denfant charge est donc : 97

le raisonnement qui vient dtre fait se traduit par le tableau de calculs suivants : Nombre denfants charge xi 0 1 2 3 4 5 6 Effectif ni 2 7 14 10 4 2 1 40 Le nombre moyen cherch est : x= Exemple 3 : Reprenons le tableau de la page 13 relatif aux salaires horaires des 40 agents de DA/AC et calculons le salaire moyen de cette srie. Dans ce cas les valeurs sont reprsentes sous forme de classes, pour calculer la moyenne arithmtique ; on prend les centres de classes comme valeurs observes. Classes de salaire 3,5 4,5 4,5 5,5 5,5 6,5 6,5 7,5 7,5 8,5 8,5 9,5 Centre de classe x i 4 5 6 7 8 9 effectifs ni 3 15 10 6 5 1 40 xi ni 12 75 70 42 40 9 238 xi ni ni = 97 40 = 2,425 xi ni 0 7 28 30 16 10 6 97

Nous venons de calculer les moyennes arithmtiques sur deux exemples de sries statistiques en utilisant la formule : x= xi ni ni

ISTA Beni Mellal

STATISTIQUES DESCRIPTIVES I

Page 19 sur 30

STATISTIQUES DESCRIPTIVES

dans la quelle chaque xi observe de la variable x tait pondre par leffectif ni qui lui correspondait. Cest--dire que chaque valeur de x intervenait dans le calcul de la moyenne un nombre de fois gal au nombre de fois o cette valeur avait t observe. La moyenne arithmtique est dite moyenne arithmtique pondre. Le salaire moyen est donc : x = 40 y = N = ni xi = ni (xi + c) N = ( ni xi + ni c ) N + c ni ni ni 238 = 5,95 DH

ni xi + ni c = ni xi ni ni

y = x + c (x + c ) = x + c Somme des carts par rapport la moyenne arithmtique est gal zro. Calcul de la moyenne arithmtique par changement de variable Le calcul de la moyenne arithmtique peut tre simplifi normment si on utilise un changement de variable judicieuse permis par les proprits de la moyenne arithmtique que nous avons vu prcdemment. On adopte une moyenne provisionne x0 qui peut tre gale au centre de lune quelconque des intervalles. (ce calcul est utilis uniquement dans le cas de classes de mmes intervalles ). Utilisant les proprits de la moyenne arithmtique. x = xi-x0 (K tant lamplitude de classes ) k _ _ _ on a x = x x0 k x = x - xo
k

_ x = k x + xo

Tableau de calcul (exemple des salaires des 40 agents de DA/AC). k=i on prend xo = 6 Classes salaires 3,5 - 4,5 4,5 - 5,5 5,5 - 6,5 6,5 - 7,5 7,5 - 8,5 8,5 - 9,5 de Centre classe xi 4 5 6 7 8 9 de Effectif ni 3 15 10 6 5 1 40 xi -xo -2 -1 0 1 2 3 x = xi xo k -2 -1 0 1 2 3 xi -6 -15 0 6 10 3 -2 ni

_ x = - 2 40 _ = -0,05 x = ( -0,05 x 1 ) + 6 _ x = 5,95 Inconvnients, avantages de la moyenne arithmtique La moyenne arithmtique prsente linconvnient dentraner des calculs parfois longs, et dtre influence par les valeurs aberrantes de la variable ( valeurs exagrment faibles ou fortes ).
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 20 sur 30

STATISTIQUES DESCRIPTIVES

Cependant le fait dutiliser les valeurs mme de la variable meilleure des caractristiques de position et la seule qui soit commodment utilisable pour des dveloppement mathmatiques. 2/ La moyenne gomtrique : Montrons dabord comment peut on conduit lide de moyenne gomtrique. Le chiffre daffaire mensuel dune entreprise est en progression gomtrique de raison 1,1. Il a t successivement au cours de 5 mois de : X1 =10.000 X2 =11.000 X3 = 12.100 X4 = 13.310 X5 =14.641 Renseignement qui sont prsents dans le tableau suivant : Chiffre daffaire mensuel xi 10.000 11.000 12.000 13.310 14.641 Effectif ni 1 1 1 1 1 5

Si lon se propose de rsumer par un chiffre daffaire mensuel moyen les 6 chiffres donns, on peut videmment additionner les 5 nombres, de diviser par 5 calculant ainsi leur moyenne arithmtique. Mais on peut aussi calculer le terme moyen de la progression gomtrique en faisant le produit des 5 nombres donns et en extrayant la racine 5me du rsultat. On obtiendra ainsi la moyenne gomtrique du 5 nombres, rsultat qui aura une signification plus logique que la moyenne arithmtique. Ainsi la moyenne gomtrique : G =5 x1.x2.x3.x4.x5 = = 12.080

= 510.000x11.000x12.000x13.310x14.641

Dune faon gnrale, si lon dispose du tableau statistique habituel la moyenne gomtrique des valeurs x1, x2, x3xk sera donne par la formule : G =n xn1 . xn2. xn3 xnk
2 3 k

Valeur de la variable xi x1 x2 xi xk n1 n2 ni nk

Effectifs ni

ni = N Le calcul dune moyenne gomtrique est toujours long et pnible. On aura alors avantage crire la formule qui donne G sous forme logarithmique. n2Logx2 + nkLogxk ni Ce qui permet dnoncer que le logarithme de la moyenne gomtrique est gal la moyenne arithmtique des logarithmes des valeurs de la variable : ni Log xi Log G = ni
Log G =

n1Logx 1

ISTA Beni Mellal

STATISTIQUES DESCRIPTIVES I

Page 21 sur 30

STATISTIQUES DESCRIPTIVES

Exemple de calcul dune moyenne gomtrique . Notes xi 15 12 9 7 3 Coefficient ni 2 3 2 2 1 10 Log xi 1,176 1,079 0,954 0,845 0,477 niLogxi 2,352 3,237 1,908 1,690 0,477 9,664

9,66 = 0,9664 10 G = 9,255 Le calcul de la moyenne gomtrique prsente toujours un intrt et a toujours une signification lorsque les valeurs observes de la variable, mises on ordre croissant ou dcroissant sont en progression gomtrique. 3/ La moyenne Harmonique Montrons dabord dans quels problmes on peut tre conduit calculer une moyenne harmonique. Exemple : Supposons quune entreprise dispose de 2 voitures automobiles dont la consommation respectives de carturant, pour une distance de 10 Km, sont de 20 titres et 10 titres lentreprise se propose de calculer la consommation moyenne de carturant, pour 100 Kilomtres, des deux voitures en question. Nous pouvons, bien entendu, calculer la moyenne arithmtique des consommations qui sera gale 30/2=15 : aux 100 Km. Mais nous pouvons aussi tenir le raisonnement suivant : Le premier vhicule permet de couvrir avec 1 L de carburant 100/20 = 5Km Le second vhicule permet de couvrir avec 1 L de carburant 100/20 = 10Km

Log G =

En moyenne, les deux automobiles permettent donc de parcourir avec 1 L de carburant 5 + 10 = 7 Km 500 2 Et en moyenne, la consommation de carburant aux 100 Km sera donc de 100/7,5 = 13,33 litres. Rsultat diffrent des 15 L prcdemment obtenu. Nous venons de calculer la moyenne harmonique des deux quantits 20 et 10 moyenne qui satisfait la relation : N = n1 + n2 +.nk ( avec N= ni ). H x1 x2 xk

Ce qui peut aussi dcrire : 1 1 = ni . xi et H ni snonce " Linverse de la moyenne harmonique est gale la moyenne arithmtiques des inverses des valeurs de la variable" . Exemple 2 Soient deux pays voisins dgale population, dans le premier il y a 4 habitants pour une voiture , dans le second il y a 12 habitants pour une voiture . Quel est le taux dquipement ? La rponse nest pas la moyenne arithmtique de 4 et 12 (4 + 12 = 8) 2
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 22 sur 30

STATISTIQUES DESCRIPTIVES

Mais leur moyenne harmonique 1 H

= 1 (1 + 1 ) = 1 2 4 12 6

donc H + 6

En effet, les deux pays tant galement peupls, il y a 3 voitures pour 12 habitants dans le premier et une voiture pour 12 habitants dans le second, soit 4 voitures pour 24 habitants do 1 voiture pour 6 habitants. Exemple de calcul de la moyenne harmonique xi ni 1/xi 1/xi ni 1 22 1,00 22,00 2 31 0,50 15,50 3 20 0,33 6,67 4 11 0,25 2,75 5 4 0,20 0,80 6 1 0,167 0,17 89 47,89 Nous aurons 1 / H = 47,89 / 89 do H = 89 / 47,89 = 1,86 Le calcul de la moyenne harmonique sera intressant chaque fois que lon pourra donner un sens aux nombres inverses des valeurs de la variable statistique. 4/ Conclusion sur les moyennes Toutes les moyennes que nous venons de rencontrer remplissent leur rle, qui est de donner en un seul chiffre ide de la valeur centrale dune srie statistique. Cependant leurs dfinitions ; leurs modes de calcul nous conduisent donner la prfrence la moyenne arithmtique. Indiquons encore, que les trois moyennes retenues satisfont toujours aux conditions dingalit : H<G < X Rappelons enfin que ces moyennes dont le rle est de rsumer une srie statistique, sexpriment dans la mme unit que la variable tudie. COMPARATION DES DIVERS CARACTERISTIQUES DE TENDANCE CENTRALE 1/ La moyenne et sauf exception, la moyenne arithmtique est gnralement la meilleure caractristique de tendance centrale. Elle dpend de la valeur de toutes les observations. Elle est dfinie sans ambigut, et correspond une notion bien comprise du public. Elle se prte aux calculs algbrique et nest que relativement peu sensible aux fluctuations dchantillonnage.

2/ La mdiane est facile dterminer, puisquelle nexige aucune opration arithmtique mais un simple classement des termes. Mais elle est moins connue du public, et sensible que la moyenne aux fluctuations dchantillonnage . Elle se prte assez mal aux calculs algbriques et ne convient gure la reprsentation des caractres discontinus. Elle limine leffet des valeurs aberrantes ce qui lui confre un avantage sur la moyenne si du moins, la srie comporte des valeurs effectivement aberrantes. Sa valeur descriptive est toujours intressante puisquelle exprime le cas qui a autant de chances dtre dpass que de ne pas dtre. 3/ Lintrt pratique du mode est incontestable, puisquil reprsente le cas le plus courant, la valeur-type qui mrite dtre particulirement tudie. Cette notion est parfaitement comprise du public. Mais sa dtermination est souvent ambigu, surtout si le caractre tudi est continu, et elle nest gure accessible par voie dchantillonnage : Le mode de lchantillon risque dtre trs diffrent de celui de lensemble dont il a t extrait. Lapparition de plusieurs modes correspondant aux diverses varits dmontrera lheterogeneit de lensemble tudi dcoulant elle mme dune dfinition insuffisante de lunit statistique. Lorsque la distribution est parfaitement symtrique les trois paramtres X, Me, Mo, sont alors gaux . Si la distribution est uni modale et modrment asymtrique les trois caractristiques se trouvent lies, approximativement par la relation : (x - Mo ) = 3(x - Me) qui permet, lorsque deux caractristiques sont connues destimer la troisime.

ISTA Beni Mellal

STATISTIQUES DESCRIPTIVES I

Page 23 sur 30

STATISTIQUES DESCRIPTIVES

Leon 3 :VARIANCE , ECART-TYPE INTRODUCTION La valeur centrale ne fournie quune reprsentation trs insuffisante de lensemble tudi, si lon ignore comment les termes se groupent autour de cette valeur. Deux sries de rpartition peuvent avoir la mme moyenne est tre diffrentes lune de lautre. cette diffrence peut tre remarquer dans la dispersion de chacune des 2 rpartition. Pour cela nous nous posons la question suivante : Dans quel cas la moyenne calcule dans les deux rpartitions est significative (a un sens) ? Exemple : Srie 1 X1 = 2 X2 = 98 X = 50 X nest pas significative les valeurs Sont trs diffrentes, elles sont trs Disperses lune de lautre. srie 2 y1 = 48 y2 = 52 y = 50 y plus sens car les valeurs sont proches lune de lautre

Nous sentons alors le besoin de caractriser toute rpartition par une mesure de dispersion pour ainsi pouvoir comparer des sries, pour la comparaison desquelles les caractristiques de tendance centrale se soit avres tre des instruments insuffisants. Nous nous limiterons tudier la variance et lcart-type . Calcul de la variance Formule de base La variance est la moyenne arithmtique des carrs des carts des valeurs de la variable leur moyenne arithmtique. V = ( xi x )2 ni ni La variation des 10 salaires est donc V = 1,412 + 1,202 + 1,002 + 0,792 + 0,742 + 0,632 + 0,562 + 0,702 + 1,992 + 3,642 10 = 23,77 = 2,377 10 mais ce rsultat sexprime en dirhams au carr unit dont la comprhension est videmment peu accessible et, pour retrouver un nombre sexpriment en dirhams, comme les termes mme de la srie lon se trouve naturellement amen prendre la racine carr de la variance . On dfinit ainsi une nouvelle caractristique de la dispersion, appele cart-type (dsign gnralement par la lettre grecque sigma) et dont limportance en analyse est primordiale. = 2,377 = 1,54 III- Calcul de lcart type En effet lcart type et la variation se prtent bien aux combinaisons algbriques. Tableau de calcul de lcart type pour une srie classe (exemple de la srie des 40 salaires) Classes 3,5 4,5 4,5 5,5 5,5 6,5 Xi 4 5 6
ISTA Beni Mellal

ni 3 15 10

Xi ni 12 75 60

Xi -1,95 -0,95 0,05

(xi x ) 3,8025 0,9025 0,0025

(xi x ) 2 ni 11,4075 13,5375 0,0250

STATISTIQUES DESCRIPTIVES I

Page 24 sur 30

STATISTIQUES DESCRIPTIVES

6,5 7,5 7,5 8,5 8,5 9,5

7 8 9

6 5 1 238

42 40 9

1,05 2,05 3,05

1,1025 4,2025 9,3025

6,6150 21,0125 9,3025 61,9000

Il est vident que la somme algbrique des carts avec la moyenne (pris avec leur signe) sera toujours nulle, aussi additionne t-on les carts absolus. Lcart absolu moyen est gal la moyenne arithmtique des carts absolus de toutes les valeurs par rapport la moyenne : e = xi x N Exemple : soit la srie dix salaires 4,35 5,754 - 1,414 4,55 5,754 -1,204 4,75 5,754 -1,004 4,96 5,754 -0,794 5,01 5,12 5,19 6,46 7,75 9,400 5,754 5,754 5,754 5,754 5,754 5,754 -0,744 -0,634 -0,564 + 0,706 + 1,996 + 3,646

e = 1,414 + 1,204 + 1,004 +0,794 + 0,744 + 0,634 + 0,564 + 0,706 + 1,996 + 3,646 10 = 12,706 = 1,27 10 Dans le cas des observations groupes par classe lcart moyen est calcul comme moyenne arithmtique pondre. Exemple de la srie classe des salaires des 40 agents de DA/AC. Xi 4 5 6 7 8 9 Ni 3 15 10 6 5 1 40 ni .xi 12 75 60 42 40 9 238 Xi - x -1,95 -0,95 0,05 1,05 2,05 3,05 Xi x . ni 5,85 14,25 0,50 6,30 10,25 3,05 40,20

3,5 4,5 5,5 6,5 7,5 8,5

4,5 5,5 6,5 7,5 8,5 9,5

e = xi x .ni = 40,20 = 1,005 ni 40 v = 61,9/40 = 1,5475 = 1,24 Lcart type mesure la dispersion autour de x , et plus que sa valeur est grande plus la dispersion des observations autour de la moyenne est importante. Autre formule de calcul de la variance et de lcart type Le calcul de la variation nous a conduit calculer la quantit . (xi x )2 ni si on dveloppe lidentit ( xi x )2 on obtient : ( xi - x ) 2 ni = xi2 ni 2 x xi ni + x 2 ni Or nous savons que : x = xi ni do xi ni = x ni ni Alors (xi x )2 ni = xi2 ni 2 x 2 ni + x 2 ni = xi2 ni - x 2 ni
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 25 sur 30

STATISTIQUES DESCRIPTIVES

do v = (xi x )2 ni = xi ni2 - x 2 ni ni ni v = ( xi2 ni/ ni ) - x 2 = v Formule dvelopp du calcul de la variance Tableau de calcul Classe 3,5 4,5 5,5 6,5 7,5 8,5 4,5 5,5 6,5 7,5 8,5 9,5 (1) xi 4 5 6 7 8 9 (2) ni 3 15 10 6 5 1 40 ( 3 ) = (1) x (2) (4) = (3) x (1) xi .ni xi 2 . ni 12 48 75 375 60 360 42 294 40 320 9 81 238 1478

V = 1478/40 (238/40) V = 1,5475 = 1,5475 = 1,24 Changement de variable Prenons le tableau de calcul de la moyenne arithmtique par changement de variable et calculons la variance par la formule dveloppe : K= 1 , xo = 6 Classe 3,5 4,5 8,5 6,5 7,5 8,5 4,5 5,5 - ,5 7,5 8,5 9,5 xi 4 5 6 7 8 9 ni 3 15 10 6 5 1 40 xi - ni -2 -1 0 1 2 3 x = (xi xo ) K -1 0 1 2 3 xi . ni -6 -15 0 6 10 3 -2 xi ni 12 15 0 6 20 9 62

x=

-2 /40 = -0 ,05

x = ( -0 .05 x 1) + 6 = 5.95 = K xi ni / ni - x = 1 62 /40 -( 0,05 )

= 1,24 Le coefficient de variation Toutes les mesures de dispersion que nous avons vu sont des mesures absolues car elle sexpriment en unit de caractre et dpendent du niveau gnral de ce mme caractre . Cest ainsi que nous introduisons des mesures de dispersion relatives en prenant le rapport des mesures absolues tudies sur la mesure de tendance centrale .
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 26 sur 30

STATISTIQUES DESCRIPTIVES

La mesure la plus utilise est : lcart type relatif appel coefficient de variation : Cv = / x Si les deux populations ont le mme niveau gnral ( peu prs la mme moyenne ) on utilise les mesures absolues pour faire la comparaison de la dispersion . La mesure de la dispersion relative sera utilise uniquement lorsque les deux populations ont deux niveaux diffrents . De mme que ces mesures seront utilises lorsqu il sagit de comparer la dispersion de deux caractres diffrents pour une mme population .

Ainsi et ds ce premier contact, le lecteur aura pu prendre conscience des possibilits, des sujtions, et des limites de loutil statistique : La statistique se propose de rsoudre des problmes qui, rigoureusement parlant , sont insolubles ; elle ne peut le faire que grce ladoption de certaines conventions. La plus part de ces conventions ne sont pas absurde et sont recueillies . La valeur des rsultats obtenus en statistiques est fonction des conventions adoptes et leur interprtation doit toujours se faire fonction de la nature du domaine ex DEVOIR Cas n 1 : A un examen on a relev pour 100 candidats les notes suivantes : Notes moins de 2 de 2 moins de 4 de 4 moins de 6 de 6 moins de 8 de 8 moins de 10 de 10 moins de 12 de 12 moins de 14 de 14 moins de 16 de 16 moins de 18 de 18 20 Nombre de candidats 3 2 15 14 20 23 12 5 5 1

1. Tracer l'histogramme des effectifs et le polygone des effectifs cumuls croissants. 2. Calculer la mdiane et la moyenne de cette srie. Cas n 2 : On donne le tableau statistique suivant : Valeurs Effectifs 20 10 2 25 15 30 10 35 40 8 45 5

1. Quel est le mode et la mdiane de cette distribution ? 2. calculer la moyenne, la variance et l'cart type.

ISTA Beni Mellal

STATISTIQUES DESCRIPTIVES I

Page 27 sur 30

STATISTIQUES DESCRIPTIVES

Solution Cas n1 1- Pour la population tudie : 100 candidats. Le caractre statistique retenu (note obtenue lexamen) est un caractre quantitatif. La variable statistique (valeur de la note) est continue et par consquent les classes sont dfinies par des intervalles . Daprs les donnes, les classes ont t choisies damplitude gale 2. Compltons le tableau statistique par la colonne des effectifs cumuls dcroissants. Classes [ 0, 2 [ [ 2, 4 [ [ 4, 6 [ [ 6, 8 [ [ 8,10 [ [10,12[ [12,14[ [14,16[ [16,18[ [18,20[ Effectifs 3 2 15 14 20 23 12 5 5 1 Effectifs cumuls 3 5 20 34 54 77 89 94 99 100

100 Ne confondez pas le polygone des effectifs cumul et le polygone des effectifs figur en pointill sur lhistogramme.

2 . Calcul de la mdiane n= 100 n/2 =50 Daprs le calcul des effectifs cumuls, nous savons que leffectif 50 est atteint dans la classe [8,10[ 8 correspondant leffectif 34 10 correspondant leffectif 54 Donc pour leffectif 50=34+16 m=8+2x16/20=9,6 On peut considrer que 50 candidats ont obtenus une note infrieure 9,6 et 50 candidats ont obtenu une note suprieur 9,6. Daprs le polygone des effectifs cumuls, m est labscisse du point dordonne 50. Calcul de la moyenne On dtermine au pralable les centres des classes xi, puis on calcule les produits ni xi . xi 1 3 5 7 9 11 13 15 17
ISTA Beni Mellal

ni 3 2 15 14 20 23 12 5 5

Ni xi 3 6 75 98 180 253 156 75 85


STATISTIQUES DESCRIPTIVES I Page 28 sur 30

STATISTIQUES DESCRIPTIVES

19

1 100

19 950
HISTOGRAMME

25 EFFECTIFS 20 15 10 5 0 de 2 4 de 6 8 de 10 12 de 14 16 de 18 20

Nombre de candidats NOTE

Polygone des effectifs cum uls effectifs cummuls

120 100 80 60 40 20 0
de 4 6 Notes moins de 2 de 8 10 de 12 14 de 16 18 note

Srie1

x = 950/100 =9.5 9.5 est la note moyenne obtenue sur lensemble des 100 candidats. Cas n2 : 1 . Le monde est la valeur de la variable d effectif maximum. m =25 La mdiane partage la srie en deux groupes de mme effectifs. Valeurs 20 25 30 35 40 45 Effectifs 10 15 10 8 5 2 Effectifs cumuls 10 25 35 43 48 50

Or, on constate que : - pour les valeurs de la variable infrieures ou gales 25 le nombre dobservations releves est : 10 + 15 =25 - pour les valeurs de la variable suprieurs ou gales 30 le nombre dobservations est : 10 + 8 + 5 + 2 =25 Il y a donc deux valeurs possibles de la mdiane : m=25 ou m=30 On peut aussi prendre pour mdiane le milieu de lintervalle mdian [25,30[. Soit, m=27,5 3. Calcul de la variance et de lcart-type.
STATISTIQUES DESCRIPTIVES I Page 29 sur 30

ISTA Beni Mellal

STATISTIQUES DESCRIPTIVES

xi 20 25 30 35 40 45

ni 10 15 10 8 5 2 50

xi 400 625 900 1225 1600 2025

ni xi 4000 9375 9000 9800 8000 4050 44225

ni ;xi 200 375 300 280 100 90 1445 k

La moyenne est : x = 1/n ni .xi 1 Soit : x = 1445/50 =28,9 La variance est donne par la formule : k V= 1/n ni.xi- x 1 Do : V = 1/50 x 44225 (28,9) Lcart-type est la racine carr positive de v . Do : = 49,29 = 7,02 Remarque : Pour allge les calculs, on pouvait effectuer le changement de repre dfini par : xi = 30 + ui ( par exemple).

Sachant que , dans ce cas : X = 30 + u et V = 1/nni.ui - u xi 20 25 30 35 40 45 ni 10 15 10 8 5 2 50 ui ui - 10 100 -5 0 5 10 15 25 0 25 100 225 ni.ui 1000 375 0 200 500 450 2525 ni.ui - 100 -175 - 75 0 40 50 + 120 30 - 55

u = - 55/ 50 = - 1,1 ; x = 30 1,1 = 28,9 V = 2525 /50 =

ISTA Beni Mellal

STATISTIQUES DESCRIPTIVES I

Page 30 sur 30

Vous aimerez peut-être aussi