Vous êtes sur la page 1sur 55

Master 1 MRHDS Traitement statistique des donn ees

Cyrille Joutard et Jean-Michel Kosianski


Universit e Paul Val ery-Montpellier 3

Ann ee universitaire 2012-2013

Organisation
1) 1h30 Cours - 1h30 TD par semaine

2) Informations et documents sur le site http://www.univ-montp3.fr/miap/ens/ cliquer sur le lien M1MRHDS: Traitement statistique des donn ees

Introduction
` des Les statistiques: Ensemble de donn ees, dobservations relatives a groupes dindividus, pr esent ees sous forme de tableaux num eriques, de graphiques ou synth etis ees par des r esum es num eriques. La statistique: Ensemble de m ethodes ayant pour objectif la collecte, la pr esentation, le traitement de donn ees dune part, lanalyse de ces donn ees, leur mod elisation et la prise de d ecision dautre part. Ce cours portera principalement sur la Statistique descriptive (on ` d ` synth tudi sint eresse a ecrire et a etiser les donn ees e ees) = Statistique ` tirer des conclusions g ` partir des inf erentielle (on cherche a en erales a chantillon) utilise notamment les donn ees observ ees sur un e probabilit es.

Exemple 1: Notes d etudiants et li` eres d etude tudiants dune On a not e dans le tableau ci-dessous la r epartition de 100 e ` une e preuve universit e par li` ere d etude et par classe de notes obtenues a dun concours commun. Note Fili` ere A Fili` ere B Fili` ere C Fili` ere D [0, 6[ 26 12 1 10 [6, 10[ 6 9 4 8 [10, 14[ 4 3 5 3 [14, 20] 1 1 6 1

Exemple 2: Sondage sur une mesure gouvernementale chantillon est pr Un e elev e au hasard dans la population franc aise pour sonder lopinion sur une mesure du gouvernement. On a obtenu les ` la mesure, 894 indiff r esultats suivants: 689 sont oppos es a erents et 417 favorables.

Exemple 3: Habitants dune r esidence de Montpellier Dans une r esidence de Montpellier comprenant 11 appartements, on sint eresse au nombre de personnes habitant dans chaque appartement. On a obtenu les r eponses suivantes: 1, 3, 1, 0, 2, 2, 4, 1, 3, 1, 2 Exemple 4: Produits dune grande surface Dans le tableau ci-dessous, on a r eparti 700 produits provenant dune grande surface franc aise selon leur classe de prix (en euros). Prix Effectifs ]0, 10[ 110 [10, 15[ 205 [15,30[ 235 [30,45[ 70 [45,150] 80 Total 700

Exemple 5: Couleurs des yeux et des cheveux On souhaite savoir sil existe un lien entre la couleur des cheveux et la l` cole primaire. couleur des yeux chez les 445 e eves dune e On a relev e les effectifs suivants: Couleur yeux \ cheveux Marron Gris-vert Bleu Brun 113 38 20 Noir 72 41 17 Roux 7 10 8 Blond 39 27 53

Chapitre I. Description dune situation statistique


1) Population et individus
Lensemble des individus sur lequel porte l etude sappelle la tudier la population en population. Comme en g en eral, on ne peut pas e chantillon. Les individus entier, on en extrait une partie appel ee e tudi constituant l echantillon sont donc extraits de la population e ee. tre repr L echantillon est cens ee esentatif de cette population (note: le processus de s election des individus de l echantillon fait parti dune chantillonnage qui ne sera pas e tudi branche de la statistique appel ee e ee dans ce cours). ` la population dans son entier on parle Lorsque l echantillon correspond a de recensement.

Pour d esigner un individu, on parle aussi dunit e statistique. Notons quun individu (ou unit e statistique) nest pas n ecessairement une personne (exemple: une voiture, une ville franc aise, un appartement,...) On notera n=taille de l echantillon = nombre dindividus de l echantillon = effectif total Exemple 1: Notes d etudiants et li` eres d etude tudiants dune universit Les individus sont des e e. chantillon M eme si ce nest pas pr ecis e on peut penser quil sagit dun e tudiants nont pas e t (tous les e e interrog es). La taille de l echantillon est n = 100. Exemple 2: Avis sur une mesure gouvernementale Les individus sont des personnes habitant en France. chantillon (a priori repr Il sagit dun e esentatif de la population franc aise). La taille de l echantillon est n = 2000.
8

Exemple 3: Habitants dune r esidence Les individus sont les appartements dune r esidence de Montpellier. tudi Il sagit dun recensement car on a e e tous les appartements de la r esidence. La taille de le la population (= echantillon) est n = 11. Exemple 4: Produits dune grande surface Les individus sont des produits dune grande surface franc aise. chantillon mais ce nest pas clairement sp Il pourrait sagir dun e eci e. La taille de l echantillon est n = 700. Exemple 5: Couleurs des yeux et des cheveux cole primaire. Les individus sont les enfants dune e Cest un recensement. La taille de la population (= echantillon) est n = 445.

2) Variable(s)
tudi Le (ou les) caract` ere(s) e e(s) et mesur e(s) sur les individus est (sont) appel e(s) la (ou les) variable(s). On la (les) notera par des lettres majuscules: X, Y, Z.... On observe et mesure la (ou les) variable(s) sur chaque individu de l echantillon. ge, taille, salaire, note a ` un examen, nombre Exemple de variables: a denfants, mention au bac, etc.... ` une variable. On appelle modalit es les r eponses faites par les individus a Pour un individu donn e, on na quune seule r eponse possible (par variable). On notera ces r eponses par des lettres minuscules. Par exemple, ` la x2 repr esente la r eponse faite par lindividu num ero 2 de l echantillon a variable X . tudie 2 variables X et Y (au lieu dune seule), (x5 , y5 ) repr Si on e esente les r eponses faites par lindividu num ero 5 de l echantillon aux 2 variables X et Y .
10

On fait la distinction entre lensemble des modalit es observ ees et lensemble des modalit ees observables (les r eponses possibles). Il se t peut tr` es bien que toutes les r eponses possibles naient pas e e tudi observ ees parmi les n individus constituant l echantillon e e. En effet soit lensemble des modalit es observables est inni (ex: modalit es de la variable taille en cm) soit certaines r eponses nont tout t simplement pas e e propos ees par les n individus de l echantillon. On notera MX lensemble des modalit es de la variable X . On pourrait avoir par exemple: MX = {Passable, Assez bien, Bien, Tr` es bien}. MX = {1, 2, 3, 4, 5, 6}. MX = [140, 200]. MX = {musique, th eatre, danse, autre}.
11

Lorsque lensemble des modalit es est ni (en particulier ce nest pas un intervalle comme dans lexemple MX = [140, 200]), on note K son cardinal (cest-` a-dire le nombre d el ements de lensemble). Dans le cas g en eral, on aura alors MX = {m1 , . . . , mK }. Si K = 2 (2 modalit es pour la variable), on dit que la variable est ` une question). dichotomique (exemple: r eponse (Oui/Non) a

12

` pr ` la nature des ces variables (qui d Nous nous int eressons a esent a epend de la structure de lensemble des modalit es): Variable qualitative: Lorsque les modalit es dune variable sont des mots (ou des codes utilis es pour d esigner des mots), on dit que la variable est qualitative. Dans ce cas les modalit es sont aussi appel ees niveaux (de la variable). Il existe 2 types de variables qualititatives : Variable qualitative nominale: Il nexiste pas dordre naturel entre les diff erentes modalit es (ou niveaux) de la variable (ex: cat egories socio-professionnelles, couleurs des cheveux,....) Variable qualitative ordinale: Il existe un ordre naturel entre les modalit es et il est donc possible dordonner ces modalit es les unes par rapport aux autres (ex: mentions au bac, niveaux de difcult e dun test,...)

13

Variable quantitative: Les modalit es dune variables quantitative sont des nombres (obtenus par comptage, mesure, etc..). On parle alors de valeurs (de la variable) plut ot que de modalit es. Il existe 2 types de variables quantitatives : Variable quantitative discr` ete: les valeurs sont en g en eral des nombres entiers obtenus par d enombrement (ex: Nombre denfants dune famille, Nombre d etages dun immeuble, etc..) Variable quantitative continue: les valeurs sont en g en eral des nombres d ecimaux lus par un instrument de mesure r eel ou imaginaire. Elles sexpriment souvent dans une unit e (ex: taille en cm, salaire en euros, dur ee en min,...). Notons quentre deux valeurs distinctes, il existe en th eorie une innit e de valeurs possibles.

14

Exemple 1: Notes d etudiants et li` eres d etude X : Fili` ere d etude Y : Note MX = {A, B, C, D}. Variable qualitative nominale MY = [0, 20]. Variable quantitative continue Exemple 2: Avis sur une mesure gouvernementale X : Avis MX = {Oppos e, Indiff erent, Favorable}. Variable qualitative ordinale Exemple 3: Habitants dune r esidence X : Nombre de personnes (habitant dans un appartement) MX = {0, 1, 2, 3, 4}. Variable quantitative discr` ete

15

Exemple 4: Produits dune grande surface X : Prix MX =]0, 150]. Variable quantitative continue Exemple 5: Couleurs des yeux et des cheveux X : Couleur des yeux Y : Couleur des cheveux MX = {Marron, Gris-vert, Bleu} Variable qualitative nominale MY = {Blond, Brun, Noir, Roux} Variable qualitative nominale

16

3) Donn ees
` la mani` On sint eresse maintenant a ere dont les donn ees (lensemble des r eponses des individus) sont pr esent ees. En g en eral, les donn ees dont on dispose ont d ej` a subi des transformations pour les rendre plus lisibles. t Les donn ees dans leur forme originelle (aucune transformation na e e effectu ee) sont appel ees donn ees brutes. Elles peuvent se pr esenter sous la forme dun tableau avec en lignes les individus et en colonnes les variables. Dans le cas dune seule variable X, on aurait alors par exemple:
Num ero de lindividu (identiant) 1 2 3 4 . . . n Variable X m3 m2 m4 m1 . . . m1

17

Exemple 2: Avis sur une mesure gouvernementale: Le tableau des donn ees brutes pouvait se pr esenter sous la forme:
Num ero de lindividu 1 2 3 4 . . . n Avis Indiff erent Indiff erent Oppos e Favorable . . . Oppos e

tre simplement pr Les donn ees brutes pourraient aussi e esent ees sous la ` la variable X . Par forme dune liste de n r eponses (1 par individu) a exemple, on pourrait avoir: x1 = Indiff erent, x2 = Indiff erent, x3 = Oppos e, x4 = Favorable, . . ., xn = Oppos e, ou encore plus simplement: Indiff erent, Indiff erent, Oppos e, Favorable, . . ., Oppos e.
18

Exemple 1: Notes d etudiants et li` eres d etude X = Fili` ere d etude (variable qualitative nominale). ` l Y = Note obtenue a epreuve (variable quantitative continue). Les ensembles des modalit es pour X et Y sont MX = {A, B, C, D} et MY = [0, 20]. Le tableau des donn ees brutes pouvait se pr esenter sous la forme: Num ero de l etudiant 1 2 3 4 . . . n Fili` ere (X) B A B D . . . C Note (Y) 10.5 4.5 12 8.5 . . . 14

19

Souvent, on regroupe les individus qui ont donn e la m eme r eponse (cest-` a-dire la m eme modalit e) et on compte leur nombre. Donc pour chaque modalit e (dans le cas dun ensemble de modalit es de cardinal ni), on obtient leffectif associ e, cest-` a-dire le nombre dindividus (dans l echantillon) ayant choisi cette modalit e. Pour une variable X avec K modalit es, on a alors le tableau suivant donnant la r epartition des individus selon les K modalit es: Variable X Effectifs nk m1 n1 m2 n2 mK nK

Ce tableau donne la distribution en effectifs de la variable X, notion qui fait lobjet du chapitre suivant.

20

En r esum e, lorsque lon veut d ecrire une situation statistique, on doit clairement identier: ventuellement la Les individus (qui est lobjet de l etude?) et e chantillon (en donnant la taille de l population et le echantillon et en pr ecisant si possible sil sagit dun recensement). La (ou les) variable(s) (sur quoi porte l etude?) en pr ecisant leur nature et leurs modalit es. Les donn ees (comment se pr esente le relev e des observations? donn ees brutes? tableau de distribution en effectifs? etc...).

21

Chapitre II. Distribution et distribution cumul ee


1) Distribution
chantillon de taille n. On note Soit X une variable observ ee sur un e ` lensemble des modalit x1 , x2 , . . . , xn les r eponses (appartenant a es ` X . On appelle MX ) donn ees par les n individus de l echantillon a distribution de X la r epartition des r eponses suivant les modalit es de X . 1.1) Distribution en effectifs Pour chaque modalit e, on compte le nombre dindividus ayant pour ` compter les r r eponse cette m eme modalit e (ceci revient a ep etitions dans les r eponses donn ees par les n individus). On notera mk la k` eme ` cette modalit modalit e de X et nk leffectif associ ea e (cest-` a-dire le ` X est mk ). nombre dindividus dont la r eponse a

22

Remarquons que
K k=1

nk = n1 + n2 + . . . + nK = n,

gale a ` n. cest-` a-dire la somme des effectifs est e On a le tableau suivant pour la distribution en effectifs de X : Variable X Effectifs nk m1 n1 m2 n2 mK nK Total n

23

1.2) Distribution en fr equences ` la proportion des diff ` On sint eresse a erents effectifs par rapport a leffectif total n (taille de l echantillon). Il est ainsi plus facile de comparer et dinterpr eter. ` la k` equence associ ee a eme modalit e: Notons fk la fr nk fk = . n Une fr equence est toujours comprise entre 0 et 1. On peut aussi l ecrire sous forme de pourcentage (ex: 0.35 = 35%). K gale a `1 On a k=1 fk = 1, cest-` a-dire la somme des fr equences est e (ou 100% sil sagit de pourcentages). Le tableau ci-dessous donne la distribution en fr equences de X : Variable X Fr equences fk m1 f1 m2 f2 mK fK Total 1

24

1.3) Cas particulier de la variable quantitative continue Vu linnit e des valeurs (ou modalit es) observables pour une variable quantitative continue, il ny a pas de r ep etitions et donc pas de regroupement imm ediat par modalit e. On va former des classes de a-dire d ecouper lensemble des modalit es M en intervalles valeurs, cest-` (classes) successifs. Pour ceci on doit : choisir le nombre de classes (ou intervalles) K . choisir la borne inf erieure et la borne sup erieure de chaque intervalle. Il ne doit pas y avoir despace vide entre 2 intervalles (ou classes) successifs, la borne sup erieure dune classe est la borne inf erieure de la tre disjoints classe qui suit. En m eme temps les deux intervalles doivent e (exemple: [1, 3[ et [3, 6[).

25

On parle de regroupement en classes de la variable. Notons que ce regroupement en classes implique forc ement une perte dinformation vu quon ne conna t plus la valeur exacte de chaque observation (ou r eponse ` une observ ee pour chaque individu) mais seulement son appartenance a classe. On a le tableau suivant pour la distribution (en effectifs et fr equences) de X: Variable X Effectifs nk Fr equences fk [b0 ; b1 [ n1 f1 [b1 ; b2 [ n2 f2 [bK 1 ; bK [ nK fK Total n 1

` choisir, on doit faire attention a ` En ce qui concerne le nombre de classes a viter une trop grande perte ce quil ne soit pas trop petit pour e dinformation mais pas trop grand non plus pour que linformation reste assez lisible.

26

2) Distribution cumul ee
On parle de distribution cumul ee uniquement lorsquil existe un ordre naturel sur les modalit es (cest le cas des variables quantitatives discr` etes ou continues et des variables qualitatives ordinales mais pas des variables qualitatives nominales). Lorsquon peut donc ranger les modalit es selon un ordre, il sagit de cumuler les effectifs (ou les fr equences) selon lordre croissant des modalit es. ` des Etudier la distribution cumul ee dune variable permet de r epondre a questions du type: ` ...? Quelle est la proportion dindividus dont la r eponse est inf erieure a Quelle est la proportion dindividus dont la r eponse est comprise entre... et ...? ` ...? Quelle est la proportion dindividus dont la r eponse est sup erieure a

27

Pour la k` eme modalit e, les formules sont les suivantes: Effectifs cumul es Nk : Nk = n1 + n2 + . . . + nk . Fr equences cumul ees Fk : Fk = f1 + f2 + . . . + fk . 2.1) Cas des variables qualitatives ordinales Les modalit es sont rang ees selon un ordre naturel. m1 < m 2 < . . . < m k < . . . < m K On a alors le tableau suivant pour la distribution et la distribution cumul ee (en effectifs et en fr equences) de X : Variable X Effectifs nk Fr equences fk Effectifs cumul es N k Fr equences cumul ees Fk m1 n1 f1 N1 = n1 F1 = f1
28

m2 n2 f2 N2 F2

mK nK fK NK = n FK = 1

Total n 1

2.2) Cas des variables quantitatives discr` etes tre rang Les valeurs peuvent bien entendu e ees dans lordre. v1 < v2 < . . . < vk < . . . < vK Le tableau ci-dessous donne la distribution et la distribution cumul ee (en effectifs et en fr equences) de X : Variable X Effectifs nk Fr equences fk Effectifs cumul es N k Fr equences cumul ees Fk v1 n1 f1 N1 = n1 F1 = f1 v2 n2 f2 N2 F2 vK nK fK NK = n FK = 1 Total n 1

29

2.3) Cas des variables quantitatives continues Les classes sont rang ees dans lordre. [b0 ; b1 [< [b1 ; b2 [< < [bK 1 ; bK [ Le tableau ci-dessous donne la distribution et la distribution cumul ee (en effectifs et en fr equences) de X :
Variable X Bornes Effectifs nk Fr equences fk Eff. cum. Nk Fr eq. cum. Fk | b0 | | 0 0 n1 f1 [b0 ; b1 [ | b1 | | N1 F1 n2 f2 [b 1 ; b 2 [ | b2 | | N2 F2 | b K 1 | | NK 1 FK 1 nK fK [bK 1 ; bK [ | bK n 1 n 1 Total

crit en g Note: On e en eral les effectifs (et les fr equences) cumul ees au niveau des bornes des classes.

30

3) Exemples
Exemple 1: Notes d etudiants et li` eres d etude Les deux tableaux ci-dessous donnent dune part la distribution (en effectifs et fr equences) de la variable X = Fili` ere d etude (ou distribution marginale de X, voir chapitre III) et dautre part la distribution ` l et la distribution cumul ee de la variable Y = Note obtenue a epreuve
Fili` ere Effectifs nk Fr equences fk (%)
Note Bornes nk fk (%) Nk Fk (%) | 0 | | 0 0 49 49 [0, 6[ | 6 | | 49 49 27 27 [6, 10[ | 10 | | 76 76 15 15

A 37 37

B 25 25
[10, 14[

C 16 16
| 14 | | 91 91

D 22 22

Total 100 100


20 9 9 100 100 100 100 Total

[14, 20]

31

Exemple 2: Avis sur une mesure gouvernementale Le tableau ci-dessous donne la distribution (en effectifs et fr equences) et la distribution cumul ee (en effectifs et fr equences) de X =Avis. Avis Effectifs nk Fr equences fk Eff. cum. Nk Fr eq. cum. Fk Oppos e 689 0.3445 689 0.3445 Indiff erent 894 0.447 1583 0.7915 Favorable 417 0.2085 2000 1 Total 2000 1

32

Exemple 3: Habitants dune r esidence On repr esente dans le tableau ci-dessous la distribution et la distribution cumul ee (en effectifs et en fr equences) de X =Nbre de personnes (habitant dans un appartement). Nbre de personnes Effectifs nk Fr equences fk Eff. cum. Nk Fr eq. cum. Fk 0 1 0.091 1 0.091 1 4 0.364 5 0.455 2 3 0.273 8 0.728 3 2 0.182 10 0.910 4 1 0.091 11 1 Total 11 1

33

Exemple 4: Produits dune grande surface On donne dans le tableau ci-dessous la distribution et la distribution cumul ee (en effectifs et en fr equences) de X =Prix.
X bk nk fk (%) Nk Fk (%) | 0 | | 0 0 110 15.7 ]0, 10[ | 10 | | 110 15.7 205 29.3 [10, 15[ | 15 | | 315 45 235 33.6 [15,30[ | 30 | | 550 78.6 70 10.0 [30,45[ | 45 | | 620 88.6 80 11.4 [45,150] 150 700 100 700 100 Tot.

34

4) Repr esentations graphiques


Dans cette partie du cours, nous donnons une repr esentation graphique de la r epartiton des individus selon leurs modalit es. l Pour chaque type de variable, nous pr esentons les principaux e ements permettant de repr esenter graphiquement la distribution et lorsque cela est possible la distribution cumul ee.

35

4.1) Variable qualitative nominale La distribution de X est donn ee dans le tableau suivant Variable X Effectifs nk Fr equences fk m1 n1 f1 m2 n2 f2 mK nK fK Total n 1

Distribution: diagramme en barres s epar ees On trace un axe horizontal portant le nom de la variable et on y positionne les modalit es de la variable (ici lordre et la distance entre modalit es nont pas de sens, laxe nest pas orient e). Sur laxe vertical, on place les effectifs ou les fr equences apr` es avoir chelle (laxe est orient choisi une e e). Au dessus de chaque modalit e, on trace un trait ou un rectangle (la gale a ` leffectif largeur na pas de signication) vertical de hauteur e ` la fr (ou a equence) correspondant.
36

4.2) Variable qualitative ordinale La distribution et la distribution cumul ee de X sont donn ees ci-dessous:
Variable X Effectifs nk Fr equences fk Effectifs cumul es Nk Fr equences cumul ees Fk m1 n1 f1 N1 = n1 F1 = f1 m2 n2 f2 N2 F2 mK nK fK NK = n FK = 1 Total n 1

Distribution: diagramme en barres juxtapos ees Sur un axe horizontal portant le nom de la variable, on positionne les modalit es de la variable entre deux d elimiteurs r epartis r eguli` erement. Sur laxe vertical, on place les effectifs ou les fr equences apr` es avoir choisi chelle (laxe est orient une e e). Au dessus de chaque modalit e, on trace un rectangle vertical (la base du ` la modalit gale a ` rectangle correspond a e entre 2 d elimiteurs) de hauteur e ` la fr leffectif (ou a equence) correspondant.

37

Distribution cumul ee: graphe des fr equences cumul ees On trace un axe horizontal portant le nom de la variable et on y positionne les modalit es de la variable (dans lordre) entre deux d elimiteurs r epartis r eguli` erement. Sur laxe vertical, on positionne les fr equences cumul ees en ` 1). respectant l echelle choisie (laxe est orient e de 0 a ` sa Au niveau de chaque d elimiteur, on place un point correspondant a fr equence cumul ee. On relie les points par des morceaux de droite.

38

4.3) Variable quantitative discr` ete La distribution et la distribution cumul ee de X sont donn ees ci-dessous:
Variable X Effectifs nk Fr equences fk Effectifs cumul es Nk Fr equences cumul ees Fk v1 n1 f1 N 1 = n1 F1 = f1 v2 n2 f2 N2 F2 vK nK fK NK = n FK = 1 Total n 1

Distribution: Diagramme en b atons On trace un axe horizontal portant le nom de la variable et on y positionne les chelle (laxe est valeurs (modalit es) de la variable apr` es avoir choisi une e orient e). Sur laxe vertical, on place les effectifs ou les fr equences en respectant l echelle choisie (laxe est orient e). gale a ` Au dessus de chaque modalit e on trace un b aton de longueur e ` la fr leffectif (ou a equence) correspondant.

39

Distribution cumul ee: graphe de la fonction de r epartition empirique graphe en escalier On positionne les valeurs (modalit es) de la variable sur laxe horizontal en respectant l echelle choisie (laxe est orient e). Sur laxe vertical, on place les fr equences cumul ees en respectant ` 1). l echelle choisie (laxe est orient e de 0 a ` sa fr A chaque valeur, on associe un point correspondant a equence cumul ee. On trace des morceaux de droite horizontale (le cumul se fait par des sauts pour chaque valeur).

40

4.4) Variable quantitative continue Distribution: Histogramme Dans le cas dune variable quantitative continue, on doit prendre en compte lamplitude (ou largeur) des classes. g Par exemple, 15 individus sont a es entre 20 et 30 ans na pas du tout la g m eme signication que 15 individus sont a es entre 20 et 22 ans. Les effectifs (et fr equences) sont les m emes mais dans le 2` eme cas la concentration des observations est beaucoup plus forte. Notons ak lamplitude de la k` eme classe. ` chaque Nous allons donc calculer la densit e de fr equence associ ee a classe: fk dk = ak

41

Nous pouvons alors compl eter le tableau de distribution en effectifs et en fr equences comme ceci :
Variable X Bornes Effectifs nk Fr equences fk Eff. cum. Nk Fr eq. cum. Fk Amplitudes ak Densit es dk | b0 | | 0 0 | | a1 d1 n1 f1 [b0 ; b1 [ | b1 | | N1 F1 | | a2 d2 n2 f2 [b 1 ; b 2 [ | b2 | | N2 F2 | | | b K 1 | | NK 1 FK 1 | | aK dK nK fK [bK 1 ; bK [ | bK n 1 n 1 Total

42

On trace un axe horizontal portant le nom de la variable et on y chelle (laxe positionne les bornes des classes apr` es avoir choisi une e est orient e). chelle Sur laxe vertical, on place les densit es apr` es avoir choisi une e (laxe est orient e). Pour chaque modalit e, on trace un rectangle de hauteur correspondant ` sa densit ` son amplitude. a e de fr equence et de largeur correspondant a gale a ` la largeur multipli Notons que la surface de chaque rectangle, e ee par la hauteur (donc ici lamplitude multipli ee par la densit e), repr esente ` chaque classe. la fr equence associ ee a

43

Distribution cumul ee: graphe de la fonction de r epartition empirique graphe lin eaire par morceaux On trace un axe horizontal portant le nom de la variable et on y place chelle (laxe est les bornes des classes apr` es avoir choisi une e orient e). Sur laxe vertical, on place les fr equences cumul ees en respectant ` 1). l echelle choisie (laxe est orient e de 0 a ` sa Au niveau de chaque borne on place un point correspondant a fr equence cumul ee. On relie les points par des morceaux de droite.

44

4.5) Exemples Exemple 1: Notes d etudiants et li` eres d etude Tableau de la distribution (en effectifs et fr equences) de la variable X = Fili` ere d etude (ou distribution marginale de X, voir chapitre III) Fili` ere Effectifs nk Fr eq. fk (%) Fili` ere A 37 37 Fili` ere B 25 25 Fili` ere C 16 16 Fili` ere D 22 22 Total 100 100

45

Diagramme en barres spares


35

Frquences (%)

10

15

20

25

30

Filire

46

Exemple 2: Avis sur une mesure gouvernementale Tableau de la distribution et de la distribution cumul ee de X =Avis. Avis Effectifs nk Fr equences fk Eff. cum. Nk Fr eq. cum. Fk Oppos e 689 0.3445 689 0.3445 Indiff erent 894 0.447 1583 0.7915 Favorable 417 0.2085 2000 1 Total 2000 1

47

Diagramme en barres juxtaposes


0.5

Frquences

0.0

0.1

0.2

0.3

0.4

Oppos

Indiffrent

Favorable

Avis

48

Graphe des frquences cumules


1.0

0.8

Frquences cumules

0.4

0.6

+
0.2 0.0

Oppos

Indiffrent

Favorable

Avis

49

Exemple 3: Habitants dune r esidence Tableau de la distribution et de la distribution cumul ee de X =Nbre de personnes (habitant dans un appartement). Nbre de personnes Effectifs nk Fr equences fk Eff. cum. Nk Fr eq. cum. Fk 0 1 0.091 1 0.091 1 4 0.364 5 0.455 2 3 0.273 8 0.728 3 2 0.182 10 0.910 4 1 0.091 11 1 Total 11 1

50

Diagramme en batons de la distribution en effectifs


4

Effectifs
1 0 2

Nb personnes habitant dans un appartement

51

Graphe de la fonction de rpartition


1.0
o o

Frquences cumules

0.8

0.6

0.2

0.4

0.0

Nb personnes habitant dans un appartement

52

Exemple 4: Produits dune grande surface Tableau de la distribution, de la distribution cumul ee de X =Prix et des ` la formule dk = fk /ak ). densit es de fr equences (calcul ees gr ace a
Prix Bornes nk fk (%) Nk Fk (%) ak dk | 0 | | 0 0 | | 10 1.57 110 15.7 ]0, 10[ | 10 | | 110 15.7 | | 5 5.86 205 29.3 [10, 15[ | 15 | | 315 45 | | 15 2.24 235 33.6 [15,30[ | 30 | | 550 78.6 | | 15 0.67 70 10.0 [30,45[ | 45 | | 620 88.6 | | 105 0.109 80 11.4 [45,150] 150 700 100 / / 700 100 Total

53

Histogramme de la distribution
6

Densits de frquence

0 0

50

100

150

Prix

54

Graphe de la fonction de rpartition


100
x x

80

Frquences cumules (%)

60

20

40

50

100

150

Prix

55