Vous êtes sur la page 1sur 9

Les objectifs A la fin du cours, ltudiant sera capable de: 1. Dfinir la notion de variable 2.

Identifier les types de variables 3. Prsenter les donnes par des tableaux de frquence 4. Prsenter les donnes par des graphiques 5. Dcrire les paramtres de tendance centrale 6. Dcrire les paramtres de dispersion I) la notion de variables et de mesure 1. Dfinitions Une variable est une proprit commune aux individus de la population tudie (taille, poids, glycmie, genre) et qui varie en fonction du temps, du lieu et de lindividu Les modalits d'une variable sont les diffrentes valeurs que celle-ci peut prendre variable situation familiale : clibataire, mari, veuf.. variable genre: homme, femme. variable prnom : El Fehem, Mohamed, Salah

2. Types de variables Variable quantitative :les modalits sexpriment par des valeurs numriques Variable continue :prend un nombre infini de valeurs lintrieur dun intervalle donn (nombre rel) Taille, poids, glycmie Variable discrte : prend un nombre fini de valeur lintrieur dun intervalle donn (nombre entier) Nbr de lits dans un hpital, nbr denfants dans une famille On transforme parfois une variable continue en une variable discrte = Discrtisation = groupement par classe (plus simple mais perte de linformation)

Variable qualitative : les modalits sexpriment par des qualits (genre, systme ABO, tat civil...) ordinale : sexprime en classes qui peut tre ordonne selon une chelle de valeurs (degr de satisfaction, niveau dtude, NSE, taille vestimentaire) Nominales : les classes ne peuvent pas tre hirarchises. Lordre de prcision est arbitraire (ABO, tat civile, religion) Binaires ne prennent que 2 valeurs (H/F, malade/sain) appeles aussi: Variables dichotomiques, Variables boolennes: vrai ou faux ou Variables de Bernouilli (0/1)

II) La prsentation des donnes 1. Mthode tabulaire Il faut prsenter leffectif absolu (faire un tri plat) Il faut prsenter la proportion dindividus dans une modalit par rapport au total = frquence relative qui peut sexprimer en pourcentages ou non Effectif (ou frq. Absolue) 390 463 853 Il faut faire attention aux donnes manquantes +++ Elles peuvent tres lies : Au refus de rponse Frquence relative 0.46 0.54 1.00 Frquence relative (%) 46% 54% 100%

Situation familiale Mari clibataire Total

A des mesures non pratiques ou oublis de saisie Tenter de rcuprer le maximum de donnes manquantes

En tenir compte dans le tableau de frquences 2. prsentation graphique

Mthode visuelle pour saisir rapidement la forme dune distribution Le choix du graphique est dtermin par lchelle de mesure de la variable Les Variables qualitatives : Diagramme en btons Diagramme en secteur

Les Variables quantitatives Histogrammes polygones de frquence

(diagramme en btons)

(diagramme en secteurs)

(Polygone de frquences)

Anne de 1re inscription

Effectif
500 400

Anne de 1re inscription

1998 1999 2000 2001 2002 2003 2004 (Boite moustaches)

8 27 42 88 115 192 381

300

200 100 0 1998 1999 2000 2001 2002 2003 2004

III) Les paramtres de rduction 1. Dfinition et types Ce sont des valeurs numriques qui rsument les mesures dune variable quantitative

Paramtres de tendance centrale(Moyenne, Mediane,Mode) Des mesures qui localisent le centre dune distribution

Paramtres de dispersion (Etendue,Ecart-Type) Renseignent sur ltalement de la srie autour de la mesure de tendance centrale

2. Les paramtres de tendance centrale a) la moyenne Mesure la plus connue

Division de la somme de toutes les valeurs de l'chantillon par sa taille (n). Le point auquel il faudrait placer un support pour que la "planche" reste en quilibre.

m=

Inconvnient de la moyenne +++ Sensibilit aux valeurs extrmes erreurs cas particuliers

b) La Mdiane :

Valeur pour laquelle il y a autant d'observations gauche qu' droite. La meilleure mesure de TC pour les variables ordinales Pour la calculer : on classe les observations par ordre croissant on cherche quelle est la valeur qui divise les observations en deux groupes gaux ?

Si le nombre d'observations est pair: la mdiane est la moyenne entre les observations n/2 et n/2 + 1 Si le nombre d'observations est impair: la mdiane est la valeur (n+1)/2.

c) Le mode : La valeur la plus frquente dans un chantillon. Si l'chantillon est divis en classes, la classe modale constitue la classe la plus frquente. Distributions bimodales, ou exemple :

Exemple : 156, 178, 189, 178, 152, 1, 34 : le mode = ??

d)les quartiles, dciles et percentiles Quartiles : 3 valeurs qui partagent la distribution en 4 1er quartile : divise dun cot les 25 % des valeurs les plus faibles et de lautre cot les 75 % restants 2me quartile = Mdiane 3me quartile : divise lchantillon en - Dciles (9 valeurs : 10 %, 20 % ., 90 %)

Percentiles (1%, 2%.........99%) 130, 124, 147, 160, 139, 105, 112, 137, 122, 134 1 On range en premier lieu les donnes par ordre croissant Ordre 1 2 3 4 5 6 7 8 9 10

Valeur 105 112 122 124 130 134 137 139 147 160 Me

2 On calcule la position de Q1 et Q3 P (q1) = n +1/ 4 = 2,75 q1 = entre 112 et 122 mm P (q3) = (n +1/ 4) x 3 = 8,25 q3 = entre 139 et 147 mm

3. Les paramtres de dispersion : a)Ltendue : Mesure l'cart entre la valeur la plus leve et la plus petite Etendue (Et.) = Valeur maximale (Vmax) -Valeur minimale (Vmin) Exemple : 220 cm - 171 cm = 49 cm Inconvnient : ltendue ne tient pas compte de lensemble des valeurs

b)La variance : Moyenne des carrs des carts la moyenne La variance nest pas dans la mme unit que les donnes m m2 kg kg
2

(x )
N

c) Lcart-type : Caractrise la dispersion des valeurs de part et dautre de la moyenne.

Plus l'cart-type est grand, plus la dispersion est grande galement. racine carre de la variance mme unit que les donnes Formule :

(x )
N

Relation entre les trois indices La relation dpend de la forme la distribution Distribution symtrique (ou peu prs) : mode = mdiane = moyenne

Distribution asymtrique Etale gauche : mode < mdiane <moyenne

Distribution asymtrique Etale droite : mode > mdiane > moyenne

Notions essentielles La variabilit est une caractristique de toutes les mesures Pour la description dune population Mthode tabulaire Mthode graphique (dpend de la nature des variables) Mthode numrique : il est indispensable de dfinir des indices synthtiques Les paramtres de tendance centrale Les paramtres de dispersion