Vous êtes sur la page 1sur 183

Statistique descriptive

JeanBaptisteLamy(jibalamy@free.fr) CatherineDuclos
1

Pourquoi?
PourquoidesstatistiquesenSciencesSanitairesetSociales? Rendrecrdibleunetude Preuvesstatistiques Lesstatistiquessontpartoutaujourd'hui

Sondages Ilestfaciledesefaireavoirsil'onnematrisepaslesoutils statistiquesutilissparderrire!

Statistiquedescriptive

Lastatistiquedescriptiveestl'ensembledesmthodespour prsenter,dcrireetrsumerlescaractristiques essentiellesdunensemblededonnesetenfaireressortir linformationdemanireobjective Ils'agit:


dedcrirelesdonnes delestrier delesrsumerpardesvaleursclef(moyenneparexemple) delesrsumersousformedetableauxoudegraphiques Pasd'extrapolationunepopulationplusvaste

Surlapopulationtudie

Rfrences

CampusvirtuelSMBH:

http://www.campusvirtuel.smbh.univparis13.fr/ http://www.agromontpellier.fr/cnamlr/statnet/index.htm

Statnet:

Variableset questionnaires
JeanBaptisteLamy(jibalamy@free.fr) CatherineDuclos
5

Conceptiond'unetude
1)Mettreaupointleprotocole:

Choixdelapopulation Choixd'unpland'exprience(seulementsiintervention) Mettreaupointunquestionnaire

2)Recueillirlesdonnes(phasetrslongueengnral!) 3)Saisiedesdonnes(phasepnible!) 4)Analysedesdonnes:


Traitementdesdonnes:statistiquedescriptive Interprtationdesdonnes:statistiquequantitative

Nepasfaired'erreurdanslaconceptionduprotocoleoudu questionnaire!

Sinon,ilfautrefairelerecueiletlasaisiedesdonnes

Variables

Variable=valeurmesuresurlesindividusdelapopulation Lesdonnessontsouventprsentessousformedetableau

1colonneparvariable,1ligneparindividu Variable1 Variable2 Variable3 Variable...

Individu1 Individu2 Individu3 Individu4 Individu5 Individu...


7

Variables

Exemples:ge,taille,sexe,...

Age Individu1 Individu2 Individu3 Individu4 Individu5 Individu...


8

Taille 170,4 182,1 165,8 180,6 168,5 ...

Poids 64,1 70,2 68,8 72,9 62,4 ...

Sexe homme homme femme homme femme ...

28 32 24 45 75 ...

Typesdevariables

Ilexisteplusieurstypesdevariable,enfonctiondesvaleurs qu'ellesprennent Lesmthodesstatistiquesnesontpaslesmmesselonles diffrentstypesdevariable

Parexemple,onnepeuxpascalculerdemoyennesurlavariable sexe!

Typesdevariables

Quellessontlescaractristiquesquidistinguentlesvariables dansletableausuivant?
Age Individu1 Individu2 Individu3 Individu4 Individu5 Individu... 28 32 24 45 75 ... Taille 170,4 182,1 165,8 180,6 168,5 ... Poids 64,1 70,2 68,8 72,9 62,4 ... Sexe homme homme femme homme femme ... tatdesant bon excellent bon moyen mauvais ...

10

Typesdevariables

Variablesquantitativesounumriques:lesvaleurssontdes nombressurlesquelscelaaunsensdefairedesadditions, multiplications,...(oprationsarithmtiques)

Exemples:ge,taille,poids,...

Variablesqualitatives:lesvaleurssontdesmotsoudes chiffressurlesquelsfairedesoprationsn'apasdesens

Exemples:nom,sexe,adresse,... Onparledevaleuroudemodalit

Pourlesexe,deuxmodalits:hommeetfemme

11

Typesdevariablesnumriques

Variablenumriquediscrte:silesvaleurspossiblessont limitescertainsnombresisols

Gnralementdesvaleursentires,exemple:ge,... Maispastoujours,exemple:nombredemorceauxdesucredans uncaf

onpeutmettremorceaudesucremaispas0,7126!

Variablenumriquecontinue:danslecascontraire

Exemples:taille,poids,...

12

Typesdevariablesqualitatives

Variablequalitativeordinale:silesvaleurssontordonnes

Exemple:frquencedeseffetsindsirablesd'unmdicament: exceptionnel,rare,frquent,trsfrquent

Variablequalitativenominale:s'iln'yapasd'ordreentreles valeurs

Exemple:couleurdesyeux Variabledichotomique:variablequalitativenominalequine peutprendreque2valeurdiffrentes


Exemple:sexe Variableboolenne:variabledichotomiquedontlesdeuxvaleurs sontvraietfaux(ououiounon)

Exemple:malade:ouiounon

13

Propritsdesvariables
numriquecontinue numriquediscrte qualitativeordinale qualitativenominale qualitativedichotomique qualitativeboolenne Non ordonnes Qualitatives Ordonnes Nombrede valeursinfini Nombre devaleurs limit 2valeurs Valeursvrai oufaux

Numriques

14

Exercice:typesdevariables

Danslequestionnairesuivant,listerlesvariablesetindiquer leurtype

15

Exercice:typesdevariables

Nom:______________ Prnom:____________ Profession:__________ Niveaud'tude:BacLicenceMasterDoctorat Annesd'tudeaprsleBac:_____ Numrodescuritsocial:___________ Groupesanguin:____ Habitedansledpartementnumro:___ Cholestrol(LDL):____g/l Fumeur?ouinon Sifumeur,nombredepaquetsdecigarette consommsparjour:____________ Allergie:pollenanimauxpoussire

16

Exercice:typesdevariables

Nominale Nom:______________ Nominale Prnom:____________ Nominale Profession:__________ Niveaud'tude:BacLicenceMasterDoctorat Ordinale Numriquediscrte Annesd'tudeaprsleBac:_____ Nominale Numrodescuritsocial:___________ Nominale Groupesanguin:____ Nominale Habitedansledpartementnumro:___ Cholestrol(LDL):____g/l Numriquecontinue Fumeur?ouinon Boolenne Sifumeur,nombredepaquetsdecigarette consommsparjour:____________ Numriquediscrte Allergie:pollenanimauxpoussire Boolenne Boolenne Boolenne

17

Exercice:typesdevariables

Nom:______________ Datedenaissance:____________ Sexe(1pourhomme,0pourfemme):____ Situationfamiliale:_____________ Nombred'enfants:______ Salairemensuel:_______ Couleurprfre:RougeRoseVertBleu Tailledevtement:SMLXL Budgetannuelconsacrl'achatdevtement printemps/t:____automne/hiver:____ Avezvouslacartederductiondumagasin? OuiNonJenesaispas J'ailulesconditionsdevente:

18

Exercice:typesdevariables

Nominale Nom:______________ Numriquediscrte Datedenaissance:____________ Sexe(1pourhomme,0pourfemme):____ Dichotomique Situationfamiliale:_____________ Nominale Numriquediscrte Nombred'enfants:______ Numriquecontinue(oudiscrte) Salairemensuel:_______ Couleurprfre:RougeRoseVertBleu Nominale Tailledevtement:SMLXL Ordinale Budgetannuelconsacrl'achatdevtement printemps/t:____automne/hiver:____ Numrique Numrique Avezvouslacartederductiondumagasin? OuiNonJenesaispas Boolenne J'ailulesconditionsdevente: Boolenne

19

Conceptiond'unquestionnaire

Lequestionnairedoitpermettrederecueillirtouteslesdonnes ncessairesl'analyse Ildoittreneutre(pasdebiais)

Nepaspousserlapersonnechoisirtelleoutellerponse

Ilnedoitpastreambigu Lesvaleursmanquantessonttoujoursproblmatiques
=>lequestionnairedoitfaireensortedeleslimiter Penserajouterdeschoixautreoujenesaispaslorsque celaestncessaire

Pensertesterlequestionnairesurquelquespersonnes naves

20

Typesdequestions

Questionferme:lapersonnedoitchoisirparmiunensemble derponsesprdfinies(QCM)

Uneseuleouplusieursrponsespossibles Facilitel'analysedesdonnes Exemples:

Quelleestvotresituationfamiliale: clibatairemaridivorcveuf

Questionouverte:lapersonnepeutdonnern'importequelle rponse(textelibre)

Laisseplusdelibert,moinsderisquedebiais Demandeplusd'effortlapersonnequirpond+risqued'erreur Exemples:

Quelleestvotresituationfamiliale: ___________________________________

21

Exercice:questionnaire
Critiqueretamliorerlequestionnairesuivant:

Nometprnom:_______________________ Age:_____ Taille:1m401m501m501m601m601m80 Couleurdesyeux:BleuMarronNoirVert

22

Exercice:questionnaire

Nom:_____________Prnom:_____________ Datedenaissance:________ Taille:<1m40 1m401m491m501m59 1m601m691m701m79>1m79 Couleurdesyeux: BleuMarronNoirVert autre:___________________

23

Exercice:questionnaire
Critiqueretamliorerlequestionnairesuivant: Combienfaitesvousderepasparjour? 01234 Prenezvousunpetitdjeunercomplettouslesjours? ouinon Consommezvousdesboissonssucres? 01234 Queltyped'alimentconsommezvouschaquerepas? produitlaitierfruitetlgumefculent(riz,ptes,...) Vousarrivetildegrignoterentrelesrepas? ouinon
24

Exercice:questionnaire

Combienfaitesvousderepasparjour? 123ouplus Prenezvousunpetitdjeunercomplettouslesjours? ouinon Combiendeboissonssucresconsommezvousparjour? 0123ouplus Queltyped'alimentconsommezvouschaquerepas? produitlaitierfruitetlgumefculent(riz,ptes,...) (plusieursrponsessontpossibles) Vousarrivetildegrignoterentrelesrepas? rgulirementparfoisjamais

25

Saisiedesdonnes

Saisiedesdonnesendoubleaveugle

Deuxpersonnes(ouplus)saisissentlesdonnes indpendamment Lessaisiessontcompares

Encasdediffrence,onvrifie

Vrificationautomatique:parexemplevrifierquepourla variablenombred'enfantslapersonnequisaisitabienentr unnombreentier

26

Exercice
Onsouhaiteraliseruneenqutesurl'impactdesproblmes conomiquessurlasantdestudiants Quellesvariablesproposezvousdeconsidrer?

Enretenirunedizaine

Quellessontleurstypes? Proposerunquestionnairepourlerecueildecesvariables

27

Exercice

Propositionsdevariables(d'autressontpossibles!):

Age Sexe Travailetsalairemensuel Aidedesparents,salairesdesparents Mutuelle tatdesant:prsencedemaladieslourdes,delunettes Dpensesdesantannuelles Dernirevisitechezlemdecin,ledentiste,l'ophtalmo(si problmedevue) Renoncementdessoinspourraisonsconomiques

28

Exercice

Typedesvariables:

Age numriquediscrte Sexe dichotomique Travailetsalairemensuel boolenneetnumriquecontinue Aidedesparents ordinale Salairesdesparents numriquecontinue Mutuelle boolenne tatdesant:prsencedemaladieslourdes,delunettes boolenne boolenne Dpensesdesantannuelles numriquecontinue Dernirevisitechezlemdecin,ledentiste,l'ophtalmo(si problmedevue) numriquediscrtex3 Renoncementdessoinspourraisonsconomiquesboolenne

29

Datedenaissance:__________ Sexe:hommefemme Avezvousuneactivitrmunre?OuiNon Sioui,quelestvotresalairemensuel?________euros Vousrecevezuneaidedevosparents... rgulirementoccasionnellementjamais Quelestlesalairedevosparents?________euros Avezvousunemutuelle?OuiNonJeensaispas Souffrezvousdemaladieschroniques(asthme,diabte,...)? OuiNon Portezvousdeslunettesoudeslentilles?OuiNon Combiendpensezvousdesantparan?________euros Acombiendemoisremontevotredernirevisitechez... lemdecin:______mois ledentiste:______mois l'ophtalmologue:______mois Avezvousdjrenoncdessoinspourraisonsconomiques? OuiNon

Exercice

30

Rappel

Quelssontlestypesdesvariables?

Sexe:hommefemme Situationfamiliale:_____________ Nombred'enfants:______________ Poids:_______________________ Fumeur?ouinon

31

Rappel

Quelssontlestypesdesvariables?

Dichotomique Sexe:hommefemme (2valeurspossibles) Situationfamiliale:_____________ Nominale Nombred'enfants:______________ Numriquediscrte Poids:_______________________ Numriquecontinue Fumeur?ouinon Boolenne (valeurspossibles: vraioufaux)

32

Analysestatistiquedescriptive

Analyseunivarie:ons'intresseuneseulevariable

Paramtresstatistiques Tableaux Graphiques

Analysebivarie:ons'intressedeuxvariableslafois, c'estdirequel'ontudielesvariationsd'unevariableen fonctiondel'autre(ouparrapportl'autre)


Paramtresstatistiques Tableaux Graphiques

Sil'onanalyseunevariable,puisuneseconde,demanire indpendante,ils'agitde2analysesunivaries,etpasd'1 analysebivarie!

33

Paramtres statistiques Univaris


JeanBaptisteLamy(jibalamy@free.fr) CatherineDuclos
34

Paramtresstatistiques

Unparamtrestatistiqueestunnombrequirsume l'informationd'unevariable

Lesparamtrescentraux:rsumentlavaleurcentraledela variableautourdesquelslesautresvaleurssontrparties

Exemple:lamoyenne

Lesparamtresdeposition:rsumentlesvaleursdepositions autresquelapositioncentrale Lesparamtresdedispersion:rsumentladispersiondes valeursautourdelavaleurcentrale

Exemples:lavariance,l'carttype

Lesparamtresutilisernesontpaslesmmesselonles typesdevariable!

35

Paramtresstatistiques
Distribution du poids chez 80 individus
10 9,5 9 8,5 8 7,5 7 6,5 6 effectif 5,5 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0
45 50 55 58 60 63 64 65 66 67 68 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 86

Dispersion

classes de Poids en kg

Valeurcentrale
36

Paramtrescentraux

Lamoyenne(): Sommedesvaleursobserves,diviseparlenombre d'observations:


v1+v2+v3+...+vn n

Attention,lamoyenneestsensibleauxvaleursextrmes Pourdesvariablesnumriques

37

Paramtrescentraux

Lamdiane(M):c'estlavaleurquipartagelasriedes individusen2groupesdeffectifsgaux

Lamoitidesindividusprsenteunevaleurinfrieurela mdiane,lautremoitiunevaleursuprieurelamdiane Pourcalculerlamdiane:


Classerlesvaleursparordrecroissant Sinombredevaleursnestimpair,lamdianeestlavaleur observepourlesujetmdian:le((n+1)/2)me(=c'estceluidu milieu) Silenombredesujetsnestpair,lamdianeestlamoyennedela (n/2)meetla((n/2)+1)mevaleurs

Lamdianeestpeusensibleauxvaleursextrmes, contrairementlamoyenne Pourdesvariablesnumriquesouordinales

38

Paramtrescentraux
Distribution du poids chez 80 individus
10 9,5 9 8,5 8 7,5 7 6,5 6 effectif 5,5 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0
45 50 55 58 60 63 64 65 66 67 68 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 86

Mdiane

classe de Poids en kg

39

Paramtrescentraux

Lemode:cestlavaleurquirevientleplussouvent

Ellecorrespondaupicleplushautdeladistribution Cestunparamtrepurementdescriptif. Unseulpic =>distributionmodale 2pics =>distributionbimodale Pourlesvariablesnumriquesdiscrtesouqualitatives

Lorsquunedistributionestsymtrique,moyenne,mdianeet modesontconfondus

40

Paramtrescentraux
nombrede voituresau carrefour

Distribution bimodale 6
41

10 12 14 16 18 20 22

heure

Mode,mdianeetmoyenne

Distributionsymtrique

mode=mdiane=moyenne mode<mdiane<moyenne mode>mdiane>moyenne

Distributionasymtriquegauche

Distributionasymtriquedroite

42

Paramtresdeposition

Lesquartiles:cesontlesvaleursquipartagentladistribution en4groupesdetaillesgales

Le1erquartileestlavaleurquipartagedunctdela distributionles25%correspondantauxvaleurslesplusfaibleset delautreles75%correspondantauxvaleurslesplusleves Le2mequartileestlamdiane Le3mequartileestlavaleurquipartagedunctdela distributionles75%correspondantauxvaleurslesplusfaibleset delautreles25%correspondantauxvaleurslesplusleves Pourdesvariablesnumriquesouordinales

43

Paramtresdeposition
Distribution du poids chez 80 individus
10 9,5 9 8,5 8 7,5 7 6,5 6 5,5 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0
45 50 55 58 60 63 64 65 66 67 68 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 86

1erquartile

2mequartile

3mequartile

44

Paramtresdeposition

Lesdciles:valeursquipartagentladistributionen10 groupesdetaillesgales,chaquegroupecontient10%des individus Lespercentiles:valeursquipartagentladistributionen100 groupesdetaillesgales,chaquegroupecontient1%des individus

percentile10%=premierdcile

c'estlavaleurquipartaged'unctdeladistribution,les10%des valeursquisontlespluspetites,etdelautreles90%desvaleurs quisontlesplusleves

percentile25%=1erquartile percentile50%=5medcile=2mequartile=mdiane

45

Paramtresde position

46

Paramtresdedispersion

Lesextrmes:cesontlesvaleursmaximumetminimum

Pourdesvariablesnumriquesouordinales

L'tendue:cestladiffrenceentreles2valeursextrmes

Pourdesvariablesnumriques

47

Paramtresdedispersion

Lavariance():rsumelensembledescartsdechaque valeurdunedistributionparrapportlamoyenne

C'estlamoyennedescarrsdescartslamoyennede chacunedesvaleurs Calcul,avecntantnombred'individu,lamoyenne,v1...vnles diffrentesvaleurs: (v1)+(v2)+...+(vn) = n v1+v2+...+vn n

48

Paramtresdedispersion

L'carttype():c'estlaracinecarrdelavariance

Elles'exprimedanslesmmesunitsquelavariablemesure =>plusfacileinterprter

Lecofficientdevariation(CV):ilcombinelamoyenneet l'carttypeets'exprimeen%:
CV=x100

Ilpermetdecomparerladispersiondedeuxvariablesquiontdes moyennesdiffrentes

49

Quelparamtrepour queltypedevariable?
Moyenne Mdiane Quartiles carttype Percentiles numriquecontinue numriquediscrte qualitativeordinale qualitativenominale qualitativedichotomique qualitativeboolenne Extrmes Variance Coefvar tendue Dciles

50

Mode

Exercice

Surletableaudedonnessuivant,calculerlesparamtres centrauxetdedispersionpourlesdiffrentesvariables
Age Individu1 Individu2 Individu3 Individu4 Individu5 28 32 24 26 75 Sexe homme homme femme homme femme Poids 64 70 68 72 62 Consod'alcool occasionnelle rgulire rgulire nulle occasionnelle

51

Exercice
numrique numrique discrte dichotomique continue Age Individu1 Individu2 Individu3 Individu4 Individu5 28 32 24 26 75 Sexe homme homme femme homme femme Poids 64 70 68 72 62

ordinale Consod'alcool occasionnelle rgulire rgulire nulle occasionnelle

52

Exercice

Age:

Moyenne=(28+32+24+26+75)/5=37,0ans Mdiane:24,26,28,32,75=>28ans Mode:tropdevaleursdiffrentesici! Variance=(28+32+24+26+75)/537=368 carttype=368=19,2 CofficientdevariationCV=19,2/37=52% Extrmes=24at75ans tendue=51ans

Sexe:

Mode:homme

53

Exercice

Poids:

Moyenne=(64+70+68+72+62)/5=67,2kg Mdiane:62,64,68,70,72=>68kg Variance=(64+70+68+72+62)/567,2=13,2 carttype=13,2=3,6 CofficientdevariationCV=3,6/67,2=5,5% Extrmes=6272kg tendue=10kg

Consommationd'alcool:

Mdiane:nulle,occasionnelle,occasionnelle,rgulire,rgulire =>occasionnelle Mode:occasionnelleetrgulire Extrme:nulle,rgulire

54

Tableaux univaris
JeanBaptisteLamy(jibalamy@free.fr) CatherineDuclos
55

Tableaux

Ilestpossibledersumerunevariableparuntableauplutt queparunparamtre

Letableaursumn'estpasletableaudedonnes;ildoittre plussimple! Particulirementutilispourlesvariablesqualitatives Effectifs Frquences Effectifscumuls Frquencescumules

Plusieurstypesdetableau:

Cestableauxpourrontensuiteservirfairedesgraphiques

56

Tableaudeseffectifs

Trierplat=compterleseffectifs=construireletableaudes effectifs

Dansletableaudedonnes,onauneligneparindividu Dansletableaudeseffectifsd'unevariable,onaunelignepar valeurpossibledelavariable Pourchaquevaleurpossible,oncomptelenombred'individu ayantcettevaleur

57

Tableaudeseffectifs

Tableaudesdonnes Variable1 ValeurA ValeurB ValeurA ValeurC ValeurB ValeurB

Tableaudeseffectifspour lavariable1 Variable1 ValeurA ValeurB ValeurC Effectifs 2 3 1

Individu1 Individu2 Individu3 Individu4 Individu5 Individu6

58

Tableaudeseffectifs

Letableaudeseffectifsconcernedesvariablesnumriques discrtesouqualitatives Pourlesvariablesnumriquescontinues,ilfautd'abord discrtiserlavariable,c'estdirelatransformerenvariable qualitativeordinale


Ilfautdfinirunensembledeclasses Parexemplepourdestailles,onpourracrerlesclasses suivantes:


<1m50 1m501m59 1m601m69 1m701m79 >1m79

59

Tableaudeseffectifs

Tableaudes donnes Individu1 Individu2 Individu3 Individu4 Individu5 Individu6 Taille 152 163 185 177 166 171

Discrtisationde lataille Individu1 Individu2 Individu3 Individu4 Individu5 Individu6 Taille 150159 160169 >179 170179 160169 170179

Tableaudeseffectifs pourlataille Taille <150 150159 160169 170179 >179 Effectifs 0 1 2 2 1

60

Tableaudeseffectifs

Lorsdeladiscrtisation,lechoixdesclassesestsouvent dlicat

chelled'amplitude:onprenddesintervallesdemme longueur,avecdeseffectifsdiffrents(casleplusfrquentvu prcdamment) chelleparfrquence:onprenddesintervallesdelongueurs diffrentes,choisisdesortecequeleseffectifssoientgaux chelledeconvenance:onprenddesvaleurssanssignification statistiques(maisquipeuventavoird'autressignifications)

Exemplepourunevariablesalaire:infrieurousuprieurauseuil depauvret

61

Tableaudesfrquences

Lafrquence(oueffectifrelatif)estl'effectifdivisparle nombretotald'individus

Elles'exprimeen% Facilitelacomparaisondesriedevaleurs Tableaudeseffectifs pourlataille Taille <150 150159 160169 170179 >179 Effectifs 0 1 2 2 1 Tableaudes frquencespourlataille Taille Frquences <150 0% 150159 17% 160169 33% 170179 33% >179 17%

62

Tableaudeseffectifscumuls

L'effectifcumulpourunevaleurdonneestlasommede tousleseffectifscorrespondantauxvaleursinfrieursou galescettevaleur

Uniquementpourdesvariablesnumriquesouordinales Tableaudeseffectifs cumulspourlataille Taille Effectifscumuls <150 0 =0+1 150159 1 =0+1+2 160169 3 =0+1+2+2 170179 5 =0+1+2+2+1 >179 6

Tableaudeseffectifs pourlataille Taille <150 150159 160169 170179 >179


63

Effectifs 0 1 2 2 1

Tableaudesfrquencescumules

Lafrquencecumuleestl'effectifcumuldivisparle nombretotald'individus

Uniquementpourdesvariablesnumriquesouordinales

Tableaudeseffectifs cumulspourlataille Taille Effectifscumuls <150 0 150159 1 160169 3 170179 5 >179 6


64

Tableaudesfrquences cumulspourlataille Taille Effectifscumuls <150 0% 150159 17% 160169 50% 170179 83% >179 100%

Queltableaupour queltypedevariable?
numriquecontinue numriquediscrte qualitativeordinale qualitativenominale qualitativedichotomique qualitativeboolenne Effectifs Frquences
(Possibleendiscrtisantlavariable,c'estdire enlatransformantenvariableordinale)

Effectifs Frquences cumules cumules

65

Exercice1

OntudielesIndicesdeMasse Corporeldedeuxgroupes d'individusayantdescompor tementsalimentairesdiffrents

L'IMCcorrespondunecorpulence normalde18,525, unemaigreurendessousde18,5, unsurpoidsde2530, uneobsitaudel Lesdonnescicontre correspondentaupremiergroupe; fairedestableauxd'effectifset d'effectifscumulspourchaque variable

Individu 1 2 3 4 5 6 7 8 9 10

Sexe homme femme femme homme femme femme homme homme femme femme

IMC 22,5 24,1 17,8 20,8 27,8 23,2 29,9 22,7 35,8 23,6

66

Exercice1
Sexe Effectifs homme 4 femme 6 IMC Effectifs Effectifscumuls maigreur 1 1 normal 6 7 surpoids 2 9 obsit 1 10

Combiendepersonnesnesontpasobsesdanscegroupe?

67

Exercice1
Sexe Effectifs homme 4 femme 6 IMC Effectifs Effectifscumuls maigreur 1 1 normal 6 7 surpoids 2 9 obsit 1 10

Combiendepersonnesnesontpasobsesdanscegroupe?

68

Exercice1

VoicilesIMCdusecondgroupe

Fairelestableauxd'effectifset d'effectifscumuls Compareraupremiergroupe

Yatilproportionnellementplusou moinsd'obsesdanslesecond groupe?

Individu 1 2 3 4 5 6 7

Sexe homme femme femme homme femme femme homme

IMC 18,1 24,1 25,6 36,2 22,7 20,9 28,9

69

Exercice1

Fairelestableauxd'effectifsetd'effectifscumuls
IMC Effectifs Effectifscumuls maigreur 1 1 normal 3 4 surpoids 2 6 obsit 1 7

Compareraupremiergroupe
Yatilplusoumoinsd'obsesdanslesecondgroupe... ...envaleurabsolue? ...enproportion?

70

Exercice1
Yatilplusoumoinsd'obsesdanslesecondgroupe... ...envaleurabsolue?

Ilyaautantd'obsesdanschacundesdeuxgroupes(1dans chaquegroupe)

...enproportion?

Lesdeuxgroupesn'ontpaslemmenombred'individus =>pourlescomparerilfautregarderlesfrquencesetles frquencescumules

71

Exercice1

Groupe1:

IMC Effectifs Effectifscumuls Frquences Frquencescumules maigreur 1 1 10% 10% normal 6 7 60% 70% surpoids 2 9 20% 90% obsit 1 10 10% 100%

Groupe2:

IMC Effectifs Effectifscumuls Frquences Frquencescumules maigreur 1 1 14% 14% normal 3 4 43% 57% surpoids 2 6 29% 86% obsit 1 7 14% 100%

Ilyaproportionnellementplusd'obsesdanslesecondgroupe

72

Exercice2

Aqueltype correspondle tableaucicontre? Transformerce tableauentableau defrquences cumules

Pays Population(millions) Allemagne 81.8 Autriche 8.0 Belgique 10.1 Danemark 5.2 Espagne 39.7 Finlande 5.1 France 58.2 Grce 10.5 Irlande 3.6 Italie 57.2 Luxembourg 0.4 PaysBas 15.6 Portugal 9.8 RoyaumeUni 58.4 Sude 8.8 Total(Europedes15) 372.4

PNB/hab 27620 26730 24820 30300 13740 20740 25060 8180 15050 19200 43480 23700 9780 18950 23120

73

Exercice2
Effectifs

Valeurs
PNB/hab 27620 26730 24820 30300 13740 20740 25060 8180 15050 19200 43480 23700 9780 18950 23120

C'estuntableau deseffectifsdela variablePNBpar habitantpour l'ensembledes personneshabitants dansl'Europedes 15 Transformerce tableauentableau defrquences cumules

Pays Population(millions) Allemagne 81.8 Autriche 8.0 Belgique 10.1 Danemark 5.2 Espagne 39.7 Finlande 5.1 France 58.2 Grce 10.5 Irlande 3.6 Italie 57.2 Luxembourg 0.4 PaysBas 15.6 Portugal 9.8 RoyaumeUni 58.4 Sude 8.8 Total(Europedes15) 372.4

74

Exercice2

Frquences cumules

Valeurs
PNB/hab 8180 9780 13740 15050 18950 19200 20740 23120 23700 24820 25060 26730 27620 30300 43480

Pays Population(millions) Grce 2.8% Portugal 5.5% Espagne 16.1% Irlande 17.1% RoyaumeUni 32.8% Italie 48.1% Finlande 49.5% Sude 51.9% PaysBas 56.0% Belgique 58.8% France 74.4% Autriche 76.5% Allemagne 98.5% Danemark 99.9% Luxembourg 100.0% 75

Exercice2

Calculerlamdiane desPNBpar habitantdans l'ensemblede l'Europedes15

Pays Population(millions) Grce 2.8% Portugal 5.5% Espagne 16.1% Irlande 17.1% RoyaumeUni 32.8% Italie 48.1% Finlande 49.5% Sude 51.9% PaysBas 56.0% Belgique 58.8% France 74.4% Autriche 76.5% Allemagne 98.5% Danemark 99.9% Luxembourg 100.0%

PNB/hab 8180 9780 13740 15050 18950 19200 20740 23120 23700 24820 25060 26730 27620 30300 43480

76

Exercice2

Frquences cumules

Valeurs
PNB/hab 8180 9780 13740 15050 18950 19200 20740 23120 23700 24820 25060 26730 27620 30300 43480

Calculerlamdiane desPNBpar habitantdans l'ensemblede l'Europedes15 Correspond l'habitantmdian, c'estdireune frquencecumule de50% =23120euros

Pays Population(millions) Grce 2.8% Portugal 5.5% Espagne 16.1% Irlande 17.1% RoyaumeUni 32.8% Italie 48.1% Finlande 49.5% Sude 51.9% PaysBas 56.0% Belgique 58.8% France 74.4% Autriche 76.5% Allemagne 98.5% Danemark 99.9% Luxembourg 100.0%

77

Exercice2

Calculerla moyennedesPNB parhabitantdes paysdel'europe des15 CalculerlePNB moyenparhabitant dansl'Europedes 15

Pays Population(millions) Allemagne 81.8 Autriche 8.0 Belgique 10.1 Danemark 5.2 Espagne 39.7 Finlande 5.1 France 58.2 Grce 10.5 Irlande 3.6 Italie 57.2 Luxembourg 0.4 PaysBas 15.6 Portugal 9.8 RoyaumeUni 58.4 Sude 8.8 Total(Europedes15) 372.4

PNB/hab 27620 26730 24820 30300 13740 20740 25060 8180 15050 19200 43480 23700 9780 18950 23120

78

Exercice2

CalculerlamoyennedesPNBparhabitantdespaysde l'europedes15
=(27620+26730+24820+30300+13740+20740+25060+ 8180+15050+19200+43480+23700+9780+18950+ 23120)/15 =22031,3

CalculerlePNBmoyenparhabitantdansl'Europedes15
=(8180x10.5+9780x9.8+13740x39.7+15050x3.6+18950x58.4 +19200x57.2+20740x5.1+23120x8.8+23700x15.6+ 24820x10.1+25060x58.2+26730x8.0+27620x81.8+ 30300x5.2+43480x0.4)/372.4 =21542,8

79

Graphiques univaris
JeanBaptisteLamy(jibalamy@free.fr) CatherineDuclos
80

Graphiquesunivaris

Lechoixdugraphiquesefaitenfonctiondutypedevariable Engnrallesgraphiquessonttracssurordinateur

81

Camembert

Pourdesvariablesnominales Tracpartirdutableaudeseffectifs Formecirculaire,avecunsecteurparvaleur,detaille proportionnellel'effectifdecettevaleur

Femme

54%

46%

Homme

360x46/100 =166

82

Diagrammeenbarres

Pourdesvariablesordinales(ouventuellementnominales) Tracpartirdutableaudeseffectifs(oudesfrquences) Unebarreparvaleur,hauteur=effectif Lesbarressontrangesdansl'ordrecroissant

Effectif 30 20 10 Nulle
83

Occasionnelle

Rgulire

Consommation d'alcool

Digrammeenbtons

Pourdesvariablesnumriquesdiscrtes Tracpartirdutableaudeseffectifs(oudesfrquences) Prochedudiagrammeenbarres

Frquence 30% 20% 10% 0


84

1/2

Morceauxde sucredansle caf

Histogramme

Pourdesvariablesnumriquescontinues Tracpartirdutableaudeseffectifs(oudesfrquences) Prochedudiagrammeenbarres,lesrectanglessontjuxtaposs

Effectifs 300 200 100 Taille 1m30 1m40 1m50 1m60 1m70 1m80 1m90
85

Histogramme

Cequicompteestlasurfacedurectangle! Parexemplesiunrectangleestdivispardeux:

pourcerectanglel'chellen'estpluslamme

Effectifs 300 200 100 Taille 1m30 1m40 1m50 1m60 1m70 1m80 1m90
86

Courbecumulativecroissante

Tracpartirdutableaudeseffectifscumuls(oudes frquencescumuls) Pourdesvariablesnumriquesdiscrtes:formeenescalier

Frquence 100% 50% Morceauxde sucredansle caf

0
87

1/2

Courbecumulativecroissante

Pourdesvariablesnumriquescontinues

Frquence 100% 50% Taille 1m40


88

1m60

1m80

2m

Botemoustache

Pourdesvariablesnumriquescontinues Traitcentraldurectangle=mdiane Cthautdurectangle=3mequartile Ctbasdurectangle=1erquartile Traitdubas=percentile5%(parfois 10%) Traitduhaut=percentile95% Petitrond=valeurextrme

Taille 1m90 1m80 1m70 1m60 1m50 1m40 1m30

89

Quelgraphiquepour queltypedevariable?
numriquecontinue numriquediscrte qualitativeordinale qualitativenominale qualitativedichotomique qualitativeboolenne Camembert Barres B tons
Courbe cumulative croissante
Bote mous tache

90

His togr.

Exercice

Reprsentersousformede graphiquechacunedes variablesdansletableauci contre

Individu Diabte Age 1 Non 28 2 Non 52 3 Type1 19 4 Type2 49 5 Non 68 6 Type2 72 7 Type2 70 8 Non 39 9 Type2 65 10 Non 53

Poids 64,1 62,4 67,0 72,2 59,8 87,0 70,5 65,0 73,2 58,1

91

Exercice

Reprsentersousformede graphiquechacunedes variablesdansletableauci contre

Pourlediabte(variable nominale),onferaun camembert Pourl'ge(variable numriquediscrte),une courbecumulativecroissante Pourlepoids(variable numriquecontinue),une botemoustache

Individu Diabte Age 1 Non 28 2 Non 52 3 Type1 19 4 Type2 49 5 Non 68 6 Type2 72 7 Type2 70 8 Non 39 9 Type2 65 10 Non 53

Poids 64,1 62,4 67,0 72,2 59,8 87,0 70,5 65,0 73,2 58,1

92

Exercice
Diabte Effectifs Non 5 Type1 1 Type2 4 Pasdediabte Diabtetype2

Diabtetype1
93

Exercice
effectifs 10 Age Effectifscumuls 19 1 28 2 39 3 49 4 52 5 53 6 65 7 68 8 70 9 72 10 10 20 30 40 50 60 70 ge

0
94

Exercice
Poids 58,1 59,8 62,4 64,1 65,0 67,0 70,5 72,2 73,2 87,0

95

Exercice
Poids 90 85 80 75 70 65 60 55
96

Poids 58,1 59,8 62,4 64,1 65,0 67,0 70,5 72,2 73,2 87,0

58,1 62,4 66,0 72,2 87,0

Exercice

Afind'valuerleshpitauxd'unergion(provincedel'Ontario auCanada)en2005,6indicateursonttcrs,avecdes valeursallantde0100,combinantplusieursparamtres

Encequiconcernel'indicateurmilieudetravailsain,la distributionestellesymtriqueouasymtrique?Qu'estceque celasignifie? Quelestl'indicateuroleshpitauxobtiennentdansl'ensemble leplusmauvaisrsultat?Yatildesexceptions? Quelestl'indicateurquivarielemoins?Celuiquivarieleplus? Quelestlescored'utilisationdestechnologiesd'information cliniquequ'obtiennentaumoins75%deshpitaux?aumoins 95%deshpitaux?

97

98

Exercice

Lammetudeatreconduiteen2006;voicilesrsultats pourl'indicateurUtilisationdeprotocolesnormaliss.

Commentleshpitauxontilsvolus?

2005 2006

99

analysesbivaris
JeanBaptisteLamy(jibalamy@free.fr) CatherineDuclos
100

Analysesbivaris

Uneanalysebivaries'intressel'volutiond'unevariable parrapportuneautre Lesdeuxvariablesportentsurlesmmesindividus! Plusieurscassontpossibles,selonlestypesdesdeux variables

101

Deuxvariablesnumriques

Graphique:

Poids 90 85 80 75 70 65 60 55 140 150 160 170 180 190 Taille

Nuagedepoints YenfonctiondeX

102

Deuxvariablesnumriques

Graphique:

Poids 90 85

Nuagedepoints

Lecentredegravit 80 (G)estlepointdont lescoordonnesXet 75 Ysontlesmoyennes 70 desdeuxvariables 65 60 55

103

140 150 160 170 180 190

Taille

Deuxvariablesnumriques

Paramtre:lacovariance(cov)mesurelamaniredontles deuxvariablesvarientl'uneparrapportl'autre
(x1x)(y1y)+(x2x)(y2y)+...+(xnx)(yny) cov= n x1y1+x2y2+...+xnyn xy cov= n

Covariance>0=>XetYvariedanslemmesens Covariance<0=>XetYvariedanslesenscontraire LacovariancedpenddesunitsdeXetY(parexm.kg)

104

Deuxvariablesnumriques

Lecoficientdecorrlationlinaire(r)estluiindpendantdes units
cov r= xy

IlexprimeaussilamaniredontXetYvarientl'unparrapport l'autre Sansunit,comprisentre1et1 rprochede1oude1:variablesbiencorrllinairement rprochede0:variablesnoncorrleslinrairement


lesvariablessontindpendantes,ou lesvariablessontcorrles,maispasdemanirelinaire

105

Deuxvariablesnumriques
r=1 r=0 r=1

r=0,8

r=0

r=0,8

106

Exercice

Onsouhaitetudier l'influencedelatailledes hpitaux(nombredelits) surlerisqued'infection nosocomiale.Pourcela, lesdonnessuivantes onttrecueillies.


Hpital1 Hpital2 Hpital3 Hpital4 Reprsentergraphique Hpital5 mentlesdeuxvariables Hpital6 Calculerlecentrede Hpital7 gravit,lacovarianceet Hpital8 lecoficientde Hpital9 corrlationlinaire Hpital10 Qu'endduire?

Taille Sexe Homme 120 Femme 1100 Femme 850 Homme 360 Femme 95 Homme 260 Femme 750 Femme 1000 Homme 200 Femme 80

Infectionsnoso. Sexe Homme 1,2% Femme 5,0% Femme 3,6% Homme 2,1% Femme 1,3% Homme 3,2% Femme 4,5% Femme 6,3% Homme 1,5% Femme 0,9%

107

Exercice
6,5 6 5,5 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 250 500 750 1000 1250
Infection

108

Exercice

Taille:

=481,5 =3%

6,5 6 5,5 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 250 500 750 1000 1250
Infection

Tauxd'infection:

109

Exercice

Taille:=380 Tauxd'infection:=1,8%
cov= 120x1,2+1100x5+... 481,5x3=621,0 10

r=621,0/(380*1,8)=0,93

110

Exercice

resttrsprochede1 Ilyaunefortecorrlationlinaireentrelatailledeshpitauxet lerisqued'infectionnosocomiale:lerisqueaugmente linairementaveclatailledel'hpital

111

Unevariablequalitativeetune variablenumrique

Ontudielesvariationsdelavariablenumrique(Y)pour chaquevaleurdelavariablequalitative(X)

Parexemple,l'gedespatientsenfonctionduserviceoilssont hospitaliss

Graphique:onreprsenteungraphiquepourchaquevaleurde lavariablequalitative

112

Unevariablequalitativeetune variablenumrique
ge 90 80 70 60 50 40 30 20 10
113

Cardiologie Diabtologie Griatrie

Servicehospitalier

Unevariablequalitativeetune variablenumrique
100 Effectifs 0 100 Effectifs 0 100 Effectifs 0
114

Cardiologie 0 20 40 60 80 100 ge Diabtologie 0 20 40 60 80 100 ge Griatrie ge

20

40

60

80

100

Unevariablequalitativeetune variablenumrique
Effectifs 300 Cardiologie 200 100 0
115

Histogrammeglobal

Diabtologie Griatrie

20

40

60

80

100

ge

Unevariablequalitativeetune variablenumrique

LavariationdesvaleursdeYs'expliqueenpartieparla variableX ChaquevaleurdeXdfinitungrouped'individus

Ex.lespatientsencardio,endiabto,engriatrie,...

Sil'onappellen1,n2,...,nklenombred'individusdanschaque groupe,et1,2,...,klamoyennedeYdanschaquegroupe, lavarianceexplique(VE)est:


n11+n22+...+nkk VE= n

Lavariancersiduelle(=variancevarianceexplique)estla variationdeYquin'estpasexpliqueparX

116

Unevariablequalitativeetune variablenumrique

Lerapportdecorrlation(e)mesurelaproportiondela variationdeYquiestexpliqueparX evarieentre0et1


e= VE

117

Exercice

Afind'tudierl'impactdusexesur letauxdeHDLcholestrol,les dosagessuivantsontteffectus Faire(rapidement)ungraphique quireprsenteleHDLcholestrol enfonctiondusexe Calculerlavariancedutauxde HDLcholestrolexpliqueparle sexe,etlerapportdecorrlation

Individu 1 2 3 4 5 6 7 8 9 10

Sexe homme femme femme homme femme femme homme homme homme femme

HDL 0,4 0,8 0,5 0,6 0,3 0,9 0,4 0,3 0,5 0,6

118

Exercice
HDL 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1
119

Homme

Femme

Sexe

Exercice

HDL:

=0,53=0,0361 Chezleshommes:=0,44 Chezlesfemmes:=0,62 5x0,44+5x0,62 10 0,53=0,0081

VE=

e=0,0081/0,0361=22%

120

Deuxvariablesqualitatives

Tableaudecontingence:c'estuntableaud'effectifdeux dimensions

Individu1 Individu2 Individu3 Individu4 Individu5

Sexe Homme Femme Femme Homme Femme

Sexe Fumeur Homme Non Femme Non Femme Oui Homme Oui Femme Non

Sexe

Homme Femme

Fumeur Oui Non 1 1 1 2

121

Deuxvariablesqualitatives

Paramtre:lechi2() Graphique:
Effectifs fumeur 2 1 nonfumeur

hommes
122

femmes

sexe

Deuxvariablesqualitatives

Graphique:
Effectifs fumeur nonfumeur nonfumeur

1 sexe

hommes
123

fumeur

femmes

Droitedesmoindrescarrs

Danslecasde2variables numriques Oncherchetracerune droitepassantauplusprs despointsd'unnuagede points

124

Droitedesmoindrescarrs

Danslecasde2variables numriques Oncherchetracerune droitepassantauplusprs despointsd'unnuagede points Cettedroiteminimiseles carrsdescartsladroite Cettedroitepasseparle centredegravit(G)

125

Droitedesmoindrescarrs

quationdeladroitedes moindrescarrs: y=ax+b a=cov(X,Y) X b=YaX

L'quationdeladroitepeut treutilisepoureffectuer desprdictions

126

Exercice

Onsouhaitetudier l'influencedelatailledes hpitaux(nombredelits) Taille Sexe surlerisqued'infection Hpital1 Homme 120 nosocomiale.

Hpital2 Calculerl'quationdela Hpital3 droitedesmoindres Hpital4 carrs Hpital5 Onsouhaiteconstruire Hpital6 unhpitalgantde Hpital7 2500lits.queltaux d'infectionnosocomiale Hpital8 Hpital9 peutons'attendre? Hpital10

Femme 1100 Femme 850 Homme 360 Femme 95 Homme 260 Femme 750 Femme 1000 Homme 200 Femme 80

Infectionsnoso. Sexe Homme 1,2% Femme 5,0% Femme 3,6% Homme 2,1% Femme 1,3% Homme 3,2% Femme 4,5% Femme 6,3% Homme 1,5% Femme 0,9%

127

Exercice

Voirexerciceprcdent: cov=621,0 X=380 X=481,5 Y=3% a=cov/X=621/(380)=0,0043 b=YaX=30,0043x481,5=0,93 y=0,0043x+0,93

128

Exercice
6,5 6 5,5 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 250 500 750 1000 1250
Infection

129

Exercice

y=0,0043x+0,93 OneffectueuneprdictionpourX=2500 y=0,0043x2500+0,93=11,68 Dansunhpitalde2500lits,onpeuts'attendre11,68% d'infectionnosocomiale

130

Prvalence, incidence,...
JeanBaptisteLamy(jibalamy@free.fr)
131

Dfinitions
Plusieursindicateurssontutilisspourdcrirelafrquencedes maladies Prvalence:nombre(oupourcentage)depersonnesmalade unedatedonne Incidence:nombre(oupourcentage)depersonnesattrapant lamaladie,surunepopulationetuneduredonnes

Danscertainscas,lespersonnesquigurissentsontcomptsen ngatif

Mortalit:pourcentagedemortscausesparlamaladie,pour unepopulationetuneduredonnes(gnralementunan) Morbidit:pourcentagedepersonnesatteintesdelamaladie, pourunepopulationetuneduredonnes(gnralementun an)

132

Exercice

Surunchantillonde10000personnes,52taientatteintes detuberculoseau1/1/2006 Aucoursdel'anne2006,


17personnesontattrapplatuberculose 5personnesontguridelatuberculose 10personnessontmortesdelatuberculose

Calculerlaprvalencedelatuberculoseau1/1/2006etau 1/1/2007,l'incidence,lamortalitetlamorbiditsurl'anne 2006

133

Exercice

Prvalenceau1/1/2006:52/10000=0,52% Prvalenceau1/1/2007:(52+17510)/10000=0,54% Incidencesur2006:(175)/10000=0,12% Mortalitsur2006:10/10000=0,1% Morbiditsur2006:(52+17)/10000=0,69%

134

Biais
JeanBaptisteLamy(jibalamy@free.fr)
135

Dfinition

Unbiaisestunesourcepotentielled'erreurdansunetude statistique Ceserreurspeuventtrevolontairesouinvolontaires Lorsquel'onraliseunetude,ilfautliminertouslesbiais Ilexisteplusieurscatgoriesdebiais

136

Catgoriesdebiais

Biaisd'chantillonnage:lorsquel'ondfinitunchantillonqui n'estpasreprsentatifdelapopulationtudie Biaisdeslection:lorsquelespersonnesrecrutesdans l'tudenecorrespondentcellesquel'onvoulaitrecruter Biaisparpertedevue:lorsquel'ontudieungroupede personnesetquecertainesquittentl'tudeavantsafin Biaisd'investigation:lorsquelespersonnesinterrogsont oublioumentent,oulorsquelesenquteursfontpressionsur elles Biaisdemesure:lorsquelesvariablesnesontpasmesures demanirefiable

137

Catgoriesdebiais

Biaisd'analyse:erreurdansl'analysestatistique Biaisdeconfusion:lorsqu'unautrefacteurintervientmaisn'a pastprisencompte Biaisdeprsentation:graphiqueneprsentantpas l'informationdemanireclaireetobjective Biaisdepublication:lorsquelestudesdonnantunrsultat positifsontpluspubliesquecellesdonnantunrsultatngatif Biaisdesource:lorsqu'unesourced'informationn'estpas fiable Biaisdeconfirmation:lorsqu'onaunehypothseentte,on cherchelaconfirmer,maisplusrarementl'infimer ...

138

Rpartitionhommefemmeparmilesdirigeantsd'unegrande entreprise

Hommes Femmes

139

Attentionauxcamembertspenchs! Biaisdeprsentation

Hommes Femmes

=
140

141

Unetudepidmiologiqueadnombr162400casde cancerdupoumonchezl'homme,et117600chezlafemme, surl'ensembledelapopulationfranaiseen2000. Lecancerdupoumonestdoncplusfrquentchezl'homme Leshommessontdoncplussensiblesaucancerdupoumon

Sexe homme femme


142

Cancerdupoumon 162400 117600

Unetudepidmiologiqueadnombr162400casde cancerdupoumonchezl'homme,et117600chezlafemme, surl'ensembledelapopulationfranaiseen2000. Lecancerdupoumonestdoncplusfrquentchezl'homme Leshommessontdoncplussensiblesaucancerdupoumon Lecancerdupoumonestcaus90%parletabac Leshommesfumentplusquelesfemmes(surtoutence quiconcernelespersonnesges),cequipeutaussi expliquercettediffrence Sexe Cancerdupoumon Biaisdeconfusion
homme femme 162400 117600

143

144

Source:EUFIC(ConseilEuropen del'Informationsurl'Alimentation)

Biaisdesource Biaisdeprsentation

145

Onsouhaiteraliserunetuded'opinionpoursavoirceque pensentlespatientsd'unhpitalausujetdel'euthanasie Pourcela,unenquteurseplacedevantlamachinecafde l'hpitaletinterrogelespatientsqu'ilvoitpasser. Laquestionsuivanteestpose:tesvouspluttfavorable oupluttdfavorablel'applicationdel'euthanasiechezdes patientsdemandeursatteintsdemaladiesmortelles?

146

Onsouhaiteraliserunetuded'opinionpoursavoirceque pensentlespatientsd'unhpitalausujetdel'euthanasie Pourcela,unenquteurseplacedevantlamachinecafde l'hpitaletinterrogelespatientsqu'ilvoitpasser. Laquestionsuivanteestpose:tesvouspluttfavorable oupluttdfavorablel'applicationdel'euthanasiechezdes patientsdemandeursatteintsdemaladiesmortelles? Biaisd'chantillonnage:lespatientsalitsnevontpasla machinecaf!

147

148

Biaisdepublication/biaisdesource Biaisdeconfusion:autresfacteurs:caries?

149

150

Biaisd'investigation

151

Montanten 515 512 509 506 503 500 2007


152

volutiond'un placementfinancier

Annes 2008

Montanten 515 512 509 506 503 500 2007


153

Biaisdeprsentation

Annes 2008

Exercices
JeanBaptisteLamy(jibalamy@free.fr) CatherineDuclos
154

Exercice1

Nousavonsmesurlespoidsd'ungrouped'tudiants:

69kg,75kg,59kg,67kg,64kg,96kg,81kg,58kg,67kg, 55kg,76kg,78kg,102kg,66kg,63kg,62kg,57kg,80kg, 68kg,65kg

Calculerlesquartilesetle10mepercentile Quelleestlavaleuraudessusdelaquelleonneretrouveque 20%desindividus? Calculerlamoyenneetl'carttype

155

Exercice1

Dansl'ordre:
55,57,58,59,62,63,64,65,66,67,67,68,69,75,76,78,80,81,96,102

1erquartile=62,5kg 2mequartile=mdiane=67,0kg 3mequartile=77,0kg 10mepercentile=57,5kg Lavaleuraudessusdelaquelleonneretrouveque20%des individusestlepercentile80%=79,0kg Moyenne=70,4kg carttype=12,1

156

Exercice2
Afindetesterunnouveau mdicamentantimigraineux,celuici atdonn10patients.L'intensit delamigraineatmesurechez cespatientsavantlaprisedu traitementpuisaprs,avecune chelleanalogiquede09.

Individu 1 2 3 4 5 6 7 8 9 10

Douleur 0,5 5,6 7,4 3,5 2,1 6,8 8,9 5,4 3,9 7,1

Discrtiserlesvariablespar tranchesdeuneunitet construirelestableauxdes frquences

Tracerl'histogrammedela douleuravanttraitement

Douleur avec traitement 0,4 1,2 2,1 1,5 1,8 0,8 1,1 2,2 2,0 0,3

157

Exercice2
Douleur 0 1 2 3 4 5 6 7 8 9
158

Frquence 10% 0% 10% 20% 0% 20% 10% 20% 10% 0%

Exercice2
Douleur 0 1 2 3 4 5 6 7 8 9
159

Frquence 10% 0% 10% 20% 0% 20% 10% 20% 10% 0%

Frquence

20% 10% 0% 0 5 10 Douleur

Exercice2
Afindetesterunnouveau mdicamentantimigraineux,celuici atdonn10patients.L'intensit delamigraineatmesurechez cespatientsavantlaprisedu traitementpuisaprs,avecune chelleanalogiquede09.

Individu 1 2 3 4 5 6 7 8 9 10

Douleur 0,5 5,6 7,4 3,5 2,1 6,8 8,9 5,4 3,9 7,1

Tracerungraphiqueavecles 2variables Calculerlecoficientde corrlationlinaire.Qu'en dduire?

Douleur avec traitement 0,4 1,2 2,1 1,5 1,8 0,8 1,1 2,2 2,0 0,3

160

Exercice2
10

Douleur avec traitement

9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10

Douleur

161

Exercice2

Formules:

cov r= xy x1y1+x2y2+...+xnyn xy cov= n v1+v2+...+vn = n

X=5,12 Y=1,34 x=2,47 y=0,66 cov=0,0078 r=0,0048


162

= v1+v2+v3+...+vn n

Exercice2

r=0,0048 Pasdelienentrel'intensitdeladouleuravanttraitementet l'intensitdeladouleuraprstraitement


Avanttraitement:douleurd'intensitvariable Aprstraitement:quedesdouleursfaibles

163

Exercice2

Afindetesterunnouveau mdicamentantimigraineux, celuiciatdonn10 patients.L'intensitdela migraineatmesurechez cespatientsavantlaprisedu traitementpuisaprs,avecune chelleanalogiquede09.

Individu 1 2 3 4 5 6 7 8 9 10

Douleur 0,5 5,6 7,4 3,5 2,1 6,8 8,9 5,4 3,9 7,1

Yatilunbiaisdanscette tude?

Douleur avec traitement 0,4 1,2 2,1 1,5 1,8 0,8 1,1 2,2 2,0 0,3

164

Exercice2

Biais:

Ilmanqueunetudecontreplacebo:lefaitdedonnerun traitementaupatientpeutavoiruneffetpsychologiqueet diminuerladouleur

165

Exercice3

Afind'tudierlelienentretabagismeetsituationfamiliale,une tudeatralisesurungroupede10personnes Faireungraphiquepour Situationfamiliale Fumeur Sexe reprsenterlarpartition Individu1 Clibataire Homme Homme Oui desdiffrentessituations Individu2 Femme Femme Mari Non familiales Individu3 Encouple Femme Femme Non Faireungraphiquepour Individu4 Clibataire Homme Homme Oui reprsenterlenombrede Individu5 Encouple Femme Femme Oui Individu6 Clibataire Homme Homme Oui fumeurenfonctiondela Individu7 Femme Femme Mari Non situationfamiliale
Individu8 Individu9 Individu10 Femme Mari Clibataire Homme Encouple Femme Femme Oui Homme Non Femme Non

166

Exercice3
Situationfamiliale Clibataire Homme Femme Encouple Femme Mari Effectif Sexe Homme 4 Femme 3 Femme 3

Tableaud'effectif

167

Exercice3
Situationfamiliale Clibataire Homme Encouple Femme Femme Mari Effectif 4 3 2 1 0
168

Effectif Sexe Homme 4 Femme 3 Femme 3

Clibataire

Encouple

Mari

Situation familiale

Exercice3
Fumeur Sexe Non Oui Clibataire Homme Homme 1 3 Situation Encouple Femme Femme 2 1 familiale Mari Femme Femme 2 1 Tableaudecontingence

169

Exercice3
Fumeur Sexe Non Oui Clibataire Homme Homme 1 3 Situation Encouple Femme Femme 2 1 familiale Femme Femme Mari 2 1

Effectif 4 3 2 1 0
170
Fumeur

Fumeur Non fumeur

Fumeur Non fumeur

Non fumeur

Clibataire

Encouple

Mari

Situation familiale

Exercice3

Peutonendduirequelesfumeurssontplussouvent clibatairesdanscegroupede10personnes? Peutonendduirequeletabacdiminueleschancesde trouveruncompagnonouunconjoint,danscegroupede10 personnes?

171

Exercice3

Peutonendduirequelesfumeurssontplussouvent clibatairesdanscegroupede10personnes?

Oui

Peutonendduirequeletabacdiminueleschancesde trouveruncompagnonouunconjoint,danscegroupede10 personnes?

Non(biaisdeconfusion)

172

Correctionde l'examenblanc
JeanBaptisteLamy(jibalamy@free.fr) CatherineDuclos
173

Correction

Indiquerlesnomsdesvariablesprsentesetleurtype

ge:numriquediscrte Pressionartriellediastolique(PAD):numriquecontinue Diabte:boolen

Calculerlamoyenneetl'carttypedechacunedesvariables

ge: moyenne=74,7 PAD: moyenne=95,7

carttype=11,3 carttype=10,9

174

Correction

Diabte

Pasde diabte

175

Correction

8089 9099 100109 110119 >120

Effectif Effectifcumul Homme 4 Homme 4 Femme 6 Femme 10 Femme 2 Femme 12 Homme 2 Homme 14 Femme 1 Femme 15

Frquencecumule Homme 26,7% Femme 66,7% Femme 80,0% Homme 93,3% 100,0% Femme

176

Correction
Diabte PAD(mmHg) 120 110 100 90 80 Diabte
177

Nondia btique 80 85 85 85 90 90 90 95 95 110

95 100 105 110 120

Nondiabtique

Correction
VE= VE= n11+n22+...+nkk n 5x(106)+10x(90,5) 15 (95,7)

VE=53,4 e= e= VE 53,4 10,9

e=44,7%
178

Correction

e=44,7% Lediabteexplique44,7%desvariationsdelapression artriellediastoliquedanslespatientduservice.Ilyadoncun lienimportantentrediabteethypertension.

179

Correction
PAD
120 115 110 105 100 95 90 85 80 50 55 60 65 70 75 80 85 90 95

ge

180

Correction
x1y1+x2y2+...+xnyn xy cov= n cov= 72x95+78x90+... 15 74,7x95,7

cov=88,5 cov r= xy r= 88,5 11,3x10,9

r=0,72
181

Correction

r=0,72 Larelationentrel'geetlaPADestrelativementlinaire.La PADaugmenteavecl'ge.

182

Correction

quationdeladroitedes moindrescarrs: y=ax+b a=cov(X,Y) X b=YaX


a=88,5/(11,3)=0,69

b=95,7x74,7=43,9

183