Vous êtes sur la page 1sur 28

1

DONNES ET STATISTIQUES

1.1 1.2 1.3 1.4 1.! 1.$

Statistiques appliques : Business Week Applications en conomie, en gestion et marketing Donnes Sources de donnes Statistiques descripti es "n#rence statistique "n#ormatique et anal%se statistique &sum 'lossaire ()ercices

Statistiques appliques
Business Week *1+ % Statistiques ,e- .ork, /tat de ,e.ork Avec un tirage mondial de plus dun million dexemplaires Business Week est le maga! "ine commercial le plus lu au monde# $lus de %&& 'ournalistes et r(dacteurs en c)e* r(partis dans %+ ,ureaux - travers le monde *ournissent un grand c)oix darticles int(ressant les (conomistes et )ommes da**aires# En plus darticles de *ond traitant de su'ets dactualit( le maga"ine comprend des ru,ri.ues )e,domadaires intitul(es /ommerce international Anal0se (conomi.ue Traitement de lin*ormation et Sciences et tec)nologie# 1es in*or! mations contenues dans les articles de *ond et les ru,ri.ues )e,domadaires aident les lecteurs - se tenir in*orm(s des d(veloppements r(cents et - (va! luer limpact de ces derniers sur les conditions (co! nomi.ues# 1a plupart des num(ros de Business Week *ournissent un compte!rendu d(taill( sur un su'et dactualit(# Souvent les comptes!rendus d(taill(s contiennent des *aits statisti.ues et des r(sum(s .ui aident le lecteur - comprendre lin*or! mation (conomi.ue# $ar exemple le num(ro du 11 novem,re %&&2 (vo.uait le nouveau d0namisme des communications sans *il 3 le num(ro du 14 d(c! em,re %&&2 rappelait les meilleurs produits de %&&2 3 le num(ro du 1% 'anvier %&&5 d(crivait les perspectives (conomi.ues de lindustrie - l)ori! "on %&&5 3 et celui du %+ 'anvier %&&5 *ournissait des in*ormations concernant les meilleurs *onds communs de placement pour lann(e - venir# De plus la ru,ri.ue )e,domadaire Business Week Investor *ournit des statisti.ues sur l(tat de l(co! nomie incluant des indices de production le prix des actions les *onds communs de placement et les taux dint(r6t# Business Week utilise (galement des don! n(es et des in*ormations statisti.ues pour g(rer sa propre activit( commerciale# $ar exemple une en.u6te aupr7s de ses a,onn(s laide conna8tre leur pro*il leurs )a,itudes de lecture leurs ac)ats

leur st0le de vie etc# 1es dirigeants de Business Week utilisent les r(sultats statisti.ues de len.u6te pour am(liorer les services o**erts - leurs a,onn(s DONNES et aux annonceurs# $ar exemple une en.u6te r(cente aupr7s des a,onn(s Nord!Am(ricains a r(v(l( .ue 9& : des a,onn(s - Business Week uti! lisaient leur ordinateur personnel et .ue pour +5 : des a,onn(s lac)at dun ordinateur (tait n(cessai! re dun point de vue pro*essionnel# De telles statis! ti.ues avertissent les dirigeants de Business Week de lint(r6t .ue peuvent porter les a,onn(s - des articles concernant les nouveaux d(veloppements in*ormati.ues# De plus les conclusions de ces en.u6tes sont mises - la disposition dannonceurs potentiels# 1e pourcentage (lev( da,onn(s utili! sant un ordinateur - la maison et pro'etant dac)e! ter un ordinateur pour usage pro*essionnel peuvent inciter des *a,ricants - *aire de la pu,licit( pour leurs produits dans le maga"ine# Dans ce c)apitre nous discuterons des t0pes de donn(es disponi,les pour lanal0se statis! ti.ue et d(crirons les mo0ens de les o,tenir# Nous introduirons ensuite les statisti.ues descriptives et lin*(rence statisti.ue en tant .ue mo0ens de convertir des donn(es en in*ormation statisti.ue *acilement interpr(ta,le#

ET

Business Week utilise des #aits statistiques dans la plupart de ses articles. * 0erri 1iller2(34isual 5ommunications, "nc.+

1es auteurs remercient /)arlene Trent)am directrice de rec)erc)e Business Week de leur avoir *ourni ce
;1<

Statisti.ues appli.u(es#

>r(.uemment on lit ce genre de p)rases dans les articles de 'ournaux et de maga! "ines = ? Selon une en.u6te de @upiter Aedia 21 : des )ommes adultes regardent la t(l(! vision au moins 1& )eures par semaine# /ette proportion s(l7ve - %+ : c)e" les *emmes adultes ;The Wall Street Journal %+ 'anvier %&&5<# ? Beneral Aotors leader des ristournes dans le secteur automo,ile a *ourni une r(duction mo0enne de 5 2&& dollars par v()icule en %&&2 ;USA Today %2 'anvier %&&5<# ? $lus de 5& : des managers de Aarriott International connaissent une ascension pro*essionnelle au sein de cette soci(t( ;Fortune %& 'anvier %&&2<# ? 1es emplo0(s des secteurs *inanciers ont reCu un salaire annuel m(dian de 59 D1% dollars en %&&2 ;The World Almanac %&&5<# ? 1es emplo0eurs ont pr(vu dem,auc)er 1% D : de 'eunes diplEm(s suppl(mentai! res en %&&5 par rapport - %&&2 ;Institut de rec)erc)e sur lemploi des 'eunes diplE! m(s Universit( dtat du Aic)igan *(vrier %&&5<# ? 1(.uipe neF!0orGaise des HanGees perCoit les salaires et traitements les plus (le! v(s de la ligue principale de ,ase,all# En %&&2 le revenu de l(.uipe s(levait 14% D59 I15 dollars soit un revenu m(dian de 5 4D4 &&& dollars par 'oueur ;USA Today 1er septem,re %&&2<# ? 1indice DoF @ones des valeurs industrielles a clEtur( - 1& 24I points le 21 mars %&&5 ;The Wall Street Journal 1er avril %&&5<# 1es c)i**res pr(sents dans les p)rases ci!dessus ;21 : %+ : 5 2&& J 5& : 59 D1% J 1% D : 14% D59 I15 J 5 4D4 &&& J et 1& 24I< sont appel(s statisti.ues# Ainsi dans le langage courant le terme K statisti.ue L recouvre des donn(es c)i**r(es# /ependant le c)amp ou le contenu de la statisti.ue inclut ,eaucoup plus .ue des c)i**res# Blo,alement la statistique est lart et la science de collecter anal0ser pr(senter et inter! pr(ter des donn(es# $lus particuli7rement en (conomie et dans le monde des a**aires lin! *ormation *ournie par la collecte lanal0se la pr(sentation et linterpr(tation des donn(es o**re aux dirigeants une meilleure compr()ension de lenvironnement (conomi.ue et com! mercial et leur permet ainsi de prendre de ,onnes d(cisions en toute connaissance de cause# Dans ce texte nous insistons sur lutilisation des statisti.ues dans la prise de d(ci! sion en mati7re (conomi.ue et commerciale# 1e c)apitre 1 d(,ute par .uel.ues exemples dapplications statisti.ues en (cono! mie *inance et marGeting# Dans la section 1#% nous d(*inissons le terme K donnes L et introduisons le concept dun ensem,le de donn(es# /ette section introduit (galement des termes cl(s comme K variables L et K observations L discute des di**(rences entre donn(es .uantitatives et .ualitatives et illustre lutilisation des donn(es en coupe transversale et des s(ries temporelles# 1a section 1#2 traite de la collecte des donn(es partir de sources exis! tantes ou - partir den.u6tes ou d(tudes exp(rimentales conCues pour o,tenir de nouvel! les donn(es# 1utilisation des donn(es au travers des statisti.ues descriptives et de lin*(! rence statisti.ue est d(crite dans les sections 1#5 et 1#4#

1.1 A667"5A0"8,S (, /58,81"( (0 '(S0"8,


Dans lenvironnement (conomi.ue et commercial actuel tout le monde a acc7s - de nom! ,reuses in*ormations statisti.ues# 1es dirigeants et les managers .ui ont le plus de succ7s sont ceux .ui comprennent lin*ormation et savent lutiliser - ,on escient# Dans cette sec! tion nous pr(sentons des exemples .ui illustrent .uel.ues utilisations de statisti.ues dans le domaine (conomi.ue et commercial#

Com tabilit
1es entreprises compta,les utilisent des proc(dures d(c)antillonnage statisti.ue pour e**ectuer des op(rations daudit pour le compte de leurs clients# $ar exemple supposons .uune entreprise compta,le veuille d(terminer si le montant du compte *ournisseurs .ui appara8t dans le ,ilan correspond ,ien au montant r(el# B(n(ralement le nom,re de *our! nisseurs est tellement grand .ue r(examiner et valider c)a.ue compte individuellement serait trop long et trop coMteux# Dans de telles situations il est courant .ue lexpert!comp! ta,le s(lectionne un sous!ensem,le de comptes appel( (c)antillon# Apr7s avoir r(exami! n( les comptes de l(c)antillon lexpert!compta,le conclut si le montant des comptes *our! nisseurs inscrit dans le ,ilan est accepta,le ou non#

Finance
1es anal0stes *inanciers utilisent des in*ormations statisti.ues diverses pour orienter leurs recommandations en mati7re dinvestissement# Dans le cas de titres ,oursiers les anal0s! tes examinent un certain nom,re de donn(es *inanci7res telles .ue le coe**icient de capi! talisation des r(sultats et le rendement des dividendes# En comparant lin*ormation pour un titre seul et lin*ormation pour la mo0enne des titres du marc)( un anal0ste *inancier peut se rendre compte si le titre individuel est sur ou sous!(valu(# $ar exemple Barron!s ;+ 'an! vier %&&2< rapportait .ue le coe**icient mo0en de capitalisation des r(sultats des 2& titres *ormant lindice DoF @ones industriel (tait de %% 2+# 1e coe**icient de capitalisation des r(sultats de Beneral Electrics s(levait - 1+# /es di**(rentes in*ormations statisti.ues sur le coe**icient de capitalisation des r(sultats nous indi.uent .ue la valeur du titre Beneral Electrics (tait in*(rieure - la mo0enne# Un anal0ste *inancier aurait alors pu conclure .ue le titre Beneral Electrics (tait sous!(valu(# /ette in*ormation a'out(e dautres pourrait aider lanal0ste *inancier - recommander lac)at la vente ou la conservation des actions Beneral Electrics#

"arketin#
1es scanners (lectroni.ues des caisses enregistreuses dans les commerces collectent des donn(es utilis(es dans de nom,reuses applications de rec)erc)e en marGeting# $ar exem! ple des soci(t(s telles .ue A/Nielsen et In*ormation Nesources ac)7tent les donn(es recueillies par les scanners des caisses enregistreuses les exploitent et vendent ensuite les conclusions statisti.ues aux producteurs# 1es producteurs d(pensent des centaines de milliers de dollars par cat(gorie de produit pour o,tenir ce t0pe de donn(es scann(es# Ils

ac)7tent (galement les donn(es et les conclusions statisti.ues relatives aux activit(s pro! motionnelles telles .ue les o**res sp(ciales en t6te de gondole dans les magasins# 1es *a,ricants de produits mar.ue peuvent examiner les conclusions des (tudes statisti.ues 4 A de lications en conomie et DONNES men(es - partir des donn(es scann(es a*in de mieux comprendre la relation entre vente et promotion# De telles anal0ses se r(v7lent souvent utiles pour (ta,lir les *utures strat(gies commerciales des produits concern(s#

ET

$roduction
1importance accord(e de nos 'ours - la .ualit( *ait de son contrEle une application pri! mordiale de la statisti.ue dans la gestion de la production# De nom,reux grap)i.ues de contrEle de la .ualit( sont utilis(s pour v(ri*ier les caract(risti.ues du produit *ini dans un processus de production# En particulier un diagramme en ,Oton peut 6tre utilis( pour contrEler loutput mo0en# Supposons par exemple .uune mac)ine remplisse des canet! tes de 22 cl dune ,oisson non!alcoolis(e# $(riodi.uement un agent de production s(lec! tionne un (c)antillon de canettes et calcule la .uantit( mo0enne contenue dans les canet! tes de l(c)antillon# /ette mo0enne ou valeur % est repr(sent(e sur un grap)i.ue de la mo0enne# Un point situ( au!dessus de la limite sup(rieure du grap)i.ue indi.ue un sur! remplissage alors .uun point situ( en!dessous de la limite in*(rieure indi.ue un sous! rem! plissage# 1e processus de production est dit K sous contrEle L et peut se poursuivre tant .ue les points repr(sent(s dans le grap)i.ue de la mo0enne sont compris entre les limites in*(! rieure et sup(rieure# 1interpr(tation correcte dun diagramme en ,Oton permet de d(ter! miner si des a'ustements sont n(cessaires a*in de corriger le processus de production#

&conomie
1es (conomistes *ournissent *r(.uemment des pr(visions - propos de certains *aits (cono! mi.ues# Ils utilisent de nom,reuses in*ormations statisti.ues pour e**ectuer ces pr(visions# $ar exemple pour pr(voir le taux din*lation les (conomistes utilisent des indicateurs tels .ue lindice des prix - la production le taux de c)Emage et le taux dutilisation de la capa! cit( productive# /es indicateurs statisti.ues sont ensuite int(gr(s - des mod7les de pr(vi! sion .ui pr(voient le taux din*lation# 1es applications statisti.ues telles .ue celles d(crites dans cette section *ont par! tie int(grante de cet ouvrage# De tels exemples *ournissent un aperCu de l(tendue des applications statisti.ues# $our compl(ter ces exemples nous avons demand( - des person! nes utilisant des statisti.ues dans les domaines commercial et (conomi.ue de r(diger des articles dans la section intitul(e K Statisti.ues appli.u(es L a*in dintroduire les outils pr(! sent(s dans c)a.ue c)apitre# 1es applications d(crites dans Statisti.ues appli.u(es illust! rent concr7tement limportance des statisti.ues#

1.2 D8,,/(S
1es donnes sont les *aits et les c)i**res .ui sont collect(s anal0s(s et r(sum(s pour pou! voir ensuite 6tre interpr(t(s# Toutes les donn(es collect(es dans une (tude particuli7re *or!

ment l9ensem:le de donnes de l(tude# 1e ta,leau 1#1 pr(sente un ensem,le de donn(es contenant des in*ormations relatives - %4 titres du marc)( secondaire dont l(volution est suivie par lAssociation am(ricaine des investisseurs individuels# /es titres sont ceux de petites et mo0ennes soci(t(s .ui ne sont pas suivies par les anal0stes de Pall Street#

&lments' variables et observations


1es lments sont les entit(s aupr7s des.uelles les donn(es sont collect(es# $our lensem! ,le de donn(es du ta,leau 1#1 c)a.ue titre individuel dune soci(t( est un (l(ment 3 les noms des (l(ments apparaissent dans la premi7re colonne# $uis.uil 0 a %4 titres lensem! ,le de donn(es contient %4 (l(ments#

0a:leau 1.1 Ensemble de donnes pour 25 titres du march secondaire

Socit

DePol*e /ompanies Nort) /oast Energ0 Qansen Natural /orp# AarineAax Inc# Nanometrics Incorporated TeamSta** Inc# Environmental Tectonics Aeasurement Specialti $art0 /it0 /orporation Em,rex Inc# Tec)ROps Sevcon Inc# AN/ADIS NS Qiao Ting Universal Tele# Energ0 Pest Incorporated UarnFell Industries Inc# Innodata /orporation Aedical Action Industries Instrumentarium /orp# $etroleum Developm /orp# Ber,er /)ildrensFear Inc# Baiam Inc# Artesian Nesources /orp# HorG Pater /ompan0

Source = Association Am(ricaine des Investisseurs Individuels )ttp=RRFFF#aaii#com ;*(vrier %&&%<#

Une aria:le est une caract(risti.ue des (l(ments - la.uelle on sint(resse# 1ensem,le de donn(es du ta,leau 1#1 contient les 4 varia,les suivantes = D (onn DONNES ? $lace ,oursi7re = Endroit oV les titres des soci(t(s sont (c)ang(s W NHSE ;Uourse de NeF HorG< AAET ;Uourse Am(ricaine< et OT/ ;marc)( parall7le<# ? S0m,ole = A,r(viation utilis(e pour identi*ier le titre dans la liste des cotations ,oursi7res# ? /apitalisation ,oursi7re = Saleur de la soci(t( ;cours du titre multipli( par le nom! ,re de titres en circulation<# ? /oe**icient de capitalisation des r(sultats ;ou rapport cours!,(n(*ice< = $rix de marc)( par action divis( par le ,(n(*ice par action des dou"e derniers mois# ? Aarge ,rute = $ro*it ,rut en pourcentage des ventes# 1es donn(es sont o,tenues en collectant des in*ormations sur c)a.ue varia,le pour tous les (l(ments de l(tude# 1ensem,le des in*ormations o,tenues pour un (l(ment par! ticulier correspond - une o:ser ation# En se r(*(rant au ta,leau 1#1 lensem,le des in*or! mations associ(es - la premi7re o,servation ;Soci(t( DePol*e< est AAET DP1 2+ 5 I 5 et 2+ D# 1ensem,le des mesures associ(es - la seconde o,servation ;Nort) /oast Energ0< est OT/ N/EU 4% 4 + % et 49 2 et ainsi de suite# Un ensem,le de donn(es de %4 (l(! ments contient %4 o,servations#

ET

&chelles de mesure
Di**(rentes (c)elles de mesure dune varia,le existent = nominale ordinale dintervalle ;ou cardinale< ou de rapport ;de ratio<# 1(c)elle de mesure d(termine la .uantit( din*or! mation contenue dans les donn(es et indi.ue la m(t)ode danal0se des donn(es la plus appropri(e# 1ors.ue les donn(es dune varia,le consistent en des la,els ou des noms utilis(s pour identi*ier et di**(rencier une caract(risti.ue de l(l(ment l(c)elle de mesure est nominale# $ar exemple en se r(*(rant au ta,leau 1#1 nous vo0ons .ue l(c)elle de mesu! re de la varia,le place ,oursi7re est nominale dans la mesure oV NHSE AAET et OT/ sont les la,els utilis(s pour identi*ier lendroit oV le titre de la soci(t( est (c)ang(# Dans les cas oV l(c)elle de mesure est nominale un code num(ri.ue ou des la,els non!num(! ri.ues peuvent 6tre utilis(s# $ar exemple pour *aciliter la collecte de donn(es et pr(parer les donn(es en vue de leur incorporation dans une ,ase de donn(es in*ormatis(e nous pourrions utiliser un code num(ri.ue en attri,uant le c)i**re 1 - la ,ourse de NeF HorG le c)i**re % - la ,ourse am(ricaine et le c)i**re 2 au marc)( parall7le# Dans ce cas les valeurs num(ri.ues 1 % et 2 correspondent aux la,els utilis(s pour identi*ier la place ,oursi7re sur la.uelle le titre est (c)ang(# 1(c)elle de mesure est nominale m6me si les donn(es appa! raissent sous la *orme de valeurs num(ri.ues# 1(c)elle de mesure dune varia,le est ordinale si les donn(es ex)i,ent les pro! pri(t(s nominales et .uil est possi,le de les ordonner# $ar exemple Eastside Automotive envoie - ses clients un .uestionnaire dans le ,ut de recueillir des donn(es sur la .ualit( du service de r(paration automo,ile# /)a.ue client attri,ue une note au service de r(paration allant de K excellent L - K mauvais L en passant par K ,on L# $uis.ue les donn(es o,tenues

sont des la,els W excellent ,on mauvais W les donn(es ont des propri(t(s nominales# De plus elles peuvent 6tre ordonn(es en *onction de la .ualit( du service# 1a mention K excel! lent L indi.ue le meilleur service suivie des mentions K ,on L puis K mauvais L# Ainsi l(! c)elle de mesure est ordinale# Note" .ue les donn(es ordinales peuvent (galement 6tre enre! gistr(es en utilisant un code num(ri.ue# $ar exemple nous pourrions utiliser 1 pour excel! lent % pour ,on et 2 pour mauvais tout en conservant les propri(t(s ordinales des donn(es# Ainsi les donn(es de nature ordinale peuvent 6tre soit non!num(ri.ues soit num(ri.ues# 1(c)elle de mesure dune varia,le devient cardinale ;ou par intervalles< si les don! n(es poss7dent les propri(t(s ordinales et si lintervalle entre les valeurs peut 6tre mesur( par une unit( de mesure *ixe# 1es donn(es cardinales ;ou par intervalles< sont tou'ours num(ri.ues# 1es r(sultats dun test daptitude intellectuelle sont un exemple de donn(es car! dinales# $ar exemple les r(sultats de trois (tudiants - un test ;11%& 1&4& et 9D&< peuvent 6tre ordonn(s de la meilleure - la moins ,onne per*ormance# De plus les (carts entre les r(sultats ont un sens# $ar exemple l(tudiant 1 a o,tenu 11%&!1&4& X D& points de plus .ue l(tudiant % alors .ue l(tudiant % a o,tenu 1&4&!9D& X I& points de plus .ue l(tudiant 2# 1(c)elle de mesure dune varia,le est dite de ratio si les donn(es ont toutes les propri(t(s des donn(es cardinales et .ue le rapport entre deux varia,les a un sens# Des varia,les telles .ue la distance la )auteur le poids et la dur(e utilisent une (c)elle de rap! port# /ette (c)elle n(cessite linclusion dune valeur nulle pour indi.uer .ue rien nexiste pour la varia,le au point "(ro# $ar exemple consid(rons le coMt dune automo,ile# Une valeur nulle indi.ue .ue lautomo,ile a un coMt nul et est gratuite# De plus si nous com! parons une automo,ile dont le coMt est de 2& &&& dollars - une autre automo,ile dont le coMt est de 14 &&& dollars le rapport indi.ue .ue le coMt de la premi7re automo,ile est deux *ois plus (lev( .ue celui de la seconde#

(onnes qualitatives et donnes quantitatives


$ar ailleurs les donn(es peuvent 6tre class(es en *onction de leur nature .ualitative ou .uantitative# 1es donnes qualitati es incluent des la,els ou des noms utilis(s pour iden! ti*ier une caract(risti.ue des (l(ments# 1es donn(es .ualitatives sont ordinales ou nomina! les et peuvent 6tre num(ri.ues ou non# 1es donnes quantitati es ont des valeurs num(! ri.ues et pr(sentent un caract7re d(nom,ra,le# 1es donn(es .uantitatives ont une (c)elle de mesure cardinale ou de rapport# Une aria:le qualitati e est une varia,le dont les donn(es sont .ualitatives et une aria:le quantitati e est une varia,le dont les donn(es sont .uantitatives# 1anal0se statis! ti.ue appropri(e - une varia,le particuli7re d(pend de sa nature .ualitative ou .uantitative# Si la varia,le est .ualitative lanal0se statisti.ue est plutEt limit(e# Nous pouvons r(sumer des donn(es .ualitatives en d(nom,rant le nom,re do,servations ou en calculant la propor! tion do,servations dans c)a.ue cat(gorie .ualitative# /ependant m6me lors.ue des donn(es .ualitatives utilisent un code num(ri.ue des op(rations arit)m(ti.ues telles .ue laddition la soustraction la multiplication et la division ne permettent pas do,tenir des r(sultats a0ant un sens# 1a section %#1 traite des m(t)odes danal0se des donn(es .ualitatives# $ar contre les op(rations arit)m(ti.ues *ournissent souvent des r(sultats a0ant un sens lors.ue les varia,les sont .uantitatives# $ar exemple pour une varia,le .uantitative

les donn(es peuvent 6tre additionn(es et divis(es par le nom,re do,servations de *aCon calculer la valeur mo0enne# /ette mo0enne a un sens mat)(mati.ue et est *acilement inter! pr(ta,le# En g(n(ral les outils danal0se statisti.ue sont plus nom,reux pour des donn(es .uantitatives# 1a section %#% et le c)apitre 2 pr(sentent les m(t)odes danal0se statisti.ue des donn(es .uantitatives#
)es donnes qualitatives sont souvent quali*ies de donnes + cat#orielles ,)a mthode statistique a ro rie our rsumer des donnes d end de la nature quantitative ou qualitative des donnes-

(onnes en cou e transversale et sries tem orelles


$our les ,esoins de lanal0se statisti.ue la distinction entre les donn(es en coupe trans! versale et les donn(es de s(rie temporelle est *ondamentale# 1es donnes en coupe trans3 ersale sont collect(es au m6me moment ;ou approximativement au m6me moment<# 1es donn(es du ta,leau 1#1 sont en coupe transversale puis.uelles d(crivent les cin. varia,les pour les %4 titres du marc)( secondaire - un m6me moment dans le temps# 1es sries tem3 porelles sont des donn(es collect(es sur plusieurs p(riodes de temps di**(rentes# $ar exem! ple le grap)i.ue 1#1 repr(sente le prix mo0en par gallon ;%< dessence sans

plom, aux tats! Unis# 1e grap)i.ue illustre une augmentation *orte du prix mo0en de lessence sans plom, - partir de 'anvier %&&5# Au cours dune p(riode de cin. mois le prix mo0en du gallon dessence sans plom, est pass( de 1 59 dollars - 1 I1 dollars# 1a plupart des m(t)odes sta! tisti.ues pr(sent(es dans cet ouvrage sont applica,les aux donn(es en coupe transversale#
J1#I&

J1#D&

J1#+&

$ r i x m o 0
Aai @uin @uil# AoM# Sept# Oct# Nov# D(c# @an# >(v# Aars Avr# %&&5 Aai %&&2

J1#4&

J1#5&

Aois

;igure 1.1 Prix moyen dun gallon dessence sans plomb aux tats- nis
Source = Administration am(ricaine de lin*ormation sur l(nergie mai %&&5#

;%<

NdT = Un gallon (.uivaut - environ 2 I litres#

Remarques 1. Une observation est un ensemble de mesures obtenues pour chaque lment dun ensemble de donnes. Ainsi, le nombre dobservations et le nom- bre dlments sont identiques. Le nombre de mesures obtenues sur chaque lment est gal au nombre de variables. Par consquent, le nombre total de valeurs dans un ensemble de donnes peut tre dtermin en multipliant le nombre dobservations par le nombre de variables. . Les donnes quantitatives peuvent tre discr!tes ou continues. "elles qui mesurent une variable dnombrable sont discr!tes. "elles qui mesurent des variables indnombrables sont continues, aucune sparation ntant possi- ble entre les valeurs potentielles des donnes.

1.3 S8<&5(S D( D8,,/(S


1es donn(es peuvent 6tre o,tenues - partir de sources existantes ou grOce - des en.u6tes ou des (tudes men(es sp(ci*i.uement dans le ,ut de collecter de nouvelles donn(es#

Sources e%istantes
Dans certains cas les donn(es n(cessaires - une application particuli7re existent d('-# De nom,reuses entreprises constituent des ,ases de donn(es sur leurs emplo0(s leurs clients et leurs op(rations commerciales# 1es donn(es sur le salaire lOge et les ann(es de service des emplo0(s peuvent 6tre g(n(ralement o,tenues aupr7s du service du personnel# Dautres services internes - lentreprise collectent des donn(es sur les ventes les d(penses pu,licitaires les coMts de distri,ution linventaire et les .uantit(s produites# 1a plupart des entreprises entretiennent (galement des ,ases de donn(es sur leurs clients# 1e ta,leau 1#% *ournit .uel.ues exemples de donn(es *r(.uemment disponi,les dans les services internes des entreprises#
0a:leau 1.2 Exemples de donnes disponibles dans les registres internes de lentreprise

Negistre des emplo0(s Negistre de la production Negistre dinventaire Negistre des ventes Negistre des cr(dits $ro*il des clients

Des organismes sp(cialis(s dans la collecte et le traitement des donn(es *ournis! sent des .uantit(s su,stantielles de donn(es (conomi.ues et commerciales# 1es entreprises ont acc7s - ces sources de de donn(es externes par des arrangements de cr(dit!,ail ou D par 1 Sources ONNES ac)at# Dun Y Uradstreet Uloom,erg et DoF @ones Y /ompan0 sont trois entreprises .ui *ournissent de vastes services en mati7re de collecte de donn(es# 1es soci(t(s A/Nielsen et In*ormation Nesources prosp7rent grOce - la collecte et au traitement des donn(es .uils vendent ensuite - des pu,licitaires et - des producteurs# De nom,reuses associations industrielles et organisations sp(cialis(es *ournissent (galement des donn(es# 1association am(ricaine de lindustrie du tourisme conserve des in*ormations relatives au tourisme comme le nom,re de touristes et le montant des d(pen! ses touristi.ues par tat# De telles in*ormations peuvent int(resser lindustrie du tourisme# 1e conseil dadmission des (coles sup(rieures de commerce conserve des donn(es sur les r(sultats des tests les caract(risti.ues des (tudiants et le programme des cours# 1a plupart des donn(es issues de ces sources sont accessi,les - un coMt modeste# Internet est une source croissante de donn(es et din*ormations statisti.ues# 1a plupart des soci(t(s poss7dent leur site Pe, .ui *ournit des in*ormations g(n(rales sur la soci(t( ainsi .ue des donn(es sur les ventes le nom,re demplo0(s la gamme de produits leurs prix et leurs sp(ci*icit(s# De plus certaines entreprises se sont d(sormais sp(cialis(es dans la divulgation din*ormations sur Internet# En cons(.uence tout le monde peut o,te! nir les cotations ,oursi7res les prix dun repas au restaurant des donn(es sur les salaires et une .uantit( din*ormations .uasi in*inie# 1es agences gouvernementales sont une autre source importante de donn(es exis! tantes# $ar exemple le d(partement am(ricain du travail conserve des donn(es sur le taux dem,auc)e les taux de salaire la taille de la population active et le degr( de s0ndicalisa! tion# 1e ta,leau 1#2 (ta,lit la liste dautres agences gouvernementales ainsi .ue le t0pe de donn(es dont elles disposent# 1a plupart des agences gouvernementales .ui collectent et traitent des donn(es rendent pu,lics leurs r(sultats# $ar exemple le ,ureau des recense! ments pu,lie de nom,reuses donn(es sur son site Fe, FFF#census#gov# 1a *igure 1#% pr(! sente la page daccueil du ,ureau des recensements#
0a:leau 1.3 Exemples de donnes disponibles aupr!s de "uel"ues agences gou#ernementales Agence gou ernementale Uureau des recensements Uan.ue centrale am(ricaine Ainist7re des *inances D(partement du commerce

ET

Uureau des Statisti.ues du Travail

;igure 1.2 $a page daccueil du bureau des recensements

&tudes statistiques
$ar*ois les donn(es n(cessaires - une (tude particuli7re ne sont pas disponi,les aupr7s de sources existantes# Dans ce cas les donn(es peuvent 6tre o,tenues en e**ectuant une (tude statisti.ue# On distingue deux t0pes d(tudes statisti.ues = les tudes e)primentales et les tudes empiriques#
)a lus im ortante tude statistique e% rimentale .amais ralise est' semble/t/il' l!e% rience ralise ar le Service ublic de la sant en 0123 relative 4 la cam/

a#ne de vaccination contre la olio- $r5s de deu% millions d!en*ants scolariss dans le rimaire ont t slectionns 4 travers les &tats/Unis-

Dans une (tude exp(rimentale on identi*ie en premier lieu la varia,le .ui nous int(resse# Ensuite une ou plusieurs autres varia,les sont identi*i(es et contrEl(es de sorte - o,tenir des donn(es concernant leur in*luence sur la varia,le dint(r6t# $ar exemple une *irme p)armaceuti.ue serait int(ress(e par une (tude permettant de conna8tre le**et dun nouveau m(dicament sur la pression art(rielle# 1a pression art(rielle est la varia,le dint(! r6t de l(tude# 1e dosage du nouveau m(dicament est une autre varia,le suppos(e avoir un e**et sur la pression art(rielle# $our o,tenir des donn(es concernant le**et de ce nouveau m(dicament les c)erc)eurs s(lectionnent un (c)antillon dindividus# 1e dosage du nou! veau m(dicament est contrEl( = c)a.ue groupe dindividus reCoit un dosage di**(rent# 1es donn(es sur la pression art(rielle avant et apr7s traitement sont collect(es pour c)a.ue groupe# 1anal0se statisti.ue des donn(es exp(rimentales permettra de d(terminer lin! *luence du nouveau m(dicament sur la pression art(rielle#
)es tudes sur les *umeurs et les non/*umeurs sont des tudes em iriques uisque les chercheurs ne dterminent ou ne contr6lent as qui *ume et qui ne *ume as-

1es (tudes statisti.ues non!exp(rimentales ou empiri.ues ne tentent pas de contrEler les varia,les dint(r6t# Un sondage est le t0pe le plus courant d(tudes empi! ri.ues = on identi*ie da,ord les .uestions ensuite un .uestionnaire est (ta,li et distri,u( un (c)antillon dindividus# Quel.ues restaurants utilisent des (tudes empiri.ues pour conna8tre lopinion de leurs clients sur la .ualit( de la nourriture du service de lam,ian! ce etc# 1a *igure 1#2 pr(sente le .uestionnaire utilis( par le restaurant 1o,ster $ot de Nedington S)ores en >loride# 1es clients interrog(s doivent (valuer cin. varia,les = la .ua! lit( de la nourriture la .ualit( du service la rapidit( du service la propret( et la gestion# 1es cat(gories de r(ponse W excellent ,on satis*aisant et insatis*aisant W permettent aux propri(taires du 1o,ster $ot dam(liorer la .ualit( des services *ournis# 1es dirigeants .ui d(sirent utiliser les donn(es et les anal0ses statisti.ues comme outil daide - la d(cision doivent tenir compte du coMt et du temps .ue n(cessite lo,ten! tion des donn(es# 1utilisation de sources existantes est sou)aita,le lors.ue les donn(es doivent 6tre o,tenues rapidement# Si les donn(es importantes ne sont pas disponi,les aupr7s dune source existante le temps et les coMts dac.uisition des donn(es doivent 6tre (valu(s# Dans tous les cas il est important de consid(rer la contri,ution de lanal0se sta! tisti.ue dans le processus de prise de d(cision# 1e coMt dac.uisition des donn(es et de la! nal0se .ui en d(coule ne doit pas exc(der les gains g(n(r(s par lutilisation de lin*orma! tion pour prendre une meilleure d(cision#

7rreurs dans la collecte des donnes


Il convient de tou'ours tenir compte de la pr(sence (ventuelle derreurs de mesure dans les (tudes statisti.ues# Utiliser des donn(es erron(es peut sav(rer pire .ue de ne pas en utili! ser# Une erreur dans lac.uisition des donn(es intervient lors.ue la valeur inscrite ne cor! respond pas - la vraie valeur cest!-!dire celle .ui aurait (t( o,tenue avec une proc(dure

ous sommes tr7s )eureux de votre passage au 1o,ster $ot et nous voulons nous assurer .ue vous reviendre"# Si vous ave" .uel.ues minutes nous vous serions reconnaissants de ,ien vouloir r(pondre - ce petit .uestionnaire# Sos commentaires et suggestions sont extr6mement importants pour nous# Aerci# Nom du serveur
Excellent Uon Satis*aisant Insatis*aisant

Qualit( de la nourriture Qualit( du service Napidit( du service $ropret( Bestion Nemar.ues Quest!ce .ui vous a incit( - venir dans ce restaurant Z
Seuille" d(poser ce .uestionnaire dans la ,o8te - suggestions situ(e - lentr(e#

;igure 1.3 %ondage dopinion aupr!s des clients du restaurant $obster Pot de &edington %hores' dans ltat de (loride

dac.uisition correcte# De telles erreurs peuvent survenir de di**(rentes mani7res# $ar exemple un en.u6teur peut *aire une erreur denregistrement noter .uun individu a 5% ans au lieu de %5 ans ou ,ien la personne interrog(e peut mal interpr(ter la .uestion et donner une r(ponse incorrecte# 1es anal0stes exp(riment(s prennent grand soin de ne pas *aire derreur dans la collecte et lenregistrement des donn(es# Des proc(dures de d(tection des inco)(rences existent# $ar exemple lattention de lanal0ste sera attir(e lors.ue le traitement dun .ues! tionnaire r(v7le .uun individu Og( de %% ans a %& ann(es dexp(rience sur le marc)( du travail# 1es anal0stes r(examinent (galement les donn(es pour les.uelles on constate des valeurs in)a,ituellement (lev(es ou *ai,les pouvant 6tre dues - des erreurs de mesure# Dans le c)apitre 2 nous pr(senterons .uel.ues m(t)odes utilis(es par les statisticiens pour identi*ier ces valeurs K )ors normes L# 1es erreurs surviennent souvent au cours de la p)ase de collecte des donn(es# Utiliser toutes les donn(es disponi,les - laveuglette ou utiliser des donn(es .ui nont pas *ait lo,'et de toutes les attentions peut apporter une in*ormation trompeuse et conduire prendre de mauvaises d(cisions# Ainsi en prenant soin de collecter des donn(es pr(cises on am(liore le processus d(cisionnel#

1.4 S0A0"S0"=<(S D(S5&"60"4(S


1 Statistiques 1a plupart des in*ormations statisti.ues contenues dans les 'ournaux les maga"ines D les ONNES rapports de soci(t(s et autres pu,lications sont des donn(es r(sum(es et pr(sent(es sous une *orme *acilement compr()ensi,le par le lecteur# On appelle de tels r(sum(s sous *orme de ta,leaux de grap)i.ues ou sous *orme num(ri.ue des statistiques descripti es# On se r(*7re une *ois encore - lensem,le de donn(es relati* aux %4 titres du mar! c)( secondaire pr(sent( dans le ta,leau 1#1# Des statisti.ues descriptives peuvent 6tre uti! lis(es pour r(sumer lin*ormation contenue dans cet ensem,le de donn(es# $ar exemple le ta,leau 1#5 pr(sente un r(sum( sous *orme de ta,leau des donn(es de la varia,le $lace ,oursi7re# 1a *igure 1#5 est un r(sum( grap)i.ue de ces m6mes donn(es sous *orme dun diagramme en ,arre# /es t0pes de repr(sentation grap)i.ue et sous *orme de ta,leaux *aci! litent g(n(ralement linterpr(tation des donn(es# En se r(*(rant au ta,leau 1#5 et au gra! p)i.ue 1#5 on saperCoit .ue la ma'orit( des titres sont (c)ang(s sur le marc)( parall7le = +I : des titres sont (c)ang(s sur le marc)( parall7le %& : sur le marc)( ,oursier am(ri! cain et 1% : sur le marc)( de NeF HorG# Une anal0se grap)i.ue de la varia,le .uantitative repr(sentant la marge ,rute des titres secondaires sous *orme d)istogramme est pr(sent(e au grap)i.ue 1#4# [ partir de l)istogramme il est *acile de voir .ue les marges ,rutes vont de & : - D4 : les plus *or! tes concentrations se situant entre 2& : et 54 :#
0a:leau 1.4 (r"uences et )r"uences en pourcentage de la #ariable Place boursi!re 6lace :oursi>re Uourse de NeF HorG Uourse Am(ricaine Aarc)( parall7le
ET

Total

I& D& +& 4& 5& 2& %& 1& NHSE AAET Aarc)( ,oursier OT/ $ o u r

;igure 1.4 *iagramme en b+tons pour la #ariable Place boursi!re

9 I D + 4 5 2 % 1 && 14 2& 54 Aarge ,rute ;en :< +& D4 > r (

;igure 1.! ,istogramme de la marge brute -en ./ pour les 25 titres du march secondaire

En plus des pr(sentations sous *orme de ta,leaux et de grap)i.ues on peut utili! ser des statisti.ues descriptives num(ri.ues# 1a plus courante est la mo0enne# En utilisant les donn(es sur la capitalisation ,oursi7re des titres secondaires pr(sent(es dans le ta,leau 1#1 on peut calculer la capitalisation ,oursi7re mo0enne en additionnant les valeurs des %4 titres et en divisant la somme par %4# Ainsi les valeurs de marc)( s(l7vent en mo0enne - 11% 5 millions de dollars# /ette mo0enne est interpr(t(e comme une mesu! re de la valeur centrale des donn(es de cette varia,le# Dans de nom,reux domaines lint(r6t pour les m(t)odes statisti.ues .ui peuvent 6tre utilis(es pour d(velopper et pr(senter des statisti.ues descriptives continue de cro8tre# 1es c)apitres % et 2 sont consacr(s aux m(t)odes de statisti.ues descriptives sous *orme de ta,leaux de grap)i.ues et sous *orme num(ri.ue#

1.! ",;/&(,5( S0A0"S0"=<(


De nom,reuses situations re.ui7rent des donn(es relatives - un vaste ensem,le d(l(ments ;individus soci(t(s (lecteurs m(nages produits clients etc#<# [ cause des imp(rati*s li(s aux coMts au temps et - dautres consid(rations les donn(es sont collect(es uni.uement aupr7s dune petite partie du groupe concern(# 1e groupe consid(r( dans son ensem,le est d(sign( par le terme o ulation et la petite partie du groupe par le terme chantillon# >ormellement on utilise les d(*initions suivantes#
Population # une population est lensemble des lments considrs dans une tude particuli!re. chantillon # un chantillon est un sous-ensemble de la population.

)e #ouvernement amricain e**ectue un recensement tous les di% ans- )es socits d!tudes de march ralisent des enqu8tes au r5s d!chantillons de la o ulation 1 In*rence DONNES tous les .ours-

ET

1e processus de conduite dune en.u6te pour collecter des donn(es relatives - la population enti7re est appel( un recensement# 1e processus de conduite dune en.u6te pour collecter des donn(es relatives - un (c)antillon est appel( une enqu?te d9c@an3 tillonnage# 1apport ma'eur des statisti.ues r(side dans la possi,ilit( de *aire des estima! tions et des tests d)0pot)7ses sur les caract(risti.ues dune population au travers dun pro! cessus dit din#rence statistique# /omme exemple din*(rence statisti.ue consid(rons l(tude *aite par Norris Electronics# 1a soci(t( Norris *a,ri.ue des ampoules - *orte intensit( utilis(es dans de nom,reux produits (lectri.ues# Dans le ,ut daccro8tre la dur(e de vie des ampoules le groupe de rec)erc)e a mis au point un nouveau *ilament# Dans ce cas la population cor! respond - lensem,le des ampoules produites avec le nouveau *ilament# $our (valuer les avantages de ce nouveau *ilament un (c)antillon de %&& nouvelles ampoules a (t( s(lec! tionn(# 1es donn(es collect(es correspondent au nom,re d)eures d(clairage o,tenues avant .ue le *ilament ne grille# 1es donn(es de l(c)antillon sont report(es dans le ta,leau 1#4#
0a:leau 1.! 0ombre dheures a#ant "ue lampoule ne grille pour un chantillon de 211 ampoules de 0orris Electronics 1&D 45 ++ +% D5 9% D4 +4 I1 I2 DI 9& 9+ ++ +I I4 I2 D5 D2 D2

Supposons .ue Norris veuille utiliser l(c)antillon pour estimer le nom,re mo0en d)eures d(clairage des ampoules *a,ri.u(es avec le nouveau *ilament pour la population

enti7re# En additionnant les %&& valeurs du ta,leau 1#4 et en divisant le total par %&& on o,tient la dur(e de vie mo0enne des ampoules de l(c)antillon = D+ )eures# On peut utili! ser ce r(sultat pour estimer la dur(e de vie mo0enne des ampoules de la population D+ )eures# 1a *igure 1#+ est un r(sum( grap)i.ue du processus din*(rence statisti.ue uti! lis( par Norris Electronics#

1# 1a population correspond - toutes les ampoules *a,ri.u(es avec le nouveau *ilament# 1a dur(e de vie mo0enne est inconnue#

%# Un (c)antillon de %&& ampoules est *a,ri.u( avec le nouveau *ilament#

5# 1a valeur de la mo0enne de l(c)antillon est utilis(e comme estimation de la mo0enne de la population#

2# 1es donn(es de l(c)antillon *ournissent une dur(e de vie mo0enne de D+ )eures par ampoule#

;igure 1.$ $e processus din)rence statisti"ue pour lexemple de 0orris Electronics

Quand les statisticiens utilisent un (c)antillon pour estimer une caract(risti.ue de la population ils d(*inissent (galement la .ualit( ou pr(cision de lestimation# $our lexemple de Norris le statisticien doit pr(ciser .ue lestimation de la dur(e de vie mo0en! ne des ampoules de la population est de D+ )eures avec une marge derreur de plus ou moins 5 )eures# Ainsi lintervalle destimation de la dur(e de vie mo0enne de toutes les ampoules est compris entre D% et I& )eures# 1e statisticien peut (galement donner un indi! ce de con*iance pour la vraie dur(e de vie mo0enne cest!-!dire la pro,a,ilit( .ue linter! valle \D% 3 I&] contienne e**ectivement la vraie valeur de la mo0enne de la population#

1.$ ",;8&1A0"=<( (0 A,A7.S( S0A0"S0"=<(


Dans la mesure oV lanal0se statisti.ue impli.ue de larges ensem,les de donn(es les ana! l0stes utilisent *r(.uemment des logiciels in*ormati.ues pour ce travail# $ar exemple cal! culer la dur(e de vie mo0enne des %&& ampoules dans lexemple de Norris Electronics ;c*# ta,leau 1#4< pourrait sav(rer p(ni,le sans un ordinateur#

&/S<1/
1 9su ONNES 1es statisti.ues sont lart et la science de collecter anal0ser pr(senter et interpr(ter D des donn(es# $rati.uement tous les (tudiants en (conomie ou en commerce suivent des cours de statisti.ue# Nous avons d(,ut( ce c)apitre par une pr(sentation des applications statis! ti.ues usuelles en (conomie et dans le domaine commercial# 1es donn(es sont les *aits et les c)i**res .ui sont collect(s et anal0s(s# Il existe .uatre (c)elles de mesure utilis(es pour o,tenir des donn(es sur une varia,le particuli7re = cardinale ordinale par intervalle ou par ratio# 1(c)elle de mesure dune varia,le est car! dinale lors.ue des la,els ou des noms permettent didenti*ier une caract(risti.ue dun (l(! ment# 1(c)elle est ordinale si les donn(es ont les propri(t(s cardinales et si lordre ou le rang des donn(es *ait sens# 1(c)elle est dite dintervalle si les donn(es poss7dent les pro! pri(t(s ordinales et si lintervalle entre les valeurs est mesur( selon une unit( *ixe# >inalement l(c)elle de mesure est de ratio si les donn(es poss7dent les propri(t(s de don! n(es par intervalle et si le ratio de deux valeurs est porteur de sens# Dans une perspective danal0se les donn(es peuvent 6tre class(es selon leur natu! re .uantitative ou .ualitative# 1es donn(es .ualitatives utilisent des (ti.uettes ou des noms identi*iant une caract(risti.ue de c)a.ue (l(ment# 1es donn(es .ualitatives ont une (c)el! le de mesure cardinale ou ordinale et peuvent 6tre num(ri.ues ou non num(ri.ues# 1es donn(es .uantitatives sont des valeurs num(ri.ues .ui indi.uent des .uantit(s# 1es don! n(es .uantitatives sont (valu(es grOce - une (c)elle de mesure par intervalle ou par ratio# 1es op(rations arit)m(ti.ues ordinaires ne sont pertinentes .uavec des varia,les .uantita! tives# Ainsi les op(rations statisti.ues utilis(es pour des donn(es .uantitatives ne sont pas tou'ours appropri(es pour des donn(es .ualitatives# Dans les sections 1#5 et 1#4 nous avons a,ord( les su'ets de statisti.ue descripti! ve et din*(rence statisti.ue# 1es statisti.ues descriptives sont constitu(es de ta,leaux de grap)i.ues ou de c)i**res r(sumant les donn(es# 1in*(rence statisti.ue est le processus .ui consiste - utiliser les donn(es dun (c)antillon pour e**ectuer des estimations ou des tests d)0pot)7ses concernant les caract(risti.ues dune population# Dans la derni7re section de ce c)apitre nous avons not( .ue les ordinateurs *acilitent lanal0se statisti.ue#
ET

'78SSA"&(
Statistiques : 1art et la science de collecter anal0ser pr(senter et interpr(ter des donn(es# Donnes : >aits et c)i**res .ui sont collect(s anal0s(s et r(sum(s pour 6tre pr(sent(s et interpr(t(s# (nsem:le de donnes : Toutes les donn(es collect(es pour une (tude particuli7re# /lments : Entit(s aupr7s des.uelles sont collect(es les donn(es# 4aria:le : /aract(risti.ue des (l(ments .ui nous int(resse#

8:ser ation : Ensem,le des mesures o,tenues pour un (l(ment uni.ue# /c@elle nominale : c)elle de mesure dune varia,le dont les donn(es consistent en des la,els ou noms identi*iant une caract(risti.ue dun (l(ment# 1es donn(es nominales peu! vent 6tre num(ri.ues ou non# /c@elle ordinale : c)elle de mesure dune varia,le dont les donn(es poss7dent les pro! pri(t(s nominales et dont lordre *ait sens# 1es donn(es ordinales peuvent 6tre num(ri.ues ou non# /c@elle cardinale ou d9inter alle : c)elle de mesure dune varia,le dont les donn(es poss7dent les propri(t(s ordinales et dont l(cart peut 6tre exprim( selon une unit( de mesure *ixe# 1es donn(es cardinales sont tou'ours num(ri.ues# /c@elle de ratio : c)elle de mesure dune varia,le dont les donn(es poss7dent les pro! pri(t(s cardinales et dont le rapport *ait sens# 1es donn(es mesur(es selon une (c)elle de ratio sont tou'ours num(ri.ues# Donnes qualitati es : 1a,els ou noms utilis(s pour identi*ier une caract(risti.ue de c)a.ue (l(ment# 1es donn(es .ualitatives utilisent une (c)elle de mesure nominale ou ordinale et peuvent 6tre num(ri.ues ou non num(ri.ues# Donnes quantitati es : Saleurs num(ri.ues .ui indi.uent la .uantit( de .uel.ue c)ose# 1es donn(es .uantitatives sont mesur(es selon une (c)elle cardinale ou de ratio# 4aria:le qualitati e : Saria,le dont .ualitatives# 4aria:le quantitati e .uantitatives# : Saria,le dont les donn(es les donn(es sont sont

Donnes en coupe trans ersale : Donn(es collect(es - un m6me moment ;ou - des moments tr7s proc)es< dans le temps# Donnes de srie temporelle : Donn(es collect(es - des moments di**(rents dans le temps# Statistiques descripti es : Ta,leaux grap)i.ues et approc)es num(ri.ues utilis(s pour r(sumer les donn(es# 6opulation : Ensem,le de tous les (l(ments dint(r6t dans une (tude particuli7re# /c@antillon : Sous!ensem,le de la population# &ecensement : En.u6te visant - collecter des donn(es relatives - la population enti7re# (nqu?te d9c@antillonnage : En.u6te visant - collecter des donn(es relatives - un (c)an! tillon# "n#rence statistique : $rocessus dutilisation des donn(es dun (c)antillon pour estimer ou tester des )0pot)7ses sur les caract(risti.ues dune population#

(A(&5"5(S
% 7%ercic entre les statisti.ues en tant .ue *aits num(ri.ues et D ONNES 1# Discuter des di**(rences les statisti.ues en tant .ue discipline ou o,'et d(tude# %# 1e maga"ine Cond :ast Traveler a men( une en.u6te annuelle aupr7s de ses a,onn(s pour d(terminer les meilleurs endroits oV s('ourner - travers le monde# 1e ta,leau 1#+ pr(sente les donn(es relatives - un (c)antillon de neu* )Etels europ(ens ; Cond :ast Traveler 'anvier %&&&<# 1e prix dune c)am,re dou,le standard en )aute saison varie entre J ;prix le plus *ai,le< et JJJJ ;prix le plus (lev(<# 1a note glo,ale inclut les (valuations des a,onn(s de c)a.ue c)am,re d)Etel du service du restaurant du lieu de latmosp)7re et des parties communes 3 plus la note glo,ale est (lev(e plus lest (galement le degr( de satis*action#
0a:leau 1.$ 2lassement de neu) h3tels en Europe
ET

,om de la proprit Bravete0e Aanor Silla dEste Qotel $rem Qotel d^Europe $alace 1u"ern No0al /rescent Qotel Qotel Sac)er Duc de Uourgogne Silla Ballici

Source = Cond :ast Traveller 'anvier %&&&#

a< /om,ien 0 a t!il d(l(ments dans cet ensem,le de donn(es Z ,< /om,ien 0 a t!il de varia,les dans cet ensem,le de donn(es Z c< Quelles sont les varia,les .ualitatives et .uelles sont les varia,les .uantitatives Z d< Quel t0pe d(c)elle de mesure est utilis( pour c)acune des varia,les Z

2# Neprendre les donn(es du ta,leau 1#+#


a< Quel est le nom,re mo0en de c)am,res dans les neu* )Etels Z ,< /alculer la note glo,ale mo0enne# c< Quel est le pourcentage des )Etels situ(s en Angleterre Z d< Quel est le pourcentage des )Etels dont le prix des c)am,res s(l7ve - JJ Z

5# 1es s0st7mes d(coute tout!en!un appel(s mini!c)a8nes audio incluent g(n(ralement la radio AAR>A un dou,le lecteur de cassettes et un lecteur /D avec deux enceintes s(par(es# 1es donn(es du ta,leau 1#D indi.uent le prix de vente la .ualit( sonore la

capacit( de lecture des /D la sensi,ilit( et la s(lectivit( de la ,ande radio et le nom,re de lecteurs de cassettes pour un (c)antillon de dix mini!c)a8nes ;Consumers! 9e orts Buyin# ;uide %&&%<#
0a:leau 1.B n chantillon de dix mini-cha4nes audio

1arque et mod>le AiFa NST!A@I&& @S/ >S!SD1&&& @S/ AT!B4& $anasonic S/!$A 11 N/A NS 1%I2 S)arp /D!UA%+&& Son0 /Q/!/11 Son0 AQ/!NT1 Hama)a BT!4&4 Hama)a A/N!E1&& a< /om,ien 0 a t!il d(l(ments dans cet ensem,le de donn(es Z ,< Quelle est la population Z c< /alculer le prix mo0en pour l(c)antillon# d< En utilisant les r(sultats de ;c< .uelle est lestimation du prix mo0en pour la popu!

lation Z

4# Neprendre lensem,le de donn(es du ta,leau 1#D#


a< /om,ien 0 a t!il de varia,les dans cet ensem,le de donn(es Z ,< Quelles sont les varia,les .ualitatives Z .uantitatives Z c< Quelle est la capacit( mo0enne de lecture des /D de l(c)antillon Z d< Quel est le pourcentage des mini!c)a8nes .ui o,tiennent une (valuation tr7s ,onne

ou excellente de leur radio Z

e< Quel est le pourcentage des mini!c)a8nes .ui incluent deux lecteurs de cassettes Z

+# /olum,ia Qouse vend des /D - ses mem,res du clu, dac)at par internet# 1ors dune en.u6te les nouveaux mem,res devaient r(pondre - un .uestionnaire de 11 .uestions# /ertaines des .uestions pos(es (taient =
a< /om,ien de /D ave"!vous ac)et( au cours des dou"e derniers mois Z ,< _tes!vous actuellement mem,re dun clu, national dac)at par internet Z ;oui ou non< c< Quel est votre Oge Z d< Sous 0 compris com,ien 0 a t!il de personnes ;adultes et en*ants< dans votre *o0er Z e< Quel genre de musi.ue sou)aiterie"!vous ac)eter Z ;14 cat(gories sont propos(es

dont le )ard rocG le rocG la musi.ue contemporaine le )eav0 metal le rap et la countr0<# Dire si c)a.ue .uestion *ournit des donn(es .uantitatives ou .ualitatives#

D# Une en.u6te r(alis(e aupr7s des a,onn(s au maga"ine Barron!s ;14 septem,re %&&&< demandait - ces derniers dindi.uer leur statut pro*essionnel# 1es donn(es *urent enregistr(es en notant 1 le *ait de travailler - temps plein % de travailler - temps partiel 2 d6tre en retraite et 5 d6tre sans emploi ;(tudiant au c)Emage etc#<#
a< 1a varia,le est le statut pro*essionnel# Est!ce une varia,le .ualitative ou .uantitative Z ,< Quel t0pe d(c)elle de mesure est utilis( pour cette varia,le Z

I# 1a soci(t( Ballup a men( une en.u6te par t(l(p)one aupr7s dun (c)antillon de 1&&4 adultes de 1I ans et plus s(lectionn(s de *aCon al(atoire# 1en.u6te posait aux personnes contact(es la .uestion suivante K /omment d(cririe"!vous votre condition p)0si.ue en ce moment Z L ;)ttp=RRFFF#gallup#com D *(vrier %&&%<# 1es cat(gories de r(ponse (taient excellente ,onne correcte mauvaise et sans opinion#
a< Quelle (tait la taille d(c)antillon de cette en.u6te Z ,< 1es donn(es sont!elles .ualitatives ou .uantitatives Z c< Est!il plus pertinent dutiliser des mo0ennes ou des pourcentages pour r(sumer les

r(ponses - cette .uestion Z d< $armi les personnes a0ant r(pondu %9 : ont d(clar( .ue leur condition p)0si.ue (tait excellente# /om,ien dindividus ont *ourni cette r(ponse Z

9# 1e d(partement au commerce a rapport( .ue parmi les pr(tendants au prix national de la .ualit( Aalcolm Ualdrige %2 (taient de grandes entreprises manu*acturi7res 1I de grandes entreprises prestataires de service et 2& (taient de petites entreprises#
a< 1a varia,le dint(r6t est le t0pe des entreprises# Sagit!il une varia,le .ualitative ou

.uantitative Z ,< Quel est le pourcentage de candidatures (manant de petites entreprises Z

1&# 1en.u6te aupr7s des a,onn(s au Wall Street Journal ;12 octo,re %&&2< comportait 5+ .uestions relatives aux caract(risti.ues des a,onn(s et - leurs centres dint(r6t# Dire si c)acune des .uestions suivantes *ournit des donn(es .uantitatives ou .ualitatives et indi.uer l(c)elle de mesure appropri(e pour c)acune#
a< Quel est votre Oge Z ,< _tes!vous un )omme ou une *emme Z c< Quand ave"!vous commenc( - lire le Wall Street Journal Z Au l0c(e

luniversit( au d(,ut de votre carri7re pro*essionnelle plus tard dans votre carri7re ou - la retrai! te Z d< Depuis com,ien de temps occupe"!vous le poste actuel Z e< Quel t0pe de v()icule envisage"!vous dac)eter proc)ainement Z Neu* cat(gories de r(ponse (taient propos(es dont ,erline voiture de sport monospace mini!van etc# 11# ta,lir si les varia,les suivantes sont .ualitatives ou .uantitatives et indi.uer leur (c)elle de mesure#
a< Sentes annuelles ,< Taille de la cannette de ,oisson ;petite mo0enne grande< c< /lassi*ication des emplo0(s ;BS1 - BS1I<

d< Nevenus par action e< A(t)ode de paiement ;li.uide c)7.ue carte de cr(dit<

1%# 1o**ice du tourisme de QaFaii a collect( des donn(es sur les touristes de l8le# 1es .uestions suivantes sont extraites dun .uestionnaire comportant 1+ .uestions distri,u( aux passagers dun vol - destination de QaFaii en 'uin %&&2#
? /e vo0age - QaFaii est mon = 1er

%e 2e 5e etc#

? 1a raison principale de ce vo0age est = ;1& cat(gories dont vacances convention

lune de miel<
? OV est!ce .ue 'envisage de s('ourner ;11 cat(gories dont )Etel appartement

d(pendances camping< ? Nom,re de 'ours - passer - QaFaii a< Quelle est la population (tudi(e Z ,< Est!ce .ue le .uestionnaire est un ,on mo0en datteindre la population des passa! gers dun vol - destination dQaFaii Z c< Dire si c)acune des .uatre .uestions pr(c(dentes *ournit des donn(es .ualitatives ou .uantitatives Z 12`# 1e grap)i.ue 1#D est un diagramme en ,Oton r(sumant les pro*its de SolGsFagen r(alis(s entre 199D et %&&% ;Business Week %2 'uillet %&&1<#
%#4 %#& 1#4 1#& &#4

$ r o * i t s ; m

&

199D

199I

1999 %&&& Ann(e

%&&1

%&&%

;igure 1.B Pro)its de 5olks6agen

a< 1es donn(es sont!elles .ualitatives ou .uantitatives Z ,< 1es donn(es sont!elles des donn(es en coupe transversale ou des donn(es de s(rie

temporelle Z c< Quelle est la varia,le dint(r6t Z

d< /ommenter la tendance dans le temps# Sous attende"!vous - voir une

augmentation ou une ,aisse en %&&2 Z

15`# 1industrie du dis.ue am(ricaine conserve des donn(es sur les ventes par t0pe de musi.ue par *ormat et groupe dOge# 1es donn(es suivantes indi.uent le pourcentage des ventes par t0pe de musi.ue ;The :e< =ork Times >??> Almanac<#
0%pe NocG /ountr0 NYU $op Nap Bospel /lassi.ue @a"" Autre

a< 1a varia,le dint(r6t est le t0pe de musi.ue# Sagit!il une varia,le .uantitative

ou .ualitative Z ,< /onstruire un grap)i.ue des ventes de musi.ue rocG sur la p(riode 199+!%&&& 3 uti! liser laxe des a,scisses pour repr(senter les ann(es et laxe des ordonn(es pour repr(senter le pourcentage des ventes# 1e grap)i.ue est!il construit - partir de don! n(es en coupe transversale ou dune s(rie temporelle Z c< /onstruire un diagramme en ,Oton pour les ventes de musi.ue en %&&&# /e grap)i.ue est!il construit - partir de donn(es en coupe transversale ou dune s(rie temporelle Z 14# 1administration de contrEle des aliments et des m(dicaments a rapport( le nom,re de nouveaux m(dicaments approuv(s entre 199+ et %&&2 ;The Wall Street Journal 1% 'anvier %&&5<# 1e grap)i.ue 1#I r(sume le nom,re de nouveaux m(dicaments approuv(s c)a.ue ann(e#
a< 1es donn(es sont!elles .ualitatives ou .uantitatives Z ,< 1es donn(es sont!elles des donn(es en coupe transversale ou des donn(es de s(rie

temporelle Z c< /om,ien de nouveaux m(dicaments ont (t( approuv(s en %&&2 Z d< En .uelle ann(e le moins de nouveaux m(dicaments ont!ils (t( approuv(s Z /om,ien Z e< /ommenter la tendance o,serv(e concernant le nom,re dappro,ation sur la p(rio! de de 199+ - %&&2#

1+# 1e groupe marGeting de votre entreprise a mis au point une nouvelle ,oisson di(t(ti.ue .ui devrait attirer une grande partie du marc)( des 'eunes adultes#
a< De .uelles donn(es sou)aiterie"!vous disposer avant de d(cider dinvestir des

*onds importants dans la mise sur le marc)( de ce nouveau produit Z

,< /omment esp(re"!vous o,tenir les donn(es mentionn(es en ;a< Z

+&

54

2&

N o m , r e d e

14

n o

&

199+ %&&2

199D

199I
Ann(e

1999

%&&&

%&&1

%&&%

;igure 1.C 0ombre de nou#eaux mdicaments approu#s par ladministration de contr3le des aliments et des
mdica- ments

1D# 1e manager dune grande entreprise a conseill( daugmenter le salaire dun emplo0( pr(cieux de 1& &&& J pour le dissuader de .uitter lentreprise# Quelles sources de donn(es internes et externes devraient 6tre utilis(es pour d(cider si une telle augmentation de salaire est appropri(e Z 1I# Selon une en.u6te r(alis(e aupr7s de 52& vo0ageurs da**aires 144 ont eu recours une agence de vo0age pour pr(parer leur vo0age ;USA Today %& novem,re %&&2<#
a< D(velopper une statisti.ue descriptive .ui permet destimer le pourcentage de

vo0a! geurs da**aires .ui ont recours aux services dune agence de vo0age# ,< 1en.u6te rapporte .ue le mo0en le plus *r(.uemment utilis( par les vo0ageurs da*! *aires pour pr(parer leur vo0age est un site de vo0age en ligne# Si 55 : des vo0a! geurs interrog(s pr(parent leur vo0age de cette *aCon sur les 52& personnes interro! g(es com,ien ont eu recours - un site de vo0age en ligne Z c< 1es donn(es sur la *aCon dont les vo0ages sont organis(s sont!elles .ualitatives ou .uantitatives Z 19# 1en.u6te r(alis(e aupr7s des a,onn(s Nord!Am(ricains de Business Week a permis de collecter des donn(es sur un (c)antillon de % I+1 a,onn(s# 49 : des personnes a0ant r(pondu - len.u6te ont indi.u( .ue leur salaire annuel (tait sup(rieur - D4 &&& J et plus de 4& : ont d(clar( poss(der une carte de cr(dit American Express#
a< Quelle est la population concern(e par cette (tude Z ,< Est!ce .ue le revenu annuel est une varia,le .ualitative ou .uantitative Z

c< Est!ce .ue la possession dune carte de cr(dit American Express est une varia,le

.ua! litative ou .uantitative Z de s(ries temporelles Z de cette (tude#

d< Est!ce .ue cette (tude impli.ue des donn(es en coupe transversale ou des donn(es e< D(crire .uel.ues in*(rences statisti.ues .ue Business Week peut *aire sur la ,ase

%&# Une en.u6te r(alis(e aupr7s de 121 investisseurs pour le maga"ine Barron!s r(v7le .ue ;Barron!s %I octo,re %&&%< =
? 52 : des investisseurs consid(raient la tendance sur le marc)( ,oursier comme (tant

)aussi7re ou tr7s )aussi7re# ? 1e rendement mo0en attendu des actions sur les dou"e proc)ains mois (tait de 11 % :# ? %1 : des investisseurs consid(raient le secteur m(dical comme celui .ui tirerait le marc)( au cours des dou"e mois suivants# ? 1ors.ue lon demandait aux investisseurs com,ien de temps les titres des secteurs tec)nologi.ues et des t(l(communications mettraient pour retrouver une croissance soutena,le leur r(ponse mo0enne (tait deux ans et demi# a< /iter deux statisti.ues descriptives# ,< In*(rer le rendement mo0en des actions au cours des dou"e mois suivants attendu par la population de tous les investisseurs# c< In*(rer - propos de la dur(e mo0enne .uil *audra aux titres tec)nologi.ues et de t(l(! communications pour retrouver une croissance soutena,le# %1# Une (tude m(dicale de sept ans a conclu .ue les *emmes dont les m7res ont pris la drogue DES au cours de leur grossesse (taient deux *ois plus - m6me de d(velopper des anormalit(s au niveau des tissus pouvant conduire - un cancer .ue les *emmes dont les m7res nont pas pris cette drogue#
a< /ette (tude impli.ue la comparaison de deux populations# Quelles sont ces popula!

tions Z ,< $ense"!vous .ue les donn(es ont (t( o,tenues par une (tude ou une exp(rimenta! tion Z c< $our la population des *emmes dont les m7res ont pris la drogue DES au cours de leur grossesse un (c)antillon de 2 9I& *emmes montraient .ue +2 avaient d(velopp( des anormalit(s au niveau des tissus .ui pouvaient conduire - un cancer# >ournir une statisti.ue descriptive .ui peut servir - estimer le nom,re de *emmes sur 1 &&& dans cette population .ui ont des anormalit(s au niveau des tissus# d< $our la population des *emmes dont les m7res nont pas pris la drogue DES au cours de leur grossesse .uelle est lestimation du nom,re de *emmes sur 1 &&& .ui pour! raient avoir d(velopp( des anormalit(s au niveau des tissus Z e< 1es (tudes m(dicales utilisent souvent un (c)antillon relativement grand ;dans ce cas 2 9I&<# $our.uoi Z %%# [ lautomne %&&2 Arnold Sc)Far"enegger se pr(sentait aux (lections de gouverneur de la /ali*ornie *ace au gouverneur en place Bra0 Davis# Un sondage de lInstitut

politi.ue de /ali*ornie aupr7s des (lecteurs donnait Arnold Sc)Far"enegger en t6te avec 45 : des votes ;:e<s<eek I septem,re %&&2<#
a< Quelle est la population dans cette (tude Z ,< Quel est l(c)antillon de l(tude Z c< $our.uoi est!il n(cessaire dutiliser un (c)antillon dans cette (tude Z Expli.uer#

%2# Nielsen Aedia Nesearc) e**ectue c)a.ue semaine des en.u6tes sur laudimat t(l(visuel - travers les tats!Unis et pu,lie - la *ois les taux daudience et les parts de marc)(# 1e taux daudience de Nielsen correspond au pourcentage de m(nages poss(dant une t(l(vision .ui regardent un programme d(*ini alors .ue la part de marc)( correspond au pourcentage de m(nages regardant un programme parmi lensem,le des m(nages regardant la t(l(vision# $ar exemple lors du matc) de ,ase,all entre les NeF HorG HanGees et les >lorida Aarlins en %&&2 le taux daudience *ut de 1% I : et la part de marc)( de %% : ;Associated $ress %D octo,re %&&2<# Ainsi 1% I : des m(nages poss(dant une t(l(vision ont regard( le matc) et %% : des m(nages regardant la t(l(vision regardaient pr(cis(ment le matc)# En se ,asant sur les taux daudience et les parts de marc)( des principaux programmes de t(l(vision Nielsen pu,lie c)a.ue semaine un classement des programmes ainsi .uun classement des .uatre plus grandes c)a8nes = AU/ /US NU/ et >ox#
a< Quest!ce .ue la soci(t( Nielsen essaie de mesurer Z ,< Quelle est la population Z c< $our.uoi est!il n(cessaire dutiliser un (c)antillon dans cette (tude Z d< Quelles sortes de d(cisions ou dactions sont ,as(es sur les (tudes Nielsen Z

%5# Un (c)antillon des notes o,tenues lors de lexamen du milieu de trimestre de cin. (tudiants *ournit les donn(es suivantes = D% +4 I% 9& D+# $armi les a**irmations suivantes les.uelles sont correctes et les.uelles peuvent 6tre .uali*i(es de trop g(n(rale Z
a< 1a mo0enne des notes o,tenues par l(c)antillon des cin. (tudiants est de DD# ,< 1a mo0enne des notes de tous les (tudiants .ui ont pass( leur examen est de DD# c< Une estimation de la mo0enne des notes de tous les (tudiants .ui ont pass( leur exa!

men est de DD# d< $lus de la moiti( des (tudiants .ui ont pass( leur examen ont des notes comprises entre D& et I4# e< Si cin. autres (tudiants (taient inclus dans l(c)antillon leurs notes seraient compri! ses entre +4 et 9&#