Vous êtes sur la page 1sur 9

M.S.G.

Formation distance Techniques quantitatives et analyse des donnes Devoir 2 1 En condition normale de fonctionnement, une machine produit des pices dfectueuses dans une proportion constante gale 1/10.000. Un client reoit un lot tir au hasard de 30.000 pices usines par cette machine. Quelle est la probabilit quil trouve moins de trois pices dfectueuses dans ce lot ? A 0,01% de certitude prs, quel est le nombre maximal de pices dfectueuses que le client risque de trouver dans ce lot ? Une machine a confectionn 1000 paquets dont les masses sont distribues normalement. La masse moyenne des sachets est de 500 gr. avec un cart-type de 25 gr. Combien de paquets psent de 480 550 gr. ? Combien psent plus de 450 gr. Combien psent moins de 475 gr. Entre quelles limites sont compris les 9/10 de lchantillon ?

a) b)

2 a) b) c) d)

a)

b) c)

Donnes tlcharger sur le site Internet Lors d'une enqute d'opinion tenue au salon du jouet en 1997, on a demand un chantillon de 1300 parents de noter un jouet sur une chelle de 10 points (10 parents n'ont pas voulu rpondre). Voici la table des rponses : On considre la variable note comme variable quantitative continue. On vous demande de reprsenter la distribution sous forme d'histogrammes simple et cumulatif. S'agit-il d'une distribution normale? Calculer la moyenne et l'cart-type de cet chantillon (arrondir 2 dcimales). Estimer la note moyenne accorde aux jouets dans la population mre, c'est--dire par tous les parents en France. Utiliser la technique des intervalles de confiance aux seuils de 10%, de 5% et de 1% de se tromper.

Nombre note jouet 0 1 2 3 4 5 6 7 8 9 10 Total 40 10 30 26 27 104 98 250 430 182 93 1290

4 a)

Le montant de la dpense moyenne pour lachat de carburant des franais dans un supermarch nest pas connu. Un chantillon de taille n=16 indique : x = 200 fr. et s2 = 375 fr. (ce sont donc les moyenne et variance de lchantillon). Estimer par intervalle de confiance la dpense moyenne de tous les Franais au seuil de 5% (niveau de confiance de 95%). Un deuxime chantillon de taille n=100 indique : x = 201 fr. et s2 = 396 fr. (ce sont donc les moyenne et variance de lchantillon). Estimer par intervalle de confiance la dpense moyenne de tous les franais au seuil de 5% (niveau de confiance de 95%). Afin d'augmenter ses marges, une chane de magasins de distribution dcide d'adopter une nouvelle politique de gestion de stocks pour l'ensemble de ses succursales. Auparavant le bnfice mensuel d'une succursale est en moyenne gal 300 000 F. Une tude mene sur un chantillon de 15 succursales a donn un bnfice moyen de 314 600 F avec un cart-type de 20 000 F. Peut-on conclure l'efficacit de la nouvelle politique, au niveau de confiance de 95% ? Deux laboratoires ont tudi des pices produites par une mme machine. Dans le laboratoire A, sur 100 pices testes 5 ont t dclares non conformes. Dans le laboratoire B, sur 120 pices testes 11 ont t dclares non conformes. Il y a-t-il une diffrence entre les deux laboratoires un niveau de confiance de 95 % ?

b)

M.S.G. Formation distance Techniques quantitatives et analyse des donnes Devoir 2

a) b)

En tat normal de marche, une machine dbite, raison de 1600 la minute, des cigarettes dont la masse moyenne est de 1,20 grammes par cigarette (la norme officielle) avec un cart-type de 0,063 gr. Un beau matin on souponne que la machine est drgle. On prlve un chantillon de 16 cigarettes sur la chane de production. Leur masse moyenne est de 1,23 gr. A un niveau de confiance de 95% bilatral, peut-on conclure que la machine est drgle ? Ensuite, on prlve un chantillon de 100 cigarettes. De nouveau leur masse moyenne est de 1,23 gr. A un niveau de confiance de 95% bilatral, peut-on conclure que la machine est drgle ?

On souhaite contrler par sondage lexactitude de linventaire dun stock commercial comprenant plusieurs dizaines de milliers darticles. Un chantillon de 500 articles a t tir dans ce but et lon admet quune proportion derreurs (articles dfaut) infrieure ou gale 3% est acceptable. Si lon dsire un niveau de confiance de 95%, quel est le % derreurs-limite que lon peut observer sur cet chantillon au-del duquel on rejette lhypothse nulle (H 0 : erreurs = 3%) ?

LE PRIX AU M2 DES APPARTEMENTS DANS UNE PETITE VILLE FRANAISE


Donnes tlcharger sur le site Internet ou recopier (voir page suivante) Une agence immobilire a actuellement en portefeuille 45 appartements de plus de 20 m 2 en vente dans les quatre arrondissements d'une grande ville franaise. Le prix, la surface et la localisation de ces appartements sont donns dans le tableau ci-dessous (page suivante).

Questions : a) Calculer le prix au m2 pour chacun des appartements. b) Calculez ensuite la moyenne, la variance et l'cart-type, la mdiane, le premier quartile et le troisime quartile de la variable "prix au m2". Construire la bote moustache. c) Dterminer l'intervalle de confiance 95% du prix moyen au mtre carr des appartements dans la population de la ville franaise tudie. d) Pour juger de l'influence de l'arrondissement sur le prix au m 2 celui-ci est considr par arrondissement. Il vous est demand de le complter le tableau suivant :
Arrondissements Nombre d'appartements Moyenne du prix/m2 Variance (sans biais) Ecart-type (sans biais) 1 2 3 4

e) Une analyse de la variance selon un test F (ANOVA) comparant les moyennes dans les quatre arrondissements produit un tableau ANOVA. Expliquer son calcul et interprter la valeur de F.
Source Inter-chantillon Intra-chantillon Total Somme des carrs 454,4 725,4 1179,8 d.d.l 3 41 44 Carr moyen 151,5 17,7 F 8,560 Sig. 0,000

f)

Reprsenter graphiquement (fascicule, p. 58) les intervalles de confiances 95% autour des 4 moyennes d'arrondissement. Est-ce que les IC se chevauchent tous ?

M.S.G. Formation distance Techniques quantitatives et analyse des donnes Devoir 2

g) Dterminer laide de tests T de Student de diffrence de moyennes sil existe une diffrence significative de prix au m2 (utiliser la formule 5 du fascicule, p 52.) entre les arrondissements 1 et 3 au seuil de risque de 5% ? entre les arrondissements 1 et 4 au seuil de risque de 5% ? entre les arrondissements 2 et 3 au seuil de risque de 5% ? h) Esquisser le nuage de points entre les variables "surface" et "prix en KF". Marquer les appartement qui ont un jardin. Etablir la droite d'ajustement selon les moindres carrs ou "prix en KF" est expliqu par "surface totale". Calculer le coefficient de corrlation. i) SPSS dtermine la rgression multiple suivante :
Variable Constante Surface Nombre de pices Jardin Coefficients (b) 0,43 10,94 130,26 308,30 Std. Error (SE) 96,69 3,34 67,27 79,71 t 0,00 3,27 1,94 3,87 Sig. 1,00 ,00 ,06 ,00

La variable "jardin" est entre dans la rgression sous forme de "variable muette". Expliquer ce qu'on entend par "variable muette" (voir W&W 14.1) Expliquez le calcul et le rle des tests t et de son niveau de signification Calculer les intervalles de confiances autour des coefficients de rgression Quel est la fourchette de prix selon cette quation d'une maison de 88 m 2, 4 pices avec un jardin? j) Le coefficient de rgression multiple est gal 0,905. Comment est-il calcul? Expliquer sa signification.

Donnes brutes ( entrer sur une feuille Excel ou tlcharger et faire les calculs par ordinateur).
Appt. Surface 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 21 28 28 29 30 31 35 38 38 39 40 40 45 48 50 50 52 52 55 58 60 60 Arrondis- Prix en Nombre de Jardin sement KF pices 2 1 1 2 3 2 4 1 1 2 3 3 4 3 4 3 1 2 1 3 1 4 380 550 425 350 670 330 1200 478 370 304 1000 583 1043 1250 1400 870 1120 990 1270 1087 1500 1217 1 2 1 1 2 1 2 2 1 1 2 1 2 2 3 3 2 3 3 1 3 3 oui non non non non non oui non non non oui non oui oui oui non oui non oui non non non Appt. Surface 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 62 65 65 65 70 70 75 75 80 80 86 90 90 96 100 100 105 105 110 110 115 115 Arrondis- Prix en Nombre de Jardin sement KF pices 2 1 3 1 3 1 1 3 2 3 1 2 2 1 4 2 2 4 4 4 2 4 861 1350 1500 1104 1600 1304 1174 1304 1300 1391 1800 1460 1130 1565 2000 1270 1780 2400 2700 1739 1548 2087 3 3 3 4 4 3 3 3 4 4 5 4 4 5 4 4 5 5 5 5 5 5 non non non non oui non non non non non oui non non non oui non oui oui non non non oui

M.S.G. Formation distance Techniques quantitatives et analyse des donnes Devoir 2


23 62 1 974 2 non

M.S.G. Formation distance Techniques quantitatives et analyse des donnes Devoir 2

10 LE CAS : "LES ALIMENTS BIOLOGIQUES"(SUITE DU DEVOIR 1)


Une entreprise dsire se lancer dans une srie d'aliments biologiques (gteaux, riz, ptes, etc.). Elle dsire connatre un peu mieux ses clients potentiels. Elle fait une enqute par sondage auprs de 392 consommateurs potentiels la sortie d'un supermarch. La premire question consiste savoir si : "il vous arrive d'acheter des produits biologiques? Dans la fiche signaltique, on trouve, parmi d'autres, une question concernant la classe d'ge du rpondant. Le tableau suivant est un tri crois sous forme de table de contingence des deux questions :
Age \ achat 15-19 20-24 25-34 35-44 45-59 60+ Total souvent 3 2 5 8 10 14 42 de temps autre 6 13 18 42 46 20 145 rarement 24 49 19 33 36 9 170 jamais 9 6 9 3 4 4 35 Total 42 70 51 86 96 47 392

Le khi-deux d'indpendance est de 78,11 et connat un niveau de signification de 0,00 %. Une analyse factorielle des correspondances simples produit une carte simultane (ci-aprs). On vous demande, partir des indicateurs de qualit de la reprsentation, d'interprter la carte factorielle.

Carte simultane
.5 20-24 rarement 35-44 45-59 de temps a

0.0

25-34 -.5 15-19 60+ souvent

-1.0 Dimension 2

jamais Achat produits bio

-1.5 -1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0 1.2

Age

Dimension 1

M.S.G. Formation distance Techniques quantitatives et analyse des donnes Devoir 2

Axe 1 2 3

Valeurs propres 0,133 0,053 0,014

Variance explique ( dterminer)

Contributions absolues Age [15-19] [20-24] [25-34] [35-44] [45-59] [60+] Total Axe 1 20,8% 37,1% 0,4% 5,6% 7,0% 29,1% 100% Axe 2 22,2% 5,2% 13,0% 18,0% 12,6% 29,1% 100%

Cosinus carrs Axe 1 69,9% 88,3% 3,8% 43,2% 57,5% 66,7% Axe 2 29,4% 4,9% 54,9% 54,7% 41,0% 26,3%

Contributions absolues Achat souvent de temps autre rarement jamais Total Axe 1 24,8% 29,1% 37,1% 9,0% 100% Axe 2 28,2% 13,8% 6,2% 51,9% 100%

Cosinus carrs Axe 1 62,4% 79,4% 90,7% 27,5% Axe 2 28,1% 14,9% 5,9% 62,8%

11 LE MINI-MAG D'UNE CHANE DE TLVISION


Une chane de tlvision vous demande de faire une tude sur les besoins en informations auprs d'un public de tlspectateurs susceptible de regarder la tlvision entre 18h00 et 20h00 en semaine. Une enqute quantitative large comportait la question suivante : "Je vais vous citer une liste de thmes qui pourraient tre abords dans un mini-magazine, notez-les de 1 5 en fonction de vos attentes" :
Attentes La culture (cinma, thtre, concert, ) Le social Le monde tudiant Le jardinage La cuisine Le sport Lhistoire de la rgion L'emploi Les entreprises Lagriculture, la viticulture

-1 1 1 1 1 1 1 1 1 1

2 2 2 2 2 2 2 2 2 2

0
3 3 3 3 3 3 3 3 3 3

+
4 4 4 4 4 4 4 4 4 4

++
5 5 5 5 5 5 5 5 5 5

M.S.G. Formation distance Techniques quantitatives et analyse des donnes Devoir 2

a)

Ci-aprs vous trouverez la matrice des corrlations. Expliquer le sens que l'on peut donner aux coefficients entre les items { culture, social}, {culture, jardinage} et {culture, sport}.
Correlation Matrix culture 1,00 ,16 ,33 -,22 -,20 -,04 -,02 -,01 -,08 -,18 ,00 ,00 ,00 ,00 ,23 ,33 ,44 ,06 ,00 social ,16 1,00 ,12 -,04 ,06 -,04 ,10 ,12 ,17 ,07 ,00 ,01 ,20 ,10 ,19 ,02 ,01 ,00 ,09 monde tudiant ,33 ,12 1,00 -,14 -,14 ,08 -,06 ,14 -,05 -,12 ,00 ,01 ,00 ,00 ,06 ,14 ,00 ,15 ,01 jardinage -,22 -,04 -,14 1,00 ,53 ,00 ,28 ,01 ,01 ,39 ,00 ,20 ,00 ,00 ,48 ,00 ,45 ,40 ,00 cuisine -,20 ,06 -,14 ,53 1,00 ,07 ,33 ,01 ,08 ,32 ,00 ,10 ,00 ,00 ,10 ,00 ,46 ,06 ,00 sport -,04 -,04 ,08 ,00 ,07 1,00 ,01 ,10 ,13 ,04 ,23 ,19 ,06 ,48 ,10 ,43 ,03 ,00 ,22 histoire -,02 ,10 -,06 ,28 ,33 ,01 1,00 ,17 ,16 ,31 ,33 ,02 ,14 ,00 ,00 ,43 ,00 ,00 ,00 emploi -,01 ,12 ,14 ,01 ,01 ,10 ,17 1,00 ,54 ,22 ,44 ,01 ,00 ,45 ,46 ,03 ,00 ,00 ,00 entreprise -,08 ,17 -,05 ,01 ,08 ,13 ,16 ,54 1,00 ,36 ,06 ,00 ,15 ,40 ,06 ,00 ,00 ,00 ,00 agriculture -,18 ,07 -,12 ,39 ,32 ,04 ,31 ,22 ,36 1,00 ,00 ,09 ,01 ,00 ,00 ,22 ,00 ,00 ,00

Correlation

Sig. (1-tailed)

culture social monde tudiant jardinage cuisine sport histoire emploi entreprise agriculture culture social monde tudiant jardinage cuisine sport histoire emploi entreprise agriculture

b)

On procde une analyse factorielle selon la mthode des composantes principales. Expliquer succinctement quoi servent les trois tableaux d'aide l'interprtation qui sont reproduits ci-aprs : (i) (ii) la variance explique les communalits

(iii) le "component matrix" (matrice des coordonnes factorielles)

Total Variance Explained Initial Eigenvalues % of Variance Cumulative % 24,10 24,10 17,09 41,19 12,22 53,41 10,33 63,74 8,35 72,10 7,36 79,46 6,48 85,93 5,78 91,72 4,54 96,26 3,74 100,00 Extraction Sums of Squared Loadings Total % of Variance Cumulative % 2,41 24,10 24,10 1,71 17,09 41,19

Component 1 2 3 4 5 6 7 8 9 10

Total 2,41 1,71 1,22 1,03 ,84 ,74 ,65 ,58 ,45 ,37

Extraction Method: Principal Component Analysis.

M.S.G. Formation distance Techniques quantitatives et analyse des donnes Devoir 2


Communalities culture social monde tudiant jardinage cuisine sport histoire emploi entreprise agriculture Initial 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 Extraction ,32 ,20 ,31 ,58 ,54 ,05 ,35 ,61 ,61 ,54

Extraction Method: Principal Component Analysis.

Component Matrix Component 5 6 -,15 -,26 ,67 ,14 -,28 ,39 -,13 ,27 ,13 ,12 ,38 -,19 -,17 -,60 -,25 ,10 ,03 ,00 -,11 ,10

culture social monde tudiant jardinage cuisine sport histoire emploi entreprise agriculture

1 -,39 ,11 -,28 ,67 ,68 ,12 ,58 ,37 ,49 ,73

2 ,41 ,44 ,49 -,37 -,28 ,19 ,08 ,69 ,61 ,09

3 ,54 ,44 ,41 ,26 ,31 -,26 ,35 -,26 -,37 -,01

4 ,07 -,32 ,40 ,15 ,19 ,83 -,02 -,04 -,15 -,07

7 ,44 -,07 -,18 ,08 -,12 ,08 -,30 -,24 ,11 ,48

8 ,32 -,09 -,26 ,15 ,33 -,04 -,21 ,22 ,14 -,39

9 ,03 ,13 -,15 ,39 -,38 ,10 ,02 ,23 -,23 -,05

10 -,03 -,02 ,10 ,24 -,17 -,02 ,07 -,29 ,38 -,20

c)

SPSS cre la carte des variables. A partir des indicateurs de la qualit de la reprsentation et du dendrogramme, interprter correctement cette carte.

M.S.G. Formation distance Techniques quantitatives et analyse des donnes Devoir 2

Cercle des corrlations


1,0 emploi entreprise ,5 monde tudiant culture social sport agriculture histoire 0,0 cuisine jardinage -,5 Component 2

-1,0 -1,0 Component 1 -,5 0,0 ,5 1,0

* * H I E R A R C H I C A L

C L U S T E R

A N A L Y S I S * *

Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E Label Num emploi entreprise social histoire culture monde tu. sport jardinage cuisine agricultur 0 5 10 15 20 25 +---------+---------+---------+---------+---------+

Vous aimerez peut-être aussi