Académique Documents
Professionnel Documents
Culture Documents
Sommaire
1 Les tests statistiques ................................................................................................................................................. 3
1.1 Beaver ............................................................................................................................................................... 3
1.2 Qualité chez Innovatron .................................................................................................................................... 3
1.3 Connaissance des prix ....................................................................................................................................... 3
1.4 Lire des tests faits par un logiciel - interpréter une p-valeur ............................................................................ 3
Travail à faire:
1.3 Connaissance des prix3
1. Trouver l'intervalle [ a ; b ] , centré en m , dans Market Research Inc. veut savoir si les acheteurs sont
lequel se trouve le ratio de 95% des entreprises sensibles aux prix des articles vendus dans un
saines. supermarché. Elle a obtenu un échantillon aléatoire
de 802 acheteurs et a constaté que 378 acheteurs du
2. On cherche à définir un test pour juger de la
supermarché étaient capables d'indiquer le prix d'un
santé d’une entreprise. L’hypothèse nulle de ce
article immédiatement après l'avoir mis dans leur
test est que l’entreprise considérée est saine, et
panier. Testez au risque de 5 % l'hypothèse nulle selon
on décide de juger saines les entreprises dont le
laquelle au moins la moitié des clients sont capables
ratio est supérieur ou égal à a et défaillantes
d'indiquer le prix correct.
celles dont le ratio est inférieur ou égal à a .
Quel est risque de classer défaillante une
entreprise qui est saine (seuil de signification du
test, ou risque α ) ? 1.4 Lire des tests faits par un logiciel -
Quel est le risque de classer saine une entreprise interpréter une p-p-valeur4
défaillante (risque β )? On considère des données dont l’aperçu est le
suivant :
Number of
1.2 Qualité chez Innovatron2 Amount Sex
Method of
paymt
Items
Au sein de l’entreprise Innovatron, un procédé de purchased
fabrication courant a produit une population de milliers 84.12 Male Check 1
d’écrans TV dont la durée de vie moyenne est µ = 12000 34.66 Male Credit Card 9
heures avec un écart-type σ = 3000 heures. Un nouveau 37.27 Female Credit Card 1
procédé, estimé meilleur par le bureau d’études de 46.5 Female Credit Card 8
l’entreprise, a été testé sur un échantillon de taille n = 99.67 Female Check 5
100. La durée de vie moyenne des écrans de … … .. …
l’échantillon est m = 12650 heures. On estime d’après
le théorème central limite que cette distribution est (il s’agit d’une enquête sur les achats et les paiements
normale, et donc, d’après le cours de 1ère année, que la faits par les clients d’un magasin. Nous avons déjà
loi de la moyenne d’échantillon ̅ est , , où μ et utilisé ces données. L’échantillon est constitué de 80
√ clients)
σ sont respectivement la moyenne et l’écart-type des
durées de vie des écrans de la population.
1 3
DECS 1984, modifié BFC. Proposé par PS. Source : Paul Newbold, William L. Carlson,
2
PS Betty Thorne
4
BFC
Data 30
Mean (µ) 66.87263 25
Frequency
St Dev (σ) 36.10915 20
15
Proportions Frequencies 10
µ-σ to µ
µ-2σ to µ-σ
µ to µ+σ
µ+σ to µ+2σ
µ+2σ to µ+3σ
µ-3σ to µ-2σ
< µ-3σ
> µ+3σ
µ-3σ to µ-2σ 0 0.0214 0 1.712019
µ-2σ to µ-σ 0.2 0.135905 16 10.87241
µ-σ to µ 0.3 0.341345 24 27.30758
µ to µ+σ 0.3375 0.341345 27 27.30758
Amount
µ+σ to µ+2σ 0.15 0.135905 12 10.87241
µ+2σ to µ+3σ 0.0125 0.0214 1 1.712019 Observed Expected
> µ+3σ 0 0.00135 0 0.107992
Hypothesis Test
H0: Population is normally distributed
H1: Population is not normally distributed
Chisquare 5.163407
DF 5
p-value = 0.396265
sample estimates:
mean of x mean of y
49.49939 79.07085
Quelle est votre conclusion ? Quelle serait cette conclusion si le seuil de signification α était de 1% ?
5 8
PS Proposé par PS. Source : Paul Newbold, William L. Carlson,
6
DECS 1984, modifié BFC. Betty Thorne
7
Groebner, Shannon, Fry, Smith, Business Statistics: A
Decision-Making approach. Pearson. Examen Ipag
Japanese Passenger
Suicides by crashing 3.2 Tabac et Alcool en Grande-
Grande-
Year Cars sold in the US
of motor vehicle 10
(Thousands) Bretagne
1999 87 758 Les personnes qui consomment du tabac sont-elles
2000 103 863 plus susceptibles de consommer de l'alcool ? Voici
2001 91 837 (Ipagora) des données sur les dépenses des ménages
2002 112 930 (en livres) consacrées au tabac et à l'alcool, relevées
2003 104 830 par le gouvernement britannique sur 11 régions de
Grande-Bretagne. Les dépenses en tabac et en alcool
2004 108 810
semblent-elles être liées ? Que pensez-vous de ces
2005 113 923 données ? Quelles conclusions pouvez-vous tirer ?
2006 137 1154
2007 131 1183 Region Alcohol Tobacco
2008 129 1142 North 6.47 4.03
2009 104 828 Yorkshire 6.13 3.76
Northeast 6.19 3.77
East Midlands 4.89 3.34
Suicides by crashing of motor vehicle and
Japanese Passenger Cars sold in the US West Midlands 5.63 3.47
1300 140
East Anglia 4.52 2.92
1200 130 Southeast 5.89 3.2
1100
120 Southwest 4.79 2.71
1000
900
110 Wales 5.27 3.53
800
100
Scotland 6.08 4.51
Japanese cars sold (Thousands) 90
700
Suicides by car crash
Northern Ireland 4.02 4.56
600 80
1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009
9 10
Vigen, Tyler : Spurious Correlations, Source = DASL,
http://www.tylervigen.com/spurious-correlations . https://dasl.datadescription.com/datafile/tobacco-and-
rédaction B.F.C. alcohol/
11
BFC - Ipag Exam
12
D’après un ancien sujet de BTS AC
ancienneté
nécessaire panne
paiement
% remise
montant
dernière
cliente
(heures) achats
âge
intervention
TI TE TP
2.6 3 Electrique 1 150 15 35 2 visa
4.6 8 Mécanique 2 200 25 37 2 magasin
1 2 Mécanique 3 250 35 37 5 magasin
5.5 10 Mécanique 4 85 5 22 1 visa
… … … 5 80 5 20 1 visa
(La suite des données se trouve sur Ipagora) …..suite du fichier sur Ipagora.
… … …
3.5 7 Mécanique Ces informations portent sur les achats :
- Le montant des achats avant remise (en euros)
1. Dans un premier temps, ignorez le type de la - Le pourcentage de la remise qui sera appliquée
panne et déterminez une équation de régression - Le mode de paiement : carte du magasin ou
permettant d'estimer le temps d’intervention Y carte de paiement visa
des techniciens en fonction du nombre X1 de mois
écoulés depuis la dernière intervention. Qu’en Et sur les caractéristiques de la cliente :
pensez-vous ? Interprétez les coefficients de - L’âge en années
l’équation. - L’ancienneté dans le programme de fidélisation.
2. Dans un deuxième temps, établissez une
deuxième équation de régression permettant L’objectif est de comprendre et de quantifier l’impact
d’estimer Y en fonction de X1 et du nombre de éventuel de la remise consentie sur le montant
pannes (introduisez pour cela une nouvelle d’achats. Vous construirez pour cela un ou plusieurs
variable binaire, comme vous l’avez vu en cours). modèle de régression linéaire. Dans ce but, la variable
Interprétez les coefficients de l’équation. « paiement » sera représentée par une variable
Comparez les deux modèles. binaire que vous définirez.
Travail à faire :
13 14
B.F.C. Source ? S.S.
A1 A2 A3 A4
Semestre 1 310 321 327 340
Semestre 2 616 601 655 612
15
Balke, N. S. (1993). Detecting level shifts in time Cobb, G. W. (1978). The problem of the Nile: conditional
series. Journal of Business and Economic Statistics, 11, 81– solution to a change-point problem.Biometrika 65, 243–51.
92. doi: 10.2307/1391308. doi: 10.2307/2335202.
16
B.F.C. Source ?
trimestre
Année
A1 A2 A3 A4 Moyennes mobiles
Y
centrées
Semestre 1 310 321 327 340
Semestre 2 616 601 655 612
T1 1 185
T2 2 218
1. Quelle est la nature de cette série 2020
T3 3 174 224.875
chronologique ? Lissez la série à l’aide de
moyennes mobiles d’ordre approprié. (déjà fait) T4 4 342 218.125
2. Déterminez les coefficients saisonniers T1 5 146 219.125
semestriels T2 6 203 217.875
2021
3. Si cette évolution se poursuit, donnez une T3 7 197 213.375
estimation des ventes pour chacun des deux T4 8 309 212
semestres de 2020. Que pensez-vous de ces
T1 9 143 ?
prévisions ?
T2 10 195 ?
2022
T3 11 161
6.2 Chiffre d’affaires18 T4 12 293
Au cours des trois derniers exercices, le chiffre Pourquoi utilise-t-on des moyennes mobiles
d’affaires trimestriel d'une entreprise a évolué comme d’ordre 4 ?
suit : Calculez les valeurs manquantes du tableau
2020 2021 2022 (signalées par un point d’interrogation dans ce
tableau).
1er trimestre 185 146 143
2è trimestre 218 203 195 3. Déterminez la saisonnalité de la série en calculant
3è trimestre 174 197 151 les coefficients saisonniers.
4è trimestre 342 309 293 4. Interprétez ensuite ces coefficients : Pour cette
entreprise, à quelle époque de l’année se situe à
votre avis la haute saison ? la basse saison ? Que
veut dire précisément le coefficient saisonnier
calculé pour le trimestre 3 ?
5. Désaisonnalisez la série et représentez les chiffres
d’affaires corrigés des variations saisonnières sur
un graphique. Qu’en concluez-vous ?
6. En supposant que l’évolution de ces chiffres
d’affaires dessaisonnalisés constatées sur les trois
dernières années se poursuive de la même façon
en 2022, donnez une estimation pour le chiffre
d’affaires de chacun des deux premiers trimestres
de 2022.
17 18
B.F.C. Source ? Examen Ipag
19 20
S.S. S.S. Examen Ipag