Vous êtes sur la page 1sur 17

Statistiques et Méthodes de prévision

Bruno Fischer Colonimos, Radhoine Laouer, Olivier Levine, Philippe Scotto

Exercices à traiter pour chaque séance de TD

Sommaire
1 Les tests statistiques ................................................................................................................................................. 3
1.1 Beaver ............................................................................................................................................................... 3
1.2 Qualité chez Innovatron .................................................................................................................................... 3
1.3 Connaissance des prix ....................................................................................................................................... 3
1.4 Lire des tests faits par un logiciel - interpréter une p-valeur ............................................................................ 3

2 Tests du Chi² .............................................................................................................................................................. 6


2.1 Monte-Carlo Casino .......................................................................................................................................... 6
2.2 Beaver, suite ..................................................................................................................................................... 6
2.3 Librairie ............................................................................................................................................................. 6
2.4 Force de Vente .................................................................................................................................................. 6
2.5 Gaz..................................................................................................................................................................... 6

3 Régression linéaire simple, corrélation. .................................................................................................................... 8


3.1 Japanese Go Home! .......................................................................................................................................... 8
3.2 Tabac et Alcool en Grande-Bretagne................................................................................................................. 8
3.3 MicroDiscount ................................................................................................................................................... 8
3.4 Scierie de Romme ............................................................................................................................................. 9

4 Régression linéaire : modèles, régression multiple ................................................................................................ 11


4.1 Indication ........................................................................................................................................................ 11
4.2 Réparations .................................................................................................................................................... 11
4.3 MaxMode ........................................................................................................................................................ 11

5 Séries chronologiques – Moyennes mobiles........................................................................................................... 13


5.1 Le debit du Nil ................................................................................................................................................. 13
5.2 Ventes semestrielles ....................................................................................................................................... 13

6 Séries chronologiques-Saisonnalité ........................................................................................................................ 14


6.1 Ventes semestrielles ....................................................................................................................................... 14
6.2 Chiffre d’affaires .............................................................................................................................................. 14

7 Séries chronologiques-Lissages exponentiels ......................................................................................................... 15


7.1 Champi ............................................................................................................................................................ 15
7.2 ParfumS ........................................................................................................................................................... 15

Annexe : Table de la distribution inverse du χ²............................................................................................................... 16


Table de la fonction de répartition de la loi normale centrée réduite ............................................................................ 17

Année universitaire 2022-2023 BFC, RL, OL, PS - 2/17


Travail à faire :
1 Les tests statistiques 1. Afin de vérifier si le nouveau procédé est meilleur
l’entreprise décide d’utiliser un test. Précisez les
hypothèses H0 et H1 de ce test et précisez s’il est
1.1 Beaver1 bilatéral ou unilatéral.
Pour essayer de prévoir la défaillance des entreprises 2. La statistique du test sera la moyenne d’échantillon
et prévoir suffisamment tôt leur éventuel ̅ . Donnez les paramètres de la loi de probabilité de
reclassement, l'économiste W. BEAVER introduit le ̅.
ratio défini, pour chaque entreprise, comme le 3. Calculer la valeur critique ̅ de cette statistique
quotient de la marge brute d'autofinancement (cash
pour un seuil alpha de 5%. Que peut-on dire du
flow) par les dettes totales.
nouveau procédé de fabrication ?
A partir d'un grand nombre d'observations, il déduit
que les entreprises saines ont un ratio qui suit une loi 4. Calculer la p-valeur pour un seuil alpha de 5%.
normale de moyenne m = 0.7 et d'écart-type s = 0.18 Votre résultat confirme-t-il la conclusion obtenue à
et que les entreprises défaillantes ont un ratio qui suit la question précédente ?
une loi normale de moyenne m = 0.1 et d'écart-type s
= 0.15 .

Travail à faire:
1.3 Connaissance des prix3
1. Trouver l'intervalle [ a ; b ] , centré en m , dans Market Research Inc. veut savoir si les acheteurs sont
lequel se trouve le ratio de 95% des entreprises sensibles aux prix des articles vendus dans un
saines. supermarché. Elle a obtenu un échantillon aléatoire
de 802 acheteurs et a constaté que 378 acheteurs du
2. On cherche à définir un test pour juger de la
supermarché étaient capables d'indiquer le prix d'un
santé d’une entreprise. L’hypothèse nulle de ce
article immédiatement après l'avoir mis dans leur
test est que l’entreprise considérée est saine, et
panier. Testez au risque de 5 % l'hypothèse nulle selon
on décide de juger saines les entreprises dont le
laquelle au moins la moitié des clients sont capables
ratio est supérieur ou égal à a et défaillantes
d'indiquer le prix correct.
celles dont le ratio est inférieur ou égal à a .
Quel est risque de classer défaillante une
entreprise qui est saine (seuil de signification du
test, ou risque α ) ? 1.4 Lire des tests faits par un logiciel -
Quel est le risque de classer saine une entreprise interpréter une p-p-valeur4
défaillante (risque β )? On considère des données dont l’aperçu est le
suivant :
Number of
1.2 Qualité chez Innovatron2 Amount Sex
Method of
paymt
Items
Au sein de l’entreprise Innovatron, un procédé de purchased
fabrication courant a produit une population de milliers 84.12 Male Check 1
d’écrans TV dont la durée de vie moyenne est µ = 12000 34.66 Male Credit Card 9
heures avec un écart-type σ = 3000 heures. Un nouveau 37.27 Female Credit Card 1
procédé, estimé meilleur par le bureau d’études de 46.5 Female Credit Card 8
l’entreprise, a été testé sur un échantillon de taille n = 99.67 Female Check 5
100. La durée de vie moyenne des écrans de … … .. …
l’échantillon est m = 12650 heures. On estime d’après
le théorème central limite que cette distribution est (il s’agit d’une enquête sur les achats et les paiements
normale, et donc, d’après le cours de 1ère année, que la faits par les clients d’un magasin. Nous avons déjà
loi de la moyenne d’échantillon ̅ est , , où μ et utilisé ces données. L’échantillon est constitué de 80
√ clients)
σ sont respectivement la moyenne et l’écart-type des
durées de vie des écrans de la population.

1 3
DECS 1984, modifié BFC. Proposé par PS. Source : Paul Newbold, William L. Carlson,
2
PS Betty Thorne
4
BFC

Année universitaire 2022-2023 BFC, RL, OL, PS - 3/17


1.4.1 Les montants payés suivent-
suivent-ils une loi
normale ?
On se fixe un seuil de signification de 5% et on réalise
le test avec le logiciel Xlstatistics . On obtient l’écran
suivant :

Data 30
Mean (µ) 66.87263 25

Frequency
St Dev (σ) 36.10915 20
15

Proportions Frequencies 10

Range Observed Expected Observed Expected 5


0
< µ-3σ 0 0.00135 0 0.107992

µ-σ to µ
µ-2σ to µ-σ

µ to µ+σ

µ+σ to µ+2σ
µ+2σ to µ+3σ
µ-3σ to µ-2σ
< µ-3σ

> µ+3σ
µ-3σ to µ-2σ 0 0.0214 0 1.712019
µ-2σ to µ-σ 0.2 0.135905 16 10.87241
µ-σ to µ 0.3 0.341345 24 27.30758
µ to µ+σ 0.3375 0.341345 27 27.30758
Amount
µ+σ to µ+2σ 0.15 0.135905 12 10.87241
µ+2σ to µ+3σ 0.0125 0.0214 1 1.712019 Observed Expected
> µ+3σ 0 0.00135 0 0.107992

Hypothesis Test
H0: Population is normally distributed
H1: Population is not normally distributed
Chisquare 5.163407
DF 5
p-value = 0.396265

femmes. Peut-on dire que ces montants moyens sont


1.4.2 Comparaison des montants d’achat, en différents dans la population ?
fonction du sexe. On se fixe un seuil de signification de 5% et on réalise
Dans l’échantillon, on observe une différence entre les le test avec le logiciel R On obtient les résultats
montants payés par les hommes et ceux payés par les suivants :

Welch Two Sample t-test

data: Amount_male and Amount_female


t = -4.0257, df = 74.746, p-value = 0.0001349
alternative hypothesis: true difference in means is not equal to 0

95 percent confidence interval:


-44.20573 -14.93718

sample estimates:
mean of x mean of y
49.49939 79.07085

Quelle est votre conclusion ? Quelle serait cette conclusion si le seuil de signification α était de 1% ?

Année universitaire 2022-2023 BFC, RL, OL, PS - 4/17


On se fixe un seuil de signification de 5% et on réalise
1.4.3 Comparaison des nombres d’articles
d’articles achetés,
achetés, le test avec le logiciel Xlstatistics . On obtient l’écran
en fonction du sexe. suivant :
Dans l’échantillon, on observe une différence entre le
nombre d’articles achetés les hommes et ceux achetés
par les femmes. Peut-on dire que ces nombres
d’articles moyens sont différents dans la population ?

Année universitaire 2022-2023 BFC, RL, OL, PS - 5/17


Vous considérez les 150 derniers passages de clients
2 Tests du Chi² en caisse. La distribution de ces passages en caisse est
la suivante :
Caisse A Caisse B Caisse C Caisse D Total
Monte-Carlo Casino 5
2.1 Monte- 47 31 43 29 150
Le responsable des tables de jeux du Casino de Monte- Ces résultats sont-ils compatibles avec l’hypothèse
Carlo décide de faire tester les dés nouvellement que toutes les caisses sont également fréquentées, ou
achetés chez un nouveau fournisseur, FoxSpirit. Il fait bien permettent-t-ils d’affirmer que certaines caisses
choisir un dé au hasard dans le lot et le fait lancer 120 sont plus fréquentées que d’autres ? Vous utiliserez
fois de suite. Vous trouverez ci-dessous le tableau pour répondre à cette question un test d’ajustement
contenant les résultats des différents lancers : du Chi² au seuil de signification de 5%
# Vous préciserez clairement les hypothèses de ce test,
1 2 3 4 5 6 Total
Face puis vous ferez les calculs nécessaires et vous
ni 14 26 10 9 30 31 120 énoncerez votre conclusion.

Cette statistique permet-elle d’affirmer que le dé est


équilibré ? Vous emploierez pour répondre à cette 2.4 Force de Vente
question un test d’ajustement du χ² au seuil de Les vendeurs d'une entreprise doivent remettre à leur
signification α de 1%. Vous préciserez clairement les chef des ventes un rapport hebdomadaire précisant la
hypothèses de ce test, puis vous ferez les calculs liste de tous les prospects contactés au cours de la
adéquats et vous énoncerez votre conclusion. semaine, ainsi que les ventes réalisées.
A. Arnulf et C.Corot sont deux commerciaux travaillant
sur le même secteur. Le relevé du nombre des ventes
2.2 Beaver, suite 6 qu’ils ont réalisées cette semaine est le suivant :
Suite du problème du TD précédent Ventes réalisées en un mois
3. Sur 80 entreprises défaillantes, 48 décident une vendeur Produit X Produit Y Produit Z
modernisation de leur gestion.Au bout de la B.Baron 12 8 4
période d'observation, on constate cependant que C.Curie 15 4 11
25 d'entre elles ont fait faillite et que, sur les 32
entreprises qui n'ont pas modifié leur gestion, 25 Répondez aux questions suivantes à l’aide de tests
ont également fait faillite. Présentez ces résultats statistiques du χ² au seuil de signification α = 5%.
sous la forme d’un tableau de contingence et 1. En considérant la ventilation par produits, peut-on
testez à l'aide du χ² (Khi-deux), au risque de 5%, dire que le type de produit vendu dépend
puis de 1%, l'indépendance entre le changement significativement du vendeur ?
de gestion et la faillite. Dans chaque cas, vous présenterez clairement vos
hypothèses de test ainsi que vos calculs, et vous
utiliserez un seuil de signification de 5%)
2.3 Librairie7
Vous venez d’être nommé directeur d’une grande
librairie et vous cherchez à savoir comment en Gazz8
2.5 Ga
améliorer l’organisation. Une compagnie de distribution de gaz a déterminé, à
Le magasin dispose de quatre caisses, et les acheteurs partir de son expérience passée, qu'à la fin de l'hiver
peuvent régler leurs achats à chacune d’entre elles. 80 % de ses comptes clients sont entièrement soldés,
Toutefois, il vous semble que certaines caisses sont 10 % ont un mois d'arriérés, 6 % ont deux mois
plus fréquentées que d’autres, bien qu’il soit difficile d'arriérés et 4 % ont plus de deux mois d'arriérés.
de dire pourquoi. D’ailleurs, les caissiers prétendent À la fin de l'hiver dernier, l'entreprise a contrôlé un
que ces caisses sont toutes également utilisées par les échantillon aléatoire de 400 de ses comptes et a
clients. constaté que 287 étaient entièrement soldés, 49

5 8
PS Proposé par PS. Source : Paul Newbold, William L. Carlson,
6
DECS 1984, modifié BFC. Betty Thorne
7
Groebner, Shannon, Fry, Smith, Business Statistics: A
Decision-Making approach. Pearson. Examen Ipag

Année universitaire 2022-2023 BFC, RL, OL, PS - 6/17


avaient un mois d'arriérés, 30 avaient deux mois Ces données suggèrent-elles que la structure des
d'arriérés et 34 avaient plus de deux mois d'arriérés. statuts des comptes a changé cet hiver, par rapport
aux années précédentes ?

Année universitaire 2022-2023 BFC, RL, OL, PS - 7/17


3 Régression linéaire simple, corrélation.
japonaises ? Ou encore, doit-on considérer que,
pour pouvoir conduire des voitures japonaises aux
Etats-Unis,, on peut accepter un (modeste) niveau
3.1 Japanese Go Home!9 de risque ?
Encore un scandale dans l'industrie automobile ! Sources :
Sur son site, Tyler Vigen a publié la remarquable • Center for Disease Control & Prevention,
corrélation suivante: • U.S. Bureau of Transportation Statistics

Japanese Passenger
Suicides by crashing 3.2 Tabac et Alcool en Grande-
Grande-
Year Cars sold in the US
of motor vehicle 10
(Thousands) Bretagne
1999 87 758 Les personnes qui consomment du tabac sont-elles
2000 103 863 plus susceptibles de consommer de l'alcool ? Voici
2001 91 837 (Ipagora) des données sur les dépenses des ménages
2002 112 930 (en livres) consacrées au tabac et à l'alcool, relevées
2003 104 830 par le gouvernement britannique sur 11 régions de
Grande-Bretagne. Les dépenses en tabac et en alcool
2004 108 810
semblent-elles être liées ? Que pensez-vous de ces
2005 113 923 données ? Quelles conclusions pouvez-vous tirer ?
2006 137 1154
2007 131 1183 Region Alcohol Tobacco
2008 129 1142 North 6.47 4.03
2009 104 828 Yorkshire 6.13 3.76
Northeast 6.19 3.77
East Midlands 4.89 3.34
Suicides by crashing of motor vehicle and
Japanese Passenger Cars sold in the US West Midlands 5.63 3.47
1300 140
East Anglia 4.52 2.92
1200 130 Southeast 5.89 3.2
1100
120 Southwest 4.79 2.71
1000

900
110 Wales 5.27 3.53
800
100
Scotland 6.08 4.51
Japanese cars sold (Thousands) 90
700
Suicides by car crash
Northern Ireland 4.02 4.56
600 80
1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009

1. Le graphique ci-dessus présente l’évolution au 3.3 MicroDiscount11


cours du temps des deux variables considérées. MicroDiscount est une entreprise de vente à distance.
Vous suspectez naturellement une corrélation Pour certains des produits qu’elle commercialise, le
entre ces variables. Quel graphique emploieriez- prix de vente annoncé au client comprend les frais
vous pour mettre en évidence cette corrélation ? d’expédition (effectuée par les services de la poste).
Présentez ce graphique. Bien entendu, l’estimation de ces frais doit être faite
2. Calculez le coefficient de corrélation linéaire. au préalable par l’entreprise. Cette tâche est rendue
Qu’en pensez-vous ? plus difficile par le fait que la catégorie d’articles en
3. Pour sauver des vies, faut-il interdire l'importation question comprend des objets divers, plus ou moins
des voitures japonaises aux Etats-Unis ? Ou bien lourds et plus ou moins encombrants. La seule
doit-on considérer que les suicides mesurés sont utilisation du tarif postal ne suffit donc pas au calcul
en réalité une protestation contre les importations

9 10
Vigen, Tyler : Spurious Correlations, Source = DASL,
http://www.tylervigen.com/spurious-correlations . https://dasl.datadescription.com/datafile/tobacco-and-
rédaction B.F.C. alcohol/
11
BFC - Ipag Exam

Année universitaire 2022-2023 BFC, RL, OL, PS - 8/17


de ces frais. Il faut recourir à des techniques 3.4.1 I - Détermination d'un prix de départ par le
statistiques. vendeur
Pour ces produits, on a reconstitué l’évolution des Pour fixer le prix de départ, le responsable de la
quantités vendues des cinq derniers exercices et commune procède à une étude sur les ventes
l’évolution en Euros constants (de l’année 5) de ces antérieures. Les données sont consignées dans le
frais. (c’est-à-dire que les frais postaux ont été donnés tableau suivant:
ici sur la base d’un usage du tarif postal de l’année 5,
pour toutes les années). m³ Prix d'achat m³ Prix d'achat
Année 1 2 3 4 5 400 150 000 550 225 000
Unités vendues 3500 3700 4000 4700 4300 600 262 500 850 412 500
Frais postaux en k€ 700 337 000 800 375 000
40 42 44 50 48 700 412 500 700 262 500
constants
450 262 500 650 300 000
1. On représente graphiquement le montant des frais
300 187 500 550 300 000
postaux en fonction des quantités vendues. Qu’en
800 337 000 750 337 000
concluez-vous ?
450 225 000
Frais postaux Travail à faire:
52 1. Représentez cette série par un graphique.
50 2. Faites un ajustement linéaire interprétez les
coefficients de la droite de régression.
48
3. Déduisez de ce qui précède le prix d'achat
46
probable de la coupe. Sachant que le prix d'achat
44 est en moyenne égal à 90 % du prix de départ, à
42 quel niveau le responsable peut-il fixer le prix de
40 départ ? Quel serait alors le prix de retrait (40 %
38 au-dessous du prix de départ) ?
3200 3700 4200 4700 5200
3.4.2 II - Détermination par l'acheteur du prix d'achat
2. Utilisez une régression linéaire pour exprimer le maximal
montant annuel des frais postaux en fonction des Une scierie voisine envisage de faire une offre, mais
quantités vendues. Interprétez les coefficients de la pour cela il faut qu'elle tienne compte, dans son
droite de régression. calcul, du coût de revient de l'abattage et du
débardage, c'est-à-dire du transport du bois hors de la
3. Déduisez en les frais postaux à prévoir pour l’année
forêt. Ces frais peuvent varier et sont évalués soit à
6, si l’objectif de vente est de 4200 unités, en
l'heure de travail, soit au mètre cube de bois façonné
tenant compte d’une hausse des tarifs de 4 % par
au bord de la route. Le tableau suivant regroupe les
rapport à l’année 5.
données disponibles :

3.4 Scierie de Romme12


La commune de Nancy-sur-Cluses met en vente une
coupe de bois d'environ 1 000 m³.
La vente se fait selon la méthode dite de la "vente au
rabais" : un prix de départ est annoncé par un
"crieur", puis le prix est diminué de 1 000 € en
1 000 €, jusqu'à ce qu'un acheteur se manifeste. Bien
entendu, la commune se réserve le droit de retirer la
coupe de bois de la vente si le prix baisse au-dessous
d'un prix plancher, appelé "prix de retrait".

12
D’après un ancien sujet de BTS AC

Année universitaire 2022-2023 BFC, RL, OL, PS - 9/17


Coût d'abattage Nombre d'évaluer le prix le plus précisément ? Quel calcul
Nombre de m³ vous permettrait-il de confirmer vos
et de débardage d'heures
de bois observations ? faites-le et concluez.
(k€) passées
78 550 900 2. Etablissez l'équation de la droite d'ajustement
123 650 900 donnant le coût d'abattage et de débardage en
128 700 1500 fonction du critère choisi à la question
126 850 1400 précédente. Utilisez l’utilitaire d’analyse d’Excel
pour cette régression. Interprétez les coefficients
136 750 1100
de cette droite.
110 600 1200
3. En se basant sur les prix pratiqués dans ce passé
146 900 1400
récent, quel est le coût maximal que l'on peut
164 850 900 escompter, pour les frais d'abattage et de
98 600 650 débardage, pour la coupe en question ?
182 1050 1500 4. A quel prix le responsable de la scierie peut-il
100 650 600 soumissionner, s'il veut s'assurer une marge de
158 950 1600 10 % sur les ventes ? Appuyez-vous sur les
200 1200 2000 éléments suivants :
• Prix de vente sur le marché d'un m³ de bois
Travail à faire: scié: 800 € le m³
1. Pour discuter avec une équipe de bûcherons qui • Frais de transport de la forêt à la scierie: 20 €
se chargerait du travail, le responsable de la le m³
scierie veut savoir quel est le meilleur critère
• Frais de scierie: 60 € le m³
pour cerner à coup sûr son coût de revient.
Pouvez-vous dire, à l'aide de deux graphiques,
quel critère (m³ ou nombre d'heures), permet

Année universitaire 2022-2023 BFC, RL, OL, PS - 10/17


4 Régression linéaire : modèles,
modèles, régression multiple
4.1 Indication
Pour ce TD, munissez-vous d’un ordinateur exécutant 4.3 MaxMode14
Excel, avec l’utilitaire d’analyse activé. Une alternative MaxMode est une chaîne de magasins de mode pour
(conseillée) à l’utilitaire d’analyse est le complément à femme. Les dirigeants de la chaine souhaitent revoir le
Excel StatPlus (version light téléchargeable programme de fidélisation de la clientèle pour la
gratuitement- voir le cours) rentrée prochaine.
Dans un premier temps ils vous demandent d’analyser
le comportement des clientes concernant les bons de
4.2 Réparations 13 réductions. Ces bons de réductions sont envoyés aux
Un constructeur de machines-outils propose à ses clientes, selon un programme prédéfini, et elles
clients industriels un service de maintenance sur site, peuvent les présenter lors de leur passage en caisse.
ainsi qu'un service de réparation d'urgence. Les réductions de prix ainsi consenties varient de 5% à
Afin de mieux organiser la production de ce service et 50%.
mieux anticiper le temps passé par les techniciens
pour réparer une machine, les données suivantes ont Vous avez à votre disposition des informations sur 34
été recueillies. clientes concernant leurs achats sur une journée prise
Temps écoulé au hasard :
Temps
(en mois)
d'intervention Type de
depuis la

ancienneté
nécessaire panne

paiement
% remise
montant
dernière
cliente

(heures) achats

âge
intervention
TI TE TP
2.6 3 Electrique 1 150 15 35 2 visa
4.6 8 Mécanique 2 200 25 37 2 magasin
1 2 Mécanique 3 250 35 37 5 magasin
5.5 10 Mécanique 4 85 5 22 1 visa
… … … 5 80 5 20 1 visa
(La suite des données se trouve sur Ipagora) …..suite du fichier sur Ipagora.
… … …
3.5 7 Mécanique Ces informations portent sur les achats :
- Le montant des achats avant remise (en euros)
1. Dans un premier temps, ignorez le type de la - Le pourcentage de la remise qui sera appliquée
panne et déterminez une équation de régression - Le mode de paiement : carte du magasin ou
permettant d'estimer le temps d’intervention Y carte de paiement visa
des techniciens en fonction du nombre X1 de mois
écoulés depuis la dernière intervention. Qu’en Et sur les caractéristiques de la cliente :
pensez-vous ? Interprétez les coefficients de - L’âge en années
l’équation. - L’ancienneté dans le programme de fidélisation.
2. Dans un deuxième temps, établissez une
deuxième équation de régression permettant L’objectif est de comprendre et de quantifier l’impact
d’estimer Y en fonction de X1 et du nombre de éventuel de la remise consentie sur le montant
pannes (introduisez pour cela une nouvelle d’achats. Vous construirez pour cela un ou plusieurs
variable binaire, comme vous l’avez vu en cours). modèle de régression linéaire. Dans ce but, la variable
Interprétez les coefficients de l’équation. « paiement » sera représentée par une variable
Comparez les deux modèles. binaire que vous définirez.
Travail à faire :

13 14
B.F.C. Source ? S.S.

Année universitaire 2022-2023 BFC, RL, OL, PS - 11/17


1. Etudiez brièvement chaque variable. i. Vous sélectionnerez les
2. Etudiez brièvement les liens 2 à 2 des variables prédicteurs par la méthode
(matrice de corrélations, nuages de points) d’élimination progressive des
3. Construisez un modèle linéaire dont la variable variables. ( vous exclurez
expliquée est le montant d’achats. préalablement des prédicteurs la
a. Vous sélectionnerez les prédicteurs par la variable « Montant »)
méthode d’élimination progressive des ii. Commentez les graphiques de
variables, vue en cours. diagnostic donnés par Excel pour
b. Commentez les graphiques de diagnostic votre modèle final.
donnés par Excel pour votre modèle final. 5. Interprétez et commentez votre modèle final
4. Transformation des variables : On va tenter de Remarque : Il peut être utile d’éliminer les
construire un nouveau modèle en introduisant des logarithmes de l’équation de régression, de la
variables transformées : façon suivante :
a. Ajoutez au jeu de données les variables = + ⋅ ⟺
!⋅ "
transformées suivantes : = = = ⋅ #⋅ "
" !
Lmontant = log(montant d’achats) = ⋅$ % ⟺
Lremise = log(% remise) =& ⋅
Lage = log(âge)
Lancien = log(ancienneté)
b. Construisez un modèle linéaire dont la
variable expliquée est Lmontant (cad
log(montant d’achats))

Année universitaire 2022-2023 BFC, RL, OL, PS - 12/17


5 Séries chronologiques
– Moyennes mobiles

5.1 Le debit du Nil15


Le fichier de données (Excel) disponible sur
Ipagora/Moodle montre les mesures du débit annuel
du Nil à Assouan entre 1871 et 1970, en 10) *+ ,
(Cobb(1978), Tableau 1, p.249),
x y
1 1120
2 1160
3 963
… …

Lissez la série à l'aide de moyennes mobiles et aidez-


vous de ce lissage pour décrire l'évolution de ce débit.
(expérimentez pour déterminer un ordre convenable
pour les moyennes mobiles). Commentez

5.2 Ventes semestrielles16


Une société considère l'évolution des ventes de l'un
de ses produits durant les quatre dernières années.
Ces ventes sont données dans le tableau ci-dessous.

A1 A2 A3 A4
Semestre 1 310 321 327 340
Semestre 2 616 601 655 612

1. Quelle est la nature de cette série


chronologique ? Lissez la série à l’aide de
moyennes mobiles d’ordre approprié.
Commentez.

15
Balke, N. S. (1993). Detecting level shifts in time Cobb, G. W. (1978). The problem of the Nile: conditional
series. Journal of Business and Economic Statistics, 11, 81– solution to a change-point problem.Biometrika 65, 243–51.
92. doi: 10.2307/1391308. doi: 10.2307/2335202.
16
B.F.C. Source ?

Année universitaire 2022-2023 BFC, RL, OL, PS - 13/17


1. Quelles remarques l’examen de ce graphique
6 Séries chronologiques-
chronologiques- suggère-t-il concernant la tendance et la
saisonnalité de la série ?
Saisonnalité 2. On cherche à analyser la saisonnalité de la série.
On utilisera pour cela un modèle multiplicatif. On
lissera pour cela la série par la méthode des
6.1 Ventes semestrielles17 moyennes mobiles (moyennes mobiles centrées
calculées sur 4 trimestres consécutifs).
(suite du TD précédent)
Les résultats obtenus lors du calcul de ce lissage
Une société considère l'évolution des ventes de l'un
sont présentés dans le tableau ci-dessous, à
de ses produits durant les quatre dernières années.
l’exception des dernières valeurs :
Ces ventes sont données dans le tableau ci-dessous.

trimestre
Année
A1 A2 A3 A4 Moyennes mobiles

Y
centrées
Semestre 1 310 321 327 340
Semestre 2 616 601 655 612
T1 1 185
T2 2 218
1. Quelle est la nature de cette série 2020
T3 3 174 224.875
chronologique ? Lissez la série à l’aide de
moyennes mobiles d’ordre approprié. (déjà fait) T4 4 342 218.125
2. Déterminez les coefficients saisonniers T1 5 146 219.125
semestriels T2 6 203 217.875
2021
3. Si cette évolution se poursuit, donnez une T3 7 197 213.375
estimation des ventes pour chacun des deux T4 8 309 212
semestres de 2020. Que pensez-vous de ces
T1 9 143 ?
prévisions ?
T2 10 195 ?
2022
T3 11 161
6.2 Chiffre d’affaires18 T4 12 293
Au cours des trois derniers exercices, le chiffre Pourquoi utilise-t-on des moyennes mobiles
d’affaires trimestriel d'une entreprise a évolué comme d’ordre 4 ?
suit : Calculez les valeurs manquantes du tableau
2020 2021 2022 (signalées par un point d’interrogation dans ce
tableau).
1er trimestre 185 146 143
2è trimestre 218 203 195 3. Déterminez la saisonnalité de la série en calculant
3è trimestre 174 197 151 les coefficients saisonniers.
4è trimestre 342 309 293 4. Interprétez ensuite ces coefficients : Pour cette
entreprise, à quelle époque de l’année se situe à
votre avis la haute saison ? la basse saison ? Que
veut dire précisément le coefficient saisonnier
calculé pour le trimestre 3 ?
5. Désaisonnalisez la série et représentez les chiffres
d’affaires corrigés des variations saisonnières sur
un graphique. Qu’en concluez-vous ?
6. En supposant que l’évolution de ces chiffres
d’affaires dessaisonnalisés constatées sur les trois
dernières années se poursuive de la même façon
en 2022, donnez une estimation pour le chiffre
d’affaires de chacun des deux premiers trimestres
de 2022.

17 18
B.F.C. Source ? Examen Ipag

Année universitaire 2022-2023 BFC, RL, OL, PS - 14/17


années mois commandes
7 Séries chronologiques-
chronologiques- 2021 novembre 25
décembre 29
Lissages exponentiels 2022 janvier 24
février 21
mars 26
7.1 Champi19 avril 23
On dispose du chiffre d’affaires, en milliers mai 27
d’euros, réalisé par la société Champi, sur les juin 25
8 derniers mois. juillet 21
Mois Rang Chiffre d’affaires août 24
avril 1 39
mai 2 52 Vous numéroterez les mois de 1 à 10. Vous souhaitez
juin 3 52 établir une prévision pour septembre et octobre 2022.
juillet 4 39 La représentation graphique des ventes dont vous
août 5 26 disposez est donnée ci-dessous :
septembre 6 26
octobre 7 39
novembre 8 39
Commandes
40

1. Représentez graphiquement l’évolution de ce 30


chiffre d’affaires sur les 8 derniers mois.
20
2. On souhaite établir une prévision pour les deux
prochains mois. Un lissage exponentiel simple est- 10
il adapté ? Pourquoi ? 0
3. En utilisant un lissage exponentiel simple avec 0 2 4 6 8 10 12
une constante de 0.3, établissez les prévisions de
chiffre d’affaires pour les deux mois suivants.
4. Positionnez-les sur le graphique et commentez vos 1. Un lissage exponentiel simple est-il adapté ?
résultats. Pourquoi ou pourquoi pas ?
2. En utilisant un lissage exponentiel simple avec une
constante de lissage α = 0,4, établissez les
prévisions du nombre de commandes pour chacun
7.2 ParfumS20 des deux mois suivants.
Le directeur de la société ParfumS.com vous
communique les commandes effectuées par les clients
sur son site internet (en milliers d’unités).
Vous disposez des commandes sur fin 2021 et une
partie de l’année 2022.

19 20
S.S. S.S. Examen Ipag

Année universitaire 2022-2023 BFC, RL, OL, PS - 15/17


Annexe : Table de la distribution inverse du χ²

La table donne les valeurs de χ² ayant la probabilité p d'être dépassées.

p 0.9 0.7 0.5 0.3 0.2 0.1 0.05 0.02 0.01


Degrés de
Valeurs de Chi²
liberté
1 0.0158 0.1485 0.4549 1.0742 1.6424 2.7055 3.8415 5.4119 6.6349
2 0.2107 0.7133 1.3863 2.4079 3.2189 4.6052 5.9915 7.8241 9.2104
3 0.5844 1.4237 2.3660 3.6649 4.6416 6.2514 7.8147 9.8374 11.3449
4 1.0636 2.1947 3.3567 4.8784 5.9886 7.7794 9.4877 11.6678 13.2767
5 1.6103 2.9999 4.3515 6.0644 7.2893 9.2363 11.0705 13.3882 15.0863
6 2.2041 3.8276 5.3481 7.2311 8.5581 10.6446 12.5916 15.0332 16.8119
7 2.8331 4.6713 6.3458 8.3834 9.8032 12.0170 14.0671 16.6224 18.4753
8 3.4895 5.5274 7.3441 9.5245 11.0301 13.3616 15.5073 18.1682 20.0902
9 4.1682 6.3933 8.3428 10.6564 12.2421 14.6837 16.9190 19.6790 21.6660
10 4.8652 7.2672 9.3418 11.7807 13.4420 15.9872 18.3070 21.1608 23.2093
11 5.5778 8.1479 10.3410 12.8987 14.6314 17.2750 19.6752 22.6179 24.7250
12 6.3038 9.0343 11.3403 14.0111 15.8120 18.5493 21.0261 24.0539 26.2170
13 7.0415 9.9257 12.3398 15.1187 16.9848 19.8119 22.3620 25.4715 27.6882
14 7.7895 10.8215 13.3393 16.2221 18.1508 21.0641 23.6848 26.8727 29.1412
15 8.5468 11.7212 14.3389 17.3217 19.3107 22.3071 24.9958 28.2595 30.5780
16 9.3122 12.6243 15.3385 18.4179 20.4651 23.5418 26.2962 29.6332 31.9999
17 10.0852 13.5307 16.3382 19.5110 21.6146 24.7690 27.5871 30.9950 33.4087
18 10.8649 14.4399 17.3379 20.6014 22.7595 25.9894 28.8693 32.3462 34.8052
19 11.6509 15.3517 18.3376 21.6891 23.9004 27.2036 30.1435 33.6874 36.1908
20 12.4426 16.2659 19.3374 22.7745 25.0375 28.4120 31.4104 35.0196 37.5663
21 13.2396 17.1823 20.3372 23.8578 26.1711 29.6151 32.6706 36.3434 38.9322
22 14.0415 18.1007 21.3370 24.9390 27.3015 30.8133 33.9245 37.6595 40.2894
23 14.8480 19.0211 22.3369 26.0184 28.4288 32.0069 35.1725 38.9683 41.6383
24 15.6587 19.9432 23.3367 27.0960 29.5533 33.1962 36.4150 40.2703 42.9798
25 16.4734 20.8670 24.3366 28.1719 30.6752 34.3816 37.6525 41.5660 44.3140
26 17.2919 21.7924 25.3365 29.2463 31.7946 35.5632 38.8851 42.8558 45.6416
27 18.1139 22.7192 26.3363 30.3193 32.9117 36.7412 40.1133 44.1399 46.9628
28 18.9392 23.6475 27.3362 31.3909 34.0266 37.9159 41.3372 45.4188 48.2782
29 19.7677 24.5770 28.3361 32.4612 35.1394 39.0875 42.5569 46.6926 49.5878
30 20.5992 25.5078 29.3360 33.5302 36.2502 40.2560 43.7730 47.9618 50.8922

Année universitaire 2022-2023 BFC, RL, OL, PS - 16/17


Table de la fonction de répartition de la loi normale
centrée réduite

La table donne la probabilité d'une valeur inférieure à t : π(t) = p(T < t)


t 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
Intervalles de confiance/ de prévision bilatéraux : valeurs critiques de t pour des seuils usuels de probabilité/de
confiance
Seuil de probabilité / de confiance 90% 95% 99%
Critical value of t 1.65 1.96 2.58

Année universitaire 2022-2023 BFC, RL, OL, PS - 17/17

Vous aimerez peut-être aussi