Académique Documents
Professionnel Documents
Culture Documents
Plan 1 Description de 2 variables quantitatives 2 Rgression simple 2.1 Rappels sur l'ajustement linaire 2.2 Autres types d'ajustement 2.3 Mesure de la qualit de la rgression 2.4 Jugement sur chantillon 3 Exemples 4 Rgression multiple
Dans le chapitre sur le test du khi-deux, nous avons tudi les liaisons entre deux caractres qualitatifs. Ici, nous nous intresserons aux liaisons entre des caractres quantitatifs : (d'abord 2 : c'est la rgression simple ; puis plus de 2 : c'est la rgression multiple) Tout d'abord, nous essaierons de dcrire ces liaisons, puis nous proposerons des modles explicatifs.
1 2 2 4 5 6 8 14
Station 1 2 3 4 5 6
Nuage de points
Description des C.A. en fonction du trafic
3000
2500
2000
1500
1000
500
2. Rgression simple
2.1 Rappels sur l'ajustement linaire
Lorsque l'allure du nuage de points le commande, on ralise un "ajustement linaire" On fait passer une droite "au mieux" dans un nuage de points. Y = b0 + b1 X Chaque point correspond un couple (xi, yi) de valeurs des variables X et Y. yci est la valeur calcule l'aide de la droite partir de xi yci = b0 + b1 xi
On trouve
b1 = c o v ( X , Y ) v a r (X ) =
( x
i= 1 n
- x) ( y
i
- y)
( x
i=1
- x) 2
b0 = y - b 1 x xe s t lam o ye s t lam y e n n ed e s o y e n n ed e s xi yi
Exemple :
Station 1 2 3 4 5 6
CA CA calc 2200 1928.75 750 997.42 2500 2614.98 1450 1732.68 1800 1389.56 1500 1536.61
rsidu
271.25 -247.42 -114.98 -282.68 410.44 -36.61
CA en fonction du trafic
3000 2500 2000 1500 1000 500 0 40 60 80 100 120 140 160 180 200 220 240 CA Linear Regression for CA CA calc f(x) = 9.8x + 458.24 R = 0.79
SAVOIR-FAIRE EXCEL
La droite des moindres carrs peut tre dtermine par EXCEL avec les fonctions matricielles : TENDANCE et DROITEREG Le moyen le plus simple est cependant de "coller directement" la droite sur le graphique (slectionner la srie de donnes et choisir l'option "ajouter une courbe de tendance" dans le menu contextuel) et d'afficher l'quation et le coefficient de dtermination (options). Il existe aussi un utilitaire d'analyse : Rgression linaire
Usage de la fonction matricielle : DROITEREG La plage ci-dessous, (nomme : RESULT), contient certains rsultats importants fournis par EXCEL La premire cellule (en haut gauche), correspond la pente de la droite. La deuxime (en haut, droite), correspond au second membre.
les autres cellules sont expliques par des commentaires, nous y reviendrons par la suite.
Ve r = ----Vt Vt
V t
( y i - y) 2 = n i
V e
(y ci - y) 2 = n i
Vr =
e2 (y i - yci ) 2 = i n n i
Le coefficient de dtermination mesure la part de la variance totale qui est explique par la rgression Ve r = ----Vt Vt
Le coefficient de corrlation est gale la racine carre du coefficient de corrlation. Le coefficient de corrlation (tout comme le coefficient de dtermination) permet de juger de l'intensit de la relation existant entre les variables. Attention, il peut tre ngatif ! (il est du signe de b1). Plus il est proche de -1, plus l'intensit de la relation est ngativement forte Plus il est proche de 1, plus l'intensit de la relation est positivement forte Plus il est proche de 0, plus l'intensit de la relation est faible.
SAVOIR-FAIRE EXCEL
utiliser les fonctions COEFFICIENT.CORRELATION COEFFICIENT.DETERMINATION
Echantillon Y = b 1 X + b0
yi = b1 xi + b0 + ei
Echantillon Y = b 1 X + b0
yi = b1 xi + b0 + ei
Population Y = 1 X + 0 1 0 yii = 1 x + 0 + ii 1 ii 0
i /(n-2)
Ce modle peut tre test de diffrentes manires : nous en prsenterons deux ici : le test de Student sur la pente et le test de Fischer.
valeur valeur donne donne par par EXCEL EXCEL (lig.2, (lig.2, col.1) col.1) tt correspond correspond la la loi loi de de Student Student n-2 n-2 d.d.l d.d.l
b1 t sb 1 1 b1
valeur valeur donne donne par par EXCEL EXCEL (lig.2, (lig.2, col.1) col.1) tt correspond correspond la la loi loi de de Student Student n-2 n-2 d.d.l d.d.l
b1 t sb 1 1 b1
sb 1 =
( n -2 )
e ( x
i 2 i i
- x) 2
on peut tester l'hypothse (H0) : 9.8 2.52 0.05 2.78 borne inf. borne sup 2.81 16.79
"b1 = 0"
dcision 0 n'est pas dans l'intervalle, donc on peut rejeter (H0) au seuil choisi. c'est dire avec au plus 5.00% de risque d'erreur Variante mthodologique On peut directement calculer le rapport b1 / Sb1 = et en appliquant le fonction STUDENT, dterminer la p-valeur p= Dcision: 0.02 pour un test bilatral. Puisque la p-valeur est infrieure au seuil de 5%, on peur rejeter (H0) 3.89
2.4.2Test de FISCHER
La valeur du F de FISCHER est donne dans le tableau RESULT (lig. 4, col. 1) Remarque Avec Excel, on peut galement utiliser l'utilitaire d'analyse qui donne directement tous les tests.
Probabilit 0.25
Limite infrieure pour seuil de Limite suprieure confiance = pour seuil de 95,0% confiance = 95,0% -496.69 2.81 1413.16 16.79
0.02
Exemples
Taux d'intrt
frais
12 10
Comparaison de prts
Classeur : "COREG" - Feuille "cours" Page 8
Alaska USA FCU Amco Mortgage American Builders ARCS Mortgage Bay Mortgage Benjamin Franklin Cambelco Motgage Cascade Pacific Mortgage Cascade S&L Center Mortgage Centrust Mortgage Chase Manhattan Citified Mortgage Coast Exchange Columbia Federal
10.25 10.13 10.25 10.2 10.25 10.25 10.13 10.13 10.25 10.13 10.5 10.88 10.25 10.25 10.5
Comparaison de prts
12 10 8 6 4 2 0 0 2 4 6 8 10 12
taux d'intrt
frais d'entre
r=
-0.441
Exemple 3
L'effet "mmoire" des marchs financiers
On souhaite savoir si un march financier a une "mmoire", autrement dit s'il existe une liaison entre les variations d'un jour et les variations de la veille. Les donnes suivantes reprsente la variation (en relatif) du Dow Jones sur une dure de 2 mois.
Aujourd'hui
Hier
July 2, 1987 -0.29 0.83 0.58 -0.52 0.2 -0.12 1.16 0.1 0.53 0.52 -0.89 -0.8 0.09 0.07 0.54 0.35 1.04 0.78 1.1 0.18 -0.58 -0.41
1.12 -0.29 0.83 0.58 -0.52 0.2 -0.12 1.16 0.1 0.53 0.52 -0.89 -0.8 0.09 0.07 0.54 0.35 1.04 0.78 1.1 0.18 -0.58
10
8 Aujourd'hui
0 0 2 4 6 Hier 8 10 12
r=
0.043
Exemple 4
Les options
Acheter une option revient acqurir un droit d'acheter (par exemple une action), un certain prix appel prix d'exercice. Ce droit peut tre exerc toute date antrieure la date d'expiration de l'option. Les donnes suivantes correspondent un chantillon de 10 options.
Les options
Prix de l'option
12 10 Prix de l'option 8 6 4 2 0 220 270 320 Prix d'exercice 370 420 470
230 245 250 255 260 265 270 275 280 285
Les donnes sont issues de The Wall Street Journal, November 9, 1988, p.C15.
r=
-0.962
Exemple 5
Temprature et rendement d'un process industriel
Les donnes suivantes correspondent une exprience destine trouver la temprature donnant le meilleur rendement pour un process industriel.
Tempr ature
Rendement
Rendement et temprature
240 220 200 180 160 140 120 580 680 780 880 980 1080 1180
600 625 650 675 700 725 750 775 800 825 850
127 139 147 147 155 154 153 148 146 136 129
r=
-0.02
Exemple 6
Quantit produite et cot
On souhaite tudier la liaison entre le nombre de pices produites chaque semaine dans une usine, et le cot total de la production.
Quanti t
Cot 12
22 30 26 31 36 30 22 45 38 3 30 38 41 27 28 31 37
3.47 3.78 3.86 3.91 4.49 3.88 3.22 4.58 4.33 14.13 3.59 4 4.16 3.67 3.89 3.57 4.5
r=
-0.62
32 41
3.81 4.43
r=
0.87
Exemple 7
Location d'appartements
Voici un ensemble de donnes qui semble contredire tous les principes conomiques !
Pourcentage de non-occupation Loyer mensuel 4.80% 378 5.30% 368 1.30% 348 4.90% 391 4.20% 463 3.60% 581 4.40% 483 3.50% 363 5.00% 395 10.10% 301 4.80% 406 8.30% 449 4.50% 403 6.30% 400 2.30% 429 4.40% 424 1.50% 561 0.40% 572 1.40% 443 6.40% 472 3.70% 433 3.20% 423 3.30% 428 15.70% 341 3.90% 501 6.00% 416 4.70% 381 4.30% 430 3.90% 355 6.10% 381 4.70% 428
Airport Auburn Ballard Beacon Hill Bellevue-East Bellevue-West Bothel/juanita Burien Capitol Hill/Eastlake Central Des Moines Downtown Seattle Federal Way First Hill Greenlake/Wall Kent Kirkland Madison/leschi Magnolia Mercer Island North King Co. North Seattle Queen Anne Rainnier Valley Redmond Renton Riverton/tukwila Universty West Seattle White Center King Country
Les appartements
12 10 8 6 4 2 0 300 350 400 450 500 550 600 loyer mensuel en dollars
taux de non-occupation
r=
-0.47
4. Rgression multiple
Lorsqu'un phnomne quantifiable s'explique en faisant appel plus d'un facteur explicatif, on peut utiliser la rgression multiple.
Exemple 8 Une entreprise a organis une campagne promotionnelle sur un territoire divis en 8 secteurs. Le directeur, voulant tester l'efficacit du mix promotionnel, se fait communiquer le volume des ventes et le budget de publicit de chacun des 8 secteurs. Il obtient le tableau suivant : VENTES PUB VISITES
1 2 3 4 5 6 7 8
75 76 82 82 76 83 76 74
26 28 34 31 29 36 25 23
Utilisation de DROITEREG 1.02 0.34 0.87 17 81.95 0.08 40.67 0.1 18.75 1.55 #N/A 5 #N/A 12.05 #N/A
Exemple 1
Exemple 1 Une companie ptrolire dcide d'implanter de nouvelles stations-service. On mesure sur 6 stations le trafic observ (Variable X =nombre moyen de voiture pa ainsi que le C.A. moyen ralis en une heure (variable Y). Station 1 2 3 4 5 6 Trafic 150 55 220 130 95 110 CA 2200 750 2500 1450 1800 1500
Page 17
Exemple 1
Page 18
Exemple 2
Exemple 2
Les cots de crdit
Lorsque vous contractez un emprunt auprs d'une banque, il y a diffrents types de cots. Nous considrons ici : - le taux d'intrt (un pourcentage) - le cot d'entre (un pourcentage du montant emprunt) On dsire tudier la relation entre ces deux pourcentages partir d'un chantillon de 66 banques.
Taux d'intrt
frais
Alaska USA FCU Amco Mortgage American Builders ARCS Mortgage Bay Mortgage Benjamin Franklin Cambelco Motgage Cascade Pacific Mortgage Cascade S&L Center Mortgage Centrust Mortgage Chase Manhattan Citified Mortgage Coast Exchange Columbia Federal Columbia Services Commonwealth Mortgage Continental Motgage Crossland Mortgage Direct Mortgage Services Family Savings Far West Mortgage First Fed Savings of WA First Interstate Fireman's Fund Mortgage First Mutual First Union Mortgage Fleet Mortgage Corp GMAC Mortgage Goldome Rainier Great American Bank Great NW Federal S&L Great Pacific Mortgage Great Western Bank Hallmark Mortgage Hoover Mortgage
10.25 10.13 10.25 10.2 10.25 10.25 10.13 10.13 10.25 10.13 10.5 10.88 10.25 10.25 10.5 10.5 10.25 10.25 10.25 10.25 10.38 10.13 10.38 10.38 10.13 10.25 10.25 10.38 10.13 9.88 10.5 10.25 10.25 10.7 10.25 10.13
2 1.95 2 2 2 1.5 2 2 1.5 2.5 1.13 2 2 2 2 2 1.5 2 2.75 2 2 2 1.5 2 2.25 2 2.25 2.5 2.5 3.38 1.5 2 2 2 2 2
Page 19
Exemple 2
ICA Mortgage Key Pacific Mortgage Metropolitan Federal Mornet of WA Mortgage Brokers Mt. Baker Bank Norwest Mortgage Old Stone Bank Olympic Savings bank Pacific First Mortgage Pacific R.E. Mortgage Pioneer Federal Savings Principal Financial Pacific West Mortgage Rainier Bank Seafirst Home Loans Sears Mortgage Summit Savings Security Pacific N.B. Shearson Lehman Standard Green Mortgage Sterling Mortgage U.S. Bankcorp Mortgage United Pacific Mortgage University Fed Savings University Mortgage Valley Mortgage Washington Mutual Weyerhaeuser Willamette Financial
10.25 10.25 10.13 10.25 10.25 10.38 10.25 10 10.25 10.25 10.38 10.38 10.25 10.13 10.5 10.38 10.25 10.5 10.5 10.38 10.25 10.13 10.38 10.13 10.25 10.25 10.25 10.5 10.25 10.38
Les donnes sont issues de "How the Summer rates" Seattle Times, July 3 1988, p. D1. Sources : Scotsman Publishing's Electronic Bulletin et Western Wahington Bulletin.
Page 20
Exemple 3
Exemple 3
L'effet "mmoire" des marchs financiers
On souhaite savoir si un march financier a une "mmoire", autrement dit s'il existe une liaison entre les variations d'un jour et les variations de la veille. Les donnes suivantes reprsente la variation (en relatif) du Dow Jones sur une dure de 2 mois.
Aujourd'hui Hier
July 2, 1987
-0.29 0.83 0.58 -0.52 0.2 -0.12 1.16 0.1 0.53 0.52 -0.89 -0.8 0.09 0.07 0.54 0.35 1.04 0.78 1.1 0.18 -0.58 -0.41 0.78 1.07 -0.09 1.69 1.69 -0.42 0.83 -0.23 0.56 -1.7 0.42 1.54 0.1 -0.46 0.94 -0.76 -0.99 -1.33 0.89
1.12 -0.29 0.83 0.58 -0.52 0.2 -0.12 1.16 0.1 0.53 0.52 -0.89 -0.8 0.09 0.07 0.54 0.35 1.04 0.78 1.1 0.18 -0.58 -0.41 0.78 1.07 -0.09 1.69 1.69 -0.42 0.83 -0.23 0.56 -1.7 0.42 1.54 0.1 -0.46 0.94 -0.76 -0.99 -1.33
Page 21
Exemple 4
Exemple 4
Les options
Acheter une option revient acqurir un droit d'acheter (par exemple une action), un certain prix appel prix d'exercice. Ce droit peut tre exerc toute date antrieure la date d'expiration de l'option. Les donnes suivantes correspondent un chantillon de 10 options.
Prix d'exercice Prix de l'option
230 245 250 255 260 265 270 275 280 285
Les donnes sont issues de The Wall Street Journal, November 9, 1988, p.C15.
Page 22
Exemple 5
Exemple 5
Temprature et rendement d'un process industriel
Les donnes suivantes correspondent une exprience destine trouver la temprature donnant le meilleur rendement pour un process industriel.
Temprature Rendement
600 625 650 675 700 725 750 775 800 825 850
127 139 147 147 155 154 153 148 146 136 129
Page 23
Exemple 6
Exemple 6
Quantit produite et cot
On souhaite tudier la liaison entre le nombre de pices produites chaque semaine dans une usine, et le cot total de la production.
Production hebdomadaire
Quantit Cot
22 30 26 31 36 30 22 45 38 30 38 41 27 28 31 37 32 41
3.47 3.78 3.86 3.91 4.49 3.88 3.22 4.58 4.33 3.59 4 4.16 3.67 3.89 3.57 4.5 3.81 4.43 x
Page 24
Exemple 7
Exemple 7
Les locations d'appartement le taux d'occupation
Pourcentage de non-occupation
Loyer mensuel
Airport Auburn Ballard Beacon Hill Bellevue-East Bellevue-West Bothel/juanita Burien Capitol Hill/Eastlake Central Des Moines Downtown Seattle Federal Way First Hill Greenlake/Wall Kent Kirkland Madison/leschi Magnolia Mercer Island North King Co. North Seattle Queen Anne Rainnier Valley Redmond Renton Riverton/tukwila Universty West Seattle White Center King Country
4.80% 5.30% 1.30% 4.90% 4.20% 3.60% 4.40% 3.50% 5.00% 10.10% 4.80% 8.30% 4.50% 6.30% 2.30% 4.40% 1.50% 0.40% 1.40% 6.40% 3.70% 3.20% 3.30% 15.70% 3.90% 6.00% 4.70% 4.30% 3.90% 6.10% 4.70%
378 368 348 391 463 581 483 363 395 301 406 449 403 400 429 424 561 572 443 472 433 423 428 341 501 416 381 430 355 381 428
Page 25
Exemple 8
Exemple 8 Une entreprise a organis une campagne promotionnelle sur un territoire divis en 8 secteurs. Le directeur, voulant tester l'efficacit du mix promotionnel, se fait communiquer le volume des ventes et le budget de publicit de chacun des 8 secteurs. Il obtient le tableau suivant :
VENTES PUB VISITES
1 2 3 4 5 6 7 8
75 76 82 82 76 83 76 74
26 28 34 31 29 36 25 23
Page 26
RAPPORT DTAILL Statistiques de la rgression Coefficient de dtermination 0.87 multiple Coefficient de dtermination 0.76 R^2 Coefficient de dtermination 0.74 R^2 Erreur-type 638.07 Observations 34
ANALYSE DE VARIANCE 0 Degr de libert Somme des carrs Moyenne des carrs F Valeur critique de F Rgression 2 ### ### -500 48.48 0 Rsidus 31 ### 407127.31 -1000 Total 33 ### Coefficients 5837.52 -53.22 3.61
Erreur-type Statistique Limite t Probabilit infrieure Limite pour suprieure seuil de confiance pour seuil = de 95% confiance = 9 628.15 9.29 -2000 0 4556.4 7118.64 6.85 -7.77 55 0 60 -67.19 65 70 -39.24 75 80 0.69 5.27 0 2.22 5.01
-1500
Price
ANALYSE DES RSIDUS ObservationPrvisions Sales 1 3420.31 2 3420.31 3 3420.31 4 3420.31 5 4142.92 6 4142.92 7 4142.92 8 4142.92 9 4865.53 10 4865.53 11 4865.53 12 4865.53 13 2355.96 14 2355.96 15 2355.96 16 2355.96 17 3078.57 18 3078.57 19 3078.57 20 3078.57 21 3801.19 22 3801.19 23 3801.19 24 3801.19 25 1291.62 26 1291.62 27 1291.62 Rsidus Rsidus normaliss 720.69 1.17 421.69 0.68 -364.31 -0.59 98.69 0.16 83.08 0.13 487.08 0.79 -635.92 -1.03 -388.92 -0.63 134.47 0.22 254.47 0.41 -854.53 -1.38 149.47 0.24 -439.96 -0.71 -1680.96 -2.72 1280.04 2.07 868.04 1.4 -783.57 -1.27 -348.57 -0.56 -460.57 -0.74 1342.43 2.17 311.81 0.5 -55.19 -0.09 -269.19 -0.44 23.81 0.04 -195.62 -0.32 -530.62 -0.86 796.38 1.29
RPARTITION DES PROBABILITS Centile 1.47 4.41 7.35 10.29 13.24 16.18 19.12 22.06 25 27.94 30.88 33.82 36.76 39.71 42.65 45.59 48.53 51.47 54.41 57.35 60.29 63.24 66.18 69.12 72.06 75 77.94 Sales 675 761 820 1096 1602 1882 1916 2088 2114 2159 2295 2618 2730 2927 3056 3224 3354 3507 3519 3532 3636 3746 3754 3825 3842 4011 4113
28 29 30 31 32 33 34
Promotion Courb
4000 300 350 4006000 450 500 550 2000 Promotion 4000 60 65 70 75 80 85 90 95 0 Price 2000 150 200 250 300 350 400 Promotion 0 0 20 Sales
nfrieure Limite pour suprieure seuil de confiance pour seuil = de 95,0% confiance = 95,0% 4556.4 7118.64 -67.19 70 75 80 85 -39.24 90 95 100 2.22 5.01
105
Price
S PROBABILITS
ue des rsidus
Column B 4006000 450 500 550 600 650 tion 4000 75 80 85 90 95 100 105 Price 2000 00 250 300 350 400 450 500 550 600 650 Promotion 0 0 20 40 60 Centile
Sales
80
100
120
Sales 4141 3842 3056 3519 4226 4630 3507 3754 5000 5120 4011 5015 1916 675 3636 3224 2295 2730 2618 4421 4113 3746 3532 3825 1096 761 2088 820 2114 1882 2159 1602 3354 2927
Price 59 59 59 59 59 59 59 59 59 59 59 59 79 79 79 79 79 79 79 79 79 79 79 79 99 99 99 99 99 99 99 99 99 99
Promotion 200 200 200 200 400 400 400 400 600 600 600 600 200 200 200 200 400 400 400 400 600 600 600 600 200 200 200 200 400 400 400 400 600 600
Constante 3420.31 -720.69 Price 3420.31 -421.69 Promotion 3420.31 364.31 3420.31 -98.69 4142.92 -83.08 4142.92 -487.08 4142.92 635.92 2000 4142.92 388.92 4865.53 -134.47 1500 4865.53 -254.47 4865.53 854.53 1000 4865.53 -149.47 2355.96 439.96 500 2355.96 1680.96 0 2355.96 -1280.04 2355.96 -868.04 -500 3078.57 783.57 3078.57 348.57 -1000 3078.57 460.57 -1500 3078.57 -1342.43 3801.19 55 60 -311.81 65 70 75 80 3801.19 55.19 3801.19 269.19 3801.19 -23.81 1291.62 195.62 1291.62 530.62 1291.62 -796.38 1291.62 471.62 2014.23 -99.77 2014.23 132.23 2014.23 -144.77 2014.23 412.23 2736.84 -617.16 2736.84 -190.16
85
90
95
100
105
-500 -1000
90
95
100
105
95
100
105
Exercice
Exercice
On a pris un chantillon de 24 voitures de mme modle, mais d'ges diffrents, qui on t vendues rcemment. Les donnes suivantes correspondent aux ges des 24 vhicules, et leurs prix de vente.
Age 1 3 5 2 8 2 3 1 6 7 4 8 5 1 5 3 6 6 7 4 7 8 4 2
1 Dcrire ces donnes
Prix 119,400 73,200 51,000 91,800 36,600 102,000 73,800 120,600 42,600 39,600 61,800 31,200 48,600 126,000 52,800 70,200 43,200 53,400 40,800 63,400 36,000 33,000 64,800 93,000
Page 36
Exercice
Testez l'hypothse d'absence de liaison 3 Proposez un ajustement exponentiel Comparez ces deux ajustements
Page 37