Vous êtes sur la page 1sur 8

Universit De Bretagne Du Sud Ecole Nationale Suprieure D'ingnieurs De Bretagne-Sud

Compte Rendu : Travaux Pratique Statistique uni varie et bivarie

Ralis par AL ECHCHEIKH EL ALOUI Adnane Anne Universitaire 2010/2011

Ludovic Billot

Encadr par

1. Les donnes On va saisir une table qui fournit les caractristiques de cylindre, de vitesse, de poids et de largeur de 24 modles de voiture.

modele

cylindre vitesse loids largeur

modele={'Honda Civic';'Renault 19';'Fiat Tipo';'Peugeot 405';'Renault 21';'Citron BX';'BMW 530i';'Rover 827i';'Renault 25';'Opel Omega';'Peugeot 405 Break';'Ford Sierra';'BMW 325iX';'Audi 90 Quattro';'Ford Scorpio';'Renault Espace';'Nissan Vanette';'VW Caravelle';'Ford Fiesta';'Fiat Uno';'Peugeot 205';'Peugeot 205 Rallye';'Seat Ibiza I';'Citron AX Sport'} cylindre=[1396;1721;1580;1769;2068;1769;2986;2675;2548;1998;1905;1993;2494;1994;293 3;1995;1952;2109;1117;1116;1580;1294;1461;1294] vitesse=[174;180;170;180;180;182;226;222;226;190;194;185;208;214;200;177;144;149;135;1 45;159;189;181;184] >>Poids=[850;965;970;1080;1135;1060;1510;1365;1350;1255;1120;1190;1300;1220;1345;12 65;1430;1320;810;780;880;805;925;730] largeur=[166;169;170;169;170;168;175;175;180;177;171;172;164;169;176;177;169;184;162; 155;156;157;161;160]

Concatnation des variables quantitatives donnee=[cylindre vitesse Poids largeur];

2. Statistique descriptive commande mean >> moyenne=mean(donnee) moyenne = 1.0e+003 * 1.9061 0.1831 1.1108 0.1688 std >> ecarttype=std(donnee) ecarttype = 527.9087 25.2154 230.2912 7.6537 >> mediane=median(donnee) mediane = 1.0e+003 * 1.9285 0.1815 1.1275 0.1690 >> quantile50=quantile(donnee,0.50) quantile50 = 1.0e+003 * 1.9285 0.1815 1.1275 0.1690 >> interquartile=iqr(donnee) interquartile = 568.0000 25.0000 407.5000 12.0000

description M = moyenne (A) renvoie les valeurs moyennes des lments le long de diffrentes dimensions d'un tableau. (pour que la valeur soit plus explicite on multiplier 1.0e+003 * 1.9061 )

median

median(donnee)renvoie les valeurs mdianes des lments le long de diffrentes dimensions d'un tableau. Qui permet de partager chaque tableau en deux parties

quantile

Il dcile les lments On remarque que les valeurs sont quivalentes

iqr

1) La reprsentation par histogramme La premire opration est de dterminer le nombre de classes de lhistogramme.

>> k=1+3.3*log10(24) (Sturges)

hist(cylindre,k)

hist(vitesse,k) classe modale 180

hist(poids,k)

hist(largeur,k)

Une reprsentation par box-plot La distribution est dcompose en 4 zones de mme effectif 25%, (la mdiane est en rouge)
230 220 210 200 190 180 170 160 150 140

3000 2800 2600 2400 2200 2000 1800 1600 1400 1200 1

boxplot(cylindre) le quart des voitures de cylindre faible est moins que le dernier quart

boxplot(vitesse)

185
1500 1400 1300

180

175
1200 1100 1000 900

170

165

160
800 700 1

155 1

boxplot(poids)

boxplot(largeur) le moustaches est symtriques

Il ya une valeur "atypiques", c'est--dire une valeur extrmement diffrentes des autres et on remarque un plus rouge dans bote moustache de cylindre Dans ce cas on peut supprimer cette valeur Calcul des indices dasymtrie et daplatissement Le rcapitulatif des rsultats obtenus: Cylindre Asymtrie Aplatissement 0.4632 2.5135 Vitesse -0.0394 2.4670 Poids -0.0958 1.7753 Largeur -0.1179 2.3667

3. Rgression linaire Calcule des covariances >> cov(donnee) ans = 1.0e+005 * 2.7869 0.0923 1.1002 0.0286 0.0923 0.0064 0.0285 0.0007 1.1002 0.0285 0.5303 0.0139 0.0286 0.0007 0.0139 0.0006 >> corrcoef(donnee) ans = 1.0000 0.6933 0.9049 0.7091 0.6933 1.0000 0.4914 0.3632 0.9049 0.4914 1.0000 0.7909 0.7091 0.3632 0.7909 1.0000 Il y'a une symtrie par rapport la diagonal, et la valeur 1 est normal car une variable corrle ellemme donne, et cov(X,X)=var(X) Si on a une valeur proche de 1 c-a-d il ya une corrlation fort On remarque que le poids et la cylindre sont plutt des variables fortement corrles Coefficients de dtermination de variables x=corrcoef(donnee) >> x.^x ans = 1.0000 0.7757 0.9136 0.7837 0.7757 1.0000 0.7053 0.6922 0.9136 0.7053 1.0000 0.8307 0.7837 0.6922 0.8307 1.0000 On voit une forte corrlation entre le poids et la cylindre, ainsi quune faible corrlation entre la largeur et la vitesse.

Donner les diagrammes de dispersion de deux variables fortement corrle entre cylindre et le poids

Le diagramme de dispersion de deux variables moyennement corrle (entre largeur et poids)


185

180 Honda Civic Renault 19 Fiat Tipo Peugeot 405 Renault 21 Citron BX BMW 530i Rover 827i Renault 25 Opel Omega Peugeot 405 Break Ford Sierra BMW 325iX Audi 90 Quattro Ford Scorpio Renault Espace Nissan Vanette VW Caravelle Ford Fiesta Fiat Uno Peugeot 205 Peugeot 205 Rallye Seat Ibiza I Citron AX Sport 700 800 900 1000 1100 poids 1200 1300 1400 1500 1600

175

largeur

170

165

160

155

Le diagramme de Dispersion faiblement corrle entre vitesse et largeur :

185 Honda Civic Renault 19 Fiat Tipo Peugeot 405 Renault 21 Citron BX BMW 530i Rover 827i Renault 25 Opel Omega Peugeot 405 Break Ford Sierra BMW 325iX Audi 90 Quattro Ford Scorpio Renault Espace Nissan Vanette VW Caravelle Ford Fiesta Fiat Uno Peugeot 205 Peugeot 205 Rallye Seat Ibiza I Citron AX Sport

180

175

largeur

170

165

160

155 130

140

150

160

170

180 vitesse

190

200

210

220

230

Faire une rgression linaire des deux variables les plus fortement corrles :

polyfit(poids, cylindree, 1) : Dtermination des coefficients de la droite polyfit(poids, cylindre, 1) ans = 2.0744 -398.2186 lsline : Trac de la droite des moindres carres
3000 2800 2600 2400 2200

cylindre

2000 1800 1600 1400 1200 1000

700

800

900

1000

1100 1200 poids

1300

1400

1500

1600