Académique Documents
Professionnel Documents
Culture Documents
4.
1 #I n d i c a t e u r s de t e n d a n c e c e n t r a l e
2 T e n d a n c e C e n t r a l e<−summary ( DonneesOzone [ ] [ 2 : 1 1 ] )
3
4 # I n d i c a t e u r s de d i s p e r s i o n
5 V a r i a n c e<−v a r ( DonneesOzone [ ] [ 2 : 1 1 ] )
1 # Boxplot t e m p é r a t u r e
2 dev . new ( )
3 b o x p l o t ( DonneesOzone [ ] [ 3 : 5 ] , ’ b o x s t y l e ’ , ’ f i l l e d ’ , ’
notch ’ , ’ on ’ , y l a b=" T e m p e r a t u r e o b s e r v é e en d e g r é e " )
4 t i t l e ( " Temperatures o b s e r v é e à 9 , 1 2 e t 15h" , c e x . l a b
= 0 . 8 , c e x . a x i s = 0 . 8 , c e x . main = 0 . 8 , c e x . sub =0.8)
5
6 # Boxplot N é b u l o s i t é
7 dev . new ( )
8 b o x p l o t ( DonneesOzone [ ] [ 6 : 8 ] , ’ b o x s t y l e ’ , ’ f i l l e d ’ , ’
notch ’ , ’ on ’ , y l a b=" N é b u l o s i t é " )
9 t i t l e ( " N é b u l o s i t é o b s e r v é e à 9 , 1 2 e t 15h" , c e x . l a b
= 0 . 8 , c e x . a x i s = 0 . 8 , c e x . main = 0 . 8 , c e x . sub =0.8)
10
11 # Les v a l e u r s a b e r r a n t e s pour l e s v a r i a b l e s Ne9 ,
Ne12 e t Ne15
12 o u t l i e r N e 9 <− b o x p l o t . s t a t s ( DonneesOzone $Ne9 ) $ out
13 p r i n t ( o u t l i e r N e 9 ) #17
14
15 o u t l i e r N e 1 2 <− b o x p l o t . s t a t s ( DonneesOzone $Ne12 ) $ out
16 p r i n t ( o u t l i e r N e 1 2 ) #18
17
18 o u t l i e r N e 1 5 <− b o x p l o t . s t a t s ( DonneesOzone $Ne15 ) $ out
19 p r i n t ( o u t l i e r N e 1 5 ) #17
(b) Déterminer, s’il y a lieu les valeurs aberrantes pour les variables
Ne9, Ne12 et Ne15 . Expliquez votre réponse.
1 #− m o d i f i e r l e r é p e r t o i r e par d é f a u t
2 setwd ( "C : / U s e r s / y o u s s e f / Dropbox / INF1421−Module1−
I n t r o d u c t i o n /R/ E x e r c i c e 4 / " )
3
4 #− c h a r g e r l e s d o nn é es
5 # i n s t a l l e r et charger la bibliotheque " readxl "
6 i n s t a l l . packages ( " readxl " )
7 library ( readxl )
8
Les diagrammes circulaires nous permettent de voir la répartition 9 #− L i r e l e f i c h i e r x l s x
en pourcentage des sous-ensembles des ensembles. Dans notre cas, 10 JeuDonnees <− r e a d_e x c e l ( " JeuDonnees . x l s x " , s h e e t = 1 )
ils nous permettent de voir la répartition des vents selon qu’ils
viennent de l’ouest, de l’est, du sud ou du nord. Pour la variable 2. La matrice de confusion en utilisant R :
pluie, le diagramme nous permet de voir la répartition des temps
pendant lesquels il pleut ou il fait sec. 1 # Méthode 1 :
2 c o n f<−t a b l e ( JeuDonnees $ ‘ C l a s s e r é e l l e ‘ , JeuDonnees $ ‘ C l a s s e
Du premier coup d’oeil, on constate que le vent venant de l’ouest prédite ‘ )
3 print ( conf )
est plus souvent présent que le vent venant de l’est. On voit aussi 4
que le temps est moins souvent à la pluie qu’au temps sec. 5 # Méthode 2 :
6 i n s t a l l . packages ( " c a r e t " )
7 library ( caret )
8 f . c o n f <− c o n f u s i o n M a t r i x ( c o n f )
9 print ( f . conf )
Pred-Classe
Classe 1 Classe 2 Classe 3
Classe
Classe 1 8 1 1
Classe 2 2 7 1
Classe 3 0 1 9
1 # Le taux de c l a s s i f i c a t i o n par c l a s s e
2 for ( i in 1:3) {
3 TauxClasse<−c o n f [ i , i ] /sum ( c o n f [ i , ] ) ∗ 100
4 R e s u l t a t<− s p r i n t f ( ’ Le taux de c l a s s i f i c a t i o n de l a
C l a s s e %d e s t de %.2 f%%’ , i , TauxClasse )
5 print ( Resultat )
6 }
7
8 # Le taux de c l a s s i f i c a t i o n g l o b a l
9 T a u x D e C l a s s i f i c a t i o n<−mean ( JeuDonnees $ ‘ C l a s s e r é e l l e ‘==
JeuDonnees $ ‘ C l a s s e p r é d i t e ‘ ) ∗ 100
10 R e s u l t a t<− s p r i n t f ( ’ Le taux de c l a s s i f i c a t i o n g l o b a l e s t
de %.2 f%%’ , T a u x D e C l a s s i f i c a t i o n )
11 print ( Resultat )