Vous êtes sur la page 1sur 2

TP01

Analyse de données avec R

Télécharger R et RStudio.
https://quanti.hypotheses.org/1813

Exercice 1 :
Considérons le dataset qui est disponible dans R « iris »
1) Afficher les 6 premières lignes du dataset
2) Donner les dimensions de ce dataset (nombre de lignes et colonnes)
3) Sélectionner les lignes avec longueur des pétales <1,5
4) Sélectionner le sous-ensemble concernant les espèces setosa OU versicolor.
5) Afficher le nombre d’iris ayant des pétales de longueur égale à 3,5 cm
6) Sélectionner les fleurs dont la longueur du pétale est inférieure à 1,5 cm OU
supérieure à 5 cm.
7) Extraire la première et la troisième ligne du dataset
8) Tracer un nuage de points pour représenter Longueur des sépales en fonction de
Longueur des pétales. Ajouter la droite de régression.
9) Pour chaque espèce de fleurs, indiquer le nombre de lignes.
10) A partir du résultat précédent, réaliser une représentation en camembert (pie
chart), puis en bâtons (barplot). Indice pie()
11) Créer une boîte à moustache (boxplot) les 4 variables numériques du jeu de
données iris.
12) Réaliser le même graphique en ajoutant un titre et en supprimant les valeurs
extrêmes.
13) Représenter le pie chart et le boxplot sur la même fenêtre graphique, l’un à côté
de l’autre. Indice par(), option mfrow
14) Exportez le graphique obtenu de la question précédente (le pie chart et le
boxplot) en pdf sur votre machine.

Exercice 2 :
1) Importer dans une variable nommée A les données contenues dans le fichier
nommé auto2004_original.txt.
Source : https://github.com/PF-BB/Formation-Rrrr/tree/master/docs/source/TP1/data
2) Afficher les noms des variables considérées.
3) Quel est le mode des objets créés par la fonction read.table() ?
4) Afficher le nombre de lignes et de colonnes.

1
5) Afficher le 6 premières lignes de ce jeu de données
6) Afficher les mesures statistiques de base
7) Déterminer variance et écart-type de la variable Puissance.
8) Déterminer la covariance des variables Puissance et Poids.
9) Importez dans une variable nommée S le jeu de données
auto2004_don_manquante.txt (même source). Combien de valeurs manquantes
sont contenues dans le fichier ?
10)Insérer la var VeryWeighty qui affiche TRUE pour Weight >= 10

Exercice 3 :
1. Exécuter la fonction suivante et la tester.
monexemple<-function(A,B){
out<-(A+B)^2
out<-out + A
return (out)
}

2. Ecrire en R une fonction CV qui permet de calculer le coefficient de variation


d'un vecteur de valeurs numériques.
On rappelle que le coefficient de variation est défini comme étant le rapport de
l'écart type sur la moyenne des valeurs.
3. Ecrire en R une fonction PO qui permet de déterminer par la méthode des
moindre carrés (MCO) la valeur de la pente de la droite ainsi que l’ordonnée à
l’origine d’une équation de régression linéaire simple.

Vous aimerez peut-être aussi