Vous êtes sur la page 1sur 3

Module: DATA MINING

INSTALLATION DE R

Pour une installation sous Windows, on se rendra sur cette page : http://cran.r-
project.org/bin/windows/base/ et l’on suivra le premier lien pour télécharger le programme
d’installation. Une fois le programme d’installation lancé, il suffira d’installer R avec les options
par défaut

Pour Mac OS X, les fichiers d’installation sont disponibles à http://cran.r-


project.org/bin/macosx/.

Si vous travaillez sous Linux, vous devriez pouvoir trouver R via votre gestionnaire de paquets,
cela pouvant dépendre d’une distribution de Linux à une autre.

INSTALLATION DE RStudio

Une fois R correctement installé, rendez-vous sur :


http://www.rstudio.com/products/rstudio/download/ pour télécharger la dernière version
stable de RStudio. Plus précisément, il s’agit de l’édition Open Source de RStudio Desktop (en
effet, il existe aussi une version serveur).

Choisissez l’installateur correspondant à votre système d’exploitation et suivez les instructions


du programme d’installation.

Si vous voulez tester les dernières fonctionnalités de RStudio, vous pouvez télécharger la
version de développement (plus riche en fonctionnalités que la version stable, mais pouvant
contenir des bugs) sur http://www.rstudio.com/products/rstudio/download/preview/.

INSTALLATION D’UN PACKAGE EN R

Pour installer un package, en utilise la commande:

install.packages('nom du package'):

Master Big Data & Cloud Computing


Module: DATA MINING

1. dplyr
2. data.table
3. ggplot2
4. readr
5. tidyr
Pour utiliser un package:

library('nom du package'):

dplyr Package
Ce package contient tout (ou presque) pour accélérer vos efforts de manipulation des
données. C'est le mieux connu pour l'exploration et la transformation des données.

data.table Package
Ce package vous permet d’effectuer une manipulation plus rapide dans un ensemble
de données. L'utilisation de data.table permet de réduire le temps de calcul par rapport
à data.frame.

ggplot2 Package
ggplot2 offre une variété de graphe pour représenter les données.

readr Package
Ce paquet permet de lire diverses formes de données dans R. Ce paquet peut
remplacer les fonctions R de base read.csv () et read.table () traditionnelles.

tidyr Package
tidyr fournit un ensemble de fonctions qui vous aident à ranger vos données. Les
données ordonnées sont des données ayant une forme cohérente: en bref, chaque
variable est placée dans une colonne et chaque colonne est une variable.

Quelques package de R utiles

Parmi les quelque 7800 packages répertoriés dans CRAN, j’ai répertorié certains des packages
les plus puissants et les plus couramment utilisés en modélisation prédictive dans ce cours.
Depuis, j’ai déjà expliqué la méthode d’installation des paquetages, vous pouvez les installer
maintenant. Tôt ou tard, vous en aurez besoin.

Master Big Data & Cloud Computing


Module: DATA MINING

Importation des données

R propose une large gamme de packages d’importation de données disponibles dans tous les
formats, tels que .txt, .csv, .json, .sql, etc. Pour importer rapidement des fichiers volumineux, il
est conseillé d’installer et d’utiliser data.table, readr, RMySQL. , sqldf, jsonlite.

Visualisation des données

R a également construit des commandes de traçage. Ils sont bons pour créer des graphiques
simples. Mais, devient complexe quand il s'agit de créer des graphiques avancés. Par
conséquent, vous devriez installer ggplot2.

Manipulation des données

R possède une fantastique collection de paquets pour la manipulation de données. Ces


packages vous permettent d'effectuer rapidement des calculs de base et avancés. Ces paquets
sont dplyr, plyr, tidyr, lubrifier, stringr. Découvrez ce tutoriel complet sur les packages de
manipulation de données en R.

Modelisation / Machine Learning

Pour la modélisation, le package caret in R est suffisamment puissant pour répondre à tous les
besoins en matière de création de modèle d’apprentissage automatique. Cependant, vous
pouvez installer des algorithmes tels que randomForest, rpart, gbm, etc.

Master Big Data & Cloud Computing

Vous aimerez peut-être aussi