Académique Documents
Professionnel Documents
Culture Documents
INSTALLATION DE R
Pour une installation sous Windows, on se rendra sur cette page : http://cran.r-
project.org/bin/windows/base/ et l’on suivra le premier lien pour télécharger le programme
d’installation. Une fois le programme d’installation lancé, il suffira d’installer R avec les options
par défaut
Si vous travaillez sous Linux, vous devriez pouvoir trouver R via votre gestionnaire de paquets,
cela pouvant dépendre d’une distribution de Linux à une autre.
INSTALLATION DE RStudio
Si vous voulez tester les dernières fonctionnalités de RStudio, vous pouvez télécharger la
version de développement (plus riche en fonctionnalités que la version stable, mais pouvant
contenir des bugs) sur http://www.rstudio.com/products/rstudio/download/preview/.
install.packages('nom du package'):
1. dplyr
2. data.table
3. ggplot2
4. readr
5. tidyr
Pour utiliser un package:
library('nom du package'):
dplyr Package
Ce package contient tout (ou presque) pour accélérer vos efforts de manipulation des
données. C'est le mieux connu pour l'exploration et la transformation des données.
data.table Package
Ce package vous permet d’effectuer une manipulation plus rapide dans un ensemble
de données. L'utilisation de data.table permet de réduire le temps de calcul par rapport
à data.frame.
ggplot2 Package
ggplot2 offre une variété de graphe pour représenter les données.
readr Package
Ce paquet permet de lire diverses formes de données dans R. Ce paquet peut
remplacer les fonctions R de base read.csv () et read.table () traditionnelles.
tidyr Package
tidyr fournit un ensemble de fonctions qui vous aident à ranger vos données. Les
données ordonnées sont des données ayant une forme cohérente: en bref, chaque
variable est placée dans une colonne et chaque colonne est une variable.
Parmi les quelque 7800 packages répertoriés dans CRAN, j’ai répertorié certains des packages
les plus puissants et les plus couramment utilisés en modélisation prédictive dans ce cours.
Depuis, j’ai déjà expliqué la méthode d’installation des paquetages, vous pouvez les installer
maintenant. Tôt ou tard, vous en aurez besoin.
R propose une large gamme de packages d’importation de données disponibles dans tous les
formats, tels que .txt, .csv, .json, .sql, etc. Pour importer rapidement des fichiers volumineux, il
est conseillé d’installer et d’utiliser data.table, readr, RMySQL. , sqldf, jsonlite.
R a également construit des commandes de traçage. Ils sont bons pour créer des graphiques
simples. Mais, devient complexe quand il s'agit de créer des graphiques avancés. Par
conséquent, vous devriez installer ggplot2.
Pour la modélisation, le package caret in R est suffisamment puissant pour répondre à tous les
besoins en matière de création de modèle d’apprentissage automatique. Cependant, vous
pouvez installer des algorithmes tels que randomForest, rpart, gbm, etc.