Vous êtes sur la page 1sur 18

Présentation de R

M. Fall
R: qu'est ce que c'est ?
• R est un environnement intégré de manipulation et d’analyse de
données, de modélisation et de préparation de graphiques.

• R est un langage de programmation complet et autonome pour traiter


et organiser des jeux de données afin :
• de pouvoir y appliquer des tests statistiques plus ou moins complexes
• de représenter ces données graphiquement
• Langage particulièrement puissant pour les applications
mathématiques
• Programmes courts, en général quelques lignes de code seulement ;
• temps de développement très court.
Avantages de R
Le langage R est très utilisé pour diverses raisons :
• permet d'organiser et traiter des volumes importants de données de manière
rapide et flexible.
• logiciel très puissant, dont les fonctionnalités de base peuvent être étendues à
l’aide d’extensions
• créer des graphiques paramétrables afin de pouvoir mieux visualiser le résultat
des analyses.
• c’est un logiciel avec d’excellentes capacités graphiques.
• entièrement gratuit
• multi-plateforme.
• R est un langage de programmation mais son utilisation est fortement orientée
vers les analyses de données et la modélisation statistique.
Exemples d’utilisation
Exemples d’utilisation
• Pour y arriver, il faudra taper quelques lignes de code. Voici un exemple de ce qui
vous attend:
Installation
• R est disponible sous différente plateformes: Windows, Mac OS et Linux. Il faudra
donc adapter l'installation au type de machine que vous avez.

• https://cran.r-project.org/mirrors.html

• Installation de R
• Puis installation de RStudio
Démarrer avec R
La console
• Le langage R est un langage interprété. Cela signifie que l'on peut écrire
seulement une ligne de code, la valider et en voir le résultat.
• Il n'y a donc pas besoin d'une étape préalable de compilation du code, celui ci est
intreprété à la volée.
• Pour écrire du code en R on peut donc simplement lancer ce que l'on appelle la
console et taper du code.
• Comme vous le voyez, un curseur clignote au niveau du chevron (le signe ">"),
c'est là que sera rentré le code.
La console
Stratégies de travail
• Il existe deux grandes stratégies de travail avec l’environnement statistique de R.
1. On entre des expressions à la ligne de commande pour les évaluer
immédiatement :
>2+3
[1] 5
On peut également créer des objets contenant le résultat d’un calcul. Ces
objets sont stockés en mémoire dans l’espace de travail de R :
> x <- exp(2)
>x
[1] 7.389056
Stratégies de travail
2. On sauvegarde dans ce que l’on nommera des fichiers de script les expressions
R et le code de les fonctions personnelles.
• Par convention, on donne aux fichiers de script un nom se terminant avec
l’extension .R.
• Avec cette approche, les objets sont créés au besoin en exécutant le code des
fichiers de script.
• Comment ? Simplement en copiant le code du fichier de script et en le collant
dans l’invite de commande de R.
Éditeurs de texte et environnements intégrés
• Dans la mesure où l’on a recours à des fichiers de script, l’édition de code R est
rendue beaucoup plus aisée avec un bon éditeur de texte pour programmeur ou
un environnement de développement intégré (integrated development
environment, IDE).
• RStudio est un environnement de développement intégré (IDE) créé
spécifiquement pour travailler avec R.
• Il permet de consulter dans une interface conviviale ses fichiers de script, la
ligne de commande R, les rubriques d’aide, les graphiques, etc.
• RStudio est disponible sur les plateformes Windows, OS X et Linux.
Répertoire de travail
Le répertoire de travail (workspace) de R est le dossier par défaut dans lequel le
logiciel :
1. va rechercher des fichiers de script ou de données ; et
2. va sauvegarder l’espace de travail dans le fichier .RData. Le répertoire de travail
est déterminé au lancement de R.

• Les interfaces graphiques de R démarrent avec un répertoire de travail par


défaut.
• Pour le changer, utiliser l’entrée appropriée dans le menu Fichier (Windows) ou Divers (OS
X).
• Consulter aussi les foires aux questions spécifiques aux interfaces graphiques pour des
détails additionnels sur la gestion des répertoires de travail.
• Dans RStudio, on change le répertoire de travail via le menu Session.
L’environnement de travail
• Connaître le répertoire de travail de R
• getwd()
• Changer le répertoire de travail de R
• setwd(“E:/R/data/FormatR”)
Objets en mémoire
• La fonction ls() permet de lister les objets en mémoire
• ls()
• Effacer des objets en mémoire
• rm(a,b)
• Effacer tous les objets
• rm(list=ls())
Help : l’aide en ligne
• R dispose d’une aide en ligne très exhaustive et qui peut vous être très
utile.
• En tapant ? suivi du nom de l’instruction ou help(‘’nom de
l’instruction’’).
• La description de cette instruction, ses arguments, le type d’objet
retourné par cette instruction sont affichés ainsi quelques exemples
d’utilisation.
> help.start()
• Cette instruction permet de lancer votre navigateur (par exemple
Mozilla ou Internet-explorer) et d’accéder directement à l’aide html
L'aide en ligne
• L'aide en ligne de R est extrêment utile pour l'utilisation des fonctions.
• L'aide est disponible directement pour une fonction donnée,
• par exemple : > ?lm
• affichera, dans R, la page d'aide pour la fonction lm() (linear model).
• Les commandes help(lm) et help("lm") auront le même effet.
• C'est cette dernière qu'il faut utiliser pour accéder à l'aide avec des caractères
non-conventionnels :
> ?*
Error: syntax error
> help("*")
Arithmetic package:base R Documentation
Arithmetic Operators
...
Autres fonctionnalités
Importer, exporter des données
• Le langage R peut lire des données provenant de sources externes sous forme de
fichiers, comme il peut en créer et sauvegarder dans des formats transportables.
Créer, générer, saisir des données
• R dispose d’une large bibliothèque de fonctions mathématiques et de densité de
probabilités qui permettent de créer, transformer des données ou de les générer
et de les stocker dans des fichiers.
• R permet aussi la saisie directe d’un tableau de données.
Exercices : Prise en main avec R
• Créer une variable A avec la valeur 2019
• Incrémenter cette variable de 5.
• Effacer cette variable de l’environnement avec la commande rm, puis essayer de l’afficher. Que
remarquez-vous?
• Démarrer une session R et entrer une à une les expressions ci-dessous à la ligne de commande.
Observer les résultats.
> ls()
> pi
> (v <- c(1, 5, 8))
>v*2
> x <- v + c(2, 1, 7)
>x
> ls()
> q()
• Redéfinir la valeur de pi en 3, que se passe-t-il ?
• Afficher les rubriques d’aide des fonctions rencontrées lors de la question précédente.
• Observer d’abord comment les rubriques d’aide sont structurées
• Calculer le vecteur y=x2

Vous aimerez peut-être aussi