Vous êtes sur la page 1sur 51

Initiation au langage R

Pr Aicha MAJDA
Département ETAP
FSJES – UMI
2023 - 2024
Introduction

 R est un langage de programmation et un logiciel libre destiné à


l’analyse statistique et à la science des données soutenu par la R
Foundation for Statistical Computing.
 Gratuit : Il fait partie de la liste des paquets GNU (General Public
License ) et est écrit en C, Fortran et R.
 Multiplateforme : Il existe pour d'autres systèmes d'exploitation
( Linux, Windows et MacOS, …)
Introduction
 Très populaire dans le domaine de finance et académique
 Largement utilisé par les statisticiens et les data scientists pour le
développement de logiciels statistiques et l’exploration des
données avec le Machine Learning (Artificial Intelligence).
Introduction

 R est un langage parfait pour la manipulation, le traitement, la


visualisation et l’interprétation des données
Bibliographie

 https://cran.r-
project.org/doc/contrib/Goulet_introduction_programmation_R.pdf

 https://www.w3schools.com/r/default.asp
 https://r.developpez.com/tutoriels/cours-complet-programmation-r/
Plan
 Introduction
 Installation des outils
 Session de travail
 Bases du langage R
 Objets R
 Vecteurs
 Matrices et tableaux
 Listes
 Data frames
 Opérateurs
 Fonctions
 Structures de contrôle
Installation des outils
Le langage R
 CRAN est un site web où l'on peut trouver et télécharger du
matériel concernant le logiciel de statistiques R : code,
documentation et bibliothèques (https://cran.r-
project.org/bin/windows/base/)
Installation des outils
Le langage R
Installation des outils
Le langage R
Installation des outils
Le langage R
Installation des outils
Le langage R
Installation des outils
Le langage R
Installation des outils
Le langage R
Installation des outils
Le langage R
Installation des outils
Le langage R
Installation des outils
Le langage R
Installation des outils
L’Éditeur de script R
Installation des outils
Rstudio
 RStudio est un environnement de développement gratuit,
libre et multiplateforme pour R
 un endroit où on peut utiliser le langage R, visualiser des
tableaux et des figures et même réaliser une multitude
d'analyses statistiques.
Installation des outils
Rstudio
Installation des outils
Rstudio
Installation des outils
Rstudio
Installation des outils
Rstudio
Installation des outils
Rstudio
Installation des outils
Rstudio
Installation des outils
Rstudio
Session de travail

1. Démarrer une session R en cliquant sur l'icône de l'application


2. Ouvrir un fichier de script existant ou en créer un nouveau à l'aide de
l'éditeur de texte.
3. Saisir le script R que l'on souhaite sauvegarder et les commentaires qui
permettront d’éclaircir le code.
4. Tester les commandes à la ligne de commande.
5. Au cours de la phase de développement, on fera généralement de
nombreux allers-retours entre la ligne de commande et le fichier de script.
6. Sauvegarder son fichier de script et quitter l'éditeur ou l'environnement de
développement.
Exercice

 Calculer le prix ttc compris pour un produit dont le prix hors taxe = 220 Dh
et la TVA est 5%.
 Ouvrir une session R
 Ouvrir un nouveau script
 Copier le script sur la ligne de commande de la console R pour exécuter le
script
 Sauvegarder le script sous le nom p1.R
Solution
Bases du langage R
 Commandes R
 l'utilisateur de R interagit avec l'interprète R en entrant des commandes à
l'invite de commande " > ".
 Toute commande R est soit une expression, soit une affectation.

Expression

Affectation
Bases du langage R
 Affectation
 On peut affecter une valeur ou une expression à une variable, en utlisant
le symbole <-

 On peut utiliser le symbole dans le sens inverse ->

 =, <<- et ->> sont aussi des symboles d’affectation


Bases du langage R
 Commandes R
 Le point-virgule peut être utile pour séparer deux courtes expressions ou plus sur
une même ligne :

 On peut regrouper plusieurs commandes en une seule expression en les entourant


d'accolades { }

 a et b sont deux variables


Bases du langage R
 Variables
 Les variables sont des conteneurs pour stocker les valeurs des données
 R n'a pas de commande pour déclarer une variable.
 Une variable est créée au moment où on lui affecte une valeur pour la première
fois

name, age sont appelées variables


Ilham , 30 sont appelées valeurs de ces variables
Bases du langage R
 Nom des variables
 Une variable peut avoir un nom court (comme x et y) ou un nom plus
descriptif (age et name).
 Règles à respecter :
▪ Un nom de variable doit commencer par une lettre et peut être une
combinaison de lettres, chiffres, point(.)et soulignez (_).
▪ S'il commence par un point (.), il ne peut pas être suivi d'un chiffre.
▪ Un nom de variable ne peut pas commencer par un chiffre ou un trait de
soulignement (_)
▪ Les noms de variables sont sensibles à la casse (age, Age et AGE sont trois
variables différentes)
▪ Les mots réservés ne peuvent pas être utilisés comme variables (TRUE, FALSE,
NULL, if...)
Bases du langage R
 Plusieurs Variables
 R permet d’affecter une valeur à plusieurs variables en même temps

 Pour afficher (ou imprimer) la valeur de la variable, tapez simplement le nom de la


variable :

 On peut utiliser aussi la fonction print() pour afficher


Bases du langage R
 Affichage
 Par rapport aux autres langages, en R, nous n’avons pas besoin d’une
fonction spécifique pour afficher les valeurs des variables

 Dans certains cas on doit utiliser des fonctions d’affichage comme print ou
cat
Exemple1 afficher la valeur de la variable x qui prend une valeur de 1 à 5

Exemple2 afficher l’information suivante : Ikram is 33 years old


Bases du langage R
 Affichage
Exemple1 afficher la valeur de la variable x qui prend une valeur de 1 à 5

#Afficher une variable x qui prend une valeur de 1 à 5


# Avec appel de la variable
for (x in 1:5) x
# Avec la fonction print
for (x in 1:5) print(x)
# Avec la fonction cat
for (x in 1:5) cat(x)
for (x in 1:5) cat(x,'\n')
Bases du langage R
 Concaténer des éléments
La fonction cat est aussi une fonction de concaténation
Exemple 2
name='Ikram'
age=33
#Afficher l'information sous forme "Ikram is 33 years old"
cat(name ,'is ',age,' years old\n')

On peur aussi utiliser la fonction paste pour concaténer des éléments

name='Ikram'
age=33
#Afficher l'information sous forme "Ikram is 33 years old"
paste(name ,'is ',age,' years old')
Bases du langage R
 Commentaires
 Utilisés pour expliquer le code R et le rendre plus lisible.
 Les commentaires commencent par un #. Lors de l’exécution du code, R ignorera
tout ce qui commence par #.
Bases du langage R
 Les objets en R
 En R tout est un objet : les variables contenant des données, les fonctions, les
opérateurs, …
 Les objets possèdent un mode et une longueur

c est une fonction de


concaténation produit un
vecteur
Bases du langage R
 Types de données
▪ En programmation, le type de données est un concept important.
▪ Les variables peuvent stocker des données de différents types
▪ Dans R, les variables n'ont pas besoin d'être déclarées avec un type particulier et peuvent
même changer de type après avoir été définies
Bases du langage R
 Types de données simples

numeric - (10.5, 55, 787)


integer - (1L, 55L, 100L, "L" désigne que
c’est entier)
complex - (9 + 3i, "i" désigne la partie
imaginaire)
character (a.k.a. string) - ("k", "R is
exciting", "FALSE", "11.5")
logical (a.k.a. boolean) - (TRUE or
FALSE)

 Nous pouvons utiliser la fonction


class() ou mode() pour vérifier le
type de données d'une variable :
Bases du langage R
 Nombres en R
Il existe trois types de nombres en R, le plus utilisé est numeric :
numeric
integer
complex
 Les variables de types numériques sont créées lorsque on leur attribue une
valeur :

 Conversion de types
 convertir d'un type à un autre avec les fonctions suivantes :
as.numeric()
as.integer()
as.complex()
Bases du langage R
 Conversion des nombres

Exercice
Convertir le type d’une variable
contenant la valeur 3.14 au type
integer.
Que peut-on conclure?
Bases du langage R
 Les vecteurs
 En R tout est un vecteur : pas de notion de scalaire en R ;
 Un scalaire est simplement un vecteur de longueur 1.
Le vecteur est l'unité de base dans les calculs.
 Dans un vecteur simple, tous les éléments doivent être du même mode.
Bases du langage R
 Les vecteurs
 La fonction de base pour créer des vecteurs est c (concaténation) ;

 Il est possible (et souvent souhaitable) de donner une étiquette à chacun des
éléments d'un vecteur.

 On peut accéder aux éléments du vecteurs via l'indiçage avec les crochets [ ].
Bases du langage R
 Les matrices
 R est un langage spécialisé pour les calculs mathématiques.
 Il supporte les matrices et, plus généralement, les tableaux à plusieurs dimensions :
ce sont vecteurs dotés d'un attribut dim.
 la classe de l'objet est matrix
 Exemple

 La généralisation d'une matrice à plus de deux dimensions est un tableau (array).


Bases du langage R
 Les tableaux (array)
 Le nombre de dimensions du tableau est toujours égal à la longueur de
l'attribut dim. La classe implicite d'un tableau est « array ».
 La fonction de base pour créer des tableaux est array :

Colonne

Ligne
C1
C2
Bases du langage R
 Les listes
 Le mode de stockage le plus général et polyvalent du langage R
 Un type de vecteur spécial dont les éléments peuvent être de n'importe quel
mode
 La fonction de base pour créer des listes est list :

 Pour indicer un élément de la liste on utilise soit les crochets ou l’opérateur $


Bases du langage R
 Les Data frames
 Un nombre de procédures statistiques (régression linéaire, par exemple ) reposent
sur les data frames pour le stockage des données.
 Elles sont des données affichées sous forme de tables.
 Elles peuvent contenir différents types de données.
 Chaque colonne doit contenir le même type de données.
 Toutes les colonnes ont le même nombres de données
Bases du langage R
 Les Data frames
 Exemple
Bases du langage R
 Les Data frames
 Exercice : En utilisant R, créer le data.frame correspondant

Vous aimerez peut-être aussi