Vous êtes sur la page 1sur 11

Commandes du logiciel R

Exemple Explication

pour affecté a la variable x une valeur (numérique


x=3 ou x<- 3 ou 3 ->x
ou texte)

+-*/>< les opérations

x != 5 different de 5

10%%3 le reste de la division (resultat = 1)

11%/%3 la partie entiere de la division (resultat = 3)

log(x) logarithmes népériens (Ln)

log(x , base=2) ou
pour le log de base quelconque
log2(x)

exp(x) exponentielle

cos(x) sin(x) tan(x) cosinus, sinus, tangente

?log pour avoir de l'aide concernant cette fonction

pour avoir de l'aide concernant tous le logciel R (en


help.start()
anglais)

is.character(x)
pour tester le type de la variable si c'est vrai ou
is.numeric(x)
faux
is.logical(x) …

as.character(x) pour redefinir le type de la variable (exemple rendre


as.numeric(x) x=9 de numerique à une chaine de caractères
as.logical(x) … x="9")

changer la variable d'un nombre decimal a un


as.integer(3.14)
nombre entier (resultat = 3)

floor(15.3) renvoie a l'entier inferieur (resultat = 15)

ceiling(15.3) renvoie a l'entier superieur (resultat = 16)


round(5.654, 2) arrondir la variable à 2ème decimale (ou 3 4 …)

scan() pour demander a l'utilisateur d'enter une donnée

permet de définir combien d'entrées l'utilisateur


scan(nmax=1)
pourra saisir

pour afficher la valeur de la variable x au cours de


print(x)
l'execution du script

x=paste("Bonjour
permet de coller bout à bout différents morceaux de
j'ai", scan(nmax=1), "an
texte pour n'en faire plus qu'un seul
s")

transformer la chaîne de caractères donnée en


toupper("bonjour")
majuscule

transformer la chaîne de caractères donnée en


tolower("LOTFI")
miniscule

ls() permet d'afficher tous les variables que avez utilisé

permet d'afficher tous les variables que avez utilisé


ls(pattern="lotfi")
et qui ont dans une partie de leur nom "lotfi"

rm(x) supprime la variable x

source("D:/Document/Do
pour charger un fichier de l'ordinateur et l'executer
ssier/test.txt")

pour voir l'emplacement ou le logiciel enregistre les


getwd()
données

pour definir l'emplacement ou vous souhaitez


enregistrer les données. Vous n'aurez plus besoin
setwd("/Users/Document/ de préciser l'adresse absolue de votre fichier
Logiciel R") ("C:/Documents/R") mais seulement son adresse
relative au dossier courant (exemple :
source("scripts/test.R"))
sink("C:/Users/Document
pour enregister dans un fichier les resultats des
s/R/essai_sink.txt")
variables et les affichers dans le fichier grace à
print(x) print(y)
print()
……….. sink()

pour enregister dans un fichier les resultats des


sink("C:/Users/Document variables et les affichers dans le fichier grace à
s/R/essai_sink.txt",TRUE) print() avec TRUE qui indique que les données
print(x) print(y) seront ajoutées au fichier, après les données déjà
……….. sink() existantes et FALSE qui indique que le contenu du
fichier existant sera écrasé

permet de sauvgarder les resultats des variables


save(x , qu'on veut dans un ficier (Rdata) que seul le logiciel
file="C:/Users/Document peut le lire. Ca permet d'importer les resultats des
s/R/sav_x.Rdata") variables d'un scripte pour les utilisers dans un
autre scripts

load("C:/Users/Document permet de charger et importer les resultats des


s/R/sav_x.Rdata") variables sauvgardés

créer un vecteur vide de type numerique de 10


numeric(10)
éléments

créer un vecteur vide de type logique de 10


logical(10)
éléments

créer un vecteur vide de type caractère de 10


character(10)
éléments

x=c(1,3,5,….) pour faire un vecteur colone

permet de sourstraire au 1èr élément "1" et au


x=x-c(1,0,…) 2ème élément "2" … et ca se repete sur tous le
vecteur

crée un vecteur avec une suite de valeur


1:10 ou aussi 20:5 (croissante ou decroissante) allant de 1 à 10 ou de
20 à 5
créer un vecteur avec une suite de valeur allant de
seq(1,10)
1 à 10

créer un vecteur avec une suite de valeur allant de


seq(1,10,3)
1 à 10 et avec un pas de 3 (exemple : 1-4-7-10)

créer un vecteur avec la valeur 2 trois fois (exemple


rep(2,3)
: 2 2 2)

on associe un nom à chacun de ces éléments (pour


names(x)=c("a","b","k")
pouvoir lire plus facilement ce vecteur)

pour d'extraire du vecteur x juste les valeurs du


x[c(1,3,5)]
1,3,5 éléments

pour d'extraire du vecteur x juste les valeurs des


x[c("a","b","k")]
éléments qui ont pour nom a,b,k

permet de sélectionner tous les éléments sauf les 3


x[-(1:3)]
premiers

x[x>7] pour avoir que les éléments qui sont superieur à 7

pour avoir la longueur du vecteur (le nombre


length(x)
d'élément du vecteur)

pour mettre à jour la variable en y assignant un vect


x = x[4:length(x)] eur contenant seulement les éléments allant de 4 à
la fin du vecteur

pour changer la valeur de x et l'enregister a


x=edit(x)
nouveau dans la variable x

renvoie un nouveau vecteur contenant les mêmes


sort(x)
éléments mais triés dans l'ordre croissant

sort(x, renvoie un nouveau vecteur contenant les mêmes


decreasing=TRUE) éléments mais triés dans l'ordre décroissant
au lieu de renvoyer les valeurs du vecteur, elle va
order(x) en renvoyer les index (l'élément 2 est plus petit que
l'élément 17 …)

pour créer un facteur (ressemble a un vecteur mais


factor(c(1,2,3)) qui a une proprièté "levels" qui nous indique les
éléments qui existe dans le facteurs (dans l'ordre)

pour créer un facteur (ressemble a un vecteur mais


qui a une proprièté "levels" qui nous indique les
factor(c(1,2,3),levels=c(1
éléments que peut prendre ce facteurs (et si on
,2,3,4))
trouve avec un éléments qui n'existe pas dans
"levels" c'est qu'on s'est trompé quelque part)

levels(x) pour avoir les levels d'un facteur

as.factor(x) pour transformer un vecteur en un facteur

as.vecteur(y) pour transformer un facteur en un vecteur

as.numeric(as.character( pour transformer un facteur en un vecteur (methode


y)) 2)

pour créer une matrice vide de 2 lignes et 2


matrix(nrow=2,ncol=2)
colonnes

créer une matrice de 3 lignes et 3 colonnes et la


matrix(ncol=3,nrow=3,x,
remplir avec les 3 vecteurs x,y,z par lignes (sinon si
y,z,byrow=TRUE)
c'est FALSE ca sera par colonnes)

rownames(matrice)=c("x
pour le nom des lignes
")

colnames(matrice)=c("x"
pour le nom des colonnes
)

matrice[ligne,colonne] Pour accéder à un élément particulier d'une matrice


ou matrice["nomLin", grace à son numero de ligne et colonne ou grace à
"nomCol"] son nom de ligne et colonne
Pour accéder à des éléments d'une matrice (dans
matrice[2:4, c(1,3)] cette exemple on a la 2,3 et 4 ligne avec 1 et 3
colonnes

matrice[,y] pour sélectionner toutes les lignes de la colonne y

matrice[x,] pour sélectionner toutes les colonnes de la ligne x

data.frame(x,y,z) pour affichier un tableau des données des variables

data.frame(x=c(1,2), b=c(
3,4), k=c(5,4), row.name pour créer un tableau avec 2 lignes et 3 colonnes
s=c("nom1","nom2"))

x : est la variable qui enregistre le tableau


x$y y : nom de la colonne
afin d'avoir le contenu de toute une colonne

x : est la variable qui enregistre le tableau


cette fonction crééra pour chaque colonne du
attach(x) tableau une variable dont le nom sera le nom de la
dite colonne et le contenu les éléments de la
colonne

sum(x) la somme des valeurs

prod(x) le produit des valeurs

mean(x) la moyenne des valeurs

var(x) la variance

sd(x) l'ecart-type

cov(x,y) la covariance

cor(x,y) la correlation

x^2 pour la puissance

sqrt(9) la racine

median(x) la médiane

la médiane sans prendre en compte les valeurs


median(x, na.rm=TRUE) inexistant (NA) qui parasitent généralement les
calculs
quantile(x) pour avoir le quartile par defaut (4-quantiles)

quantile(x, pour avoir un q-quantile allant de 0% à 100% et de


probs=seq(0,1,0.2)) pas de 20%

max(x, na.rm=TRUE) permet d'avoir le maximum des valeurs

min(x, na.rm=TRUE) permet d'avoir le minimum des valeurs

Elle prend comme arguments deux vecteurs et


union(names(x),names(y)
retourne l'ensemble des éléments se trouvant dans
)
au moins un de ces vecteurs

Cette fonction prend deux vecteurs en entrée et


intersect(names(x),name renvoie un nouveau vecteur contenant, de manière
s(y)) unique, les éléments présents dans chacun des
deux vecteurs

Cette fonction prend deux vecteurs x et y en


setdiff(names(x),names( argument et renvoie les éléments de x qui ne sont
y)) pas dans y (remarque : x et y ne renverra pas le
même résultat que comparer y et x)

x [names(x) %in%
renvoie tous les valeurs de x qui se trouve dans y
names(y)]

modele linèare (y=ax+b) pour avoir les valeurs de


lm(y~x)
"a" et "b"

plot(x,y,ylab="...",xlab=". pour avoir les nuages de point, en nomant l'axe x et


..") l'axe y

pour tracer la droite y=ax+b dans le graphe des


abline(lm(y~x))
nuages de point (plot)

cor.test(x,y,conf.level=0.
Test de corrélation bilateral au risque de 5%
95)

cor.test(x,y,
Test de corrélation unilaterale à gauche au risque
alternative="less",conf.l
de 5%
evel=0.95)
cor.test(x,y,
Test de corrélation unilaterale à droite au risque de
alternative="greater",co
5%
nf.level=0.95)

wilcox.test(x, y,
Test de médiane au risque de 5%
conf.level=0.95)

t.test(x,mu=n,conf.level= test de student bilateral avec l'hypothese nul = n au


0.95) risque de 5%

summary(lm(y~x)) pour avoir un resumer statistique

une liste c'est comme un tableau en quelque sorte


list(a=c(…),b=(…),...) mais qui donne la possibilité d'avoir des differents
vecteur qui n'ont pas la meme longueur

avec x : variable de type liste


pour avoir l'élément "a" de la liste (remarque : si on
x[[a]] ou x[1:3] ou x$a
utilise la symbole "$" il faut spécifier le nom de
l'élément et non son identifiant numérique)

avec x : variable de type liste


x[["a"]][1:3] on aura sélectionné les 3 premiers éléments du vec
teur contenu dans l'élément de la liste "a"

x : la variable de type liste


fun : la fonction que l'on souhait appliquer sans les
parenthèses (max() ==> max)
lapply(x, fun , ...) ... : les arguments (Si l'on souhaite par exemple
spécifier l'argument na.rm de la fonction max(), il
faudra le préciser comme argument optionnel à la
fonction lapply())

c'est une fonction permettant d'appliquer


automatiquement et indépendamment une même
lapply(x, max
fonction aux différents éléments d'une liste (ici
, na.rm=TRUE)
c'est le maximum de chaque élément de la liste
sans prendre en compte les valeur inexistant (NA)
L'unique différence avec lapply() est que sapply()
essaiera, dans la mesure du possible, de retourner
les résultats sous la forme d'un objet plus
sapply(x, fun , ...) facilement réutilisables tels que des vecteurs,
matrices ou tableaux de données contrairement à la
fonction lapply() qui retourne des resultats sous
forme de liste

x : la variable de type teste (teste de correlation ou


autre)
vous retournera donc les noms des différents
str(x) éléments de la liste mais elle donne aussi un
aperçu rapide de ce qui y est contenu ce qui nous
aide à extraire une information particulière de cette
liste (test)

random deviates normal centrée et reduit du


rnorm(n)
nombre d'observation
random deviates normal (P(X<x) si lower.tail=TRUE)
rnorm(n,mean=5,sd=10,l
de moyenne 5 et ecart-type 10 du nombre
ower.tail = TRUE)
d'observation
donne la probabilité du vecteur x d'apres le tableau
pnorm(x)
de la loi normal (centrée et reduit)
donne la densité du vecteur x (loi normal centrée et
dnorm(n)
reduit)
l'inverse de pnorm(x) dans la mesure qu'il renvoit un
qnorm(p)
quantile d'apres la probabilité "p"
diagramme quantile-quantile pour verifiée la
qqnorm(x)
normalité du vecteur x
pour dessiner la droite d'origine mean(x) et de
abline(mean(x),sd(x))
pente sd(x)
choose(n,p) pour la combinaison mathematique nCp
pour lire un tabeau des données à partir d'un fichier
read.table(file.choose(),h
sur l'ordinateur (header c'est pour prendre les noms
eader=TRUE)
des colonnes)
la p-value est la probabilité (donc un nombre compris entre 0 et 1) que la
différence observée entre nos deux observations soit due au hasard