Vous êtes sur la page 1sur 11

Chapitre 2 :

Structure de données
en R

BENDANI Houda
Hbendani.houda@gmail.com
Option : Biomédicale
Année universitaire : 2022/2023
Section 1:

Dataframe
Dataframe

Objets atomiques : Objets récursifs :


données toutes du même type objets de types quelconques

Nombre de dimensions Objets atomiques Objets récursifs

1 Vecteur* List

2 Matrice DataFrame

n Array

*Facteur: cas vecteur


Dataframe

• Un data frame est un tableau de données dont toutes les colonnes doivent avoir la même
longueur, mais peuvent être de modes différents.
• C’est la structure de base de R pour le traitement des données statistiques.
• Les lignes sont des observations et les colonnes des variables .
• Il pourrait être illustré comme suit :

C1 C2 C3

R1

R2

R3

R4

R5
Création

• Fonction data.frame()
Syntaxe : Fonction data.frame(vecteurs)

• Pour transformer, si possible, un objet R en data frame, il faut utiliser la fonction as.data.frame().
Attribut

• Structure : str() Dimension : dim() Nombre de ligne et de colonne : nrow() , ncol()


• Fonction length() : nombre de colonnes.
• Fonction names() : retourne les noms des colonnes d’un data frame et peut aussi être utiliser pour
remplacer les noms des colonnes.
• Fonction dimnames() : retourne les noms de lignes et colonnes
• Afficher, modifier ou attribuer des noms aux colonnes : colnames()
• Afficher, modifier ou attribuer des noms aux lignes : rownames()
Extraction

Récupération d'une seule ligne ou d'une seule colonne :

• df[, pos] ou df[, « nom_colonne »] : renvoie un


vecteur (toutes les valeurs sont du même type).
• df[pos,] : renvoie un data.frame (car toutes les valeurs
ne sont pas nécessairement du même type).

En traitant le data frame comme une liste :

• Indexation par pos : [] ou [[]] , indexation par nom :


df$nom ou df[[« nom »]]

En traitant le data frame comme une matrice

• Indexation par pos : [m,n] , indexation par nom :


df[ , « nom »]
Concaténer des DF

Fonction data.frame

• La fonction data.frame permet de combiner par


concaténation de colonnes.
• Syntaxe : data.frame(df1,df2) ; les nombres
d’observations doivent être égaux.

Fonction rbind et cbind

• Comme avec une matrice, rbind effectue une


concaténation en lignes et cbind en colonnes.
• Syntaxe : rbind(df1, df2, df3) (les noms des variables
(colonnes) dans les data frames doivent concorder)
• Syntaxe : cbind(df1, df2)( les noms des observations
(lignes) n’ont pas besoin de concorder entre les data
frames, mais les nombres d’observations doivent être
égaux. )
Manipulation

• Modification : même syntaxe sélection/ extraction + assignement de la valeur


• Rajouter une colonne : cbind() ou data.frame() ou df$nom_colonne <- vecteur de valeur
• Rajouter une ligne : df[nrow() +1,] <- list(….) ou df <- rbind(df,list(….))
• Supprimer des lignes : df <- df[-pos, ]
• Supprimer des colonnes : Comme pour une liste, assigner la valeur NULL a la colonne ou df<- df[-pos_colonne]
Recherche
• Recherche des observations : df[condition, ] ou subset( df, condition)
• Pour Remplacer : on commence par sélectionner les observations par recherche + assignement de la nouvelle
valeur. Syntaxe : df[condition, ] <- valeur
Fonction

• Afficher les n premieres lignes : head(df, n)


• Afficher les n dernieres lignes: tail(df,n)

Vous aimerez peut-être aussi