Vous êtes sur la page 1sur 33

Introduction à R

Julie Wasilewski
Objets dans R
• Vecteur : objets tous de même type
• Matrices : objets tous de même type
• Listes : objets de types différents
• Data.frame : données tabulées
Vecteurs
• Plusieurs valeurs toutes du même type
• Création par énumération des valeurs avec c()

• Eléments des vecteurs :


• NULL si il est vide
• numeric si il est composer de nombres reel ou d’entiers relatifs : 7, -1, 523,
pi
• character si ses éléments sont des chaines de caractères : ça,
mathématiques, Marseille
• logical si il est composé de booléens : TRUE ou FAlSE
• complex pour les nombres complexes : 3i, 0+1i, -1+0i
Vecteurs
• Déterminer le type de vecteur
• str(nom_vecteur)
• mode(nom_vecteur)

• Taille du vecteur
• length(nom_vecteur)
Matrice
Une matrice est un vecteur en plusieurs dimensions dont les éléments sont disposés sous forme d’un tableau
qui comporte des lignes et des colonnes.
Une matrice est composée de plusieurs valeurs toutes du même type

Comment créer une matrice :


matrix(données,ncol=2,nrow=2)
Exercice
• d<-c(1:10)
• e<-c(11:20)
• f<-c(“un”,”deux”,”trois”,”quatre”)
• matrix(c(d,e),10,2)
• matrix(c(d,e),2,10)
• matrix(c(d,e),nrow=2)
• matrix(c(d,e),nrow=2,byrow=F)
• matrix(c(d,e),nrow=2,byrow=T)

• matrix(c(d,f),nrow=2)
Matrice
Comment accéder aux éléments d’une matrice
dim(nom_matrice) # donne le nombre de ligne et colonne

nom_matrice[x,y]
Exercice matrice
• mat<-matrix(c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12), 4, 3)

• mat[1,]
• mat[,1]
• mat[1,3]
Listes
• Structure peu rigide
• Peut contenir des
éléments ayant des
structures différentes
• Peut contenir des listes
Data frame
ou tableau
• Permet de stocker des
données tabulées
• Chaque ligne correspond
a un individu
• Chaque colonne a une
variable
Caractéristique
Data frame
Sélection dans data frame

Individu numéro 1
df[1,]

Individu 4 est-il marié ?


df[4,2]

Variable age
df$age
df[,1]
Opération sur
data frame
• Extraction sur condition
• Utilisation
opérateur logique

• Afficher selon un ou
plusieurs tests
Modifier un
data frame
• Ajout et modification dans un
data frame
• Calculé
• Non calculé
• Sous condition
• Suppression de ligne et
colonne
• df<-df[,-num_colonne]
• df<-df[,-c(num_colonnes)]
Analyser des données tabulées
1. Importation
2. Inspecter les données
3. analyse univariée
4. analyse bivariée
5. analyse multivariée
6. synthèse et visualisation
Exercice
application :
Titanic

Cette photo par Auteur inconnu est soumise à la licence CC BY


Importation
de données
• Type de fichier
• Excel
• CSV
• TXT
• Internet

Chemin
Type de
d’accès au
séparateur
fichier
Inspecter les données

Est-ce que les variables du jeu de données Titanic sont bien catégorisées?
Inspecter les données
Correction des catégories des variables
Regrouper des modalités
Analyse univarié
● Analyser les variables qualitatives
○ Utilise les tableaux de contingence ou/et des tableaux de fréquences
Représentations
des variables
qualitatives
• Tableau de contingence
• Synthétisation de la
distribution des variables
• R: fonction table()
Représentation
des variables
quantitatives
• Indicateurs de tendance
centrales et de dispersions
Visualisation
des données
Camembert
• Utilisé pour les variables
qualitatives avec peu de
modalité
• R: fonction pie()
Diagramme en
bâton ou en
tuyaux d’orgue
• Utilisé pour les variables
qualitatives
• R : fonction barplot()
Histogramme
• Utilisé pour les variables
continues
• R fonction hist()
Boite à
moustache
• Permet une vision globale
• Prise en compte des écarts
• R : function boxplot()

https://www150.statcan.gc.ca/n1/edu/power-pouvoir/ch12/5214889-fra.htm
Nuage de
points
• R function plot()
Exercice application: Etude sur le ronflement
● Dans le cadre d'une surveillance de la population angevine, le CHU
d'Angers a étudié des hommes et des femmes pour déterminer leur
aptitude à ronfler. Le fichier contient un échantillon de 100 patients
interrogés entre 2000 et 2002.

● Dans un script R
○ Importez
○ inspectez le jeux de données
○ Faites des analyses univariés et graphique
● Déposer votre script dans le google form
○ https://forms.gle/meXCQ1x7eMKyMzA88
Descriptifs des variables
• IDEN numéro de l'individu
• SEXE sexe de la personne (homme, femme)
• AGE en années T
• AILLE en cm
• POIDS en kg
• TABA Comportement au niveau du tabac (fumeur,non-fumeur)
• ALCOOL Nombre de verres bus par jour (en équivalent verre de vin
rouge)
• RONFLE Diagnostic de ronflement (Ronfle,Ne ronfle pas)

Vous aimerez peut-être aussi