Vous êtes sur la page 1sur 12

Test analyse de données

Matrix :
crée une matrice; les éléments de x sont répétés si la taille ne convient pas

vector(…) : génére un vecteur

mat1 + mat2 : addition de matrices.


mat1 * mat2 : multiplication de matrices terme à terme : ce n'est pas la multiplication de
matrices au sens mathématique !
mat1 %*% mat2 : la vraie multiplication de matrices au sens mathématique.

rowSums(mat1) et colSums(mat1) : renvoient les vecteurs contenant la somme des lignes ou


la somme des colonnes.
rowMeans(mat1) et colMeans(mat1) : renvoient les vecteurs contenant la moyenne des
lignes ou la moyenne des colonnes.
avec rowSums, colSums, rowMeans, colMeans, utiliser na.rm = TRUE pour éviter de tenir
compte des valeurs NA (sinon, le résultat est NA si il y a un seul NA sur la ligne ou la
colonne).

apply(mat1, 1, sum) : renvoie un vecteur avec la somme des lignes.


apply(mat1, 2, sum) : renvoie un vecteur avec la somme des colonnes.
apply(mat1, 1, mean) : renvoie un vecteur avec la moyenne des lignes.

sweep(mat, 1, rowMeans(mat)) : enlève à chaque valeur la moyenne de chaque ligne.


sweep(mat, 2, colMeans(mat)) : enlève à chaque valeur la moyenne de chaque colonne.

scale(mat, center = TRUE, scale = FALSE) : soustrait de chaque valeur la moyenne par
colonne (i.e. colonnes ont alors une moyenne nulle). Identique àsweep(mat, 2,
colMeans(mat)).
scale(mat, center = TRUE, scale = TRUE), ou même scale(mat) : normalise pour que
chaque colonne soit de moyenne 0 et d'écart-type 1.

solve(mat1) : calcule l'inverse d'une matrice carrée mat.


solve(mat1, vect) : résoud l'équation linéaire mat %*% x = vect (attention, ne pas la résoudre
en faisant solve(mat) %*% vect, car c'est inefficace et cela peut être instable).

det(mat1) : renvoie un scalaire.

vp <- eigen(mat) : calcule les valeurs propres et les vecteurs propres et renvoie une
liste.vp$values : le vecteur des valeurs propres de dimension n si mat est une matrice n x
n.vp$vectors : la matrice des vecteurs propres. Chaque colonne vp$vectors[, j] est un vecteur
propre de valeur propre vp$values[j].

sum(x) ;sum(y) :Somme des éléments de x,de y


prod(x) ;prod(y) Produit des éléments de x
max(x) ; min(x) ;max(y) ;min(y) :Maximum, minimum des éléments de x
which.max(x) ,which.max(y) :Retourne l’indice du maximum des éléments de x
which.min(x) ;which.min(y) : Retourne l’indice du minimum des éléments de x

range(x) ;range(y) Idem que v1<-c(min(x),max(x)) ; v2<-c(min(y),max(y)) ;v1 ;v2


mean(x) ;mean(y) :Moyenne des éléments de x
median(x) ; median(y) :Médiane des éléments de x
var(x) ;var(y) ; cov(y) Variance des éléments de x(calculée sur n-1) matrice des var et cov si
x est une matrice
cor(y) Matrice de corrélation si x est une matrice ou un data frame

sd(x) ; sd(y) : Ecart-type des éléments de x


diff(x) ;diff(y)

cumsum(x) ; cumsum(y) :un vecteur dont le ie élément est la somme des i premiers éléments
de x
cumprod(x) ; cummin(x) ; cummax(x) ; cumprod(y) ; cummin(y) ; cummax(y) idem pour
le produit, le min, le max

rev(x) Inverse l’ordre des éléments de x


sort(x) Trie les éléments de x dans l’ordre ascendant
rank(x) Range les éléments de x
match(x,y) Retourne un vecteur de meme longueur que x contenant les éléments de x qui sont
dans y

table(x) : compte les fréquences des valeurs de x (x discrète ou caractère)


table(xx)
summary(x) : renvoie un résumé statistique du contenu de x, avec le min, 1er quartile,
moyenne, médiane, 3 ieme quartile et max ( x numérique)
summary(xx)

mean(x) ; median(x) ; var(x) ; sd(x) : moyenne, mediane, variance , ecart-type (x


numérique)
mean(xx) ; median(xx) ; var(xx) ; sd(xx)

cor(x,y) : Donne la matrice de corrélations entre x et y (x et y numériques)


cor(xx) ;cor(yy)
cov(x,y) : Donne la covariance entre x et y (x et y numériques)
cov(xx) ;cov(yy)

Réponse :

mat1<-matrix(c(8,6,5,4,9,7,2,3,3),nrow=3)

> mat2<-matrix(1 :9,nrow=3)

> mat1 + mat2

[,1] [,2] [,3]

[1,] 9 8 9
[2,] 8 14 11

[3,] 8 13 12

> mat1 * mat2

[,1] [,2] [,3]

[1,] 8 16 14

[2,] 12 45 24

[3,] 15 42 27

> mat1 %*% mat2

[,1] [,2] [,3]

[1,] 22 64 106

[2,] 33 87 141

[3,] 28 73 118

> rowSums(mat1)

[1] 14 18 15

> colSums(mat1)

[1] 19 20 8

> rowMeans(mat1)

[1] 4.666667 6.000000 5.000000

> colMeans(mat1)

[1] 6.333333 6.666667 2.666667

> apply(mat1, 1, sum)

[1] 14 18 15

> apply(mat1, 2, sum)

[1] 19 20 8

> apply(mat1, 1, mean)

[1] 4.666667 6.000000 5.000000

> sweep(mat1, 1, rowMeans(mat1))


[,1] [,2] [,3]

[1,] 3.333333 -0.6666667 -2.666667

[2,] 0.000000 3.0000000 -3.000000

[3,] 0.000000 2.0000000 -2.000000

> sweep(mat1, 2, colMeans(mat1))

[,1] [,2] [,3]

[1,] 1.6666667 -2.6666667 -0.6666667

[2,] -0.3333333 2.3333333 0.3333333

[3,] -1.3333333 0.3333333 0.3333333

> scale(mat1, center = TRUE, scale = FALSE)

[,1] [,2] [,3]

[1,] 1.6666667 -2.6666667 -0.6666667

[2,] -0.3333333 2.3333333 0.3333333

[3,] -1.3333333 0.3333333 0.3333333

attr(,"scaled:center")

[1] 6.333333 6.666667 2.666667

> scale(mat1, center = TRUE, scale = TRUE)

[,1] [,2] [,3]

[1,] 1.0910895 -1.0596259 -1.1547005

[2,] -0.2182179 0.9271726 0.5773503

[3,] -0.8728716 0.1324532 0.5773503

attr(,"scaled:center")

[1] 6.333333 6.666667 2.666667

attr(,"scaled:scale")

[1] 1.5275252 2.5166115 0.5773503

> scale(mat1)

[,1] [,2] [,3]


[1,] 1.0910895 -1.0596259 -1.1547005

[2,] -0.2182179 0.9271726 0.5773503

[3,] -0.8728716 0.1324532 0.5773503

attr(,"scaled:center")

[1] 6.333333 6.666667 2.666667

attr(,"scaled:scale")

[1] 1.5275252 2.5166115 0.5773503

>

> mat1<-matrix(c(8,6,5,4,9,7,2,3,3),nrow=3)

> vect<-c(8,4,3)

> solve(mat1)

[,1] [,2] [,3]

[1,] 0.2 0.06666667 -0.2

[2,] -0.1 0.46666667 -0.4

[3,] -0.1 -1.20000000 1.6

> solve(mat1, vect)

[1] 1.2666667 -0.1333333 -0.8000000

> det(mat1)

[1] 30

> vp <- eigen(mat1)

> vp$values

[1] 15.8220349 3.6598926 0.5180725

> vp$vectors

[,1] [,2] [,3]

[1,] 0.4865775 0.7094376 -0.1207133

[2,] 0.6729434 -0.5484642 -0.2540254

[3,] 0.5571262 -0.4425893 0.9596350


>

> x<-c(12,8,7,6,9,11,15,21,0)

> y<-matrix(c(12,8,7,6,9,11,15,21,0,8,9,11,4,5,6,24),nrow=4)

> sum(x)

[1] 89

> sum(y)

[1] 156

> prod(x)

[1] 0

> prod(y)

[1] 0

> max(x)

[1] 21

> min(x)

[1] 0

> max(y)

[1] 24

> min(y)

[1] 0

> which.max(x)

[1] 8

> which.max(y)

[1] 16

> which.min(x)

[1] 9

> which.min(y)

[1] 9
> range(x)

[1] 0 21

> range(y)

[1] 0 24

> mean(x)

[1] 9.888889

> mean(y)

[1] 9.75

> median(x)

[1] 9

> median(y)

[1] 8.5

> var(x)

[1] 35.11111

> var(y)

[,1] [,2] [,3] [,4]

[1,] 6.916667 -11.66667 -12.66667 -15.91667

[2,] -11.666667 28.00000 20.66667 46.33333

[3,] -12.666667 20.66667 23.33333 28.33333

[4,] -15.916667 46.33333 28.33333 90.91667

> cov(y)

[,1] [,2] [,3] [,4]

[1,] 6.916667 -11.66667 -12.66667 -15.91667

[2,] -11.666667 28.00000 20.66667 46.33333

[3,] -12.666667 20.66667 23.33333 28.33333

[4,] -15.916667 46.33333 28.33333 90.91667

> cor(y)
[,1] [,2] [,3] [,4]

[1,] 1.0000000 -0.8383384 -0.9970697 -0.6347197

[2,] -0.8383384 1.0000000 0.8085428 0.9183173

[3,] -0.9970697 0.8085428 1.0000000 0.6151592

[4,] -0.6347197 0.9183173 0.6151592 1.0000000

> sd(x)

[1] 5.925463

> sd(y)

[1] 6.104643

> diff(x)

[1] -4 -1 -1 3 2 4 6 -21

> diff(y)

[,1] [,2] [,3] [,4]

[1,] -4 2 8 1

[2,] -1 4 1 1

[3,] -1 6 2 18

>

> cumsum(x)

[1] 12 20 27 33 42 53 68 89 89

> cumsum(y)

[1] 12 20 27 33 42 53 68 89 89 97 106 117 121 126 132 156

> cumprod(x)

[1] 12 96 672 4032 36288 399168 5987520

[8] 125737920 0

> cummin(x)

[1] 12 8 7 6 6 6 6 6 0

> cummax(x)
[1] 12 12 12 12 12 12 15 21 21

> cumprod(y)

[1] 12 96 672 4032 36288 399168 5987520

[8] 125737920 0 0 0 0 0 0

[15] 0 0

> cummin(y)

[1] 12 8 7 6 6 6 6 6 0 0 0 0 0 0 0 0

> cummax(y)

[1] 12 12 12 12 12 12 15 21 21 21 21 21 21 21 21 24

> x<-c(5,5.55,6.22,3 ,12,4.123,9.567,14)

> y<-c(8,8.12,14,5.7,9.98,9.6,7.76,9.34)

> union(x,y)

[1] 5.000 5.550 6.220 3.000 12.000 4.123 9.567 14.000 8.000 8.120

[11] 5.700 9.980 9.600 7.760 9.340

> intersect(x,y)

[1] 14

> setdiff(x,y)

[1] 5.000 5.550 6.220 3.000 12.000 4.123 9.567

> setdiff(y,x)

[1] 8.00 8.12 5.70 9.98 9.60 7.76 9.34

> yy<-matrix(c(12,8,7,6,9,11,15,21,0,8,9,11,4,5,6,24),nrow=4)

> rev(x)

[1] 14.000 9.567 4.123 12.000 3.000 6.220 5.550 5.000

> sort(x)

[1] 3.000 4.123 5.000 5.550 6.220 9.567 12.000 14.000

> rank(x)

[1] 3 4 5 1 7 2 6 8
> match(x,y)

[1] NA NA NA NA NA NA NA 3

>

> x<-c(2,3,4,2,5,6,4,6,3,7,8,6,7,4,8,3,8,7,3,2)

> xx<-matrix(c(2,3,4,2,5,6,4,6,3,7,8,6,7,4,8,3),nrow=4)

> y<-c(3,6,5,4,3,2,5,4,6,7,7,5,4,3,2,1,7,6,4,6)

> yy<-matrix(c(3,6,5,4,3,2,5,4,6,7,7,5,4,3,2,1),nrow=4)

> table(x)

2345678

3431333

> table(xx)

xx

2345678

2331322

> summary(x)

Min. 1st Qu. Median Mean 3rd Qu. Max.

2.0 3.0 4.5 4.9 7.0 8.0

> summary(xx)

V1 V2 V3 V4

Min. :2.00 Min. :4.00 Min. :3.00 Min. :3.00

1st Qu.:2.00 1st Qu.:4.75 1st Qu.:5.25 1st Qu.:3.75

Median :2.50 Median :5.50 Median :6.50 Median :5.50

Mean :2.75 Mean :5.25 Mean :6.00 Mean :5.50

3rd Qu.:3.25 3rd Qu.:6.00 3rd Qu.:7.25 3rd Qu.:7.25

Max. :4.00 Max. :6.00 Max. :8.00 Max. :8.00

> mean(x)
[1] 4.9

> median(x)

[1] 4.5

> var(x)

[1] 4.621053

> sd(x)

[1] 2.149663

> mean(xx)

[1] 4.875

> median(xx)

[1] 4.5

> var(xx)

[,1] [,2] [,3] [,4]

[1,] 0.9166667 -0.5833333 1.6666667 1.1666667

[2,] -0.5833333 0.9166667 -0.3333333 -2.1666667

[3,] 1.6666667 -0.3333333 4.6666667 -0.3333333

[4,] 1.1666667 -2.1666667 -0.3333333 5.6666667

> sd(xx)

[1] 2.028957

> cor(x,y)

[1] 0.218629

> cor(xx)

[,1] [,2] [,3] [,4]

[1,] 1.0000000 -0.6363636 0.80582296 0.51189070

[2,] -0.6363636 1.0000000 -0.16116459 -0.95065415

[3,] 0.8058230 -0.1611646 1.00000000 -0.06482037

[4,] 0.5118907 -0.9506542 -0.06482037 1.00000000


> cor(yy)

[,1] [,2] [,3] [,4]

[1,] 1.0000000 -0.20000 0.6741999 -0.2000000

[2,] -0.2000000 1.00000 -0.1348400 -0.6000000

[3,] 0.6741999 -0.13484 1.0000000 0.4045199

[4,] -0.2000000 -0.60000 0.4045199 1.0000000

> cov(x,y)

[1] 0.8421053

> cov(xx)

[,1] [,2] [,3] [,4]

[1,] 0.9166667 -0.5833333 1.6666667 1.1666667

[2,] -0.5833333 0.9166667 -0.3333333 -2.1666667

[3,] 1.6666667 -0.3333333 4.6666667 -0.3333333

[4,] 1.1666667 -2.1666667 -0.3333333 5.6666667

> cov(yy)

[,1] [,2] [,3] [,4]

[1,] 1.6666667 -0.3333333 0.8333333 -0.3333333

[2,] -0.3333333 1.6666667 -0.1666667 -1.0000000

[3,] 0.8333333 -0.1666667 0.9166667 0.5000000

[4,] -0.3333333 -1.0000000 0.5000000 1.6666667

>