Vous êtes sur la page 1sur 31

ACP-ÉTUDE DE CAS

TEMPÉRATURE

18/01/2021

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 1 / 31


Problématique

Le but général de l’étude est de comparer les températures mensuelles d’un


ensemble de villes de France.
Précisons quelques questions auxquelles les résultats de l’ACP permettent
de répondre en abordant le tableau successivement à travers ses lignes et
ses colonnes.
Données:
Pour 15 villes de France, on dispose des moyennes des températures mensu-
elles calculées sur 30 ans (entre 1931 et 1960).

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 2 / 31


Point de vue des individus (les villes)

Chaque ville est caractérisée par ses 12 températures moyennes mensuelles.


Quelles sont, de ce point de vue, les villes qui se ressemblent?
Quelles sont celles qui diffèrent ?
Plus généralement, peut-on faire une typologie des villes mettant en évidence
l’ensemble des ressemblances ainsi définies ?
En ACP, la dissemblance entre les individus est mesurée par une distance.
Le carré de la distance entre deux villes est la somme des carrés des douze
différences entre leurs températures moyennes mensuelles.

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 3 / 31


Point de vue des variables (les mois)

Chaque mois est vu au travers des températures moyennes mensuelles des


15 villes. Le problème n’est pas de séparer les mois chauds des mois froids
pour l’ensemble des 15 villes mais de comparer la répartition des 15 villes.
Les comparaisons entre mois se font au travers de la notion de corrélation
entre variables numériques.
Deux mois sont d’autant plus corrélés que, pour chacun, on observe la même
répartition des 15 villes selon leur température.
Si les mois sont corrélés, on peut résumer en remplaçant les 12 mois par un
petit nombre de variables synthétiques.

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 4 / 31


Faut-il réduire les données?

Ne pas réduire revient ici à considérer qu’un écart de 1 degré entre deux
villes a la même importance quel que soit le mois au cours duquel il est
observé.
Selon ce point de vue, un mois possède alors plus d’influence que l’on y
observe de grandes différences de températures d’une ville à l’autre. D’où,
ne pas réduire les variables revient à accorder aux variables un poids égal à
leur variance.

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 5 / 31


Les données

Fr_Temp <- read.csv2("Fr_Temp.txt", sep="",


header=TRUE,row.names=1)
head(Fr_Temp[,1:5],5)

## Jan Feb Mar Apr May


## Bordeaux 5.6 6.6 10.3 12.8 15.8
## Brest 6.1 5.8 7.8 9.2 11.6
## Clermont 2.6 3.7 7.5 10.3 13.8
## Grenoble 1.5 3.2 7.7 10.6 14.5
## Lille 2.4 2.9 6.0 8.9 12.4

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 6 / 31


Matrice des corrélations
cor.mat=cor(Fr_Temp[,1:12])
round(cor.mat,2)

## Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov
## Jan 1.00 0.97 0.84 0.61 0.36 0.34 0.30 0.41 0.60 0.85 0.95
## Feb 0.97 1.00 0.93 0.76 0.55 0.52 0.49 0.59 0.76 0.94 0.99
## Mar 0.84 0.93 1.00 0.92 0.77 0.76 0.72 0.80 0.91 0.97 0.93
## Apr 0.61 0.76 0.92 1.00 0.95 0.94 0.91 0.95 0.98 0.91 0.78
## May 0.36 0.55 0.77 0.95 1.00 0.99 0.98 0.98 0.94 0.77 0.59
## Jun 0.34 0.52 0.76 0.94 0.99 1.00 0.99 0.99 0.94 0.76 0.57
## Jul 0.30 0.49 0.72 0.91 0.98 0.99 1.00 0.99 0.93 0.74 0.55
## Aug 0.41 0.59 0.80 0.95 0.98 0.99 0.99 1.00 0.97 0.81 0.64
## Sep 0.60 0.76 0.91 0.98 0.94 0.94 0.93 0.97 1.00 0.93 0.80
## Oct 0.85 0.94 0.97 0.91 0.77 0.76 0.74 0.81 0.93 1.00 0.96
## Nov 0.95 0.99 0.93 0.78 0.59 0.57 0.55 0.64 0.80 0.96 1.00
## Dec 0.99 0.97 0.83 0.62 0.38 0.36 0.32 0.43 0.62 0.87 0.96
TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 7 / 31
Résultats de l’ACP

res.Fr_Temp=PCA(Fr_Temp,quanti.sup =13:16,graph=FALSE)

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 8 / 31


Indicateurs d’inertie

round(res.Fr_Temp$eig[1:5,-2],3)

eigenvalue cumulative %ge of variance


comp 1 9.582 79.848
comp 2 2.276 98.818
comp 3 0.070 99.402
comp 4 0.040 99.732
comp 5 0.014 99.849
Dans une ACP normée, l’inertie totale de chacun des nuages (celui des villes
et celui des mois) est égale au nombre de variables actives (ici 12).

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 9 / 31


Indicateurs d’inertie
Scree plot

79.8%
80

60
Percentage of explained variances

40

20 19%

0.6% 0.3% 0.1% 0.1% 0.1% 0% 0% 0%


0

1 2 3 4 5 6 7 8 9 10
Dimensions
TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 10 / 31
Encore
Contribution of variables to Dim−1−2

6
Contributions (%)

0
b

ct

ec

ov

ay
Ju
Fe

Ju

Ja

Au

Se

M
N
D
TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 11 / 31
Avec une inertie de 9.58, qui représente 80 % de l’inertie des nuages dans
l’espace tout entier, le premier facteur est largement prépondérant.
Les deux premiers facteurs totalisent 98.8 % de l’inertie totale.
Les deux nuages de points (individus et variables) sont donc pratiquement
bidimensionnels: leur projection sur le premier plan factoriel en donne une
représentation quasiment parfaite.

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 12 / 31


Contribution des individus
res.Fr_Temp$ind$contrib[,1:3]

## Dim.1 Dim.2 Dim.3


## Bordeaux 6.7759249 0.03498418 49.47583268
## Brest 3.5789091 49.06878939 1.25666928
## Clermont 2.0725832 1.02820712 0.03475855
## Grenoble 1.6271372 8.34401167 1.79994987
## Lille 12.3718247 1.03749158 12.05957373
## Lyon 0.4850349 9.36488350 0.05026181
## Marseille 16.2497301 2.01168233 12.10721845
## Montpellier 11.9672370 0.55505413 3.19773171
## Nantes 0.0550515 3.63802974 4.95797180
## Nice 25.1063100 1.82452633 3.99424990
## Paris 1.0731542 0.07158624 4.53311303
## Rennes 1.4400400 8.17848800 2.20914917
## Strasbourg 11.7277788 13.81902127 0.11379683
## Toulouse 2.0972252 0.05426751 0.17913143
## Vichy
TEMPÉRATURE 3.3720591ACP-ÉTUDE
0.96897702
DE CAS 4.0305917518/01/2021 13 / 31
Contribution des individus

Le premier facteur est dû essentiellement à 5 villes (Lille, Marseille, Mont-


pellier, Nice et Strasbourg) qui totalisent 77.4 % de son inertie.
Compte tenu du faible nombre de villes étudiées, cette situation est banale
et n’attire pas d’observation particulière.
Le deuxième facteur est dû pour moitié (49.1 %) à la ville de Brest, qui est
donc assez particulière du point de vue climatique.

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 14 / 31


Interprétation du premier facteur

Coordonnées des variables actives


Fig1=fviz_pca_var(res.Fr_Temp,
invisible="quanti.sup",repel = TRUE )
Les 12 variables sont corrélées fortement et positivement au premier facteur.
Etant ainsi liées à une même variable, elles sont liées entre elles. Ceci peut
être constaté sur la matrice des corrélations (cf. ci-dessous) dont toutes les
valeurs sont positives.

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 15 / 31


Figure 1
Variables − PCA
1.0

Jan
Dec
0.5 Feb
Nov
Oct
Dim2 (19%)

Mar
0.0
Apr
Sep
Aug
−0.5
May
Jul Jun

−1.0
TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 16 / 31
Matrice des corrélations

round(cor.mat,2)

## Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov
## Jan 1.00 0.97 0.84 0.61 0.36 0.34 0.30 0.41 0.60 0.85 0.95
## Feb 0.97 1.00 0.93 0.76 0.55 0.52 0.49 0.59 0.76 0.94 0.99
## Mar 0.84 0.93 1.00 0.92 0.77 0.76 0.72 0.80 0.91 0.97 0.93
## Apr 0.61 0.76 0.92 1.00 0.95 0.94 0.91 0.95 0.98 0.91 0.78
## May 0.36 0.55 0.77 0.95 1.00 0.99 0.98 0.98 0.94 0.77 0.59
## Jun 0.34 0.52 0.76 0.94 0.99 1.00 0.99 0.99 0.94 0.76 0.57
## Jul 0.30 0.49 0.72 0.91 0.98 0.99 1.00 0.99 0.93 0.74 0.55
## Aug 0.41 0.59 0.80 0.95 0.98 0.99 0.99 1.00 0.97 0.81 0.64
## Sep 0.60 0.76 0.91 0.98 0.94 0.94 0.93 0.97 1.00 0.93 0.80
## Oct 0.85 0.94 0.97 0.91 0.77 0.76 0.74 0.81 0.93 1.00 0.96
## Nov 0.95 0.99 0.93 0.78 0.59 0.57 0.55 0.64 0.80 0.96 1.00
## Dec 0.99 0.97 0.83 0.62 0.38 0.36 0.32 0.43 0.62 0.87 0.96

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 17 / 31


Coordonnées des individus

res.Fr_Temp$ind$coord[1:5,1:2]

## Dim.1 Dim.2
## Bordeaux 3.120707 0.1092968
## Brest -2.268005 4.0933073
## Clermont -1.725936 -0.5925322
## Grenoble -1.529258 -1.6879482
## Lille -4.216825 0.5952014

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 18 / 31


Relations entre les coordonnées des individus-variables

On a
1 X xik − x̄k 1 1 X xik − x̄k
Fs (i) = √ Gs (k) Gs (k) = √ Fs (i)
λs k sk I λs i sk

La première relation exprime le fait que la projection Fs (i) d’un individu i


sur l’axe s, est une combinaison linéaire des projections Gs (k) de toutes les
variables. Un individu est du côté des variables pour lesquelles il a de fortes
valeurs et à l’opposé des variables pour lesquelles il a de faibles valeurs.
Compte tenu de ces relations, on doit s’attendre à trouver le long de l’axe 1,
les villes chaudes du côté des coordonnées positives et les villes froides du
côté des coordonnées négatives.

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 19 / 31


Représentation
fviz_pca_ind(res.Fr_Temp,repel =TRUE)
Individuals − PCA

4 Brest

2
Rennes
Dim2 (19%)

Nantes
Lille

0 Bordeaux
Paris Toulouse
Vichy
Montpellier
Clermont
Marseille

Lyon
Grenoble
−2
TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 20 / 31
Interprétation

On observe que l’axe 1 oppose principalement Nice, Marseille et Montpellier


(à droite) à Lille et Strasbourg (à gauche).

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 21 / 31


Remarque

La formule ci-haut relie la coordonnée d’un individu à l’ensemble des coor-


données des variables. Ainsi, Lille a la plus faible coordonnée sur le premier
axe, mais il serait faux d’en conclure qu’elle est, quel que soit le mois, la
ville la plus froide.
En effet les données montrent que Lille est toujours plus froide que la
moyenne, mais elle n’est pas toujours la plus froide.
La faible coordonnée, sur le premier axe, de Nantes, Lyon ou Paris indique
que, sur l’ensemble de l’année, la température de ces villes est moyenne.

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 22 / 31


Interprétation du deuxième facteur
Coordonnées des variables actives
res.Fr_Temp$var$coord[,1:4]
## Dim.1 Dim.2 Dim.3 Dim.4
## Jan 0.7612384 0.6443379 -0.02141723 0.050985523
## Feb 0.8804578 0.4690786 -0.03355925 -0.011652192
## Mar 0.9687704 0.1560084 -0.15435120 -0.109217288
## Apr 0.9693357 -0.2036737 -0.12174425 0.054072597
## May 0.8727646 -0.4747092 -0.03855734 0.092588621
## Jun 0.8635747 -0.4993460 -0.01242061 0.048863646
## Jul 0.8415346 -0.5314197 0.08212005 -0.011781462
## Aug 0.8986059 -0.4299386 0.06153954 -0.040173888
## Sep 0.9740289 -0.2081014 0.04124477 -0.064058662
## Oct 0.9801599 0.1704565 0.07418299 -0.040077540
## Nov 0.9037531 0.4139260 0.08508702 0.002998317
## Dec 0.7743349 0.6242957 0.05628254 0.060459976

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 23 / 31


Coordonnées des variables actives

Ce facteur oppose les mois d’automne et d’hiver aux mois de printemps


et d’été. Nous verrons plus loin que ce facteur est donc caractérisé par
l’amplitude thermique (température moyenne mensuelle maximale – tem-
pérature moyenne mensuelle minimale).

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 24 / 31


Coordonnées des variables actives

Fig3=fviz_pca_var(res.Fr_Temp,
invisible="quanti.sup" ,repel =TRUE)

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 25 / 31


Figure 3
Variables − PCA

1.0

Jan
Dec
0.5 Feb

Nov

Oct
Dim2 (19%)

Mar

0.0

Apr
Sep

Aug
May
−0.5
Jun
Jul

−1.0 TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 26 / 31


Coordonnées des individus

Compte tenu des relations entre les coordonnées individus-variables, les


coordonnées des villes ayant une forte amplitude thermique (supérieure à
la moyenne) sont positives tandis que celles des villes à faible amplitude
(inférieure à la moyenne) sont négatives.
Brest, dont la coordonnée sur le 2ème facteur est la plus élevée, présente
des températures au-dessus de la moyenne entre novembre et février et très
en-dessous de la moyenne entre avril et septembre.

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 27 / 31


Coordonnées des variables supplémentaires

res.Fr_Temp$quanti.sup$coord

## Dim.1 Dim.2 Dim.3 Dim.4


## Lat -0.8389348 0.30649960 -0.012578344 0.361890148 -0.08
## Long 0.1714839 -0.79221915 0.387214982 0.125304724 -0.31
## Moy 0.9997097 0.02140443 0.009774255 0.002505878 0.00
## Ampl 0.1010565 -0.98567531 0.094558907 -0.059221316 -0.02
L’interprétation générale du deuxième facteur est confirmée par sa corréla-
tion avec la variable supplémentaire amplitude thermique égale à -0.99.
Fig4=fviz_pca_var(res.Fr_Temp,
invisible="var" ,repel =TRUE)

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 28 / 31


Figure 4
Variables − PCA

1.0

0.5

Lat
Dim2 (19%)

0.0
Moy

−0.5

Long

Ampl
−1.0 TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 29 / 31
Premier plan factoriel

Il est toujours intéressant d’étudier globalement un plan factoriel, même si,


comme ici, chaque facteur est clairement interprétable.
Typologies des villes
Notons que plus une ville est froide, plus elle est située à gauche sur le plan
; plus son amplitude thermique est grande, plus elle est située en haut.
Remarquons aussi que les villes « chaudes », situées à droite, sont proches
de l’axe horizontal : le deuxième facteur ne les différencie guère. Au
contraire, pour les villes « froides », les différences d’amplitude thermique
sont importantes.

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 30 / 31


Typologies des villes

La répartition sur le plan permet, un peu arbitrairement, de distinguer trois


groupes de villes. L’interprétation des deux axes permet de caractériser ces
groupes.
1- Les villes à climat chaud : Marseille, Montpellier, Nice, Bordeaux et
Toulouse.
2- Les villes à climat froid et continental (été chaud, hiver très froid) :
Lille, Strasbourg, Lyon, Grenoble, Vichy, Clermont et Paris.
3- Les villes à climat froid et océanique (été froid, hiver doux) : Brest,
Rennes et Nantes.

TEMPÉRATURE ACP-ÉTUDE DE CAS 18/01/2021 31 / 31

Vous aimerez peut-être aussi