Vous êtes sur la page 1sur 5

TD N° 4

Étude du PIB dans 3 pays européens en 2002


Corrigé

1)
* Dans un tableau, les individus sont les objets étudiés. Ici, il s'agit des régions (on peut parler
alors d'unités spatiales) qui composent les 3 pays étudiés.
Ici, on a 58 individus. Ces derniers composent ce que l'on appelle la population (ou ensemble)
statistique.
* Les variables sont définies comme les caractéristiques communes aux individus. Elles
permettent donc de les décrire.
On a ici 3 variables : code, pays et PIB.
Le code est une variable quantitative discrète. Il s'agit ici d'une donnée utilisée en informatique
pour identifier les individus. En SGBD, on parle de clé.
Le pays est une variable qualitative à 3 modalités (E, I, F) qui permet de différencier les régions
selon leur pays d'appartenance.
Le PIB est une variable quantitative continue qui définit la richesse. Cette variable peut a priori
prendre toutes les valeurs possibles dans un intervalle donné.
* Les modalités sont les valeurs qui sont prises par les individus pour chaque variable. Cette
donnée permet donc de les décrire. On dit aussi de les caractériser.
Par exemple, l'Extrémadure est décrite par les 3 données suivantes : 143 / E / 6800.
Les variables code et PIB possèdent théroriquement 58 modalités (sauf cas d'ex aequo sur la
variable PIB), la variable pays 3 (E / I / F).
Pour information, on peut rappeler que le nombre de modalités pris par chaque variable
compose ce que l'on appelle la série statistique.

2)
* Avant de calculer une donnée synthétique comme la moyenne, rappelez-vous que l'on peut
appréhender utilement le contenu d'un tableau brut en faisant un (des) graphe(s). Cela permet
de se faire une idée de la (des) série(s), et ce faisant d'anticiper les résultats attendus. C'est
aussi un bon moyen de savoir si on doit plutôt utiliser la moyenne ou la médiane.

* Donc, pour chaque série, on peut projeter les données sur un axe OX correctement
dimensionné.

1
Espagne

0 5000 10000 15000 20000 25000 30000

PIB

France

0 5000 10000 15000 20000 25000 30000


PIB

Italie

0 5000 10000 15000 20000 25000 30000

PIB

* L'examen des graphes montre que - en se référant au PIB - l'Espagne serait un pays moins riche
que les autres.

La France et l'Italie sont plus proches avec cependant une région très riche en France (IDF qui
constitue un maximum).

Sachant cela et considérant que la moyenne est sensible aux valeurs extrêmes, on peut penser
que le classement sera le suivant en termes de moyenne : 1 la France, 2 l'Italie, 3 l'Espagne.

* Ce que l'on peut aussi anticiper avec ces graphes, c'est la dispersion des données. Espagne et
France (abstraction faite du maximum) seraient des pays relativement homogènes en termes de
richesse par région.
Italie est nettement plus hétérogène. Cela signifie qu'il y aurait des régions riches et des régions
pauvres.

* En fait, à partir de l'examen des graphes, on a une idée assez précise de la (des) série(s).
Pour autant à quelques euros près, le classement est le suivant : Italie, France, Espagne

Italie France Espagne


Moyenne 15025 14940,9091 10725

* On conclura que Italie et France sont très proches et plus riches que Espagne.
3)
* D'abord quelle est la signification de ces écarts ?

2
On retranchant à la donnée de chaque région la moyenne générale ou par pays, on a une mesure
de la distance - en termes de richesse - entre chaque région et les différentes moyennes.
On va donc avoir une idée de la richesse de chaque région par rapport à ces voisines.
On notera que, naturellement, les écarts vont varier entre +/- l'infini.
Ainsi, une donnée négative indiquera un pays moins riche (par rapport à la moyenne) et
inversement.
De même, on s'intéressera à la valeur absolue de la donnée.
Donc, on étudiera les résultats en termes de valeur absolue et de signe.
On notera enfin que la somme des écarts vaudra toujours zéro puisque c'est une des propriétés
de la moyenne.
* Pour ce faire, il faut calculer la moyenne générale et utiliser les moyennes par pays
calculées en Q2.

M. générale M. Italie M. France M. Espagne


13806,8966 15025 14940,9091 10725

* Pour répondre aux questions suivantes, on peut là encore faire un graphe pour préciser les
choses.
Avec en bleu, les écarts à la moyenne générale et en violet les écarts aux pays.

Positions relatives

15000

10000

5000
Ecarts

Série1
0
Série2
-5000

-10000

-15000
Pays

NB. Pour bien faire, il faut ici étiqueter l'axe des x et nommer les séries. On pourra le faire
ensemble.
* Sur ces courbes, on voit clairement que l'ensemble de référence modifie la perception que l'on
a des régions puisque les courbes sont systématiquement décalées.
* Prenons quelques exemples et intéressons nous aux résultats en termes de valeur absolue et de
signe.
Examinons aussi ces résultats par rapport aux 2 ensembles de référence.
* D'abord pour l'Espagne, toutes les régions sont déficitaires relativement à la moyenne générale
; ceci indique que toutes les régions sont relativement pauvres par rapport aux autres pays
européens.
Pour la France et l'Italie, cela est plus contrasté avec des régions pauvres voire très pauvres et
des régions riches voire très riches (valeur absolue et signe).

3
* En ce qui concerne, les écarts à la moyenne des pays, les résultats changent radicalement en
particulier pour l'Espagne. On constate que près de la moitié des régions restent en négatif mais
que l'autre moitié bascule en positif.
A ce niveau, ce qui est aussi intéressant de constater c'est que les pays qui restent négatif
apparaissent relativement moins pauvres lorsque l'on compare les valeurs absolues des 2 séries
(ie moyenne générale et moyenne par pays).
Par exemple, Extrémadure : - 7007 / - 3925.
Prenons maintenant l'exemple de l'Aragon : pauvre par rapport à la moyenne générale (- 2107) /
riche par rapport à la moyenne du pays (+ 975).
* Prenons maintenant 2 exemples en France, les mêmes causes produisant les mêmes effets, les
tendances sont à peu près similaires pour l'Italie.
La Corse qui apparaît très pauvre par rapport à la moyenne générale, l'est encore plus par
rapport à la moyenne du pays (- 2007 / - 3141) L'IDF qui apparaît très riche en 1 l'est un peu
moins en 2 (+ 11793 / + 10659)
* Effectivement, la perception change donc selon l'ensemble de référence choisi.
Pourquoi, c'est tout simplement mécanique.
En effet, dans le premier cas, pour l'Espagne par exemple, en prenant comme référence une
moyenne générale élevée (en ts les cas plus élevée que celle du pays), on "sous - estime" la
richesse des régions.
Inversement, en considérant la moyenne du pays (qui est plus faible), on discrimine plus
finement les régions en termes de richesse.
* En fait, le choix de l'ensemble de référence va directement dépendre de ce que vous souhaitez
démontrer au plan économique et des mesures que vous préconiseriez à la communauté
européenne afin de limiter ces disparités (ou des les accroître).

4)

* On définit d'abord ces termes en précisant que les données obtenues permettent d'appréhender
la dispersion des valeurs soit de façon globale soit par rapport à la moyenne.
Etendue : différence entre les valeurs extrêmes. Pb. Cette donnée n'est pas tjs très significative
car les valeurs extrêmes ne le sont pas.
Variance : c'est la somme des écarts des valeurs à la moyenne au carré rapportée à n. Intérêt :
toutes les valeurs sont ici prises en compte (on minimise alors le poids des extrêmes). PB. Le
résultat est au carré donc difficilement interprétable à notre niveau.
Ecart Type : c'est la racine carrée de la variance. C'est donc un indice de même équation
dimensionnelle que la variable étudiée. Il s'interprète sous la forme +/- par rapport à la
moyenne.
* On calcule ensuite les valeurs (attention au choix des fonctions dans calc ou excel car on peut
calculer différents types de variance et d'écart type).
Résultats
Etendue 18800 avec min = 6800 max = 25600
Variance 12560987
Ecart type 3544

4
* L'étendue (18800) est bien plus forte que l'écart type (+/- 3544 euros autour de la moyenne).
Ceci est normal puisque l'étendue est dépendante des valeurs extrêmes qui ne sont pas vraiment
significatives.
* La variance vaut +/- 12560987 euros² autour de la moyenne. A notre niveau, elle n'a pas
d'intérêt. Que faire en effet avec des euros au carré.

5)
* On a déjà défini la moyenne et l'écart type, reste à définir le CV.
CV : c'est le quotient de l'écart type et de la moyenne. On peut l'exprimer en %.
Il permet de comparer les séries "toutes choses égales par ailleurs".
Résultats
Moyenne E. 10725
Etendue E. 7000 avec min = 6800 max = 13800
Ecart type E. 2050
CV E. 19,11
Moyenne F. 14941
Etendue F. 13800 avec min = 11800 max = 25600
Ecart type F. 2764
CV F. 18,50
Moyenne I. 15025
Etendue I. 12700 avec min = 8400 max = 21100
Ecart type I. 3764
CV I. 25,05

* En ce qui concerne l'écart type : on constate ici (on s'en doutait vu les graphes en Q2) que le
pays le plus hétérogène donc celui où il y a le plus de disparités socio - économiques est l'Italie
(cassure historique entre le nord et le sud).
Viennent ensuite la France puis l'Espagne. Ainsi ce dernier pays qui apparaît comme
relativement plus pauvre que les autres est aussi celui où les disparités inter - régionales sont a
priori les moins marquées (on le voie bien sur le graphe en Q2).
* En ce qui concerne l'étendue, le classement s'inverse entre l'Italie et la France du fait de la
valeur extrême de l'IDF. Ceci montre bien l'attention particulière qu'il faut accorder aux min. et
aux max. dans une analyse statistique.
* Concernant le CV, l'Espagne et la France sont assez proches, donc ces pays ont des niveaux de
disparités semblables. L'Italie ressort comme un pays très hétérogène donc où il y a des fortes
disparités et inégalités.
* Maintenant, il serait interessant de calculer les médianes et les coefficients inter - quartiles
par pays.
Il faudrait les définir au regard des autres paramètres et commenter les résultats.
C'est à vous de jouer.

Vous aimerez peut-être aussi