Vous êtes sur la page 1sur 50

Traduit de Anglais vers Français - www.onlinedoctranslator.

com

Guide de l'utilisateur Gretl

Bibliothèque de régression Gnu, d'économétrie et de séries chronologiques

Allin Cottrell
Département d'économie
Université Wake Forest

Riccardo "Jack" Lucchetti


Département d'économie
Università Politecnica delle Marche

mars 2023
La permission est accordée de copier, distribuer et/ou modifier ce document selon les termes de la Licence
de documentation gratuite GNU, Version 1.1 ou toute version ultérieure publiée par la Free Software
Foundation (voirhttp://www.gnu.org/licenses/fdl.html).
Contenu

1 Introduction 1
1.1 Fonctionnalités en un coup d'œil ......................................... 1
1.2 Remerciements ......................................... 1
1.3 Installation des programmes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

I Lancer le programme 3

2 Commencer 4
2.1 Exécutons une régression ........................................ 4
2.2 Sortie de l'estimation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3 Les menus de la fenêtre principale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.4 Raccourcis clavier. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . dix
2.5 La barre d'outils gret. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . dix

3 Modes de travail 12
3.1 Scripts de commande. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.2 Enregistrement des objets de script. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.3 La console gret. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.4 La notion de séance. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

4 Fichiers de données 18
4.1 Formats des fichiers de données ........................................... 18
4.2 Bases de données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4.3 Créer un ensemble de données à partir de zéro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4.4 Structurer un jeu de données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
4.5 Spécificités des données du panel ......................................... 23
4.6 Valeurs de données manquantes ......................................... 27
4.7 Taille maximale des ensembles de données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.8 Collections de fichiers de données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.9 Assemblage de données provenant de plusieurs sources. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

5 Sous-échantillonner un jeu de données 31


5.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
5.2 Réglage de l'échantillon. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
5.3 Restriction de l'échantillon. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

je
Contenu ii

5.4 Données du panneau. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33


5.5 Rééchantillonnage et bootstrap. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

6 Graphiques et tracés 36
6.1 Graphes Gnuplot. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
6.2 Tracer des graphiques à partir de scripts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
6.3 Boîtes à moustaches. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

7 Joindre des sources de données 48


7.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
7.2 Syntaxe de base. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
7.3 Filtrage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
7.4 Appariement avec les clés. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
7.5 Agrégation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
7.6 Variables clés à valeur de chaîne. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
7.7 Importation de plusieurs séries. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
7.8 Un cas réel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
7.9 La représentation des dates. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.10 Données de séries chronologiques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
7.11 Traitement spécial des colonnes de temps. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
7.12 Données du panneau. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
7.13 Mémo :rejoindreoptions. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

8 Données en temps réel 66


8.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
8.2 Format atomique pour les données en temps réel ................................. 66
8.3 Plus d'informations sur les options liées au temps ................................... 68
8.4 Obtenir un certain millésime de données ................................... 68
8.5 Obtenir len-ème diffusion pour chaque période d'observation. . . . . . . . . . . . . . . . . . . . . 69
8.6 Obtenir les valeurs avec un décalage fixe après la période d'observation. . . . . . . . . . . . . . . . 70
8.7 Obtenir l'historique des révisions d'une observation. . . . . . . . . . . . . . . . . . . . . . . . 71

9 Désagrégation temporelle 74
9.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
9.2 Notation et conception. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
9.3 Vue d'ensemble du traitement des données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
9.4 Extrapolation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
9.5 Signature de fonction. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
9.6 Manipulation des termes déterministes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
9.7 Quelques détails techniques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
9.8 L'option de tracé. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Contenu iii

9.9 Plusieurs séries basse fréquence. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80


9.10 Exemples. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

10 Fonctions spéciales dansgenre 82


10.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
10.2 Densités cumulées et valeurs de p. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
10.3 Récupération des variables internes (accesseurs dollar). . . . . . . . . . . . . . . . . . . . . . . . . 84

11 types de données Gretl 85


11.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
11.2 Série .................................................. 85
11.3 Scalaires ................................................. 86
11.4 Matrices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
11.5 Listes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
11.6 Cordes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
11.7 Forfaits. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
11.8 Tableaux. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
11.9 Le cycle de vie des objets gretl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

12 variables discrètes 98
12.1 Déclarer des variables comme discrètes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
12.2 Commandes pour variables discrètes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

13 Constructions de boucle 103


13.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
13.2 Variantes de contrôle de boucle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
13.3 Contrôles spéciaux. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
13.4 Mode progressif. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
13.5 Exemples de boucle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

14 fonctions définies par l'utilisateur 110


14.1 Définir une fonction. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
14.2 Appel d'une fonction. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
14.3 Supprimer une fonction. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
14.4 Détails de la programmation des fonctions. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
14.5 Packs de fonctions. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

15 Listes et chaînes nommées 122


15.1 Listes nommées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
15.2 Chaînes nommées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

16 séries à valeur de chaîne 131


Contenu iv

16.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131


16.2 Création d'une série de valeurs de chaîne. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
16.3 Opérations autorisées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
16.4 Séries et fonctions à valeur de chaîne. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
16.5 Autres formats d'importation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

17 Manipulation matricielle 139


17.1 Création de matrices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
17.2 Matrices vides. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
17.3 Sélection des sous-matrices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
17.4 Suppression de lignes ou de colonnes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
17.5 Opérateurs matriciels. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
17.6 Opérateurs matriciels–scalaires. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
17.7 Fonctions matricielles ........................................... 145
17.8 Accesseurs matriciels ........................................... 150
17.9 Problèmes d'espace de noms .......................................... 152
17.10Création d'une série de données à partir d'une matrice. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
17.11Matrices et listes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
17.12Supprimer une matrice. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
17.13Imprimer une matrice. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
17.14Exemple : OLS utilisant des matrices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155

18 Matrices complexes 156


18.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
18.2 Création d'une matrice complexe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
18.3 Indexation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
18.4 Opérateurs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
18.5 Fonctions. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
18.6 Entrée/sortie de fichier. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
18.7 Rétrocompatibilité (in)compatibilité. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

19 Dates du calendrier 163


19.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
19.2 Représentations de la date et de l'heure. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
19.3 Conversion entre représentations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
19.4 Arithmétique des jours d'époque. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
19.5 Autres accessoires et fonctions. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
19.6 Travailler avec des dates pré-grégoriennes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

20 Traitement des données à fréquence mixte 176


20.1 Bases. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
Contenu v

20.2 La notion de « liste MIDAS ». . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178


20.3 Listes de décalage haute fréquence. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
20.4 Différences premières à haute fréquence. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
20.5 Graphiques liés à MIDAS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
20.6 Autres méthodes de données MIDAS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181

21 Aide-mémoire 187
21.1 Gestion des jeux de données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
21.2 Créer/modifier des variables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
21.3 Astuces soignées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198

II Méthodes économétriques 203

22 Estimation robuste de la matrice de covariance 204


22.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
22.2 Données transversales et HCCME. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
22.3 Données de séries chronologiques et matrices de covariance HAC. . . . . . . . . . . . . . . . . . . . . . . . 206
22.4 Problèmes particuliers avec les données de panel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
22.5 L'estimateur robuste aux grappes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212

23 Données du panneau 214


23.1 Estimation des modèles de panel .................................... 214
23.2 Modèles de panneaux autorégressifs ................................... 222

24 modèles de panneaux dynamiques 224


24.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
24.2 Utilisation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
24.3 Réplication des résultats DPD. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
24.4 Exemple de croissance internationale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
24.5 Statistiques d'essai auxiliaires. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
24.6 Statistiques disponibles post-estimation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
24.7 Mémo :dpaneloptions. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238

25 moindres carrés non linéaires 239


25.1 Introduction et exemples. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
25.2 Initialisation des paramètres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
25.3 Fenêtre de dialogue NLS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
25.4 Dérivées analytiques et numériques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
25.5 Utilisation avancée. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
25.6 Contrôle de la résiliation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
25.7 Détails sur le code. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
Contenu vi

25.8 Précision numérique ......................................... 242

26 Estimation du maximum de vraisemblance 245


26.1 Estimation ML générique avec gretl ................................. 245
26.2 Syntaxe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
26.3 Matrice de covariance et erreurs standard. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
26.4 Estimation gamma. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
26.5 Fonction de coût frontière stochastique. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250
26.6 Modèles GARCH. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
26.7 Dérivés analytiques ........................................ 254
26.8 Débogage des scripts ML ........................................ 255
26.9 Utilisation des fonctions. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255
26.10 Utilisation avancée demle :fonctions, dérivées analytiques, choix d'algorithme. . . . . . . . 258
26.11Estimation de modèles contraints. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262
26.12Gérer la non-convergence avec élégance. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263

27 Estimation GMM 266


27.1 Introduction et terminologie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266
27.2 GMM comme méthode des moments. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267
27.3 OLS en tant que GMM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
27.4 TSLS en tant que GMM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271
27.5 Options de matrice de covariance. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271
27.6 Un exemple concret : le modèle d'évaluation des actifs basé sur la consommation. . . . . . . . . . . . . . . . 273
27.7 Mises en garde. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277

28 Critères de sélection des modèles 278


28.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278
28.2 Critères d'information. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278

29 Correction des degrés de liberté 280


29.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
29.2 Retour aux sources. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
29.3 Application à la régression MCO. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281
29.4 Au-delà de l'OLS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281
29.5 Cohérence et cas délicats. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282
29.6 Que fait Gretl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283

30 filtres de séries chronologiques 286


30.1 Différence fractionnaire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286
30.2 Le filtre Hodrick-Prescott. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286
30.3 Le filtre Baxter et King. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
Contenu vii

30.4 Le filtre de Butterworth. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288


30.5 La transformée de Fourier discrète. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289

31 Modèles de séries temporelles univariées 292


31.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
31.2 Modèles ARIMA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
31.3 Tests de racine unitaire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299
31.4 Test de cointégration .......................................... 302
31.5 ARCH et GARCH .......................................... 302

32 Autorégressions vectorielles 306


32.1 Notation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306
32.2 Estimation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307
32.3 VAR structurels. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309
32.4 Tests de diagnostic basés sur les résidus. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313

33 Modèles de cointégration et de correction d'erreurs vectorielles 315


33.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315
33.2 Modèles vectoriels de correction d'erreurs comme représentation d'un système cointégré. . . . . . . 316
33.3 Interprétation des composantes déterministes. . . . . . . . . . . . . . . . . . . . . . . . 317
33.4 Les tests de cointégration de Johansen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319
33.5 Identification des vecteurs de cointégration. . . . . . . . . . . . . . . . . . . . . . . . . . . 320
33.6 Restrictions de suridentification. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322
33.7 Méthodes de résolution numérique. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328

34 Modèles multivariés 332


34.1 La commande système. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332
34.2 Systèmes d'équations dans les fonctions. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334
34.3 Restriction et estimation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335
34.4 Accesseurs système. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336

35 Prévision 339
35.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339
35.2 Enregistrement et contrôle des valeurs ajustées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339
35.3 Lefcastcommande. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339
35.4 Statistiques d'évaluation des prévisions univariées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342
35.5 Prévisions basées sur des modèles VAR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343
35.6 Prévision à partir de systèmes simultanés. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345

36 Modélisation de l'espace d'état 346


36.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346
Contenu viii

36.2 Notation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346


36.3 Définition du modèle en tant que bundle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346
36.4 Caractéristiques spéciales des faisceaux d'espace d'état. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 348
36.5 Lekfiltrefonction. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 348
36.6 Lelissefonction. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 349
36.7 Lekdsmoothfonction. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350
36.8 Initialisation diffuse du vecteur d'état. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350
36.9 Extensions et raffinements. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352
36.10Leksimulfonction. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354
36.11Optimisation numérique. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356
36.12Exemples de scénario. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356
36.13Interface graphique. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363

37 Méthodes numériques 370


37.1 Méthodes d'optimisation basées sur les dérivées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 370
37.2 Méthodes d'optimisation sans dérivées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373
37.3 Différenciation numérique. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 377
37.4 Intégration numérique. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 381

38 Variables dépendantes discrètes et censurées 383


38.1 Modèles logit et probit. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383
38.2 Modèles de réponse ordonnée. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387
38.3 Logit multinomial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 389
38.4 Probit bivarié. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 390
38.5 Estimateurs de panel ........................................... 390
38.6 Le modèle Tobie ........................................... 392
38.7 Régression par intervalle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392
38.8 Modèle de sélection d'échantillon. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393
38.9 Données de comptage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395
38.10Modèles de durée. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397

39 Régression quantile 405


39.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405
39.2 Syntaxe de base. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405
39.3 Intervalles de confiance. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 406
39.4 Quantiles multiples. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 406
39.5 Grands ensembles de données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 407

40 Méthodes non paramétriques 410


40.1 Régression pondérée localement (loess). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410
40.2 L'estimateur de Nadaraya–Watson. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412
Contenu ix

41 modèles MIDAS 415


41.1 Paramétrages parcimonieux ................................. 415
41.2 Estimation des modèles MIDAS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416
41.3 Fonctions de paramétrage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 422

III Détails techniques 426

42 Gretl et ODBC 427


42.1 Prise en charge ODBC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 427
42.2 Notions de base ODBC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 427
42.3 Syntaxe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 428
42.4 Exemples. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 430
42.5 Détails de connectivité. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431

43 Gretl et TEX 433


43.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433
43.2 Éléments de menu liés à TEX. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433
43.3 Réglage fin de la sortie typographique. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 435
43.4 Installer et apprendre TEX. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 438

44 Gretl et R 439
44.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 439
44.2 Démarrer un interactifRsession. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 439
44.3 Exécution d'unRscénario. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442
44.4 Faire des allers-retours. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443
44.5 Interagir avecRdepuis la ligne de commande. . . . . . . . . . . . . . . . . . . . . . . . . . . 446
44.6 Problèmes de performances avecR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 448
44.7 Utilisation ultérieure duRbibliothèque. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 448

45 Gretl et le boeuf 450


45.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 450
45.2Bœufsoutien à gretl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 450
45.3 Illustration : réplication du modèle DPD. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452

46 Gretl et Octave 454


46.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454
46.2Octavesoutien à gretl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454
46.3 Illustration : méthodes spectrales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 456

47 Gretl et Stata 458

48 Gretl et Python 460


Contenu X

48.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 460


48.2 Prise en charge de Python dans gret. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 460
48.3 Illustration : régression linéaire avec multicolinéarité. . . . . . . . . . . . . . . . . . . . . 460

49 Gretl et Julia 462


49.1 Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462
49.2 Prise en charge de Julia dans Gretl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462
49.3 Illustration. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462

50 Dépannage grtl 464


50.1 Rapports de bogues. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 464
50.2 Programmes auxiliaires. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465

51 L'interface de ligne de commande 466

IV Annexes 467

A Détails du fichier de données 468


A.1 Format natif de base. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Format de fichier de 468
A.2 données binaires. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Format de base de données 468
A.3 natif. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 469

B Gret de construction 470


B.1 Installation des prérequis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Obtenir la source : 470
B.2 release ou git. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Configurer la source 471
B.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Construire et installer 472
B.4 ............................................ 473

C Précision numérique 475

D Logiciels gratuits associés 476

E Liste des URL 477

Bibliographie 478
Chapitre 1

Introduction

1.1 Fonctionnalités en un coup d'œil

Gretl est un package d'économétrie, comprenant une bibliothèque partagée, un programme client en ligne de commande et une interface
utilisateur graphique.

ConvivialGretl offre une interface utilisateur intuitive ; il est très facile de démarrer et de courir avec
analyse économétrique. Grâce à son association avec les manuels d'économétrie de Ramu Ramanathan,
Jeffrey Wooldridge, et James Stock et Mark Watson, le package propose de nombreux fichiers de données
pratiques et scripts de commande. Ceux-ci sont bien annotés et accessibles. Deux autres ressources utiles
pour les utilisateurs de Gretl sont la documentation disponible et legret-utilisateursliste de diffusion.

FlexibleVous pouvez choisir votre point préféré sur le spectre du pointer-cliquer interactif à
des scripts complexes et peut facilement combiner ces approches.

MultiplateformeLa plate-forme "maison" de Gretl est Linux mais elle est également disponible pour MS Windows et Mac
OS X, et devrait fonctionner sur n'importe quel système de type Unix qui possède les bibliothèques de base appropriées (voir
l'annexeB).

Open sourceLe code source complet de gretl est disponible pour quiconque souhaite le critiquer, le corriger,
ou le prolonger. Voir l'annexeB.

SophistiquéGretl propose une gamme complète d'estimateurs basés sur les moindres carrés, soit pour des équations simples
et pour les systèmes, y compris les autorégressions vectorielles et les modèles vectoriels de correction d'erreurs. Plusieurs
estimateurs spécifiques du maximum de vraisemblance (par exemple probit, ARIMA, GARCH) sont également fournis nativement ;
des méthodes d'estimation plus avancées peuvent être mises en œuvre par l'utilisateur via le maximum de vraisemblance
générique ou le GMM non linéaire.

ExtensibleLes utilisateurs peuvent améliorer gretl en écrivant leurs propres fonctions et procédures dans le script de gretl-
langage de programmation, qui comprend un large éventail de fonctions matricielles.

PrécisGretl a été minutieusement testée sur plusieurs benchmarks, parmi lesquels la référence NIST
ensembles de données de référence. Voir l'annexeC.

Prêt pour InternetGretl peut récupérer des matériaux tels que des bases de données, des collections de fichiers de données de manuels et des compléments
sur les forfaits sur Internet.

InternationalGretl produira sa production en anglais, français, italien, espagnol, polonais, portugais,


Allemand, basque, turc, russe, albanais ou grec selon la langue maternelle de votre ordinateur.

1.2 Remerciements
La base de code gretl dérivée à l'origine du programmeALS ("Econometrics Software Library »), écrit par le
professeur Ramu Ramanathan de l'Université de Californie à San Diego. Nous sommes très reconnaissants au
professeur Ramanathan d'avoir rendu ce code disponible sous la licence publique générale GNU et d'avoir aidé à
diriger les premiers développements de gretl.

1
Chapitre 1 Introduction 2

Nous sommes également reconnaissants aux auteurs de plusieurs manuels d'économétrie pour l'autorisation
d'empaqueter pour gretl divers ensembles de données associés à leurs textes. Cette liste comprend actuellement
William Greene, auteur deAnalyse économétrique; Jeffrey Wooldridge (Introduction à l'économétrie : une
approche moderne); James Stock et Mark Watson (Introduction à l'économétrie); Damodar gujarati (Économétrie
de base); Russel Davidson et James MacKinnon (Théorie et méthodes économétriques); et Marno Verbeek (Un
guide de l'économétrie moderne).
L'estimation GARCH dans gretl est basée sur le code déposé dans l'archive duJournal d'économétrie
appliquéepar les professeurs Fiorentini, Calzolari et Panattoni, et le code pour générerp-les valeurs des
tests de Dickey-Fuller sont dues à James MacKinnon. Dans chaque cas, nous remercions les auteurs pour la
permission d'utiliser leur travail.
En ce qui concerne l'internationalisation de gretl, merci à Ignacio Díaz-Emparanza (espagnol), Michel
Robitaille et Florent Bresson (français), Cristian Rigamonti (italien), Tadeusz Kufel et Pawel Kufel (polonais),
Markus Hahn et Sven Schreiber (allemand ), Hélio Guilherme et Henrique Andrade (portugais), Susan Orbe
(basque), Talha Yalta (turc) et Alexander Gedranovich (russe).
Gretl a largement bénéficié du travail de nombreux développeurs de logiciels libres et open source : pour plus de
détails, veuillez consulter l'annexeB. Nos remerciements vont à Richard Stallman de la Free Software Foundation,
pour son soutien au logiciel libre en général et pour avoir accepté « d'adopter » gretl en tant que programme
GNU en particulier.
De nombreux utilisateurs de gretl ont soumis des suggestions utiles et des rapports de bogues. À cet
égard, des remerciements particuliers sont dus à Ignacio Díaz-Emparanza, Tadeusz Kufel, Pawel Kufel, Alan
Isaac, Cri Rigamonti, Sven Schreiber, Talha Yalta, Andreas Rosenblad et Dirk Eddelbuettel, qui maintient le
paquet gretl pour Debian GNU/Linux.

1.3 Installation des programmes

Linux
Sur Linux1plate-forme, vous avez le choix de compiler le code gretl vous-même ou d'utiliser un package pré-construit. Construire
gretl à partir des sources est nécessaire si vous souhaitez accéder à la version de développement ou personnaliser gretl selon
vos besoins, mais cela demande pas mal de compétences ; la plupart des utilisateurs voudront opter pour un package pré-
construit.

Certaines distributions Linux incluent gretl dans leur offre standard : Debian, Ubuntu et Fedora, par
exemple. Si tel est le cas, tout ce que vous avez à faire est d'installer gretl via votre package. De
gestionnaire de choix. plus, la page Web de gretl surhttp://gretl.sourceforge.netpropose une
paquet "générique" danstr/minformat pour les systèmes Linux modernes.

Si vous préférez compiler le vôtre (ou si vous utilisez un système Unix pour lequel les packages pré-construits ne sont pas disponibles), des
instructions sur la construction de gretl peuvent être trouvées dans l'annexeB.

MS Windows
La version MS Windows se présente sous la forme d'un exécutable auto-extractible. L'installation est juste une question
de téléchargementgretl_install.exeet exécuter ce programme. Vous serez invité à indiquer un emplacement pour
installer le package.

Mac OS X
La version Mac se présente sous la forme d'une image disque compressée. L'installation consiste à télécharger le
fichier image, à l'ouvrir dans le Finder et à faire glisserGretl.appdans le dossier Applications. Cependant, lors de la
première installation, deux packages prérequis doivent d'abord être mis en place ; les détails sont donnés sur le
site du gretl.

1Dans ce manuel, nous utilisons « Linux » comme raccourci pour faire référence au système d'exploitation GNU/Linux. Ce qui est dit ici à propos de Linux
s'applique principalement à d'autres systèmes de type Unix, bien que certaines modifications locales puissent être nécessaires.
Première partie

Exécution du programme

3
Chapitre 2

Commencer

2.1 Exécutons une régression


Cette introduction est principalement orientée vers le programme client graphique ; veuillez consulter le chapitre51 ci-dessous et
leRéférence des commandes Gretlpour plus de détails sur le programme en ligne de commande,gretcli.

Vous pouvez fournir le nom d'un fichier de données à ouvrir en argument de gretl, mais pour le moment ne faisons pas cela :
lancez simplement le programme.1Vous devriez voir une fenêtre principale (qui contiendra des informations sur l'ensemble de
données mais qui est d'abord vide) et divers menus, certains d'entre eux étant désactivés au début.

Que pouvez-vous faire à ce stade ? Vous pouvez parcourir les fichiers de données (ou bases de données) fournis, ouvrir un fichier
de données, créer un nouveau fichier de données, lire les éléments d'aide ou ouvrir un script de commande. Pour l'instant,
parcourons les fichiers de données fournis. Dans le menu Fichier, choisissez « Ouvrir les données, Exemple de fichier ». Une
deuxième fenêtre de type carnet s'ouvrira, présentant les ensembles de fichiers de données fournis avec le package (voir Figure
2.1). Sélectionnez le premier onglet, "Ramanathan". La numérotation des fichiers dans cette section correspond à l'organisation
des chapitres deRamanathan(2002), qui contient une discussion sur l'analyse de ces données. Les données seront utiles à des
fins pratiques même sans le texte.

Figure 2.1 :Fenêtre des fichiers de données d'entraînement

Si vous sélectionnez une ligne dans cette fenêtre et cliquez sur "Info", cela ouvre une fenêtre affichant des informations
sur l'ensemble de données en question (par exemple, sur les sources et les définitions des variables). Si vous trouvez un
fichier qui vous intéresse, vous pouvez l'ouvrir en cliquant sur « Ouvrir » ou en double-cliquant simplement sur le nom du
fichier. Pour le moment ouvronsdonnées3-6.

☞Dans les fenêtres de gretl contenant des listes, un double-clic sur une ligne lance une action par défaut pour l'entrée de liste associée : par
exemple affichage des valeurs d'une série de données, ouverture d'un fichier.

1Pour plus de commodité, nous nous référons au programme client graphique simplement comme gretl dans ce manuel. Notez
cependant que le nom spécifique du programme diffère selon la plate-forme informatique. Sous Linux, il s'appellegret_x11alors que sur
MS Windows c'estgretl.exe.Sur les systèmes Linux, un script wrapper nommégrêleest également installé — voir aussi leRéférence des
commandes Gretl.

4
Chapitre 2. Mise en route 5

Ce fichier contient des données relatives à une « châtaigne » économétrique classique, la fonction de consommation. La
fenêtre de données doit maintenant afficher le nom du fichier de données actuel, la plage de données globale et la plage
d'échantillons, ainsi que les noms des variables ainsi que de brèves balises descriptives - voir la figure2.2.

Figure 2.2 :Fenêtre principale, avec un fichier de données de pratique ouvert

OK, qu'est-ce qu'on peut faire maintenant ? Espérons que les différentes options de menu devraient être assez explicites. Pour l'instant,
nous allons plonger dans le menu Modèle ; une brève visite de tous les menus de la fenêtre principale est donnée dans la section2.3
dessous.

Le menu Modèle de Gretl propose de nombreuses routines d'estimation économétriques. Le plus simple et le plus standard est
celui des moindres carrés ordinaires (MCO). La sélection d'OLS fait apparaître une boîte de dialogue demandant un Modèle
Spécification—voir figure2.3.

Figure 2.3 :Boîte de dialogue de spécification du modèle

Pour sélectionner la variable dépendante, mettez en surbrillance la variable souhaitée dans la liste de gauche et cliquez sur la flèche qui
pointe vers l'emplacement Variable dépendante. Si vous cochez la case "Définir par défaut", cette variable sera présélectionnée comme
dépendante lors de la prochaine ouverture de la boîte de dialogue du modèle. Raccourci : un double-clic sur une variable à gauche la
sélectionne comme dépendante et la définit également comme valeur par défaut. Pour sélectionner des variables indépendantes, mettez-
les en surbrillance à gauche et cliquez sur la flèche verte (ou cliquez avec le bouton droit sur
Chapitre 2. Mise en route 6

variable en surbrillance); pour supprimer des variables de la liste sélectionnée, utilisez la flèche rad. Pour sélectionner plusieurs
variables dans la zone de liste, faites glisser la souris dessus ; pour sélectionner plusieurs variables non contiguës, maintenez la
toucheCtrlet cliquez sur les variables souhaitées. Pour exécuter une régression avec la consommation comme variable
dépendante et le revenu comme variable indépendante, cliquez surCTdans l'emplacement dépendant et ajoutezYtà la liste
Variables indépendantes.

2.2 Sortie de l'estimation


Une fois que vous avez spécifié un modèle, une fenêtre affichant la sortie de régression apparaîtra. La sortie est
raisonnablement complète et dans un format standard (Figure2.4).

Figure 2.4 :Fenêtre de sortie du modèle

La fenêtre de sortie contient des menus qui vous permettent d'inspecter ou de représenter graphiquement les valeurs
résiduelles et ajustées, et d'exécuter divers tests de diagnostic sur le modèle.

Pour la plupart des modèles, il existe également une option pour imprimer la sortie de régression en LUNFormat TEX. Voir le chapitre43
pour plus de détails.

Pour importer la sortie de Gretl dans un traitement de texte, vous pouvez copier et coller à partir d'une fenêtre de sortie,
en utilisant sonModifiermenu (ou bouton Copier, dans certains contextes) vers le programme cible. De nombreuses
fenêtres gretl (pas toutes) offrent la possibilité de copier au format RTF (Rich Text Format) de Microsoft ou au format LUN
TEXAS. Si vous collez dans un traitement de texte, RTF peut être une bonne option car la mise en forme tabulaire de la
sortie est préservée.2Vous pouvez également enregistrer la sortie dans un fichier (texte brut) puis importer le fichier
dans le programme cible. Lorsque vous terminez une session gretl, vous avez la possibilité d'enregistrer toutes les
sorties de la session dans un seul fichier.

A noter que sur legnomebureau et sous MS Windows, leDéposerinclut une commande pour envoyer la
sortie directement à une imprimante.

☞Lorsque vous collez ou importez une sortie gret en texte brut dans un traitement de texte, sélectionnez une police à espacement fixe ou de style
machine à écrire (par exemple, Courier) pour conserver la mise en forme tabulaire de la sortie. Sélectionnez une petite police (Courier 10 points
devrait suffire) pour éviter que les lignes de sortie ne soient interrompues au mauvais endroit.

2Notez que lorsque vous copiez au format RTF sous MS Windows, Windows ne vous autorisera à coller le matériel que dans des applications qui
"comprennent" le RTF. Ainsi, vous pourrez coller dans MS Word, mais pas dans le bloc-notes. Notez également qu'il semble y avoir un bogue dans
certaines versions de Windows, par lequel le collage ne fonctionnera pas correctement à moins que l'application "cible" (par exemple MS Word) ne
soit déjà en cours d'exécution avant de copier le matériel en question.
Chapitre 2. Mise en route 7

2.3 Les menus de la fenêtre principale

En lisant de gauche à droite le long de la barre de menus de la fenêtre principale, nous trouvons les menus Fichier, Outils, Données,
Affichage, Ajouter, Échantillon, Variable, Modèle et Aide.

• Menu Fichier

– Données ouvertes:Ouvrez un fichier de données Gretl natif ou importez-le à partir d'autres formats. Voir le chapitre4.

– Ajouter des données :Ajoutez des données à l'ensemble de données de travail actuel, à partir d'un fichier de données gretl, d'un fichier de
valeurs séparées par des virgules ou d'un fichier tableur.

– Enregistrer des données:Enregistrez le fichier de données Gretl natif actuellement ouvert.

– Enregistrer les données sous :Écrivez l'ensemble de données actuel au format natif, avec la possibilité d'utiliser la
compression de données gzip. Voir le chapitre4.

– Exporter des données:Écrivez l'ensemble de données actuel au format CSV (Comma Separated Values)
ou aux formats GNU R ou GNU Octave. Voir le chapitre4et aussi AnnexeD.
– Envoyer à:Envoyez l'ensemble de données actuel sous forme de pièce jointe à un e-mail.

– Nouvel ensemble de données :Vous permet de créer un ensemble de données vide, prêt à saisir des valeurs ou à importer des séries
à partir d'une base de données. Voir ci-dessous pour plus d'informations sur les bases de données.

– Effacer l'ensemble de données :Efface le jeu de données actuel de la mémoire. Généralement, vous n'avez pas à le
faire (puisque l'ouverture d'un nouveau fichier de données efface automatiquement l'ancien), mais parfois c'est
utile.

– Directeur de travail:Modifiez le répertoire de travail actuel (ou "workdir") et spécifiez les options
associées. Pour une explication du rôle du workdir cliquez sur le bouton Aide dans la fenêtre de
dialogue qui s'affiche, ou reportez-vous à la documentation duensemblecommande avec le
workdiroption dans la référence de commande.
– Fichiers de script :Un "script" est un fichier contenant une séquence de commandes gretl. Cet élément contient des entrées
qui vous permettent d'ouvrir un script que vous avez créé précédemment ("fichier utilisateur"), d'ouvrir un exemple de
script ou d'ouvrir une fenêtre d'éditeur dans laquelle vous pouvez créer un nouveau script.

– Fichiers de session :Un fichier "session" contient un instantané d'une session gretl précédente, y compris l'ensemble de
données utilisé et tous les modèles ou graphiques que vous avez enregistrés. Sous cet élément, vous pouvez ouvrir une
session enregistrée ou enregistrer la session en cours.

– Bases de données :Vous permet de parcourir diverses bases de données volumineuses, soit sur votre propre
ordinateur, soit, si vous êtes connecté à Internet, sur le serveur de base de données gretl. Voir section4.2pour plus
de détails.

– Packs de fonctions :Gérez les packages de fonctions fournies par les utilisateurs qui étendent les capacités
de gretl. Pour en savoir plus sur ces packages écrits dans la matrice intégrée de Gretl et le langage de script
"hansl", veuillez vous référer à l'entrée "Packages" dans le menu Aide.
– Ressource de l'addon :Accédez à des exemples de scripts et de fichiers de données fournis avec les « addons »
officiels de Gretl. (Les modules complémentaires sont des packages de fonctions qui sont plus étroitement intégrés
au programme gretl que les packages standard fournis par les utilisateurs.)

– Sortie:Quittez le programme. Vous serez invité à enregistrer tout travail non enregistré.

• Menu Outils

– Tableaux statistiques :Recherchez les valeurs critiques des distributions couramment utilisées


(normale ou gaussienne,t, chi carré,Fet Durbin–Watson).
– Outil de recherche de valeur P :Recherchez les valeurs p de la gaussienne,t, chi carré,Fdistributions , gamma,
binomiales ou de Poisson. Voir aussi lepvaluecommande dans leRéférence des commandes Gretl.
Chapitre 2. Mise en route 8

– Graphiques de distribution :Produire des graphiques de diverses distributions de probabilité. Dans la


fenêtre graphique résultante, le menu contextuel comprend un élément "Ajouter une autre courbe",
qui vous permet de superposer un autre tracé (par exemple, vous pouvez dessiner letdistribution avec
différents degrés de liberté).
– Calculateur de statistiques de test :Calculez les statistiques de test et les valeurs de p pour une gamme de tests
d'hypothèse courants (moyenne, variance et proportion de la population ; différence des moyennes, variances et
proportions).

– Tests non paramétriques :Calculez les statistiques de test pour divers tests non paramétriques (test de signe, test de somme
de rang de Wilcoxon, test de rang signé de Wilcoxon, test d'exécution).

– Seed pour les nombres aléatoires :Définissez la graine du générateur de nombres aléatoires (par défaut, elle
est définie en fonction de l'heure système au démarrage du programme).
– Journal des commandes :Ouvre une fenêtre contenant un enregistrement des commandes exécutées jusqu'à présent.

– Console Gretl :Ouvrez une fenêtre "console" dans laquelle vous pouvez taper des commandes comme vous
le feriez avec le programme en ligne de commande,gretcli (au lieu d'utiliser le pointer-cliquer).
– Démarrez Gnu R :CommencerR (s'il est installé sur votre système), et chargez une copie de l'ensemble de données
actuellement ouvert dans gretl. Voir l'annexeD.

– Variables de tri :Réorganisez la liste des variables dans la fenêtre principale, soit par numéro d'identification, soit
par ordre alphabétique de nom.

– Packs de fonctions :Gère les « paquets de fonctions » (voir la section14.5), qui vous permettent d'accéder à
des fonctions écrites par d'autres utilisateurs et de partager celles que vous avez écrites.
– Suite de tests NIST :Vérifiez la précision numérique de gretl par rapport aux résultats de référence pour la
régression linéaire mis à disposition par le National Institute of Standards and Technology (États-Unis).

– Préférences :Définissez les chemins d'accès aux différents fichiers auxquels Gretl doit accéder. Choisissez la police
dans laquelle Gretl affiche la sortie texte. Activez ou supprimez les messages de gretl concernant la disponibilité des
mises à jour du programme, etc. Voir leRéférence des commandes Gretlpour plus de détails.

• Menu Données

– Tout sélectionner:Plusieurs éléments de menu agissent sur les variables actuellement sélectionnées dans la fenêtre
principale. Cet élément permet de sélectionner toutes les variables.

– Valeurs d'affichage :Ouvre une fenêtre avec une impression simple (non modifiable) des valeurs de la
ou des variables sélectionnées.
– Modifier les valeurs :Ouvre une fenêtre de feuille de calcul dans laquelle vous pouvez modifier les valeurs des variables
sélectionnées.

– Ajouter des observations :Affiche une boîte de dialogue dans laquelle vous pouvez choisir un certain nombre d'observations
à ajouter à la fin de l'ensemble de données actuel ; à utiliser avec les prévisions.

– Supprimer les observations supplémentaires :Actif uniquement si des observations supplémentaires ont été ajoutées
automatiquement dans le processus de prévision ; supprime ces observations supplémentaires.

– Lire les infos, Modifier les infos : "Lire les informations" affiche simplement les informations récapitulatives du fichier de données
actuel ; "Modifier les informations" vous permet d'y apporter des modifications (si vous avez la permission de le faire).

– Descriptif imprimé :Ouvre une fenêtre contenant un compte rendu complet de l'ensemble de données
actuel, y compris les informations récapitulatives et toute information spécifique sur chacune des variables.
– Ajoutez des marqueurs de casse :Demande le nom d'un fichier texte contenant des "marqueurs de cas" (chaînes
courtes identifiant les observations individuelles) et ajoute cette information à l'ensemble de données. Voir le
chapitre4.

– Supprimer les marqueurs de casse :Actif uniquement si l'ensemble de données comporte des marqueurs de cas identifiant les
observations ; supprime ces marqueurs de casse.
Chapitre 2. Mise en route 9

– Structure du jeu de données :appelle une série de boîtes de dialogue qui vous permettent de modifier l'interprétation
structurelle de l'ensemble de données actuel. Par exemple, si les données ont été lues sous forme de coupe transversale,
vous pouvez demander au programme de les interpréter comme des séries chronologiques ou comme un panel. Voir aussi
la rubrique4.4.

– Données compactes :Pour les données de séries chronologiques de fréquence supérieure à annuelle, vous donne la
possibilité de compacter les données à une fréquence inférieure, en utilisant l'une des quatre méthodes de compactage
(moyenne, somme, début de période ou fin de période).

– Développer les données :Pour les données de séries chronologiques, vous offre la possibilité d'étendre les données à une fréquence
plus élevée.

– Transposer les données :Transformer chaque observation en variable et vice versa (ou en d'autres termes,
chaque ligne de la matrice de données devient une colonne dans la matrice de données modifiée) ; peut être
utile avec des données importées qui ont été lues « de côté ».

• Afficher le menu

– Affichage par icônes :Ouvre une fenêtre affichant le contenu de la session en cours sous la forme d'un ensemble d'icônes ;
voir section3.4.

– Variables spécifiées par le graphique :Donne le choix entre un diagramme de série temporelle, un diagramme de dispersion
X–Y régulier, un diagramme X–Y utilisant des impulsions (barres verticales), un diagramme X–Y « avec séparation des
facteurs » (c'est-à-dire avec des points colorés différemment selon la valeur d'une variable fictive donnée), des boîtes à
moustaches et un graphique 3D. Affiche une boîte de dialogue dans laquelle vous spécifiez les variables à représenter
graphiquement. Voir le chapitre6pour plus de détails.

– Plusieurs graphiques :Vous permet de composer un ensemble de six petits graphiques maximum, soit des nuages de points par
paires, soit des graphiques de séries chronologiques. Ceux-ci sont affichés ensemble dans une seule fenêtre.

– Statistiques récapitulatives :Affiche un ensemble complet de statistiques descriptives pour les variables sélectionnées dans
la fenêtre principale.

– Matrice de corrélation :Affiche les coefficients de corrélation par paires pour les variables sélectionnées.
– Tableau croisé :Affiche un tableau croisé des variables sélectionnées. Cela ne fonctionne que si au moins
deux variables de l'ensemble de données ont été marquées comme discrètes (voir Chapitre12).
– Composants principaux:Produit une analyse en composantes principales pour les variables
sélectionnées.
– Distances de Mahalanobis :Calcule la distance de Mahalanobis de chaque observation à partir du centre de
gravité de l'ensemble de variables sélectionné.
– Corrélogramme croisé :Calcule et représente graphiquement le corrélogramme croisé pour deux variables sélectionnées.

• Ajouter un menuOffre diverses transformations standard de variables (logs, décalages, carrés, etc.) que vous pouvez souhaiter
ajouter à l'ensemble de données. Donne également la possibilité d'ajouter des variables aléatoires et (pour les données de séries
chronologiques) d'ajouter des variables fictives saisonnières (par exemple, des variables fictives trimestrielles pour les données
trimestrielles).

• Exemple de menu

– Définir la plage :Sélectionnez un point de départ et/ou de fin différent pour l'échantillon actuel, dans la plage
de données disponibles.
– Restaurer la plage complète :explicite.
– Définissez, en vous basant sur le mannequin :Étant donné une variable fictive (indicatrice) avec les valeurs 0 ou 1,
cela supprime de l'échantillon actuel toutes les observations pour lesquelles la variable fictive a la valeur 0.

– Restreindre, selon le critère :Semblable à l'élément ci-dessus, sauf que vous n'avez pas besoin d'une variable
prédéfinie : vous fournissez une expression booléenne (par exemplepi2 > 1400)et l'échantillon est limité aux
observations satisfaisant à cette condition. Voir l'entrée pourgenredans leRéférence des commandes Gretl
pour plus de détails sur les opérateurs booléens pouvant être utilisés.
Chapitre 2. Mise en route dix

– Sous-échantillon aléatoire :Tirer un échantillon aléatoire de l'ensemble de données complet.

– Supprimez tous les obs avec des valeurs manquantes :Supprimer de l'échantillon actuel toutes les observations
pour lesquelles au moins une variable a une valeur manquante (voir la section4.6).

– Compter les valeurs manquantes :Donnez un rapport sur les observations où les valeurs des données sont manquantes.
Peut être utile pour examiner un ensemble de données de panel, où il est assez courant de rencontrer des valeurs
manquantes.

– Définissez le code de valeur manquant :Définissez une valeur numérique qui sera interprétée comme « manquante » ou
« non disponible ». Ceci est destiné à être utilisé avec des données importées, lorsque gretl n'a pas reconnu le code de
valeur manquante utilisé.

• Menu variableLa plupart des éléments ci-dessous fonctionnent sur une seule variable à la fois. La variable "active" est
définie en la mettant en surbrillance (en cliquant sur sa ligne) dans la fenêtre de données principale. La plupart des
options seront explicites. Notez que vous pouvez renommer une variable et modifier son libellé descriptif sous "Modifier
les attributs". Vous pouvez également "Définir une nouvelle variable" via une formule (par exemple impliquant une
fonction d'une ou plusieurs variables existantes). Pour connaître la syntaxe de ces formules, consultez l'aide en ligne de
"Générer la syntaxe des variables" ou consultez legenrecommande dans leRéférence des commandes Gretl. Un exemple
simple :

toto = x1 * x2

va créer une nouvelle variablefoucomme le produit des variables existantesx1etx2.Dans ces formules, les variables
doivent être référencées par leur nom et non par leur numéro.

• Menu modèlePour plus de détails sur les divers estimateurs offerts dans ce menu, veuillez consulter le
Référence des commandes Gretl. Voir aussi le chapitre25concernant l'estimation de modèles non linéaires.

• Menu d'aideVeuillez l'utiliser au besoin ! Il donne des détails sur la syntaxe requise dans diverses entrées de
dialogue.

2.4 Raccourcis clavier


Lorsque vous travaillez dans la fenêtre principale de Gretl, certaines opérations courantes peuvent être effectuées à l'aide du
clavier, comme indiqué dans le tableau ci-dessous.

Retour Ouvre une fenêtre affichant les valeurs des variables actuellement sélectionnées : cela revient à
sélectionner « Données, Afficher les valeurs ».
Supprimer L'appui sur cette touche a pour effet de supprimer les variables sélectionnées. Une confirmation
est requise pour éviter les suppressions accidentelles.
e A le même effet que de sélectionner "Modifier les attributs" dans le menu "Variable".
F2 Identique à "e". Inclus pour la compatibilité avec d'autres programmes.
g A le même effet que de sélectionner « Définir une nouvelle variable » dans le menu
« Variable » (qui correspond à lagenrecommande).
h Ouvre une fenêtre d'aide pour les commandes gretl.
F1 Identique à "h". Inclus pour la compatibilité avec d'autres programmes.
r Actualise la liste des variables dans la fenêtre principale.
t Représente graphiquement la variable sélectionnée ; un graphique linéaire est utilisé pour les ensembles de données de séries

chronologiques, tandis qu'un diagramme de distribution est utilisé pour les données transversales.

2.5 La barre d'outils gret


En bas à gauche de la fenêtre principale se trouve la barre d'outils.
Chapitre 2. Mise en route 11

Les icônes ont les fonctions suivantes, lues de gauche à droite :

1. Lancez un programme de calculatrice. Une fonction pratique au cas où vous souhaiteriez un accès rapide à
une calculatrice lorsque vous travaillez dans gretl. Le programme par défaut estcalc.exesous MS Windows,
ouxcalcsous le système X window. Vous pouvez modifier le programme dans le menu "Outils, Préférences,
Général", onglet "Programmes".

2. Démarrez un nouveau script. Ouvre une fenêtre d'édition dans laquelle vous pouvez saisir une série de commandes à
envoyer au programme sous forme de lot.

3. Ouvrez la console gret. Un raccourci vers l'élément de menu "Gretl console" (Section2.3au-dessus de).

4. Ouvrez la fenêtre de l'icône de session.

5. Ouvrez une fenêtre affichant les packages de fonctions gret disponibles.

6. Ouvrez ce manuel au format PDF.

7. Ouvrez l'élément d'aide pour la syntaxe des commandes de script (c'est-à-dire une liste avec les détails de toutes les commandes
disponibles).

8. Ouvrez la boîte de dialogue de définition d'un graphique.

9. Ouvrez la boîte de dialogue d'estimation d'un modèle à l'aide des moindres carrés ordinaires.

10. Ouvrez une fenêtre répertoriant les exemples de jeux de données fournis avec gretl et toutes les autres collections de
fichiers de données qui ont été installées.
chapitre 3

Modes de travail

3.1 Scripts de commande


Lorsque vous exécutez des commandes dans gretl, en utilisant l'interface graphique et en remplissant les entrées de la boîte de dialogue, ces
commandes sont enregistrées sous la forme d'un "script" ou d'un fichier batch. Ces scripts peuvent être modifiés et réexécutés, en utilisant gretl ou
le client en ligne de commande,gretcli.

Pour afficher l'état actuel du script à tout moment d'une session gretl, choisissez "Journal des commandes" dans le menu Outils.
Ce fichier journal s'appellesession.inpet il est écrasé chaque fois que vous démarrez une nouvelle session. Pour le conserver,
enregistrez le script sous un autre nom. Les fichiers de script seront trouvés plus facilement, en utilisant le sélecteur de fichiers
de l'interface graphique, si vous les nommez avec l'extension ".inp ».

Pour ouvrir un script que vous avez écrit indépendamment, utilisez l'élément de menu "Fichier, Fichiers de script" ; pour créer un script à
partir de zéro, utilisez l'élément "Fichier, Fichiers de script, Nouveau script" ou le bouton "Nouveau script" de la barre d'outils. Dans les
deux cas, une fenêtre de script s'ouvrira (voir Figure3.1).

Figure 3.1 :Fenêtre de script, modification d'un fichier de commandes

La barre d'outils en haut de la fenêtre de script offre les fonctions suivantes (de gauche à droite) : (1) Enregistrer le fichier ; (2)
Enregistrez le fichier sous un nom spécifié ; (3) Imprimez le fichier (cette option n'est pas disponible sur toutes les plateformes) ;
(4) Exécutez les commandes du fichier ; (5) Copier le texte sélectionné ; (6) Collez le texte sélectionné ; (7) Rechercher et remplacer
du texte ; (8) Annuler la dernière action Coller ou Remplacer ; (9) Aide (si vous placez le curseur dans un mot de commande et
appuyez sur le point d'interrogation, vous obtiendrez de l'aide sur cette commande); (10) Fermez la fenêtre.

Lorsque vous exécutez le script, en cliquant sur l'icône Exécuter ou en appuyant sur Ctrl-r, toutes les sorties sont dirigées
vers une seule fenêtre, où elles peuvent être modifiées, enregistrées ou copiées dans le presse-papiers. Pour en savoir
plus sur les possibilités de script, jetez un œil à l'élément d'aide de Gretl "Command reference",

12
Chapitre 3. Modes de travail 13

ou lancez le programme en ligne de commandeGretcliet consultez son aide, ou consultez leRéférence des commandes
Gretl.

Si vous exécutez le script lorsqu'une partie de celui-ci est en surbrillance, gretl n'exécutera que cette partie. De plus, si vous souhaitez
exécuter uniquement la ligne actuelle, vous pouvez le faire en appuyant sur Ctrl-Entrée.1

Cliquer sur le bouton droit de la souris dans la fenêtre de l'éditeur de script produit un menu contextuel. Cela
vous donne la possibilité d'exécuter soit la ligne sur laquelle se trouve le curseur, soit la région sélectionnée du
script s'il y a une sélection en place. Si le script est éditable, ce menu donne également la possibilité d'ajouter ou
de supprimer des marqueurs de commentaire au début de la ligne ou des lignes.
Le paquet gretl comprend plus de 70 exemples de scripts. Beaucoup d'entre eux concernentRamanathan(2002), mais ils peuvent
également être utilisés comme une introduction autonome à la scénarisation dans gretl et à divers points de la théorie
économétrique. Vous pouvez explorer les fichiers d'exemple sous "Fichier, Fichiers de script, Exemples de scripts". Vous y
trouverez une liste des fichiers ainsi qu'une brève description des points qu'ils illustrent et des données qu'ils utilisent. Ouvrez
n'importe quel fichier et exécutez-le pour voir la sortie. Notez que les commandes longues d'un script peuvent être réparties sur
deux lignes ou plus, en utilisant une barre oblique inverse comme caractère de continuation.

Vous pouvez, si vous le souhaitez, utiliser les contrôles de l'interface graphique et l'approche de script en tandem, en exploitant
chaque méthode là où elle offre une plus grande commodité. Voici deux suggestions.

• Ouvrez un fichier de données dans l'interface graphique. Explorez les données : générez des graphiques, exécutez des régressions, effectuez
des tests. Ouvrez ensuite le journal des commandes, supprimez toutes les commandes redondantes et enregistrez-le sous un nom
spécifique. Exécutez le script pour générer un seul fichier contenant un enregistrement concis de votre travail.

• Commencez par établir un nouveau fichier de script. Tapez toutes les commandes qui peuvent être nécessaires pour
configurer les transformations des données (voir legenrecommande dans leRéférence des commandes Gretl).
Généralement, ce genre de chose peut être accompli plus efficacement via des commandes assemblées avec prévoyance
plutôt qu'en pointant-cliquant. Ensuite, enregistrez et exécutez le script : la fenêtre de données de l'interface graphique
sera mise à jour en conséquence. Vous pouvez maintenant effectuer une exploration plus approfondie des données via
l'interface graphique. Pour revoir les données ultérieurement, ouvrez et réexécutez d'abord le script "préparatoire".

Scripts et fichiers de données

Une manière courante de faire des recherches économétriques avec gretl est la suivante : composer un script ; exécuter
le script ; inspecter la sortie ; modifier le script ; exécutez-le à nouveau, les trois dernières étapes étant répétées autant
de fois que nécessaire. Dans ce contexte, notez que lorsque vous ouvrez un fichier de données, cela efface la majeure
partie de l'état interne de gretl. C'est donc probablement une bonne idée de commencer votre script par unouvrir
commande : le fichier de données sera rouvert à chaque fois, et vous pouvez être sûr d'obtenir des résultats « frais ».

Un autre point doit être noté. Lorsque vous allez ouvrir un nouveau fichier de données via l'interface graphique,
vous êtes toujours invité : l'ouverture d'un nouveau fichier de données entraînera la perte de tout travail non
enregistré, voulez-vous vraiment faire cela ? Cependant, lorsque vous exécutez un script qui ouvre un fichier de
données, vous êtespasinvité. L'hypothèse est que dans ce cas, vous n'allez pas perdre de travail, car le travail est
incorporé dans le script lui-même (et il serait ennuyeux d'être invité à chaque itération du cycle de travail décrit ci-
dessus).
Cela signifie que vous devez être prudent si vous avez travaillé à l'aide de l'interface graphique et que vous décidez ensuite d'exécuter un
script : le fichier de données actuel sera remplacé sans qu'aucune question ne soit posée, et il est de votre responsabilité d'enregistrer
d'abord les modifications apportées à vos données.

1Cette fonctionnalité n'est pas unique à gretl ; d'autres packages économétriques offrent la même facilité. Cependant, l'expérience montre que même si cela
peut être remarquablement utile, cela peut également conduire à écrire des scripts de dinosaures qui ne sont jamais destinés à être exécutés tous en même
temps, mais plutôt utilisés comme un référentiel chaotique pour sélectionner des extraits de code. Étant donné que gretl vous permet d'ouvrir plusieurs fenêtres
de script en même temps, vous voudrez peut-être garder vos scripts bien rangés et raisonnablement petits.
Chapitre 3. Modes de travail 14

3.2 Enregistrement des objets de script

Lorsque vous estimez un modèle en pointant-cliquant, les résultats du modèle sont affichés dans une fenêtre séparée, proposant
des menus qui vous permettent d'effectuer des tests, de dessiner des graphiques, d'enregistrer des données du modèle, etc.
Habituellement, lorsque vous estimez un modèle à l'aide d'un script, vous obtenez simplement une impression non interactive
des résultats. Vous pouvez cependant faire en sorte que les modèles estimés dans un script soient « capturés », afin de pouvoir
les examiner de manière interactive une fois le script terminé. Voici un exemple de syntaxe pour obtenir cet effet :

Modèle1 <- ols Ct 0 Yt

Autrement dit, vous tapez un nom pour le modèle à enregistrer sous, puis une "flèche d'affectation"
pointant vers l'arrière, puis la commande de modèle. La flèche d'affectation est composée du signe
inférieur à suivi d'un tiret ; il doit être séparé par des espaces du nom précédent et de la commande
suivante. Le nom d'un objet enregistré peut inclure des espaces, mais dans ce cas, il doit être entouré de
guillemets :

"Modèle 1" <- ols Ct 0 Yt

Les modèles enregistrés de cette manière apparaîtront sous forme d'icônes dans la fenêtre d'affichage des icônes de gretl (voir
la section3.4) après l'exécution du script. De plus, vous pouvez faire en sorte qu'un modèle nommé s'affiche automatiquement
(dans sa propre fenêtre) comme suit :

Modèle1.show

Encore une fois, si le nom contient des espaces, il doit être entre guillemets :

"Modèle 1". afficher

La même facilité peut être utilisée pour les graphiques. Par exemple, ce qui suit créera un tracé deCTcontre
Yt,enregistrez-le sous le nom "CrossPlot" (il apparaîtra sous ce nom dans la fenêtre d'affichage des icônes),
et affichez-le :

CrossPlot <- gnuplot Ct Yt


CrossPlot.show

Vous pouvez également enregistrer la sortie des commandes sélectionnées sous forme de morceaux de texte nommés
(là encore, ceux-ci apparaîtront dans la fenêtre de l'icône de session, à partir de laquelle vous pourrez les ouvrir plus
tard). Par exemple, cette commande envoie la sortie d'un test Dickey-Fuller augmenté à un "objet texte" nomméADF1et
l'affiche dans une fenêtre :

ADF1 <- adf 2 x1


ADF1.show

Les objets ainsi sauvegardés (qu'il s'agisse de modèles, de graphiques ou de sorties de texte) peuvent être détruits à
l'aide de la commande .gratuitajouté au nom de l'objet, comme dansADF1.gratuit.

3.3 La console gret


Une autre option est disponible pour votre confort informatique. Sous le menu « Outils » de gretl, vous trouverez
l'élément « console Gretl » (il y a aussi un bouton « ouvrir la console gretl » sur la barre d'outils de la fenêtre principale).
Cela ouvre une fenêtre dans laquelle vous pouvez taper des commandes et les exécuter une par une (en appuyant sur la
touche Entrée) de manière interactive. C'est essentiellement la même chose quesuperlcli's mode de fonctionnement,
sauf que l'interface graphique est mise à jour en fonction des commandes exécutées à partir de la console, ce qui vous
permet de faire des allers-retours à votre guise.
Chapitre 3. Modes de travail 15

Dans la console, vous avez "l'historique des commandes" ; c'est-à-dire que vous pouvez utiliser les touches fléchées haut et bas
pour naviguer dans la liste des commandes que vous avez saisies à ce jour. Vous pouvez récupérer, modifier puis ressaisir une
commande précédente.

En mode console, vous pouvez créer, afficher et libérer des objets (modèles, graphes ou texte) comme décrit ci-dessus
pour le mode script.

3.4 La notion de séance


Gretl propose l'idée d'une « session » comme moyen de garder une trace de votre travail et de le revoir plus tard. L'idée
de base est de fournir un espace iconique contenant divers objets relatifs à votre session de travail en cours (voir Figure
3.2). Vous pouvez ajouter des objets (représentés par des icônes) à cet espace au fur et à mesure. Si vous enregistrez la
session, ces objets ajoutés devraient être à nouveau disponibles si vous rouvrez la session ultérieurement.

Figure 3.2 :Vue par icônes : un modèle et un graphique ont été ajoutés aux icônes par défaut

Si vous démarrez gretl et ouvrez un ensemble de données, puis sélectionnez "Affichage des icônes" dans le menu Affichage, vous devriez
voir l'ensemble d'icônes de base par défaut : celles-ci vous donnent un accès rapide aux informations sur l'ensemble de données (le cas
échéant), la matrice de corrélation ( « Corrélations » et des statistiques récapitulatives descriptives (« Résumé »). Tous ces éléments sont
activés en double-cliquant sur l'icône correspondante. L'icône "Ensemble de données" est un peu plus complexe : un double-clic ouvre les
données dans la feuille de calcul intégrée, mais vous pouvez également cliquer avec le bouton droit sur l'icône pour accéder à un menu
d'autres actions.

Pour ajouter un modèle à la vue Icône, estimez-le d'abord à l'aide du menu Modèle. Ensuite, déroulez le menu Fichier dans la
fenêtre du modèle et sélectionnez "Enregistrer dans la session en tant qu'icône. . . » ou « Enregistrer sous icône et fermer ». Il
suffit d'appuyer sur leSsur la fenêtre du modèle est un raccourci vers cette dernière action.

Pour ajouter un graphe, créez-le d'abord (dans le menu Affichage, « Variables spécifiées par le graphe », ou via l'une des autres
commandes de génération de graphe de gretl). Cliquez sur la fenêtre du graphique pour afficher le menu du graphique et sélectionnez «
Enregistrer dans la session sous forme d'icône ».

Une fois qu'un modèle ou un graphique est ajouté, son icône apparaîtra dans la fenêtre d'affichage des icônes. Un double-clic sur
l'icône réaffiche l'objet, tandis qu'un clic droit fait apparaître un menu permettant d'afficher ou de supprimer l'objet. Ce menu
contextuel vous offre également la possibilité d'éditer des graphiques.

Le tableau modèle

Dans la recherche économétrique, il est courant d'estimer plusieurs modèles avec une variable dépendante
commune - les modèles différant par rapport aux variables indépendantes incluses, ou peut-être par
rapport à l'estimateur utilisé. Dans cette situation, il est pratique de présenter les résultats de la régression
sous la forme d'un tableau, où chaque colonne contient les résultats (coefficients estimés et erreurs
standard) pour un modèle donné, et chaque ligne contient les estimations pour une variable donnée dans
les modèles. Notez que certaines méthodes d'estimation ne sont pas compatibles avec le modèle simple
Chapitre 3. Modes de travail 16

format de table, donc gretl ne laissera pas ces modèles être ajoutés à la table de modèles. Ces méthodes incluent
les moindres carrés non linéaires (nls),estimateurs génériques du maximum de vraisemblance (mle),MGM
générique (gmm),modèles de panneaux dynamiques (panneau),régressions d'intervalle (intreg),modèles probit
bivariés (biprobit),Modèles AR(I)MA (arimaouarme),et les modèles (G)ARCH (Garcetcambre).
Dans la fenêtre d'affichage des icônes, gretl fournit un moyen de construire une telle table (et de la copier en texte brut, LUNTEX
ou format texte enrichi). La procédure est décrite ci-dessous. (La table modèle peut également être construite de manière non
interactive, en mode script—voir l'entrée pouronglet modèledans leRéférence des commandes Gretl.)

1. Estimez un modèle que vous souhaitez inclure dans le tableau, et dans la fenêtre d'affichage du modèle, sous le menu Fichier,
sélectionnez « Enregistrer dans la session sous forme d'icône » ou « Enregistrer sous forme d'icône et fermer ».

2. Répétez l'étape 1 pour les autres modèles à inclure dans le tableau (jusqu'à un total de six modèles).

3. Lorsque vous avez terminé d'estimer les modèles, ouvrez la vue en icônes de votre session gretl, en sélectionnant
"Vue en icônes" dans le menu Affichage de la fenêtre principale de gretl, ou en cliquant sur l'icône "Vue en icônes
de session" dans la barre d'outils gretl.

4. Dans la vue Icône, il y a une icône intitulée "Table modèle". Décidez quel modèle vous souhaitez voir apparaître dans la
colonne la plus à gauche du tableau des modèles et ajoutez-le au tableau, soit en faisant glisser son icône sur l'icône du
tableau des modèles, soit en cliquant avec le bouton droit sur l'icône du modèle et en sélectionnant "Ajouter au modèle
tableau » dans le menu contextuel.

5. Répétez l'étape 4 pour les autres modèles que vous souhaitez inclure dans le tableau. Le deuxième modèle sélectionné
apparaîtra dans la deuxième colonne à partir de la gauche, et ainsi de suite.

6. Lorsque vous avez terminé de composer la table modèle, affichez-la en double-cliquant sur son icône. Dans
le menu Edition de la fenêtre qui apparaît, vous avez la possibilité de copier le tableau dans le presse-
papiers sous différents formats.

7. Si l'ordre des modèles dans le tableau n'est pas ce que vous vouliez, cliquez avec le bouton droit sur l'icône du tableau des
modèles et sélectionnez "Effacer le tableau". Revenez ensuite à l'étape 4 ci-dessus et réessayez.

Une simple instance de la table modèle de Gretl est illustrée à la figure3.3.

Figure 3.3 :Exemple de table modèle


Chapitre 3. Modes de travail 17

La page graphique

L'icône « page graphique » de la fenêtre de session permet de regrouper plusieurs graphiques à imprimer sur
une seule page. Cette installation ne fonctionnera que si vous avez le LUNSystème de composition TEX installé et
capable de générer et d'afficher une sortie PDF ou PostScript. Le format de sortie est contrôlé par votre choix de
programme pour compiler les fichiers TEX, qui se trouve sous l'onglet "Programmes" dans la boîte de dialogue
Préférences (sous le menu "Outils" dans la fenêtre principale). Habituellement, cela devrait êtrepdflatexpour la
sortie PDF oulatexpour PostScript. Dans ce dernier cas, vous devez disposer d'une configuration de travail pour
gérer PostScript, qui inclura généralementdvips, ghostscriptet un spectateur tel quegv, gvoukghostview.

Dans la fenêtre d'affichage des icônes, vous pouvez faire glisser jusqu'à huit graphiques sur l'icône de la page de graphique.
Lorsque vous double-cliquez sur l'icône (ou faites un clic droit et sélectionnez "Afficher"), une page contenant les graphiques
sélectionnés (au format PDF ou EPS) sera composée et ouverte dans votre visionneuse. À partir de là, vous devriez pouvoir
imprimer la page.

Pour effacer la page graphique, faites un clic droit sur son icône et sélectionnez "Effacer".

Comme pour la table modèle, il est également possible de manipuler la page graphique via des commandes en mode
script ou console - voir l'entrée pour legraphpgcommande dans leRéférence des commandes Gretl.

Enregistrement et réouverture des sessions

Si vous créez des modèles ou des graphiques que vous pensez pouvoir réexaminer plus tard, alors avant de quitter gretl
sélectionnez "Fichiers de session, Enregistrer la session" dans le menu Fichier et donnez un nom sous lequel enregistrer
la session. Pour rouvrir la session plus tard, soit

• Lancez gretl puis rouvrez le fichier de session en allant dans « Fichier, Fichiers de session, Ouvrir session », ou

• Depuis la ligne de commande, tapezgret -rfichier de session, oùfichier de sessionest le nom sous lequel la
session a été enregistrée, ou

• Faites glisser l'icône représentant un fichier de session sur gretl.


Chapitre 4

Fichiers de données

4.1 Formats des fichiers de données

Gretl a son propre format natif pour les fichiers de données. La plupart des utilisateurs ne voudront probablement pas lire ou
écrire de tels fichiers en dehors de gretl lui-même, mais cela peut parfois être utile et des détails sur les formats de fichiers sont
donnés en annexeUN. Le programme peut également importer des données à partir d'une variété d'autres formats. Dans le
programme GUI, cela peut être fait via le menu "Fichier, Ouvrir les données, Fichier utilisateur" - notez la liste déroulante des
types de fichiers acceptables. En mode script, utilisez simplement leouvrircommande. Les formats d'importation pris en charge
sont les suivants.

• Fichiers de texte brut (séparés par des virgules ou "CSV" étant le type le plus courant). Pour plus de détails sur ce
que Gretl attend de tels fichiers, voir Section4.3.

• Feuilles de calcul : MSExcel, Gnumériqueet Document ouvert (ODS). Les exigences pour de tels fichiers sont
données dans la section4.3.

• Étatfichiers de données (.données).

• SPSSfichiers de données (.sav).

• SAS "xport" fichiers (.xpt).

• Avisfichiers de travail (.wf1).1

• JMultifichiers de données.

Lorsque vous importez des données à partir d'un format texte brut, gretl ouvre une fenêtre de "diagnostic", rendant compte de
sa progression dans la lecture des données. Si vous rencontrez un problème avec des données mal formatées, les messages de
cette fenêtre devraient vous aider à résoudre le problème.

Notez que gretl a une fonction pour écrire des données dans les formats natifs de GNUR, Octave, JMulTiet PcGive (voir
l'annexeD). Dans le client GUI, cette option se trouve dans le menu "Fichier, Exporter les données" ; dans le client de ligne
de commande, utilisez lemagasincommande avec l'indicateur d'option approprié.

4.2 Bases de données

Pour travailler avec de grandes quantités de données, Gretl est fourni avec une routine de gestion de base de données. UN base de
données, par opposition à unfichier de données, n'est pas lu directement dans l'espace de travail du programme. Une base de données
peut contenir des séries de fréquences mixtes et des gammes d'échantillons. Vous ouvrez la base de données et sélectionnez les séries à
importer dans le jeu de données de travail. Vous pouvez ensuite enregistrer ces séries dans un fichier de données au format natif si vous
le souhaitez. Les bases de données sont accessibles via l'élément de menu "Fichier, Bases de données".

Pour plus de détails sur le format des bases de données Gretl, voir l'annexeUN.

1Voirhttp://users.wfu.edu/cottrell/eviews_format/.

18
Chapitre 4. Fichiers de données 19

Accès en ligne aux bases de données

Plusieurs bases de données gretl sont disponibles auprès de l'Université de Wake Forest. Votre ordinateur doit être
connecté à Internet pour que cette option fonctionne. Veuillez consulter la description de la commande "données" dans
le menu Aide.

☞Visiter le grétpage de donnéespour plus de détails et des mises à jour sur les données disponibles.

Formats de bases de données étrangères

Merci à Thomas Doan deEstima, qui a mis à disposition la spécification du format de base de données utilisé par RATS 4
(Regression Analysis of Time Series), gretl peut gérer de telles bases de données, ou du moins un sous-ensemble de celles-ci, à
savoir des bases de données de séries chronologiques contenant des séries mensuelles et trimestrielles.

Gretl peut également importer des données depuisPcGivebases de données. Ceux-ci prennent la forme d'une paire de fichiers,
l'un contenant les données réelles (avec le suffixe .bn7)et un contenant des informations supplémentaires (.in7).

De plus, gretl propose une connectivité ODBC. Soyez averti : cette fonctionnalité est destinée aux utilisateurs quelque
peu avancés ; il n'y a actuellement aucune interface graphique. Les lecteurs intéressés trouveront plus d'informations en
annexe42.

4.3 Créer un ensemble de données à partir de zéro

Il existe plusieurs manières de procéder :

1. Recherchez ou créez à l'aide d'un éditeur de texte un fichier de données en texte brut et ouvrez-le via "Importer".

2. Utilisez votre feuille de calcul préférée pour établir le fichier de données, enregistrez-le au format séparé par des virgules si
nécessaire (cela peut ne pas être nécessaire si le format de la feuille de calcul est MS Excel, Gnumeric ou Open Document),
puis utilisez l'une des options "Importer" .

3. Utilisez la feuille de calcul intégrée de Gretl.

4. Sélectionnez des séries de données dans une base de données appropriée.

5. Utilisez votre éditeur de texte préféré ou d'autres outils logiciels pour créer un fichier de données au format gret
indépendamment.

Voici quelques commentaires et détails sur ces méthodes.

Points communs sur les données importées

Les options (1) et (2) impliquent l'utilisation du mécanisme « d'importation » de gretl. Pour que le programme puisse lire ces données avec
succès, certaines conditions générales doivent être satisfaites :

• La première ligne doit contenir des noms de variable valides. Un nom de variable valide est de 31 caractères maximum ;
commence par une lettre ; et ne contient que des lettres, des chiffres et le caractère de soulignement, _. (Les noms de
variables plus longs seront tronqués à 31 caractères.) Qualifications à ce qui précède : Premièrement, dans le cas d'une
importation de texte brut, si le fichier ne contient aucune ligne avec des noms de variables, le programme ajoutera
automatiquement des noms,v1, v2et ainsi de suite. Deuxièmement, par "la première rangée", on entend la première
pertinentligne. Dans le cas d'importations de texte brut, les lignes vides et les lignes commençant par un signe dièse, #,
sont ignorées. Dans le cas des importations Excel, Gnumeric et ODS, une boîte de dialogue vous est présentée dans
laquelle vous pouvez sélectionner un décalage dans la feuille de calcul, de sorte que gretl ignorera un nombre spécifié de
lignes et/ou de colonnes.

• Valeurs des données : elles doivent constituer un bloc rectangulaire, avec une variable par colonne (et une
observation par ligne). Le nombre de variables (colonnes de données) doit correspondre au nombre de noms de
variables donnés. Voir aussi la rubrique4.6. Des données numériques sont attendues, mais dans le cas de
Chapitre 4. Fichiers de données 20

lors de l'importation à partir de texte brut, le programme offre une gestion limitée des données de caractères
(chaînes) : si une colonne donnée ne contient que des données de caractères, des codes numériques consécutifs
sont remplacés par les chaînes, et une fois l'importation terminée, un tableau est imprimé montrant la
correspondance entre les les chaînes et les codes.

• Dates (ou étiquettes d'observation) : Facultativement, lesd'abordLa colonne peut contenir des chaînes telles que des dates
ou des étiquettes pour les observations transversales. Ces chaînes ont un maximum de 15 caractères (comme pour les
noms de variables, les chaînes plus longues seront tronquées). Une colonne de ce type doit être précédée de la chaîneobs
oudate,ou l'entrée de la première ligne peut être laissée vide.

Pour que les dates soient reconnues comme telles, les chaînes de date doivent respecter l'un ou l'autre d'un
ensemble de formats spécifiques, comme suit. Pourannueldonnées : années à 4 chiffres. Pourtrimestrieldonnées :
une année à 4 chiffres, suivie d'un séparateur (soit un point, deux-points ou la lettreQ),suivi d'un quart à 1 chiffre.
Exemples:1997.1, 2002:3, 1947Q1.Pourmensueldonnées : une année à 4 chiffres, suivie d'un point ou de deux-
points, suivi d'un mois à deux chiffres. Exemples:1997.01, 2002 :10.

Les fichiers en texte brut ("CSV") peuvent utiliser une virgule, un espace, une tabulation ou un point-virgule comme séparateur de colonne.
Lorsque vous ouvrez un tel fichier via l'interface graphique, vous avez la possibilité de spécifier le séparateur, bien que dans la plupart des
cas, il doive être détecté automatiquement.

Si vous utilisez un tableur pour préparer vos données, vous pouvez facilement effectuer diverses transformations
des données "brutes" (additionner, prendre des pourcentages ou autre): notez cependant que vous pouvez
également faire ce genre de chose facilement - peut-être plus facilement - dans gretl, en utilisant les outils du
menu "Ajouter".

Ajout de données importées


Vous souhaiterez peut-être établir un ensemble de données pièce par pièce, en important progressivement des données provenant
d'autres sources. Ceci est pris en charge via les éléments de menu "Fichier, Ajouter des données": gretl vérifiera la conformité des
nouvelles données avec l'ensemble de données existant et, si tout semble OK, fusionnera les données. Vous pouvez ajouter de nouvelles
variables de cette manière, à condition que la fréquence des données corresponde à celle de l'ensemble de données existant. Ou vous
pouvez ajouter de nouvelles observations pour les séries de données qui sont déjà présentes ; dans ce cas, les noms de variables doivent
correspondre correctement. Notez que par défaut (c'est-à-dire si vous choisissez "Ouvrir les données" plutôt que "Ajouter des données"),
l'ouverture d'un nouveau fichier de données ferme l'actuel.

Utilisation de la feuille de calcul intégrée

Dans le menu "Fichier, Nouvel ensemble de données", vous pouvez choisir le type d'ensemble de données que vous
souhaitez établir (par exemple, séries chronologiques trimestrielles, transversales). Vous serez ensuite invité à entrer les
dates de début et de fin (ou les numéros d'observation) et le nom de la première variable à ajouter à l'ensemble de
données. Après avoir fourni ces informations, vous serez confronté à une simple feuille de calcul dans laquelle vous
pourrez saisir des valeurs de données. Dans la fenêtre du tableur, un clic droit de la souris fait apparaître un menu
contextuel permettant d'ajouter une nouvelle variable (colonne), d'ajouter une observation (ajouter une ligne en pied de
feuille), ou d'insérer une observation en point sélectionné (déplacez les données vers le bas et insérez une ligne vide.)

Une fois que vous avez saisi les données dans la feuille de calcul, vous les importez dans l'espace de travail de Gretl à l'aide du bouton
"Appliquer les modifications" de la feuille de calcul.

Veuillez noter que la feuille de calcul de gretl est assez basique et ne prend pas en charge les fonctions ou les formules. Les
transformations de données se font via les menus « Ajouter » ou « Variable » de la fenêtre principale.

Sélection dans une base de données

Une autre alternative consiste à établir votre jeu de données en sélectionnant des variables dans une base de données.

Commencez par l'élément de menu "Fichier, Bases de données". Celui-ci comporte quatre forks : « Gretl native », « RATS 4 », «
PcGive » et « On database server ». Vous devriez pouvoir trouver le fichierfedstl.bindans le sélecteur de fichier qui
Chapitre 4. Fichiers de données 21

s'ouvre si vous choisissez l'option « Gretl native » puisque ce fichier, qui contient une large collection de séries
chronologiques macroéconomiques américaines, est fourni avec la distribution.

Vous ne trouverez rien sous "RATS 4" sauf si vous avez acheté des données RATS.2Si vous possédez des données RATS,
vous devez accéder à la boîte de dialogue "Outils, Préférences, Général", sélectionner l'onglet Bases de données et
indiquer le chemin d'accès correct à vos fichiers RATS.

Si votre ordinateur est connecté à Internet, vous devriez trouver plusieurs bases de données (à l'Université de Wake
Forest) sous « Sur le serveur de base de données ». Vous pouvez les parcourir à distance ; vous avez également la
possibilité de les installer sur votre propre ordinateur. La fenêtre initiale des bases de données distantes comporte un
élément indiquant, pour chaque fichier, s'il est déjà installé localement (et si oui, si la version locale est à jour avec la
version de Wake Forest).

En supposant que vous avez réussi à ouvrir une base de données, vous pouvez importer les séries sélectionnées dans l'espace de travail de
gretl en utilisant l'élément de menu "Séries, Importer" dans la fenêtre de la base de données, ou via le menu contextuel qui apparaît si vous
cliquez sur le bouton droit de la souris, ou en faisant glisser le série dans la fenêtre principale du programme.

Créer un fichier de données gret indépendamment

Il est possible de créer un fichier de données dans l'un ou l'autre des formats propres à gretl à l'aide d'un éditeur
de texte ou d'outils logiciels tels queok, sedouperl.Cela peut être un bon choix si vous avez déjà de grandes
quantités de données sous forme lisible par machine. Vous devrez bien sûr étudier ces formats de données (basés
sur XML ou "traditionnels") comme décrit dans l'annexeUN.

4.4 Structurer un jeu de données

Une fois vos données lues par gretl, il peut être nécessaire de fournir des informations sur la nature des
données. Nous distinguons trois types de jeux de données :

1. Coupe transversale

2. Séries chronologiques

3. Données du panneau

L'outil principal pour ce faire est l'entrée de menu "Données, Structure du jeu de données" dans l'interface
graphique, ou lesetobscommande pour les scripts et l'interface de ligne de commande.

Données transversales

Par section transversale, nous entendons des observations sur un ensemble d'"unités" (qui peuvent être des entreprises, des pays, des
individus ou autre) à un moment donné. Il s'agit de l'interprétation par défaut d'un fichier de données : s'il n'y a pas suffisamment
d'informations pour interpréter les données comme des séries chronologiques ou des données de panel, elles sont automatiquement
interprétées comme une coupe transversale. Dans le cas peu probable où des données transversales seraient interprétées à tort comme
des séries chronologiques, vous pouvez corriger cela en sélectionnant l'élément de menu "Données, Structure du jeu de données". Cliquez
sur le bouton radio "transversal" dans la boîte de dialogue qui apparaît, puis cliquez sur "En avant". Cliquez sur « OK » pour confirmer
votre sélection.

Données de séries chronologiques

Lorsque vous importez des données à partir d'une feuille de calcul ou d'un fichier texte brut, gretl fera des efforts assez acharnés pour glaner des
informations de séries chronologiques à partir de la première colonne des données, s'il semble plausible que de telles informations puissent être
présentes. Si la structure de la série chronologique est présente mais n'est pas reconnue, vous pouvez à nouveau utiliser l'élément de menu
"Données, structure de l'ensemble de données". Sélectionnez « Séries chronologiques » et cliquez sur « Suivant » ; sélectionnez la fréquence de
données appropriée et cliquez à nouveau sur "Suivant" ; puis sélectionnez ou entrez l'observation de départ

2Voirwww.estima.com
Chapitre 4. Fichiers de données 22

et cliquez sur "Suivant" une fois de plus. Enfin, cliquez sur « OK » pour confirmer l'interprétation de la série chronologique si elle est
correcte (ou cliquez sur « Retour » pour faire des ajustements si nécessaire).

Outre l'activité de base consistant à interpréter un ensemble de données comme des séries chronologiques, d'autres problèmes peuvent
survenir concernant la fréquence des données de séries chronologiques. Dans un ensemble de données de séries chronologiques gretl,
toutes les séries doivent avoir la même fréquence. Supposons que vous souhaitiez créer un jeu de données combiné à l'aide de séries qui,
dans leur état d'origine, n'ont pas toutes la même fréquence. Par exemple, certaines séries sont mensuelles et d'autres trimestrielles.

Votre première étape consiste à formuler une stratégie : voulez-vous vous retrouver avec un ensemble de données trimestriel ou
mensuel ? Un point fondamental à noter ici est que le « compactage » des données d'une fréquence élevée (par exemple mensuelle) à une
fréquence inférieure (par exemple trimestrielle) ne pose généralement pas de problème. Vous perdez des informations ce faisant, mais en
général il est parfaitement légitime de prendre (disons) la moyenne de trois observations mensuelles pour créer une observation
trimestrielle. D'autre part, "étendre" les données d'une fréquence inférieure à une fréquence supérieure n'est pas, en général, une
opération valide.

Dans la plupart des cas, la meilleure stratégie consiste donc à commencer par créer un ensemble de donnéesinférieurfréquence, puis de
compacter les données de fréquence plus élevée pour les faire correspondre. Lorsque vous importez des données à fréquence plus élevée
d'une base de données dans l'ensemble de données actuel, vous avez le choix entre une méthode de compactage (moyenne, somme,
début de période ou fin de période). Dans la plupart des cas, "moyenne" est susceptible d'être appropriée.

Toipeutimportez également des données à basse fréquence dans un ensemble de données à haute fréquence,
mais cela n'est généralement pas recommandé. Ce que fait gretl dans ce cas, c'est simplement répliquer les
valeurs de la série de fréquence inférieure autant de fois que nécessaire. Par exemple, supposons que nous ayons
une série trimestrielle avec la valeur 35,5 en 1990:1, le premier trimestre de 1990. Lors de l'expansion à mensuel,
la valeur 35,5 sera attribuée aux observations de janvier, février et mars 1990. La variable élargie est donc inutile
pour une analyse fine des séries temporelles, en dehors du cas particulier où l'on sait que la variable en question
reste effectivement constante sur les sous-périodes.
Lorsque la fréquence actuelle des données est appropriée, gretl propose à la fois les options "Compacter les données" et "Développer les
données" dans le menu "Données". Ces options fonctionnent sur l'ensemble du jeu de données, en compactant ou en étendant toutes les
séries. Elles doivent être considérées comme des options « expertes » et doivent être utilisées avec prudence.

Données du panneau

Les données de panel sont intrinsèquement tridimensionnelles, les dimensions étant la variable, l'unité transversale et la
période. Par exemple, un nombre particulier dans un ensemble de données de panel pourrait être identifié comme
l'observation sur le stock de capital pour General Motors en 1980. (Une note sur la terminologie : nous utilisons les
termes « unité transversale », « unité » et « groupe » indifféremment ci-dessous pour désigner les entités qui composent
la dimension transversale du panel (il peut s'agir, par exemple, d'entreprises, de pays ou de personnes).

Pour la représentation dans un fichier informatique textuel (et aussi pour les calculs internes de gretl) les trois
dimensions doivent en quelque sorte être aplaties en deux. Cet « aplatissement » consiste à prendre des couches de
données qui s'empileraient naturellement dans une troisième dimension et à les empiler dans la dimension verticale.

gretl s'attend toujours à ce que les données soient organisées « par observation », c'est-à-dire que chaque ligne représente une
observation (et chaque variable occupe une et une seule colonne). Dans ce contexte, l'aplatissement d'un ensemble de données
de panel peut être effectué de deux manières :

• Séries temporelles empilées : les blocs verticaux successifs comprennent chacun une série temporelle pour une unité donnée.

• Coupes superposées : les blocs verticaux successifs comportent chacun une coupe pour une période
donnée.

Vous pouvez saisir les données selon l'arrangement qui vous convient le mieux. En interne, cependant, gretl stocke toujours les données
du panel sous la forme de séries chronologiques empilées.
Chapitre 4. Fichiers de données 23

4.5 Spécificités des données du panel

Lorsque vous importez des données de panel dans gretl à partir d'une feuille de calcul ou d'un format séparé par des virgules, la
nature du panel des données ne sera pas reconnue automatiquement (les données seront très probablement traitées comme «
non datées »). Une interprétation en panel peut être imposée aux données à l'aide de l'interface graphique ou via lesetobs
commande.

Dans l'interface graphique, utilisez l'élément de menu "Données, Structure du jeu de données". Dans la première
boîte de dialogue qui apparaît, sélectionnez "Panneau". Dans la boîte de dialogue suivante, vous avez un choix à
trois voies. Les deux premières options, « Séries chronologiques empilées » et « Sections transversales empilées »,
sont applicables si l'ensemble de données est déjà organisé de l'une de ces deux manières. Si vous sélectionnez
l'une de ces options, l'étape suivante consiste à spécifier le nombre d'unités de section transversale dans
l'ensemble de données. La troisième option, « Utiliser des variables d'index », est applicable si l'ensemble de
données contient deux variables qui indexent respectivement les unités et les périodes de temps ; l'étape suivante
consiste alors à sélectionner ces variables. Par exemple, un fichier de données peut contenir une variable de code
de pays et une variable représentant l'année de l'observation.
LesetobsLa commande a des options parallèles à celles de l'interface graphique. Si des variables d'index appropriées
sont disponibles, vous pouvez faire, par exemple

setobs unitvar timevar --panel-vars

oùunitévarest une variable qui indexe les unités ettimevarest une variable indexant les périodes. Sinon, vous
pouvez utiliser le formulairesetobsfréquence1:1structure, oùfréquenceest remplacé par la "taille de bloc" des
données (c'est-à-dire le nombre de périodes dans le cas de séries temporelles empilées, ou le nombre d'unités
dans le cas de sections transversales empilées) et la structure est soit --séries temporelles empiléesou
- - section empilée.Deux exemples sont donnés ci-dessous : le premier est adapté à un panel sous forme de
séries chronologiques empilées avec des observations de 20 périodes ; le second pour les sections empilées
de 5 unités.

setobs 20 1:1 --stacked-time-series setobs 5 1:1 --


stacked-cross-section

Données du panel classées par variable

Les données de panel accessibles au public sont parfois classées « par variable ». Supposons que nous ayons des
données sur deux variables,x1etx2,pour chacun des 50 États au cours de chacune des 5 années (donnant un total de 250
observations par variable). Une représentation textuelle d'un tel ensemble de données commencerait par un bloc pour
x1,avec 50 lignes correspondant aux états et 5 colonnes correspondant aux années. Cela serait suivi, verticalement, par
un bloc avec la même structure pour la variablex2.Un fragment d'un tel fichier de données est présenté ci-dessous, avec
des observations quinquennales 1965-1985. Imaginez que le tableau continue pour 48 états supplémentaires, suivi de 50
autres lignes pour la variablex2.

x1
1965 1970 1975 1980 1985
RA 100,0 110,5 118,7 131,2 160,4 AZ 100,0 104,3
113,8 120,9 140,6

Si un fichier de données avec ce type de structure est lu dans gretl,3le programme interprétera les colonnes comme des variables
distinctes, de sorte que les données ne seront pas utilisables "telles quelles". Mais il existe un mécanisme pour corriger la
situation, à savoir laempilerfonction.

Considérez la première colonne de données dans le fragment ci-dessus : les 50 premières lignes de cette colonne
constituent une coupe transversale pour la variablex1en 1965. Si nous pouvions créer une nouvelle série en empilant les

3Notez que vous devrez modifier légèrement un tel fichier de données avant de pouvoir le lire. La ligne contenant le nom de la
variable (dans cet exemplex1)devra être supprimée, ainsi que la ligne initiale contenant les années, sinon elles seront considérées comme
des données numériques.
Chapitre 4. Fichiers de données 24

50 premières entrées de la deuxième colonne sous les 50 premières entrées de la première, on serait en passe de
constituer un jeu de données « par observation » (dans la première des deux formes citées ci-dessus, coupes
empilées). Autrement dit, nous aurions une colonne comprenant une section pourx1en 1965, suivie d'une coupe
transversale pour la même variable en 1970.
Le script gretl suivant illustre comment nous pouvons accomplir l'empilement, pour les deuxx1etx2.Nous supposons que
le fichier de données d'origine s'appellepanneau.txt,et que dans ce fichier les colonnes portent des "noms de variables"
v1, v2, . . . , v5. (Les colonnes ne sont pas vraiment des variables, mais dans un premier temps, nous « prétendons »
qu'elles le sont.)

ouvrir panel.txt
série x1 = pile(v1..v5, 50) série x2 = pile(v1..v5, 50,
50) setobs 50 1:1 --stacked-cross-section store
panel.gdt x1 x2

Les deuxième et troisième lignes illustrent la syntaxe duempilerfonction, qui a cette signature :

pile de séries (liste L, longueur scalaire, décalage scalaire)

• L :une liste de séries sur lesquelles opérer.


• longueur:un entier donnant le nombre d'observations à tirer de chaque série.
• compenser:un entier donnant le décalage à partir du haut de l'ensemble de données auquel commencer à prendre des valeurs
(facultatif, par défaut à 0).

La syntaxe ".." dans l'exemple ci-dessus construit une liste des 5 séries contiguës à empiler. Plus généralement, vous
pouvez définir une liste nommée de séries et la passer comme premier argument àempiler (voir chapitre15). Dans cet
exemple, nous supposons que l'ensemble de données complet contient 100 lignes, et que dans l'empilement de la
variablex1nous souhaitons lire uniquement les 50 premières lignes de chaque colonne, nous donnons donc 50comme
deuxième argument.

À la ligne 3, nous faisons l'empilement pour la variablex2.Encore une fois, nous voulons unlongueurde 50 pour les composants
de la série empilée, mais cette fois, nous voulons commencer à lire à partir de la 50e ligne des données d'origine, et nous
ajoutons donc un troisièmecompenserargument de 50. La ligne 4 impose alors une interprétation de panel sur les données.
Enfin, nous sauvegardons les données empilées dans un fichier, avec l'interprétation du panel.

Le script illustratif ci-dessus est approprié lorsque le nombre de variables à traiter est petit. Lorsqu'il y a alors de
nombreuses variables dans l'ensemble de données, il sera plus pratique d'utiliser une boucle pour accomplir
l'empilement, comme indiqué dans le script suivant. La configuration est supposée être la même que dans le cas
précédent (50 unités, 5 périodes), mais avec 20 variables au lieu de 2.

ouvrir panel.txt
list L = v1..v5 # prédéfinir une liste de longueur scalaire série
= 50
boucle i=1..20
décalage scalaire = (i - 1) * série de longueur x$i =
stack(L, length, offset) endloop

setobs 50 1.01 --stacked-cross-section store


panel.gdt x1..x20

Séries chronologiques côte à côte

Il existe un deuxième type de données que vous souhaiterez peut-être convertir au format de panneau de Gretl, à savoir des
séries chronologiques côte à côte pour un certain nombre d'unités transversales. Par exemple, un fichier de données peut
contenir des séries de PIB distinctes de longueur communeJpour chacun deNdes pays. Pour les transformer en un seul empilé
Chapitre 4. Fichiers de données 25

série chronologique laempilerfonction peut à nouveau être utilisée. Un exemple suit, où nous supposons que la source
de données d'origine est un fichier séparé par des virgules nomméPIB.csv,contenant des données sur le PIB pour les
pays d'Autriche (PIB_AT)au Zimbabwé (PIB_ZW)en colonnes consécutives.

ouvrir GDP.csv
scalaire T = $nobs # la liste des nombres de périodes L
= GDP_AT..GDP_ZW
série PIB = stack(L, T)
setobs T 1:01 --stacked-time-series store
panel.gdt PIB

Le fichier de données obtenu,panneau.gdt,contiendra une seule série de longueurNToùNest le nombre de pays et


Jest la longueur de l'ensemble de données d'origine. On pourrait insérer des variantes révisées des lignes 3 et 4
du script si le fichier original contenait des séries côte à côte supplémentaires par pays pour l'investissement, la
consommation ou autre.

Chaînes de marqueur de données de panneau

Il peut être utile avec des données de panel d'avoir les observations identifiées par des marqueurs UN
mnémoniques. fonction spéciale dans legenrecommande est disponible à cet effet.
Dans l'exemple sous l'en-tête "Données de panel classées par variable" ci-dessus, supposons que tous les états
sont identifiés par des codes à deux lettres dans la colonne la plus à gauche du fichier de données d'origine.
Quand leempiler est appelée comme indiqué, ces codes seront empilés avec les valeurs de données. Si la
première ligne est marquéeRApour l'Arkansas, alors le marqueurRAfinira par apparaître sur chaque ligne
contenant une observation pour l'Arkansas. C'est très bien, mais ces marqueurs ne nous disent rien sur la date de
l'observation. Pour remédier à cela, nous pourrions faire :

temps de genre
année de la série = 1960 + (5 * temps) marqueurs
genre = "%s:%d", marqueur, année

La première ligne génère un indice de base 1 représentant la période de chaque observation, et la deuxième ligne
utilise letempsvariable pour générer une variable représentant l'année de l'observation. La troisième ligne
contient cette particularité : si (et seulement si) le nom de la nouvelle « variable » à générer est Marqueurs,la
partie de la commande suivant le signe égal est considérée comme une chaîne de format de style C (qui doit être
entourée de guillemets doubles), suivie d'une liste d'arguments séparés par des virgules. Les arguments seront
imprimés selon le format donné pour créer un nouvel ensemble de marqueurs d'observation. Les arguments
valides sont soit les noms des variables dans l'ensemble de données, soit la chaînemarqueur qui désigne le
marqueur d'observation préexistant. Les spécificateurs de format susceptibles d'être utiles dans ce contexte sont
%spour une chaîne et %dpour un entier. exemple %.3sn'utilisera que les trois premiers caractères
Les chaînes peuvent de
êtrelatronquées :
chaîne.
pour couper les caractères initiaux
un marqueur d'observation existant lors de la construction d'un nouveau, vous pouvez utiliser la syntaxemarqueur + n,
oùnest un entier positif : dans le cas où le premiernles caractères seront ignorés.

Une fois les commandes ci-dessus traitées, les marqueurs d'observation ressembleront, par exemple, à
AR:1965,où le code d'état à deux lettres et l'année de l'observation sont assemblés avec deux-points.

Variables fictives du panel

Dans une étude par panel, vous souhaiterez peut-être construire des variables fictives de l'un ou des deux types suivants : (a) des variables
fictives comme identifiants uniques pour les unités ou les groupes, et (b) des variables fictives comme identifiants uniques pour les
périodes. Le premier peut être utilisé pour permettre à l'ordonnée à l'origine de la régression de différer d'une unité à l'autre, le second
pour permettre à l'ordonnée à l'origine de différer d'une période à l'autre.

Deux fonctions spéciales sont disponibles pour créer de tels mannequins. Ceux-ci se trouvent sous le menu "Ajouter"
dans l'interface graphique, ou sous legenrecommande en mode script ougretcli.
Chapitre 4. Fichiers de données 26

1. "factices d'unité" (commande de scriptgenr unitdum).Cette commande crée un ensemble de variables


fictives identifiant les unités de la section. La variabledu_1aura la valeur 1 dans chaque ligne
correspondant à une observation de l'unité 1, 0 sinon ;du_2aura la valeur 1 dans chaque ligne
correspondant à une observation de l'unité 2, 0 sinon ; et ainsi de suite.

2. "time dummies" (commande de scriptgenr timedum).Cette commande crée un ensemble de variables


factices identifiant les périodes. La variabledt_1aura la valeur 1 dans chaque ligne correspondant à une
observation de période 1, 0 sinon ;dt_2aura la valeur 1 dans chaque ligne correspondant à une observation
de période 2, 0 sinon ; et ainsi de suite.

Si un ensemble de données de panel a leANNÉEde l'observation saisie comme l'une des variables, vous pouvez créer une variable
fictive périodique pour sélectionner une année particulière, par exemplegenr dum = (ANNEE==1960).Vous pouvez également
créer des variables fictives périodiques à l'aide de l'opérateur de module, %. Par exemple, pour créer une variable fictive avec la
valeur 1 pour la première observation et toutes les trentièmes observations par la suite, 0 sinon, faites

index de genre
série dum = ((index-1) % 30) == 0

Retards, différences, tendances

Si les périodes sont régulièrement espacées, vous pouvez utiliser des valeurs décalées de variables dans une régression de panel
(mais voir aussi le chapitre24); vous pouvez également souhaiter construire les différences premières des variables d'intérêt.

Une fois qu'un jeu de données est identifié comme un panel, gretl gérera correctement la génération de ces variables.
Par exemple la commandegenre x1_1 = x1(-1)va créer une variable qui contient le premier décalage dex1le cas échéant,
et le code de valeur manquante lorsque le décalage n'est pas disponible (par exemple, au début de la série
chronologique pour chaque groupe). Lorsque vous exécutez une régression à l'aide de ces variables, le programme
ignore automatiquement les observations manquantes.

Lorsqu'un ensemble de données de panel a une dimension temporelle assez importante, vous souhaiterez peut-
être inclure une tendance dans l'analyse. La commandetemps de genrecrée une variable nomméetempsqui va de
1 àJpour chaque unité, oùJest la longueur de la dimension chronologique du panel. Si vous souhaitez créer un
index qui s'exécute consécutivement de 1 àm ×J, oùmest le nombre d'unités dans le panneau, utilisez index genre.

Statistiques de base par unité

gretl contient des fonctions qui peuvent être utilisées pour générer des statistiques descriptives de base
pour une variable donnée, sur une base unitaire ; ceux-ci sontpnobs() (nombre de cas valides),min()et
pmax() (minimum et maximum) etmoyenne()etpsd() (moyenne et écart-type).
Pour illustrer brièvement, supposons que nous ayons un ensemble de données de panel comprenant 8 observations de séries
chronologiques sur chacun desNunités ou groupes. Puis la commande

série pmx = pmean(x)

crée une série de cette forme : les 8 premières valeurs (correspondant à l'unité 1) contiennent la moyenne deXpour
l'unité 1, les 8 valeurs suivantes contiennent la moyenne de l'unité 2, et ainsi de suite. Lepsd()fonction fonctionne de
manière similaire. L'écart type de l'échantillon pour le groupejeest calculé comme
√∑
(x −x̄2 je)
sje=
Jje−1

oùJjeindique le nombre d'observations valides surXpour l'unité donnée,Xjedésigne la moyenne du groupe et


la sommation concerne les observations valides pour le groupe. SiJje<2, cependant, l'écart type est
enregistré comme 0.
Chapitre 4. Fichiers de données 27

Une utilisation particulière depsd()peut être utile de noter. Si vous voulez former un sous-échantillon d'un panel qui ne
contient que les unités pour lesquelles la variableXvarie dans le temps, vous pouvez soit utiliser

smpl pmin(x) < pmax(x) --restrict

ou

smpl psd(x) > 0 --restrict

4.6 Valeurs de données manquantes

Représentation et manipulation
Les valeurs manquantes sont représentées en interne parNaN ("not a number »), tel que défini dans la norme à virgule flottante
IEEE 754. Dans un fichier de données au format natif, ils doivent être représentés commeN / A.Lors de l'importation de données
CSV, Gretl accepte plusieurs représentations courantes des valeurs manquantes, notamment−999, la chaîneN / A (en majuscules
ou minuscules), un seul point ou simplement une cellule vide. Les cellules vides doivent, bien sûr, être correctement délimitées,
par exemple120.6,,5.38,dans lequel la valeur médiane est présumée manquante.

En ce qui concerne la gestion des valeurs manquantes au cours de l'analyse statistique, gretl procède comme suit :

• Dans le calcul des statistiques descriptives (moyenne, écart-type, etc.) sous larésumécommande, les valeurs
manquantes sont simplement ignorées et la taille de l'échantillon est ajustée en conséquence.

• Lors de l'exécution des régressions, gretl ajuste d'abord le début et la fin de la plage d'échantillons, en tronquant
l'échantillon si nécessaire. Les valeurs manquantes au début de l'échantillon sont courantes dans le travail sur les séries
chronologiques en raison de l'inclusion des décalages, des différences premières, etc. les valeurs manquantes à la fin de
la plage ne sont pas rares en raison de la mise à jour différentielle des séries et éventuellement de l'inclusion de pistes.

Si gretl détecte des valeurs manquantes "à l'intérieur" de la plage d'échantillonnage (éventuellement tronquée) pour une
régression, le résultat dépend du caractère de l'ensemble de données et de l'estimateur choisi. Dans de nombreux cas, le
programme ignorera automatiquement les observations manquantes lors du calcul des résultats de la régression. Dans
cette situation, un message est imprimé indiquant le nombre d'observations supprimées. D'autre part, le saut des
observations manquantes n'est pas pris en charge pour toutes les procédures : les exceptions incluent tous les
estimateurs autorégressifs, les estimateurs de système tels que SUR et les moindres carrés non linéaires. Dans le cas des
données de panel, le saut des observations manquantes n'est pris en charge que si leur omission laisse un panel
équilibré. Si des observations manquantes sont trouvées dans les cas où elles ne sont pas prises en charge, gretl donne
un message d'erreur et refuse de produire des estimations.

Manipulation des valeurs manquantes

Certaines fonctions spéciales sont disponibles pour le traitement des valeurs manquantes. La fonction booléenne
manquant()prend le nom d'une variable comme unique argument ; il renvoie une série avec la valeur 1 pour
chaque observation à laquelle la variable donnée a une valeur manquante, et la valeur 0 sinon (c'est-à-dire si la
variable donnée a une valeur valide à cette observation). La fonctiond'accord()est complémentaire de manquant;
ce n'est qu'un raccourci pour !manquant (où ! est l'opérateur booléen NON). Par exemple, on peut compter les
valeurs manquantes pour la variableXen utilisant

scalaire nmiss_x = somme(manquant(x))

La fonctionzéromiss(),qui prend à nouveau une seule série comme argument, renvoie une série où toutes les valeurs
nulles sont définies sur le code manquant. Ceci doit être utilisé avec prudence - il ne faut pas confondre les valeurs
manquantes et les zéros - mais cela peut être utile dans certains contextes. Par exemple, on peut déterminer la première
observation valide pour une variableXen utilisant
Chapitre 4. Fichiers de données 28

temps de genre
scalaire x0 = min(zeromiss(time * ok(x)))

La fonctionmisszero()fait le contraire dezéro raté,c'est-à-dire qu'il convertit toutes les valeurs manquantes en zéro.

Si des valeurs manquantes interviennent dans les calculs, elles se propagent selon les règles IEEE : notamment, si
l'un des opérandes d'une opération arithmétique est unNaN,le résultat sera aussiNaN.

4.7 Taille maximale des ensembles de données

Fondamentalement, la taille des ensembles de données (à la fois le nombre de variables et le nombre d'observations par
variable) n'est limitée que par les caractéristiques de votre ordinateur. Gretl alloue de la mémoire dynamiquement et
demandera au système d'exploitation autant de mémoire que vos données en ont besoin. Évidemment, alors, vous êtes
finalement limité par la taille de la RAM.

Outre l'option OLS à précision multiple, gretl utilise partout des nombres à virgule flottante à double précision. La taille de ces
nombres en octets dépend de la plate-forme informatique, mais est généralement de huit. Pour donner une notion
approximative des grandeurs, supposons que nous ayons un ensemble de données avec 10 000 observations sur 500 variables.
C'est 5 millions de nombres à virgule flottante ou 40 millions d'octets. Si nous définissons le mégaoctet (Mo) comme 1024×1024
octets, comme c'est le cas en parlant de RAM, c'est un peu plus de 38 Mo. Le programme a besoin de mémoire supplémentaire
pour l'espace de travail, mais même ainsi, la gestion d'un ensemble de données de cette taille devrait être tout à fait faisable sur
un PC actuel, qui au moment de la rédaction est susceptible d'avoir au moins 256 Mo de RAM.

Si la RAM n'est pas un problème, il existe une autre limitation sur la taille des données (bien qu'il soit très peu probable
qu'il s'agisse d'une contrainte contraignante). Autrement dit, les variables et les observations sont indexées par des
entiers signés, et sur un PC typique, ce seront des valeurs de 32 bits, capables de représenter une valeur positive
maximale de 231−1=2,147,483,647.

Les limites mentionnées ci-dessus s'appliquent à la fonctionnalité "native" de gretl. Il existe des limites plus strictes en ce
qui concerne deux programmes tiers disponibles en tant que modules complémentaires de gretl pour certains types
d'analyses de séries temporelles, y compris l'ajustement saisonnier, à savoirTRAMO/SIÈGESetX-12-ARIMA.Ces
programmes utilisent une allocation de mémoire de taille fixe et ne peuvent pas gérer des séries de plus de 600
observations.

4.8 Collections de fichiers de données

Si vous utilisez gretl dans un contexte d'enseignement, vous pourriez être intéressé par l'ajout d'une collection de fichiers de données et/
ou de scripts qui se rapportent spécifiquement à votre cours, de manière à ce que les étudiants puissent les parcourir et y accéder
facilement.

Il existe trois façons d'accéder à ces collections de fichiers :

• Pour les fichiers de données : sélectionnez l'élément de menu "Fichier, Ouvrir les données, Fichier d'échantillon", ou cliquez sur l'icône du dossier dans la
barre d'outils de gretl.

• Pour les fichiers de script : sélectionnez l'élément de menu « Fichier, Fichiers de script, Exemples de scripts ».

Lorsqu'un utilisateur sélectionne l'un des éléments :

• Les fichiers de données ou de script inclus dans la distribution gretl sont automatiquement affichés (ceci inclut les
fichiers relatifs à RamanathanÉconométrie d'introductionet celui de GreeneAnalyse économétrique).

• Le programme recherche certaines collections connues de fichiers de données disponibles en option,


par exemple les fichiers de données de divers manuels d'économétrie (Davidson et MacKinnon,
Gujarati, Stock et Watson, Verbeek, Wooldridge) et le Penn World Table (PWT 5.6). (Voir
Chapitre 4. Fichiers de données 29

la page de donnéessur le site du gretl pour des informations sur ces collections.) Si des fichiers supplémentaires
sont trouvés, ils sont ajoutés aux fenêtres de sélection.

• Le programme recherche alors des collections de fichiers valides (pas forcément connues à l'avance) à ces
endroits : le répertoire de données « système », le répertoire de script système, le répertoire utilisateur, et
tous les sous-répertoires de premier niveau de ceux-ci. Pour référence, les valeurs typiques de ces
répertoires sont indiquées dans le tableau4.1. (Noter quePERSONNELest un espace réservé développé par
Windows, correspondant à « Mes documents » sur les systèmes en anglais.)

Linux MS Windows
répertoire des données système /usr/share/gretl/data c:\Programme Fichiers\gretl\données
répertoire des scripts système /usr/share/gretl/scripts $HOME/ c:\Programme Fichiers\gretl\scripts
répertoire utilisateur gretl PERSONNEL\gretl

Tableau 4.1 :Emplacements typiques des collections de fichiers

Toutes les collections valides seront ajoutées aux fenêtres de sélection. Alors, qu'est-ce qui constitue une collection de
fichiers valide ? Il s'agit soit d'un ensemble de fichiers de données au format gretl XML (avec l'extension .gdtsuffixe) ou
un ensemble de fichiers de script contenant des commandes gretl (avec .entréesuffixe), dans chaque cas accompagné
d'un "fichier maître" ou catalogue. La distribution gretl contient plusieurs exemples de fichiers de catalogue, par exemple
le fichier descriptifsdans lediverssous-répertoire du répertoire de données de gretl etps_descriptionsdans le diverssous-
répertoire du répertoire des scripts.

Si vous ajoutez votre propre collection, les catalogues de données doivent être nommésdescriptifset les
catalogues de scripts doivent être nommésps_descriptions.Dans chaque cas, le catalogue doit être placé (avec les
fichiers de données ou de script associés) dans son propre sous-répertoire spécifique (par exemple/usr/share/
gretl/data/mesdonnéesouc:\userdata\gretl\data\mesdonnées).
Les fichiers de catalogue sont en texte brut ; s'ils contiennent des caractères non ASCII, ils doivent être encodés
en UTF-8. La syntaxe de ces fichiers est simple. Voici par exemple les premières lignes du catalogue de données «
misc » de gretl :

# Gretl : divers fichiers de données illustratifs "arma","exemple de


données artificielles pour le script ARMA" "ects_nls","exemple de
moindres carrés non linéaires" "hamilton","Prix et taux de change, États-
Unis et Italie"

La première ligne, qui doit commencer par un dièse, contient un nom court, ici "Gretl", qui apparaîtra
comme le libellé de l'onglet de cette collection dans la fenêtre du navigateur de données, suivi de deux-
points, suivi d'une courte description facultative de la collection.
Les lignes suivantes contiennent deux éléments, séparés par une virgule et entourés de guillemets doubles. Le
premier est un nom de fichier de données (sans le .gdtsuffixe ici) et le second est une courte description du
contenu de ce fichier de données. Il devrait y avoir une telle ligne pour chaque fichier de données de la collection.

Un fichier de catalogue de scripts ressemble beaucoup, sauf qu'il y a trois champs dans les lignes de fichier : un nom de
fichier (sans son .entréesuffixe), une brève description du point économétrique illustré dans le script, et une brève
indication de la nature des données utilisées. Encore une fois, voici les premières lignes du catalogue de scripts "misc"
fourni :

# Gretl : divers exemples de scripts "arma","Modélisation ARMA","données artificielles"


"ects_nls","Moindres carrés non linéaires (Davidson)","données artificielles" "effet de
levier","Observations influentes","données artificielles" "
longley","Multicolinéarité","Emploi aux États-Unis"
Chapitre 4. Fichiers de données 30

Si vous souhaitez mettre votre propre collecte de données à la disposition des utilisateurs, procédez comme suit :

1. Assemblez les données, dans le format qui vous convient.

2. Convertissez les données au format gretl et enregistrez-les sousgdtdes dossiers. Il est probablement plus facile de convertir les
données en les important dans le programme à partir de texte brut, CSV ou d'un format de feuille de calcul (MS Excel ou Gnumeric)
puis en les enregistrant. Vous souhaiterez peut-être ajouter des descriptions des variables individuelles (l'élément de menu
"Variable, Modifier les attributs") et ajouter des informations sur la source des données (l'élément de menu "Données, Modifier les
informations").

3. Rédigez un fichier de descriptions pour la collection à l'aide d'un éditeur de texte.

4. Placez les fichiers de données ainsi que le fichier de descriptions dans un sous-répertoire du répertoire de données gretl (ou répertoire
utilisateur).

5. Si la collection doit être distribuée à d'autres personnes, regroupez les fichiers de données et le catalogue d'une manière
appropriée, par exemple sous forme de fichier zip.

Si vous assemblez une telle collection et que les données ne sont pas exclusives, nous vous encourageons à soumettre la
collection pour emballage en tant que supplément facultatif gretl.

4.9 Assemblage de données provenant de plusieurs sources

Dans de nombreux contextes, les chercheurs doivent rassembler des données provenant de plusieurs fichiers sources et, dans certains
cas, ces sources ne sont pas organisées de telle sorte que les données peuvent simplement être « collées ensemble » en ajoutant des
lignes ou des colonnes à un ensemble de données de base. En gret, lerejoindreLa commande peut être utilisée à cette fin ; cette
commande est décrite en détail dans le chapitre7.
Chapitre 5

Sous-échantillonner un jeu de données

5.1 Présentation
Certains problèmes subtils peuvent survenir ici; ce chapitre tente d'expliquer les problèmes.

Un sous-échantillon peut être défini par rapport à un jeu de données complet de deux manières différentes : nous les
désignerons par les termes « établissement » de l'échantillon et « restriction » de l'échantillon ; ces méthodes sont décrites dans
les sections5.2 et5.3respectivement. En plus de la rubrique5.4aborde certaines questions particulières relatives aux données de
panel, et la section5.5couvre le rééchantillonnage avec remplacement, qui est utile dans le contexte des statistiques de test
d'amorçage.

La discussion suivante se concentre sur l'approche de la ligne de commande. Mais vous pouvez également invoquer les
méthodes décrites ici via les éléments sous leGoûtermenu dans le programme GUI.

5.2 Réglage de l'échantillon

Par "régler" l'échantillon, nous entendons définir un sous-échantillon simplement en ajustant le point de départ et/ou de fin de la
plage d'échantillons actuelle. Ceci est probablement plus pertinent pour les données de séries chronologiques. Par exemple, on
dispose de données trimestrielles de 1960 : 1 à 2003 : 4, et on veut exécuter une régression en utilisant uniquement les données
des années 1970. Une commande appropriée est alors

spl 1970:1 1979:4

Ou on souhaite mettre de côté un bloc d'observations à la fin de la période de données pour la prévision hors
échantillon. Dans ce cas on pourrait faire

spl ; 2000:4

où le point-virgule est un raccourci pour "laisser l'observation de départ inchangée". (Le point-virgule peut
également être utilisé à la place du deuxième paramètre, pour signifier que l'observation de fin doit être
inchangée.) Par "inchangé" ici, nous entendons inchangé par rapport à la dernièresplparamètre, ou par rapport à
l'ensemble de données complet si aucun sous-échantillon n'a été défini jusqu'à présent. Par exemple, après

spl 1970:1 2003:4


spl ; 2000:4

la plage d'échantillonnage sera de 1970:1 à 2000:4.

Une forme incrémentielle ou relative de définition de la plage d'échantillonnage est également prise en charge. Dans ce cas, un décalage
relatif doit être donné, sous la forme d'un entier signé (ou d'un point-virgule pour indiquer qu'il n'y a pas de changement), à la fois pour le
point de départ et pour le point d'arrivée. Par exemple

spl +1 ;

avancera l'observation de départ d'une unité tout en préservant l'observation de fin, et

petit +2 -1

31
Chapitre 5. Sous-échantillonnage d'un jeu de données 32

avancera à la fois l'observation de départ de deux et retardera l'observation de fin de un.


Une caractéristique importante du « réglage » de l'échantillon tel que décrit ci-dessus est qu'il entraîne nécessairement la
sélection d'un sous-ensemble d'observations qui sont contiguës dans l'ensemble de données complet. La structure du jeu de
données n'est donc pas affectée (par exemple, s'il s'agit d'une série temporelle trimestrielle avant la constitution de l'échantillon,
elle reste une série temporelle trimestrielle après).

5.3 Restriction de l'échantillon


Par « restreindre » l'échantillon, nous entendons sélectionner des observations sur la base d'un critère booléen (logique)
ou au moyen d'un générateur de nombres aléatoires. Ceci est probablement plus pertinent pour les données
transversales ou de panel.

Supposons que nous ayons des données sur un échantillon représentatif d'individus, enregistrant leur sexe, leur revenu et d'autres
caractéristiques. Nous souhaitons sélectionner pour analyse uniquement les femmes. Si nous avons unhommevariable muette avec la
valeur 1 pour les hommes et 0 pour les femmes que nous pourrions faire

smpl male==0 --restrict

à cet effet. Ou supposons que nous voulions restreindre l'échantillon aux répondants ayant des revenus supérieurs à 50 000 $. Ensuite,
nous pourrions utiliser

revenu spl> 50000 --restrict

Une question se pose : si nous émettons les deux commandes ci-dessus dans l'ordre, qu'obtenons-nous dans notre sous-
échantillon : tous les cas avec un revenu supérieur à 50 000 €, ou uniquement les femmes avec un revenu supérieur à 50 000 € ?
Par défaut, la réponse est la dernière : les femmes dont le revenu est supérieur à 50 000. La deuxième restriction s'ajoute à la
première, ou en d'autres termes la restriction finale est le produit logique de la nouvelle restriction et de toute restriction déjà en
place. Si vous souhaitez qu'une nouvelle restriction remplace les restrictions existantes, vous pouvez d'abord recréer l'ensemble
de données complet à l'aide de

spl --full

Alternativement, vous pouvez ajouter leremplacerl'option à lasplcommande:

revenu smpl> 50000 --restrict --replace

Cette option a pour effet de rétablir automatiquement l'ensemble de données complet avant d'appliquer la nouvelle
restriction.

Contrairement à un simple « réglage » de l'échantillon, la « restriction » de l'échantillon peut entraîner la sélection d'observations
non contiguës à partir de l'ensemble de données complet. Cela peut donc modifier la structure de l'ensemble de données.

Cela se voit dans le cas des données de panel. Supposons que nous ayons un panel de cinq entreprises (indexées par la variable
entreprise)observé au cours de chacune de plusieurs années (identifié par la variableannée).Ensuite la restriction

petite année==1995 --restrict

produit un ensemble de données qui n'est pas un panel, mais une coupe transversale pour l'année 1995. De même

smpl firme==3 --restrict

produit un ensemble de données chronologiques pour l'entreprise numéro 3.

Pour ces raisons (non-contiguïté possible dans les observations, changement possible dans la structure des données),
gretl agit différemment lorsque vous « restreignez » l'échantillon plutôt que de simplement le « fixer ». Dans
Chapitre 5. Sous-échantillonnage d'un jeu de données 33

Dans le cas du paramétrage, le programme se contente d'enregistrer les observations de début et de fin et les utilise
comme paramètres pour les différentes commandes nécessitant l'estimation de modèles, le calcul de statistiques, etc. En
cas de restriction, le programme fait une copie réduite de l'ensemble de données et traite par défaut cette copie réduite
comme une simple coupe transversale non datée, mais voir la discussion plus approfondie sur les données de panel
dans la section5.4.

Si vous souhaitez réimposer une interprétation chronologique de l'ensemble de données réduit, vous pouvez le faire en utilisant le setobs
ou l'élément de menu de l'interface graphique "Données, Structure du jeu de données".

Le fait que la « restriction » de l'échantillon entraîne la création d'une copie réduite de l'ensemble de données d'origine
peut poser problème lorsque l'ensemble de données est très volumineux. Avec un tel ensemble de données en mémoire,
la création d'une copie peut conduire à une situation où l'ordinateur manque de mémoire pour calculer les résultats de
régression. Vous pouvez contourner cela comme suit :

1. Ouvrez l'ensemble de données complet et imposez la restriction d'échantillon.

2. Enregistrez une copie du jeu de données réduit sur le disque.

3. Fermez le jeu de données complet et ouvrez le jeu réduit.

4. Poursuivez votre analyse.

Sous-échantillonnage aléatoire

Outre la restriction de l'échantillon sur certains critères déterministes, il peut parfois être utile (lorsque vous travaillez avec de
très grands ensembles de données, ou peut-être pour étudier les propriétés d'un estimateur) de tirer un sous-échantillon
aléatoire à partir de l'ensemble de données complet. Cela peut être fait en utilisant, par exemple,

smpl 100 --aléatoire

pour sélectionner 100 cas. Si vous voulez que l'échantillon soit reproductible, vous devez d'abord définir la graine pour le
générateur de nombres aléatoires, en utilisant leensemblecommande. Ce type d'échantillonnage relève de la catégorie
« restriction » : une copie réduite de l'ensemble de données est effectuée.

5.4 Données du panneau

Considérons pour plus de concret le jeu de données Arellano–Bond fourni avec gretl (abdata.gdt).Cela comprend des données
sur 140 entreprises(n =140) observée au cours des années 1976-1984(T =9). L'ensemble de données est "nominalement équilibré"
en ce sens que la longueur de la série chronologique est la même pour tous les pays (ceci étant une exigence pour qu'un
ensemble de données compte comme un panel dans gretl), mais en fait il y a beaucoup de valeurs manquantes (N / As).

Vous voudrez peut-être sous-échantillonner un tel ensemble de données dans la dimension transversale (limiter l'échantillon à un sous-
ensemble d'entreprises) ou dans la dimension temporelle (par exemple, n'utiliser que les données des années 1980). Une façon de sous-
échantillonner les entreprises s'écarte de la notation utilisée par gretl pour les observations de panel. La plage de données complète est
imprimée comme1:1 (cabinet 1, période 1) à140:9 (cabinet 140, période 9). L'effet de

spl 1:1 80:9

est de limiter l'échantillon aux 80 premières entreprises. Notez que si vous avez plutôt essayépetit 1:1 80:4cela provoquerait une
erreur : vous ne pouvez pas utiliser cette syntaxe pour sous-échantillonner dans la dimension temporelle du panel.
Alternativement, et peut-être plus naturellement, vous pouvez utiliser le --unitépossibilité avec lesplcommande pour limiter
l'échantillon dans la dimension de la section, comme dans

smpl 1 80 --unité

Les entreprises de l'ensemble de données Arellano-Bond sont anonymes, mais supposons que vous disposiez d'un panel
de cinq pays nommés. Avec un tel panneau vous pouvez informer gretl des noms des groupes en utilisant le setobs
commande. Par exemple, étant donné
Chapitre 5. Sous-échantillonnage d'un jeu de données 34

string cstr = "Portugal Italie Irlande Grèce Espagne" setobs country


cstr --panel-groups

gretl crée une série de valeurs de chaîne nomméepaysavec des noms de groupe tirés de la variablecstr. Ensuite, pour
n'inclure que l'Italie et l'Espagne, vous pourriez faire

smpl country=="Italie" || country=="Espagne" --restrict

ou d'exclure un pays,

smpl country!="Irlande" --restrict

Le sous-échantillonnage d'un panel dans la dimension temporelle peut être effectué via --limiter.Par exemple, le jeu de
données Arellano–Bond contient une variable nomméeANNÉEqui enregistre l'année des observations et si l'on voulait
omettre les deux premières années de données on pourrait faire

smpl ANNEE >= 1978 --restrict

Si un jeu de données n'inclut pas déjà une variable appropriée à cet effet, on peut utiliser la commande temps de
genrepour créer un simple index temporel de base 1.
Une autre façon de sous-échantillonner dans la dimension temporelle d'un panel commence par une spécification du temps via
lesetobscommande, comme dans

setobs 1 1976 --panel-time

Cela indique à gretl que le panel-time est annuel (fréquence 1), à partir de 1976. (En fait c'est déjà fait pourabdata.gdt.)
Ensuite, pour restreindre la plage d'échantillonnage à 1979–1982, vous pouvez faire

smpl 1979 1982 --temps

Notez que si vous appliquez une restriction d'échantillonnage qui ne sélectionne que certaines unités (entreprises, pays ou
autres), ou sélectionne certaines périodes de temps contiguës, telles quen >1,T >1 et la longueur de la série chronologique est
toujours la même pour toutes les unités incluses - votre sous-échantillon sera toujours interprété par gretl comme un panel.

Restrictions de déséquilibre

Dans certains cas, on souhaite sous-échantillonner en fonction d'un critère qui « coupe à travers le grain » d'un ensemble de
données de panel. Par exemple, supposons que vous disposiez d'un ensemble de microdonnées avec des milliers d'individus
observés sur plusieurs années et que vous souhaitiez limiter l'échantillon aux observations sur les femmes employées.

Si nous extrayons simplement du totalNTlignes de l'ensemble de données celles qui se rapportent aux femmes qui étaient
employées à ce moment-làt (t =1,...,T)nous nous retrouverions probablement avec un ensemble de données qui ne compte pas
comme un panel dans gretl (parce que la longueur spécifique de la série temporelle,Jje, différerait d'un individu à l'autre). Dans
certains contextes, il peut être acceptable que gretl ne considère pas votre sous-échantillon comme un panel, mais si vous
souhaitez appliquer des méthodes spécifiques au panel, cela pose un problème. Vous pouvez le résoudre en donnant le --
préserver-panneau options avecspl.Par exemple, supposons que votre ensemble de données contienne des variables factices
genre (avec le codage de valeur 1 pour les femmes) etemployé,vous pourriez faire

smpl gender==1 && employee==1 --restrict --preserve-panel

Qu'est-ce que cela fait exactement? Eh bien, disons que les années de vos données sont 2000, 2005 et 2010,
et que certaines femmes ont été employées pendant toutes ces années, ce qui donne un maximumJjevaleur
de 3. Mais l'individu 526 est une femme qui n'était employée qu'en l'an 2000 (Jje=1). L'effet de la
- - préserver-panneaul'option est alors d'insérer des "lignes de remplissage" deN / As pour les années 2005 et 2010 pour
l'individu 526, et de même pour tous les individus avec 0<Jje<3. Votre sous-échantillon est alors considéré comme un
panel.
Chapitre 5. Sous-échantillonnage d'un jeu de données 35

5.5 Rééchantillonnage et bootstrap


Étant donné une série de données originaleX,la commande

série xr = rééchantillonner(x)

crée une nouvelle série dont chacun des éléments est tiré au hasard parmi les éléments deX.Si la série originale
comporte 100 observations, chaque élément deXest sélectionné avec probabilité 1/100 à chaque tirage. Ainsi,
l'effet est de "mélanger" les éléments deX,avec la torsion que chaque élément deXpeuvent apparaître plus d'une
fois, voire pas du tout, dansxr.
L'utilisation principale de cette fonction est dans la construction d'intervalles de confiance bootstrap ou de valeurs
p. Voici un exemple simple. Supposons que nous estimons une régression simple deysurXvia OLS et trouver que
le coefficient de pente a un rapportt-un ratio det0avecvdegrés de liberté. Une valeur de p bilatérale pour
l'hypothèse nulle selon laquelle le paramètre de pente est égal à zéro peut alors être trouvée à l'aide de lat(ν)
distribution. Cependant, selon le contexte, nous pouvons douter que le rapport du coefficient à l'erreur type suive
vraiment lat(ν)distribution. Dans ce cas, nous pourrions dériver une valeur p bootstrap comme indiqué dans la
liste5.1.
Sous l'hypothèse nulle que la pente par rapport àXest zéro,yest simplement égal à sa moyenne plus un
terme d'erreur. Nous simulonsyen rééchantillonnant les résidus de la MCO initiale et en réestimant le
modèle. Nous répétons cette procédure un grand nombre de fois et enregistrons le nombre de cas où la
valeur absolue de lat-le rapport est supérieur àt0: la proportion de tels cas est notre p-value bootstrap. Pour
une bonne discussion sur les tests basés sur la simulation et le bootstrap, voir Davidson et MacKinnon (
2004, Chapitre 4); Davidson et Flachaire (2001) est également instructif.

Liste 5.1 :Calcul de la valeur p bootstrap[Télécharger▼]

données nulles 50
54321
définir la graine
série x = normale()
série y = 10 + x + 2*normal() ols y 0 x

# le t-stat rapporté
t0 = abs($coeff[2] / $stderr[2])
# enregistrer la série des
résidus u = $uhat
scalaire ybar = moyenne(y)
# nombre de réplications pour le scalaire bootstrap
B = 1000
scalaire tcount = 0 série
ysim
boucle B
# générer y simulé en rééchantillonnant ysim =
ybar + resample(u)
ols ysim 0 x --calme
scalaire tsim = abs($coeff[2] / $stderr[2]) tcount += (tsim
> t0)
boucle d'extrémité

printf "proportion de cas avec |t| > %.3f = %g\n", t0, tcount / B
Chapitre 6

Graphiques et tracés

6.1 Graphes Gnuplot


Un programme séparé,gnuplot,est appelé pour générer des graphes. Gnuplot est un programme graphique très
complet avec une myriade d'options. Il est disponible à partir dewww.gnuplot.info(mais notez qu'une copie appropriée
de gnuplot est fournie avec les versions packagées de gretl pour MS Windows et Mac OS X). Gretl vous donne un accès
direct, via une interface graphique, à un sous-ensemble d'options de gnuplot et essaie de choisir des valeurs sensibles
pour vous ; il vous permet également de prendre le contrôle complet des détails du graphique si vous le souhaitez.

Lorsqu'un graphique est affiché, vous pouvez cliquer sur la fenêtre du graphique pour afficher un menu contextuel avec les options
suivantes.

• Enregistrer au format PNG :Enregistrez le graphique au format Portable Network Graphics (le même format que celui que vous
voyez à l'écran).

• Enregistrer en post-scriptum :Enregistrez au format postscript encapsulé (EPS).

• Enregistrer en tant que métafichier Windows :Enregistrer au format de métafichier amélioré (EMF).

• Enregistrer dans la session sous forme d'icône :Le graphique apparaîtra sous forme d'icônes lorsque vous sélectionnez "Affichage par icônes" dans le
menu Affichage.

• Zoom:Vous permet de sélectionner une zone dans le graphique pour une inspection plus approfondie (non disponible pour tous les
graphiques).

• Imprimer: (GTK actuel ou MS Windows uniquement) vous permet d'imprimer directement le graphique.

• Copier dans le presse-papier:MS Windows uniquement, vous permet de coller le graphique dans des applications Windows telles
que MS Word.

• Modifier:Ouvre un contrôleur pour le tracé qui vous permet d'ajuster de nombreux aspects de son apparence.

• Fermer:Ferme la fenêtre graphique.

Affichage des étiquettes de données

Pour les diagrammes de dispersion XY simples, d'autres options sont disponibles si l'ensemble de données comprend des « marqueurs de
cas » (c'est-à-dire des étiquettes identifiant chaque observation).1Avec un nuage de points affiché, lorsque vous déplacez le pointeur de la
souris sur un point de données, son étiquette s'affiche sur le graphique. Par défaut, ces étiquettes sont transitoires : elles n'apparaissent
pas dans la version imprimée ou copiée du graphique. Ils peuvent être supprimés en sélectionnant "Effacer les étiquettes de données"
dans le menu contextuel du graphique. Si vous souhaitez que les étiquettes soient apposées de manière permanente (afin qu'elles
apparaissent lors de l'impression ou de la copie du graphique), sélectionnez l'option « Figer les étiquettes de données » dans le menu
contextuel ; "Effacer les étiquettes de données" annule cette opération. L'autre option liée aux étiquettes, "Toutes les étiquettes de
données", demande que les marqueurs de cas soient affichés pour toutes les observations. À l'heure actuelle, l'affichage des marqueurs
de cas est désactivé pour les graphiques contenant plus de 250 points de données.

1Pour un exemple d'un tel jeu de données, voir le fichier Ramanathandonnées4-10 :il contient des données sur les inscriptions dans les écoles
privées pour les 50 États des États-Unis plus Washington, DC ; les marqueurs de cas sont les codes à deux lettres pour les états.

36
Chapitre 6. Graphiques et tracés 37

Éditeur de tracé graphique

Sélection duModifierL'option dans le menu contextuel du graphique ouvre une boîte de dialogue d'édition, illustrée à la figure6.1
. Notez qu'il existe plusieurs onglets, vous permettant d'ajuster de nombreux aspects de l'apparence d'un graphique : police,
titre, mise à l'échelle des axes, couleurs et types de lignes, etc. Vous pouvez également ajouter des lignes ou des étiquettes
descriptives à un graphique (sous les onglets Lignes et Étiquettes). Le bouton "Appliquer" applique vos modifications sans fermer
l'éditeur ; "OK" applique les modifications et ferme la boîte de dialogue.

Figure 6.1 :contrôleur gnuplot de gretl

Graphiques de qualité publication : options avancées

L'éditeur de tracé GUI a deux limitations. Premièrement, il ne peut pas représenter toutes les myriades d'options qui gnuplotdes
offres. Les utilisateurs suffisamment familiarisés avecgnuplotpour savoir ce qu'ils manquent dans l'éditeur d'intrigue n'ont
probablement pas besoin de beaucoup d'aide de gretl, tant qu'ils peuvent mettre la main sur le gnuplotfichier de commande que
gretl a mis en place. Deuxièmement, même si l'éditeur de tracé répond à vos besoins, en termes de réglage fin du graphique que
vous voyez à l'écran, quelques détails peuvent nécessiter un travail supplémentaire afin d'obtenir des résultats optimaux pour la
publication.

Quoi qu'il en soit, la première étape de l'ajustement avancé d'un graphique consiste à accéder au fichier de commandes du graphique.

• Dans la fenêtre d'affichage du graphique, cliquez avec le bouton droit de la souris et choisissez "Enregistrer dans la session sous forme d'icône".

• Si elle n'est pas déjà ouverte, ouvrez la fenêtre d'affichage des icônes—soit via l'élément de menu Affichage/Affichage des icônes, soit en
cliquant sur le bouton « Affichage des icônes de session » dans la barre d'outils de la fenêtre principale.

• Faites un clic droit sur l'icône représentant le graphique nouvellement ajouté et sélectionnez "Modifier les commandes de tracé"
dans le menu contextuel.

• Vous obtenez une fenêtre affichant le fichier de tracé (Figure6.2).

Voici les choses de base que vous pouvez faire dans cette fenêtre. Évidemment, vous pouvez modifier le fichier que vous venez d'ouvrir.
Vous pouvez également l'envoyer pour traitement par gnuplot, en cliquant sur l'icône "Exécuter" (roue dentée) dans la barre d'outils. Ou
vous pouvez utiliser le bouton "Enregistrer sous" pour enregistrer une copie pour l'éditer et la traiter comme vous le souhaitez.
Chapitre 6. Graphiques et tracés 38

Figure 6.2 :Éditeur de commandes de tracé

À moins que vous ne soyez un expert de gnuplot, vous n'aurez probablement besoin de modifier que quelques lignes en haut du
fichier, en spécifiant un pilote (plus des options) et un fichier de sortie. Nous vous proposons ici un bref résumé de quelques
points qui peuvent être utiles.

D'abord,gnuplot's le mode de sortie est défini via la commandedéfinir le termesuivi du nom d'un pilote pris
en charge ("terminal" dans le langage gnuplot) ainsi que de diverses options possibles. (La ligne supérieure
de la fenêtre des commandes de tracé affichedéfinir le termeligne que gretl a utilisée pour créer un fichier
PNG, commentée.) Les formats graphiques les plus adaptés à la publication sont PDF et EPS. Ceux-ci sont
pris en charge par le gnuplottermeles typespdf, pdfcairoetpost-scriptum (avec leepsoption). Lepdfcairo
pilote a la vertu de se comporter de manière très similaire au PNG, dont vous voyez la sortie à l'écran. Ceci
est fourni par la version de gnuplot qui est incluse dans les packages gretl pour MS Windows et Mac OS X ;
si vous êtes sous Linux, il peut ou peut être pris en charge. Sipdfcairon'est pas disponible, lepdfterminal
peut être disponible ; lepost-scriptumterminal est presque certainement disponible.
Outre la sélection d'un type de terme, si vous souhaitez que gnuplot écrive le fichier de sortie réel, vous devez ajouter un
définir la sortieligne donnant un nom de fichier. Voici quelques exemples des deux premières lignes que vous pourriez
taper dans la fenêtre éditant vos commandes de tracé. Nous les rendrons plus "réalistes" sous peu.

ensemble terme pdfcairo


ensemble sortie 'mongraphe.pdf'

ensemble terme pdf


ensemble sortie 'mongraphe.pdf'

définir le terme postscript eps


définir la sortie 'mygraph.eps'

Il y a quelques choses qui méritent d'être remarquées ici. Premièrement, vous voudrez peut-être ajuster la taille du
graphique, et deuxièmement, vous voudrez peut-être changer la police. Les tailles par défaut produites par les pilotes ci-
dessus sont de 5 pouces par 3 pouces pourpdfcairoetpdf,et 5 pouces par 3,5 pouces pourpost-scriptum eps.Dans chaque
cas, vous pouvez modifier cela en donnant une spécification de taille, qui prend la formeXX, AA (exemples ci-dessous).

Vous aimerez peut-être aussi