Académique Documents
Professionnel Documents
Culture Documents
(a) Commentons la différence entre les deux histogrammes obtenus. A donner pour
chacun
Le nombre d’intervalle n’est pas le même pour les deux histogrammes sur l’axe des
ordonnées mais identique sur les abscisses, il est choisi par le logiciel utilisé.
La différence entre les deux histogrammes provient seulement du choix de l’origine, celui du
gauche ayant pour origine sur l’axe des abscisses la valeur 0 tandis que celui de la droite
utilise comme point de départ la valeur sensiblement égale à 0.2.
La distribution est leptokurtique, elle est plus pointue et possède des extrémités plus épaisses
que la loi normale.
Les probabilités aux extrêmes et au centre sont plus grandes que la loi normale.
Réponse 3 :
den = density(donnees_ex2$EcartPauvrete)
Réponse 4
Réponse 5 :
Réponse 5a
########Estimons le modèle non paramétrique ######
Réponse 5b :
D’après le calcul des EQM pour les deux modèles, on voit que l’erreur quadratique moyenne
pour le modèle non paramétrique est de 26.4008 et celle du modèle paramétrique vaut
26.42292. L’EQM du modèle paramétrique est légèrement supérieure à celle du modèle non
paramétrique. La différence entre les deux est suffisamment petite. Dans les modèles
paramétriques, on connait la distribution et du coup, on applique les hypothèses classiques
alors que dans les modèles non paramétriques, il faut répéter plusieurs fois la différence entre
l’EQM du modèle paramétrique et celle du modèle non paramétrique (t) pour obtenir une
distribution.
eqm_npr
eqm_pr
Réponse 5c :
Ces deux types d’estimations aboutissent à des conclusions similaires sur la relation entre le
niveau d’inégalité et le taux de croissance économique à travers le monde.
Aux valeurs de croissance trop faible, il y a de relation forte entre la croissance et l'inégalité.
La courbe de Kuznets (une forme U inversée) semble être présente pour les pays avec un taux
positif de croissance du PIB positive pas trop élevé. Il y a aussi des valeurs aberrantes de
croissance du PIB.
Exercice 3 :
Premeire etape :
#telecharcher la bibliotheque
library(np)
library(haven)
library(tidyverse)
deuxième étape :
reponse 1 :
Call:
Coefficients:
#calculons EQM
eqm_pr
Réponse 2 :
eqm_npr
Réponse 4 :
4. Utilisons les fonctions sim ml, calcT tilde et ’replicate’ vues en classe pour :
(a) Simulons des données fictives ´ (x1′ , y1′ ), (x2′ , y2′ ), , (xn′ , y′ n) avec les paramètres `
αˆ et βˆ obtenus à la question 1.
(e) Répétons les étapes (a)-(d) ci-dessus 50 fois pour obtenir une distribution ´
de T˜.
Les conmandes qui nous permettent de faire cela sont les suivantes :
##Creer une fonction pour simuler des donnees avec le modèle paramétrique obtenu
n <- length(table_x)
return(table_sim)
#Creer une fonction pour calculer la différence entre les EQM des modele paramétriques et
non paramétrique
# créer la fonction
return(EQM_p - EQM_np )
nbr_rep = 50
set.seed(123)
p= 0.01960784
Exercice 1 :
2) Réponse 2
Réponse 4
Réponse 5
kernel = "normal",
bandwidth = 0.5)
Réponse 7
aes(x=x, y=y)) +
geom_point() +
Réponse 9
reg_loc
Réponse 10
#utiliser la fonction ksmooth pour l'estimation par la regression du noyau avec le kernel
rectangulaire
kernel = "box",
bandwidth = 0.5)
Réponse 11
Au nombre d'années de l'éducation trop fort, il y a une relation forte entre les niveaux de
salaire et d'expérience.
La courbe de Kuznets semble être présente pour les individus avec un taux positif de salaire.