Académique Documents
Professionnel Documents
Culture Documents
pour l’analyse de
données
Pourquoi STATA ?
1. Introduction
2. Fichiers de Stata
3. Traiter les Variables
4. Statistiques Descriptives
5. Régression de Séries Temporelles
6. Variables Qualitatives
7. Quelques Extensions
Presentation STATA
Stata se présente sous la forme de 4 fenêtres :
1. Review : affiche l’historique des commandes tapées par
I ’utilisateur et permet d'en rappeler une facilement.
2. Results : utiliser pour afficher tous les résultats des
commandes tapées par l’utilisateur.
3. Variables : détaille toutes les variables présentes dans
la base de données actuellement ouverte dans Stata
(Stata ne peut ouvrir qu'une seule base de données en
même temps).
4. Command : permet a l’utilisateur d'entrer les
commandes.
4 □ ► 4 (5 ► <“► 4 ^
Presentation STATA
Présentation STATA
Permet d’écrire et
de modifier
directement les
données
Permet de
visualiser
les données
Présentation STATA : Fichiers et répertoires
4 □ ► 4 (5 ► <“► 4=►
Presentation STATA : Do-file editor
4 □ ► 4 (5 ► <“► 4=►
Presentation STATA : Do-file editor
Gestion de l'affichage :
EN RESUME
• On débute le programme avec la commande clear afin de vider la
mémoire de Stata.
• On spécifie la taille de la mémoire a allouer set memory 100m (set
mem 100m).
• on indique quelle base utiliser use
"F:\BeninEdu.com\formation_stata_evie\essaie1.dta"
• il est conseille d'ouvrir un fichier log : log using nouveaunom.bg,
replace(par défaut a la racine) ou bien spécifier l'emplacement du
log: log using
"F:\BeninEdu.com\formation_stata_evie\essai.smcl”
• commencer le programme par set more off
• il est possible d'inclure des commentaires dans le programme en les
encadrant par des ‘
Description des données
concernees, options
Stata ne tient pas compte des espaces multiples
Quelques remarques :
Addition + Soustraction -
Multiplicatio Division /
n *
=
Egalite Inégalité ~= ou I =
Exposant ^ partie entiere Int
Racine sqrt{) Exponentielle exp
Logarithme log{) Valeur absolue abs()
Sup. (resp. > (resp. Sup. (resp. Inf) ou >= (resp.
Inf.) <) egal <=)
Ou 1 Et &
Minimum min() Maximum max()
Trois expressions : by, if et in
log(a x b) - 𝑏
Stata ne peut ouvrir qu'une seule base de données en même temps. Pour
travailler simultanément sur deux bases de données : soit ouvrir base 1,
l'enregistrer puis ouvrir base 2 ; soit ouvrir deux sessions Stata en parallèle.
=> Pour fusionner deux bases de données, deux cas sont a distinguer selon
que l'on souhaite ajouter des observations ou bien des variables :
tabulate variable (tab) calcule les fréquences des valeurs prises par une
variable, et permet de créer des tableaux croises pour deux variables.
Statistiques Descriptives
tabulate variable, row col cel (tab) permet de créer des tableaux croises
pour deux variables avec toutes les fréquences conditionnelles associées.
Statistiques Descriptives
pwcorr variable1 variable2 donne la matrice de corrélations entre les variables. L'option
sig permet d'obtenir le résultat du test de nullité du coefficient de corrélation.
Exemples :
=>ou rejette HO <liff=0 et on valide Ha diff!=0 avec diff>0 c'est a dire l'age moyen des
femmes est significativement plus eleve que l'age moyen des homines
Utilisation des séries temporelles
tsreport : reporte des stats sur la structure des séries temporelles (trous,
observations multiples, . . . )
Principaux operateurs de séries temporelles
Modèle ARIMA(p,d,q)
Exemple : arima y xl x2, arima(2,2,l/4)
Quelques Commandes
Modèles multinomiaux :
4 □ ► 4 (5 ► <“► 4 =► =
Introduction a STATA
Ajout de nouvelles commandes
4 □ ► 4 (5 ► <“► 4 =►
Introduction a STATA
Trouver de l'aide...
Introduction a STATA