Académique Documents
Professionnel Documents
Culture Documents
Introduction générale
Thierry Kamionka
1 / 27
Objectifs de cette partie
Présentation du cours
2 / 27
Présentation du cours
L’objet du cours : la statistique descriptive ou exploratoire
3 / 27
Présentation du cours
La démarche de l’analyse statistique
Travail de l'ombre
Des données,
Une question floue, souvent mal posée Formuler les bonnes questions
et/ou pas adaptée aux données Avoir les idées claires
Explorer Comprendre
Le bon graphique,
Rendu / Livrable
La bonne statistique,
Ce qui est pertinent! Matières avancées
Conclusions et
Description Analyse Recommandations
4 / 27
Domaines d’applications : nombreux
I agronomie I marketing
I balistique I médecine
I biologie I météorologie
I démographie I physique
I économie I psychologie
I épidémiologie I sciences politiques
I finance I ...
5 / 27
Présentation du cours
Objectifs
Acquérir le recul nécessaire pour faire un bon usage des
outils de description de l’information.
I Fournir le vocabulaire et le cadre théorique pour
explorer une problématique et en comprendre les tenants
et les aboutissants.
I Présenter des méthodes nombreuses et adaptées à
des données de natures variées : représentations
graphiques, statistique uni- et bi-variée, mesures
d’association, rudiments sur l’analyse des séries
temporelles.
I Mettre en œuvre ces méthodes avec le logiciel
SAS : savoir travailler sur des bases de données,
appliquer les méthodes adaptées, en connaître les
avantages et les inconvénients.
6 / 27
Présentation du cours
Organisation
7 / 27
Présentation du cours
Volume horaire et évaluation
Volume horaire : 11 séances de 3h
I Des séances de cours (05/09, 20/09, 04/10). Des séances
de TD (13/09, 27/09, 25/10, 29/11, 06/12,
13/12,19/12). Une séance mixte le 15/11.
I Deux séances de suivi pour encadrer le mémoire (25/10
et le 06/12).
I Un TP noté le 19/12.
Évaluation :
I 25 % : présence, participation, exercices à rendre.
I 25 % : TP noté.
10 / 27
Présentation du cours
Le site Web
https ://sites.google.com/view/ensae-stat-des
11 / 27
Bibliographie
Statistique descriptive :
I DeVeaux, Velleman, Bock : Intro Stats, Pearson Intl Ed
12 / 27
Les concepts de base de la statistique descriptive
Population et unités statistiques
13 / 27
Les concepts de base de la statistique descriptive
Les caractères et leurs modalités
Exemples
I le sexe : le sexe biologique d’un individu est un caractère
présentant deux modalités (homme ou femme) ;
I la taille ; la taille d’un individu en cm est un caractère
pouvant prendre un grand nombre de modalités (en
pratique un nombre décimal positif inférieur à 250).
16 / 27
Les concepts de base de la statistique descriptive
Caractères qualitatifs
17 / 27
Les concepts de base de la statistique descriptive
Nomeclatures - PCS
code Libellé
1 Agriculteurs exploitants
2 Artisans, commerçants et chefs d’entreprise
3 Cadres et professions intellectuelles supérieures
4 Professions Intermédiaires
5 Employés
6 Ouvriers
7 Retraités
8 Autres personnes sans activité professionnelle
19 / 27
Les concepts de base de la statistique descriptive
Les regroupements de modalités
I Exemples :
Classe d’âge : 0 à moins de 5 ans, 5 à moins de 10 ans, 10 à moins de 15 ans,
..., 95 à moins de 100 ans, plus de 100 ans
Tranches de durée du chômage : moins de 1 mois, 1 à moins de 3 mois, 3 à
moins de 6 mois, 6 mois à moins de 1 an, 1 à moins de 2 ans, 2 ans et plus.
I Le nombre de classes doit être choisi de manière à ce que les effectifs de chaque
classe soient non nuls et du même ordre de grandeur.
20 / 27
Ex : Enquête sur l’emploi : Population ?
Echantillon ? Variables ?
21 / 27
Les concepts de base de la statistique descriptive
Nature des caractère et analyse statistique
22 / 27
Les concepts de base de la statistique descriptive
Structure générale d’une base de données
Les informations sur les caractères des individus statistiques
interrogés sont stockées dans une base de données.
Avantages Inconvénients
Très utilisé (polyvalent) Syntaxe parfois lourde
Gros volumes de données Propriétaire
Programmation
Deux explorateurs :
I l’explorateur de résultats : pour naviguer plus facilement
dans les résultats ;
I l’explorateur de fichiers : pour visualiser et ouvrir les bases
de données par l’intermédiaire des librairies.
25 / 27
Premiers pas avec le logiciel SAS
Accéder aux bases de données dans SAS : les librairies
Pour accéder aux bases de données dans SAS, il faut définir
des librairies.