Université Cheikh Anta Diop de Dakar
Dr Ir. Codjo Emile AGBANGBA
Statistique:
Introduction
Permet de mieux appréhender les situations à travers des
tendances (moyenne, écart-type etc.), c’est un outil d’aide
rapide à la prise de décision.
Elle part souvent des données complexes dont l’analyse
efficiente échappe à l’esprit humain: on fait alors appel à
l’informatique (Ordinateur + Logiciels) pour prolonger ses
aptitudes et combler ses insuffisances.
Statistique = méthodologie de collecte et d’analyse des
données.
statistique est en amont de la collecte des données, après la
formulation des objectifs et des hypothèses de recherche.
Les données à collecter doivent servir à vérifier les hypothèses
de recherche émises.
Objectifs spécifiques
Hypothèse 1 Hypothèse 2 … Hypothèse p
Données Données Données
nécessaires nécessaires nécessaires
Caractéristiques de la population concernée ou du milieu d’essai
Statistique
Techniques d’échantillonnage ou dispositifs expérimentaux
Choix des méthodes statistiques pour la vérification des hypothèses
Utilisation de l’ordinateur pour une bonne analyse des données
Généralités sur le logiciel R
Origines
• logiciel de statistique crée par Ross Ihaka & Robert
Gentleman (1996).
• R à la fois un langage informatique et un
environnement de travail : les commandes sont
exécutées grâce à des instructions codées dans un
langage relativement simple, les résultats sont
affichés sous forme de texte et les graphiques sont
visualisés directement dans une fenêtre qui leur est
propre.
Pourquoi utiliser R?
• Tout d'abord R est un logiciel gratuit et a code
source ouvert (open source)
• R fonctionne sous UNIX (et Linux), Windows
et Macintosh
• C'est donc un logiciel multi-plates-formes
• Tout le monde peut d'ailleurs contribuer à son
amélioration en y intégrant de nouvelles
fonctionnalités ou méthodes d'analyse non
encore implémentées.
• Cela en fait donc un logiciel en rapide et
constante évolution.
• très puissant et très complet, particulièrement bien
adapté pour la mise en oeuvre informatique de
méthodes statistiques.
• plus difficile d'accès que certains autres logiciels du
marché (comme SAS, Minitab, SPSS …., car il n'est pas
concu pour être utilisé a l'aide de «clics» de souris
dans des menus.
• approche est pédagogique puis qu'il faut maîtriser les
méthodes statistiques pour parvenir à les mettre en
oeuvre;
• efficace lorsque l'on domine le langage R puisque l'on
devient alors capable de créer ses propres outils, ce
qui permet ainsi d'opérer des analyses très
sophistiquées sur les données.
Installation du logiciel R
La marche à suivre est :
Lancer un navigateur sur internet
Aller sur la page du CRAN (http://cran.r-project.org)
Choisissez la version correspondant à votre système
d’exploitation et télécharger le fichier d’installation
Double clique sur le fichier exécutable téléchargé et
Suivre les instructions qui s’affichent à l’écran.
Gérer ses scripts de commandes
Stratégie de travail
• Prenez l'habitude de stocker vos fichiers dans un
dossier réservé à cet usage (par exemple TravauxR).
• En outre, il est conseillé de taper toutes les instructions
R dans une fenêtre de script appelée script ou R Editor,
accessible depuis le menu «Fichier/Nouveau script».
• À la fin de la session, on peut sauver ce script , dans le
dossier TravauxR, sous le nom « monscript ».
• R par exemple, et le rouvrir lors d 'une session
ultérieure depuis le menu «Fichier/ Ouvrir un script»
Présentation de l’environnement de travail
Présentation de l’environnement de travail
Permet d’exécuter les codes d’un script
Création d’un fichier d’édition de R
Ouverture d’un fichier d’édition de R
Ouverture de script et de fichiers txt et R
Fichier R image, mémoire de toutes les
activités en cours
Ensemble des codes R exécutés
Choix du répertoire de travail
Sauvegarde de la console dans un fichier txt
Présentation de l’environnement de travail
Mettre en mémoire de R les modules
externes
Choix des serveurs R
Installation des modules externes
directement des serveurs (Connexion
internet)
Les modules externes sont déjà téléchargés
sur le site de R rn format zip.
Présentation de l’environnement de travail
Présentation de l’environnement de travail
Présentation de l’environnement de travail
Gestion de la console
Questions fréquemment posées
Documents en pdf stockés sur votre ordinateur
Documentation sur les fonctions R (ordinateur)
Documentation générale en format page web
Recherche sur les fonctions et sur les modules
Documentation générale en ligne
Site web R
3. Importation de données
Structure des données
• Caractères alphanumériques ainsi que du point
(.)
• Un nom de variable ne peut pas contenir des
espaces ou commencer par un chiffre, sauf s 'il est
encadré de guillemets
3. Importation de données
• La principale fonction utilisée est read.table
• donnees <- read.table(‘’nom.fichier.txt’’ ,
header=TRUE)
3. Importation des données
• Importer un fichier texte (séparateur tabulation)
donnees <- read.table(‘’nom.fichier.txt’’ , header=TRUE)
• Importer les données d’Excel
On sélectionne à l'aide de la souris la plage de données que l'on
souhaite incorporer dans R. Une fois que les données ont été
sélectionnées, on les copie. On tape l’expression suivante dans R.
donnees <- read.table("clipboard", header=TRUE)
NB: Clipboard=presse-papier
: Ajouter le paramètre sep=‘’\t’’ si le tableau contient des données
manquantes ou des cases vides.
3. Importation des données
Importation des données data1 et data2
donnees1 <- read.table(data1.txt , header=TRUE)
# Le fichier texte se trouve dans le répertoire courant
donnees1 <- read.table( ’’clipboard’’ , header=TRUE)
En présence de données manquantes il faut préciser le séparateur: ici c’est la
tabulation
donnees2 <- read.table(data1.txt , header=TRUE, sep=‘’\t’’)
# Le fichier texte se trouve dans le répertoire courant
donnees2 <- read.table( ’’clipboard’’ , header=TRUE, sep=‘’\t’’)
3. R commander
• L'interface graphique de R est très limitée
• Des programmes sont conçus pour combler ce vide (pour
débutants)
• Rcmdr, Tinn R, Rstudio etc.
• Tinn R et Studio sont des programmes externes à R.
• Rcmdr est un package de R (Intéressant)
• Il permet d'effectuer des analyses graphiques et statistiques
usuelles au moyen d'une interface plus conviviale à l'aide de
menus déroulants.
• Outils d’apprentissage des codes de R.