Vous êtes sur la page 1sur 19

Université Cheikh Anta Diop de Dakar

Dr Ir. Codjo Emile AGBANGBA


Statistique:
Introduction
Permet de mieux appréhender les situations à travers des
tendances (moyenne, écart-type etc.), c’est un outil d’aide
rapide à la prise de décision.
Elle part souvent des données complexes dont l’analyse
efficiente échappe à l’esprit humain: on fait alors appel à
l’informatique (Ordinateur + Logiciels) pour prolonger ses
aptitudes et combler ses insuffisances.
Statistique = méthodologie de collecte et d’analyse des
données.
statistique est en amont de la collecte des données, après la
formulation des objectifs et des hypothèses de recherche.
Les données à collecter doivent servir à vérifier les hypothèses
de recherche émises.
Objectifs spécifiques

Hypothèse 1 Hypothèse 2 … Hypothèse p

Données Données Données


nécessaires nécessaires nécessaires

Caractéristiques de la population concernée ou du milieu d’essai


Statistique
Techniques d’échantillonnage ou dispositifs expérimentaux

Choix des méthodes statistiques pour la vérification des hypothèses

Utilisation de l’ordinateur pour une bonne analyse des données


Généralités sur le logiciel R
Origines
• logiciel de statistique crée par Ross Ihaka & Robert
Gentleman (1996).
• R à la fois un langage informatique et un
environnement de travail : les commandes sont
exécutées grâce à des instructions codées dans un
langage relativement simple, les résultats sont
affichés sous forme de texte et les graphiques sont
visualisés directement dans une fenêtre qui leur est
propre.
Pourquoi utiliser R?
• Tout d'abord R est un logiciel gratuit et a code
source ouvert (open source)
• R fonctionne sous UNIX (et Linux), Windows
et Macintosh
• C'est donc un logiciel multi-plates-formes
• Tout le monde peut d'ailleurs contribuer à son
amélioration en y intégrant de nouvelles
fonctionnalités ou méthodes d'analyse non
encore implémentées.
• Cela en fait donc un logiciel en rapide et
constante évolution.
• très puissant et très complet, particulièrement bien
adapté pour la mise en oeuvre informatique de
méthodes statistiques.
• plus difficile d'accès que certains autres logiciels du
marché (comme SAS, Minitab, SPSS …., car il n'est pas
concu pour être utilisé a l'aide de «clics» de souris
dans des menus.
• approche est pédagogique puis qu'il faut maîtriser les
méthodes statistiques pour parvenir à les mettre en
oeuvre;
• efficace lorsque l'on domine le langage R puisque l'on
devient alors capable de créer ses propres outils, ce
qui permet ainsi d'opérer des analyses très
sophistiquées sur les données.
Installation du logiciel R
 La marche à suivre est :

 Lancer un navigateur sur internet

 Aller sur la page du CRAN (http://cran.r-project.org)

 Choisissez la version correspondant à votre système

d’exploitation et télécharger le fichier d’installation

 Double clique sur le fichier exécutable téléchargé et

 Suivre les instructions qui s’affichent à l’écran.


Gérer ses scripts de commandes

 Stratégie de travail
• Prenez l'habitude de stocker vos fichiers dans un
dossier réservé à cet usage (par exemple TravauxR).

• En outre, il est conseillé de taper toutes les instructions


R dans une fenêtre de script appelée script ou R Editor,
accessible depuis le menu «Fichier/Nouveau script».

• À la fin de la session, on peut sauver ce script , dans le


dossier TravauxR, sous le nom « monscript ».
• R par exemple, et le rouvrir lors d 'une session
ultérieure depuis le menu «Fichier/ Ouvrir un script»
Présentation de l’environnement de travail
Présentation de l’environnement de travail

Permet d’exécuter les codes d’un script


Création d’un fichier d’édition de R
Ouverture d’un fichier d’édition de R
Ouverture de script et de fichiers txt et R

Fichier R image, mémoire de toutes les


activités en cours

Ensemble des codes R exécutés

Choix du répertoire de travail

Sauvegarde de la console dans un fichier txt


Présentation de l’environnement de travail

Mettre en mémoire de R les modules


externes

Choix des serveurs R

Installation des modules externes


directement des serveurs (Connexion
internet)

Les modules externes sont déjà téléchargés


sur le site de R rn format zip.
Présentation de l’environnement de travail
Présentation de l’environnement de travail
Présentation de l’environnement de travail

Gestion de la console

Questions fréquemment posées

Documents en pdf stockés sur votre ordinateur


Documentation sur les fonctions R (ordinateur)

Documentation générale en format page web


Recherche sur les fonctions et sur les modules
Documentation générale en ligne

Site web R
3. Importation de données
Structure des données
• Caractères alphanumériques ainsi que du point
(.)
• Un nom de variable ne peut pas contenir des
espaces ou commencer par un chiffre, sauf s 'il est
encadré de guillemets
3. Importation de données
• La principale fonction utilisée est read.table
• donnees <- read.table(‘’nom.fichier.txt’’ ,
header=TRUE)
3. Importation des données
• Importer un fichier texte (séparateur tabulation)

donnees <- read.table(‘’nom.fichier.txt’’ , header=TRUE)

• Importer les données d’Excel

On sélectionne à l'aide de la souris la plage de données que l'on


souhaite incorporer dans R. Une fois que les données ont été
sélectionnées, on les copie. On tape l’expression suivante dans R.

donnees <- read.table("clipboard", header=TRUE)

NB: Clipboard=presse-papier
: Ajouter le paramètre sep=‘’\t’’ si le tableau contient des données
manquantes ou des cases vides.
3. Importation des données
Importation des données data1 et data2

donnees1 <- read.table(data1.txt , header=TRUE)


# Le fichier texte se trouve dans le répertoire courant

donnees1 <- read.table( ’’clipboard’’ , header=TRUE)

En présence de données manquantes il faut préciser le séparateur: ici c’est la


tabulation

donnees2 <- read.table(data1.txt , header=TRUE, sep=‘’\t’’)


# Le fichier texte se trouve dans le répertoire courant

donnees2 <- read.table( ’’clipboard’’ , header=TRUE, sep=‘’\t’’)


3. R commander

• L'interface graphique de R est très limitée

• Des programmes sont conçus pour combler ce vide (pour


débutants)

• Rcmdr, Tinn R, Rstudio etc.

• Tinn R et Studio sont des programmes externes à R.

• Rcmdr est un package de R (Intéressant)

• Il permet d'effectuer des analyses graphiques et statistiques


usuelles au moyen d'une interface plus conviviale à l'aide de
menus déroulants.

• Outils d’apprentissage des codes de R.

Vous aimerez peut-être aussi