Académique Documents
Professionnel Documents
Culture Documents
• Manifeste GNU :
– http://www.gnu.org/gnu/manifesto.fr.html
Différents types de licences
• Licence GPL : General Public Licence
– http://www.gnu.org/licenses/gpl.html
– http://www.gnu.org/licenses/gpl-faq.fr.html
• Autres licences :
http://www.gnu.org/licenses/license-list.fr.html
• Licence CeCILL :
http://www.cecill.info/index.fr.html
Autres types de licence
• Freeware, gratuiciel
• Shareware, partagiciel
Licences et logiciels libres
• Logiciels Open Source
• Exemple de fracture :
– Environnements KDE et GNOME
Apport des logiciels libres
• Bien plus qu’un apport technique :
– Apport d’un cadre juridique
– Apport d’un modèle économique alternatif
• CSPRO :
– Saisie d’enquêtes
– http://www.census.gov/ipc/www/cspro/
R : Principes
• Fenêtres de travail
• Langage de commandes
• Langage interprété
• Langage orienté objet
• Utilisation d’opérateurs et de fonctions
• Package de base et packages spécialisés
R : Contraintes
• Objets chargés en mémoire
• Sensible à la casse des caractères
R : aides
• Aide en ligne
• Forums utilisateurs
• Documentations associées
• Sites Web :
http://www.r-project.org/
http://cran.r-project.org/
R : Les objets
• Caractérisation
• Quelques types d’objets
R : Les objets (2)
• Caractérisation :
– Nom
– Attributs : mode et longueur
• load("idf.Rdata")
• barplot(table(idf$d)
• mean(idf[idf$d=="75",'ptot90'])
• boxplot(as.integer(idf$ptot90)~as.factor(idf$d))
• pairs(idf[,c('ptot75','ptot82','ptot90')])
•
• data(USArrests)
• attach(USArrests)
• plot(Murder,UrbanPop,cex=0.1)
• text(Murder,UrbanPop,rownames(USArrests),cex=0.7)
• plot(Murder,UrbanPop,cex=0.1,xlim=c(3,12)) # Zoom sur certaines valeurs
• text(Murder,UrbanPop,rownames(USArrests),cex=0.7)
• plot(Murder,UrbanPop,cex=0.1,xlim=c(5,7)) # Zoom sur certaines valeurs
• text(Murder,UrbanPop,rownames(USArrests),cex=0.7)
• load("idf.Rdata")
R : Eléments de Modélisation
• Modèle linéaire
• Modèle non linéaire
R : Modèle linéaire
• Fonction lm(formule,objet)
• Fonctions supplémentaires :
– Summary.lm: Résultats détaillés de la régression
– Predict.lm: Valeurs prédites par le modèle
– Residuals.lm: Résidus individuels de la régression
– Plot.lm: Aides à l'interprétation graphique de la
régression
– Coef : Coefficients du modèle
R : Modèle logistique
• Syntaxe :
– glm(formule,family=(binomial),data=objet)
R : Applications
• Etude n°1 :
– Pays du monde
• Etude n°2 :
– Exploitation enquête EHF
Problèmes rencontrés sous R
• Volumétrie des données
• Syntaxe compliquée
• Coût d’entrée important
Pourquoi préférer Sas
• Plus adapté aux masses de données
importantes
• Gestion des données plus aisée
• Traitements statistiques exploratoires plus
simples à mettre en oeuvre
Pourquoi préférer R
• Sources des fonctions disponibles
• Analyse exploratoire de données
• Evolutivité du logiciel
• Communauté d’utilisateurs active
• Communauté d’utilisateurs axée recherche
et enseignement
• Adapté à Linux
Sas vs R
• Alternatifs ou complémentaires ?
• Nécessité d’étudier les transferts de données
?
Liens Web
• Framasoft :
– http://www.framasoft.net
• Léa :
– http://lea-linux.org/
• April :
– http://www.april.org/
• Je Suis Libre :
– http://www.jesuislibre.org/
Questions ??