Académique Documents
Professionnel Documents
Culture Documents
Données :
Sources :
http://eric.univ-lyon2.fr/~ricco/tanagra/fichiers/cars_dataset.zip
http://lib.stat.cmu.edu/datasets/cars.desc
2. Centrage et réduction :
On propose de concevoir une partition de trois groupes (trois clusters), en se limitant à 100 itérations avec
K-means.
1
Walid Ayadi
ENIT 2ème année GI
Pour croiser les clusters avec la variable catégorielle illustrative origin, on introduit la commande
« table » :
1 2 3
Americain
European
Japanese
II. Les variables du fichier Cultures_raisin.txt sont TEMPERATURE : Somme des températures moyennes
journalières, SOLEIL : Durée d’insolation, CHALEUR : Nombre de jours de grande chaleur, PLUIE :
Hauteur des pluies, QUALITE DU RAISIN : Bon, Moyen, Mauvais.
Refaire le même travail sur le fichier Cultures_raisin.txt afin de classer les observations selon les classes de
la variable QUALITE DU RAISIN.
III. Refaire le même travail sur le fichier Faillite_entrep.txt afin de classer les observations selon les classes
de la variable ET.
2
Walid Ayadi