Vous êtes sur la page 1sur 2

2020/2021 Data Mining TP n°6 ENIT

Enseignant : Walid Ayadi Génie Industriel

I. Les données du fichier Performance_entrep.txt décrivent les résultats comptables de


80 entreprises du Royaume Uni. PERF est la variable à prédire.

PERF Performance des entreprises (performant 1, non performant 0)


RETCAP Retour sur capitaux employés
WCFTDT Ratio des flux de fonds de roulement à la dette totale
LOGSALE Chiffre d'affaires total
LOGASST Total des actifs
CURRAT Ratio de liquidité générale
QUIKRAT Ratio de liquidité
NFATAST Ratio de l'actif immobilisé net de l'actif total
FATTOT Actifs bruts au total des actifs
PAYOUT Ratio de distribution
WCFTCL Rapport du débit du fonds de roulement au total des passifs
GEARRAT courants
CAPINT Ratio d'endettement
INVTAST L'intensité du capital (ratio du total des ventes à l'actif total)
Ratio du total des stocks à l'actif total

On propose de construire un modèle permettant de prédire les performances des entreprises


via la méthode réseaux des neurones à partir des données du fichier Performance_entrep.txt.
1. Charger les données, centrer et réduire les variables explicatives quantitatives avec la
commande scale() et forcer le fait que la variable cible est qualitative avec la commande
factor().
2. Modélisation
En utilisant la librairie nnet, la commande nnet, construire le meilleur modèle de la méthode
réseaux de neurones pour la prédiction de la variable cible de chaque fichier de données.

Travaux pratiques Data Mining Walid Ayadi


3. Prédiction :
En utilisant la commande predict(), prédire la variable cible sur l’échantillon d’apprentissage.
4. Matrice de Confusion :
A partir de la table de confusion, calculer le taux d’erreur du modèle.
Comparer les résultats de la méthode réseaux des neurones par rapport aux résultats de la
méthode arbre de décision.

II. Le fichier Performance.txt est composé de variables caractérisant les propriétés des PC
et leurs performances évaluées par des experts. Si la variable Performance=1, le PC
est évalué performant sinon il est évalué non performant.

Reprendre les questions de la partie I sur les données du fichier Performance.txt. La


variable Performance est la variable cible de l’étude.

Travaux pratiques Data Mining Walid Ayadi

Vous aimerez peut-être aussi