Académique Documents
Professionnel Documents
Culture Documents
Correction TD Datamining Technique de Régression
Correction TD Datamining Technique de Régression
Pr. A. EL OUARDIGHI
1
Année Universitaire 2019 - 2020
Sources de données
Fichier source VENTES.arff
o 9 variables, continues,
o 30 enregistrements.
Pour développer un modèle de régression multiple permettant d’estimer les ventes du produit, Nous
avons appliqué la technique de régression sur les données ventes utilisant l’outil WEKA. Les résultats
obtenus sont reportés dans l’annexe 1.
1. Justifier le choix de cette technique.
Rép.
Variable de sortie (vente) numérique et on a au moins une variable d’entrée numérique
2. Donner l’équation du modèle.
Rép.
VENTE = 4.4139 * MT + 0.8219 * RG -7.0874 * P -4.5053 * BR + 2.1032 * I + 7.3457 *
PUB + 1.0813 * FR + 0.2942 * TPUB + 2900.0716
3. Analyser la qualité du modèle développé.
Rép.
R= 0.88 la corrélation entre la variable vente et les autres variables est de l’ordre de 0.88
R2 = 0.77 la part expliqué par le modèle est de 77%, 23% non expliqué par le modèle
2
Année Universitaire 2019 - 2020
Pour développer un modèle de régression linéaire avec un jeu de variables réduit, nous avons appliqué
la méthode d’élimination M5 Methode de WEKA. Les résultats obtenus sont reporté dans l’annexe 2.
4. Donner la nouvelle équation de ce modèle.
Rép.
VENTE = 4.6325 * MT + 2.1738 * I + 6.633 * PUB + 2712.0361
3
Année Universitaire 2019 - 2020
Annexe 1
Régression linéaire multiple utilisant l’open source WEKA
VENTE =
4.4139 * MT +
0.8219 * RG +
-7.0874 * P +
-4.5053 * BR +
2.1032 * I +
7.3457 * PUB +
1.0813 * FR +
0.2942 * TPUB +
2900.0716
4
Année Universitaire 2019 - 2020
Annexe 2:
VENTE =
4.6325 * MT +
2.1738 * I +
6.633 * PUB +
2712.0361