TP05

Transféré par

saidista2021

0% ont trouvé ce document utile (0 vote)

3 vues2 pages

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

3 vues2 pages

TP05

Transféré par

saidista2021

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 2

Rechercher à l'intérieur du document

Centre Universitaire de Mila Apprentissage Automatique

1ier Année STIC/I2A – Semestre 2 2022-2023

TP 5 : Détection de spam avec la régression logistique (RL)

Qu’est-ce qu’un email spam ?

 Un email spam est un email non sollicité et non pertinent, envoyé en grands lots vers des
boites emails d’utilisateurs.
 Le but du spammer sont divers : les publicités pour les sites produits/Web, messages en
chaines, assurer un gain rapide d'argent, la pornographie, l’usurpation d’identités, etc.

Exemples :

Filtres anti-spams

 Les filtres de spams basés sur l’analyse de texte vérifient l’existence/absence de certains
mots ou de symboles.

1
TP 5 - Apprentissage Automatique 2022-2023 Dr. Aissa Boulmerka
 Dans un email, la présence de mots, tels que: héritage, viagra, loterie, dollars, etc., et de
symboles tels que: ’$’, ‘¥’, ‘€’, ‘!’, etc., augmentent la probabilité d’un spam.
 Ces probabilités sont estimées à partir d’un ensemble d’apprentissage "D" contenant des
emails étiquetés.
 Les filtres peuvent faire des erreurs. Idéalement, les filtres doivent s’adapter et s’améliorer
avec le temps.

Le jeu de données (Dataset) « Spambase » :

1) L’ensemble d’entrainement est créé par Mark Hopkins et al. de Hewlett-Packard Labs.

https://archive.ics.uci.edu/ml/datasets/Spambase

2) L’ensemble contient 4601 emails. Chaque email possède 57 valeurs attributs reflétant les
propriétés de l’email. Parmi ces attributs, on a :
o 48 sont des fréquences de certains mots.
o 06 sont des fréquences de certains caractères.
o 03 comptent la longueur de chaines non interrompues.

Exercice :

1. Étudier la régression logistique (LogisticRegression) sur Python.

https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html

2. Utiliser le classificateur de Bayes (CB) et la régression logistique (RL) pour classer les
données de spams en se basant sur le dataset spambase.
3. Utiliser une validation croisée pour calculer l’erreur de classification (ex. moyenne de 10
validation en retenant à chaque fois 10% de données pour la validation). Comparer les
résultats obtenus par les deux modèles implémentés (à savoir le CB et la RL).

2
TP 5 - Apprentissage Automatique 2022-2023 Dr. Aissa Boulmerka

Vous aimerez peut-être aussi

Web hacking : apprenez à tester la sécurité des applications web comme un hacker pro avec kali linux
D'Everand
Web hacking : apprenez à tester la sécurité des applications web comme un hacker pro avec kali linux
HG inc
Pas encore d'évaluation
Dictionnaire Des Mots Savants
Document183 pages
Dictionnaire Des Mots Savants
bradbader
100% (2)
Algorithme Cours Et Exercece
Document169 pages
Algorithme Cours Et Exercece
BBCM AbdEL
Pas encore d'évaluation
18-Nouveau Discours Du Recit - Genette Gerard
Document166 pages
18-Nouveau Discours Du Recit - Genette Gerard
Longin Ateba
100% (1)
Dossier Complet e Mail Entreprise
Document69 pages
Dossier Complet e Mail Entreprise
Maher Zed
Pas encore d'évaluation
Les Codes de La Seduction
Document7 pages
Les Codes de La Seduction
Fernando Ramos
Pas encore d'évaluation
Exercices - Gestion Des Risques
Document8 pages
Exercices - Gestion Des Risques
Ju Lie
60% (5)
(LE SPAMMING) Tutoriel Complète Pour Les Débutants
Document6 pages
(LE SPAMMING) Tutoriel Complète Pour Les Débutants
Miguel
Pas encore d'évaluation
Examen Securite - Omarcheikhrouhou - 10 - 11 - Correction
Document2 pages
Examen Securite - Omarcheikhrouhou - 10 - 11 - Correction
Chaima awedni
75% (4)
Lève Toi Et Spam by @mauvaisx4
Document14 pages
Lève Toi Et Spam by @mauvaisx4
nahil.loudjani
0% (1)
Déformations Morphologiques de La Colonne Vertébrale: Traitement Physiothérapique en Rééducation Posturale Globale - RPG
Document152 pages
Déformations Morphologiques de La Colonne Vertébrale: Traitement Physiothérapique en Rééducation Posturale Globale - RPG
juan HECTOR
Pas encore d'évaluation
TD EmailSPAM SVM
Document4 pages
TD EmailSPAM SVM
Haifa Zaidi
Pas encore d'évaluation
Calcul Hydrologique
Document7 pages
Calcul Hydrologique
Fatre 1980
Pas encore d'évaluation
CH VII. Déversement
Document7 pages
CH VII. Déversement
Ali Embarec
Pas encore d'évaluation
Devoir SR OmarCheikhrouhou 0910
Document3 pages
Devoir SR OmarCheikhrouhou 0910
Ahmed Bendahmane
Pas encore d'évaluation
Examen FinalL3 SesionSeptembre2017
Document4 pages
Examen FinalL3 SesionSeptembre2017
Haladou M. Sani
Pas encore d'évaluation
Les Saisons-Projet Didactique
Document12 pages
Les Saisons-Projet Didactique
Boguș Diana
Pas encore d'évaluation
ST Scenar App Spam
Document11 pages
ST Scenar App Spam
Yao jean luc
Pas encore d'évaluation
L'agence Net 15 Protège Votre Messagerie Avec Mailinblack (15) Cantal
Document4 pages
L'agence Net 15 Protège Votre Messagerie Avec Mailinblack (15) Cantal
Kherkhour Mustapha
Pas encore d'évaluation
Projet Partiel
Document5 pages
Projet Partiel
dung
Pas encore d'évaluation
Cours IA Polytech 3
Document42 pages
Cours IA Polytech 3
Ahmed Bouzoffara
Pas encore d'évaluation
Documentaire
Document3 pages
Documentaire
Said Mehaddi
Pas encore d'évaluation
FR Tanagra Doc Classification Python
Document17 pages
FR Tanagra Doc Classification Python
Yao jean luc
Pas encore d'évaluation
Le Fonctionnement Du Courrier Électronique
Document5 pages
Le Fonctionnement Du Courrier Électronique
aminemaache2005
Pas encore d'évaluation
Machine Learning
Document11 pages
Machine Learning
crew player
Pas encore d'évaluation
Manuel Manager Final MailInBlack Protect Min
Document35 pages
Manuel Manager Final MailInBlack Protect Min
Oren Simon Benitah
Pas encore d'évaluation
Devoir ASW TWIN2 06 04 2023 Corrigé
Document4 pages
Devoir ASW TWIN2 06 04 2023 Corrigé
Gningninri Othniel Samson Coulibaly
Pas encore d'évaluation
TP4 ML
Document10 pages
TP4 ML
Walid Lahsiki
Pas encore d'évaluation
DS1 Apprentissage 2021
Document1 page
DS1 Apprentissage 2021
Gurzil Mlh
Pas encore d'évaluation
TP3 DM
Document7 pages
TP3 DM
Hamdi Gdhami
Pas encore d'évaluation
CorrigÃ© Examen DAW Univ Biskra 2017-2018
Document4 pages
CorrigÃ© Examen DAW Univ Biskra 2017-2018
Karim Aouadi
Pas encore d'évaluation
Exam Identité Numérique 2018-2019
Document4 pages
Exam Identité Numérique 2018-2019
Mor FALL
Pas encore d'évaluation
Rapport Spam Detection Ouadi Mohamed Aymen
Document16 pages
Rapport Spam Detection Ouadi Mohamed Aymen
aymene starship
Pas encore d'évaluation
Interrogation IA
Document10 pages
Interrogation IA
matthieus701
Pas encore d'évaluation
Grand Oral NSI-Mathématiques
Document3 pages
Grand Oral NSI-Mathématiques
Alexis letourneau
Pas encore d'évaluation
Fiche de Révision Pix
Document5 pages
Fiche de Révision Pix
Ledernier Ouii
Pas encore d'évaluation
Deesirs - Juin 2018 - Corrigé
Document19 pages
Deesirs - Juin 2018 - Corrigé
Natacha Ozanne
Pas encore d'évaluation
FR Tanagra Package Caret
Document32 pages
FR Tanagra Package Caret
el ima
Pas encore d'évaluation
2-Fr Sipina Cost Sensitive
Document18 pages
2-Fr Sipina Cost Sensitive
Soleil Sucré
Pas encore d'évaluation
These Barbe
Document730 pages
These Barbe
Mecheri Cheikh
Pas encore d'évaluation
Serie 0
Document2 pages
Serie 0
ilyasamine
Pas encore d'évaluation
Solution-TD3 SI
Document4 pages
Solution-TD3 SI
SAWADOGO
Pas encore d'évaluation
Techniques de Détection D'erreur - WayToLearnX
Document8 pages
Techniques de Détection D'erreur - WayToLearnX
Boujah Wel Limam
Pas encore d'évaluation
Qu'est-Ce Qu'un E-Mail Temporaire Jetable?: Votre Adresse Électronique Temporaire
Document4 pages
Qu'est-Ce Qu'un E-Mail Temporaire Jetable?: Votre Adresse Électronique Temporaire
Klaus
Pas encore d'évaluation
Td3 Échanger Et Communiquer A Distance
Document13 pages
Td3 Échanger Et Communiquer A Distance
benbrah
Pas encore d'évaluation
Virus Info PDF
Document148 pages
Virus Info PDF
SihemHcine
Pas encore d'évaluation
Cours ML
Document40 pages
Cours ML
Roni Yakam
Pas encore d'évaluation
Spam Clam
Document6 pages
Spam Clam
zakia.karima.27
Pas encore d'évaluation
Contrôle Final - Machinelearning2021
Document6 pages
Contrôle Final - Machinelearning2021
Hanane KARDI
Pas encore d'évaluation
Securite - Pentest - Le Phising
Document18 pages
Securite - Pentest - Le Phising
ANGOHJ EAN ROLAND
Pas encore d'évaluation
Itinéraire TICE: Le Courrier Électronique - Niveau Avancé
Document7 pages
Itinéraire TICE: Le Courrier Électronique - Niveau Avancé
jemeforme
Pas encore d'évaluation
Email Temporaire - Email À Usage Unique - Email Anonyme
Document2 pages
Email Temporaire - Email À Usage Unique - Email Anonyme
abdo19
Pas encore d'évaluation
Ouargla PSIBD Nov2011
Document4 pages
Ouargla PSIBD Nov2011
ammar
Pas encore d'évaluation
TD TW
Document7 pages
TD TW
nedjmoulacrim
Pas encore d'évaluation
2015 Sujet
Document4 pages
2015 Sujet
Bøïə Khądįją
Pas encore d'évaluation
Activite 4 Etre Responsable A Lere Du Numerique
Document1 page
Activite 4 Etre Responsable A Lere Du Numerique
rayenbrbr
Pas encore d'évaluation
Aaa Seance 02 Preparation Des Données
Document15 pages
Aaa Seance 02 Preparation Des Données
Forche Herod
Pas encore d'évaluation
Activité1 D5
Document3 pages
Activité1 D5
khaoula bezzine
Pas encore d'évaluation
Tutoriel Adaboost Haar LBP Face Detection
Document27 pages
Tutoriel Adaboost Haar LBP Face Detection
dahman16
0% (1)
Email Marketing
Document35 pages
Email Marketing
amin lazar
Pas encore d'évaluation
Situation Prof Configuration Serveur Mail Zimbra
Document14 pages
Situation Prof Configuration Serveur Mail Zimbra
Lionel ROUYAR
Pas encore d'évaluation
Concours HEM 3eme Annee Epreuve Type en Methodes Quantitatives de Gestion
Document4 pages
Concours HEM 3eme Annee Epreuve Type en Methodes Quantitatives de Gestion
lebanesefree
Pas encore d'évaluation
TP Scoring
Document5 pages
TP Scoring
haddoumi imane
Pas encore d'évaluation
TP SVM
Document8 pages
TP SVM
Hanane KARDI
Pas encore d'évaluation
Projet MACHINE LEARNING COVID
Document1 page
Projet MACHINE LEARNING COVID
Tite
Pas encore d'évaluation
Exam Sec Gir03
Document9 pages
Exam Sec Gir03
Ahmed Aniked
Pas encore d'évaluation
TP1 Soa
Document3 pages
TP1 Soa
firdaous jebri
Pas encore d'évaluation
Série 3
Document2 pages
Série 3
saidista2021
Pas encore d'évaluation
Cours Python Part123132463
Document221 pages
Cours Python Part123132463
saidista2021
Pas encore d'évaluation
Chap03.class Bayes
Document41 pages
Chap03.class Bayes
saidista2021
Pas encore d'évaluation
Chap03.arbres Decision
Document75 pages
Chap03.arbres Decision
saidista2021
Pas encore d'évaluation
Chap04.reg Logistique
Document27 pages
Chap04.reg Logistique
saidista2021
Pas encore d'évaluation
Chap06.reseaux Neurones
Document31 pages
Chap06.reseaux Neurones
saidista2021
Pas encore d'évaluation
TP09
Document1 page
TP09
saidista2021
Pas encore d'évaluation
Demande Manisrite
Document1 page
Demande Manisrite
saidista2021
Pas encore d'évaluation
TP02
Document1 page
TP02
saidista2021
Pas encore d'évaluation
TP0-Module 354 - Apprentissage Automatique
Document2 pages
TP0-Module 354 - Apprentissage Automatique
saidista2021
Pas encore d'évaluation
KP1394+KP Series
Document4 pages
KP1394+KP Series
Ravaglioli
Pas encore d'évaluation
Etude de Cas MIRLAC
Document4 pages
Etude de Cas MIRLAC
Awa Fleur Yattara
Pas encore d'évaluation
Flux Complet Sur SAP MM-PP-SD
Document34 pages
Flux Complet Sur SAP MM-PP-SD
ranya ochi
Pas encore d'évaluation
Ali El Abadi
Document18 pages
Ali El Abadi
Ali El abadi
Pas encore d'évaluation
COMB W5 711E OX DC 308L IX A+ WHIRLPOOL Electro
Document1 page
COMB W5 711E OX DC 308L IX A+ WHIRLPOOL Electro
Mohamedm38
Pas encore d'évaluation
Automatisme Pour Portails Battants Bl3924mcb Moteur Portail Battant Cardin 24v Notice Cardin
Document48 pages
Automatisme Pour Portails Battants Bl3924mcb Moteur Portail Battant Cardin 24v Notice Cardin
45x2phh5j9
Pas encore d'évaluation
MSD TP 3
Document19 pages
MSD TP 3
Maroua LH
Pas encore d'évaluation
These Adal Ahnaiba
Document618 pages
These Adal Ahnaiba
mohamedcadif2023
Pas encore d'évaluation
Reconnaissance CRS
Document26 pages
Reconnaissance CRS
Gaspard Glanz
Pas encore d'évaluation
459268execution de Chapes Le Document PDF
Document6 pages
459268execution de Chapes Le Document PDF
moulawain
Pas encore d'évaluation
Construire en Vienne Le Mag'
Document76 pages
Construire en Vienne Le Mag'
eloise_joyeux
Pas encore d'évaluation
L'identité Cachée Dans L'empreinte Digitale
Document2 pages
L'identité Cachée Dans L'empreinte Digitale
bainkss
Pas encore d'évaluation
Exercices SGBD
Document2 pages
Exercices SGBD
Asma
100% (2)
Commentaire Littéraire
Document2 pages
Commentaire Littéraire
Malorie Arnault
Pas encore d'évaluation
Ao - 44 - 14 - Cps - Etude - Economie - Eau - Benslimane
Document25 pages
Ao - 44 - 14 - Cps - Etude - Economie - Eau - Benslimane
Fatima Ezzahra Ktaib
Pas encore d'évaluation
07 Corrigé Du Sujet Bac SC 2014p
Document2 pages
07 Corrigé Du Sujet Bac SC 2014p
Alaa Miled
Pas encore d'évaluation
TD8 Energie Notions Essentielles
Document4 pages
TD8 Energie Notions Essentielles
MOUSS LOUSS
Pas encore d'évaluation
Emplois Du Temps Filière LST - S5
Document12 pages
Emplois Du Temps Filière LST - S5
Ab'Dél Ali
Pas encore d'évaluation
Transformation Lente Et Rapide: Activités
Document6 pages
Transformation Lente Et Rapide: Activités
Abd Elmooti Hijazi
Pas encore d'évaluation
Guide Eth PDF
Document41 pages
Guide Eth PDF
parfait
Pas encore d'évaluation
Naissance D'une Fonction: Audit Interne
Document52 pages
Naissance D'une Fonction: Audit Interne
Yassine Salmi
Pas encore d'évaluation
Chamoa P Psidp
Document147 pages
Chamoa P Psidp
Mustapha Fejji
Pas encore d'évaluation
Corrigé - Exam Comp Principal 2019 2020
Document6 pages
Corrigé - Exam Comp Principal 2019 2020
Héroïne CN
Pas encore d'évaluation