Académique Documents
Professionnel Documents
Culture Documents
Partie 2 Introduction
Partie 6 Conclusion
Partie 7 Exercice
1
Problematique
1960's
Qu'est ce que la
classification de texte?
classification de texte :
Analyser
Ensembles données
des
et
classifiée
données organiser
Les critères Les critères non
observables : observables :
Le titre. Contenu.......
nom de l'auteur.
l'année de l'Edition.
numéro de l'édition . . .
Avancent un peux
dans l'histoire :
2/
2 Arbre de décision
3/
3 Algorithme généalogique
4/
4 Le réseaux de neurones
Fruit
Classifieur Fruit
Légumes
Pays
Algorithmes
naïves bayes
classifier
Naïve… pourquoi?
DT
Hypothèses:
h1:citadine=occasion , h2:sportive=neuve
citadine sportive
rouge :
occasion /citadine
vert:
neuve/sportive
DT
Naïve:
Forte indépendance des hypothèses .
Malgré sa naïveté l'algorithme a fait preuve plus que
suffisantes dans beaucoup de problèmes complexes
citons :
-La classification de texte (ca c'est son but
auparavant).
-Analyse sentimental.
-prédiction de la meteo...
algorithmes naïves bayes
classifier
1- 2- 3-
Bernoulli Multinomiale Gaussien
3
Algorithme de
Bernoulli
la loi de Bernoulli :
En mathématiques et plus précisément en théorie des probabilités,
la loi de Bernoulli, du nom du mathématicien suisse Jacques
Bernoulli, désigne la loi de probabilité d'une variable aléatoire
discrète qui prend la valeur 1 avec la probabilité p et 0 avec la
probabilité q = 1 – p
0 ou 1
Oui ou non
Vrai ou faux ..
Weather Sunny Overcast Rainy Sunny Sunny Overcast Rainy Rainy Sunny Rainy Sunny Overcast Overcast Rainy
Play No Yes Yes Yes Yes Yes No No Yes Yes No Yes Yes No
1- Calculer toutes les conditions météorologiques par rapport à la
condition météo respective, puis Trouvez les probabilités de chaque
condition météorologique et créez un tableau de probabilité :
Weather Yes No
Sunny 3 2 =5/14(0.36)
Overcast 4 0 =4/14(0.29)
Rainy 2 3 =5/14(0.36)
Total 9 5
=9/14 =5/14
(0.64) (0.36)
But :
1 2 3
Bernoulli Naïve Bayes - Utilisé pour les données discrètes, où les entités
ne sont que sous forme binaire.
Outlook(x1) = Sunny
Temperature(x2)=Hot
today =
Humidity(x3)=Normal
Windy(x4)=Flase
P(B/A) * P(A)
P(A/B) =
P(B)
p(y=yes/x=today)= p(x=today/y=yes)*p(y=yes)
=p(x1=sunny/y=yes)*p(x2=hot/y=yes)*p(x3=normal/y=yes)*p(x4=false/y=yes)*p(y=yes)
= 0.0211
p(y=no/x=today)= p(x=today/y=yes)*p(no)
=p(x1=sunny/y=no)*p(x2=hot/y=no)*p(x3=normal/y=no)*p(x4=false/y=no)*p(y=no)
= 0.0045
0.0045 + 0.0211 = 0.0256