Vous êtes sur la page 1sur 4

Correction EX1

Il faut normaliser le poids w=tf*idf par la norme du vecteur qui représente le document
Poids des termes dans le doc d1 ntc
Term tf Idf tf-idf Poids normalisée w
Car 27 1.65 44.55 0.89736877414344
Auto 3 2.08 6.24 0.125692057253761
Best 14 1.5 21 0.42300211575785

Poids des termes dans le doc d1 ltc


Term tf Idf tf-idf Poids normalisée w
Car 2.43136376 1.65 4.011750210862 0.669583094005628
Auto 1.47712125 2.08 3.072412209817 0.512802434194342
Insurance 1.62 0 0
Best 2.14612804 1.5 3.219192053517 0.537300794440328

Correction EX2
N 10000
tf df idf simple =1/df idf log
il 1 1000 0.001 1
fait 1 1000 0.001 1
beau 1 1000 0.001 1
ce 1 1000 0.001 1
soir 1 1000 0.001 1
Correction EX3
N 64
tf df idf simple =1/df idf log
domaine 3 16 0.0625 0.602059991327962
théorique 2 8 0.125 0.903089986991943
informatique 4 4 0.25 1.20411998265592

Correction EX4
deux vecteurs
Q1 D1 wq*wd Q1
t1 2 1 2 2
t2 0 0 0 0
t3 2 1 2 2
t4 0 0 0 0
t5 0 0 0 0
t6 0 0 0 0
2.82842712 1.41421356 4 1 2.82842712474619

Q1 D3 wq*wd Q1
2 1 2 2
0 2 0 0
2 3 6 2
0 0 0 0
0 1 0 0
0 0 0 0
2.82842712 3.87298335 8 0.73029674334 2.82842712474619

Q1 D5 wq*wd Q1
2 1 2 2
0 1 0 0
2 1 2 2
0 4 0 0
0 2 0 0
0 1 0 0
2.82842712 4.89897949 4 0.288675134595 2.82842712474619
Poids des termes dans le doc d2 ltc
Term tf Idf tf-idf Poids normalisée w
Car 1.602059991328 1.65 2.64339899 0.36987486
Auto 2.518513939878 2.08 5.23850899 0.73299294
Insurance 2.518513939878 1.62 4.07999258 0.57088873
Best 0 1.5 0 0

tf*idf poids normalisé


1 0.4472136
1 0.4472136
1 0.4472136
1 0.4472136
1 0.4472136
tf*idf poids normalisé
1.80617997 0.33129458
1.80617997 0.33129458
4.81647993 0.88345221

D2 wq*wd
3 6
0 0
2 4
1 0
0 0
0 0
3.74165739 10 0.944911182523

D4 wq*wd
0 0
0 0
0 0
2 0
1 0
2 0
3 0 0

D6 wq*wd
1 2
1 0
0 0
0 0
3 0
2 0
3.87298335 2 0.182574185835

Vous aimerez peut-être aussi