Académique Documents
Professionnel Documents
Culture Documents
12 decembrie 2016
Creierul uman are o capacitate remarcabila de a lua decizii n prezent, a informat, iilor incerte sau incomplete. Facem predict, ii, uneori incons, tient, despre
evenimente din viitor sau pe care nu le putem observa direct s, i asta ne ajuta sa
interact, ion
am at
at de eficient cu lumea din jur.
Este necesar, deci, atunci cand discutam despre inteligent, a artificiala sa ne
punem problema reprezent
arii incertitudinii unor evenimente, fie ca aceasta provine din absent, a unor observat, ii, fie ca este consecint, a unor procese aleatoare,
nedeterministe (e.g. aruncarea unui zar). Cadrul matematic care ofera conceptele utile acestei discut, ii l reprezinta teoria probabilitat, ilor. In cele ce urmeaza
sunt reluate c
ateva not, iuni elementare necesare.
1
1.1
Teoria probabilit
at, ilor
Probabilitatea unui eveniment
Fie X o variabil
a aleatoare care poate lua valoarea 0 sau 1 (X este o variabila
aleatoare discret
a binar
a). Definim probabilitatea producerii evenimentului X =
1 ca fiind raportul dintre numarul de dat, i n care variabila X ia valoarea 1 s, i
num
arul total de experimente. Vom nota aceasta probabilitate astfel: p (X = 1).
Prin definit, ie orice probabilitate este un numar ntre 0 s, i 1.
Pentru simplificare vom nota n continuare cu p (X) probabilitatea unui eveniment oarecare X.
Dac
a p (X) = 1 atunci X este un eveniment sigur (e.g. X = 0 X = 1).
Dac
a p (X) = 0 atunci X este un eveniment imposibil.
Vom nota cu X evenimentul contrar (sau complementar) evenimentului X.
p (X) = 1 p (X)
1.2
(1)
Evenimente independente
Dou
a evenimente X s, i Y se numesc independente daca probabilitatea evenimentului combinat X Y este produsul probabilitat, ilor individuale de producere a
celor dou
a evenimente (vezi Formula 2). Vom nota fapul ca doua evenimente
1
(2)
Dou
a evenimente X s, i Y se numesc incompatibile daca acestea nu se pot
produce simultan: p (X Y ) = 0.
Probabilit
at, i condit, ionate
Fie X s, i Y dou
a evenimente s, i p (Y ) 6= 0. Probabilitatea lui X condit, ionat de
Y este dat
a de raportul dintre probabilitatea evenimentului combinat s, i probabilitatea evenimentului Y (vezi Formula 3). Intuitiv, aceasta descrie s, ansele de
a se produce evenimentul X atunci cand evenimentul Y s-a realizat.
p (X|Y ) =
p (X Y )
p (Y )
(3)
N
X
p (X|Yn ) p (Yn ) =
n=1
N
X
p (X Yn )
(5)
n=1
O aplicat, ie uzual
a a acestei reguli este descompunerea evenimentului sigur
n Y s, i Y (Formula 6).
p (X) = p (X|Y ) p (Y ) + p (X|Y ) p (Y )
(6)
Exemplu S
a presupunem ca un agent vrea sa s, i evalueze s, ansele de a cas, tiga
un joc cu zar. Fie C evenimentul n care agentul cas, tiga jocul. Presupunand
c
a agentul cunoas, te probabilitatea ca zarul sa pice pe fiecare dintre cele s, ase
fet, e ale sale p (Z = i) , i {1, . . . , 6}, acesta trebuie sa evalueze apoi care sunt
s, ansele de a c
as, tiga n fiecare dintre acele cazuri p (C|Z = i). Atunci, s, ansele ca
agentul s
a c
as, tige jocul sunt date de cantitea urmatoare (Formula 7):
2
p (C) =
6
X
p (C|Z = i) p (Z = i)
(7)
i=1
1.3
Pentru dou
a evenimente X s, i Y , aplicand Formula 5 s, i t, inand cont de simetria
p (X Y ) = p (Y X) se obt, ine Teorema lui Bayes:
p (X|Y ) =
p (Y |X) p (X)
p (Y )
(8)
Teorema lui Bayes paote fi interpretata ca o condit, ionare cauzala. Frumuset, ea acestei formule vine din faptul ca exprima probabilitatea unei cauze pe baza
unei observat, ii f
acute, ntorcand direct, ia de condit, ionare. Probabilitatea posterioar
a p (X|Y ) este exprimata ca produsul dintre verosimilitatea observat, iei
f
acute dat
a fiind cauza X, p (Y |X), s, i probabilitatea apriorica a cauzei p (X)
mp
art, it la probabilitatea totala a evenimentului Y .
O aplicat, ie uzual
a a Teoremei lui Bayes este aplicarea n cazul evenimentelor
complementare precum n Formula 9.
p (X|Y ) =
p (Y |X) p (X)
p (Y |X) p (X) + p (Y |X) p (X)
(9)
Exemplu
Se consider
a o anume forma de gripa ce afecteaza un procent cunoscut din
populat, ie (1%) s, i un test ce semnaleaza cu o anumita certitudine prezent, a acestei
boli. Mai precis, se cunosc urmatoarele probabilitat, i:
p (Gripa) = 0.01 - incident, a acestei forme de gripa ete 1%;
p (+|Gripa) = 0.9 - probabilitatea ca testul sa indice corect prezent, a gripei
n cazul unui pacient bolnav;
p (+|Gripa) = 0.2 - probabilitatea ca testul sa indice gres, it prezent, a
gripei n cazul unui pacient sanatos.
S
a not
am s, i probabilit
at, ile evenimentelor complementare:
p (Gripa) = 0.99 - probabilitatea evenimentului complementar (indivizii
s
an
atos, i din r
andul populat, iei);
p (|Gripa) = 0.1 - probabilitatea ca testul sa NU indice prezent, a gripei
n cazul unui pacient bolnav (negativ fals);
p (|Gripa) = 0.8 - probabilitatea ca testul sa iasa negativ n cazul unui
individ s
an
atos.
Aplic
and teorema lui Bayes putem afla care este probabilitatea ca un individ
s
a fie bolnav dac
a testul a ies, it pozitiv:
p (+|Gripa) p (Gripa)
p (+)
p (+|Gripa) p (Gripa)
=
p (+|Gripa) p (Gripa) + p (+|Gripa) p (Gripa)
0.9 0.01
=
0.04348
0.9 + 0.01 + 0.2 0.99
p (Gripa|+) =
(10)
Artificiu de calcul Uneori, n teorema lui Bayes numitorul este greu de calculat. Se poate evita acest calcul direct folosindu-se evenimentul complementar.
p (Y |X) p (X) not. P 1
=
p (Y )
p (X|Y ) =
(11)
(12)
Calcul
andu-se doar num
aratorii din Ecuat, iile 11 s, i 12, se rezolva apoi urmatorul
sistem de ecuat, ii:
P 1 + P 2 = 1
p (X|Y ) = P 1
(13)
(14)
Ret, elele Bayesiene sunt modele grafice utilizate pentru reprezentarea eficienta a
unor distribut, ii comune peste un spat, iu mai mare de variabile aleatoare. Ret, elele
Bayesiene sunt grafuri orientate aciclice n care nodurile reprezinta variabile
aleatoare, iar arcele reprezinta relat, ii cauzale directe ntre acestea.
Ret, ele Bayesiene pot lucra s, i cu variabile continue, dar n cadrul acestei
expuneri ne vom referi doar la ret, ele ce descriu probabilitat, i pentru variabile
discrete.
Figura 1 reprezint
a o ret, ea bayesiana cu doua variabile binare: A s, i B. Pentru
a simplifica notat, iile vom considera evenimentele A A = 1 s, i A A = 0
not
and, deci, p (A) = p (A = 1) s, i probabilitatea evenimentului complementar
p (A) = p (A = 0). Convent, ia este folosita pentru toate variabilele binare B, C,
D, etc. ce vor ap
area mai jos.
p (A)
p (B|A)
p (B|A)
2.1
Independent,
a condit, ional
a
Unul dintre conceptele cheie din teoria probabilitat, ilor care face ca lucrul cu
ret, elele bayesiane s
a fie eficient este independent, a condit, ional
a. Daca observarea
unei variabile Y face ca variabila X sa nu depinda de o a treia variabila Z atunci
spunem c
a X este condit, ional independenta de Z data fiind Y. Intuitiv, aceasta
relat, ie indic
a faptul c
a atunci cand rezultatul lui Y este cunoscut, observarea
lui Z nu ar aduce nicio informat, ie suplimentara despre X (sau, echivalent, nu
ar modifica (in)certitudinea asupra variabilei X). Una dintre notat, iile uzuale
pentru independent, a condit, ionala este cea din Formula 15.
X Z|Y p (X|Y, Z) = p (X|Y)
(15)
Relat, ia de independent,
a condit, ionala se generalizeaza s, i la mult, imi de variabile. In Formula 16, X, Y s, i Z reprezinta mult, imi de variabile aleatoare.
X Z|Y p (X|Y, Z) = p (X|Y)
(16)
Pentru a putea investiga aplicat, iile independent, ei condit, ionale n ret, ele bayesiene, mai jos sunt descrise trei posibile relat, ii n care se pot gasi trei variabile
aleatoare.
Lant, de cauzalitate Fie ret, eaua bayesiana din Figura 3 cu trei variabile A,
B s, i C. S
a presupunem c
a aceasta modeleaza urmatoarea situat, ie: variabila A
reprezint
a faptul c
a este iarna, variabila B starea de a ninge afara, iar variabila
C faptul c
a Ionut, se d
a cu sania. In primul caz sa presupunem ca nu s, tim
dac
a afar
a ninge sau nu. Informat, ia despre anotimpul curent (daca este iarna
sau nu, adic
a observarea variabilei A) modifica ceea ce credem despre faptul ca
Ionut, se d
a cu sania. Mai precis, ntr-un alt anotimp decat iarna, acest lucru ar
p
area improbabil, deoarce este foarte put, in probabil sa ninga. Iarna, n schimb,
putem crede c
a sunt s, anse mari sa ninga, drept urmare sunt s, anse mai mari ca
Ionut, s
a se dea cu sania. Dar, odata ce aflam daca ninge sau nu, informat, ia
despre anotimpul curent nu mai poate influent, a s, ansele pe care le acordam
evenimentului Ionut, se d
a cu sania. In acest caz, deci, A C|B s, i A 6 C.
A
(a) A 6 C
(b) A C|B
(a) A 6 C
C
(b) A C|B
A
A
(a) A C
(b) A 6 C|B
B
(c) A 6 C|B
2.2
D-Separabilitate
Not, iunea de D-separabilitate foloses, te o analiza a grafului care descrie ret, eaua
bayesian
a pentru a determina daca doua mult, imi de variabile sunt independente
condit, ional sau nu.
O cale neorientat
a ntre o mult, ime de noduri X s, i o mult, ime de noduri Z
este orice secvent,
a de arce (indiferent de orientarea lor) care pleaca de la un
membru al mult, imii X s, i ajunge la un membru al mult, imii Z.
D
andu-se o mult, ime de noduri O observate, o cale p este blocat
a daca una
dintre urm
atoarele trei condit, ii este adevarata:
1. exist
a un nod Y O care reprezinta destinat, ia unui arc din p s, i sursa unui
alt arc din p (nl
ant, uire cauzala);
2. exist
a un nod Y O care reprezinta sursa a doua arce diferite din p (cauza
comun
a);
3. niciun nod Y care reprezinta destinat, ia a doua arce din p nu se afla n O
s, i nici vreun descendent de-ai lui nu se afla n O.
O mult, ime de noduri O d-separ
a doua mult, imi X s, i Z daca orice cala neorientat
a ntre X s, i Z este blocata prin observarea variabilelor din O.
Exemplu s, i probleme
A
Intrebarea 2. De c
at, i parametri este nevoie pentru a descrie complet ret, eaua
bayesian
a din Figura 6? De cat, i ar fi fost nevoie ntr-o reprezentare tabulara
complet
a a p (A, B, C, D, E, F, G)?
d) A C|E
e) F G|A
f) B C|G
g) F C|G
G
(b) Intrebarea 3.b.
Intrebarea 4. Consider
and doar variabilele D, F, G, precum n Figura 8,
calculat, i urm
atoarele probabilitat, i:
a) p (D|F G)
b) p (F |G)
p (D)
p (F |D)
p (F |D)
0.8
0.5
0.7
p (G|D)
p (G|D)
10
0.25
0.65
Intrebarea 5. Consider
and doar variabilele D, E, G, precum n Figura 9,
calculat, i urm
atoarele probabilitat, i :
a) p (D|E)
b) p (D|G E)
p (D)
0.7
p (E)
p (G|D E)
p (G|D E)
p (G|D E)
p (G|D E)
0.25
0.9
0.8
0.6
0.2
(17)
(18)
(19)
Intrebarea 6. Urm
arind ret, eaua bayesiana din Figura 10, calculat, i urmatoarele
probabilit
at, i:
a) p (B|F )
b) p (A|F G)
c) p (B|C)
11
p (B)
p (A)
0.6
p (D|A B)
p (D|A B)
p (D|A B)
p (D|A B)
p (F |D)
p (F |D)
0.8
0.5
0.9
0.6
0.6
0.05
0.8
p (C)
p (E|C)
p (E|C)
p (G|D E)
p (G|D E)
p (G|D E)
p (G|D E)
0.7
0.2
0.9
0.8
0.6
0.2
12
0.1