Vous êtes sur la page 1sur 12

Analiza bivariata a

datelor
Analiza bivariata a datelor

! Presupune masurarea gradului de


asociere a doua variabile sub
aspectul:
Directiei (naturii)
Intensitatii
Semnificatiei statistice
Variabilele nominale
Tabele de frecvente (contingenta) considerata simultan
pentru doua sau mai multe variabile caracteristice aceluiasi
esantion.

Coeficientul de corelatie (valori intre -1 si +1)


ad − bc
rphi =
[(a + b)(c + d )(a + c )(b + d )]1 / 2
Directia asocierii este data de valoarea lui (rphi)2

Gradul de semnificatie al asocierii dintre opiniile subiectilor


constituiti in cele doua esantioane independente este
determinat cu ajutorul testului χ2, McNemar sau Fisher.
Testul neparametric χ2
! Bazat pe ipoteza nula:
H0: nu exista diferente semnificative intre cele doua
variabile.
r k Oij − Aij )
2

χ = ∑∑ (
2
c
i =1 j =1 Aij
! Valoarea calculata χc2 a testului se
compara cu valoarea tabelata χt2 a
acestuia, obtinuta in functie de
probabilitatea de garantare a rezultatului
si gradele de libertate asociate: (r-1)(k-1).
χc2 ≤ χt2 : se accepta ipoteza nula
χc2 > χt2 : se respinge ipoteza nula
Testul neparametric χ2
! Pentru mai mult de doua subesantioane
independente trebuie ca frecventele Oij > 1 si Oij
< 5 sa nu depaseasca 20%.
! Masurarea gradului de asociere se poate realiza
cu ajutorul coeficientului de contingenta:

χ 2
C= c

N + χ c2
Testul Fisher
! Inlocuieste testul χ2 atunci cand dimensiunea
esantionului N<40 si k=r=2
! Testul probabilitatii exacte (Fisher) are aceiasi
ipoteza nula:
H0: nu exista diferente semnificative intre cele doua
variabile.
( A + B )!(C + D )!( A + C )!( B + D )!
p=
N ! A! B!C! D!
! Valoarea calculata p a testului se compara cu
probabilitatea de garantare a rezultatului (ex.:
95%).
p ≤ 0,05 : se respinge ipoteza nula
p > 0,05 : se accepta ipoteza nula
Testul McNemar
! Inlocuieste testul χ2 atunci cand cele doua
esantioane investigate nu sunt independente
! Testul McNemar are aceiasi ipoteza nula:
H0: nu exista diferente semnificative intre cele doua
variabile.
( a − d − 1) 2
χ c2 =
a+d
! a si d reprezinta frecventele subesantioanelor
independente.
! Interpretarea este aceiasi ca si in cazul testului
χ2 :
χc2 ≤ χt2 : se accepta ipoteza nula
χc2 > χt2 : se respinge ipoteza nula
Variabilele ordinale
Tabele de frecvente (contingenta) considerata simultan pentru
doua sau mai multe variabile caracteristice aceluiasi esantion.

Masurarea gradului de asociere se poate utiliza coeficientul


Spearman de corelatie a rangurilor
n
6∑ Di2
ρ = 1− i =1

n(n − 1)
2

Directia asocierii este data de valoarea lui ρ sau γ.

Gradul de semnificatie al asocierii dintre opiniile subiectilor


constituiti in cele doua esantioane independente este
determinat cu testului semnificatiei coeficientului Spearman.
Coeficientul de corelatie Spearman

! Bazat pe ipoteza nula:


H0: nu exista o corelatie intre variabilele investigate.
ρ
Zc =
1
n −1
! Valoarea calculata Zc a testului se compara
cu valoarea tabelata Zt a acestuia, obtinuta
in functie de probabilitatea de garantare a
rezultatului.
-Zt ≤ Zc ≤ Zt : se accepta ipoteza nula
altfel : se respinge ipoteza nula
Coeficientul de corelatie γ al lui
Goodman si Kruskall
! Se poate utiliza atunci cand coeficientul Spearman nu ofera
valori concludente.
! Valoarea lui γ, la fel ca si ρ, poate lua valori in intervalul -1
si +1.
P−Q
γ =
P+Q
! P se obtine inmultind valoarea frecventei din coltul din
stanga sus a tabelului de frecvente asociat cu valorile de pe
randul urmator, fara cea care se afla imediat sub ea, si cu
celelalte valori ale tabelului, dupa care se insumeaza cu
produsul dintre prima valoare a randului urmator si suma
frecventelor incepand de pe randul urmator, insa din nou
fara valoarea aflata imediat sub ea, iterativ. Q se calculeaza
dupa aceleasi reguli, insa incepand din dreapta sus.
Variabilele metrice
Tabele de frecvente (contingenta) considerata simultan pentru
doua sau mai multe variabile caracteristice aceluiasi esantion.

Masurarea gradului de asociere se poate utiliza coeficientul


Pearson de corelatie a rangurilor
n n n
n ∑ x i y i − ∑ xi ∑ y i
r= i =1 i =1 i =1

n n n n
n ∑ ( xi ) − ( ∑ xi )
2 2
n ∑ ( y i ) − (∑ y i ) 2
2

i =1 i =1 i =1 i =1

Directia asocierii este data de valoarea lui r.

Gradul de semnificatie al asocierii dintre opiniile subiectilor


constituiti in cele doua esantioane este determinat prin
testarea semnificatiei statistice a coeficientului r.
Coeficientul de corelatie Pearson
! Utilizat pentru variabile continue, normale,
cu dispersii asemanatoare
! Bazat pe ipoteza nula:
H0: nu exista o corelatie intre variabilele investigate
(r nu este in mod semnificativ diferit de zero).
1+ r
1,1513 + log10 ( )
Zc = 1− r
1
n−3
! Valoarea calculata Zc a testului se compara
cu valoarea tabelata Zt a acestuia, obtinuta
in functie de probabilitatea de garantare a
rezultatului.
-Zt2 ≤ Zc2 ≤ Zt2 : se accepta ipoteza nula
altfel : se respinge ipoteza nula