Académique Documents
Professionnel Documents
Culture Documents
395-Article Text-1358-1-10-20200124 PDF
395-Article Text-1358-1-10-20200124 PDF
Marian Popa1
Abstract
Cronbach alpha coefficient is still commonly used in research dedicated to the development of psychologi-
cal tests. However, there is a certain lack of understanding of the significance of real and, especially, has its lim-
its. The article presents the fundamental postulates of classical test theory and analyzes, in this context, the main
issues affecting the calculation and interpretation of Cronbach alpha coefficient: unidimensionality, internal con-
sistency, item number, characteristics of the data, the sampling error. Finally, are summarized recommendations
of good practices on the use and reporting Cronbach's alpha.
Keywords: psychological tests, reliability, internal consistency
Résumé
Le coefficient alpha de Cronbach est fréquemment utilisé dans la recherche dédiée au développement des
tests psychologiques. Cependant, on constate un certain manque de compréhension de sa signification réelle mais
aussi de ses limites. L’article présente les postulats fondamentaux de la théorie classique du test et fait l’analyse
dans ce contexte des principaux aspects qui affectent le calcul et l’interprétation du coefficient alpha de Cron-
bach : l’unidimensionnalité, la cohérence interne, le nombre d’items, les caractéristiques des données, erreur
d’échantillonnage. Enfin, on fait une synthèse des recommandations de bonnes pratiques concernant l’utilisation
et le rapport de l’alpha de Cronbach.
Mots cles : tests psychologiques, fidelite, cohérence interne
Rezumat
Coeficientul Cronbach alfa este încã frecvent utilizat în cercetarea dedicatã dezvoltãrii testelor psihologice.
Cu toate acestea, se constatã o anumitã lipsã de înþelegere a semnificaþiei lui reale ºi, mai ales, a limitelor sale.
Articolul prezintã postulatele fundamentale ale teoriei clasice a testului ºi analizeazã în acest context principalele
aspecte care afecteazã calcularea ºi interpretarea coeficientului Cronbach alfa: unidimensionalitatea, consistenþa
internã, numãrul de itemi, caracteristicile datelor, eroarea de eºantionare. În final, sunt sintetizate o serie de reco-
mandãri de bune practici cu privire la utilizarea ºi raportarea lui Cronbach alfa.
Cuvinte-cheie: teste psihologice, fidelitate, consistenþã internã
Cunoaºterea ºtiinþificã în psihologie depin- structurã (ten Holt, van Duijn, & Boomsma,
de în mod decisiv de dezvoltarea unor instru- 2010). Deºi Cronbach alfa se bucurã de o mare
mente de mãsurã (teste, chestionare) destinate popularitate, persistã totuºi numeroase confuzii
mãsurãrii diverselor caracteristici psihice. În cu privire la semnificaþia sa realã ºi interpretarea
acest context, calcularea coeficientului Cronbach lui adecvatã.
alfa încã reprezintã o practicã larg rãspânditã, în De cele mai multe ori, calcularea coeficien-
ciuda unor dezvoltãri moderne, cum ar fi teoria tului Cronbach alfa este abordatã ca un ritual
rãspunsului la itemi sau modelarea ecuaþiei de statistic mecanic, ce decurge dintr-o obligaþie
1
Universitatea din Bucureºti.
Adresa de corespondenþã: popamarian@gmail.com.
85
„Infidelitãþile“ coeficientului de fidelitate Cronbach alfa
formalã, care se considerã încheiatã odatã ce a loare obþinutã prin mãsurare, fie crescãtor, fie
fost atins pragul „critic“ de 0,70, general accep- descrescãtor, dar natura lor aleatorie face ca ero-
tat. În cele ce urmeazã, ne propunem sã aducem rile pozitive (supraestimarea valorii adevãrate)
în discuþie câteva aspecte care sunt destul de sã fie neutralizate de erorile negative (subesti-
frecvent ignorate, precum ºi modalitãþile prin marea valorii adevãrate). Ca urmare, pe o dis-
care putem ameliora interpretarea analizei de tribuþie în care fiecare scor este afectat de o
fidelitate, cu referire specialã la coeficientul eroare aleatoare, media distribuþiei nu este afec-
Cronbach alfa. tatã. Erorile aleatorii provin din interacþiunea
caracteristicii supuse mãsurãrii cu alte caracte-
ristici individuale, motiv pentru care mai sunt
1. Teoria clasicã a testului denumite ºi „erori ale trãsãturii“. O prezentare
ºi fidelitatea mãsurãrii detaliatã a surselor de eroare în mãsurarea psi-
hologicã nu intrã în obiectivul nostru aici, dar
Psihologia poate aspira la atributul de ºti- recomandãm celor interesaþi analiza sistema-
inþã numai în limitele capacitãþii de a reflecta în ticã a erorilor de testare realizatã de Pitariu ºi
mod adecvat realitatea psihicã. Dacã este ade- Albu (1996).
vãrat faptul cã ºtiinþa începe cu observarea/ Modelul mãsurãrii promovat de TCT se in-
mãsurarea realitãþii, atunci ºi problemele ºtiin- tereseazã cu precãdere de erorile aleatorii, pro-
þei încep tot din acest punct. ªi aceasta deoa- blema erorilor sistematice rãmânând în mare
rece „orice mãsurare este afectatã de eroare“ parte nerezolvatã (Kline, 2005). Din aceastã
(McNemar, 1946). Teoria clasicã a testului perspectivã, orice valoare obþinutã prin mãsu-
(TCT), cunoscutã ºi sub denumirea de „teo- rare (X) este compusã dintr-o parte „adevãratã“
ria scorului adevãrat“, a fost prefiguratã de (T), care este expresia caracteristicii pe care
Spearman (1904) ºi formulatã sistematic de dorim sã o mãsurãm, la care se adaugã eroarea
Gulliksen (1950). Presupunerea fundamentalã aleatorie (E), care indicã abaterea a valorii
pe care se întemeiazã TCT este aceea cã variaþia mãsurate de la valoarea realã:
rãspunsurilor la un test ar trebui sã reflecte X=T+E (1)
exclusiv variaþia abilitãþilor/trãsãturilor vizate
de testul respectiv. În acest context, celelalte Principala provocare pentru mãsurarea în
surse de variaþie a scorurilor reprezintã erori, psihologie constã în limitarea componentei ale-
care pot fi de douã feluri: sistematice sau alea- atorii a mãsurãrii. Cu cât aceasta este mai micã,
torii. Erorile sistematice au un efect constant cu atât valoarea mãsuratã (X) descrie mai fidel
asupra tuturor scorurilor obþinute prin mãsurare, valoarea adevãratã (T). Dacã am aplica aceleiaºi
ca rezultat al standardizãrii testului ºi al proce- persoane un test de inteligenþã de n ori, ar trebui
durii de aplicare. Din acest motiv, ele mai sunt sã ne aºteptãm sã obþinem n scoruri diferite,
denumite ºi „erori de metodã“. În ce priveºte uneori mai mari, alteori mai mici decât valoarea
erorile aleatorii, acestea au un caracter variabil realã a inteligenþei, în funcþie de dispoziþia de
de la un scor la altul. Ele afecteazã fiecare va- moment, de starea de odihnã, de impactul unor
86
„Infidelitãþile“ coeficientului de fidelitate Cronbach alfa
evenimente personale etc. Într-o asemenea situ- Una dintre formalizãrile posibile ale fide-
aþie, media scorurilor la testul de inteligenþã ar litãþii (R) poate fi exprimatã ca raport între va-
reprezenta cea mai bunã estimare a nivelului riabilitatea scorului mãsurat ºi variabilitatea
adevãrat de inteligenþã al persoanei evaluate. În scorului adevãrat:
acest context, în conformitate cu TCT, având în VAR(T)
vedere natura aleatorie a erorilor de mãsurare R= (3)
VAR(X)
de-a lungul evaluãrilor repetate, ne aºteptãm sã
fie întrunite trei condiþii fundamentale: Din expresia (3) rezultã cã fidelitatea mã-
– media erorilor de mãsurare tinde spre 0, surãrii poate lua valoarea minimã 0, atunci când
dacã numãrul mãsurãrilor creºte la infinit; variabilitatea scorului adevãrat este 0. În con-
– distribuþia erorilor are o formã normalã, formitate cu expresia (2), aceasta ar însemna cã
erorile mici alcãtuind partea centralã a dis- toatã variabilitatea scorului mãsurat este da-
tribuþiei; toratã variabilitãþii erorii. Fidelitatea maximã
– erorile sunt independente una de alta, alt- posibilã este 1 ºi este atinsã atunci când varia-
fel spus, nu existã nici un model sistematic de bilitatea scorului adevãrat este identicã cu va-
fluctuaþie a erorilor, de la o mãsurare la alta; riabilitatea scorului mãsurat. În conformitate cu
– erorile sunt independente de valoarea expresia (2), acest lucru ar însemna mãsurare
adevãratã, ceea ce înseamnã cã variaþia erorii nu fãrã eroare. Cum în practicã nu existã mãsurare
are nici o legãturã cu variaþia scorului adevãrat. liberã de eroare, rezultã cã fidelitatea oricãrei
Aplicarea repetatã a unui test aceleiaºi per- mãsurãri va fi întotdeauna mai micã de 1. Drept
soane este, evident, un lucru nepractic. Acest urmare, încercând sã cuantificãm fidelitatea nu
exerciþiu de imaginaþie însã, ne permite transfer- facem altceva decât sã cuantificãm eroarea de
ul condiþiilor fundamentale ale TCT, de la mãsurare. Altfel spus, dacã mãsurãm cu o fideli-
eºantionul de mãsurãri pe o singurã persoanã, la tate R=0,70, aceasta înseamnã cã doar proporþie
distribuþia mãsurãrilor obþinute prin aplicarea de 70% din variaþia scorurilor mãsurate (X) poa-
testului pe un eºantion de persoane diferite. În te fi pusã pe seama variaþiei valorilor adevãrate
aceastã nouã situaþie, modelul TCT poate fi for- (T), restul de 30% (1-0,70) exprimând variaþie
malizat cu expresia: determinatã de eroare (E). Pe mãsurã ce nivelul
fidelitãþii de apropie de 0, valorile obþinute prin
VAR(X)=VAR(T)+VAR(E) (2)
mãsurare variazã aleatoriu, fãrã nici o legãturã
unde VAR se referã la varianþa fiecãruia dintre cu ceva anume, ceea ce este echivalent cu a
termenii ecuaþiei la nivelul eºantionului de va- spune cã nu mãsoarã, de fapt, nimic.
lori. Pe parcursul discuþiei de mai sus am avut în
vedere doar scorul global obþinut la un test, dar
În acest context se devine operant concep- testele psihologice sunt, de regulã, compuse din
tul de fidelitate a mãsurãrii, care exprimã, în itemi (întrebãri), fiecare dintre ei fiind expresia
termeni generali, cât de consistentã este o mã- mai mult sau mai puþin exactã a constructului
surare aplicatã în mod repetat. Desigur, nu pu- vizat de testul respectiv. Fidelitatea poate fi dis-
tem ºti niciodatã care este valoarea adevãratã a cutatã deci, ºi din perspectiva modului în care
caracteristicii supuse mãsurãrii, dar putem pre- itemii unui test descriu constructul psihologic
supune cã este „stabilã“ de la un moment la supus mãsurãrii.
altul. Ca urmare, considerãm fidelã o mãsurare În contextul TCT, fidelitatea nu poate fi cal-
care produce valori identice (sau mãcar apro- culatã în mod direct, deoarece scorul adevãrat
piate) în momente diferite. În acelaºi timp, o (T) este inaccesibil mãsurãrii rãmâne necunos-
mãsurare este fidelã dacã, efectuatã pe mai mulþi cut, la fel ca ºi eroarea de mãsurare (E). În acest
subiecþi, este capabilã sã reproducã corect difer- scop, abordarea fidelitãþii este inclusã în contex-
enþele reale dintre aceºtia. Cu alte cuvinte, fi- tul mai larg al analizei de itemi. În linii mari,
delitatea se referã la precizia mãsurãrii, care este aceasta este compusã din douã mari categorii de
cu atât mai mare, cu cât eroarea de mãsurare proceduri: unele care vizeazã itemii luaþi separat
este mai micã. (indicele de dificultate, indicele de discriminare,
87
„Infidelitãþile“ coeficientului de fidelitate Cronbach alfa
corelaþia item-scor total º.a.) ºi altele care vi- uneori ºi valori mai mari de 1 sau negative.
zeazã toþi itemii la un loc. Procedurile din a Cronbach alfa poate lua valoare negativã atunci
doua categorie se referã la: fidelitatea test-retest când suma corelaþiilor negative dintre itemi este
(gradul de concordanþã între douã mãsurãri mai mare decât suma corelaþiilor pozitive
repetate, cu acelaºi instrument, al aceloraºi per- (Field, 2009). Se poate ajunge într-o astfel de
soane); fidelitatea formelor paralele (gradul de situaþie atunci când datele conþin erori, eºan-
concordanþã dintre mãsurãrile aceloraºi per- tionul este foarte mic sau numãrul itemilor este
soane cu douã teste diferite, considerate echiva- foarte redus.
lente), fidelitatea split-half (gradul de concor- În mod normal, Cronbach alfa se calcu-
danþã între scorurile parþiale, obþinute prin leazã pe baza covarianþei dintre itemi. Se poate
împãrþirea în douã a itemilor testului) ºi, ultima obþine ºi o valoare standardizatã, pe baza core-
pe listã, dar nu cea din urmã, consistenþa internã laþiei inter-itemi. Prima formã este recomandatã
(gradul de concordanþã între rãspunsurile la atunci când scorul global este obþinut prin
itemii testului). Obiectul discuþiei noastre în însumarea valorilor la fiecare item. Se va apela
continuare îl va face doar ultima dintre acestea la varianta standardizatã atunci când itemii sunt
ºi anume, analiza de consistenþã internã. mãsuraþi cu unitãþi de mãsurã diferite, fiind
necesarã standardizarea lor prealabilã (progra-
mul SPSS calculeazã implicit ambele forme).
2. Coeficientul Cronbach alfa Nu existã un standard absolut cu privirea la
mãrimea pe care ar trebui sã o aibã un coeficient
Coeficientul alfa, denumit în mod curent Cronbach alfa pentru a indica o fidelitate core-
Cronbach alfa (α), a fost propus de reputatul spunzãtoare. În general însã, valorile în jur de
psihometrician american Lee J. Cronbach 0,90 sunt considerate „excelente“, în jur de 0,80,
(1951), ca o generalizare a coeficientului Kuder- „foarte bune“, iar cele în jur de 0,70, „adecvate“
Richardson (KR20), pentru itemi cu rãspuns di- (Kline, 2005). Existã însã ºi autori care acceptã
hotomic. Deºi, aºa cum vom vedea mai departe, ºi o valoare de 0,60, dar numai în studii cu car-
nu este singurul indicator al fidelitãþii, Cron- acter exploratoriu (Garson, 2010)*.
bach alfa este, de departe, cel mai utilizat ºi cel
mai frecvent raportat în literatura de specialitate
(Christmann & Van Aelst, 2006; Ercan, Yazici, 3. Impactul fidelitãþii
Sigirli, Ediz, & Kan, 2007; ten Holt, et al., asupra validitãþii
2010). Explicaþia acestei situaþii rezidã, pe de o
parte, într-o aparentã accesibilitate teoreticã ºi, Importanþa mãrimii coeficientului Cronbach
pe de altã parte, în faptul cã poate fi uºor cal- alfa poate fi înþeleasã mai bine dacã o plasãm pe
culat cu ajutorul programelor statistice uzuale, terenul relaþiei dintre validitate ºi fidelitate, de-
cum este, de exemplu, SPSS (Borsboom, 2006). oarece „Chiar ºi acei cercetãtori care considerã
Formula (4) este una dintre expresiile de fidelitatea drept o umbrã palidã a mult mai im-
calcul pentru Cronbach alfa. portantei probleme a validitãþii, nu pot ignora
N * rm fidelitatea mãsurãrilor lor. Nici un coeficient de
α= (4) validitate ºi nici o analizã factorialã nu pot fi in-
1 + (N – 1) * rm
terpretate în afara unei estimãri corespunzãtoare
unde: a mãrimii erorii de mãsurare“ (Cronbach, 1951).
N=numãrul itemilor O mãsurare poate fi fidelã, fãrã a fi în mod
rm=media coeficienþilor de corelaþie dintre itemi necesar validã. Validitatea se referã la corectitu-
dinea mãsurãrii, altfel spus, la capacitatea aces-
Teoretic, α poate lua valori între 0 ºi 1, dar teia de a reflecta în mod adecvat ceea ce dorim
nu este exclus, în cazuri extreme, sã obþinem sã mãsurãm ºi nu altceva. Intuitiv, ne putem re-
* Pentru precizia argumentaþiei statistice, pe parcursul acestui articol vom prezenta uneori valorile lui alfa cu trei zeci-
male, dar în practicã raportarea cu doar douã zecimale este suficientã.
88
„Infidelitãþile“ coeficientului de fidelitate Cronbach alfa
T=40
fidelitate ºi validitate 40 40 40 40 40 40
89
„Infidelitãþile“ coeficientului de fidelitate Cronbach alfa
mãsurare se transpune într-o diminuare a puterii belor variabile sunt relativ ridicaþi, iar eºantio-
statistice pentru majoritatea testelor parametrice nul este mare;
ºi neparametrice. La rândul lor, Ree ºi Carreta – corecþia de atenuare produce supraesti-
(2006), au adus dovezi în sprijinul ideii cã fi- marea corelaþiei adevãrate, atunci când testele
delitatea scãzutã afecteazã multe dintre proce- supuse corelaþiei nu sunt unidimensionale, ci
durile statistice cele mai frecvent folosite: core- multidimensionale.
laþia, corelaþia parþialã, analiza de varianþã,
analiza factorialã º.a. Este de remarcat ºi faptul
cã, în contextul utilizãrii modelãrii ecuaþiilor 4. Cronbach alfa, indicator imprecis
structurale, includerea în model a erorii de al unidimensionalitãþii
mãsurare oferã posibilitatea unei estimãri mai
adecvate a corelaþiei adevãrate dintre variabile Coeficientul Cronbach alfa este prezentat
(Bedeian, Day, & Kelloway, 1997; Kline, 2005) cel mai adesea ca fiind un indicator al existenþei
Corecþia de atenuare reprezintã o modali- unui construct unic, care înglobeazã cea mai
tate practicã prin care eroarea de mãsurare este mare parte a variabilitãþii rãspunsurilor la itemii
luatã în considerare în estimarea validitãþii. To- analizaþi. În limbajul modelului factorial, vari-
tuºi în ciuda utilitãþii evidente, aceastã proce- abilitatea scorului mãsurat este compusã din trei
durã ridicã o serie de probleme ºi controverse componente: varianþa datoratã factorului co-
(Muchinsky, 1996; Schmitt, 1996; Zimmerman mun; varianþa factorilor specifici (unicitatea ite-
& Williams, 1997): milor) ºi varianþa rezidualã (eroarea). Din aceas-
– corecþia de atenuare nu poate reprezenta o tã perspectivã, Cronbach alfa ne spune cât de
alternativã la lipsa de fidelitate a mãsurãrii; mare este comunalitatea itemilor unui test, cât
– coeficienþii de corelaþie corectaþi nu mai de redusã este „unicitatea“ lor ºi, de asemenea,
prezintã aceeaºi distribuþie de eºantionare ca ºi cât de mare este legãtura dintre itemi. Aceste
varianta necorectatã, iar ca urmare, ei nu pot uti- caracteristici însã nu implicã faptul cã itemii ar
lizaþi pentru testarea ipotezelor; descrie un singur factor (Cortina, 1993; Schmitt,
– se recomandã calcularea limitelor de 1996; Tan, 2009). De altfel, Cronbach însuºi
încredere pentru r corectat pe baza limitelor de precizeazã cã alfa estimeazã cu precãdere „con-
încredere pentru r necorectat; centraþia primului factor“ (Cronbach, 1951, p.
– combinaþia unor coeficienþi reduºi de fi- 321). Din acest motiv, pe mãsurã ce numãrul ite-
delitate, cu o variabilitate ridicatã ºi un eºantion milor încãrcaþi cu primul factor creºte, valoarea
mic, poate conduce la o supracorecþie, cu valori coeficientului Cronbach alfa creºte ºi ea. Altfel
chiar mai mari decât 1, situaþie în care valoarea spus, alfa reprezintã o mãsurã a saturaþiei pri-
corectatã va fi limitatã artificial la 1; mului factor (Cortina, 1993).
– diferenþa dintre r corectat ºi r necorectat Aici trebuie remarcatã confuzia frecventã
poate fi utilizatã ca informaþie utilã pentru apre- care se face între omogenitate ºi consistenþa in-
cierea contribuþiei erorii de mãsurare la nivelul ternã. În timp ce omogenitatea se referã la uni-
obþinut al corelaþiei; dimensionalitatea itemilor, consistenþa internã
– în general, corecþia de atenuare pare a fi se referã la intensitatea corelaþiei dintre aceºtia
utilã atunci când coeficienþii de fidelitate ai am- (Green, Lissitz, & Mulaik, 1977). Consistenþa
internã este o condiþie necesarã a omogenitãþii,
90
„Infidelitãþile“ coeficientului de fidelitate Cronbach alfa
dar nu ºi suficientã. Astfel, o valoare micã a lui eliminarea acestor itemi ar fi de asemenea o
alfa s-ar putea datora faptului cã itemii descriu eroare, deoarece am elimina tocmai itemii care
nu unul, ci, sã zicem, douã constructe divergente pun în evidenþã succesul învãþãrii, ceea ce este
(fig. 2a). Dacã însã am calcula coeficienþii fi- exact obiectivul mãsurãrii. Din aceste motive, în
delitate pentru itemii care compun fiecare dintre astfel de situaþii utilizarea indicelui de consis-
cele douã constructe, am putea obþine douã val- tenþã internã Cronbach alfa este inadecvatã. Cu
ori ridicate ale lui alfa. Pe de altã parte, putem toate acestea, indicii de dificultate ºi de discrim-
obþine un coeficient alfa acceptabil atunci când inare pot fi utilizaþi ca modalitãþi de identificare
itemii chestionarului ar descrie nu unul, ci doi a itemilor greºit formulaþi, a celor nerelevanþi
sau mai mulþi factori, care nu coreleazã între ei, sau, pur ºi simplu, pentru a scoate în evidenþã
sau chiar dacã sunt corelaþi (de exemplu, douã erorile tipice pe care le fac subiecþii la anumite
componente ale agresivitãþii, „verbalã“ ºi „fi- întrebãri.
zicã“directã“) (fig. 2b).
Calcularea coeficientului Cronbach alfa se
bazeazã pe presupunerea cã existã un factor unic 5. Cronbach alfa, indicator nesigur
care explicã variabilitatea itemilor, iar valoarea al consistenþei interne
lui este afectatã atunci când aceastã presupunere
nu se susþine. Totuºi, o valoare acceptabilã a lui
alfa nu reprezintã o dovadã a unidimensionali- Având un test format din mai mulþi itemi,
tãþii, ci doar indicatorul unei dimensiuni unice coeficientul Cronbach alfa cuantificã proporþia
despre care nu putem ºti dacã este cel mai adec- varianþei comune tuturor itemilor care se regã-
vat model de a descrie datele respective. Dacã seºte în scorul total (Cronbach, 1951). Presupu-
dorim o dovadã a unidimensionalitãþii, atunci nerea fundamentalã este aceea cã fiecare item
aceasta trebuie cãutatã cu alte mijloace (de ex., reprezintã, în felul lui, un retest al celorlalþi
analiza factorialã de confirmare). itemi. Altfel spus, de exemplu, dacã avem rãs-
Calcularea lui Cronbach alfa nu are sens punsurile la 10 itemi ai unui chestionar, îi con-
atunci când presupunerea unidimensionalitãþii siderãm ca ºi cum am avea 10 rãspunsuri la un
nu existã. Acesta este cazul, de exemplu, ches- item unic. Dacã aceastã presupunere este corec-
tionarelor cu întrebãri factuale, care nu sunt in- tã, atunci trebuie sã ne aºteptãm sã avem o core-
terpretate prin adiþionarea rãspunsurilor, lucru laþie medie ridicatã între rãspunsuri. Bazându-se
care este îndeobºte cunoscut. Mai puþin cunos- pe corelaþia medie dintre itemi, Cronbach alfa
cut este faptul cã alfa nu are sens nici în cazul tinde sã fie cu atât mai mare, cu cât corelaþia
chestionarelor de cunoºtinþe. Constructele vi- medie dintre itemi este mai mare sau cu cât
zate de chestionarele psihologice sunt presupuse numãrul corelaþiilor egale dintre itemi este mai
a avea o distribuþie naturalã, aleatorie, pe când mare. Pe mãsurã ce itemii coreleazã mai puter-
distribuþia performanþei la testele de cunoºtinþe nic este nevoie de mai puþini subiecþi pentru a se
este influenþatã de procesul de învãþare. Dacã, atinge niveluri ridicate ale coeficientului Cron-
de exemplu, aplicãm un test de cunoºtinþe îna- bach alfa. Itemii care dau corelaþii cu alþi itemi
inte de parcurgerea unei materii de învãþãmânt, de 0,4 sau mai mari, contribuie într-o mãsurã
vom obþine un procentaj foarte scãzut de rãs- mai importantã la creºterea valorii lui alfa.
punsuri corecte ºi o corelaþie item-total aproape În conformitate cu caracteristicile de mai
de zero, fapt care reflectã necunoaºterea de cãtre sus, Cronbach alfa este un indicator al consis-
elevi a materiei respective (rãspunsuri greºite, tenþei interne. Numai cã, dacã ar fi aºa, valoarea
rãspunsuri la întâmplare etc.). În acest caz solu- lui alfa nu ar trebui sã fie afectatã de numãrul
þia nu constã în eliminarea sau refacerea itemi- itemilor, ceea ce în realitate se întâmplã. Dacã o
lor, ci în instruirea elevilor. Dacã aplicãm testul scalã are mai mult de 20 de itemi, poate avea un
respectiv dupã parcurgerea perioadei de instru- coeficient alfa de 0,70, chiar atunci când corela-
ire, vom obþine procentaje mari de rãspunsuri þia dintre itemi este foarte micã (Cortina, 1993).
corecte, ceea ce ar fi interpretabil drept o redusã Chiar ºi pentru o corelaþie medie inter-itemi de
capacitate discriminativã a itemilor. În realitate, 0,1, valoarea lui alfa poate sã creascã de la 0,37
91
„Infidelitãþile“ coeficientului de fidelitate Cronbach alfa
Tabelul 2. Valoarea indicelui Cronbach Alfa în funcþie de numãrul de itemi ºi de corelaþia medie din-
tre aceºtia (Zeller, 2001)
Numãr de itemi
r
mediu
5 10 20 30 50
(nesatisfãcãtor), pentru o scalã cu cinci itemi, la Valoarea lui Cronbach alfa nu este influ-
0,96 (ridicat), pe o scalã cu 50 de itemi (tab. 2). enþatã doar de numãrul itemilor, ci ºi de volumul
Din moment de Cronbach alfa creºte odatã eºantionului. Cu cât acesta creºte, alfa tinde sã
cu numãrul itemilor, am putea fi tentaþi sã uti- creascã la rândul lui. Astfel, dacã ne propunem
lizãm chestionare cu un numãr mai mare de în- un anumit nivel de fidelitate, îl putem atinge în
trebãri. Acest lucru însã, poate genera cel puþin mod artificial, prin creºterea volumului eºan-
douã probleme pe care trebuie sã le luãm în con- tionului. Desigur, cu cât corelaþia dintre itemii
siderare: testului este mai redusã, cu atât volumul eºan-
– din motive practice, testele mai scurte tionului necesar trebuie sã fie mai mare. De
sunt de dorit, datã fiind reducerea costurilor de exemplu, în cazul unei corelaþii medii inter-
realizare ºi a duratei de aplicare; itemi de 0,1, putem atinge o valoare a lui alfa de
– în cazul testelor cu numãr mare de itemi 0,7, cu 21 de subiecþi, pe care o putem ridica la
pot exista întrebãri care, chiar dacã au o core- 0,9, dacã utilizãm 81 de subiecþi (Tabelul 3). În
laþie pozitivã cu scala, contribuie la reducerea general, a fost dovedit faptul cã acurateþea esti-
coeficientului alfa, sau au o contribuþie minorã mãrii fidelitãþii creºte odatã cu creºterea volu-
la consistenþa generalã a scalei. mului eºantionului, care nu ar trebui sã fie mai
mic de 50 de subiecþi (Ercan, et al., 2007).
Tabelul 3. Volumul eºantionului în funcþie de diferite valori Cronbach Alfa ºi media coeficienþilor
de corelaþie r (Zeller, 2001)
Cronbach alfa
r
mediu
0.7 0.8 0.9
0.1 21 36 81
0.2 10 16 36
0.3 6 10 21
0.4 4 6 14
0.5 3 4 9
0.6 2 3 6
0.7 1 2 4
0.8 1 1 3
92
„Infidelitãþile“ coeficientului de fidelitate Cronbach alfa
Figura 3. Model SEM de principiu, pentru fidelitatea unui chestionar unidimensional cu 4 itemi
93
„Infidelitãþile“ coeficientului de fidelitate Cronbach alfa
alfa este de 0.830, în timp ce coeficientul λ2 este tor itemi, care descriu un anumit construct. Pen-
0.835. Diferenþa dintre cei doi coeficienþi nu tru situaþia în care sursa de eroare relevantã o
este neapãrat notabilã, dacã þinem cont de faptul reprezintã evaluatorii, de exemplu, se va apela
cã valoarea coeficientului de fidelitate se la metoda fidelitãþii inter-evaluatori.
raporteazã, în mod normal, cu douã zecimale. Una dintre consecinþele importante a teoriei
De asemenea, o opþiune alternativã de luat generalizabilitãþii este aceea cã fidelitatea cuan-
în considerare, este coeficientul de fidelitate teta tificatã cu ajutorul indicelui Cronbach alfa tre-
(θ), care se bazeazã pe varianþa explicatã de buie înþeleasã, nu doar ca o caracteristicã a tes-
primul factor ºi este strâns legat de Cronbach tului, ci ºi a populaþiei din care a fost selecþionat
alfa (Dugard, Todman, & Staines, 2010). Inter- eºantionul (presupunând cã este reprezentativ),
pretarea coeficientului teta se face de regulã precum ºi a condiþiilor de administrare a testului
dupã acelaºi standard utilizat în cazul lui Cron- (Pitariu & Albu, 1996). Din acest motiv, este
bach alfa. Practic, pentru calcularea coeficientu- extrem de important ca raportarea valorii coefi-
lui teta este necesarã efectuarea preliminarã a cientului Cronbach alfa sã nu se limiteze doar la
unei analize factoriale exploratorii, reþinându-se valoarea lui ca atare, ci ºi la toate aspectele care
valoarea eigenvalue a primului factor.* Formula descriu situaþia de mãsurare. Vom putea utiliza
de calcul este urmãtoarea: cu încredere acel instrument pentru alte mãsu-
rãri, numai dacã noile condiþii sunt similare ce-
(6) lor în care a fost calculat iniþial Cronbach alfa.
În caz contrar, se impune o nouã evaluare a con-
unde n=numãrul itemilor scalei, iar λ=valoarea sistenþei interne.
eigenvalue a primul factor, pentru soluþia
nerotitã.
6. Cronbach alfa, indicator afectat
De exemplu, în cazul scalei SEAS-37, coe- de caracteristicile datelor
ficientul de fidelitate teta este:
Fiind o expresie a analizei corelaþionale, nu
ar trebui sã fie o surprizã sensibilitatea coefi-
cientului Cronbach alfa faþã de natura ºi carac-
valoare ceva mai mare decât Cronbach alfa (0,83) teristicile datelor analizate. Teoretic, calcularea
coeficientului Cronbach alfa presupune cã vari-
Din perspectiva completitudinii, coeficien- abilele sunt mãsurate pe o scalã cu valori can-
tul Cronbach alfa nu reprezintã „fidelitatea in titative, de tip continuu. Totuºi, la fel ca ºi în
general“, ci un context particular al acesteia. cazul SEM, sunt acceptate ºi variabile mãsurate
În conformitate cu teoria generalizabilitãþii, fi- la nivel ordinal, cum sunt, de exemplu, scalele
delitatea se referã la capacitatea mãsurãrii de de tip Lickert. Utilizând o serie de simulãri cu
a rãmâne constantã de la un moment la altul, metoda Monte Carlo, pe scale Lickert cu un
independentã de orice sursã posibilã de eroare numãr diferit de variante de rãspuns, Lozano et
(Cronbach, Rajaratnam, & Gleser, 1963). Esen- al. (2008) au constat cã valoarea lui Cronbach
þa acestei teorii constã în recunoaºterea exis- alfa tinde sã fie cu atât mai mare cu cât numãrul
tenþei mai multor surse de eroare a mãsurãrii: variantelor de rãspuns la itemi este mai mare.
utilizarea altor subiecþi, utilizarea altor itemi, Proprietãþile psihometrice ale scalelor sunt afec-
utilizarea altor evaluatori º.a.. Pentru fiecare din tate de numãrul alternativelor de rãspuns. Cu cât
aceste situaþii existã o altã formã de validitate ºi subiecþii pot alege dintre mai multe variante, cu
implicit, un alt mod de estimare a acesteia. Coe- atât Cronbach alfa tinde sã fie mai mare. Scalele
ficientul Cronbach alfa este adecvat doar pentru cu 5 sau 7 variante de rãspuns sunt de preferat.
situaþia în care sursa de eroare pe care o consid- De asemenea, este important de remarcat faptul
erãm relevantã este datã de utilizarea mai mul- cã cel mai scãzut nivel al lui alfa a fost obþinut pe
* Valorile eigenvalue reprezintã suma pãtratelor coeficienþilor de corelaþie dintre fiecare item ºi factorul respectiv.
94
„Infidelitãþile“ coeficientului de fidelitate Cronbach alfa
scalele cu trei niveluri de rãspuns, chiar mai scã- eroarea sa standard, care poate fi descrisã ca
zut decât pentru scalele cu rãspuns dihotomic. fiind expresia variabilitãþii corelaþiilor inter-
Cronbach alfa este recunoscut pentru lipsa itemi (Nunnally, apud Cortina, 1993). Precizia
de robusteþe în raport cu diversele încãlcãri ale cu care alfa estimeazã valoarea sa adevãratã
condiþiilor impuse de modelul de mãsurare. Atât depinde de variabilitatea coeficienþilor de core-
varianþa cât ºi covarianþa itemilor pot fi sub- laþie dintre itemi, indiferent care este sursa aces-
stanþial modificate chiar ºi de prezenþa câtorva tei împrãºtieri. O împrãºtiere mare a corelaþiilor
valori eronate, cu atât mai mult în situaþiile în inter-itemi poate rezulta, fie din multidimen-
care eºantionul este relativ redus (Christmann & sionalitatea constructului, fie ca urmare a erorii
Van Aelst, 2006). Lipsa de omogenitate a eºan- de eºantionare (Schmitt, 1996). Eroarea stan-
tionului poate fi, la rândul ei, o sursã de alterare dard a lui alfa este cu atât mai micã cu cât core-
a valorii lui alfa, dacã presupunem existenþa laþiile dintre itemi, volumul eºantionului sau
unui grup de subiecþi care fac parte dintr-o altã numãrul itemilor sunt mai mari (Duhachek &
populaþie decât cea vizatã. În acest sens, Liu Iacobucci, 2004). Doi coeficienþi alfa de aceeaºi
(2007) ºi Liu et al. (2010), atrag atenþia cu pri- valoare pot avea precizii diferite, în funcþie de
vire la impactul valorilor extreme asupra lui alfa. una sau alta dintre caracteristicile menþionate,
Dacã valorile extreme simetrice nu afecteazã sau de combinaþia specificã dintre aceºtia.
nivelul lui alfa, cele asimetrice, plasate doar pe Aºa cum existã diferite metode de calcul al
una dintre laturile distribuþiei, au un efect infla- fidelitãþii, eroarea standard este ºi ea calculabilã
þionist asupra lui Cronbach alfa. Aceste concluzii în moduri diferite. Din perspectiva practicieni-
sugereazã importanþa unei analize preliminare lor, abordarea limitelor de încredere pentru
atente a itemilor angajaþi în analiza de fidelitate. Cronbach alfa depinde de existenþa unor pro-
grame accesibile care sã rezolve aceastã prob-
lemã. Din fericire, astfel de programe existã.
8. Cronbach alfa, indicator afectat Unul dintre acestea este ScoreRel CI, realizat în
de eroarea de eºantionare Excel de Barnette (2005), care este disponibil
gratuit ºi poate fi descãrcat de pe internet. Un alt
Cea mai paradoxalã dintre greºelile de in- program care calculeazã limitele de încredere
terpretare ale lui Cronbach alfa este aceea cã, pentru Cronbach alfa este chiar SPSS, sub for-
deºi este un indicator al erorii de mãsurare, ra- ma valorii medii a coeficientului de corelaþie
portarea lui se face, de regulã, fãrã a þine cont de intraclasã (caseta Reliability Analysis: Statistics
faptul cã el însuºi este supus erorii. La fel ca cu setãrile: Intraclass correlation coefficient/
orice indicator statistic, alfa este afectat de ero- Model: Two-Way Random/Type: Consistency).
area de eºantionare (Cortina, 1993; Duhachek & Este posibilã ºi setarea unei valori de referinþã
Iacobucci, 2004; Fan & Thompson, 2001; Kon- (implicit este 0), în raport cu care se va testa
ing & Franses, 2003). Cu alte cuvinte, valoarea semnificaþia statisticã a coeficientului Cronbach
calculatã a lui alfa nu este decât o estimare a alfa, dar Fan ºi Thompson (2001) considerã cã
valorii adevãrate a lui alfa la nivelul populaþiei aceastã opþiune nu are sens în acest context.
din care este selecþionat eºantionul. Asumarea Pentru exemplificare, am calculat Cronbach
acestui adevãr ridicã problema preciziei cu care alfa ºi limitele intervalului de încredere, pentru
valoarea calculatã estimeazã valoarea adevãratã, un eºantion de 50 de cazuri selecþionate aleato-
deci a limitelor de încredere pentru Cronbach riu din cele 4180 aplicãri ale scalei SEAS-37, cu
alfa adevãrat. SPSS ºi cu ScoreRel CI (fig. 4a ºi 4b).
Principial, limitele de încredere pentru alfa Aºa cum se poate observa, ambele pro-
pot fi înþelese, la fel ca pentru orice alt indicator grame dau valori practic identice pentru limitele
statistic, ca intervalul care ar include valoarea intervalului de încredere. Având valoarea calcu-
adevãratã a lui alfa, dacã acesta ar fi calculat pe latã 0,85, valoarea realã, cu un nivel de încre-
un numãr mare de eºantioane aleatoare de ace- dere de 95% se aflã în intervalul 0,78-0,90. În
laºi fel. Practic, mãrimea intervalului de încre- tabelul 4 am sintetizat o serie de valori ale lui
dere (precizia) lui Cronbach alfa, depinde de alfa ºi limitele lor de încredere, calculate pe
95
„Infidelitãþile“ coeficientului de fidelitate Cronbach alfa
Figura 4. Limitele de încredere pentru Cronbach alfa=0.899, calculate cu SPSS (a) si SoreRel CI (b)
Tabelul 4. Limite de încredere ale lui alfa pentru eºantioane de mãrimi diferite
N alfa Lim. inf Lim. sup Mãrime interval
eºantioane aleatorii de diferite mãrimi, ale ace- de selecþia de eºantionare, mãrimea intervalului
leiaºi scale SEAS-37. Aºa cum se poate observa, de încredere (diferenþa dintre limita superioarã
indiferent de variaþiile lui alfa, care sunt induse ºi cea inferioarã) tinde sã scadã sistematic, pe
96
„Infidelitãþile“ coeficientului de fidelitate Cronbach alfa
Tabelul 6. Variaþia limitelor de încredere (95%) pentru un chestionar cu 50 itemi, în funcþie de N ºi val-
oarea lui alfa
alfa=0.60 alfa=0.70 alfa=0.80 alfa=0.90
N
Inf Sup inf sup inf sup inf sup
97
„Infidelitãþile“ coeficientului de fidelitate Cronbach alfa
98
„Infidelitãþile“ coeficientului de fidelitate Cronbach alfa
Green, S. B., & Yang, Y. (2009). Reliability of Summed Pitariu, H., & Albu, M. (1996). Psihologia personalu-
Item Scores Using Structural Equation Modeling: lui: I. Mãsurarea ºi interpretarea diferenþelor indi-
An Alternative to Coefficient Alpha. Psychometri- viduale. Cluj-Napoca: Editura Presa Universitarã
ka, 74(1), 155-167. Clujeanã.
Gulliksen, H. (1950). Theory Of Mental Tests. New York: Popa, M. (2010). Scala de evaluare a adaptarii la stres
John Wiley & Sons, Inc. (versiune online: http://w (SEAS-37).Unpublished manuscript.
ww.questia.com/PM.qst?a=o&d=8818547#). Raykov, T. (1997). Estimation of Composite Reliability
Huysamen, G. K. (2006). Coefficient Alpha: Unneces- for Congeneric Measures. Applied Psychological
sarily Ambiguous; Unduly Ubiquitous. SA Journal Measurement, 21(2), 173-184.
of Industrial Psychology, 32(4), 34-40 (http://ww Ree, M. J., & Carretta, T. R. (2006). The Role of Mea-
w.sajip.co.za/index.php/sajip/article/viewF surement Error in Familiar Statistics. Organiza-
ile/242/239). tional Research Methods, 9(1), 99-112.
Kanyongo, G. Y., Brook, G. P., Kyei-Blankson, L., & Schmitt, N. (1996). Uses and abuses of coefficient alpha.
Gocmen, G. (2007). Reliability and Statistical Psychological Assessment, 8, 350-353.
Power: How Measurement Fallibility Affects Power Sijtsma, K. (2009). On the Use, the Misuse, and the
and Required Sample Sizes for Several Parametric Very Limited Usefulness of Cronbach’s Alpha.
and Nonparametric Statistics. Journal of Modern Psychometrika, 74(1), 107-120.
Applied Statistical Methods, 6(1), 81-90. Spearman, C. (1904). The Proof and Measurement of
Kline, T. J. B. (2005). Psychological testing: a practical Association between Two Things. The American
approach to design and evaluation. Thousand Journal of Psychology, 15(1), 72-101.
Oaks: Sage Publications. Tan, ª. (2009). Misuses of KR-20 and Cronbach’s
Koning, A. J., & Franses, P. H. (2003). Confidence Inter- Alpha Reliability Coefficients. Education and Sci-
vals for Cronbach’s Coefficient Alpha Values: Eras- ence, 34(152), 101-112 (http://egitimvebilim.ted.o
mus Research Institute of Management: Report rg.tr/index.php/EB/article/viewFile/595/175).
Series Research in Management (RS-2003-041- ten Holt, J. C., van Duijn, M. A. J., & Boomsma, A.
MKT) (http://publishing.eur.nl/ir/repub/asset/43 (2010). Scale construction and evaluation in prac-
1/ERS-2003-041-MKT.pdf). tice: A review of factor analysis versus item response
Liu, Y., Wu, A. D., & Zumbo, B. D. (2010). The impact theory applications Psychological Test and Assess-
of outliers on Cronbach’s coefficient alpha estimate ment Modeling, 52(3), 272-297
of reliability: Ordinal/rating scale item responses. Widhiarso, W. (2007). Estimate Reliability Measurement
Educational and Psychological Measurement, for Multidimensional Scales Unpublished Research
70(1), 5-21. Summary. Faculty of Psychology. Gadjah Mada
Liu, Y., & Zumbo, B. D. (2007). The Impact of Outliers University (http://academia.edu.documents.s3.am
on Cronbach's Coefficient Alpha Estimate of Reli- azonaws.com/1803835/Estimate_Reliability_Mea-
ability: Visual Analogue Scales. Educational and surement_for_Multidimensional_Scales.pdf).
Psychological Measurement, 67, 620-634. Wilkinson L. &Task Force on Statistical Inference.
Lozano, L. M., Garcia-Cueto, E., & Muniz, J. (2008). (1999). Statistical methods in psychology journals:
Effect of the Number of Responses Categories on Guidelines and explanations. American Psycholo-
the Reliability and Validity of Rating Scales. gist (10.04.2009: http://www.loyola.edu/library/re
Methodology: European Journal of Research f/articles/Wilkinson.pdf), 54, 594-604.
Methods for the Behavioral and Social Sciences, Zeller, R. A. (Ed.) (2001) Encyclopedia of Sociology
4(2), 73-79. (Second ed., Vols. 4). Macmillan Reference USA.
McNemar, Q. (1946). Opinion-Attitude Methodology. Zimmerman, D. W., & Williams, R. H. (1997). Proper-
Psychological Bulletin 43, 289-374. ties of the Spearman Correction for Attenuation
Muchinsky, P. M. (1996). The Correction for Attenua- for Normal and Realistic Non-Normal Distribu-
tion. Educational and Psychological Measurement, tions. Applied Psychological Measurement, 21(3),
56(1), 63-75. 253-270.
99