Vous êtes sur la page 1sur 183

CRISTIAN POMOHACI

DANIELA PRLEA

ANALIZA DATELOR
Ediia a II-a

Editura Fundaiei Romnia de Mine, 2008 Editur acreditat de Ministerul Educaiei, Cercetrii i Tineretului prin Consiliul Naional al Cercetrii tiinifice din nvmntul Superior

Descrierea CIP a Bibliotecii Naionale a Romniei POMOHACI, CRISTIAN MIHAI Analiza datelor. Ediia a II-a / Cristian M. Pomohaci, Daniela Prlea. Bucureti, Editura Fundaiei Romnia de Mine, 2008 Bibliogr. ISBN 978-973-163-162-2 303.442.22(075.8)

Reproducerea integral sau fragmentar, prin orice form i prin orice mijloace tehnice, este strict interzis i se pedepsete conform legii.

Rspunderea pentru coninutul i originalitatea textului revine exclusiv autorului/autorilor

UNIVERSITATEA SPIRU HARET


FACULTATEA DE SOCIOLOGIE-PSIHOLOGIE

CRISTIAN POMOHACI

DANIELA PRLEA

ANALIZA DATELOR
Ediia a II-a

EDITURA FUNDAIEI ROMNIA DE MINE Bucureti, 2008


3

CUPRINS

Introducere .. 1. NOIUNI PRELIMINARE 1.1. Cunoaterea ... 1.2. Cum putem defini Analiza datelor? ... 1.3. Stabilirea ipotezelor ... 1.3.1. Caracteristici ale ipotezelor . 1.3.2. Erori frecvente n formularea ipotezelor . 1.4. Grupul de subieci . 1.5. Ce metode putem folosi pentru prelucrarea datelor? 1.5.1. Metoda observaiei sociologice ... 1.5.2. Ancheta bazat pe chestionar .. 1.5.3. Testele psihologice .. 1.5.4. Sociometria 1.6. Msurarea . 2. REPREZENTAREA DATELOR CA MOD DE EXAMINARE PRELIMINAR A FENOMENULUI STUDIAT 2.1. Serii de numere .. 2.2. Gruparea datelor 2.3. Reprezentri grafice ale seriilor de numere ... 2.3.1. Diagramele de tip linie 2.3.2. Histogramele 2.3.3. Alte tipuri de diagrame 2.3.4. Sociograme .. 2.3.5. Alte reprezentri ale datelor

11 12 17 17 18 19 23 24 26 31 32 33

38 41 42 43 48 50 56 58 5

2.4. Noiuni introductive de prezentare a datelor n Power Point 2.4.1. Ce este Power Point? ... 2.4.2. Cum ncepem? . 2.4.3. Cum realizm vizualizarea n Power Point? ... 2.4.4. Modul de vizualizare Slide-Show . 2.5. Graficul Gantt 2.6. Concluzii ... 3. STATISTICA N CERCETAREA SOCIAL 3.1. Caracteristici (variabile) 3.2 Populaie . 3.3. Eantion. Lot 3.4. Eveniment .. 3.5. Minimul i maximul . 3.6. Media . 3.7. Cuantile .... 3.7.1. Mediana .. 3.7.2. Cuartilele ... 3.7.3. Valoare modal .. 3.8. Indicatori ai dispersiei ... 3.8.1. Amplitudinea ... 3.8.2. Abaterea medie ( Am (a) ) 3.8.3. Variana ... 3.8.5. Coeficient de Omogenitate (variabilitate) ... 3.9. Compararea mediilor . 3.9.1. Cum comparm media unui grup cu o valoare dat .. 3.9.2. Testarea ipotezei privind diferena dintre mediile a dou grupuri cu numr redus de subieci 3.10. Testul 2 ... 3.11. Coeficientul de corelaie 3.12. Regresia liniar .. 3.13. Rezolvare exerciii din capitolul 3 . 4. NOIUNI INTRODUCTIVE DESPRE GRAFURI I BAZE DE DATE 4.1. Grafuri ... 4.1.1. Scurt istoric . 4.1.2. Definiia unui graf . 4.1.3. Clasificarea grafurilor . 6

59 59 60 62 63 63 64

65 67 70 71 74 75 78 78 82 83 84 85 85 87 88 91 91 92 94 97 101 104

116 116 117 119

4.1.4. Arbori ... 4.1.5. Proprieti ale grafurilor .. 4.1.6. Alt posibilitate de studiu al relaiilor dintr-un grup de indivizi ... 4.1.7. Reprezentarea matriceal a unui graf 4.2. Baze de date ... 5. UTILIZAREA EXCEL I SPSS N STATISTIC 5.1. Utilizarea Excel n statistic .. 5.1.1. Inserarea unei funcii .. 5.1.2. Minim i maxim dintr-un ir de date ... 5.1.3. Media .. 5.1.4. Mediana ... 5.1.5. Amplitudinea ... 5.1.6. Coeficientul de omogenitate 5.1.7. Compararea mediei unui grup cu o valoare dat 5.1.8. Testul t 5.1.9. Testul 2 ... 5.1.10. Coeficientul de corelaie 5.1.11. Regresia liniar . 5.1.12. Tabel funcii Excel pentru calcule statistice . 5.2. Utilizarea SPSS 5.2.1. Ferestre i fiiere n SPSS 5.2.2. Introducerea datelor 5.2.3. Crearea unui fiier de date . 5.2.4. Statistica descriptiv a bazei de date .. 5.2.5. Corelaia . 5.2.6. Comparaia ntre mediile a dou loturi 5.2.7. Testul 2 (hi-ptrat) ... 5.2.8. Coeficientul alpha 5.3. Concluzii ...

120 122 124 125 127

129 130 132 134 135 136 137 138 140 142 144 146 149 150 151 151 153 156 158 161 167 173 176

INTRODUCERE

Acest curs reprezint o ncercare sintez a unor studii realizate, pn n acest moment, n domeniul analizei datelor. n principal, am urmrit sistematizarea unor informaii care s ajute studentul n nelegerea i realizarea unui proiect de diplom ca un prim pas n realizarea cercetrii tiinifice. n general, pentru studenii de la tiinele sociale este destul de complicat nsuirea unor noiuni ce au un caracter mai tehnic. Aceasta se datoreaz anumitor abordri defectuoase a materiilor tehnice. Nu o dat s-a ntmplat la cursul de Analiza datelor ca o singur formul pus pe tabl s creeze o reacie negativ din partea studenilor. De aceea, vom ncerca o abordare mai uman a acestei materii, pornind de la experienele pe care le-am avut n decursul anilor de predare. Lucrarea este structurat pe 5 capitole. Succesiunea capitolelor a fost impus de dorina de a grada prezentarea de la uor la noiuni mai dificile, pentru a face mai accesibil parcurgerea crii. n primul capitol, se d definiia disciplinei de Analiza Datelor, rolul i locul ei n cercetarea sociologic i psihologic. Apoi se prezint o parte din etapele realizrii unui proiect de cercetare. A doua parte reia anumite noiuni din cartea Informatic utilizat n sociologie i psihologie, noiuni legate de prezentarea datelor: realizarea de diagrame, de scheme i despre Microsoft Power Point. n capitolul trei se prezint intuitiv cteva din instrumentele statistice utilizabile n cercetare. n capitolul 4 se prezint instrumente de stocare a rezultatelor, adic noiuni despre baze de date i grafuri, noiuni ce vor fi utile prezentrii de SPSS-ului i a Excel-ului.
9

Odat reamintite noiunile de statistic se va trece la capitolul 5 n care se vor prezenta noiuni de realizare a calculelor statistice cu ajutorul SPSS-ului i a Excel-ului. Se consider cunoscute, i deci nu se vor mai relua, noiuni de utilizarea computerului, noiuni de metode i tehnici de cercetare social (dei o parte din acestea se vor relua pe scurt).

10

1. NOIUNI PRELIMINARE

1.1. Cunoaterea Ce ar putea determina pe cineva s citeasc o carte? S deschid cartea i s vad ce poate fi scris n paginile ei? Curiozitatea, au rspuns o mare parte din studeni cnd le-am pus aceast ntrebare. Curiozitatea este o manifestare a unei ntrebri pe care ne-o punem: putem gsi ceva aici? Putem cunoate ceva? Deci curiozitatea ar putea fi o manifestare a dorinei de cunoatere. Cunoaterea este motorul care ne duce n fiecare zi dintr-o parte n alta. Vrem s tim cum va fi vremea, deschidem radioul i ateptm s vin tirile despre vreme. Vedem un meci la televizor, apoi a doua zi cumprm ziarul ca s vedem, s cunoatem i cum au vzut alii, sau poate ce au vzut alii i noi n-am vzut la acel meci. Deci, faptul c ceva s-a ntmplat nu e suficient, dorina noastr este de a analiza, de a obine ct mai multe date despre ceea ce ne intereseaz. Totui, din multitudinea de lucruri care se ntmpl n jurul nostru cum alegem pe unele i respingem pe altele? Cum alegem s cunoatem unele i s nu cunoatem altele? n cartea ei1, Ruane determin mai multe ci de cunoatere: Cunoaterea tradiional Cunoaterea dat de autoriti Cunoaterea dat de bunul-sim Cunoaterea dat de intuiie Cunoaterea realizat prin metode tiinifice Faptul c dintre cele cinci tipuri de cunoatere cea mai ndeprtat de subiectivism este cunoaterea realizat prin metode tiinifice, d o motivaie acestei cri. Specificm totui c nu trebuie

Vezi la bibliografie [Rua]. 11

respinse celelalte tipuri de cunoatere, dar acestea nu constituie subiectul manualului de fa. 1.2. Cum putem defini Analiza Datelor? n cele ce urmeaz vom prezenta dou posibile definiii ale analizei datelor. ntr-o prim prezentare ne bazm pe definirea succesiv a unor concepte, construcia finalizndu-se cu definirea analizei datelor. La baza analizei datelor st conceptul de mesaj. Mesajul reprezint baza comunicrii, voluntare sau involuntare, ntre un emitor i un receptor. Ceea ce accept un receptor se numesc date. Atragem atenia asupra faptului c nu ceea ce dorete s transmit emitorul poart numele de date, deoarece o parte din ceea ce se transmite se poate pierde pe drumul ntre emitor i receptor. Contientizarea prin analizare i prelucrarea datelor receptate transform datele n informaie. Deci, o posibil definiie a analizei datelor ar fi: Procesul prin care datele primite de receptor se transform n informaie. Schematic aceasta se poate reprezenta astfel:

Date culese din teren

Analiza i prelucrarea datelor

Informaii

Fig. 1. Trecerea de la date la informaii cu ajutorul Analizei Datelor 12

Informaiile odat dobndite devin parte a cunotinelor. De aceea, putem spune c procesul de finalizare a analizei i de prelucrare a datelor const n transformarea datele n informaii, iar informaiile au un rol major n formarea de cunotine. Ce se nelege prin cunotine? Cunotinele sunt elemente abstracte i individuale despre obiectele din lumea real, nsuite prin educaie i experien.2 Am insistat pe o prezentare n detaliu a acestor noiuni pentru c ele reiau, pe scurt, unele din principiile oricrei cercetri. Exemplul 1 Acum civa ani, un student m-a rugat s-l ajut s fac o repetiie pentru susinerea proiectului de diplom. Era vorba de un studiu comparativ privitor la relaia dintre mam i copil ntre mamele care aveau program de 8 ore la serviciu i cele care aveau program de 4 ore. A nceput s vorbeasc despre tema pe care i-o alesese la proiect. A prezentat obiectivele, ipotezele, instrumentele de lucru, chiar i nite diagrame destul de sugestive. n final, a vzut c ntre cele dou loturi erau diferene semnificative. Ce prere avei? m-a ntrebat. Niciuna, pentru c nc nu ai terminat, i-am spus. Ceea ce mi-ai prezentat pn aici sunt doar nite date cu o prelucrare preliminar. Prin prisma conceptelor prezentate n exemplul de mai sus, vom spune c studentul este un receptor al unor date culese din teren; prin prelucrarea primar a datelor, el a transformat datele, n informaie, dar informaia, dei corect, ntre cele dou loturi fiind diferene semnificative, totui era insuficient pentru a fi parte integrant a unor cunotine despre fenomenul studiat. Cea de-a doua metod pornete de la definiia din dicionar a celor dou cuvinte care compun sintagma Analiza datelor. Conform
2

Cf. [Vel] . 13

Dicionarului Explicativ al Limbii Romne* pentru a analiza gsim urmtoarea definiie:


ANALIZ, analizez, vb. I. Tranz. 1. A cerceta un ntreg, un fenomen etc., examinnd fiecare element n parte. A examina un text din diferite puncte de vedere. sau ANALIZ vb. 1. a cerceta, a examina, a investiga, a studia, a urmri, (livr.) a considera, (nv.) a medita, a privi, a socoti, (fig.) a explora, (nv. fig.) a scrmna. (~ cauzele unui fenomen.) 2. v. examina. 3. a comenta, a explica, a interpreta, a tlcui, (nv.) a ntoarce, (fig.) a descifra. (~ un text literar.)

S lum, pe rnd, elementele ce apar n aceast definiie: o cercetare pornete de la un fenomen, de la un ntreg care ne atrage atenia i prima reacie este s privim fiecare detaliu al lucrului analizat, adic s examinm fiecare element n parte. Cercetarea poate porni de la un text la care, mai nti, ne informm asupra diferitelor puncte de vedere asupra textului, urmnd s ncercm un punct de vedere diferit. Pentru date gsim urmtoarea definiie:
DAT, -, dai, -te, adj., s.f. I. Adj. Pus la dispoziie, oferit; nmnat, transmis, prezentat, druit. Expr. La un moment dat = ntr-un anumit moment; n clipa aceea. n cazul dat = n acest caz, n cazul de fa. Dat fiind (c...) = innd seama de... (sau c...), avnd n vedere (c...); deoarece. [] Dat uitrii = uitat, prsit. II. S.f. 1. Momentul, mprejurarea (repetabil) cnd se produce un fapt; oar, rnd. Loc. adv. Data trecut = cu prilejul anterior. Data viitoare = ntr-o mprejurare ulterioar. De data aceasta (sau asta) ori de ast dat = de rndul acesta, acum. Pe dat ce... (sau cum...) = ndat; pe loc, numaidect. O dat = ntr-un singur caz. Nu o dat = de multe ori. nc o dat = din nou. 2. (La pl.) Fapte stabilite (de tiin), elemente care constituie punctul de plecare n cercetarea unei probleme, n luarea unei hotrri etc. III. S.f. (Reg.) Soart, destin. Cum (sau precum) e data = dup cum e obiceiul, datina. V. da2. * Academia Romn, Institutul de Lingvistic Iorgu Iordan, Dicionarului Explicativ al Limbii Romne, Ediia a II-a, Editura Univers Enciclopedic, Bucureti, 1998. 14

Pornind de la aceste dou definiii putem spune c Analiza Datelor este disciplina care se ocup cu cercetarea, examinarea, investigarea, interpretarea faptelor stabilite tiinific, fapte care constituie punctul de plecare n cercetarea unei probleme, n luarea unei hotrri. Deci, cu alte cuvinte, putem spune c analiza datelor reprezint o etap n cercetarea tiinific a unui fenomen. n continuare vom discuta despre etapele cercetrii. Acestea sunt: 1. Proiectarea 2. Fixarea obiectivelor, stabilirea ipotezelor 3. Selecia grupului/grupurilor de subieci 4. Alegerea metodelor ce urmeaz s fie folosite n culegerea i prelucrarea datelor (att a instrumentelor specifice, ct i a celor statistice) 5. Alegerea lotului de subieci (n cazul sondajelor de opinie este vorba de designul eantionului reprezentativ) 6. Analiza Datelor 7. Diseminarea rezultatelor (prezentarea proiectului de licen n faa comisiei de examinare n cazul absolvenilor, prezentarea rezultatelor finanatorului, publicarea rezultatelor n reviste de specialitate etc.) Toate aceste etape ale cercetrii sunt importante deoarece orice eroare n gestionarea lor poate duce la erori destul de mari n analizarea datelor. Proiectul de diplom reprezint o prim ocazie pentru student de a fi pus n situaia unei cercetri pe care trebuie s-o realizeze i s-o prezinte singur n faa unei comisii de examinare. De aceea, considerm c este util, n vederea pregtirii proiectului, s prezentm cteva noiuni de management de proiect. De cele mai multe ori studenii pornesc la realizarea cercetrii, ce va sta la baza proiectului de diplom, construiesc aceast cercetare fr a-i planifica timpul sau resursele, ceea ce are ca efect faptul c ajung n criz de timp.

15

Ce nseamn a realiza un proiect? Un proiect reprezint [] un grup de activiti relaionate, n mod organizat, pentru ndeplinirea unui scop3. n realizarea oricrui proiect trebuie s avem n vedere trei constrngeri principale4: timp (durata efectiv de realizare a cercetrii) resurse (materiale, financiare etc.) specificitate a rezultatelor. De aceea, ar fi bine ca studenii s in cont de aceste trei constrngeri cnd i planific activitile legate de realizarea unui proiect. Planificarea activitilor se realizeaz n etape sau subetape pentru procesele mai complicate. Atunci cnd proiectm aceste etape exist dou moduri de abordare: 1. planificarea direct de la prima etap la etapa final (aceasta nsemnnd o cunoatere foarte bun a tehnicilor cercetrii) 2. planificarea invers5 pornim dinspre etapa final spre prima etap (n acest caz este necesar s vizualizm foarte bine etapele pentru a gsi drumul optim dintre ultima i prima etap).6 Un nou mod de abordare a proiectrii unei cercetri este cel realizat cu ajutorul tehnicii de programare n reea. Din aceste tehnici amintim: graficul Gantt graficul PERT7 graficul CPM8

Cf. [McC] p. 29. Cf. [McC]. 5 Backward planning denumire preluat din lucrarea [McC]. 6 Pentru studentul ce-i pregtete proiectul de diplom recomandm cea de-al doilea tip de proiectare, backward, ntruct exist constrngerea temporal. 7 Program Evaluation and Review Technique. 8 Metoda Drumului Critic. 16
4

La finalul capitolului 2 vom prezenta cteva noiuni legate de graficul Gantt. n finalul acestei seciuni revenim la problema gestionrii timpului. Kerzner d o list a activitilor ce pot rpi timp n realizarea unui proiect9. Din acestea amintim: munca incomplet amnarea nejustificat n luarea unor decizii folosirea exagerat a telefonului, chat-ului etc. ntrzierile la ntlniri corectarea superficial a unor erori planificarea pe termen scurt (lipsa unei planificri pe termen lung) perfecionismul schimbri dese ale planificrii analizele pe prea multe niveluri 1.3. Stabilirea ipotezelor Odat aleas tema i stabilite obiectivele, problema ce trebuie rezolvat este cea a stabilirii ipotezelor. Atunci cnd se stabilesc ipotezele, trebuie avute n vedere dou repere de baz: fiecare ipotez s provin dintr-un obiectiv, i, n acelai timp, s fie n acord cu instrumentele utilizate. Un alt aspect definitoriu al ipotezelor l reprezint faptul c ipotezele presupun o solid informaie n domeniu, care ofer i cadrul conceptual al ipotezei10.

1.3.1. Caracteristici ale ipotezelor


I. Radu prezint anumite caracteristici ale ipotezelor. Din acestea amintim11: Explic un ansamblu de date Ipoteza trebuie s fie bine ntemeiat, plauzibil sau verosimil Ipotezele trebuie s fie verificabile
9

Cf. [McC] p. 199. [Rad] p. 21. 11 [Rad] p. 22.


10

17

1.3.2. Erori frecvente n formularea ipotezelor


n cele ce urmeaz vom prezenta cteva din erorile ntlnite n formularea unor ipoteze: 1. Exprimarea mult prea general a ipotezei Exemplul 2 Hiperemotivitatea conduce la anxietate ridicat i depresie. 2. folosirea gradelor de comparaie, fr a spune nimic (sau a folosi o exprimare neclar), privitoare la termenii ce se vor compara Exemplul 3 Exist o alegere din partea angajailor, ncepnd de la un anumit nivel al salariului, ntre sporirea numrului de ore lucrate i sporirea timpului liber 3. formularea prin negare Exemplul 4 Succesul colar nu are drept determinant principal inteligena peste medie 4. folosirea de adjective necuantificabile Exemplul 5 Copiii expui, n mai mare msur, la pericolul de a fi supui unor rele tratamente se regsesc, n special, n familiile cu situaie material precar 5. folosirea de cuvinte-balast Exemplul 6 Indiferent de tipul de abuz suferit, copiii-victime prezint totui un tablou, simptomatologic comun: relaionarea defectuoas, scderea randamentului colar (eventual abandon colar), stare agresiv i comportamente agresive
18

6. exprimarea de concluzii Exemplul 7 Cu ct Biserica va blama homosexualitatea, cu att atitudinea romnilor va fi mai negativ (Romnia este o ar unde sentimentul religios este foarte puternic, iar Cuvntul Bisericii are un rol decisiv) Desigur, acestea sunt doar o parte din erorile frecvente n formularea ipotezelor, dar am inut s atragem atenia asupra lor deoarece formularea unei ipoteze reprezint unul din paii cei mai importani ai cercetrii. O alt problem, legat de ipoteze, o reprezint clieul confirmrii ipotezei de start12. Aceasta se refer la faptul c, de multe ori, mai ales la cei care sunt la nceputul activitii de cercetare, exist tendina ca lucrarea s se axeze pe confirmarea cu orice pre a ipotezei de start, ignorndu-se discordanele cu aceasta. Exemplul 8 S-a aplicat o sociogram ntr-o clas. n urma aplicrii sociogramei s-a determinat liderul. Analiznd ns rezultatele, s-a observat faptul c doi elevi din clas, dei ei i-au exprimat opiniile, nu au primit niciun punct de la colegi. Ceea ce ar putea duce la anumite ntrebri privind integrarea lor n grup. Deci, pe lng ipoteza de start, se poate aduga, n aceast situaie, i un studiu de caz pentru cei doi elevi. 1.4. Grupul de subieci Am folosit sintagma grupul de subieci deoarece cele ce urmeaz sunt valabile att pentru eantion, ct i pentru lot. n principal, n aceast seciune ne vom ocupa de experimentele comparative. Pentru a realiza un astfel de studiu, trebuie s alegem un grup de control i un grup experimental. Grupul
12

[Rad], p. 225. 19

de control este acel grup care nu este supus stimulilor specifici experimentului, este un grup care propriu-zis nu intervine n experiment. De unde i denumirea de grup de martor. Exemplul 9 S-a realizat o cercetare n care s-a pus problema dac relaxarea, ca tehnic psihoterapeutic, conduce la ameliorarea simptomelor nevrotice. Pentru aceasta s-a luat ca grup experimental 30 de pacieni, din care 15 brbai i 15 femei. Acetia au fost selecionai, n mod aleator, dintre persoanele cu tulburri anxioase ce s-au prezentat la clinic, solicitnd psihoterapie. Grupul martor conine 30 de persoane selectate n mod aleator, dintre care 15 brbai i 15 femei care prezentau acelai tip de tulburri anxioase ca i cei din grupul experimental. Se poate observa c puteam s lucrm cu un singur grup de subieci unde, nainte de a i se aplica tehnicile psihoterapeutice, era grupul martor i dup aplicarea tehnicilor terapeutice devine grup experimental. Atunci cnd efectum msurtori asupra unui grup trebuie s inem seama de o serie de factori13 cum ar fi: Efectul de maturare diferenele ce ar putea aprea ntre dou msurtori s nu se datoreze stimulilor aplicai n cadrul experimentului, ci maturrii ce a avut loc pe parcursul experimentului Exemplul 10 La clasa a treia se dorete s se studieze dac prin folosirea unor tehnici de dezvoltare a ateniei elevii se descurc mai bine la efectuarea calculelor de nmulire. Dup un semestru se compar rezultatele de la nceputul anului cu cele de la sfritul
13

Cf. [Rad] .

20

semestrului. Se observ c majoritatea elevilor au obinut scoruri mai bune. n acest caz, ns nu putem folosi ca grup martor grupul de la nceput i ca grup experimental grupul la sfritul semestrului, deoarece nu putem ti dac evoluia pozitiv se datoreaz metodei aplicate sau faptului c elevii n timp, lucrnd la matematic, oricum i-ar fi mbuntit performanele. n acest caz, se recomand folosirea a dou grupuri distincte: un grup de elevi crora li se aplic tehnicile de dezvoltare a ateniei grup experimental i un grup de elevi crora nu li s-a aplicat nicio tehnic de dezvoltare a ateniei grup martor. Comparaia se va face ntre aceste grupuri att la nceputul semestrului, ct i la sfritul semestrului. Grupurile trebuie alese la nceputul semestrului astfel nct s nu fie diferene semnificative ntre ele, iar la sfrit eventuala apariie a unei diferene ne poate aduce informaii despre efectele tehnicilor de dezvoltare a memoriei asupra copiilor. Efectul testrii repetate aplicnd la intervale destul de scurte acelai test, de mai multe ori, pe acelai lot de subieci rezultatele vor fi influenate i de faptul c subiecii ajung s cunoasc foarte bine testul Exemplul 11 Msurm anxietatea zilnic, timp de o sptmn nainte de operaie, la pacienii din acelai salon. Diferenele care ar putea aprea n acest caz se pot datora i faptului c pacienii se obinuiesc cu testul i dau alte rspunsuri pentru a nu se repeta. Influena evenimentelor externe apariia unui eveniment extern experimentului, eveniment ce poate influena subiecii.

21

Exemplul 12 Se aplic un chestionar pe problema corupiei n mediul urban i n mediul rural. n prima zi se aplic n mediul rural. Seara, la televizor, la tiri se vorbete despre un proces n care exist acuzaia de corupie a unui demnitar. Diferenele ce ar putea aprea, a doua zi, la aplicarea chestionarului n mediul urban se pot datora i influenei emisiunii din seara de dinaintea aplicrii chestionarului Corectitudinea seleciei subiecilor selecia subiecilor trebuie s se realizeze pe ct posibil independent de voina subiecilor i trebuie evitat subiectivismul celui care face selecia Exemplul 13 ntr-o coal s-a aplicat un test de anxietate doar la elevii ce s-au oferit voluntari n a completa testul. S-au obinut valori sczute ale anxietii. Totui, nu putem realiza o interpretare a datelor deoarece nu tim dac aceste valori sczute, ce reprezint realitatea sau faptul c lotul a fost compus din elevi ce s-au oferit voluntari, au dus la valori sczute ale anxietii. Exemplul 14 S-a aplicat un chestionar n care se studia interesul populaiei dintr-un ora fa de problemele din nvmnt. Chestionarul a fost aplicat n curtea unei coli printre prinii ce ateptau copiii de la clasele primare s ias de la cursuri. Rezultatele acestui chestionar nu pot fi validate, deoarece ceea ce s-a obinut n urma prelucrrii nu se poate spune dac este rspunsul populaiei fa de ntrebrile puse sau e vorba de influena faptului c s-a aplicat printre prinii elevilor din ciclul primar.
22

Riscul de a pierde subieci14 din cauza unor condiii ce nu depind de subiect o mare parte din subieci nu rspund la toate ntrebrile. Exemplul 15 Se dorete s se vad impactul unui film asupra spectatorilor. Se aplic la o grdin unde ruleaz acel film. Se aplic un chestionar nainte de a rula filmul, urmnd, ca la final, s se mai aplice chestionarul nc o dat. Pe la mijlocul filmului ns ncepe ploaia i toi spectatorii au plecat n grab astfel nct operatorul nu a mai apucat s aplice i a doua oar chestionarul. Desigur, exist mai multe aspecte care trebuie urmrite atunci cnd se selecteaz un grup n vederea realizrii unui experiment. Am prezentat doar situaiile cele mai des ntlnite. Pentru a vedea i alte cazuri recomandm, de exemplu, consultarea [Rad]. 1.5. Ce metode putem folosi pentru prelucrarea datelor? n aceast seciune dorim s realizm o trecere n revist a principalelor instrumente ce se folosesc n prelucrarea datelor, altele dect cele statistice15. Chiar cu riscul de a fi considerai negativiti la metodele clasice de cercetare vom ncepe cu prezentarea neajunsurilor i apoi a avantajelor. Alegem aceasta deoarece, de cele mai multe ori, n utilizarea metodelor, studenii se concentreaz pe avantajele acelui instrument, ignornd dezavantajele ce le pot aprea chiar i n condiiile folosirii corecte a instrumentului.

14 15

n [Rad] acest caz poart denumirea de moarte experimental, p. 39. De instrumentele statistice ne vom ocupa n capitolul 3. 23

1.5.1. Metoda observaiei sociologice Una din metodele de baz n sociologie o constituie observaia. Avnd n vedere c aceast metod se afl la grania dintre intuiie i raionament, folosirea ei trebuie realizat cu foarte mare grij. n primul rnd, fr o susinere din partea altor metode i instrumente, observaia poate deveni surs de eroare n analiza datelor. Dintre alte neajunsuri ale acestei metode amintim: necesit timp ndelungat de folosire se folosete pe eantioane16 mici la nivel de observaie nu se recomand ncercarea de a identifica relaii cauzale i atunci apare ntrebarea: De ce s se foloseasc aceast metod? n primul rnd, aceast metod este util atunci cnd e folosit mpreun cu alte metode. Printre avantajele acestei metode avem: permite accesul direct i nemijlocit al cercettorului la realitatea social asigur un grad mare de obiectivitate i complexitate a imaginii rezultate ne ajut s nregistrm fenomenul studiat n condiiile sale proprii de desfurare poate realiza att nregistrarea comportamentelor individuale, ct i a celor colective Putem distinge dou mari tipuri de observaie: Un prim mare tip de observaie l constituie observaia spontan. Aceasta reprezint genul de observaie, realizat la nivelul simplului contact al cercettorului cu realitatea. Dintre dezavantajele acestui gen de observaie am aminti: se realizeaz, n general, pe o baz subiectiv rareori se poate repeta n aceleai condiii nregistrarea se face pe baza memoriei, deci exist pericolul trunchierii informaiilor
16

Despre noiunea de eantion vezi capitolul 3, seciunea 3.3.

24

Avantaje: acest gen de observaie este foarte util n gsirea de direcii noi de cercetare, n cutarea de noi soluii la probleme de rezolvat. Unul din exemplele clasice este descoperirea penicilinei de ctre Flemming. Totui, continund analogia, fr s trecem la observaia tiinific, observaia spontan, care i-a atras atenia lui Flemming, ar fi avut rezultate neconcludente17. Despre observaia tiinific, Henri H. Stahl18 atrgea atenia asupra urmtoarelor note definitorii: [] are la baz o concepie tiinific despre lumea nconjurtoare [] vizeaz totalitatea aspectelor fenomenului studiat [] este condus dup anumite reguli [] asigur un grad mare de obiectivitate n aprecierea fenomenelor [] procedeaz la descompunerea obiectului observat n elementele lui componente i apoi trece la evidenierea ntregului datele i informaiile rezultate n urma observaiei sunt nregistrate ntr-o fi de observaie, n vederea prelungirii lor ulterioare Totui trebuie remarcat c observaia tiinific devine mult mai bogat n rezultate atunci cnd reprezint o urmare a unei observaii spontane. Desigur, acesta nu este singurul mod de a clasifica observaiile. Am putea aminti c observaiile se pot clasifica dup gradul de structurare, dup gradul de implicare al cercettorului n sistemul studiat, n funcie de durata observaiei, natura observaiei, gradul de extensiune i de profunzime al observaiei19. Acestea sunt tratate, pe larg, n manualele de specialitate din care putem s recomandm [Cau].
Cel mult s-ar fi gndit ca alt dat s fie mai atent i s nu mai lase laboratorul cu ustensilele murdare. 18 Apud [Cau], p. 103-104. 19 Cf. [Cau]. 25
17

Pentru a fi siguri c folosim corect metoda observaiei sociologice trebuie s ne facem nite reguli pe care s le respectm. Desigur, nu exist reguli general valabile, dar, dac s-ar ncerca gsirea unor elemente comune, un punct de plecare ar fi aprecierile lui T. Calpow20: observaia trebuie s aib la baz o foarte bun pregtire teoretic a observatorului formularea, cu precizie, a tehnicilor de observare i a procedeelor de notare a observaiilor notarea faptelor de observaie, pe ct posibil la faa locului, pe teren trebuie realizat distincia dintre faptele observate i prerile observatorului n sensul c acestea trebuie notate separat observarea trebuie s se realizeze continuu i sistematic, avndu-se n vedere urmrirea obiectivelor precis formulate. Odat luate aceste precauii, prin folosirea metodei observaiei sociologice, putem ajunge la cunoaterea i nelegerea realitii, ct i la explicarea celor observate. 1.5.2. Ancheta bazat pe chestionar Atunci, cnd dorim s explicm comportamentele umane i s identificm factorii ce determin aceste comportamente, un instrument foarte util l reprezint chestionarul. Cnd se aplic un chestionar exist mai muli factori care pot influena rspunsurile. Dintre acetia amintim: personalitatea celui care ancheteaz, personalitatea celui anchetat, tema anchetei, locul unde se aplic chestionarul, timpul de desfurare al chestionarului. Chestionarul reprezint un instrument al unui tip de anchet. De aceea, acest tip de anchet mai poart i denumirea de anchet prin chestionar. Dintre caracteristicile anchetei prin chestionar am aminti:

20

Apud [Che1].

26

1. Caracterul standardizat numrul ntrebrilor, ordinea ntrebrilor i forma lor este stabilit clar dinainte. Tot cadrul standardizat al anchetei este asigurat de faptul c se stabilete dinainte numrul persoanelor alocate fiecrei caracteristici21, acest numr rmnnd neschimbat pe tot parcursul anchetei. 2. Tehnici specifice instrumentului folosit (chestionarului) 3. Numrul mare de persoane pe care se aplic chestionarul ancheta de chestionar, pentru a fi corect realizat, trebuie aplicat pe eantioane22 mari, existnd o legtur strns ntre numrul de persoane pe care se aplic chestionarul i nivelul de semnificabilitate al rezultatelor. Chestionarele se pot clasifica n funcie de trei criterii23: coninutul informaiilor obinute o chestionarele de date factuale o chestionarele de opinie o chestionarele speciale o chestionarele tip omnibus forma ntrebrilor o chestionare cu ntrebri nchise o chestionare cu ntrebri deschise o chestionare cu ntrebri mixte o chestionare cu ntrebri scalate modul de aplicare al chestionarelor o chestionare autoadministrate o chestionare administrate de ctre operatorii de anchet Exemplu 16 Atunci cnd a avut de aplicat un chestionar, studentul a realizat un presondaj unde, printre alte ntrebri, a pus i ntrebarea deschis: Cum vi se par condiiile de la locul dumneavoastr de
21 22

Sex, vrst, mediu, nivel de studii etc. Despre noiunea de eantion vezi capitolul 3, seciunea 3.3. 23 Cf. [Che2]. 27

munc? Dup centralizarea rezultatelor, dei sperase ca la aceast ntrebare s poat determina anumite opiuni pentru a face o interpretare, paleta de rspunsuri era foarte larg. Atunci, deoarece i-a dat seama c exist riscul ca n cazul n care ar lsa ntrebarea deschis interpretarea s fie mai greu de realizat, iar rspunsurile primite destul de greu de cuantificat, studentul a optat pentru transformarea acestei ntrebri ntr-o ntrebare nchis de forma: Ct de mulumit suntei de condiiile de la locul dumneavoastr de munc? a. mulumit b. nici mulumit, nici nemulumit c. nemulumit n general, chestionarul se administreaz prin intermediul operatorilor pe teren. Desigur, mai exist i alte moduri de aplicare a unui chestionar, cum ar fi: telefonic, prin scrisori, sau cu ajutorul Internetului (prin email, chat sau chiar pagini specializate n aplicarea electronic a rspunsului), dar acestea sunt mai puin utilizate n comparaie cu metoda clasic prin intermediul operatorilor de teren. Elementul de baz al unui chestionar l constituie ntrebarea. Cnd analizm o ntrebare exist cel puin trei elemente importante la care facem referire: coninutul ntrebrii, o ntrebri factuale o ntrebri de cunotine o ntrebri de motivaie forma ntrebrii24, poziia ntrebrii n cadrul chestionarului o ntrebri introductive o ntrebri de coninut o ntrebri de trecere o ntrebrile filtru
24

Vezi clasificarea chestionarelor dup forma ntrebrilor.

28

o o o

ntrebrile bifurcate ntrebrile de control ntrebri de identificare

n cele expuse pn aici ne-am referit la chestionare doar din punctul de vedere al componentelor acestora. Dar ceea ce face un instrument s funcioneze este raportul ce se stabilete ntre diferitele pri ale instrumentului. Aceste raporturi conduc la evidenierea tehnicilor conform crora se pot alctui chestionarele25. Dintre tehnicile de alctuire a chestionarelor amintim: tehnica plniei trecerea de la general la particular i tehnica plniei rsturnate trecerea se face de la particular la general. Exemplul 17 (tehnica plniei) 1. Cum credei c se triete n Romnia comparativ cu acum un an? 2. Cum credei c trii dumneavoastr comparativ cu acum un an? Exemplul 18 (tehnica plniei rsturnate) 1. n situaii critice v folosii de autoritatea dumneavoastr de manager pentru a soluiona o problem? 2. Cnd ar trebui un manager s se foloseasc de autoritatea dat de poziia lui n cadrul firmei? Atunci cnd stabilim ntrebrile i structura chestionarului trebuie s avem n vedere posibile pericole ce pot aprea n gestionarea acestui instrument. Din acestea am aminti: I. Atunci cnd ntr-un chestionar, datorit aezrii ntrebrilor, avem contaminarea rspunsurilor spunem c se manifest efectul de halo.

25

Cf. [Che2]. 29

Exemplul 19 1. Credei c majoritatea politicienilor sunt corupi? a. Da b. Nu c. Nu tiu 2. Considerai c n sistemul sanitar exist corupie? d. Da e. Nu f. Nu tiu 3. Se poate vorbi de corupie n sistemul juridic? g. Da h. Nu i. Nu tiu 4. Ct de mare considerai c este corupia n Romnia? j. Foarte mare k. Mare l. Medie m. Mic n. Foarte mic II. Un alt posibil factor de eroare n utilizarea unui chestionar este lungimea chestionarului. S. Chelcea, de exemplu, recomand un numr de 25 pn la 50 de itemi26. Numrul de ntrebri ce pot fi puse ntr-un chestionar reprezint totui o opiune a celui care alctuiete chestionarul. III. O eroare destul de mare o constituie erorile de eantionare care se pot manifesta sub mai multe forme. Dintre acestea amintim: Nerespectarea unor caracteristici ale populaiei de baz Numrul prea mare de refuzuri
26

n [Che2].

30

IV. Un alt tip de erori l reprezint erorile datorate operatorilor de teren. Acestea pot fi: Personalitatea necorespunztoare a operatorilor (datorat unei selecii incorecte a operatorilor) arogan, aspect fizic neplcut, neseriozitate etc. Aplicarea incorect a chestionarului scurtarea ntrebrilor, simplificarea excesiv a ntrebrii, schimbarea ordinii ntrebrilor etc. Influenarea respondenilor de ctre operatori pentru a da anumite rspunsuri Nerespectarea eantionrii sau a pasului de aplicare a chestionarului V. O surs de erori, deloc neglijabil, o constituie cei care dau rspunsurile. Dintre acestea am aminti: Nesinceritatea rspunsurilor Refuzul de a completa sau de a participa Sensibilitatea subiecilor la anumite teme Tendina de a da rspunsuri conforme cu ceea ce este de dorit din punct de vedere social Tendina de a se pune ntr-o lumin favorabil Dei aceste erori, expuse mai sus, sunt destul de frecvente, ancheta pe baz de chestionar rmne un instrument important n cercetrile sociale i, utilizat cu atenie, pentru a evita erorile expuse mai sus, poate constitui o important surs de date. 1.5.3. Testele psihologice Deoarece acest manual se adreseaz studenilor ce sunt abia la nceputul activitii de cercetare, ne vom referi la teste, doar din punctul de vedere al utilizatorilor testelor27.

Dei este ludabil dorina unor studeni de a explora i a gsi noi metode i teste pe care mai apoi s le valideze, le recomandm ca mai nti s nvee s foloseasc foarte bine testele deja validate i dup acumularea unei experiene semnificative s porneasc pe drumurile noi i neexplorate ale testrii psihologice. 31

27

O prim problem ce trebuie rezolvat atunci cnd se dorete folosirea unui test ntr-o cercetare este de a gsi testul potrivit subiectului studiat. Alegerea testului nu trebuie s se bazeze doar pe denumirea testului. Aceasta deoarece, aa cum remarca I. Radu28: (...) numele (...) spune puin (...), el caut s ascund obiectivul sau intenia testului pentru a evita rspunsul conformist ori favorabil (din partea subiectului). De aceea, recomandm ca naintea aplicrii unui test s se parcurg, cu atenie, manualul testului sau materialul de ndrumare ce nsoete testul. Din cele expuse mai sus mai apare i un alt aspect al aplicrii unui test. Cu ct subiectul cruia i aplicm testul tie mai puine despre test cu att rezultatele vor fi mai aproape de adevr.

1.5.4. Sociometria
Sociometria ca metod a fost folosit pentru prima oar ntr-un studiu realizat de Moreno n 1934 n Statele Unite n lagre de persoane deportate i ntr-o instituie pentru tineri delicveni. La baza acestei metode exist un chestionar ce cuprinde dou ntrebri care evideniaz alegerea, respectiv respingerea ntr-un grup n raport cu o anumit activitate. ntrebrile pot fi de genul: - pentru alegere: pe cine ai alege s faci activitatea propus - pentru respingere: care ar fi persoana cu care ai dori cel mai mult s nu faci activitatea propus Bineneles c ntrebrile pot suferi mici variaii, dar astfel nct s se pstreze sensul de alegere, respectiv respingere. n 1952 Tagiuri29 propune ca la aceste dou ntrebri s se adauge nc dou care s se refere la cine crede cel chestionat c l-ar fi ales i cine crede cel chestionat c l-ar fi respins. Pentru a avea asigurat validitatea rspunsurilor trebui s respectm urmtoarele reguli30:
n lucrarea [Rad], p. 358. n lucrarea Relational analysis: an extension of sociometry method with emphasis upon social perception. 30 Cf. [Abr]. 32
29 28

grupul studiat trebuie s aib o perioad semnificativ de lung de convieuire - trebuie s avem acordul membrilor grupului, s nu fie impus faptul de a rspunde la ntrebri. - asigurarea confidenialitii rspunsurilor - trebuie s fie explicitate criteriile alegerii - chestionarul trebuie aplicat la grupuri de maxim 30 de persoane Indicii ce trebuie urmrii sunt31: 1. numrul de alegeri primite 2. numrul de alegeri fcute 3. numrul de alegeri reciproce 4. numrul de respingeri primite 5. numrul de respingeri fcute 6. numrul de respingeri reciproce Cercetarea poate fi extins prin studierea celor ase indici pentru realizarea unei activiti profesionale, ct i pentru realizarea unei aciuni n timpul liber. Centralizarea datelor se realizeaz ntr-o sociomatrice, iar ca reprezentare grafic putem folosi o sociogram. Modul n care realizm o sociogram este descris n capitolul 2 seciunea 2.3.4. 1.6. Msurarea datelor La nceputul acestui capitol spuneam c ceea ce se obine prin diferite metode de investigare (o parte din ele le-am prezentat n seciunile anterioare) sunt date. Un prim pas spre transformarea acestor date n informaii este msurarea lor. n continuare, vom considera datele obinute n urma msurrii, date brute, celelalte tipuri de date numindu-le date prelucrate. Nu am folosit un antonim al expresiei date brute, deoarece prelucrarea datelor nu este niciodat definitiv, orice tip de date pretndu-se la prelucrri succesive, n funcie de fenomenul studiat.

31

Cf. [Abr]. 33

Msurarea este o operaie prin care se atribuie numere datelor discrete sau continue ce urmeaz a fi evaluate 32. Putem realiza msurarea n dou moduri: citirea direct a numerelor afiate de aparatele cu care se efectueaz experimentul prin calcularea scorurilor sau a frecvenelor rezultate n urma aplicrii unui instrument specific (test, chestionar etc.) Din prima categorie amintim: experienele din laboratorul de psihologie (cum ar fi frecvena apariiei unei reacii n funcie de un stimul studiat, parametrii fizici greutate, intensitate etc.) timpul necesar pentru a rspunde unui stimul Din a doua categorie amintim: aplicarea unui chestionar aplicarea unui test (nsumarea punctelor conform cu scalele) n cele ce urmeaz ne vom referi la msurtorile din cea de-a doua categorie. Dac, de exemplu, n fizic exist mrimi ce au uniti de msur bine definite (kg pentru mas, newton pentru greutate, m/s pentru vitez etc.), n studiul fenomenelor sociale acest gen de uniti de msur nu exist. De aceea, s-a recurs la utilizarea de msurtori prin nsumare pentru fenomenele sociale. Dintre nivelurile la care se pot realiza tipuri de msurtori amintim: nivelul nominal (calitativ) nivelul ordinal nivelul hiperordinal33 Msurtori la nivel nominal reprezint tipul cel mai des ntlnit n fenomenele sociale. A folosi o msurtoare bazat pe nivelul nominal nseamn a ordona elementele msurate dup diferite categorii. Aceste categorii, pentru a putea avea un proces corect de

32 33

Cf [Rad], p. 47. Termen preluat din [Rad].

34

ordonare34, trebuie s fie disjuncte, adic un element al unei categorii nu poate aparine, n acelai timp, i altei categorii. Exemplul 20 Unui grup i se aplic un stimul35. n acest caz, putem stabili patru categorii: a. nicio reacie b. doar reacie nonverbal c. doar reacie verbal d. i reacie verbal i reacie non-verbal Categoria d a fost pus deoarece subiecii pot avea reacii i la nivel de gest i la nivel verbal. Exemplul 21 n cadrul unui chestionar, aplicat unor tineri ntre 15 i 18 de ani, s-a pus urmtoarea ntrebare deschis: Ce nseamn pentru tine a merge la coal? Dup ce s-au citit chestionarele primite, s-au stabilit urmtoarele categorii: a. a nva b. a m plictisi c. conflicte cu ceilali d. pierdere de timp A mai fost folosit i o a cincea categorie, e. altele, pentru acele situaii care nu se ncadrau n cele patru categorii stabilite, dar nici nu se regseau n numr destul de mare pentru a constitui o categorie de sine stttoare. Msurtori la nivel ordinal: acest tip de msurtori este cel mai folosit deoarece, n urma folosirii lui, se pot realiza comparaii ntre subieci, sau, altfel spus, se poate stabili o relaie de ordine ntre participanii la experiment.

34 35

Prin ordonare aici nelegem ordine nu i comparaie. Prin stimul nelegem chiar i aplicarea unei ntrebri. 35

Exemplul 22 S-a aplicat testul Hamilton pe un lot de 20 de brbai i s-au obinut urmtoarele rezultate:
Hamilton 18 16 14 15 20 10 9 14 19 18 15 11 7 20 22 15 10 17 13 17

S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11 S12 S13 S14 S15 S16 S17 S18 S19 S20

Se observ c, n urma msurrii, s-a calculat pentru fiecare subiect valoarea obinut la test. Pornind de la aceste valori putem compara subiecii din punctul de vedere al testului Hamilton. De exemplu, putem spune c subiectul S4 a obinut un scor mai mare dect subiectul S7. Msurtori la nivelul hiperordinal: La acest gen de msurtori adugm, pe lng nivelul ordinal, i o analiz a distanei dintre elementele situate pe scara de valori. Dei nu foarte folosit,
36

acest nivel de msurare reprezint un prim pas spre utilizarea mulimilor fuzzy n analiza datelor obinute n sociologie sau psihologie. Exemplul 23 n cadrul unui studiu asupra unui grup de 10 elevi s-a alctuit o list cu mediile acestora36 (datele au fost ordonate descresctor):
Nota 10 10 10 7 7 6 5 5 5 5

Elev 1 Elev 8 Elev 9 Elev 6 Elev 10 Elev 4 Elev 2 Elev 3 Elev 5 Elev 7

Se observ, din analiza distanelor dintre notele elevilor, c se pot determina trei grupuri de elevi: primul grup ar putea fi alctuit din cei care au obinut nota 10 (elevul 1, elevul 8, elevul 9), al doilea grup (din elevii care au notele 6, 7 elevul 6, elevul 10 i elevul 4) i un al treilea grup (format din elevii ce au nota 5 elevul 2, elevul 3, elevul 5 i elevul 7). Aceste scri de intervale pot constitui un punct de plecare n analiza datelor obinute din acest experiment.

Pentru claritatea expunerii prezentm exemplul doar pe 10 elevi, n practic ns nu se recomand s se trag concluzii pe un grup att de mic. 37

36

2. REPREZENTAREA DATELOR CA MOD DE EXAMINARE PRELIMINAR A FENOMENULUI STUDIAT


The preliminary examination of most data is facilitated by the use of diagrams. Diagrams prove nothing, but bring outstanding features readily to the eye; they are therefore no substitute for such critical tests as may be applied to the data, but are valuable in suggesting such tests, and in explaining the conclusions founded upon them37 R.A. Fisher

A prezenta datele nu nseamn doar a le nirui pe o foaie de hrtie. Reprezentarea datelor reprezint o etap important a prelucrrii datelor. nainte de arta cum putem realiza aceast stocare a datelor vom prezenta cte ceva despre datele culese din teren, apoi vom arta diferite moduri de a prezenta datele: prin diagrame, prin scheme, sociograme. O seciune aparte o va constitui prezentarea graficului Gantt ca mod de planificare a unui proiect. 2.1. Serii de numere n aceast seciune ne vom referi la seriile de numere aa cum pot fi ele ntlnite n majoritatea proceselor sociale, fr a face referire la semnificaia matematic a conceptului de serie, semnificaie care este mult mai larg. n acest context vom nelege prin serie de numere, mulimea de numere ce au o caracteristic comun. Pentru a nelege mai bine aceast noiune vom da dou exemple.

37

Pentru traducere vezi finalul acestui capitolul.

38

Exemplul 24 Avem un lot de 15 subieci de sex masculin crora le aplicm un test de inteligen. Mulimea alctuit din rezultatele la acest test reprezint o serie de numere, caracteristica lor comun fiind faptul c ne arat coeficientul de inteligen al subiecilor din lot. Putem avea o a doua serie de numere ce reprezint coeficientul de inteligen al subiecilor de sex feminin dintr-un lot de 15 subieci. Problema ce ar putea aprea este de a compara cele dou loturi prin prisma acestor dou serii de numere. Exemplul 25 S presupunem c avem o ntrebare dintr-un chestionar ce este aplicat pe dou grupuri de subieci, unul n mediul rural, iar al doilea n mediul urban. S presupunem c n urma prelucrrii datelor am obinut urmtoarele rezultate:
Mediul Rural Urban Da 64% 52% Nu 36% 48%

n acest caz o prim serie de numere o reprezint procentele la rspunsuri date de subiecii din mediul rural, iar o a doua serie o reprezint procentele date de subiecii din mediul urban. Dac o serie reprezint un proces ce se petrece n timp, atunci aceasta se va numi serie temporal38.

38

Sau serie cronologic 39

Exemplu 26 n tabelul de mai jos am msurat creterile anuale ale populaiei globului n perioada 1995-2000
Anii 1995 1996 1997 1998 1999 2000 Nr. locuitori 80,781,974 79,253,622 79,551,074 78,019,039 76,861,716 75,529,866

Seria este temporal ntruct ne arat un proces creterea populaiei, i acest proces este studiat ntr-o perioad de timp din anul 1995 pn n anul 2000. Analog putem avea serii de tip spaial39. Exemplul 27 n mai multe licee din Bucureti se pune urmtoare ntrebare profesorilor: Se poate vorbi de o dependen de computer n rndul elevilor? n urma prelucrrii datelor s-au obinut urmtoarele rezultate40:
Locul aplicrii Liceu sector 1 Liceu sector 2 Liceu sector 3 Liceu sector 4 Liceu sector 5 Liceu sector 6 Procent rspunsuri afirmative 58 % 49% 61% 41% 40% 44%

n acest caz seria de numere este studiat n aceeai perioad de timp, dar n puncte diferite din spaiu.

39 40

Sau serii teritoriale. Datele prezentate sunt ipotetice.

40

2.2. Gruparea datelor n continuare vom da un exemplu pentru a arta dou moduri n care putem reprezenta aceleai date n funcie de modul n care am realizat gruparea. Exemplul 28 La un cabinet de testare psihologic a oferilor profesioniti s-a analizat situaia subiecilor testai n decursul unei sptmni. Deoarece avem foarte muli subieci, realizarea unei diagrame n care s reprezentm nota obinut de fiecare subiect devine anevoioas, aceasta nu are nicio relevan, aa cum se poate observa i din diagrama de mai jos:
Rezultate test
70 60 50 40 30 20 10 0

9 10 11 12 13 14 15 16 17 18 19 20

n aceast situaie se poate recurge la gruparea datelor pe intervale. Dac avem lungimea intervalului de 9 puncte atunci datele se vor putea pune astfel ntr-un tabel:
intervalul nr. subieci 36-44 4 45-53 11 54-62 5

41

Astfel am obinut urmtoarea reprezentare a datelor:


Rezultate test
12 10 8 6 4 2 0
36-44

36-44

45-53

45-53

54-62

54-63

2.3. Reprezentri grafice ale seriilor de numere Cnd ne referim la reprezentare grafic, nelegem reprezentarea datelor ntr-un sistem de coordonate. Reprezentrile grafice cu ajutorul unui sistem de coordonate se numesc diagrame. Uneori ns putem folosi alte reprezentri cum ar fi: tabele, figuri geometrice, hri etc. O diagram conine, indiferent de form, un sistem de coordonate i o legend explicativ atunci cnd reprezentm mai multe serii de numere. Diagramele cele mai folosite sunt cele bidimensionale. Aa cum se poate deduce chiar din denumire, diagramele bidimensionale au dou axe. Axa Ox41 este axa pe care reprezentm etichetele seriei de numere42, iar pe axa Oy43 valorile corespunztoare acestor etichete.

41 42

Orizontal. Aceste etichete pot fi sub forma de text sau numere. 43 Vertical. 42

2.3.1. Diagramele de tip linie Reprezentarea datelor prin diagramele de tip linie44 este unul din modurile cel mai des folosite. Exemplul 29 La un test, n urma corectrii rezultatelor, s-au obinut urmtoarele note: cu nota 4 3 elevi, cu nota 5 5 elevi, cu nota 6 2 elevi, cu nota 7 4 elevi, cu nota 8 3 elevi, cu nota 9 4 elevi, cu nota 10 3 elevi. Cu rezultatele expuse mai sus realizm un grafic:
Nr.elevi 7 6 5 4 3 2 1 0 4 5 6 7 8 9 10

Folosind reprezentarea datelor cu ajutorul graficului, informaia obinut devine mai ampl dect n cazul prezentrii prin tabel. Putem observa imediat, n exemplul 29, faptul c n clas exist cele dou tipuri de elevi: cei care se centreaz n jurul notei 5 i cei care se centreaz n jurul notei 7. Dac n loc de note realizm o analiz a fenomenelor n funcie de timp, atunci graficul ne va arta evoluia n timp a unui proces:
44

Cunoscute sub denumirea de grafice. 43

Exemplul 30 Dorim s analizm creterea populaiei globului n perioada 1994-200445. Atunci vom pune pe axa Ox anii, iar pe Oy valorile. Vom obine urmtorul grafic:
6.5 6.4 6.3 6.2 6.1 M ilia r d e 6.0 5.9 5.8 5.7 5.6 5.5 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

n cadrul acestui tip de grafic se poate observa faptul c, dac pe scala Oy schimbm valorile, forma graficului se schimb. n cazul de mai sus valorile de pe axa Oy sunt ntre 5,5 miliarde i 6,5 miliarde. Dac ns lum valorile ntre 2,5 i 6,5 miliarde vom obine urmtorul grafic:

Sursa: U.S. Census Bureau, International Data Base. Pentru 2004 este dat desigur o estimare. 44

45

6.5 6.0 5.5 5.0 Miliarde 4.5 4.0 3.5 3.0 2.5 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

n acest caz creterea nu mai pare att de pronunat ca n primul caz. (Iat o prim justificare a faptului c nu ne putem baza pe forma unei diagrame, ci avem nevoie de instrumente obiective, cum ar fi analiza statistic a datelor).

Desigur, apare ntrebarea: Care din cele dou diagrame este cea corect? Corecte sunt amndou. Alegerea scalei este dat de problema studiat: Dac, de exemplu, studiem creterea populaiei n raport cu anul 1994, atunci este recomandabil prima reprezentare. Dac ns dorim s ne raportm la anul 1950 cnd populaia globului era de aproximativ 2,5 miliarde atunci este recomandabil cea de-a doua reprezentare.

45

Exemplu 30 (continuare) Putem reprezenta, tot n aceeai perioad, cu ct a crescut populaia n fiecare an comparativ cu anul anterior. Vom obine datele:
1995-1994 1996-1995 1997-1996 1998-1997 1999-1998 2000-1999 2001-2000 2002-2001 2003-2002 2004-2003 80,781,974 79,253,622 79,551,074 78,019,039 76,861,716 75,529,866 74,220,528 73,002,863 72,442,511 72,496,962

Ca reprezentare vom folosi din nou diagrama de tip linie. Dup cum se observ din diagrama de mai jos, dei populaia globului continu s creasc, se observ o scdere continu a ritmului de cretere.
Ritmul de cretere al populaiei globului
82 80 78 M ilioane 76 74 72 70 68
19 95 -19 94 19 96 -19 95 19 97 -19 96 19 98 -19 97 19 99 -19 98 20 00 -19 99 20 01 -20 00 20 02 -20 01 20 03 -20 02 20 04 -20 03

46

n lucrul cu diagrame de tip linie putem ntlni urmtoarele tipuri de reprezentri: a) datele grupate la cea mai mic valoare46

b) date grupate la cea mai mare valoare

c) datele distribuite normal

Putem observa chiar c ultimul exemplu se ncadreaz n aceast clas de reprezentri. 47

46

n practic, desigur, se pot ntlni mult mai multe tipuri de grafice, dar ne-am oprit la acestea i prin prisma noiunilor ce vor fi predate n capitolele urmtoare. 2.3.2. Histogramele Un alt mod de reprezentare a datelor este prin histograme. Acest tip de diagram l folosim atunci cnd dorim s comparm valorile ntre anumite categorii. Exemplul 31 n perioada noiembrie 2003 februarie 2004, s-a pus urmtoarea ntrebare elevilor de liceu din clasa a 11-a i a 12-a: La ce facultate vei da examen dup bacalaureat? n urma centralizrii datelor s-au obinut urmtoarele rezultate47:
Facultate ASE Drept Medicin Informatica Politehnic Litere Psihologie Jurnalism Procent 10,7% 12,8% 6,7% 7,0% 4,4% 6,6% 6,3% 2,8%

Ca observaie, dei ntrebarea se referea clar la facultatea la care vor da examen, totui se observ c un procent important au dat ca rspuns o instituie ntreag (cum ar fi Academia de Studii Economice). ntruct acest lucru l-am considerat important pentru studierea opiunilor pentru o facultate, am lsat aceste opiuni.

47

Am pus doar opiunile ce au ntrunit mai mult de 2%.

48

100%

75%

50%

25%

0%
ati ca lo g ie Ps i ho ep t re AS E Lit e Dr In f orm Ju rna li s m

n acest caz pe axa Ox am pus etichetele (ASE, Drept, Medicin etc.), iar pe axa Oy am pus valorile corespunztoare fiecrei etichete. Tot n cadrul cercetrii respective am pus o ntrebare pe aceeai tem i prinilor elevilor: La ce facultate va da examen dup bacalaureat fiul/fiica dumneavoastr?
Facultatea ASE Drept Medicin Informatica Politehnic Litere Psihologie Jurnalism Opiuni elevi 10,7% 12,8% 6,7% 7,0% 4,4% 6,6% 6,3% 2,8% Opiuni prini 16,8% 15,0% 7,6% 6,5% 7,8% 5,0% 4,1% 2,8%

Am pus pe aceeai diagram rspunsurile elevilor i ale prinilor.

49

18.00% 16.00% 14.00% 12.00% 10.00% 8.00% 6.00% 4.00% 2.00% 0.00% ASE Drept Medicin Informatica Politehnic elevi prini Litere Psihologie Jurnalism

Observaie. Atunci cnd am realizat diagrama doar cu opiunile elevilor am pus pe axa Oy valorile de la 0% la 100%, pentru a putea realiza o prim analiz a opiunilor elevilor n raport cu totalul opiunilor elevilor. n al doilea caz, am pus pe axa Oy valori ntre 0% i 18 % pentru a scoate n eviden eventualele diferene ntre opiunile prinilor i ale elevilor. 2.3.3. Alte tipuri de diagrame Reprezentarea pe care o putem da datelor se poate realiza n mai multe moduri (datele sunt cele de la exemplul 30). diagrama de tip disc48 dac dorim s scoatem n eviden procentul opiunilor elevilor raportndu-ne la total. Dar, n aceast situaie, ar trebui s mai introducem i restul opiunilor sau, pentru simplificarea reprezentrii, putem s mai introducem o nou categorie, alte opiuni. n acest caz obinem urmtoarea diagram:

48

n englez Pie.

50

Alte optiuni 42.7%

ASE 10.7%

Drept 12.8%

Medicin 6.7% Informatica 7.0% Psihologie 6.3% Litere 6.6% Politehnic 4.4%

Jurnalism 2.8%

diagrama de tip bar


Jurnalism Psihologie Litere Politehnic Informatica Medicin Drept ASE 0.00% 5.00% 10.00% 15.00% 20.00% Opiuni prini Opiuni elevi

51

diagrama de tip linie


18.00% 16.00% 14.00% 12.00% 10.00% 8.00% 6.00% 4.00% 2.00% 0.00%
ASE Drept Medicin Informatica Politehnic Litere Psihologie Jurnalism Opiuni elevi Opiuni prini

diagrama de tip inel (doughnut)

ASE Drept Medicin Informatica Politehnic Litere Psihologie Jurnalism

52

diagrama tip arie i coloane


18.00% 16.00% 14.00% 12.00% 10.00% 8.00% 6.00% 4.00% 2.00% 0.00%
ASE Drept Medicin Informatica Politehnic Litere Psihologie Jurnalism Opiuni elev i Opiuni prini

Un alt mod de a clasifica diagramele este raportarea la numrul de coordonate n care este realizat diagrama. Cele mai uzuale sunt: bidimensional i tridimensional. Bidimensional
82,000,000 80,000,000 78,000,000 76,000,000 74,000,000 72,000,000 70,000,000 68,000,000 1995- 1996- 1997- 1998- 1999- 2000- 2001- 2002- 2003- 20041994 1995 1996 1997 1998 1999 2000 2001 2002 2003

53

14.0% 12.0% 10.0% 8.0% 6.0% 4.0% 2.0% 0.0%

In for m ati ca

Ps iho log ie

Dr ep t

ASE 11% Alte optiuni 42% Drept 13% Medicin 7%

Jurnalism 3% Psihologie 6% Litere 7%

Informatica 7% Politehnic 4%

54

Ju rn ali sm

Lit er e

AS E

Tridimensional

82,000,000 80,000,000 78,000,000 76,000,000 74,000,000 72,000,000 70,000,000 68,000,000 1995- 1996- 19971998- 19992000- 20011994 1995 1996 2002- 20031997 1998 20041999 2000 2001 2002 2003

14.0% 12.0% 10.0% 8.0% 6.0% 4.0% 2.0% 0.0%

In fo rm at ic a

Li te re Ps ih ol og ie Ju rn al is m

E AS

D re pt

55

ASE Alte optiuni 42.7% 10.7% Drept 12.8% Medicin 6.7% Informatica Jurnalism 2.8% Psihologie 6.3% Litere 6.6% Politehnic 4.4% 7.0%

2.3.4. Sociograme O prim etap n aplicarea sociometriei este realizarea sociomatricei. Exemplul 32 ntr-o echip de lucru s-a pus problema realizrii de subechipe de cte doi muncitori care s execute anumite operaiuni mpreun i a gsirii unui coordonator al acestor subechipe. Pentru aceasta s-au pus o serie de ntrebri membrilor echipei. Una din ntrebri a fost: Dac ar trebui s faci o deplasare n vederea executrii unei lucrri de o zi pe un alt antier cu cine ai merge? Subiecii au dat urmtoarele rspunsuri49 :

49

Le-am sistematizat sub forma unui tabel.

56

Putem observa c S5, S6, S7, S9 nu au nicio opiune, c S1 i S3 au o opiune, S2 i S8 au dou opiuni i S4 are trei opiuni. Este ns destul de greu ca din tabelul de mai sus s punem n eviden i relaiile ntre subieci. Un mod de reprezentare ar putea fi sub form de cercuri concentrice, unde n cercul interior vom pune pe cei ce au 0 opiuni, iar n cercul cel mai mare vom pune pe cei cu 3 opiuni. n plus, vom duce nite sgei de la subiectul ce a ales la subiectul ales. Dac doi subieci s-au ales ntre ei, de exemplu S1 cu S3, atunci sgeata va avea dublu sens. Exemplul 32 (continuare)

S1 S3 S5 S6 S2 S9 S7

S8 S4

n capitolul 4, n seciunea 4.1.6. vom vedea c putem continua prelucrarea acestor date prin realizarea grafului asociat i a unei matrice asociate sociogramei.
57

2.3.5. Alte reprezentri ale datelor Aa cum am specificat la nceputul acestui capitol, n afar de diagrame, mai exist o serie de reprezentri pentru analiza datelor. Pentru a explica mai bine vom reveni la exemplul 30. S presupunem c dorim s analizm comparativ opiunile prinilor cu cele ale elevilor. Pentru aceasta putem folosi urmtoarea regul: dac diferenele procentuale ntre opiunile prinilor i opiunile elevilor sunt mai mici de 2% atunci vom spune c acestea nu difer. n aceast situaie vom avea opiuni comune pentru prini i elevi i opiuni specifice fiecrei categorii. Putem reprezenta aceste date astfel:

COMUN
Medicin Informatic Litere Jurnalism

Elevi Psihologie

Prini
ASE Drept Politehnic

Desigur, pentru figura de mai sus se poate folosi orice tip de form.

58

2.4. Noiuni introductive de prezentare a datelor n Power Point Odat ce am gsit modul de reprezentare (diagrame, scheme etc.) a datelor, atunci cnd ne gndim la prezentarea lor n public (fie c e vorba de comisia de licen, fie la o sesiune de comunicri), trebuie s gsim un mod de prezentare ct mai clar i uor de folosit. O prim metod este realizarea unui poster. Ce este un poster? n general e o coal de carton cam de un metru nlime i 50 de cm lungime pe care se lipesc patru-cinci foi format A4 cu diagrame i/sau diferite tabele cu date mai importante. La sesiunile de comunicri se aloc timp distinct pentru acest gen de prezentri unde autorul (autorii) pun (e) posterul n zona special amenajat pentru acest gen de prezentri i rspund la eventualele ntrebri puse de cei ce citesc i sunt interesai de ceea ce se prezint n poster. O alt metod este de a pregti nite transparente ce se pot pune la un retroproiector, fiecare folie transparent fiind pus de cel ce prezint i d explicaii audienilor. O a treia metod este de a pregti pe un computer toat prezentarea i de a prezenta folosind un videoproiector. Desigur, mai pot fi i alte metode de prezentare, dar ne-am mrginit la acestea trei ntruct reprezint cele mai rspndite moduri de prezentare care se pot folosi n toate universitile. Materialul pentru toate cele trei metode poate fi pregtit bazndu-ne pe un soft specializat: Power Point, Open Office, Staroffice etc. Deoarece la ora actual cel mai cunoscut este Power Point vom face o scurt prezentare a acestuia. 2.4.1. Ce este Power Point? Power Point reprezint un soft specializat pentru prezentri profesionale. Concret, el are multe din facilitile celorlalte softuri de la Microsoft, cum ar fi: editare text, tabelare, realizarea de desene, importarea de fiiere din alte programe. Cnd se creeaz o prezentare cu Power Point, aceasta se face pe baz de slide uri50. Prezentarea se poate realiza ntr-un singur fiier i la ea, pe lng imagine, se pot ataa i
Vom pstra denumirea n englez deoarece n dicionar la cuvntul slide am gsit diapozitiv, lamel ceea ce mi s-a prut c ar reduce nelegerea posibilitilor acestui instrument. 59
50

fiiere audio (cum ar fi vocea prezentatorului sincronizat cu parcurgerea automat a slide-urilor sau o melodie etc.) 2.4.2. Cum ncepem? S-ar putea ca icon-ul s fie pe ecran (desktop) i atunci, dnd un dublu-clic pe acest icon, se deschide Power Point. Dac nu vedei icon-ul pe ecran atunci dai un clic pe butonul de START (se afl de obicei n stnga-jos pe ecran) i din fereastra ce se deschide alegei Programs, apoi Power Point. Pe ecran, n partea dreapt va aprea o fereastr ca cea de mai jos:

60

Open a presentation aa cum arat i titlul, n aceast parte a ferestrei se gsete o list cu ultimele fiiere salvate. Dac dorim s deschidem unul din acest fiiere este suficient s dm un clic pe denumirea fiierului. New folosind aceast parte a ferestrei putem crea o prezentare slide cu slide pornind de la slide-uri albe51 (Blank Presentation), s realizm o prezentare pornind de la slide-uri preformatate (From Design Template) sau s crem o prezentare fiind ghidai de un program specializat (From AutoContent Wizard) New from existing presentation crearea unei noi prezentri pornind de la o prezentare deja salvat pe computer. New from templates realizarea unei noi prezentri pornind de la forme predefinite fie de pe computer, fie de pe WEB Observaie. Diferena dintre From Design Template i New from templates const n faptul c, n timp ce, n primul caz, afiarea slide-urilor preformatate se face n fereastra din stnga ecranului, n al doilea caz slide-ul preformatat se alege dintr-o list de slide-uri. Acum s alegem opiunea Blank Presentation i s dm un clic pe aceasta. Va aprea pe ecran n centru o foaie alb cu dou dreptunghiuri tra-sate cu linie punctat. n cel de sus putem s introducem titlul slide-ului, iar n cel de jos un text. Tot n momentul n care am dat clic pe opiunea Blank Presentation n partea dreapt a ecranului va aprea urmtoarea fereastr:

Mi s-a prut mai aproape de ceea ce este afiat denumirea de slide alb dect cea de slide gol. 61

51

Dac dorim, de exemplu, ca titlul sa fie mai sus, iar sub acest titlu s avem dou coloane, dm un clic pe icon-ul ncadrat. Textul, inserarea de imagini etc. se realizeaz ca ntr-un editor de texte. n continuare, vom arta modul n care se poate realiza vizualizarea acestor slide-uri. 2.4.3. Cum se realizeaz vizualizarea n Power Point? n fereastra de lucru, n partea stnga-jos avem un grup de trei butoane:

Le vom prezenta pe rnd: Cel mai din stnga buton este butonul activat implicit i vizualizeaz cte un slide, astfel nct se pot face modificri pe acel slide afiat. n acest mod avem acces la toate opiunile din meniul Power Point.
62

Urmtorul buton vizualizeaz n modul Outline, adic putem vedea slide-urile realizate n ordinea lor, nu putem face modificri in slide-uri, dar putem schimba ordinea lor astfel: mergem cu mouse-ul pe slide-ul cruia dorim s-i schimbm poziia, cnd ajunge cursorul pe acel slide, inem apsat butonul din stnga al mouse-ului i apoi micm mouse-ul pn aducem slide-ul n poziia dorit. Atunci ridicm degetul de pe mouse. , numit slide-show, este butonul prin Cel mai din dreapta buton care putem intra n modul prezentare a slide-urilor pornind de la slide-ul afiat iniial. n seciunea ce urmeaz vom prezenta acest mod de vizualizare. 2.4.4. Modul de vizualizare Slide-Show Cnd se folosete acest mod de vizualizare, slide-ul va ocupa tot ecranul, astfel nct de pe ecran vor disprea bara de titlu, meniurile i orice alt element ce nu face parte din slide. n acest moment computerul e folosit ca un proiector de slide-uri 52. Atunci cnd utilizatorul i pregtete prezentarea, are pentru acest mod o serie de opiuni privind modul n care s apar titlurile pe pagin (simularea venirii titlurilor din diferite pri ale ecranului, rotirea titlului pn ajunge n poziia destinat etc.), a vitezei de succesiune a slide-urilor etc. Desigur, n aceste cteva pagini nu ne-am propus dect s facem o scurt prezentare a posibilitilor de prezentare a soft-ului Power Point. Cei ce vor s afle mai multe despre acest mod computerizat de prezentare a datelor i sftuim s mearg la manualele de specialitate cum ar fi [Bott], [Kin]. 2.5. Graficul Gantt Graficul Gantt reprezint un instrument de planificare care poate fi folosit pentru alocarea timpului pentru diferite etape ce trebuie realizate n cadrul unui proiect. Acest tip de reprezentare este printre cele mai folosite de ctre manageri n planificarea diferitelor proiecte deoarece este uor de neles i de construit. Fiecare sarcin este aezat pe cte o linie. Pe coloane se pun datele (zile, sptmni sau luni n funcie de durata proiectului). Sarcinile pot decurge secvenial sau n paralel.
Montat la un video proiector poate transmite pe un ecran imaginile de pe slide-uri. 63
52

n realizarea unui grafic Gantt trebuie s inem seama de faptul c avem un numr rezonabil de sarcini astfel nct s le putem gestiona. Exemplul 33 S vedem cum s-ar putea pune, sub forma unui grafic Gantt, etapele realizrii unui proiect de diplom. S presupunem c avem urmtoarele etape de realizare a unui proiect:
Nr 1 2 3 4 5 6 7 8 9 Denumirea activitii Stabilirea obiectivelor Determinarea ipotezelor ce rezult din fiecare obiectiv Stabilirea lotului de lucru Stabilirea instrumentelor Culegerea datelor de pe teren Centralizarea, prelucrarea i analizarea datelor Revenirea pe teren pentru a mai culege date de pe teren Centralizarea, prelucrarea i analizarea noilor date Finalizarea lucrrii

Atunci graficul Gantt este:

2.6. Concluzii n finalul acestui capitol dorim s relum ideea lui R.A. Fisher n ceea ce privete rolul reprezentrii datelor n analiza i interpretarea lor: Examinarea preliminar a celor mai multe date este facilitat de folosirea diagramelor. Diagramele nu demonstreaz nimic, dar aduc caracteristici excelente mai aproape de privire; de aceea ele nu reprezint un nlocuitor pentru teste ce pot fi aplicate datelor, dar sunt valoroase n analiza acestor teste i n a explica concluziile bazate pe ele.53
Cf. Fisher R.A. (1925) Statistical methods for research workers Oliver and Boyd, London. 64
53

3. STATISTICA N CERCETAREA SOCIAL


Celor care spun c se poate demonstra orice cu statistica le rspund: cu statistica prost folosit se poate demonstra orice R.A. Fisher

n cele ce urmeaz vom prezenta anumite noiuni din statistica matematic. n general, prezentarea va fi mai mult intuitiv. Pentru o prezentare mai riguroas a noiunilor recomandm consultarea unui curs de statistic social54. Fiecare seciune va avea, la nceput, exemple de cercetri care reprezint diferite moduri de a pune problema. Rspunsurile pentru problemele puse la nceputul fiecrei seciuni se vor gsi n seciunea 3.13. 3.1. Caracteristici (variabile) Exemplul 34 Pentru proiectul de diplom un student i-a ales tema: Complexul de inferioritate la adolesceni. Ce ar trebui s cerceteze studentul n cadrul acestui proiect? Exemplul 35 La dou clase a VI-a din aceeai coal, existau performane colare semnificativ diferite, una din clase avnd rezultate foarte bune i foarte muli copiii participani la olimpiade cu rezultate foarte bune, n timp ce, la cealalt clas, dei aveau cam aceiai profesori, problema principal a elevilor era s nu rmn corigeni. Pe ce ar trebui s se axeze un eventual studiu de determinare a cauzelor diferenelor ntre performanele colare ale elevilor?
54

De exemplu, [Alex]. 65

Ceea ce face ca anumite elemente s fie grupate pentru analiz constituie o caracteristic comun. Numerele rezultate, n urma aplicrii unui test de inteligen, vor putea fi analizate mpreun deoarece au comun caracteristica dat de coeficientul de inteligen. Caracteristicile poart numele de variabile. Deci, pentru a defini o variabil, avem nevoie de o etichet pentru elementul msurat i acestei etichete i se asociaz o proprietate55. Exemplul 36 Pentru subiecii crora li s-a aplicat un test de inteligen se poate reprezenta variabila sub urmtoarea form:
Etichet Subiect 1 Subiect 2 Subiect 3 Subiect 4 Subiect 5 Valoare coef. de intelig. 117 100 98 79 102

ntruct ceea ce ne va interesa este caracterizarea unui grup de elemente, vom folosi, n continuare, denumirea de caracteristic. Caracteristicile vor fi de tip calitativ sau cantitativ. Caracteristicile de tip calitativ, aa cum se poate deduce din denumire, ne arat o calitate a elementelor grupului. Exemplu 37 Putem avea caracteristica grad universitar i atunci ea ar putea fi de forma:
Etichet Grad universitar Subiect 1 Confereniar Subiect 2 Lector Subiect 3 Lector Subiect 4 Preparator Subiect 5 Lector Subiect 6 Profesor

Caracteristicile de tip cantitativ sunt cele n care studiem valori asociate elementelor grupului.

Am folosit termenul de proprietate pentru a cuprinde amndou posibilitile: Etichetei s-i fie asociat o valoare sau o calitate. 66

55

Exemplul 38 Dac studiem indicele de caracteristica va arta astfel:


Etichet Indice de depresie Subiect 1 55

depresie

la

un grup,
Subiect 4 32,5

Subiect 2 40

Subiect 3 46,25

O abordare mai riguroas a datelor se poate da prin schema de mai jos:


Date

Calitative
Cantitative

Nominale Grad univ., culoarea prului etc.

Ordinale Locul ntr-un concurs, nr. de concursuri ctigate

Discrete Indice depresie, valoare coef .inteligen

Continue Valorile nlimii unui copil ntre 0-1 an

3.2. Populaie Exemplul 39 Pentru realizarea unui sondaj privitor la alegerile locale dintr-un anumit ora, din cine se compune mulimea pe care o studiem? Dar dac sondajul s-ar referi la alegerile generale?
67

Populaia56, din punct de vedere statistic, reprezint mulimea de elemente care au una sau mai multe caracteristici comune. De exemplu, putem avea populaia alctuit din persoanele din mediul urban, n acest caz caracteristica comun fiind mediul. Putem avea i o populaie alctuit din persoanele de sex feminin din mediul rural. n aceast situaie, persoanele au dou caracteristici comune ce le reunesc ntr-o populaie: faptul c sunt de sex feminin, i c sunt din mediu rural. Elementele populaiei pot fi: persoane, obiecte, evenimente, idei, opinii etc. Putem spune c asupra elementelor unei populaii acioneaz aceleai legi statistice din punct de vedere al caracteristicii studiate. n raport cu aceste legi se poate defini gradul de omogenitate al unei populaii. Pentru studiile n tiinele sociale aceast omogenitate ne poate fi foarte folositoare n realizarea de predicii asupra populaiei studiate. Un posibil rezultat ar putea fi: cu ct omogenitatea este mai mare cu att gradul de siguran al prediciei va fi mai mare. Exemplul 40 Lund caracteristica nvarea limbii franceze la coal n clasa a 6-a, putem avea o populaie alctuit din elevii de clasa a 6-a ce nva limba francez la coal. S-ar putea ca omogenitatea acestei populaii s fie foarte mic, datorit faptului c elevii provin din mediul urban, iar alii din mediul rural. Desigur, n acest caz, putem transforma studiul i vom spune c analizm dou populaii: o prim populaie compus din elevii de clasa a 6-a ce nva francez i sunt din mediu urban i o a doua populaie compus din elevii de clasa a 6-a ce nva francez i sunt din mediul rural. S observm c fiecare populaie are, n fapt, 3 caracteristici: nva limba francez, sunt n clasa a 6-a i mediul cruia aparin.

56

O alt denumire pentru populaie este i colectivitate statistic.

68

Exemplul 41 S presupunem c dorim s realizm un studiu asupra cumprtorilor dintr-un magazin. n acest caz vom analiza dou populaii: o prim populaie, alctuit din localnicii ce cumpr din acel magazin, i o a doua populaie, alctuit din turitii ce au fcut cumprturi n acel magazin. Dac ns dorim s comparm cumprturile realizate de localnici cu cumprturile realizate de turiti, atunci s-ar putea s obinem o omogenitate mai mic a celor 2 populaii i atunci s-ar putea s fim nevoii s studiem dup o alt caracteristic, s zicem sexul cumprtorilor. n acest caz vom avea 4 populaii: populaia de localnici de sex feminin ce cumpr din magazin, populaia de turiti de sex feminin ce cumpr din magazin, populaia de localnici de sex masculin ce cumpr din magazin i populaia de turiti de sex masculin ce cumpr din magazin. Ca exerciiu, v putei imagina, ca o caracteristic de care se poate ine cont n realizarea populaiei, vrsta celor ce fac cumprturi n acel magazin. Desigur, mprirea dup prea multe caracteristici duce la un numr mare de populaii studiate, ceea ce ngreuneaz considerabil cercetarea. Putem uni dou populaii ntr-una singur atunci cnd diferenele ntre ele nu sunt semnificative. La nivel conceptual, totul pare destul de corect, ns din punct de vedere practic, chiar i cazul n care avem de analizat caracteristicile unei singure populaii apar destule probleme57. Pentru a nelege mai bine acest lucru este suficient s ne gndim la recensmntul populaiei unei ri. Am dat acest exemplu pentru a arta c totui analiza fiecrui individ al unei populaii se realizeaz, dei este destul de dificil de realizat. n situaia cnd se realizeaz analiza unei populaii prin analiza fiecrui individ, tiina ce descrie aceast populaie se numete Statistic Descriptiv. Totui, n cele mai multe cazuri, realizarea unei statistici
57

De costuri, de control al rezultatelor etc. 69

descriptive nu se realizeaz. n aceste cazuri se folosesc uniti statistice mai mici, pe baza lor putndu-se realiza o extensie la populaie. Acest gen de statistic se numete Statistic Inferenial. n seciunea urmtoare vom prezenta diferite tipuri de uniti statistice. 3.3. Eantion. Lot Exemplul 42 O firm dorete s lanseze ntr-un anumit ora un produs i ar dori s afle prerea populaiei din acel ora, referitor la produs. Cel mai sigur ar fi s ntrebe pe toi locuitorii din ora, dar costurile, din punct de vedere financiar, ar fi destul de ridicate. Care ar fi soluia pentru a reduce costurile? O definiie destul de uzual este: eantionul reprezint subansamblul unei populaii58. Pornind de la aceast definiie putem observa c un eantion reprezint mulimea de elemente59 care conin una sau mai multe caracteristici comune. Desigur, ai observat c aceast definiie este asemntoare cu cea a populaiei. Deci unde este diferena? Numrul de elemente, n cazul eantionului, este mai mic dect cel al populaiei. Dar oare, avnd un grup elemente ce au aceeai caracteristic, putem s spunem ceva despre populaie? Rspunsul este afirmativ doar dac eantionul este reprezentativ, dac el conine la nivel micro toate elementele eseniale ce se regsesc n toat populaia. Exemplul 43 Pornind de la ipoteza60: Cu ct crete vechimea n munc cu att dorina de schimbare scade. n acest caz, vom avea dou eantioane: Primul va fi format din muncitori angajai de curnd, iar al doilea din muncitori ce au o vechime mai mare n munc.
Cf. [Rat]. Reamintim c elementele pot fi persoane, obiecte, idei, opinii, evenimente etc. 60 ntruct nu constituie scopul acestei lucrri nu voi insista asupra problemelor legate de eantionare. 70
59 58

S presupunem c dorim s studiem dac un fenomen poate influena o mulime de elemente. Vom face msurtorile pentru o mulime nainte de petrecerea fenomenului i apoi, pe aceeai mulime, vom face msurtori dup petrecerea fenomenului. n acest caz nu o caracteristic realizeaz reunirea ntr-un grup a elementelor. Pentru acest gen de situaii se folosete denumirea de lot. Primul lot61 se va numi lot de control, iar cel de-al doilea lot62 se va numi lot experimental. Exemplul 44 Dorim s studiem dac sistemul de notare cu note de la 1 la 100 ar fi mai bun dect sistemul de notare de la 1 la 10. Pentru aceasta vom lua dou loturi. n primul lot vom avea elevii unei clase la care vom face notarea de la 1 la 10, iar al doilea lot vom avea elevii din alt clas unde vom face notarea de la 1 la 100. n acest caz, am folosit denumirea de lot ntruct obiectul studiului l reprezint metoda de notare i nu elevii n sine63. 3.4. Eveniment Exemplul 45 Un operator trebuie s aplice un chestionar pe teren persoanelor peste 40 de ani de sex masculin. Avnd multe refuzuri, fiind destul de obosit, s-a dus acas unde a rugat nite prieteni s-l ajute s completeze chestionarele. Cum s-a modificat evenimentul?

Cel dinaintea petrecerii fenomenului. Cel de dup ce fenomenul studiat a avut loc. 63 S observm c obinerea de diferene semnificative ntre cele 2 loturi nu nseamn automat c un sistem de notare este mai bun dect cellalt. 71
62

61

Exemplul 46 Un student avea ca tem studiul ateniei concentrate la elevii de clasa a 3-a. n urma centralizrii datelor a venit la profesorul ndrumtor cu urmtorul tabel:
Subieci B.B. T.E. C.A. R.I. S.E. S.P. P.V. L.I. B.D. T.C. B.A. A.B. P.F. B.D. R.C. I.V. C.A. S.S. P.A. N.R. Atenia concentrat 70 90 90 100 90 90 90 90 70 90 90 100 90 60 100 80 100 90 100 90 Vrsta 9 ani 9 ani 9 ani 10 ani 9 ani 10 ani 9 ani 9 ani 10 ani 9 ani 9 ani 7 ani 10 ani 9 ani 9 ani 9 ani 8 ani 13 ani 9 ani 9 ani

n urma examinrii acestui tabel, profesorul i spune c trebuie s verifice datele i c tabelul nu e complet, deci proiectul nu poate fi notat. Odat stabilit tipul de unitate statistic cu care vom lucra64, vom dori s realizm diferite experimente, experiene pe tipul de unitate statistic ales. n teoria probabilitilor, rezultatul unei experiene se numete eveniment.
64

Populaie, eantion sau lot.

72

Exemplu 47 S presupunem c dorim s analizm ct la sut din studeni vor intra n sala de curs n cele 10 minute dinaintea cursului. Populaia va fi compus din toi studenii, deoarece indiferent de an i de facultatea de unde sunt studenii, toi au ore de curs n programa de nvmnt. Vom lua un lot65 de la un curs dintr-o anumit zi. Ca eveniment (rezultat al experienei) putem avea 20 de persoane ce au intrat in ultimele 10 minute. S notm acest eveniment cu A. Cu B vom nota evenimentul 30 de persoane au intrat n ultimele 10 minute i cu C vom nota evenimentul 70 de persoane au intrat n ultimele 10 minute la curs. Un alt tip de eveniment ar putea fi n ultimele 10 minute s intre la curs mai puin de 35 de persoane. Pe acesta l putem nota cu D. Se observ c evenimentul D include i evenimentul A i evenimentul B. Vom spune c evenimentele A i B sunt evenimente primare i evenimentul D este compus. Ca tipuri de evenimente putem avea cele dou cazuri extreme: a) Evenimentul imposibil (sau evenimentul nul), care, aa cum se poate deduce din denumire, este acel eveniment care nu se poate produce. Acesta se poate obine prin mbinarea a 2 evenimente care nu se pot produce n acelai timp. Exemplul 48 S spunem c avem evenimentul A: s obinem mai mult de 7 puncte la un joc i evenimentul B: numrul obinut la aruncarea unui zar. Evenimentul rezultat din combinarea66 celor dou evenimente este C: la un joc s obinem mai mult de 7 puncte la aruncarea unui zar. Acest lucru evident este imposibil.
n acest caz putem spune c este vorba de un lot deoarece nu ne intereseaz caracteristicile populaiei, ci fenomenul. 66 Matematic vorbind este vorba de intersecia celor 2 evenimente. 73
65

b) Evenimentul total. Acest gen de eveniment este cel care se produce, n mod sigur, n urma unui eveniment. n continuare vom prezenta principalii indicatori statistici ce se pot folosi n analiza primar a datelor. Indicatorii tendinei centrale sunt indicatori sintetici cu ajutorul crora urmrim s exprimm () ceea ce este tipic, esenial, stabil, obiectiv i caracteristic ntr-o serie de numere67. 3.5. Minimul i maximul La o prim privire asupra datelor de tip cantitativ putem deja observa doi indicatori: minimul i maximul. Exemplul 49 ntr-un liceu am studiat manifestarea complexului de inferioritate la un lot de 30 de adolesceni. Studiem posibilitatea ca s avem o manifestare a complexului de inferioritate prin valene ridicate ale anxietii68. Se observ n datele centralizate n tabelul de mai jos c maximul este 33, iar minimul este 19. Pornind de la aceste constatri am putea, de exemplu, s ncepem prin a investiga elevii ce au obinut aceste rezultate extreme.
S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11 Nota A 32 31 33 27 29 25 23 22 25 21 25 S12 S13 S14 S15 S16 S17 S18 S19 S20 S21 S22 Nota A 25 19 23 27 32 31 33 27 29 25 23 S23 S24 S25 S26 S27 S28 S29 S30 Nota A 22 25 21 25 25 19 23 27

67 68

Cf. [i] p. 114. Am luat n considerare doar anxietatea manifest.

74

3.6. Media Exemplul 50 n urma aplicrii unui test de memorie pe un lot de copii s-au obinut urmtoarele rezultate:
memoria vizual 5 3 2 4 2 2 4 4 6 1 3 memoria auditiv 6 4 4 6 2 3 5 4 8 2 4

LM VA MA TC SA TS BR FI DC CR LL

Care sunt valorile pentru care am putea spune c un copil are memorie vizual bun n raport cu grupul studiat? Exemplul 51 ntr-o lucrare cu titlul Legtura dintre mame i copiii de 6 ani, studentul, la prezentarea lotului pe care a fcut acest studiu, a calculat media vrstelor componenilor lotului studiat. Este corect sau nu? Media reprezint unul dintre indicatorii cei mai folosii pentru prezentarea datelor. Cea mai utilizat medie este media aritmetic. Din punct de vedere matematic ea se poate defini astfel: Fiind dat o serie de n numere x1, x2, , xn, media aritmetic va fi:

mx =

x1 + x 2 + ... + x n (1) n

75

Folosind notaia x1 + x 2 + ... + x n = xi , formula (1) se


i =1

mai poate scrie:

mx =

x
i =1

(2)

Observaie. Dac la aplicarea unui test obinem aceeai valoare pentru toi subiecii, s zicem 35, atunci media va chiar 35. Practic ns, un asemenea rezultat ar trebui s ne duc la investigarea validitii procedeului de aplicare al testului. Exemplul 52 n urma unei lucrri de control la o clas elevii au obinut urmtoarele note: 4, 4, 4, 5, 5, 5, 5, 5, 6, 6, 7, 7, 7, 7, 8, 8, 8, 9, 9, 9, 9, 10, 10, 10. Pentru a realiza o evaluare a rezultatelor obinute profesorul dorete s calculeze media pe clas la acel test. Pornind de la modul de abordare a datelor avem dou posibiliti de a calcula media la testul pe clas. Metoda 1. Fie datele prezentate liniar. 4, 4, 4, 5, 5, 5, 5, 5, 6, 6, 7, 7, 7, 7, 8, 8, 8, 9, 9, 9, 9, 10, 10, 10. Folosind formula (1) obinem mx = 6,96. Metoda 2. Putem pune date sub forma unui tabel:
4 5 6 7 8 9 10 3 5 2 4 3 4 3

Unde, pe prima coloan, am pus notele, iar pe coloana a doua am pus numrul de elevi corespunztori pentru fiecare not. Dac dorim s
76

calculm media pentru a afla suma notelor putem calcula astfel 4.3 + 5.5 + 6.2 + 7.4 + 8.3 + 9.4 + 10.3, iar pentru a afla numrul de elevi putem aduna numerele din coloana a doua. Modul acesta de calcul este specific mediei ponderate. Cci media unui grup la un test este dat de notele i ponderile lor. Revenind la exemplu nostru lum x1 = 4, x2 = 5, x3 = 6, x4 = 7, x5 = 8, x6 = 9, x7 = 10, i ponderile p1 = 3, p2 = 5, p3 = 2, p4 = 4, p5 = 3, p6 = 4, p7 = 3. Atunci folosind formula mediei ponderate este:

m px =

x1 p1 + x 2 p 2 + ... + x n p n p1 + p 2 + ... + p n

(3)

vom obine mpx = 6,96, adic exact acelai rezultat ca la metoda 1. Exemplul 53 S-a aplicat un test de atenie concentrat la copiii din clasa a III-a. n urma testului s-au obinut urmtoarele rezultate:
Atenie concentrat-cantitate Valori Ponderi69 60 1 70 2 80 1 90 11 100 7

n acest caz media va fi: mpx = (60.1 + 70.2 + 80.1 + 90.11 + 100.7) / (1 + 2 + 1 + 11 + 7 ) = 1970 / 22 = 89,54 Deci se poate presupune, pentru aceast clas, c pentru caracteristica cantitate, avem 4 elevi cu o atenie concentrat mic, 11 elevi au o atenie concentrat medie i 7 au atenie concentrat mare.
69

Nr de elevi ce au obinut valoarea din stnga. 77

Problema, care se pune n aceast situaie, este de a raporta media acestei clase la media populaiei alctuit din elevii de clasa a III-a70. n acest ultim exemplu am prezentat un alt rol al mediei: acela de indicator de poziie. Adic, raportndu-ne la medie, putem spune dac o valoare se afl ntr-o anumit categorie sau n alta. De exemplu, calculnd valoarea medie a nlimii unui grup, putem defini ce nseamn individ scund i ce nseamn individ nalt pentru acel grup. Muli autori consider c avantajul mediei const n faptul c este uor de calculat. Totui, acest lucru poate constitui i un dezavantaj, deoarece, fiind uor de calculat, comparativ cu ali indicatori, exist tendina s se trag concluzii n urma calculului mediei. Concluzii care pot fi eronate. 3.7. Cuantile De multe ori, n practic, informaii importante ne pot fi aduse de modul n care datele sunt distribuite ntre cea mai mare valoare i cea mai mic valoare. Deoarece poziia lor, n raport cu seria de numere, este bine determinat, aceti indicatori se mai numesc i indicatori de poziie. De exemplu, putem scrie datele n ordine cresctoare i s vedem ce date se afl la stnga mijlocului i ce date se afl la dreapta mijlocului71. Valorile ce mpart seria de numere n pri egale se numesc cuantile.

3.7.1. Mediana
Exemplul 54 Studenii dintr-o grup au vrut s-i aleag un ef de grup. Pentru c nu au ajuns la un consens, au rugat un profesor s-i ajute n aceast problem. n urma discuiilor avute cu studenii profesorul a determinat 3 candidai pentru aceast funcie. Apoi a pus pe fiecare student s acorde punctaje ntre 1 i 5 celor 3 candidai. S-au obinut urmtoarele date:
70 71

Aceast medie a populaiei se poate gsi n scala de interpretare a testului. Aa cum vom vedea mai departe, acest mijloc se numete median.

78

S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11 S12 S13 S14 S15 S16 S17 S18 S19 S20 S21 S22 media mediana

S10 1 2 1 2 5 1 5 2 2 5 5 5 2 5 5 2 5 5 2 5 2 3.29 2

S15 3 3 3 4 3 4 3 4 3 1 3 3 4 3 4 3 3 3 3 4 3 3.19 3

S22 5 5 5 5 2 3 2 1 2 2 2 1 2 5 5 2 2 5 2 5 5

3.24 2

Cine credei c este mai indicat s fie ales ef al grupei? Mediana este acea cuantil ce mparte o serie de numere n dou pri egale. Vom nota mediana cu Me. Modul de determinare al medianei se poate realiza n dou moduri (n funcie de numrul de elemente): 1) Dac avem un numr impar de valori, atunci mediana va fi cea care are numrul de elemente de la stnga egal cu numrul de elemente de la dreapta ei.
79

Exemplul 55 ntr-o echip A, s-a cerut muncitorilor s noteze eful cu note de la 1 la 10. n urma centralizrii datelor s-au obinut urmtoarele rezultate:
Note acordate AM1 1 AM2 2 AM3 2 AM4 3 AM5 10

n acest caz, mediana este cea din dreptul lui AM3 i Me = 2. Eticheta AM3 se mai numete, n acest caz, element median72. 2) Dac avem un numr par de elemente, atunci mediana este egal cu media celor dou elemente de la mijlocul seriei de numere ordonate. Exemplul 56 Analog cu problema pus la exemplul 55 s-a realizat o cercetare i la o echip B:
Note acordate BM1 1 BM2 1 BM3 2 BM4 3 BM5 3 BM6 3

Mediana este ntre BM3 i BM4, deci pentru a o calcula vom face media ntre valorile corespunztoare acestor etichete. Deci Me = 2,5 Care este rolul medianei? Mediana este util cnd, n analiza procesului, intervin preri subiective i exist pericolul ca valorile extreme s influeneze rezultatul73. Relund exemplele 54 i 55, s presupunem c dorim s studiem urmtoarea problem: n care echip eful de echip este mai bine vzut de ctre subalterni? Dac am folosi media observm c eful echipei A obine media 3, n timp ce eful echipei B obine media 2,2. Deci am putea concluziona c eful echipei A
n [Rot] este numit individ median, p. 46. Se pot folosi mai multe metode n momentul cnd avem de analizat punctaje rezultate n urma unor preri subiective. De exemplu, la notele acordate la concursurile de patinaj se elimin cea mai mare i cea mai mic valoare i se realizeaz media valorilor rmase. 80
73 72

este mai bine vzut de subalterni. Folosind mediana, eful echipei A obine valoarea 2, n timp ce eful echipei B obine valoarea 3. Asimetria unei serii de numere o putem determina prin studierea poziiei medianei fa de medie. n capitolul anterior, n finalul seciunii 2.3.1., am vzut cum se reprezint cele dou extreme (date grupate la cea mai mic valoare, respectiv la cea mai mare valoare). n practic, aceste cazuri le putem ntlni foarte rar. Ne-ar putea interesa ns situaiile n care seria de numere tinde spre o extrem sau alta. Cnd avem curba situat mai spre stnga datelor, vom spune c avem o asimetrie spre stnga, ceea ce n practic ne va indica tendina valorilor de a se grupa spre cele mai mici valori. Analog se poate concluziona atunci cnd avem curba datelor spre dreapta. Exemplul 57 ntr-un studiu comparativ s-a aplicat un test de evaluare a singurtii emoionale74 pe dou loturi de tineri: primul lot a fost format din tineri cu studii superioare75, iar al doilea din tineri ce au doar studii liceale76. n urma centralizrii datelor s-au obinut urmtoarele rezultate:
TSL 8 4 6 3 3 19 7 5 12 4 TSS 6 5 12 10 12 11 10 9 6 10 TSL 0 14 1 13 16 6 16 6 5 9 TSS 10 3 11 10 12 13 13 10 3 3 TSL 7 21 10 27 11 13 7 2 1 1 TSS 3 9 11 9 20 6 6 6 3 4

74 75

Esli b. Notai n continuare cu TSS. 76 Notai n continuare cu TSL. 81

n urma calculelor, pentru TSL s-a obinut media mTSL = 8,57 i mediana MeTSL = 7,00 i pentru TSS s-a obinut media mTSS = 8,53 i mediana MeTSS = 9,50. n acest caz se observ c, dei, din punct de vedere al mediei, cele dou loturi sunt sensibil apropiate, mediana ne aduce o nou informaie: cei din grupul TSL au tendin spre valori mici, pe cnd cei din TSS au o tendin spre valorile mari. 3.7.2. Cuartilele Cuartilele77 sunt acei indicatori ce mpart datele n patru pri egale. Se poate observa uor c cea de-a doua cuartil reprezint, de fapt, mediana. Pentru a obine cele patru cuartile folosim urmtoarea metod. Calculm nti mediana i rezultatul l vom nota cu Q2. Apoi, pentru datele din stnga lui Q2 calculm mediana i obinem valoarea Q1. Analog pentru datele din dreapta lui Q2 calculm din nou mediana i obinem Q3. Aparent, aceast metod pare complicat, dar deoarece exist destul de multe softuri ce au o funcie ce poate calcula aceast median78, lucrurile devin destul de simple. Exemplu 58 Mai jos am calculat cuartilele pentru irul de date. Am obinut mediana egal cu 7,00. Ordonm cresctor datele i pentru irul astfel obinut calculm Q1 i Q3:
TSL 0 1 1 2 3 4 Q1 5 6 6 6 7 Q2

10

11

12 Q3

13

13

16

16

19

Observaie. Am calculat mediana pentru un numr par de date i atunci mediana va fi egal cu media valorilor a 15-a i a 16-a. n
Acest noiuni trebuie tratate cu atenie ntruct din punct de vedere al denumirii sunt foarte asemntoare. Reamintim faptul c prin cuantile nelegem acele puncte din serie ce mpart seria de numere n pri egale. 78 De exemplu, n Excel avem funcia MEDIAN. 82
77

acest caz cele dou valori sunt egale i valoarea lor este 7, deci i mediana va fi egal cu 7. Pentru calculul medianei primelor 11 date79 mediana va fi numrul de la mijloc, adic a aptea valoare. Deci, Q1 va fi 4. Analog se va calcula Q3 care va fi egal cu 12. 3.7.3. Valoare modal80 Se numete valoare modal a unei serii de numere acea valoare ce apare de mai multe ori n acea serie. Vom nota valoarea modal cu vm. Observaie. n general, cnd se folosete termenul de valoare ne gndim la valoarea exprimat prin numere. Aa cum la obiecte exist n afar de valoarea din punct de vedere financiar i alt gen de valori (de exemplu, valoarea emoional), i n aceast seciune vom folosi sensul mai larg al termenului de valoare (vezi exemplul 43) Exemplul 43 (continuare) Se observ c pentru datele
Atenie concentrat-cantitate Valori Ponderi81 60 1 70 2 80 1 90 11 100 7

avem vm = 90. Observaie. Se observ c pentru acest caz avem media egal cu 89,54, iar mediana este Me = 90 = vm.

Adic Q1. Am preferat aceast denumire celorlalte denumiri cum ar fi modul sau moda, pentru a evita confuziile. 81 Nr de elevi ce au obinut valoarea din stnga. 83
80

79

3.8. Indicatori ai dispersiei Exemplul 59 Un student a realizat un studiu pe elevii dintr-o coal. Pentru a putea trage o concluzie asupra comportamentului copiilor n lotul studiat a luat elevii din clasele a 2-a, a 5-a i a 8-a. De ce ndrumtorul i-a spus s-i modifice modul de alctuire al lotului? n analiza unui grup ne intereseaz tendina grupului, privit ca un element. Dac, de exemplu, avem un lot de subieci care, n medie, a obinut la un test un anumit punctaj, atunci putem trage o concluzie asupra comportamentului grupului. Exemplul 60 n luna mai s-a aplicat unui grup de elevi din clasa a 8-a un test de anxietate. Punctajul la acest test este cuprins ntre 0 i 10 unde, cu ct punctajul este mai mare, cu att anxietatea este mai puternic. n urma prelucrrii datelor media lotului de elevi a fost 6,7. Analiznd media, rezult c tendina general este c grupul este, n mod esenial, normal din punct de vedere al anxietii, cu o uoar tendin spre categoria puin nevrotic. n momentul n care ns analizm un grup prin media lui, trebuie s inem cont de faptul c media nu este singura caracteristic a unui lot de subieci i c putem avea aceeai medie la dou loturi i totui, analiznd acele loturi, s observm diferene importante ntre ele. Uneori, n practic, dei avem aceeai medie pentru dou eantioane, ele sunt diferite din punct de vedere al tendinei82. Pentru a exemplifica, fie urmtoarea situaie: Msurm nlimea populaiei cu vrste ntre un an i 60 de ani n Bucureti. n acest caz obinem o medie a acestui lot de subieci, ns aceast medie nu ar avea nicio relevan din cauza variabilitii mari a valorilor.
82

Reamintim c tendina era dat de poziia medianei fa de medie.

84

3.8.1. Amplitudinea Amplitudinea este egal cu diferena dintre cea mai mare i cea mai mic valoare. Matematic, aceasta se scrie altfel: (4) A = xmax xmin Exemplul 49 (continuare)
Nota A 32 31 33 27 29 25 23 22 25 21 25 Nota A 25 19 23 27 32 31 33 27 29 25 23 Nota A 22 25 21 25 25 19 23 27

S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11

S12 S13 S14 S15 S16 S17 S18 S19 S20 S21 S22

S23 S24 S25 S26 S27 S28 S29 S30

Avem xmax = 33 i xmin = 19. Deci amplitudinea va fi A = 33 19 = 14. n practic, uneori prin calculul raportului

x max x min se pot obine mai

multe informaii. Acest raport se poate folosi n studiul proceselor dinamice, pentru a afla de cte ori este mai mare valoarea maxim fa de valoarea minim. 3.8.2. Abaterea medie ( Am (a) ) Ne poate interesa distana dintre o valoare calculat i o valoare dat. n termeni statistici rezultatul acestei scderi se va numi abaterea valorii calculate de la valoarea dat. Exemplul 61 Se aplic un test unui pacient nainte i dup aplicarea unu tratament. nainte de tratament a obinut 35 de puncte, iar dup aplicarea tratamentului a obinut
85

valoarea 29. tiind c valoarea critic este 40, calculm abaterea fa de aceast valoare pentru a realiza o prim apreciere asupra fenomenului. Abaterea83 dintre punctajul obinut nainte de tratament fa de valoarea critic este 5, n timp ce abaterea dintre punctajul obinut dup tratament i valoarea critic este 11, deci exist posibilitatea ca tratamentul s aib un efect pozitiv. Observaie. Am spus c exist posibilitatea ca tratamentul s aib un efect pozitiv n general, deoarece n urma aplicrii unui experiment unui singur subiect, nu putem dect s emitem ipoteze. S presupunem c dorim s studiem mai n amnunt problema pus n exemplul 3.9. Pentru aceasta ar trebui s realizm un studiu pe mai muli subieci. n acest caz, notnd cu x1, x2, , xn valorile obinute de pacieni nainte de tratament i cu y1, y2, , yn valorile obinute de pacieni dup tratament. Pentru a compara abaterile fa de valoarea critic o soluie simpl este s calculm o medie a abaterilor nainte de tratament i dup tratament. Aceast medie se numete abaterea medie i se noteaz Am (a)84 Exemplul 62 n urma aplicrii testului pe mai muli subieci nainte i dup tratament s-au obinut urmtoarele rezultate:
Nr. subiect 1 2 3 4 5 6 7 8 nainte de tratament 35 36 33 30 36 35 29 32 Am(40) = Abaterea fa de 40 5 4 7 10 4 5 11 8 6.75 Dup tratament 29 32 32 29 32 33 29 30 Am(40) = Abaterea fa de 40 11 8 8 11 8 7 11 10 9.25

n practic, n cele mai multe cazuri, se calculeaz media abaterilor fa de medie.


83 84

Val crit-val exp = 40 35. Abaterea medie fa de valoarea a.

86

Exemplul 63 S-a studiat variaia anxietii, seara i dimineaa, pe un lot de 10 studeni aflai n sesiunea de examene. O prim parte a acestui experiment a fost msurarea anxietii voalate a studenilor dimineaa. n urma centralizrii datelor s-au obinut rezultatele:
anxietate voalat x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 medie(m) 12 14 20 20 12 16 18 17 15 16 16.00 abaterea abaterea fa de medie (x - m) 4 2 4 4 4 0 2 1 1 0 2.20

Observaie Avnd n vedere modul de definire al abaterii, am luat distana dintre valori i medie n modul. 3.8.3. Variana Un alt indicator al dispersiei ce se folosete n practic este variana. Aceasta se exprim astfel:

( x1 m) 2 + ( x 2 m) 2 + ... + ( x n m) 2 (6) n 1 unde m reprezint media valorilor x1, x2, , xn . Aceast formul este valabil pentru eantion. Observaie: Termenul de varian a fost introdus pentru prima oar de Ronald Fisher n 1918 n lucrarea The Correlation Between Relatives on the Supposition of Mendelian Inheritance. s2 =
87

3.8.4. Coeficient de Omogenitate (variabilitate) n cazul cnd alegem un grup, singura problem este s asigurm c acel grup se manifest unitar din punctul de vedere caracteristicii studiate. Pentru a studia aceasta ne vom raporta omogenitatea datelor care se calculeaz cu ajutorul coeficientului variabilitate. Formula este: ne al la de

CV =

100 s % mx

(7)

Avem urmtoarea interpretare: Dac CV < 10% atunci datele sunt foarte omogene Dac 10% < CV < 20% datele sunt omogene Dac CV > 20% atunci datele nu sunt omogene, deci nu se comport unitar n raport cu caracteristica studiat i, n acest caz, fie refacem testarea pentru alt grup, fie msurm o alt caracteristic ce ar putea caracteriza grupul. Exemplul 64 Pe un lot de studeni n sesiune s-a msurat anxietatea voalat dimineaa i seara. n urma centralizrii datelor s-a obinut urmtorul tabel.
dimineaa 21 16 15 24 16 12 23 15 16 18 24 21 13 88 seara 20 17 16 22 18 18 23 16 17 19 26 20 15

medie abt std CV

23 16 14 14 12 19 15 17.35 4.003617 23.1%

22 17 16 15 14 18 16 18.25 3.09286 16.9%

Analiznd rezultatele obinute la coeficientul de variabilitate, observm c datele obinute dimineaa pentru anxietatea voalat nu sunt omogene (CV > 20%). Deci subiecii, din acest punct de vedere sunt destul de variai. ns seara datele devin omogene (CV < 20%), ceea ce arat c, din punct de vedere al anxietii, subiecii ajung s reacioneze la fel. Deci am putea concluziona c, n sesiune, seara, anxietatea voalat caracterizeaz grupul studiat. n cele prezentate n acest capitol referirile erau fcute relativ la un grup de subieci. Problema care se pune, n cazul acestor analize, este s determinm dac concluziile obinute asupra acestui grup se transfer i asupra populaiei din care face parte grupul. Concluziile la care am putea ajunge, privitor la anxietatea grupului de studeni, ar mai fi valabile dac am avea mai muli studeni? Dar dac ne intereseaz s vedem gradul de anxietate al studenilor i s comparm rezultatele obinute dimineaa cu cele obinute seara? Concret, n acest caz, avem dou grupuri de studeni un prim grup format din reacia studenilor dimineaa i un al doilea grup format din reacia studenilor seara. Pentru a compara aceste dou grupuri, indicatorii prezentai pn acum nu sunt suficieni. Ceea ce ne va ajuta, n acest gen de analize, sunt testele statistice.

89

Observaii. n cele ce urmeaz se va nelege prin analiza a dou grupuri urmtoarele: 1. un grup s fie populaia, iar al doilea grup s fie un eantion. n aceast situaie, ceea ce ne intereseaz este dac eantionul face parte din acea populaie. 2. un grup s fie un eantion, iar al doilea grup un alt eantion. n aceast situaie, ceea ce ne intereseaz este dac cele dou eantioane fac parte din aceeai populaie. Faptul c un eantion face parte dintr-o populaie sau c dou eantioane sunt din aceeai populaie reprezint ipoteza de plecare n folosirea testului. Generaliznd, putem spune c avem o ipotez nul, de obicei aceasta se noteaz cu H0, n care se presupune c ntre cele dou grupuri nu avem diferene semnificative. Atunci cnd H0 nu este ndeplinit spunem c s-a realizat ipoteza alternativ, notat cu Ha (eantionul nu face parte din populaie sau cele dou eantioane nu fac parte din aceeai populaie). Bineneles atunci cnd se emite o ipotez trebuie s tim la ce ne ateptm dac ea se verific. Dei pare un lucru evident am inut totui s scriu aceast regul deoarece adeseori studenii, n emiterea ipotezelor, nu in cont de aceast regul. Pentru a nelege mai bine aceasta dm exemplul de mai jos: Exemplul 65 La susinerea unui proiect un student i alege urmtoarea tem: Influena vrstei asupra anxietii pre i postoperatorii. i-a ales cele dou loturi i a observat c aceast diferen se manifest la brbai nainte de operaie n funcie de vrst. Cnd i s-a pus ntrebarea ce nseamn aceast diferen, studentul nu a tiut ce s rspund. Un alt concept ce ne intereseaz atunci cnd dorim s utilizm un test este nivelul de semnificaie. Acesta ne arat care este probabilitatea de la care evenimentul (fenomenul) poate fi considerat imposibil. n general apar urmtoarele valori: = 0,05 (sau 5%) = 0,01 (sau 1%) = 0,001 (sau 0,1%)
90

Altfel spus, de exemplu = 0,05 semnific faptul c maxim 5 cazuri din 100 pot s nu respecte H0, pentru a considera totui c H0 este valabil pentru lotul de 100 de subieci. Nivelul de semnificaie este stabilit de utilizator n funcie de precizia pe care o dorete pentru fenomenul studiat. 3.9. Compararea mediilor Exemplul 66 Un student i propune s studieze dac din punct de vedere al ateniei involuntare exist diferene ntre fetele i bieii dintr-o clas a patra. Ce ar trebui s fac pentru aceasta? Exemplul 67 Se poate aplica un test de comparare a mediilor la prelucrarea unui chestionar? Unul dintre matematicienii care s-a ocupat de problema comparrii statistice a mediilor este William Sealy Gosset, cunoscut i sub numele de Student. Patronul fabricii de bere Guiness din Dublin, Claude Guiness avea ca politic a firmei sale angajarea a celor mai buni absolveni de la Universitile din Oxford i Cambridge pentru a aplica n procesele industriale de la Guiness noiuni de biochimie i statistic. W.Gosset a publicat prima lucrare despre testul t n revista Biometrica n 1908 sub pseudonimul Student deoarece n contractul semnat cu fabrica de bere era stipulat c metodele statistice sunt secret de serviciu. De aceea, identitatea lui Student nu a fost dezvluit mult vreme pentru a nu fi acuzat de nclcarea clauzelor contractuale. 3.9.1. Compararea mediei unui grup cu o valoare dat n cele ce urmeaz, prin grade de libertate se va nelege valoarea dat de numrul de subieci minus doi. De exemplu, dac aplicm un test de comparare a mediilor ntre dou loturi, un lot de 15 subieci i un al doilea lot de 19 subieci atunci gradele de libertate vor avea date de 15+19-2 = 32.
91

Atunci cnd se aplic un test se obine o valoare calculat care se compar cu o valoare tabelar. Valoarea tabelar depinde de nivelul de semnificaie pe care l alegem i de gradele de libertate. Uneori, n practic, avem nevoie s comparm media obinut prin calcul cu o valoare dat. Concret, ceea ce se poate lua ca ipotez n aceast situaie este dac ntre media grupului i media unei populaii, ce are ca medie valoarea dat, exist diferene. Exemplul 68 ntr-o coal s-a dat un test la 30 de elevi. Media clasei a fost 7,30. tiind c la nivelul capitalei media obinut a fost 7,20 se pune problema dac media clasei studiate este semnificativ mai mare dect media notelor obinute la nivelul capitalei. Notm cu m media grupului, cu n numrul de subieci din grup, cu v valoarea dat i cu s abaterea medie ptratic a grupului. Atunci valoarea calculat z va fi dat de formula:

z=

mv s n

(8)

Aceast valoare se va compara cu valoarea tabelar i dac z < ztab atunci ipoteza nul este acceptat, adic se poate presupune ca m = v (media grupului este egal cu media populaiei). 3.9.2. Testarea ipotezei privind diferena dintre mediile a dou grupuri cu numr redus de subieci Pentru a testa ipoteza privind diferena dintre mediile a dou grupuri de volum redus pornim de la presupunerile c avem urmtoarele condiii ndeplinite: cele dou grupuri provin din populaii normal distribuite dispersiile corespunztoare celor dou grupuri sunt egale selecia elementelor unui grup s-a realizat independent de selecia celuilalt grup.
92

n aceste condiii, enumerate mai sus, se realizeaz, mai nti, o aproximare a dispersiei conform urmtoarei formule:
2 ( n1 1 ) 2 s12 + ( n2 1 )s 2 s = n1 + n2 2 2 c

(9)

n aceast situaie, vom avea ipoteza H0: diferena ntre medii este zero. Pentru a verifica aceast ipotez vom calcula:

t calc =

m1 m2 1 1 s c2 + n n 2 1

(10)

Analog cu procedeul de la seciunea 3.9.1., i aici avem o valoare tabelar, ttabel, care se gsete n tabele statistice i depinde de nivelul de semnificaie ales de utilizator i de gradele de libertate. Dac tcalc < ttabel atunci este acceptat ipoteza, adic diferenele dintre cele dou medii sunt nesemnificative. Exemplul 69 n urma aplicrii testului Guilford de abiliti ale gndirii divergente (flexibilitatea) la un liceu s-au obinut urmtoarele rezultate:
Biei 5 11 11 5 7 6 13 6 8 16 7 6 7 5 11 7 7 7 8 12 12 10 11 7 8 5 12 7 11 5 7 5 8 10 14 7 Fete 6 5 8 6 3 6 8 6 7 16 12 6 93 14 7 7 9 9

Calculnd mediile, obinem la biei valoarea 8,54, iar la fete valoarea 8,07. Problema care ne-o punem este dac diferena de 0,47 este semnificativ. Calculm valoarea tcalc i obinem tcalc = 0,117. Din tabel obinem pentru un nivel de semnificaie de 0,05 o valoare ttabel = 2,007. Cum ttabel > tcalc nseamn c ipoteza nul este acceptat, adic nu avem diferene semnificative ntre fete i biei din punct de vedere al flexibilitii. Adic flexibilitatea la vrsta de 17 ani n liceul studiat nu depinde de sexul subiecilor. 3.10. Testul 2 Exemple unde se poate folosi acest gen de test: Exemplul 70 n anul 2000, cercettorii de la National Opinion Research Center (NORC), de la Universitatea din Chicago au realizat un sondaj pe un eantion de 1768 de persoane (994 femei i 774 brbai). Una din ntrebri s-a referit la faptul dac respondenii sunt de acord cu avortul sau nu (indiferent de motiv). n urma centralizrii rezultatelor s-au obinut urmtoarele rezultate:
De acord Nu sunt de acord Masculin 309 465 Feminin 396 598

Putem spune c diferenele ntre cele dou loturi sunt nesemnificative sau putem afirma c femeile sunt ntr-o mai mare msur mpotriva avortului (indiferent de motiv)?

94

Exemplul 71 85 La 31 martie 2003 la nivelul rii 13,60% din persoanele cu handicap erau copii n timp ce persoane adulte cu handicap erau 86,4%. n aceeai perioad n Municipiul Bucureti erau nregistrai 3427 de copii cu handicap i 29.833 de aduli. Difer situaia din Bucureti de cea la nivelul ntregii ri? S presupunem c dorim s facem observaii asupra unor categorii. De exemplu, ntr-un liceu dorim s observm modul n care elevii de clasa a 9-a se acomodeaz cu cerinele liceului. S presupunem c avem: prima categorie cei care s-au acomodat, a doua cei care au un nivel mediu de acomodare i a treia categorie cei care nu s-au acomodat. n urma unor observaii din anii anteriori avem urmtoarele frecvene: la prima categorie avem m1 elevi, la a doua categorie avem m2 elevi, la a treia categorie avem m3 elevi. Problema pe care ne-o punem este dac ntr-un anumit liceu avem cam aceeai distribuie a frecvenelor. Dac vom nota cu x1, x2 i x3 diferenele aprute fa de ceea ce se tia din anii anteriori atunci vom spune c la prima categorie am obinut m1+x1, la a doua categorie am obinut m2 + x2 i la a treia categorie am obinut m3 + x3. Vom spune atunci c diferenele ntre cele dou distribuii vor fi mai mici cu ct valorile xi sunt mai mici. R.A. Fisher, n lucrarea sa Statistical methods for research workers, noteaz cu 2 urmtorul numr

x2 = Sum m
2

2 2 x12 x 2 x3 = m + m + m + ... 1 2 3

(11)

Se observ c exist o interdependen ntre diminuarea lui x i diminuarea lui 2 (cu ct x este mai mic cu att 2 este mai mic). Deci, putem afirma: cu ct 2 este mai mic cu att distribuiile vor fi mai apropiate. Analog cu testul de comparaie a mediilor i aici avem o ipotez nul: H0 : distribuiile frecvenelor nu difer i o ipotez alternativ: Ha: distribuiile frecvenelor difer semnificativ
85

Sursa: Anuarul Statistic ediia martie 2003. 95

Aceste ipoteze le vom verifica folosindu-ne de valoarea lui 2. n cele de mai sus am prezentat intuitiv modul de calcul al valorii
2 2 calc , valoare pe care o vom compara cu o valoare tabelar, tabel ,

care depinde de nivelul de semnificaie ales i gradele de libertate. n acest caz, gradele de libertate sunt date de: (numrul de categorii 1) x (numrul de loturi observate 1). Deci: dac calc < tabel spunem c se accept ipoteza nul (nu avem diferene semnificative ntre
2 2

loturile comparate), iar dac calc > tabel atunci ipoteza nul este respins i se accept ipoteza alternativ (avem diferene semnificative ntre loturile comparate). Exemplul 72 La un sondaj realizat n 2004 pe un eantion de 1500, printre altele, s-au adresat urmtoarele ntrebri cu variantele de rspuns: 1. Ct ncredere avei n Biseric? a. Foarte mult b. Mult c. Puin d. Foarte puin e. Deloc 2. Ct ncredere avei n armat? a. Foarte mult b. Mult c. Puin d. Foarte puin e. Deloc n urma centralizrii rezultatelor s-a obinut urmtorul tabel:
2 2

Biserica Armata 96

F. mult 626 377

Mult 525 694

Puin 201 289

F. puin 58 54

Deloc 90 86

total 1500 1500

de
2

Calculnd obinem: calc = 232,89. Lund ca nivel semnificaie 5% i gradele de libertate


2 2 calc

2 (5-1)* (2-1) = 4, obinem tabel = 9,49. Deoarece

> tabel se respinge ipoteza nul i se accept ipoteza alternativ, adic avem diferene semnificative ntre cele dou distribuii. Observaii: La aplicarea testului 2 vom lucra cu frecvene absolute, nu frecvene relative (nu procente). Dac dorim s comparm distribuiile a dou eantioane putem considera distribuia unuia ca fiind distribuie teoretic, iar a celuilalt distribuie experimental. 3.11. Coeficientul de corelaie Exemplul 73 La aplicarea testului pentru identificarea trsturilor accentuate pe un lot de 18 de subieci dependeni de heroin s-au obinut urmtoarele rezultate:
C. M. . P. G. C. Ghe. C E. E P. A. S. I. R. S. C. D. I. M. V. F. B. C. B. M. D. S. C. B. .B. C.A.L. S.D. B.M.C. Dem I 83.00 16.60 33.20 24.90 8.30 41.50 49.80 74.70 16.00 24.90 8.30 91.30 33.20 8.30 16.60 33.20 33.20 24.90 Ex VIII 75.00 75.00 50.00 75.00 50.00 100.00 50.00 75.00 25.00 75.00 100.00 75.00 25.00 25.00 50.00 97

Aa cum se poate observa din tabel pe coloana n care s-a msurat exaltarea sunt nite date lips. Exist vreo posibilitate de a putea estima aceste date? Exemplul 74 Un student a venit cu tabelul de mai jos i m-a rugat s-l ajut s interpreteze valoarea coeficientului de corelaie pentru cele dou iruri a crui valoare calculat este de -0,38.
Atenia voluntar III A 7 10 10 10 10 5 10 10 10 10 10 10 10 10 9 9 10 10 10 5 Atenia voluntar III B 10 10 5 9 2 10 4 9 5 5 10 5 10 10 10 10 10 10 10 10

De ce lucrul pe care-l cere acest student nu se poate realiza?

98

Exemplul 75 La un proiect un student are urmtoarele ipoteze de lucru : cu ct oamenii sunt mai extrovertii, cu att asertivitatea lor este mai mare. cu ct personalitatea de TIP A predomin fa de cea de TIP B, cu att nivelul stresului este mai mare. dac simptomele psihologice ale stresului sunt mai nsemnate, atunci nivelul stresului este crescut. Poate folosi corelaia pentru a studia aceste trei ipoteze ? Atunci cnd pe un lot de subieci studiem mai multe variabile se pune problema evalurii relaiei dintre aceste variabile, chiar dac nu presupunem c ar putea exista o dependen ntre aceste variabile. Problema corelaiei a fost analizat de Galton n urma unui studiu realizat asupra ereditii caracterelor, studiu aprut la mijlocul secolului al XIX-lea. O alt lucrare important n cercetarea corelaiei o reprezint studiul realizat de Pearson i Lee, studiu n care au calculat corelaii dintre statur, mrimea palmei i lungimea antebraului. Acest studiu a fost realizat pe un grup de 1401 de familii engleze. Exemplu 76 (Pearson i Lee modificat) S-a msurat pe un lot de 10 familii statura frailor i surorilor n inci. Dup transformarea n cm se obine urmtorul tabel:
Nr familiei 1 2 3 4 5 6 7 8 9 10 Sora 175 163 165 160 165 157 165 163 168 150 Frate 180 173 168 170 178 180 178 185 183 165

n urma calculelor s-a obinut un coeficient de corelaie r = 0,56


99

Ca i la teste, i n cazul coeficientului de corelaie se pune problema de a determina semnificabilitatea. Pentru aceasta lum ca ipotez H0 : variabilele sunt independente, iar ca ipotez alternativ Ha: variabilele sunt dependente. Pentru a verifica H0 trebuie s vedem dac coeficientul de corelaie este 0. Pentru aceasta se calculeaz valoarea tcalc: r n2 t calc = (12) 1 r2 Aceast valoare se compar cu valoarea ttab de la testul Student pentru n-2 grade de libertate. La fel ca la comparaia mediilor vom avea: dac tcalc < ttab atunci diferenele sunt nesemnificative, deci putem spune c nu avem corelaie semnificativ ntre cele dou variabile dac tcalc > ttab atunci diferenele sunt semnificative, deci putem spune c este semnificativ corelaia obinut. Observaie. Avnd n vedere c pentru calculul semnificabilitii corelaiei ttab depinde de numrul de subieci, putem observa c o valoare a corelaiei poate fi semnificativ pentru un numr de subieci, dar nesemnificativ pentru un numr mai mic de subieci. Dac n cazul testelor prezentate anterior finalitatea este destul de clar, n cazul coeficientului de corelaie lucrurile nu mai sunt la fel de clare. La ce folosete acest coeficient de corelaie? Pentru a ne apropia de rspunsul la aceast ntrebare amintim cele spuse de R.A. Fisher despre coeficientul de corelaie: n munca experimental locul lui este mai puin central; s-a dovedit a fi util n stadiul explorator al unei cercetri, ca de exemplu cnd doi factori care se presupunea a fi independeni par a fi asociai n apariia lor; dar rareori, n condiii experimentale controlate se dorete ca s exprimm concluziile sub forma unui coeficient de corelaie86. Am dat acest citat pentru a arta grija cu care recomand Fisher folosirea acestui coeficient. Tocmai pentru c este relativ uor de folosit (mai ales atunci cnd folosim un computer pentru prelucrarea datelor) i foarte puternic n a da explicaii unor rezultate la care nu se vede rezultatul imediat, recomandm i noi
86

n lucrarea Statistical methods for research workers, cap. VI.

100

folosirea lui doar ntr-o faz incipient a cercetrii i pentru eventuale validri a unor concluzii la care s-a ajuns folosind i alte instrumente. Una din greelile frecvente ce apar n interpretarea coeficientului de corelaie este ca atunci cnd s-au gsit dou variabile ce se coreleaz s se pun imediat o relaie ntre ele de tip cauz efect. Pentru a nelege cele expuse mai sus vom da un exemplu: Exemplul 77 n perioada 1928-1934 s-a realizat un studiu n care s-au msurat n fiecare an numrul celor internai la spitalele psihiatrice i numrul celor care au cumprat aparate de radio. S-a observat c ntre cele dou variabile exista o corelaie foarte bun de 0,94. n mod evident ns nu este vorba de o relaie de cauz efect ntre cele dou fenomene, ba chiar mai mult, nici mcar nu se poate afirma c ntre cele dou variabile exist o legtur real. Normal, la vremea respectiv aparatul de radio era un lucru nou i bineneles c numrul de cumprtori s creasc, ct despre numrul crescut al celor care au fost internai n spitalele de psihiatrie mai degrab situaia politico-economic a acelor vremuri s fie cauza real a creterii numrului de pacieni ai spitalelor de psihiatrie. Deci am vzut cum nu trebuie folosit coeficientul de corelaie. Dar ntrebarea pus iniial devine: De ce e nevoie de acest coeficient care nu ajut la gsirea unor motivaii i care, n plus, poate duce i la erori privind dependena aparent a dou variabile? Pentru a rspunde la aceast ntrebare ne vom referi la regresia liniar. 3.12. Regresia liniar Dac ntr-o populaie avem dou variabile despre care tim c au o corelaie semnificativ, atunci: cnd creterea uneia implic creterea celeilalte avem corelaie pozitiv cnd creterea unei variabile implic descreterea celeilalte variabile avem corelaie negativ.
101

n oricare din aceste cazuri semnificaia acestui fenomen statistic este c putem exprima o variabil n funcie de cealalt, adic faptul c ar exista o funcie care poate exprima valoarea unei variabile n funcie de cealalt variabil. Din aceast cauz a aprut confuzia legat de ideea de relaie de tip cauz-efect ntre variabilele corelate. n fapt, este vorba c exist o variabil uor observabil i n funcie de aceasta putem calcula o alt variabil mai greu observabil. Funcia aceasta se numete regresie. Dac funcia este de forma unei funcii de gradul nti, atunci vom spune c regresia este liniar. Exemplul 78 Pe un grup de 20 de elevi s-a studiat corelaia dintre memoria auditiv i mediile obinute pe semestrul 1. n urma centralizrii datelor s-au obinut urmtoarele rezultate:
S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11 S12 S13 S14 S15 S16 S17 S18 S19 S20 S21 S22 S23 S24 S25 102 Memoria auditiv 30 25 10 20 70 20 50 50 20 0 50 30 50 75 0 10 10 10 20 10 Note 6,25 9,10 5,42 7,11 9,15 5,10 8,16 6,41 5,30 5,32 6,33 9,15 7,55 8,16 9,85 8,65 4,65 6,35 5,45 7,56 5,12 8,14 8,15 4,20 6,48

Se observ c 5 elevi nu au rspuns la testul pentru memoria auditiv. ntruct coeficientul de corelaie obinut pentru 20 de elevi este 0,638 i este semnificativ, putem calcula o funcie de regresie cu ajutorul creia s putem estima scorurile la memoria auditiv pe baza mediilor i pentru elevii care au lipsit atunci cnd a fost aplicat acest test. n exemplul de mai sus, variabila mai uor observabil este variabila note87 i, de aceea, o putem numi variabil independent, n timp ce variabila cu scorurile obinute de elevi la testul de memorie auditiv, necesit aplicarea unui test i o putem mult mai uor obine prin estimarea cu ajutorul funciei de regresie. De aceea, putem numi variabila scoruri test memorie auditiv, variabil dependent. ns locul acestor variabile se poate schimba. tiind c exist o corelaie semnificativ ntre notele obinute de elevi i scorurile la testul de memorie auditiv, putem aplica acest test la nceputul unui semestru i putem estima pe baza lui care ar fi elevii predispui s aib rezultate colare slabe. n acest al doilea caz, variabila scoruri obinute la testul de memorie auditiv devine variabil independent i variabila note devine variabila dependent. Cu ajutorul acestui exemplu am dorit de asemenea s artm i de ce nu este ntotdeauna corect s se analizeze o corelaie ca un indicator al unui fenomen de tip cauz-efect. Un alt rol al corelaiei este i de a putea elimina anumite variabile. S presupunem c ntr-un fenomen studiat intervin mai multe variabile. n statistic este tiut c un numr mai mare de msurtori nseamn, n primul rnd, pericolul de a avea erori mari de calcul88. Dac dou variabile A i B au o corelaie semnificativ, atunci cnd analizm fenomenul respectiv, putem elimina una din ele. De obicei, se elimin variabila care se msoar mai greu. S presupunem c am eliminat variabila B atunci influena acestei
Deoarece aflm rezultatele din consultarea mediilor din catalogul de note, deci interaciunea cu elevii este practic zero. 88 Pe de alt parte un numr mai mare de msurtori efectuate nseamn i cheltuieli mai mari (att din punct de vedere financiar, ct i ca timp). 103
87

variabile n fenomen nu este eliminat, ci apare indirect prin intermediul variabilei A. 3.13. Rezolvarea exerciiilor de la nceputul fiecrei seciuni din capitolul 3 n capitolul 3 la nceputul fiecrei seciuni am pus nite probleme cu trimitere la ceea ce urmeaz s se discute n acea seciune. n continuare vom prezenta rspunsurile la problemele puse. Desigur, n cadrul discuiilor de la seminar se pot gsi i alte soluii la problemele date. 3.13.1. Caracteristici (variabile) Exemplul 34 (rezolvare) Pentru proiectul de diplom un student i-a ales tema: Complexul de inferioritate la adolesceni. Ce ar trebui s cerceteze studentul n cadrul acestui proiect? Deoarece complexul de inferioritate se manifest pregnant prin valene ridicate ale anxietii i depresiei, cercetarea ar putea porni de la aceste dou variabile Exemplul 35 (rezolvare) La dou clase a V-a din aceeai coal, existau performane colare semnificativ diferite, una din clase avnd rezultate foarte bune, n timp ce la cealalt clas, dei aveau cam aceeai profesori, problema principal a elevilor era s nu rmn corigeni. Pe ce ar trebui s se axeze un eventual studiu de determinare a cauzelor diferenelor ntre performanele colare ale elevilor? Desigur, putem avea multe puncte de pornire. O soluie ar fi s se ia variabile diferite tipuri de atenie: atenia concentrat, atenia vizual etc.
104

3.13.2. Populaie Exemplul 39 (rezolvare) Pentru realizarea unui sondaj privitor la alegerile locale dintr-un anumit ora, din cine se compune mulimea pe care o studiem? Dar dac sondajul s-ar referi la alegerile generale? n primul caz, populaia va fi alctuit din locuitorii din acel ora cu drept de vot (practic, ns se vor lua locuitorii care au peste 18 ani). n cazul alegerilor locale populaia se va compune din cetenii cu drept de vot din toat ara. Ca observaie s-ar putea include i cetenii care au 17 ani, dac alegerile ar avea loc peste un an.

3.13.3. Eantion. Lot


Exemplul 42 (rezolvare) O firm dorete s lanseze ntr-un anumit ora un produs i ar dori s afle prerea populaiei din acel ora referitor la produs. Cel mai sigur ar fi s ntrebe pe toi locuitorii din ora, dar costurile, i ca timp i financiare, ar fi destul de ridicate. Care ar fi soluia pentru a reduce costurile? n acest caz, rspunsul este evident: este vorba de a realiza un eantion reprezentativ. 3.13.4. Eveniment Exemplul 45 (rezolvare) Un operator trebuie s aplice un chestionar pe teren persoanelor peste 40 de ani de sex masculin. Avnd multe refuzuri, fiind destul de obosit, s-a dus acas unde a rugat nite prieteni s-l ajute completeze chestionarele. Cum s-a modificat evenimentul?
105

Evenimentul iniial se baza pe faptul c cei chestionai aveau vrsta de peste 40 de ani. n condiiile n care cei care completeaz nu ndeplinesc aceast condiie, deja avem un alt eveniment ale crui rezultate nu vor reflecta datele evenimentului cerut. n plus, mai apare influena indirect a operatorului, dat de faptul c cei care completau fceau parte dintr-o mulime restrns, cea a celor care erau prieteni cu operatorul. Exemplul 46 (rezolvare) Un student avea ca tem studiul ateniei concentrate la elevii de clasa a 3-a. n urma centralizrii datelor a venit la profesorul ndrumtor cu urmtorul tabel:
Subieci B.B. T.E. C.A. R.I. S.E. S.P. P.V. L.I. B.D. T.C. B.A. A.B. P.F. B.D. R.C. I.V. C.A. S.S. P.A. N.R. 106 Atenia concentrat 70 90 90 100 90 90 90 90 70 90 90 100 90 60 100 80 100 90 100 90 Vrsta 9 ani 9 ani 9 ani 10 ani 9 ani 10 ani 9 ani 9 ani 10 ani 9 ani 9 ani 7 ani 10 ani 9 ani 9 ani 9 ani 8 ani 13 ani 9 ani 9 ani

n urma examinrii acestui tabel, profesorul i spune c trebuie s verifice datele i c tabelul nu e complet, deci proiectul nu poate fi notat. O prim problem este dat de faptul c atenia concentrat are dou componente: calitativ i cantitativ, i din tabel nu reiese la care din acestea dou s-a referit studentul cnd a realizat tabelul. Apoi, n lotul cu care lucreaz apar cel puin dou cazuri ciudate: un elev de 7 ani i unul de 13 ani. Dar s-ar putea ca aceast ultim eroare s fie doar o eroare de tastare. Un factor care nu influeneaz major experimentul este faptul c studentul nu are n coloana a treia numere, ceea ce i va ngreuna calculele n cazul n care ar dori s studieze dac exist vreo legtur ntre vrsta elevilor i scorurile obinute la atenie. 3.13.5. Media Exemplul 50 (rezolvare) n urma aplicrii unui test de memorie pe un lot de copii s-au obinut urmtoarele rezultate:
Memoria vizual 5 3 2 4 2 2 4 5 6 1 3 Memoria auditiv 6 4 5 6 2 3 5 3 8 2 4 107

LM VA MA TC SA TS BR FI DC CR LL

Care sunt valorile pentru care am putea spune c un copil are memorie vizual bun, n raport cu grupul studiat? Dar memorie auditiv? Cea mai simpl metod de a afla care copii au memorie vizual bun este de a calcula media pentru acest lot. n urma calculelor obinem valoarea mediei de 3,27 pentru memoria vizual i 4,36 pentru memoria auditiv. De exemplu, despre subiectul FI putem spune c are memorie vizual bun, dar memorie auditiv slab, n timp ce despre subiectul MA putem spune c are memorie vizual slab, dar memorie auditiv bun. Acest gen de analiz este util atunci cnd dorim s monitorizm un subiect n raport cu grupul din care face parte. Exemplul 51 (rezolvare) ntr-o lucrare cu titlul Legtura dintre mame i copii de 6 ani, studentul, la prezentarea lotului pe care a fcut-o n acest studiu, a calculat media vrstelor componenilor lotului studiat. Este corect sau nu? Aceasta este una din greelile clasice pe care am putea-o denumi s facem ceva statistic la cercetare. Media vrstelor mamelor ar putea avea o relevan, media copiilor ar trebui s fie foarte aproape de 6 ani, n schimb media obinut, punnd la un loc vrstele copiilor i ale mamelor, s zicem c ar fi 18, nu arat absolut nimic, ci reprezint doar un numr ntre vrsta copiilor i vrsta mamelor, numr fr nicio relevan.

108

3.13.6. Mediana Exemplul 54 (rezolvare) Studenii dintr-o grup au vrut s-i aleag un ef de grup. Pentru c nu au ajuns la un consens, au rugat un profesor s-i ajute n aceast problem. n urma discuiilor avute cu studenii profesorul a determinat 3 candidai pentru aceasta funcie. Apoi a pus pe fiecare student s acorde punctaje ntre 1 i 5 celor 3 candidai. S-au obinut urmtoarele date:
S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11 S12 S13 S14 S15 S16 S17 S18 S19 S20 S21 S22 media mediana S10 1 2 1 2 5 1 5 2 2 5 5 5 2 5 5 2 5 5 2 5 2 3.29 2 S15 3 3 3 4 3 4 3 4 3 1 3 3 4 3 4 3 3 3 3 4 3 3.19 3 S22 5 5 5 5 2 3 2 1 2 2 2 1 2 5 5 2 2 5 2 5 5

3.24 2 109

Cine credei c este mai indicat s fie ales ef al grupei? Se observ c ntre medii diferenele sunt foarte mici. Desigur s-ar putea alege ca ef de grup s10 pentru c ar avea media cea mai mare 89. Mediana, fiind indicatorul prerii subiective a grupului, constituie un reper mult mai bun. Deci, avnd n vedere c s15 are pentru median valoarea cea mai mare, profesorul o s recomande ca ef de grup pe s15.

3.13.7. Indicatori ai dispersiei Exemplul 59 (rezolvare) Un student a realizat un studiu pe elevii dintr-o coal. Pentru a putea trage o concluzie asupra comportamentului copiilor n lotul studiat a luat elevii din clasele a 2-a, a 5-a i a 8-a. De ce ndrumtorul i-a spus s-i modifice modul de alctuire al lotului? n fapt este vorba de o problem ce apare din cauza modului incorect de folosire al variabilei. n general, o variabil este studiat pe un anumit lot dac exist posibilitatea ca ea s caracterizeze, ntr-un fel, acel lot. Deci, odat culese datele, se va obine o mprtiere foarte mare a datelor. n acest caz se poate realiza un studiu comparativ ntre elevii celor trei ani de studiu.

Aa cum ns se observ din seciunea cu testele de comparare a mediilor diferena ntre medii este nesemnificativ. 110

89

3.13.8. Compararea mediilor Exemplul 66 (rezolvare) Un student i propune s studieze dac din punct de vedere al ateniei involuntare exist diferene ntre fetele i bieii dintr-o clas a patra. Ce ar trebui s fac pentru aceasta? Pentru a studia acest lucru studentul trebuie s alctuiasc dou loturi de subieci: unul cu fetele de clasa a patra i altul cu bieii de clasa a patra. Pentru a elimina orice ali factori de influen, trebuie s ia eleve i elevi din aceeai clas (ca s aib aceeai nvtoare). Exemplul 67 (rezolvare) Se poate aplica un test de comparare a mediilor la prelucrarea unui chestionar? n general, nu se poate aplica un test de comparare a mediilor la un chestionar. Dar exist posibilitatea unei ntrebri n care se cere subiecilor s dea note pentru a-i exprima opiunea. n acest caz, ntrebarea se interpreteaz prin calculul mediei. Deci, se poate folosi, n acest caz, testul de comparare a mediilor. 3.13.9. Testul 2 Exemplul 70 (rezolvare) n anul 2000, cercettorii de la National Opinion Research Center (NORC), de la Universitatea din Chicago au realizat un sondaj pe un eantion de 1768 de persoane (994 femei i 774 brbai). Una din ntrebri s-a referit la faptul dac respondenii sunt de acord cu avortul sau nu (indiferent de motiv). n urma centralizrii rezultatelor s-au obinut urmtoarele rezultate:
111

De acord Nu sunt de acord

Masculin 309 465

Feminin 396 598

Putem spune c diferenele ntre cele dou loturi sunt nesemnificative sau putem afirma ca femeile sunt ntr-o mai mare msur mpotriva avortului (indiferent de motiv)? Dac facem o comparaie direct a datelor am putea crede c femeile sunt ntr-o msur mai mare mpotriva avortului. Dar dac exprimm datele n procente observm c diferenele sunt nesemnificative:
Masculin De acord Nu sunt de acord 39.9% 60.1% Feminin 39.8% 60.2%

O metod mai sigur de a vedea acestea este folosirea testului 2. Exemplu 71 (rezolvare) La 31 martie 2003 la nivelul rii 13,60% din persoanele cu handicap erau copii n timp ce persoane adulte cu handicap erau 86,4%. n aceeai perioad n Municipiul Bucureti erau nregistrai 3427 de copii cu handicap i 29.833 de aduli. Difer situaia din Bucureti de cea la nivelul ntregii ri?90 Pentru a compara distribuia de la nivelul Municipiului Bucureti cu distribuia pe ar vom transforma in frecvene absolute toate datele i vom obine urmtorul tabel:
n Romnia n Mun. Bucureti
90

Copii 3427 4523

Aduli 29833 28737

Total 33260 33260

Sursa: Anuarul Statistic ediia martie 2003. 90 Sursa: Anuarul Statistic ediia martie 2003

112

Aplicnd testul 2, se vede c avem diferene semnificative ntre distribuii. Deci am putea spune c la nivelul rii avem un procent mai mare de copii cu handicap dect n Bucureti, raportat la numrul total de persoane cu handicap. 3.13.10. Coeficientul de corelaie Exemplul 73 (rezolvare) La aplicarea testului pentru identificarea trsturilor accentuate pe un lot de 18 de subieci dependeni de heroin s-au obinut urmtoarele rezultate:
Dem C. M. . P. G. C. Ghe. C E. E P. A. S. I. R. S. C. D. I. M. V. F. B. C. B. M. D. S. C. B. .B. C.A.L. S.D. B.M.C. I 83.00 16.60 33.20 24.90 8.30 41.50 49.80 74.70 16.00 24.90 8.30 91.30 33.20 8.30 16.60 33.20 33.20 24.90 Ex VIII 75.00 75.00 50.00 75.00 50.00 100.00 50.00 75.00 25.00 75.00 100.00 75.00 25.00 25.00 50.00 113

Aa cum se poate observa din tabel pe coloana n care s-a msurat exaltarea sunt nite date lips. Exist vreo posibilitate de a putea estima aceste date? Acest exemplu este reluat la partea n care se prezint regresia liniar. Calculnd coeficientul de corelaie pentru datele complete, se observ c avem o corelaie semnificativ, ceea ce nseamn c putem realiza o estimare a datelor lips cu ajutorul regresiei liniare. Exemplul 74 Un student a venit cu tabelul de mai jos i m-a rugat s-l ajut s interpreteze valoarea coeficientului de corelaie pentru cele dou iruri a crui valoare calculat este de -0,38.
Atenia voluntar III A 7 10 10 10 10 5 10 10 10 10 10 10 10 10 9 9 10 10 10 5 114 Atenia voluntar III B 10 10 5 9 2 10 4 9 5 5 10 5 10 10 10 10 10 10 10 10

De ce lucrul pe care-l cere acest student nu se poate realiza? Acesta este un exemplu de folosire defectuoas a coeficientului de corelaie. Prin definiie acest coeficient ne arat legtura dintre dou caracteristici ale aceluiai grup studiat. Ori, n acest caz, este vorba de aceeai caracteristic, aplicat pe dou grupuri diferite. Ceea ce se poate aplica este comparaia mediilor celor dou grupuri. Exemplul 76 La un proiect un student are urmtoarele ipoteze de lucru : cu ct oamenii sunt mai extrovertii, cu att asertivitatea lor este mai mare. cu ct personalitatea de TIP A predomin fa de cea de TIP B, cu att nivelul stresului este mai mare. dac simptomele psihologice ale stresului sunt mai nsemnate, atunci nivelul stresului este crescut. Poate folosi corelaia pentru a studia aceste trei ipoteze ? Ipotezele ce le putem verifica cu ajutorul coeficientului de corelaie sunt cele de forma cu ct ..., cu att. Deci primele dou ipoteze se verific cu ajutorul coeficientului de corelaie. Cea de-a treia ipotez nu este bine formulat deoarece enunul este confuz (mai nsemnate).

115

4. NOIUNI INTRODUCTIVE DESPRE GRAFURI I BAZE DE DATE

4.1. Grafuri Noiunea de categorie este legat de cea de graf i c, odat cu o colecie de obiecte, [trebuie] s fie considerate modalitile de interconectare a obiectelor respective91. De aceea, grafurile pot gsi o ilustrare n domeniul social, unde analizarea unui grup nu reprezint doar suma analizelor indivizilor din grup, ci i interaciunea dintre membrii grupului. Este un lucru ndeobte recunoscut c acelai grup poate reaciona ntr-un fel cnd are un lider i altfel cnd are alt lider. Sau, evident, ntr-un mod acioneaz cineva ca lider al unui grup i altfel ca simplu membru al grupului. n acest capitol ne propunem doar s deschidem o u ctre posibilitatea de a folosi grafurile att ca reprezentare a unor fenomene, ct i ca un posibil instrument n modelarea unor fenomene sociale. De aceea, ne vom limita la o prezentare intuitiv a unor noiuni legate de teoria grafurilor. 4.1.1. Scurt istoric n secolul al XVIII-lea oraul Konigsberg (Kalingrad astzi) era traversat de rul Pregel care mprea oraul n patru zone, acestea fiind unite prin 7 poduri. Schematic, harta oraului se poate reprezenta astfel:

91

Cf. [Stn], pg

116

91

Cf. [Stn].

ZONA 1 (A) ZONA 2 (B) ZONA 3 (C)

ZONA 4 (D)

Locuitorii oraului i-au pus problema dac, n plimbrile pe care le fceau duminic prin ora, este posibil ca pornind dintr-o parte a oraului s poat traversa toate podurile oraului fr a trece de dou ori pe acelai pod i s se ntoarc la punctul de plecare. Problema a fost prima oar rezolvat de matematicianul Leonard Euler. Figura de mai sus se poate pune i sub forma unui graf. Pentru aceasta vom nota zona 1 cu A, zona 2 cu B, zona 3 cu C i zona 4 cu D. Reprezentarea va fi:

Relaiile dintre oameni reprezenta cu ajutorul grafurilor.

le

putem

4.1.1. Definiia unui graf Un graf este o structur compus din noduri92 i arce93. Grafurile se pot mpri n urmtoarele dou categorii: - grafuri neorientate - grafuri orientate
92 93

n unele manuale se folosete denumirea de vrfuri. Sau muchii 117

Diferena dintre cele dou tipuri de grafice, constnd n faptul c, n timp ce la grafurile neorientate aveam doar noduri unite prin
92 93

n unele manuale se folosete denumirea de vrfuri. Sau muchii.

arce, fr a avea un sens de parcurgere ntre noduri, la grafurile orientate avem n plus i un sens de parcurgere ntre noduri. n exemplul prezentat n seciunea 4.1. avem un graf neorientat, unde A, B, C i D sunt noduri, iar liniile care unesc aceste noduri sunt arcele grafului. Exemplul 32 (continuare) Relum exemplul 32 din capitolul 2. Considernd subiecii ca fiind noduri i interaciunile dintre ei fiind arcele grafului, putem reprezenta relaiile dintre ei sub forma unui graf astfel:
S5 S2

S1 S4 S3

S8 S6

S7

S9

118

Se observ c avem, n fapt, dou grafuri i o prim concluzie ar fi c subiecii S1 i S3 nu interacioneaz n niciun mod cu restul grupului. Acest mod de reprezentare poate releva i alte aspecte ale relaiilor dintr-un grup dect reprezentarea clasic a unei sociograme. Tot la aceast problem putem avea i un alt gen de reprezentare n care facem o reprezentare prin grafuri pentru interaciunile pozitive ntre membrii grupului i o alt reprezentare pentru interaciunile negative n grupul studiat. 4.1.3. Clasificarea grafurilor O alt clasificare a grafurilor este dat de forma lor. Astfel, putem avea urmtoarele tipuri de grafuri: Grafuri simple grafuri n care ntre orice dou noduri avem un unic arc: A B

C ntre Ai C, A i B i B i C avem cte un singur arc Grafuri multiple grafuri n care ntre dou noduri putem avea mai multe arce

119

ntre nodurile A i C i nodurile A i B avem cte dou arce

4.1.4. Arbori O clas special de grafuri orientate sunt arborii. Un graf orientat se numete arbore dac avem un nod distinct numit rdcina arborelui, notat cu n0, astfel nct pentru orice nod din restul arborelui s avem un singur drum care s uneasc acel nod cu n0, nodul-rdcin. Fie urmtorul arbore:

f a n0 d g

De exemplu, de la nodul n0 la nodul g avem drumul: n0 a d g

120

Exemplul 79 Structura unei organizaii poate fi pus sub forma unui arbore:

Director (D)

Dir.adj 1 (d1)

Dir.adj 02 (d2)

Dir. economic (de)

A1

A2

A3

A4

A5

A6

A7

A8

Pornind de la acest exemplu putem stabili dou tipuri de organizaii: cele de tip arbore, n care ntre orice angajat i director exist un drum unic, aa cum se vede n figura de mai sus. cele de tip graf multiplu n care ntre angajat i director sunt mai multe drumuri ca-n figura de mai jos:

121

Director

Dir.adj 01

Dir.adj 02

Dir. economic

A1

A2

A3

A4

A5

A6

A7

A8

De exemplu, ntre director i angajatul A5 avem dou drumuri: director dir. adj. 02 A5 i director dir economic A5. 4.1.4. Proprieti ale grafurilor Spunem c o relaie este tranzitiv dac din faptul c A este n relaie cu B i B este n relaie cu C rezult c A este n relaie cu C. Aceasta se mai scrie astfel: A (rel)B, B (rel)C A (rel)C Exemplu 79 (continuare) S presupunem c directorul ia o decizie pe care o comunic directorului economic, deci D (rel)de. Apoi directorul economic spune angajatului A7 s se ocupe de ducerea la ndeplinire a deciziei directorului, deci de (rel)A7. n concluzie vom spune c decizia directorului a fost dus la ndeplinire de
122

angajatul A7, adic D (rel)A7. Un alt concept al teoriei grafurilor este cel de distan dintre dou noduri. Pentru nceput fie un graf simplu. Atunci numrul de arce dintre dou noduri l definim ca fiind distana dintre cele dou noduri. Trecnd la graful multiplu se pune problema cum definim distana dintre dou noduri, avnd n vedere c, n acest caz, ntre dou noduri am putea avea mai multe drumuri. Definim distana dintre dou noduri, notat cu d (x,y), ca fiind cel mai scurt drum ntre nodurile x i y. Deoarece cazul grafului simplu reprezint o particularizare a grafului multiplu putem generaliza definiia drumului pentru orice tip de graf. Exemplul 80 Fie structura unei organizaii de tip graf multiplu, ca-n partea a doua a exemplului 4.2. Atunci distana dintre director i A2 este egal cu 2 (d (D,A2) = 2). Dar distana dintre director i A1 este egal cu 1 pentru c, n aceast situaie, avem dou drumuri, unul format din dou arce i unul format dintr-un singur arc.
Director (D)

Dir.adj 01 (d1)

A1

Dac ntre dou noduri nu exist niciun arc, atunci distana dintre ele se va considera egal cu
123

infinit.

Exemplul 32 (continuare) n exemplul cu scrierea unei sociograme sub forma unui graf, se poate vedea c, de exemplu, distana dintre S5 i S9 este egal cu 4 n timp ce distana dintre S5 i S1 este . n cazul n care distana dintre dou noduri este infinit spunem c un nod este inabordabil pentru cellalt. n cazul de mai sus, vom spune c S1 este inabordabil pentru S5. 4.1.6. Alt posibilitate de studiu al relaiilor dintr-un grup de indivizi n continuare, vom studia anumite relaii dintr-un grup pornind de la conceptul matematic de relaie de echivalen. Pentru nceput s reamintim ce nseamn o relaie de echivalen: Spunem c rel este o relaie de echivalen peste o mulime M dac: a. A rel A pentru orice A din mulimea M (reflexivitatea) b. Dac A rel B atunci i B rel A pentru orice A i B din mulimea M (simetria) c. Dac A rel B i B rel C atunci A rel C (tranzitivitatea) Mulimea ntre ale crei elemente exist o relaie de echivalen se numete relaie de echivalen. n continuare analizm relaiile dintr-un grup n funcie de cei care execut sarcinile. Definim o relaie a unui grup astfel: spunem c A se afl n relaie cu B dac A ia o decizie i B o execut. Afirmm c legturile ntr-un grup sunt cu att mai puternice cu ct relaia definit mai sus este mai aproape de o relaie de echivalen.
124

Reflexivitatea: n acel grup fiecare are anumite sarcini de care rspunde personal, adic are de executat sarcini n care el ia decizia i tot el execut, adic A rel A Simetria: Dac pentru o parte din sarcini A rspunde i B trebuie s execute ceea ce a decis A, exist sarcini n care B decide i A execut. De exemplu, n execuia unui proiect mai mare, ntr-o anumit etap A poate fi specialistul, iar n alt etap B poate fi specialistul. Tranzitivitatea: A decide un anumit lucru, B i d seama c nu poate finaliza sarcina dat de A i deleag pe C s finalizeze. Deci, n continuare, la recomandarea lui B A va lua decizii, iar C le va executa. Desigur, toate acestea se petrec ntr-un caz ideal. Dar totui se pot gsi nite cuantificatori prin care se poate msura apropierea de o relaie de echivalen astfel definit. Bineneles c acesta e doar un exemplu i ar putea exista cuantificri mai bune a relaiilor dintr-un anumit grup. 4.1.7. Reprezentarea matriceal a unui graf Deoarece grafurile nu sunt doar un mod de reprezentare a unor relaii ntre anumii indivizi, ci ele pot reprezenta un instrument util n modelarea matematic i avnd vedere c astzi orice modelare nseamn i introducerea datelor pe calculator, se pune problema cum se pot scrie grafurile astfel nct s fie ct mai uor citite de un program pe calculator. Pentru o nelegere mai bun vom lua un exemplu: Fie un graf reprezentat ca mai jos:

125

n primul rnd vom realiza o numerotare a nodurilor. Atunci graful va deveni:

Atunci putem avea urmtorul tabel n care pe linie punem nodul de plecare i pe coloan punem nodul n care ajunge arcul. n csuele tabelului vom pune 1 dac avem un arc ntre noduri i 0 dac nu exist un arc ntre noduri. Astfel, n csua corespunztoare liniei a doua i coloana nti am pus valoarea 1 pentru c exist un arc de la nodul 2 la nodul 1. Folosind aceeai regul, n linia a 3-a i coloana a 4-a am pus valoarea 0 pentru c nu exist niciun arc direct ntre nodurile 3 i 4. n urma completrii obinem urmtorul tabel:
1 2 3 4 1 0 1 1 0 2 1 0 1 0 3 0 0 0 0 4 0 1 0 0

Dac eliminm acum prima linie i prima coloan, corespunztoare etichetelor, vom obine matricea asociat grafului:

126

0 1 1 0

1 0 0 0 0 1 1 0 0 0 0 0

Aceast matrice este uor de folosit pentru realizarea unui program pe calculator. 4.2. Baze de date Fie imediat dup culegerea de pe teren, fie ntre etapele de analiz, datele trebuie stocate, astfel nct s poat fi accesate ct mai uor. De aceea, a aprut ca o etap important a cercetrii stocarea datelor ntr-o baz de date. Ce este o baz de date? Putem da o definiie a bazei de date n funcie de facilitile pe care le ofer: Locul unde se pun datele astfel nct s le putem nregistra cu toate informaiile specifice disponibile, s le putem cuta, s le putem extrage dup anumite criterii cerute ntr-o anumit etap a cercetrii. O baz de date poate fi construit ca un tabel n care liniile se numesc nregistrri, iar coloanele se numesc cmpuri. Exemplul 81 Fie o baz de date cu o baterie de 3 teste aplicate la 10 subieci. Aceasta poate fi reprezentat ca un tabel astfel:
Subiect 1 Subiect 2 Subiect 3 Subiect 4 Subiect 5 Subiect 6 Subiect 7 Subiect 8 Subiect 9 Subiect 10 Test 1 12 11 14 15 16 17 12 10 11 15 Test 2 2 5 4 1 5 2 2 4 6 4 Test 3 1 1 4 1 1 2 1 2 1 1 127

n acest caz prin nregistrare se neleg toate informaiile disponibile despre un subiect. De exemplu, nregistrarea corespunztoare Subiectului 3 este
Subiect 3 14 4 4

Un cmp este dat de valorile corespunztoare unui test. De exemplu, avem cmpul Test 1:
Test 1 12 11 14 15 16 17 12 10 11 15

Bazele de date se pot clasifica n baze de date analitice i baze de date operaionale. Bazele de date analitice sunt bazele de date de tip static n care datele sunt sub forma unei liste. Problema const n cutarea n aceast baz de date care, n cazul unor baze de date foarte mari, poate deveni foarte anevoioas. Odat cu apariia computerelor a aprut un al doilea tip: bazele de date operaionale. Acest gen de baze de date permite ceva mai mult dect o simpl vizualizare a datelor. Putem realiza o serie de operaii, cum ar fi: adugarea de nregistrri, modificarea nregistrrilor, sortarea dup un anumit criteriu, tergerea de nregistrri. Dintre soft-urile n care se pot crea baze de date operaionale amintim: Excel, Microsoft Acces, SPSS.
128

5. UTILIZAREA EXCEL I SPSS N STATISTIC

n acest capitol ne-am propus s facem o prezentare succint a principalelor tehnici de utilizare a Excel-ului i a SPSS n calcularea unor indicatori i teste statistice. Desigur, nu ne-am propus s facem o prezentare exhaustiv a posibilitilor acestor dou soft-uri n calculele statistice. Pentru cei interesai n a aprofunda aceste dou lucruri, recomandm pentru Excel, de exemplu [Pom], iar pentru SPSS [How]. Acest capitol va fi mprit n dou: n prima parte vom prezenta utilizarea Excel-ului n statistic, iar n partea a doua utilizarea SPSS-ului n statistic. Prezentarea se va realiza pornind de la exemple concrete. La anumite exemple am modificat, n mod intenionat, datele pentru a evidenia anumite aspecte ale utilizrii acestor soft-uri. 5.1. Utilizarea Excel n statistic Excel-ul reprezint un produs Microsoft, dezvoltat pentru sistemele Windows i Macintosh. Un fiier Excel cuprinde mai multe foi de calcul. Calculele se pot realiza pe o foaie de calcul, dar se pot realiza legturi ntre foile de lucru ale aceluiai fiier, sau legturi cu foi de lucru din alte fiiere. Amintim c, n afar de Excel, mai exist i alte soft-uri ce pot realiza sarcini asemntoare cu ale Excel-ului. De exemplu, din pachetul Open Office, avem Open Office Calc. Am optat totui pentru prezentarea Excel-ului deoarece, la ora actual, este cel mai rspndit, i, n general, un utilizator al Excel-ului se poate acomoda relativ rapid cu alte programe de calcul ce au aprut sau ar putea aprea pe piaa soft-urilor. n continuare vom considera cunoscut n Excel: - deschiderea, salvarea unui fiier - elementele meniului
129

modul n care se specific o anumit celul introducerea datelor pe o foaie realizarea celor patru operaii matematice ntre valorile cuprinse n anumite celule din foaia de calcul copierea formulelor.

5.1.1. Inserarea unei funcii nainte de a trece la prezentarea funciilor specifice Excelului, vom reaminti modul n care se poate insera o funcie n Excel. Pentru a insera o funcie dm un clic pe butonul din meniu ce arat ca mai jos:

Dup ce am apsat pe acest buton se va deschide o fereastr de forma urmtoare:

1
130

Dac dm clic pe butonul indicat de sgeata 1 se va deschide o subfereastr

din care putem selecta tipul de funcie dorit (n situaia de mai sus am selectat opiunea Statistical). Dup selecie n fereastra indicat de sgeata 2 va aprea lista cu funciile corespunztoare acelui tip de funcie. De exemplu, pentru a selecta funcia SUM (se va prezenta mai jos aceast funcie) alegem categoria Math & Trig i apoi activm fereastra 2 i dm un clic pe butonul de jos al rulerului (marcat cu 3 n figura de mai sus), pn se va vedea n list denumirea SUM. Dm un clic pe denumire i apoi apsm butonul OK. Se va obine fereastra

131

n primul dreptunghi punem celulele care vor intra n sum. De multe ori s-ar putea ns ca butonul s nu fie pus n meniu. Atunci pentru a insera o funcie dm un clic pe opiunea Insert din meniu i din fereastra

Alegem opiunea Function n cele ce urmeaz vom relua exemplele din capitolul 3 i vom arta cum se pot efectua calculele pentru a obine rezultatele prezentate n acele exemple. 5.1.2. Minim i maxim dintr-un ir de date Exemplul 49 (continuare) ntr-un liceu s-a studiat manifestarea complexului de inferioritate la un eantion de 30 de adolesceni. S-a studiat posibilitatea ca s avem o manifestare a complexului de inferioritate prin valene ridicate ale anxietii94. n urma aplicrii testului s-au obinut urmtoarele rezultate:

94 94 Am

Am luat n considerare doar anxietatea manifest. luat n considerare doar anxietatea manifest.

132

Pentru a calcula minimul i apoi maximul acestor date, mai nti le vom pune ntr-o foaie de Excel. Dac le-am aranja pe o singur coloan, s-ar putea s nu putem vizualiza pe ecran toate datele. O soluie ar fi s punem datele n Excel exact ca-n tabelul de mai sus. Atunci cnd vom selecta tot tabelul i vom calcula, cu ajutorul funciilor maximul i minimul acestor date, datele de tip caracter vor fi ignorate. n celula B18 vom calcula minimul folosind formula =MIN (A2:D16). Apoi, apsnd pe Enter, vom obine n B18 valoarea 19. Asemntor, se va calcula i valoarea maxim a datelor, folosind n celula B19 formula =MAX (A2:D16). Maximul obinut va fi 33.

133

5.1.3. Media Exemplul 50 (continuare)

n urma aplicrii unui test de memorie pe un lot de copii s-au obinut urmtoarele rezultate (datele au fost deja trecute pe o foaie de calcul din Excel) Pentru a calcula media pentru memoria vizual i memoria auditiv vom folosi formula AVERAGE. De exemplu, pentru a calcula media valorilor memoriei vizuale vom scrie n celula B13: =AVERAGE (B2:B12). Rezultatul va fi 3,273. Exemplul 53 (continuare) S-a aplicat un test de atenie concentrat la copii din clasa a III-a. n urma testului s-au obinut urmtoarele rezultate:

Reamintim c ponderile reprezint numrul de subieci care au valoarea corespunztoare din stnga. De exemplu, cu valoarea
134

70 avem 2 subieci. Pentru a calcula media, n acest caz, trebuie s nmulim respectiv elementele din fiecare coloan. Pentru aceast operaie avem funcia SUMPRODUCT. Pentru a calcula numrul de elemente dintr-un ir de numere vom folosi funcia COUNT. Deci, pentru a calcula media ponderat pentru datele din exemplu vom scrie n celula A8 urmtoarea formul: =SUMPRODUCT (A3:A7,B3:B7)/SUM (B3:B7). Rezultatul obinut va fi: 89,545 5.1.4. Mediana Exemplul 54 (continuare) Studenii au vrut s-i aleag un ef de grup. Pentru c nu au ajuns la un consens, au rugat un profesor s-i ajute n aceast problem. n urma discuiilor avute cu studenii profesorul a determinat 3 candidai pentru aceast funcie. Apoi a pus pe fiecare student s acorde punctaje ntre 1 i 5 celor 3 candidai. S-au obinut datele de mai sus

135

Pentru a calcula mediana corespunztoare valorilor obinute de S10 vom scrie n B25 urmtoarea formul: =MEDIAN (B2:B23). Rezultatul va fi 2. Asemntor se va obine pentru S15 valoarea medianei egal cu 3, respectiv pentru S22 o valoarea 2. Exemplele 55 i 56 (continuare) La dou echipe de muncitori, echipa A i echipa B, li s-au cerut s noteze cu note ntre 1 i 10 un ef de echip ce a lucrat cu amndou echipele. n urma centralizrii s-au obinut urmtoarele rezultate:

n celula G3 se calculeaz mediana cu formula: =MEDIAN (B2:F2). Rezultatul va fi 3. Asemntor se calculeaz mediana n H5 i se obine valoarea 2,5. 5.1.5. Amplitudinea Exemplu 49 (continuare) Relum exemplul 5.1. Dorim pentru subiecii de mai jos s calculm amplitudinea. Pentru aceasta n D18 vom scrie formula: =MAX (B2:D16)-MIN (B2:B16) Dnd Enter vom obine rezultatul 14.

136

5.1.6. Coeficientul de omogenitate Exemplu 64 (continuare) Pe un lot de studeni n sesiune s-a msurat anxietatea voalat dimineaa i seara. n urma centralizrii datelor ntr-o foaie de Excel s-a obinut urmtorul tabel:

n primul rnd vom calcula media pentru cele dou iruri de date n celulele B22 i C22 cu ajutorul funciei AVERAGE i pentru primul lot vom obine valoarea 17,35, iar pentru al doilea lot vom obine valoarea 18,25. Pentru a calcula abaterea standard vom folosi formula =STDEV (B2:B21) pentru primul lot i =STDEV (C2:C21) pentru al doilea lot. Pentru primul lot vom obine valoarea 4,00, iar
137

pentru al doilea lot vom obine valoarea 3,09. Pentru a calcula coeficientul de omogenitate va trebui s calculm raportul dintre abaterea standard i medie i apoi s-l exprimm n procente. Pentru raport, n celula B24 vom scrie: =B23/B22 i vom obine valoarea 0,2307. Pentru a o transforma n procent dm un clic pe celula B24, apoi un clic pe butonul din meniu. Pentru a obine un procent cu o zecimal vom da mai apoi i un clic pe butonul din meniu. Rezultatul final pentru primul lot va fi 23,1%. Asemntor se va proceda i pentru al doilea lot pentru care vom avea rezultatul 16,9%. 5.1.7. Compararea mediei unui grup cu o valoare dat Deoarece n capitolul 3, la exemplu 68 nu sunt date toate datele vom da un alt exemplu, pornind de la exemplul 64. Exemplul 64 (date modificate) Pe un lot de studeni n sesiune s-a studiat anxietatea voalat seara. n urma centralizrii datelor s-a obinut urmtorul tabel:

138

tiind din alte cercetri c, n mod normal, media studenilor n sesiune este de 19 se cere s studieze dac valoarea obinut pe lotul studiat e diferit de valoarea populaiei de studeni obinut n studiile anterioare. Pentru a rezolva aceast problem vom folosi funcia ZTEST. Dm un clic n celula B16, apoi dm un clic pe butonul de funcii i din list alegem funcia ZTEST. Se va deschide o fereastr ca mai jos:

n dreptunghiul Array vom scrie irul de date: B2:B14, n dreptul lui X se va pune valoarea mediei populaiei. Deoarece nu cunoatem valoarea dispersiei populaiei de studeni nu vom completa nimic la Sigma i atunci se va lua valoarea dispersiei lotului de subieci. Dup ce s-au completat spaiile libere obligatorii, se va da un clic pe butonul . Valoarea obinut va fi 0,978.

139

5.1.8. Testul t Exemplul 59 n urma aplicrii testului Guilford de abiliti ale gndirii divergente (flexibilitatea), la un liceu s-au obinut urmtoarele rezultate:

n Excel rezultatul funciei TTEST este eroarea (P-value). Iar pentru a avea diferene semnificative trebuie ca valoarea rezultat n urma aplicrii funciei s fie mai mic dect 0,05. n primul rnd vom da un clic pe celula B15. Selectm din lista de funcii statistice, funcia TTEST i va aprea urmtoarea fereastr:

140

Dm un clic pe dreptunghiul din dreptul etichetei Array1. Scriem acolo celulele n care se gsete primul ir de numere95: A2:B13. Analog n dreptul etichetei Array2 scriem96: C2:E13. La opiunea Tails se pune 1 dac am fcut o presupunere privitor la poziia unei medii fa de cealalt (de exemplu, media fetelor este mai mare dect media obinut de biei), sau punem valoarea 2 dac ipoteza era c cele dou medii sunt diferite fr ns a specifica ce medie este mai mare. Pentru opiunea Type avem trei posibiliti. 1 dac irurile comparate reprezint fizic acelai ir studiat nainte de a aplica un stimul i dup ce am aplicat un stimul. De exemplu, dac studiem depresia la un lot de pacieni nainte de operaie i dup operaie, fizic lotul este acelai i ne intereseaz s vedem dac stimulul
n exemplul prezentat intenionat am pus irul peirul coloane, pentru n exemplul prezentat intenionat am pus dou pe dou coloane, a arta carta cobligatoriu ca irul sca irul s fie pe o singur coloan pentru 96 nu este nu este obligatoriu fie pe o singur coloan. a 96 Aici se observ c n selecia fcut pot fi i celule goale, acestea fiind aici se observ c n selecia fcut pot fi i celule goale, acestea ignorate de ctre ctre TTEST. fiind ignorate defunciafuncia TTEST. 141
95 95

(n acest caz operaia) a avut vreo influen asupra pacienilor 2 dac irurile au aceeai dispersie 3 dac irurile au dispersie diferit n cazul prezentat la Tails vom alege opiunea 2, iar la opiunea Type alegem opiunea 3. Rezultatul final va fi: 0,573, deci eroarea este mai mare de 0,05, adic nu avem diferene semnificative ntre cele dou medii. Se observ c pentru folosirea funciei TTEST nu avem nevoie s calculm mediile celor dou loturi. Acestea trebuie calculate separat atunci cnd, n cazul diferenelor semnificative, dorim s reprezentm grafic mediile comparate. 5.1.9. Testul 2 Exemplul 72 (continuare) La un sondaj realizat n 2004 pe un eantion de 1500 persoane (subieci), printre altele, s-au adresat urmtoarele ntrebri cu variantele de rspuns:
3. Ct ncredere avei n Biseric? a. Foarte mult b. Mult c. Puin d. Foarte puin e. Deloc 4. Ct ncredere avei n armat? a. Foarte mult b. Mult c. Puin d. Foarte puin e. Deloc 142

n urma centralizrii rezultatelor s-a obinut urmtorul tabel:

Pentru a vedea dac avem diferene semnificative ntre cele dou distribuii vom folosi funcia CHITEST. Dm un clic n celula B5 i apoi selectm din lista cu funcii statistice funcia CHITEST. Va aprea urmtoarea fereastr:

143

Dac studiem faptul c a doua distribuie difer semnificativ sau nu de prima distribuie, atunci la Actual_range vom scrie B2:F2 iar la Expected_range vom scrie B3:F3. (Reamintim c pentru a compara dou distribuii vom lucra cu frecvene absolute i suma frecvenelor de la prima distribuie trebuie s fie egal cu suma de la a doua distribuie). Dup ce vom da un clic pe butonul n celula B5 va aprea rezultatul 3.14879E-49. Aceasta este o scriere matematic a numrului zecimal subunitar ce are 48 de zecimale egale cu zero, iar a 49-a zecimal este 3 i a 50-a este 1 etc. Deci, este evident c numrul obinut este mai mic de 0,05, deci ntre cele dou distribuii avem diferene semnificative. O alt posibilitate de a analiza numrul obinut este s dm un clic pe celula B5 i apoi dm un clic pe butonul , i atunci va aprea n celula B5 valoarea 0%. Cum 0,05 se mai poate scrie 5% vom compara valoarea obinut cu ajutorul funciei cu 5%. Cum valoarea este mai mic dect 5%, putem spune c avem diferene semnificative ntre distribuii. 5.1.10. Coeficientul de corelaie Exemplu 73 (Pearson i Lee) S-a msurat pe un lot de 11 familii statura frailor i surorilor n inci. Dup transformarea n cm se obine urmtorul tabel:

144

S se studieze coeficientul de corelaie ntre irul de date corespunztor sorei i irul de date corespunztor fratelui. n acest caz vom folosi funcia CORREL. O vom selecta din lista funciilor statistice i vom obine fereastra:

La Array1 vom scrie B2:L2, iar la Array2 scrie B3:L3. Coeficientul de corelaie va fi 0,6333. Pentru a verifica semnificabilitatea coeficientului de corelaie va trebui s calculm valoarea t asociat coeficientului. Reamintim formula:

t calc =

r n2 1 r2

n B5 avem valoarea coeficientului de corelaie, iar n C5 scriem numrul de nregistrri, adic valoarea 11. n B6 vom calcula valoarea lui t cu formula: =B5*sqrt (C5-2)/sqrt (1-B5^2). Vom obine valoarea 2,4547. Pentru a obine valoarea t din tabel vom folosi funcia TINV pe care o vom alege tot din lista funciilor statistice. Se va deschide fereastra:

145

n dreptul opiunii Probability se va pune nivelul de semnificabilitate, adic 0,0597, iar n dreptul gradelor de libertate se va pune valoarea lui n-2, adic n cazul nostru 998. Dup ce vom da un clic pe butonul OK, vom obine valoarea 2,2622. Deoarece valoarea calculat este mai mare dect valoarea din tabel rezult c avem o corelaie semnificativ ntre cele dou iruri de numere. 5.1.11. Regresia liniar Exemplul 78 Pe un grup de 20 de elevi s-a studiat corelaia dintre memoria auditiv i mediile obinute pe semestrul 1. n urma centralizrii datelor s-au obinut urmtoarele rezultate.

97 98

Sau 5%. rezultat obinut din n = 11 minus 2.

146

Se cere s se estimeze cele 5 rezultate lips. Pentru aceasta aezm ntr-un tabel doar rezultatele corespunztoare subiecilor crora li s-au aplicat testul de memorie auditiv.

147

Calculm coeficientul de corelaie pentru noile date i obinem valoarea 0,638. Fcnd verificrile, ca n exemplul anterior, rezult c avem corelaie semnificativ. Vom considera variabila Memoria auditiv, ca fiind variabil dependent i variabila Note ca fiind variabila independent. Deci putem calcula regresia liniar de forma y = a.x + b, unde x reprezint variabila Note, iar y reprezint variabila Memoria auditiv. Pentru a calcula pe a, numit i panta regresiei, vom folosi funcia SLOPE. Dm un clic pe celula B25 i, dup ce selectm aceast funcie din lista funciilor
148

statistice, va aprea urmtoarea fereastr:

n conformitate cu conveniile stabilite anterior, la dreptunghiul din dreptul etichetei Known_ys vom scrie B2:B21, iar la Known_xs vom scrie C2:C21. Dm un clic pe butonul i vom obine n celula B25 valoarea 8,469. Pentru a afla valoarea lui b, termenul liber, vom folosi funcia INTERCEPT pe care o gsim tot n lista cu funcii statistice. Folosind un procedeu asemntor cu cel de la funcia SLOPE, vom obine valoarea -31,239. Pentru a estima valorile lips din tabel este suficient s calculm pentru S9, n celula B10 din primul tabel valoarea expresiei: =B25*C10+B26 i vom obine valoarea estimat pentru S9 egal cu 13,645.

5.1.12. Tabel funcii Excel pentru calcule statistice Prin Celinc vom nelege celula de la nceputul irului de date cruia dorim s-i aplicm funcia, iar prin Celfin vom nelege celula de la finalul irului de date cruia dorim s-i aplicm funcia
149

Denumire Forma funciei funcie Maxim =MAX (Celinc:Celfin)

Unde se poate folosi funcia Calcularea maximului unui ir de numere Calcularea minimului unui ir de numere Calculeaz media unui ir de numere Calculeaz media ponderat

Minim

=MIN (Celinc:Celfin)

Media

=AVERAGE (Celinc:Celfin)

Media =SUMPRODUCT ponderat (Celinc1:Celfin1,Celinc2:Celfin2)/ SUM (Celinc2:Celfin2) Mediana =MEDIAN (Celinc:Celfin)

Calculeaz mediana unui ir de numere Calculeaz amplitudinea unui ir de date Calculeaz omogenitatea unui ir de date Calculeaz eroarea pentru compararea mediei unui grup cu o valoare dat

Amplitudi- =MAX (Celinc:Celfin)-MIN nea (Celinc:Celfin) Coeficient =STDEV (Celinc:Celfin)/AVERAGE de (Celinc:Celfin) omogenitate Testul Z =ZTEST (Celinc:Celfin, medpop)

Testul t

=TTEST Calculeaz eroarea (Celinc1:Celfin1,Celinc2:Celfin2,valtail pentru a compara s, valtype) mediilor dintre dou grupuri de subieci Testul 2 =CHITEST (Celinc1:Celfin1, Calculeaz eroarea (hi-ptrat) Celinc2:Celfin2) pentru a compara diferenele ntre dou distribuii 150

Denumire Forma funciei funcie Coeficien- =CORREL (Celinc1:Celfin1, tul de Celinc2:Celfin2) corelaie Valoarea =TINV (ns,gl) tabelar a lui t

Unde se poate folosi funcia Calculeaz coeficientul de corelaie ntre dou variabile Calculeaz valoarea tabelar a lui t n funcie de nivelul de semnificabilitate (ns) i gradele de libertate (gl)

5.2. Utilizarea SPSS Atunci cnd se vorbete despre cercetarea n sociologie i psihologie, mai ntotdeauna se amintete de prelucrarea datelor cu ajutorul SPSS-ului. Ce este SPSS-ul? Denumirea provine din englez (Statistical Package for the Social Sciences): pachet statistic pentru tiinele sociale. nainte de a ncepe propriu-zis prezentarea acestui pachet de programe, a dori s atrag atenia asupra anumitor aspecte n acest capitol voi realiza o introducere la un nivel de baz a SPSS-ului. pentru o nelegere mai bun a SPSS-ului se recomand reluarea unor noiuni de statistic. trebuie s nelegei c acest capitol acoper doar o parte din lucrurile ce se pot realiza cu SPSS-ul. De aceea, dup ce vei nelege bine noiunile predate, recomandm s ncercai i alte metode statistice ale acestui program.

5.2.1. Ferestre i fiiere n SPSS n SPSS vei avea ocazia s lucrai cu trei tipuri de ferestre, avnd posibilitatea s salvai coninutul fiecrei ferestre
151

1 prima fereastr, pe care o vei ntlni, va fi fereastra Data Editor99. Are rolul de a defini i introduce datele i, n acelai timp, de a ajuta la realizarea unor proceduri statistice. 2 fereastra Output100 are rolul de a afia rezultatele testelor statistice. 3 fereastra Syntax are rolul de a memora operaiile realizate asupra datelor. Aceasta fereastr se va deschide automat atunci cnd vei da comanda Paste. Oricare din aceste ferestre poate fi salvat. Pentru a executa aceast comand trebuie, mai nti, activat fereastra ce dorim s-o salvm, apoi se execut o succesiune de comenzi asemntoare cu salvarea unui document Word. Aa cum la salvarea unui document n Word, acesta va primi automat extensia .doc, la fel i aici fiecare fereastr dup scrierea numelui dat va avea i o extensie cu ajutorul creia putem s tim ce tip de fereastr avem. n tabelul de mai jos prezentm ferestrele i extensiile corespunztoare:
Numele ferestrei Editor Output Syntax Extensia fiierului salvat .sav .spo .sps

5.2.2. Introducerea datelor n lucrul cu SPSS-ul avem dou moduri de introducere a datelor: de la tastatur sau dintr-un program cu foi de lucru101. n cadrul acestei lucrri ne vom referi la primul mod de lucru. Deschiznd sesiunea de lucru cu SPSS pentru Windows, pe ecran va aprea o fereastr n care vom fi ntrebai n legtur cu ceea ce dorim s realizm:
99

Editarea datelor. De ieire. 101 Gen Excel.


100

99

Editarea a datelor. De ieire. 101 Gen Excel.


100

152

Avnd n vedere denumirea seciunii, vom alege opiunea de introducere de date noi102 dup care vom da un clic pe butonul OK. Atunci fereastra de dialog va disprea i va rmne o foaie gen Excel n care putem introduce datele. Singura diferen este c n aceast fereastr coloanele nu sunt notate cu litere, ci la fiecare coloan avem aceeai etichet var. Datele se introduc de la tastatur i dup scriere se apas tasta Enter. Atunci cnd vom completa acest tabel, la ca i n fel Excel, atunci cnd introducem datele trebuie s punem pe fiecare linie cte un caz (de exemplu, atunci cnd dorim s analizm un lot de 31 de subieci, fiecare subiect va fi pus pe o linie cu toate caracteristicile lui) i pe fiecare coloan caracteristicile corespunztoare fiecrui caz (n exemplul de dinainte, dac dorim
102

Type in data 153

102

Type in data.

s realizm un studiu n funcie de vrst, mediu, ocupaie etc. atunci vom avea o coloan pentru vrst, una pentru mediu, alta pentru ocupaie etc.). De asemenea se recomand ca fiecrui subiect s-i atribuim un numr103. Pentru identificarea sexului subiecilor se poate atribui valoarea 1 pentru masculin i 2 pentru feminin. 5.2.3. Crearea unui fiier de date n aceast seciune vom prezenta modul de realizare a unui fiier de date pas cu pas. Precizm c operaiile pe care le vom prezenta sunt specifice versiunii SPSS 14.0, n versiuni anterioare procedeul diferind la anumite etape de creare a fiierului de date. n fereastra n care am introdus datele, n partea de stnga . Implicit este activ jos avem dou butoane: cel cu Data View, adic fereastra unde se introduc datele. S presupunem c am introdus urmtoarele date:

103

Dar nu este obligatoriu.

154

103

Dar nu este obligatoriu.

Pentru a defini baza de date va trebui s specificm pentru fiecare coloan tipul datelor. Pentru aceasta vom da un clic pe butonul . Va aprea o nou fereastr:

155

n prima coloan avem eticheta Name. Aceasta reprezint lista etichetelor ce apar n foaia Data View pentru fiecare coloan. Prima coloan din baza de date este cea cu etichetele pe care le-am dat fiecrui subiect. Deci, vom denumi aceasta coloan Etichete. Pentru aceasta vom da un clic pe VAR00001 i de la tastatur vom scrie Etichete, dup ce vom da Enter n locul lui VAR00001 va aprea denumirea Etichete. n urmtoarea celul din dreapta trebuie s definim tipul datelor ce se vor introduce pe coloana Etichete. Deoarece datele introduse n acea coloan conin litere, automat este aleas opiunea String. Deci, putem lsa opiunea neschimbat. La opiunea Width se specific numrul maxim de caractere ce se pot avea datele din aceste coloane. Implicit a fost aleas valoarea 2, dou caractere, deoarece din datele introduse nu avem dect etichete de dou caractere. Dac dorim s schimbm i s putem introduce date de lungime mai mare, dm un clic pe valoarea 2 i scriem de la tastatur numrul 8. Pe liniile urmtoare vom scrie la etichete test 1, respectiv test 2 i lsm neschimbate celelalte opiuni. Vom obine fereastra:

156

iar dac dm un clic pe butonul

vom obine fereastra:

Ca un rezumat al celor explicate mai sus vom da un tabel cu proprietile ce se pot specifica n legtur cu fiecare coloan:
Tipul de comand Type permite definirea tipului variabilei (numeric, ir de numere, logic) Width total numere de caractere Decimals (n cazul datelor numerice) numrul de zecimale cu care dorim s scriem numrul Missing Values permite desemnarea anumitor scoruri ce pot lipsi la colectarea datelor Colums permite schimbarea maximului de caractere dintr-o coloan Align permite desemnarea alinierii ntr-o coloan Measure permite desemnarea tipului de date cu care lucrm104 Valoarea implicit

8 2

8 dreapta scale

De exemplu, dac avem date de tip ir de caractere atunci se va selecta opiunea Nominal. De exemplu, dac avem date de tip ir de caractere atunci se va selecta opiunea Nominal. 157
104

104

n continuare vom salva aceast baz de date. Salvarea se realizeaz asemntor cu modul n care se realizeaz salvarea n Excel, adic dm un clic pe opiunea File, apoi din lista ce va aprea vom selecta opiunea Save. Cnd salvm prima oar va trebui s indicm locul unde salvm baza de date i denumirea bazei de date. S presupunem c am salvat aceast baz de date cu denumirea Baza_d_01. La salvarea bazei de date putem da o opiune de salvare a bazei de date ca fiier din alt program, de exemplu Excel. 5.2.4. Statistica descriptiv a bazei de date Odat realizat baza de date corect, putem obine o serie de informaii utile din aceste date. Un prim lucru pe care-l putem obine este o statistic descriptiv a datelor (numr, medie, abatere standard). Pentru aceasta deschidem baza de date (n fereastra ce apare cnd deschidem SPSS-ul alegem opiunea Open an existing data source).

Iar din lista de baze de date alegem baza_d_01.sav. Se va deschide fereastra cu baza de date i din meniul acestei ferestre vom da un clic pe opiunea Analyze, apoi pe Descriptive statistics i apoi vom da un clic pe opiunea Descriptives ca n imaginea de mai jos

158

Se va deschide fereastra de mai jos:

S presupunem c dorim s obinem statistica descriptiv pentru datele de la testul 01. Dm un clic pe Test01, apoi un clic pe butonul , dup care, n fereastra denumit Variables (s), va aprea scris Tes01 i butonul se va activa. Dnd clic pe acest buton, vom obine fereastra cu datele statisticii descriptive referitoare la datele irului numit Test01
159

Rezultatele se pot salva sau se pot tipri urmnd aceleai operaii ca la salvarea unui document n Word.

5.2.5. Corelaia S deschidem din nou baza de date, aa cum am prezentat la nceputul seciunii 5.2.4. Dorim s calculm coeficientul de corelaie dintre cele dou teste din baza de date. Pentru aceasta, din meniu, vom selecta opiunea Analyse, apoi Correlate i vom merge pe opiunea Bivariate, ca n imaginea de mai jos:

160

Dup ce vom da clic pe opiunea Bivariate va aprea fereastra:

161

Dm un clic pe Test01 i apoi pe , procednd analog cu Test02. n final, cele dou vor aprea pe fereastra din dreapta, butonul OK va deveni activ. Verificm s avem bifat opiunea Pearson din fereastr

i opiunea Two-tailed care se afl pe fereastr mai jos. Apoi dm un clic pe butonul . Vor aprea rezultatele:

n partea dreapt a ferestrei vom avea afiate rezultatele. Coeficientul de corelaie, Pearson Correlation, are valoarea -0,475, iar eroarea p = 0,419. Ca s avem un coeficient de corelaie semnificativ ar trebui ca p < 0,05 i cum p-ul obinut p = 0,419 > 0,05, rezult c ntre cele dou teste nu exist o corelaie semnificativ.

162

5.2.6. Comparaia ntre mediile a dou loturi n exemplul folosit n seciunile anterioare nu se poate folosi comparaia ntre medii, deci vom realiza o alt baz de date. S presupunem c pe dou loturi de subieci aplicm un test Test03. Pentru claritatea expunerii s presupunem c loturile sunt formate din doar 10 subieci fiecare. Exemplul 82 n urma aplicrii testului Guilford de abiliti ale gndirii divergente (flexibilitatea) la un liceu s-au obinut urmtoarele rezultate:
Biei 5 11 11 8 7 6 13 6 8 11 Fete 6 5 5 6 3 6 8 6 7 8

De cele mai multe ori erorile apar de la introducerea datelor. Influenai de modul n care se introduc datele n Excel exist tendina de a le pune n acelai mod n baza de date din SPSS. Fiind vorba de o baz de date, punerea pe aceeai linie a valorilor unui biat cu valoarea unei fete (de exemplu, pentru primele 2 valori la biei 5 i la fete 6) ar putea da impresia c ntre biatul i fata care sunt pe o linie ar putea s existe o legtur. De fapt, avem 20 de subieci care nu au legtur unul cu altul, loturile sunt independente, i pentru fiecare subiect n baza de date specificm sexul i valoarea obinut la test. De aceea, n baza de date din SPSS, pe prima coloana
163

vom avea declaraia sexului subiectului, iar pe a doua coloan vom pune valoarea obinut la testul Guilford. n acelai timp, vom realiza i o codificare: vom nota cu m bieii i cu f fetele. Deci, n foaia de declaraie a variabilelor vom scrie ca n figura de mai jos:

La variabila val_test am pus n dreptul coloanei Label eticheta Guilford pentru ca pe tabelul cu rezultate s apar i denumirea testului folosit. Apoi, n foaia Data View, vom introduce datele astfel nct pe coloana denumit Sex s avem m sau f corespunztoare bieilor, respectiv fetelor. n urma completrii vom obine urmtorul tabel:

164

Deci, pn la linia a 10-a inclusiv, am introdus valorile corespunztoare bieilor, iar din linia a 11-a la linia a 20-a am introdus valorile fetelor. Pentru a calcula testul t pentru loturi independente vom da un clic pe opiunea Analyze din meniu, apoi pe Compare Means, iar din fereastra ce se va deschide vom da un clic pe opiunea Independent-Samples T Test. Dup executarea acestei succesiuni de comenzi va aprea o fereastr ca-n imaginea de mai jos:

165

Variabila sex va fi trecut la Grouping Variable, iar variabila Guilford (val_test) va fi trecut la Test Variable (s). Mai apoi trebuie sa precizm notaiile pentru grupuri. Pentru aceasta vom da un clic pe butonul i se va deschide fereastra:

n dreptunghiul corespunztor lui Group 1 vom scrie m, iar n cellalt dreptunghi vom scrie f. Atunci butonul Continue va deveni activ. Dm un clic pe el i n dreptul variabilei sex va aprea scris (m f). Acum putem da comanda de calculare a testului t i dnd un clic pe butonul OK va aprea urmtoarea fereastr de rezultate:

166

Se observ c se realizeaz n partea de sus a ferestrei o statistic descriptiv a datelor n tabelul denumit Group Statistics, iar rezultatele testului vor fi puse n tabelul denumit Independent Samples Variables. Tabelul are trei mari pri: n prima parte sunt puse etichetele

167

n a doua parte se calculeaz testul pentru studiul egalitii varianelor:

Pe exemplul prezentat am obinut valoarea F = 6,946 i o valoare p = 0,017. Deoarece p < 0,05 se poate presupune c cele dou loturi au variane egale. n cea de-a treia parte se dau datele rezultate direct din aplicarea testului t:

Avnd n vedere rezultatul testului de comparare a varianelor, vom lua n considerare doar rezultatele de pe prima linie. n prima coloan avem valoarea t = 2,654, n a doua coloan avem gradele de libertate df = 18, n a treia coloan avem valoarea p = 0,016. Pentru ca p < 0,05 nseamn c avem diferene semnificative ntre medii celor dou loturi, deci putem spune c media bieilor mb = 8,60 este semnificativ mai mare ca media fetelor mf = 6,00.
168

5.2.7. Testul 2 (hi-ptrat)105 n seciunea 5.2. am vzut c modul de a completa o baz de date n SPSS este diferit de modul n care aceste date se pun ntr-o foaie de lucru, de exemplu n Excel. Ideea de baz este nregistrarea i faptul c pe fiecare linie trebuie pus cte o nregistrare cu toate componentele ei ce vor fi folosite n analiza datelor. Dac, n cazul exemplului din seciunea anterioar, aveam pentru fiecare subiect de pus sexul i valoarea testului, n cazul aplicrii testului hi-ptrat n SPSS avem de fcut trei declaraii. Pentru claritatea expunerii vom folosi un exemplu: Exemplul 87 ntr-un centru de reeducare s-a pus bieilor urmtoarea ntrebare: Din ce cauz nu-i place coala? n urma centralizrii datelor s-au obinut urmtoarele rezultate:
16-17 ani mi este greu s nv m plictisesc m enerveaz profesorii nu-mi folosete 1 18 7 10 18-22 ani 4 11 1 19

Dorim s studiem dac exist diferene semnificative ntre cele dou loturi de subieci. Pentru nceput vom completa foaia cu Variable View a bazei de date din SPSS. Vom avea trei tipuri de caracteristici: Grup_vrst, var_rspuns i frecvene. Vom face i urmtoarele codificri:
Grup vrst Denumire categorie Codificare 16-17 ani 1 18-22 de ani 2 Variante de rspuns Denumire categorie Codificare mi este greu s nv 1 m plictisesc 2 m enerveaz profesorii 3 nu-mi folosete 4

105

n englez chi-test 169

105

n englez chi-test

Deschidem Data editor i definim, mai nti, baza de date n foaia Variable View. Pentru ca n tabelul cu rezultate s apar i denumirile, nu doar codurile, n tabelul de declaraii, n coloana Values, vom scrie i etichetele corespunztoare codurilor. De exemplu, pentru categoria Grup vrst dm un clic pe celula din dreptul liniei categoriei i coloana Values. Atunci, n dreapta celulei, va aprea butonul . Dm un clic pe acest buton i va aprea fereastra:

n dreptul lui Value vom scrie codul, iar n dreptul Label vom scrie denumirea. Apoi dm un clic pe butonul . Iar codul i eticheta vor aprea n dreptunghiul de mai jos. Astfel, introducem toate codificrile i etichetele corespunztoare categoriei

170

Grup_varsta106. Analog se vor introduce i codificrile pentru var_raspuns. n final, tabelul Variable View va arta astfel:
106

n coloana Name nu se accept spaii libere, de aceea am pus _ ntre cele dou cuvinte ce compun denumirea categoriei.

Dm un clic pe Data View pentru a introduce datele. Datele se vor introduce asemntor cu modul n care le-am introdus la testul t:

n coloana Name nu se accept spaii libere, de aceea am pus _ ntre cele dou cuvinte ce compun denumirea categoriei. 171

106

Urmtoarea procedur ce trebuie realizat este ponderarea celulelor. Pentru a realiza aceasta, dm un clic pe opiunea Data din meniu, iar din fereastra ce se va deschide alegem opiunea Weight Cases107. Va aprea fereastra:

n aceast fereastr dm un clic pe opiunea Weight cases by, se va activa butonul de la Frequency Variable. Dm un clic pe Frecvene i apoi pe butonul pentru a specifica coloana unde sunt frecvenele. Apoi dm un clic pe butonul OK. Odat specificat faptul c lucrm cu frecvene, putem trece la calcularea efectiv a testului 2. Dm un clic pe opiunea Analyse din meniu i din fereastra
107

Ultima n list.

172

ce se va deschide alegem opiunea Descriptive Statistics. Din noua fereastr ce se va deschide vom alege opiunea Crosstabs. Va aprea urmtoarea fereastr:

107

Ultima n list.

Variabila Grup_varsta o vom pune la Row (s), dnd un clic pe butonul , iar variabila Var_raspuns o vom pune la Column (s). i va aprea fereastra:

Apoi dm un clic pe butonul

173

Vom da un clic pe Chi-square pentru a specifica faptul c vom utiliza testul 2, apoi dm un clic pe butonul pentru a reveni la fereastra iniial. n fereastra iniial vom da un clic pe butonul iar n fereastra ce se va deschide:

dm un clic pe opiunea Expected i pe Unstandardized, apoi pe butonul . Revenii la fereastra iniial, dm un clic pe butonul pentru calcularea rezultatelor testului 2. n fereastra cu rezultate vor aprea trei tabele. Primul tabel

ne indic nite parametrii generali ai datelor introduse n tabel. Al doilea tabel:

174

ne red tabelul cu valori. n dreptul liniei, denumit Residual, se calculeaz diferena dintre cele dou frecvene ale celor dou grupuri corespunztoare unei variante de rspuns. De exemplu, la opiunea imi este greu sa invat la grupul de 16-17 ani la Residual se observ valoarea -1.5. Aceasta ne arat faptul c pentru aceast variant de rspuns cei din categoria 16-17 ani au mai puine opiuni dect cei de la categoria 18-22 de ani. Al treilea tabel:

ne d ceea ce rezult n urma aplicrii testului 2. Valoarea 2calc este108 10,771 gradele de libertate109 sunt 3. Valoarea p = 0,013 i cum ea este mai mic de 0,05 nseamn c avem diferene semnificative ntre cele
108 109

Pearson Chi-Square Df 175

dou grupuri, deci putem spune c cei de 16-17 ani au dat rspunsuri semnificativ diferite de cei de 18-22 de ani. Se poate observa faptul c sub acest tabel ni se atrage atenia c avem 4 celule (50% din date) cu o frecven foarte mic. i n continuare se specific faptul c minimum pentru frecven este 2,46 (deci frecvena minim recomandat este 3). 5.2.8. Coeficientul alpha Atunci cnd se aplic un instrument ce conine mai muli itemi, una din problemele ce apar este de a studia dac itemii tind s msoare acelai lucru. Exist mai multe metode de a rezolva aceast problem, dintre acestea amintim: folosirea coeficientului alpha, metoda split-half etc. n aceast seciune vom prezenta un mod de calculare a coeficientului alpha. Cu ajutorul coeficientului alpha se poate rezolva o palet mai larg de probleme. Dintre acestea amintim: Scurtarea unui chestionar prin meninerea sau mbuntirea validitii interne Msurarea concordanei dintre doi evaluatori diferii Studiul consistenei unei msuri luate att la testare, ct i la retestare n cele ce urmeaz vom da un exemplu de calcul al unui coeficient specific SPSS-ului.
108 109

Pearson Chi-Square Df.

S presupunem c avem 8 persoane110 ce rspund la trei itemi. n primul rnd, trebuie s definim cmpurile bazei de date. n prima coloan vom trece iniialele subiecilor, deci vom defini aceast coloan ca fiind de tip String, iar celelalte coloane ce vor conine valorile obinute pentru fiecare item vor fi de tip Numeric de mrime 2 i fr zecimale. Dup ce am completat aceste date vom obine o foaie ca-n figura de mai jos:

Desigur n practic numrul poate fi mult mai mare, dar am optat doar pentru 8 subieci pentru claritatea expunerii. 176

110

Dm apoi un clic pe Data View i introducem datele ce au reieit din aplicarea testelor. Va rezulta o foaie ca-n figura de mai jos:

Desigur n practic numrul poate fi mult mai mare, dar am optat doar pentru 8 subieci pentru claritatea expunerii.

110

Pentru a stabili fidelitatea itemilor, prin metoda coeficientului alpha, selectm din meniu opiunea Analyse, iar n fereastra ce se va deschide dm un clic pe opiunea Scale i apoi pe Reliability Analysis. Se va deschide fereastra:

177

Trecem cei trei itemi n fereastra din dreapta cu ajutorul butonului , dup care dm un clic pe butonul . i n fereastra

Bifm opiunea butonul

, apoi dm un clic pe

. Se va reveni la fereastra iniial unde se va da un

clic pe butonul . n fereastra de rezultate vor aprea trei tabele. Primul tabel prezint validitatea datelor. Al doilea tabel
178

Ne d valoarea coeficientului alpha111, care, n acest caz, este 0,734. Se consider c fidelitatea itemilor este asigurat de la o valoare a coeficientului mai mare de 0,8, deci putem spune c nu avem asigurat validitatea itemilor. Ultimul tabel

ne arat variaia coeficientului alpha dac eliminm un item. De exemplu, dac eliminm itemul 1 obinem un coeficient alpha de 0,646. 5.3. Concluzii n aceast seciune am ncercat s prezentm doar o parte din posibilitile celor dou soft-uri de prelucrare statistic a datelor. Pentru cei care doresc s vad mai multe din posibilitile acestor softuri recomandm, de exemplu, pentru Excel [Bott], [Pom], iar pentru SPSS recomandm [How].
111

Se mai numete i coeficientul lui Cronbach.

BIBLIOGRAFIE

111

Se mai numete i coeficientul lui Cronbach. 179

[Abr] Abric J.C. (2002), Psihologia comunicrii. Teorii i metode, Editura Polirom, Iai [Alex] Alexandrescu P. (2004), Introducere n statistica social, Editura Paralela 45, Bucureti [Bar] Brz S. (2004), Iniiere n internet i realizarea paginilor Web, Editura Fundaiei Romnia de Mine, Bucureti [Bea] Beaty J. (2004), Lumea n viziunea lui Peter Drucker, Editura Teora, Bucureti [Bott] Bott E. (2001), Utilizare Microsoft Office 2000, Editura Teora, Bucureti [Che1] Chelcea S, Mrginean I., Cauc I (1998), Cercetarea sociologic, Editura Destin, Deva [Che2] Chelcea S (1975), Chestionarul n investigaia sociologic, Editura tiinific i Enciclopedic, Bucureti [Col] Colman A., Pulford B. (2006), A Crash Course in SPSS for Windows, Blackwell Publishing, Oxford [Die] Diestel R. (2005), Graph Theory, Springer-Verlang, New York (electronic edition) [Durk] Durkheim E. (2002), Regulile metodei sociologice, Editura AntetXX Press [Fish] Fisher R.A. (1925), Statistical methods for research workers, Oliver and Boyd, London [Fota1] Fotache M. (2001), SQL. Dialecte, DB2, Oracle i Visual FoxPro, Editura Polirom, Iai [Fota2] Fotache M. (2005), Proiectarea bazelor de date, Editura Polirom, Iai [Gat] Gataulin A., Lica D., Pomohaci C.M. (2002), Biostatistica intuitiv, Editura CERES, Bucureti 180

[How] Howitt D., Cramer D. (2006), Introducere n SPSS pentru psihologie, Editura Polirom, Iai [Isa] Isaic-Maniu A., Mitru C., Voineagu V. (2003), Statistic, Editura Universitar, Bucureti [Kin] Kinkoph S. (2004), Power Point 2003 n imagini, Editura Teora, Bucureti [Lic] Lica D., Pomohaci C.M. (1998), Biostatistica, U.S.A.M.V.B., Bucureti [Lin] J.K. Lindsey (2004), Introduction to applied statistics. A modeling approach, Oxford University Press Inc., New York [Mar] Mrginean I. (1982), Msurarea n sociologie, Editura tiinific i Enciclopedic, Bucureti [Mat] Matheson D.W., Bruce R.L. Beauchamp K.L. (1970), Introduction to experimental psychology, Holt, Rinehart and Winston Inc., New York [McC] McCollum J.K., Bnacu C.S. (2005), Management de proiect o abordare practic, Editura Universitar, Bucureti [More] Moreno J.l. (1969), Les fondements de la sociometrie, PUF, Paris [Nast] Nstase P., Mihai F. (2001), Baze de date Microsoft Access 2000, Editura Teora, Bucureti [Pear] Pearson K., Lee A (1902-1903), Inheritance of physical characters, Biometrica 2:357 [Pom] Pomohaci C.M. (2005), Noiuni introductive de utilizare a computerului: Word, Excel, Documente HTML, Editura Didactic i Pedagogic, Bucureti [Pom] Pomohaci C.M. (2007), Informatic utilizat pentru aplicaii n sociologie i psihologie, Editura Fundaiei Romnia de Mine, Bucureti [Rad] Radu I i colab. (1993), Metodologie psihologic i analiza datelor, Editura Sincron, Cluj [Rat] Rateau P. (2004), Metodele i statisticile experimentale n tiinele umane, Editura Polirom, Iai

181

[Rot] Rotariu T, Bdescu G., Culic I, Mezei E., Murean C., Metode statistice aplicate n tiinele sociale, Editura Polirom, Iai [Rua] Ruane J.M. (2004), Essentials Blackwellpublishing, Oxford of Research Methods,

[Rum] Rummel R.J. (1983), Libertarianism and International Violence, The Journal of Conflict Resolution 27 (March 1983): 27-71 [Sne] Snedecor G.W. (1968), Metode statistice aplicate n cercetrile de agricultur i biologie, Editura Didactic i Pedagogic, Bucureti [Sta] Stahl H.H. (1974), Teoria i practica investigaiilor sociale, Editura tiinific i Enciclopedic, Bucureti [Stan] Stnil O. (1985), Noiuni i tehnici de matematic discret, Editura tiinific i Enciclopedic, Bucureti [Ste] R.G.D. Steel, J.H.Torrie (1980), Principles and procedures of statistics. A biometrical approach, McGraw-Hill International Editions [Sto] Stoica V. (2000), Metodologia analizei politice, Editura Fides, Iai [Tag] Tagiuri R (1952), Relational analysis: an extension of sociometry method with emphasis upon social perception, Sociometry, nr.15 [ar] arc M. (1998), Tratat de statistic aplicat, Editura Didactic i Pedagogic, Bucureti [i] ian E., Ghi S., Tranda C. (2001), Bazele statisticii, Editura Meteor Press, Bucureti [Vel] Velicanu M, Bodea C., Lungu I., Ioni C., Bdescu G. (1999), Sisteme de Gestiune a Bazelor de Date, Editura Petrion, Bucureti

182

Redactor: Cosmin COMARNESCU Tehnoredactor: Marcela OLARU Coperta: Marilena BLAN Bun de tipar: 14.02.2008; Coli tipar: 11,25 Format: 16/6186 Editura Fundaiei Romnia de Mine Bulevardul Timioara nr.58, Bucureti, Sector 6 Tel./Fax: 021/444.20.91; www.spiruharet.ro e-mail: contact@edituraromaniademaine.ro

183

Vous aimerez peut-être aussi