Vous êtes sur la page 1sur 60

Aplicaii SPSS

SPSS prezentare general


SPSS for Windows este un pachet de programe destinat analizei statistice a datelor. Dei exist o varietate de programe de acest gen (SAS, Statistica for Windows, GraphPad, MS Excel, care are i el funcii statistice), SPSS se distinge prin structurarea riguroas i uurina utilizrii, chiar i pentru nceptori. Cea mai recent versiune disponibil la aceast dat este SPSS 12.0. Acest manual nu acoper n mod special o anumit versiune, ci face referire n general la versiunile sub Windows. n esen, toate versiunile sub Windows ofer acelai pachet de funcii statistice iar diferenele, chiar dac sunt, nu sunt relevante la nivelul unui curs introductiv de statistic. Simbolul care precede aceast propoziie indic introducerea unei informaii importante, care se impune a fi reinut. Ne vom axa pe o prezentare sintetic, axat pe esenial, considernd cunoscute elementele de baz de operare n mediul Windows.
Funcii de baz ale SPSS

editarea datelor (construirea bazelor de date, transformri ale variabilelor) prelucrarea statistic a datelor (statistici descriptive, teste de semnificaie) prezentarea rezultatelor, sub form numeric sau grafic realizarea unor proceduri proprii de prelucrare sau de a modifica procedurile standard SPSS. Aceast opiune este rezervat utilizatorilor avansai i nu va face obiectul prezentrii n acest manual.

Domeniile de lucru n SPSS Particularitatea principal a interfeei de lucru cu SPSS este aceea c rezerv fiecreia dintre funciile de mai sus un domeniu special (ecran, sau fereastr). Astfel, la lansarea programului, acesta deschide automat o fereastra rezervat editrii datelor (Data Editor) i una afirii rezultatelor (Viewer). Putem numi aceste ferestre i domenii de lucru, deoarece la nivelul fiecruia avem la dispoziie o varietate de funcii i opiuni specifice. Ca s nelegem mai bine, trebuie s ne imaginm domeniile de lucru ca fiind ferestre distincte, similare celor ale documentelor Word, cu deosebirea c, n acest caz, fiecare fereastra acoper funcii specifice. Trecerea de la o fereastr la alta se face ntr-unul din urmtoarele moduri: Din meniul SPSS/Windows, prin alegerea ferestrei dorite; Utiliznd butoanele din bara de comenzi directe a ferestrei SPSS; Utiliznd butoanele de pe bara de sarcini a sistemului de operare (din partea de jos a ecranului).

-2-

Domeniul bazei de date (Data Editor) La lansarea programului SPSS se deschide fereastra domeniului de editare a datelor (SPSS Data Editor). Ea se prezint ca n imaginea de mai jos, avnd caracteristicile obinuite ale unei ferestre Windows, cu o structur de linii i coloane: - pe coloane sunt variabilele (de ex., cod_sub, rezultat) - pe linii sunt cazurile (n acest caz, cinci subieci)

O sesiune de lucru cu SPSS presupune, n mod necesar, existena unei baze de date. SPSS opereaz cu o singur baz de date la un moment dat. Pentru a deschide o alt baz de date, sau a crea una nou, cea aflat n lucru va fi nchis. Programul solicit salvarea ei prealabil, dac acest lucru nu a fost deja efectuat. Dac vrem s prelucrm date aflate n baze de date (fiiere) diferite, este necesar aducerea lor n aceeai baz de date (procedura DATA-Merge files, care va fi descris mai trziu). Meniurile ferestrei Data Editor nu se vor activa integral dect atunci cnd va exista cel puin o variabil definit i valori pentru cel puin un caz. Baza de date SPSS poate fi creat direct, cu ajutorul structurii (ferestrei) Data Editor, sau poate fi deschis cu ajutorul comenzii File-Open, aa cum vom exemplifica mai trziu. Domeniul afirii rezultatelor (Viwer) SPSS depune rezultatele prelucrrilor ntr-o seciune aparte a domeniului de lucru. Aceasta cuprinde toate tipurile de rezultate, att de tip numeric ct i de tip grafic. Fereastra respectiv (Viewer) este organizat n dou zone distincte: una pentru navigare (n partea stng) i alta pentru afiarea rezultatelor (n partea dreapt).

-3-

Fiierul rezultat prin salvarea acestei ferestre are extensia .SPO Un fiier cu rezultate SPSS nu poate fi deschis dect din SPSS Dac se dorete transmiterea rezultatelor n afar SPSS se va proceda fie la exportul rezultatelor cu procedura corespunztoare din meniul File/Export, fie la transferarea prin Select/Copy/Paste ntr-un editor grafic de tipul MS Word. Domeniul de editare a procedurilor directe (Syntax) SPSS permite, n afara operrii prin intermediul mediurilor, i lucrul direct cu proceduri definite de utilizator. Aceasta se face n interiorul unei ferestre speciale, care permite, pe de o parte, editarea procedurilor, iar pe de alt parte, lansare lor n execuie. Imaginea de mai jos red comenzile SPSS pentru calcularea procedurii de calcul indicatorilor statistici descriptivi, redai mai sus, n fereastra SPSS Viewer.

Utilizarea direct a procedurilor impune aprofundarea SPSS Se poate seta afiarea procedurilor curente n SPSS Viewer, concomitent cu rezultatele. (Edit/Options/Viewe/Display commands in the log)

-4-

Meniurile SPSS Meniurile de tip list se aseamn cu meniurile altor programe sub Windows. Fr a intra n amnunte, iat o prezentare succint a meniurilor pentru fereastra DATA EDITOR:

Meniul File Edit

View

Data

Funcii principale Operaii de deschidere i salvare de fiiere Operaii de Select/Copy/Cut/Paste, Find i, cel mai important, setarea caracteristicilor de lucru ale SPSS (Options-n versiunile pt. Win 9X) n cazul ferestrei Data Editor, seteaz modul de afiare: cu sau fr bara de butoane, cu sau fr liniile despritoare ale celulelor. Funcii de operare cu variabilele; definire, inserare, tergere, selectare, sortare, adiionare de fiiere, etc. Funcii de modificare a datelor prin calculare, recodificare.

Observaii

Transform

Statistics (Analyze) Graph Utilities Window

Grupeaz procedurile de calcul statistic Grupeaz procedurile de reprezentare grafic Informaii despre variabile, structurare pe seturi de variabile Lista ferestrelor deschise cu posibilitatea de selecie

Importante pentru pregtirea datelor n vederea prelucrrii Importante pentru pregtirea datelor n vederea prelucrrii Prin opiunile fiecrei proceduri se pot obine i reprezentri grafice specifice

Help

Informaii de ajutor

Aici se afl un tutorial extrem de sugestiv de operare cu SPSS, iar de la versiunea 7.5 n sus, o procedur de sprijin n alegerea tipului de prelucrare statistic (Statistic Coach)

Paii analizei statistice cu SPSS


n principiu, prelucrarea datelor cu SPSS presupune urmtoarele etape: Opiuni: (a) Introducerea direct a datelor n DATA EDITOR (b) Deschiderea unui fiier de date SPSS (extensia .SAV) (c) Importarea unui fiier de format diferit (se alege din

Introducerea datelor

-5-

Pregtirea datelor Selectarea procedurii satistice Selectarea variabilelor ce urmeaz a fi supuse prelucrrii Rularea procedurii

caseta File open/File of type) Corecia erorilor, selecii, recodificri, transformarea variabilelor prin calcule, declararea valorilor lips, combinarea datelor din dou fiiere diferite (meniurile Data, Transform) Meniurile Statistics (sau Analyze) i Graphs n conformitate cu configuraia casetei de dialog care este afiat la fiecare procedura Se acioneaz butonul OK din caseta de dialog a procedurii Butonul devine activ numai atunci cnd sunt ntrunite condiiile presupuse de procedura respectiv Rezultatele prelucrrilor sunt afiate ntr-o fereastr specific (SPSS Viewer), cu funciuni de editare grafic sau de tip text, n funcie de versiune. Se editeaz rezultatele afiate n Viewer, aducndu-le la forma dorit sub aspect grafic Dublu clic pe un element din Viewer conduce la intrarea elementului respectiv n regim de editare) Rezultatele din SPSS Viewer se preiau cu Select/Copy i se depun cu Paste n orice tip de editor de documente.

3 4

Analiza rezultatelor

Editarea rezultatelor Inserarea datelor ntrun document

SPSS este un program puternic de analiz statistic a datelor. Utilizarea lui optim presupune, n mod necesar, stpnirea de ctre operator a cunotinelor teoretice de statistic. Aa cum un program de editare grafic nu compenseaz lipsa de talent la desen, nici SPSS nu poate fi cu adevrat exploatat de ctre cei care nu au cunotine de statistic. n lipsa acestora, nici alegerea procedurilor i nici interpretarea rezultatelor nu va fi cu adevrat posibil.

-6-

Editarea datelor
O baz de date n SPSS este o structur format din linii i coloane, la intersecia crora se formeaz celulele care conin, fiecare, o anumit unitate de informaie. Existena unei baze de date deschis n fereastra Data Editor este o condiie obligatorie pentru operarea cu SPSS SPSS opereaz numai cu o singur baz de date deschis la un moment dat n principiu, o baz de date SPSS se obine pe una din urmtoarele ci: a) Crearea ei prin operaiunea de definire a variabilelor i introducerea datelor de la tastatur; b) Deschiderea unei baze de date SPSS, existente pe un suport de memorie; c) Importarea unei baze de date din alt format dect SPSS n continuare, vom trata pe rnd, fiecare din cele trei situaii: a) Crearea unei baze de date SPSS n linii generale, pentru crearea unei baze de date proprii n SPSS, se procedeaz astfel: Se lanseaz SPSS Se definesc variabilele bazei de date n domeniul Data Editor Se introduc datele pentru fiecare caz (subiect) n parte Se salveaz baza de date (extensia specific este *.sav) Definirea variabilelor se acioneaz Define variable din meniul Data soluie mai direct este dublu clic pe capul de coloan

n versiunile de SPSS mai recente, editarea variabilelor se face ntr-o fereastr special. Cu toate acestea, elementele de baz rmn aceleai ca al versiunile anterioare.

-7-

Ca urmare a operaiei de mai sus, apare o caset de dialog ca n imaginea de mai jos (forma ei nu difer substanial de la o versiune de SPSS la alta). Dac privim caseta, vom observa urmtoarele elemente:

Variable Name: zona de declarare a numelui de variabil. VAR00001 este numele implicit al primei variabile. Acesta se terge, pentru a fi nlocuit cu numele pe care dorim s l dm variabilei. Variable Description, este o zona informativ n care sunt afiate caracteristicile predefinite ale noii variabile. Aceste caracteristici se pot seta n Edit-Options (sau Preferences, la unele versiuni). Change Settings, este o zon care cuprinde butoane de comenzi pentru modificarea setrilor implicite: n zona Measurement, se permite declararea tipului de msurare specific variabilei: Scale (Interval/Raport); Ordinal; Nominal Butoanele OK (pentru finalizarea definirii variabilei, Cancel (pentru renunarea la definirea variabilei, Help (informaii legate de definirea variabilelor) n versiunile mai recente de SPSS editarea variabilei nu presupune acest tip de caset, dar toatele elementele ei constitutive se regsesc.

Numele variabilei: Orice variabil SPSS trebuie s aib un nume. Cele mai importante aspecte legate de denumirea variabilelor sunt urmtoarele: Trebuie sa fie format din minim 1, maxim 8 caractere, Nu sunt suportate caractere speciale cum ar fi spaiu sau semne de punctuaie

-8-

n cazul utilizrii unor caractere improprii, apare un mesaj de eroare i se permite corectarea numelui. Alegerea numelui este la latitudinea operatorului. Respectarea anumitor convenii poate fi, ns, extrem de util, mai ales dac avem de a face cu o baza de date cu multe variabile. Iat cteva recomandri utile n acest sens (ele nu sunt obligatorii): Numele s exprime, pe ct posibil, coninutul variabilei Pentru variabile nrudite, se va utiliza o schem de denumire care s exprime acest lucru. De exemplu, dac avem variabile care cuprind valori ale timpului de reacie msurat n mai multe condiii, putem declara variabilele TR_1, TR_2, TR_3 .a.m.d., caracterul underscore este recomandabil ca separator n cadrul numelui de variabil). Dac ntr-o situaie de acest gen am avea 10 sau mai multe momente, este de preferat s se declare nume de genul TR_01, TR_02,...TR_10, etc., deoarece ulterior SPSS aranjeaz alfabetic variabilele n listele de selecie i, astfel, se pstreaz ordinea dorit. ntr-o baz de date nu pot exista dou variabile cu acelai nume! Exist o serie de cuvinte rezervate, a cror utilizare ca nume de variabile nu este acceptat de program. Acestea sunt: ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT, OR, THRU, TO, WITH. Definirea tipului de variabil Tipul de variabil se refer la Se acioneaz butonul Type de pe caseta Define Variable Apare caseta Define Variable Type

, unde se marcheaz tipul variabilei i se declar caracteristicile acesteia (Width, Decimal Places, n cazul variabilelor numerice) Se acioneaz butonul Continue, pentru a se reveni la caseta Define Variable. Aa cum se observ n caseta Define Variable Type din imaginea de mai sus, SPSS poate opera cu o varietate de tipuri de variabile. Fiecrui tip i corespund anumite proprieti (caracteristici) care trebuie definite de operator. Cele mai uzuale sunt tipurile: [Numeric], care cuprind valori de tip numeric cu sau fr zecimale.

-9-

Proprieti: numrul de cifre necesare pentru exprimarea ntregilor numrul de zecimale EXEMPLE: Pentru o variabil n care vom introduce vrsta n ani mplinii, vom defini Type Numeric cu Width 2 (presupunnd c nu avem subieci cu vrsta peste 100 de ani) i Decimal Places 0. Pentru o variabil n care vom introduce rezultatul la un test exprimat n scoruri T cu o zecimal, definim Type Numeric cu Width 2 i Decimal Places 1. [Caracter] (String), care cuprind valori exprimate sub form de caractere alfanumerice (litere sau chiar cifre). Proprieti numrul de caractere rezervat, care este fixat implicit la 8, dar poate fi modificat dup dorin. SPSS face distincie ntre variabile de tip caracter scurte (Short string) i lungi (Long string). Primele au maxim 8 caractere i pot fi incluse n unele proceduri statistice (semnificaia diferenei ntre medii, de exemplu), pe cnd celelalte nu pot fi utilizate dect n operaii de listare (cazul variabilei de genul nume, de ex.). Dei permis, utilizarea variabilelor string nu este de preferat. Toate variabilele care suport codificri vor fi, de preferin, introduse cu valori numerice. Utilizarea acestora n proceduri statistice nu este limitat de nici o restricie. Uniti de timp calendaristic sau orar [Date], care pot include valori de timp ntr-un format specificat, aa cum se vede n imagine. Proprieti formatul de ntroducere, care poate fi unul din cele evideniate n caseta Define Variable Type/Date Exemplu: dd-mmm-yyyy presupune introducerea unor valori de genul 21-FEB2001 (luna fiind scris obligatoriu dup prescurtarea ei n englez).

Exist o mare varietate de formate pentru acest tip de variabil, acoperind, practic, orice cerin posibil din partea utilizatorului. Variabilele de tip Date beneficiaz de funcii speciale de tratare i analiz n SPSS.

- 10 -

Nu vom prezenta i celelalte tipuri de variabile, ele fiind mai puin folosite, dar facem precizarea c semnificaia lor poate fi gsit n Help-ul casetei Define Variable Type. Tipul unei variabile poate fi schimbat ulterior prin simpla redefinire a acesteia. Se va acorda atenie mesajelor care pot s apar i care avertizeaz asupra eventualelor pierderi de informaie prin schimbarea tipului. Opiunile din zona Measurement (Scale, Ordinal, Nominal), care se regsesc doar la versiuni SPSS de la 7.0 n sus, nu au ntotdeauna o utilitate practic dar marcarea lor corect este necesar pentru anumite proceduri statistice sau grafice. Etichetarea variabilelor i a valorilor Etichetarea este o form de descriere explicit a coninutului variabilei (avnd n vederea c numele variabilei nu poate fi mai mare de 8 caractere). Etichetarea se poate practica att la nivelul variabilei dar i la valorile pe care le conine, n cazul variabilelor de tip nominal sau ordinal. Pentru etichetare se apas butonul Labels de pe caseta Define Variable. Se deschide o nou caset (Define Labels), care conine spaii pentru eticheta variabilei (Variable Label) i pentru etichetele valorilor (Value labels). Eticheta variabilei nu se supune restriciilor pentru nume, putnd conine oricte caractere (max. 255), dar i spaii sau alte semne grafice tipribile. Etichetele pentru valori vor fi introduse una cte una, astfel: se plaseaz valorea etichetatn zona Value se introduce eticheta corespunztoare n zona Value label se acioneaz butonul Add Operaiunea se reia pentru toate valorile pe care dorim s le etichetm. Imaginea prezint etichetarea valorilor unei variabile care se refer la calificativul la un examen. Se observ c valoarea 1 are eticheta SLAB, valoarea 2, eticheta MEDIU iar valoarea 3, eticheta BUN (nc nu a fost acionat butonul Add pentru a fi finalizat declaraia etichetei acestei valori).

Dei nimic nu ne oblig s aplicm etichete variabilelor i valorilor, este foarte recomandabil ca ele s fie atribuite.

- 11 -

Etichetele ajut la citirea mai uoar a rezultatelor (deoarece apar alturi de acestea). n plus, etichetele sunt asociate prelucrrilor grafice (histograme, bare, etc.) fapt care reduce necesitatea de a le introduce ulterior prin editarea respectivelor grafice. Pentru a ti cum s declarm etichetele, este bine s ni le imaginm ca fiind nscrise pe axele de referin ale unui grafic. Dac se potrivesc, atunci au fost bine definite. Oricum, ele vor putea fi modificate ulterior sau editate direct n SPSS Viewer. Declararea valorilor lips (missing values) Valorile lips sunt de dou tipuri: valori lips de sistem (system missing values) adic valori care lipsesc din baza de date (nu au fost introduse). Forma lor de evideniere pe ecran este un punct plasat n celula respectiv. valori lips declarate de utilizator (user missing values) adic valori pe care utilizatorul le declar ca atare. Acestea pot exista n baza de date dar utilizatorul, din diverse motive, nu dorete s fie luate n calcul. Atenie, odat declarate, aceste valori nu sunt terse i nici nu sunt marcate n mod evident pe ecran. Pentru declararea valorilor lips se acioneaz butonul Missing Values din caseta Define Variables, care genereaz apariia casetei de dialog alturate.

Se observ c exist mai multe opiuni: declararea a trei valori distincte ca fiind lips (Discrete missing values) declarea unui domeniu de valori lips (Range of missing values) declararea unui domeniu la care se poate aduga i o valoare distinct (Range plus one discrete missing value) Dei nu pare foarte evident acum, utilitatea funciei de declarare a valorilor lips nu trebuie subestimat. Foarte adesea suntem nevoii s scoatem din prelucrri anumite valori (care nu pot fi totui, pur i simplu, terse). S ne gndim numai la valorile extreme ale unei distribuii, a cror meninere n anumite prelucrri poate determina modifcri semnificative a rezultatelor. n concluzie, declararea variabilelor se compune din urmtoarele operaiuni: Atribuirea numelui (maxim 8 caractere)

- 12 -

Definirea tipului (numeric, caracter, data) Atribuirea etichetei variabilei Atribuirea etichetei valorilor, n cazul variabilelor msurate pe scale nominale sau ordinale Declararea valorilor lips (care nu au fost recoltate n procesul de msurare, din diferite motive) tergerea i inserarea variabilelor tergerea unei variabile se face prin selectarea acesteia (clic pe capul de variabil) i acionarea tastei Delete (sau se comand din meniul Edit-Cut). Inserarea unei variabile se face prin plasarea cursorului-celul pe coloana variabilei n stnga creia dorim s inserm noua variabil (sau prin selectarea variabilei respective), dup care se comand, din meniul Data-Insert variable. Dup aceasta, se definete variabila inserat (nume, tip, etichete). tergerea i inserarea cazurilor tergerea cazurilor se face n mod similar variabilelor, prin selectarea acestora (clic pe capul de linie) i tasta Delete (sau Edit-Cut). Se pot selecta mai multe cazuri simultan (drag cu mouse-ul pe capul liniilor) dup care se terg ca mai sus. Inserarea cazurilor se face dup plasarea cursorului pe linia deasupra creia dorim s inserm un nou caz, dup care se acioneaz n meniul Data-Insert case. Pentru versiunile de SPSS de la 7 n sus, clic dreapta pe capul de coloan sau de linie, produce un meniu contextual care permite un acces mai rapid la funciile de inserare/tergere. SPSS nu permite Undo (n meniul Edit) dect limitat la ultima aciune. Din acest motiv, tergerea variabilelor sau a cazurilor trebuie s se fac cu atenie, pentru c datele pot fi definitiv pierdute. Se va reine, totui, c baza de date se actualizeaz pe hard disk numai dup salvarea comandat de utilizator. Ca urmare... Orice modificare efectuat nu produce efecte dect asupra datelor din memoria de lucru, fiierul rmnnd nemodificat. n cazul unei aciuni care produce efecte nedorite asupra bazei de date, exist soluia nchiderii bazei de date, fr a se accepta salvarea cerut de program, dup care se deschide fiierul respectiv din nou. Erori frecvente - Apariia unor cazuri inutile, (umplute cu system missing values) la sfritul unei baze de date. Explicaie: Introducerea inutil a unei valori ntr-o variabil, valoare care apoi este tears. Cu toate acestea, SPSS a creat deja un caz nou, pe care l-a umplut cu system missing values. Soluie: Selectarea cazului prin apsarea pe capul de linie i acionarea tastei Delete (sau Edit-Cut). - Apariia unor variabile inutile (nedorite).

- 13 -

Explicaie: La introducerea din greeal a unei valori ntr-o variabil nedefinit n prealabil, SPSS creeaz automat o variabil implicit, pe care o denumete VAR00001. Soluie: Se selecteaz variabil resectiv (clic de mouse pe capul de coloan) i se acioneaz tasta Delete (sau Edit-Cut).

Exemplu practic de realizare a unei baze de date


S ne imaginm c am aplicat testul Eysenck Personality Inventory, care vizeaz urmtoarele caracteristici de personalitate: extraversiunea, nevrozismul i atitudinea defensiv (scala Lie). Pentru analiza datelor suntem interesai s raprtm rezultatele la o serie de caracteristic demografice ale subiecilor, s zicem: sexul i vrsta. n plus, pentru a avea controlul datelor dorim s inregistrm i identitatea subiecilor. Pentru fiecare dintre informaiile pe care dorim s le introducem n baza de date vom crea cte o variabil. Variabila Numele Tipul variabilei Eticheta Etichetele variabilei variabilei valorilor COD (optm numeric, Width 2, Identitate Nu se aplic Identitatea pentru un cod Decimal Places 0 etichete subiecielor (esentiala pentru numeric dac (presupunem c nu dect la a asigura nu avem avem mai mult de 99 valorile identitatea nevoie de subieci) variabilelor fiecarei numele de tip inregistrari subiecilor) categorial inparte si pentru (nominale realizarea sau corespondentelor ordinale) cu alte baze de date in care avem informatii cu privire la aceiai subieci) SEX Numeric, Width 1, Sex 1=feminin Sexul Decimal Places 0 2=masculin Vrsta (n ani VIRSTA Numeric, Width 2, Vrsta mplinii; sau n Decimal Places 0 luni dac dorim (presupunem c nu mai mult avem subeici cu precizie) vrsta peste 99 de ani) Extraversiune EXTRAV Numeric, Width 2, Extraversiune Decimal Places 0 (nu se poate obine o valoare mai mare de 100 i nu exist zecimale) Nevrozism NEVRO Numeric, Width 2, Nevrozism

- 14 -

Lie

LIE

Decimal Places 0 (nu se poate obine o valoare mai mare de 100 i nu exist zecimale) Numeric, Width 1, Decimal Places 0 (nu se poate obine o valoare mai mare de 9 i nu exist zecimale)

Minciun

Se observ faptul c pentru variabile ale cror nume exprim exact coninutul (SEX, VRSTA) se poate utiliza fr nici un inconvenient numele i ca etichet. Pentru a fi mai explicii, s spunem c numele variablei este util n primul rnd SPSS-ului pentru a manipula variabilele, n timp ce etichetele sunt necesare mai ales utilizatorului pentru a nelege cu uurin la ce se refer o variabil al crui nume prea scurt Avem alturat, imaginea DATA EDITOR pentru primii trei subieci introdui cu variabilele de mai sus:

Insistm pe declararea, cu precdere, a variabilelor de tip numeric: SPSS este un program de prelucrare statistic, fapt care implic date numerice. Dei el poate opera i cu date de tip caracter, acestea nu sunt acceptate pentru toate tipurile de proceduri statistice. Pentru a nu avea surprize, este recomandabil s fie utilizate variabile de tip numeric n toate cazurile. De exemplu, variabila sex, poate fi declarat de tip caracter (cu valorile M si F) dar, la fel de bine, de tip numeric (cu valorile convenionale 1 i, respectiv, 2). n acest din urma caz, pentru explicitarea valorilor se vor folosi etichetele de valoare (value label). Introducerea unei variabile care s conin numele subiecilor poate fi necesar doar dac ne propunem realizarea unor liste ale subiecilor din baza de date. Altfel, identificarea numeric a fiecrei nregistrri este suficient (i absolut necesar), scutind un mare volum de munc pe care l-ar implica introducerea numelor. Vom

- 15 -

avea grij ns, ca pe documentul original s scriem codul numeric aferent fiecrui subiect, astfel nct, la nevoie, s se poat identifica numele (pentru corecii, de ex.) Variabile multiple pentru ntrebri cu rspuns multiplu: De obicei, o ntrebare prezint un singur rspuns, dar pot fi situaii n care o ntrebare prezint rspunsuri multiple care pot fi alese n acelai timp. De exemplu: Ce activiti preferai pentru timpul liber? 1. sport; 2. filme; 3. petreceri cu prieteni..., etc. ntr-un asemenea caz ne putem atepta s avem mai multe rspunsuri la aceeai ntrebare. Soluia pentru introducerea datelor este, de aceea, crearea mai multor variabile, cte una pentru fiecare variant de rspuns. Astfel, vom avea variabila SPORT care poate primi dou valori, sa zicem 1 dac este aleas i 0 dac nu este aleas, i aa mai departe. n acest mod vom putea analiza frecvena alegerilor pentru fiecare variant de rspuns n parte. Evitarea variabilelor redundante: Dac la un test nu sunt posibile, de exemplu, dect rspunsuri corecte sau greite, atunci nu este necesar s declarm o variabil pentru corecte i una pentru greite dac suma lor d totalul rspunsurilor. Salvarea bazei de date din Data Editor O baz de date aflat n lucru nu are un corespondent ntr-un fiier dect dup ce se execut o salvare a acesteia. Acest lucru nu trebuie niciodat uitat. Spre deosebire de WORD de exemplu, SPSS nu are o funcie de salvare automat dup un interval de timp prestabilit. Cu alte cuvinte, indiferent ce modificri facem n Data Editor pe ecran, datele respective vor fi salvate numai la comanda explicit a operatorului. Pentru o baz de date nou creat, salvarea se face n mod similar cu orice alt program cunoscut: File-Save as, care deschide urmtoarea caset de dialog: Se alege locaia de salvare (Save in) Se d un nume fiierului (File name) Se verific tipul de fiier (formatul implicit pentru baze de date SPSS are extensia .sav) Se acioneaz Save

SPSS poate salva i n alte formate, dintre cele mai importante fiind: Dbase sau FoxPro, Lotus 1-2-3, Excel. Salvarea n aceste formate poate fi util pentru transferul datelor pentru prelucrri ulterioare n alte programe.

- 16 -

Deschiderea unei baze de date SPSS O baz de date creat cu SPSS se deschide cu comanda File-Open, care activeaz urmtoarea caset de dialog: Se alege locaia de citire (Look in) Se indic fiierul dorit (selectarea cu mouse-ul) n fereastra de cutare Se indic tipul de fiier ce urmeaz a fi deschis (implicit este de tip SPSS cu extensia .sav) Se acioneaz Open

n cazul deschiderii unui fiier de alt tip dect SPSS, se va alege tipul respectiv din lista Files of type. n cazul n care SPSS nu recunoate tipul de fiier n care se afl datele noastre, putem ncerca transformarea lor prealabil din formatul original ntr-un format recunoscut de SPSS. Dei exist riscul pierderii unor aspecte ce in de formatul de reprezentare a datelor, operaiunea scutete totui un mare volum de munc.

- 17 -

Operaii de transformare a variabilelor


Dac privim variabilele SPSS din punctul de vedere al modului n care au fost create, putem distinge dou categorii: b) variabile primare care includ valori rezultate direct din cercetare si au fost introduse, de regul, de la tastatur. c) variabile secundare rezultate prin transformrile aplicate variabilelor primare. Exemple de situaii n care se impune transformarea variabilelor: Avem mai multe variabile primare care conin rspunsurile la ntrebrile unei scale de tip Lickert i suntem interesai s calculm (ntr-o variabil secundar) suma rspunsurilor. Avem un numr de variabile primare n care se afl rezultatul parial pentru fiecare minut din cele 10 cte dureaz un test de calcul aritmetic i dorim s crem o nou variabil ( secundar) n care s avem media performanei pe cele 10 minute sau abaterea standard a performanei pe cele 10 minute, pentru fiecare subiect, Avem o variabil care conine data naterii i dorim s crem pe baza ei o alt variabil, care s conin vrsta. Dorim s transformm variabila care conine vrsta, ntr-o alt variabil care conine valori pentru categorii de vrst. Pentru toate aceste situaii, care sunt unele dintre cele mai des ntlnite, dar i pentru multe altele nc, SPSS ofer proceduri de transformare n meniul Transform. n continuare, vom prezenta cteva dintre cele mai frecvent utilizate funcii de transformare a variabilelor. nsumarea valorilor variabilelor Se utilizeaz atunci cnd dorim s obinem o variabil prin adunarea valorilor din dou sau mai multe variabile. Imaginea de mai jos prezint o tabel de date SPSS care cuprinde scorurile la trei examene pariale (scor_1, scor_2 si scor_3). Dorim s realizm o variabil care s cuprind un scor general, prin nsumarea celor trei variabile. Se poate observa c unii dintre subieci nu au valori la toate cele trei scoruri (valori lips de sistem).

- 18 -

Deoarece prin calculare, o nou variabil este plasat dup toate variabilele existente, am preferat s inserm o nou variabil imediat dup cele trei pe care dorim s le nsumm. n acest fel avem i posibilitatea s controlm uor corectitudinea operaiei de nsumare Se apeleaz procedura Transform-Compute, care deschide caseta de mai jos:

Se efectueaz urmtoarea succesiune de operaii: 1. Se introduce numele noii variabile n zona Target Variable (total). 2. Se scrie expresia de nsumare n zona Numeric Expression. Funcia este SUM (expresie numeric, expresie numeric, ...), aa cum se vede i n zona listei Functions: Ea poate fi scris de la tastatur sau selectat din lista de funcii i ridicat prin acionarea butonului . Atenie, sintaxa fiecrei funcii trebuie respectat ntocmai. n cazul nostru, variabilele numerice se vor scrie ntre paranteze, una cte una, cu virgul ntre ele. Variabilele pot fi scrise de la tastatur sau mutate la rndul lor din lista de variabile cu butonul . - 19 -

Dac variabilele ce vor fi nsumate se afl n baza de date una dup alta, ca n cazul exemplului nostru, atunci avem posibilitatea s scriem o expresie de nsumare simplificat, astfel SUM (prima_variabil TO ultima_variabil). n acest caz, clauza TO va fi cuprins ntre spaii, pentru a nu fi confundat cu un nume de variabil. Aceast opiune ne sugereaz ct de important poate fi s aranjm corespunztor variabilele n structura unei tabele SPSS. 3. Se apas butonul OK 4. Deoarece variabila total exist, SPSS ne ntreab dac dorim s modificm coninutul acesteia. Dac nu ar exista o variabil cu acest nume, rezultatul operaiei de calcul ar fi depus ntr-o variabil creat automat i amplasat dup ultima variabil din baza de date.

Rspundem OK, deoarece tim c am creat aceast variabil tocmai pentru a depune n ea suma.

Rezultatul operaiei se vede n imaginea de mai jos:

Calcularea mediei a dou sau mai multe variabile Presupunnd c n loc de sum, ne-ar interesa media valorilor de la mai multe variabile, se procedeaz n mod similar. Expresia de calcul a mediei este MEAN (expresie_numeric, expresie_numeric, ...), unde ... arat c putem pune oricte variabile (sau valori) numerice, cu virgul ntre ele. Ca i n cazul sumei, se poate realiza o expresie cu clauza TO, cu condiia ca variabilele pentru care se realizeaz media s se afle una dup alta n tabela SPSS.

- 20 -

Reamintim c funcia MEAN poate fi scris de la tastatur sau poate fi adus din lista de funcii, prin selectare i acionarea butonului . Este de la sine neles c expresia de calcul poate fi realizat i ntr-o manier simpl i direct, fr utilizarea funciilor (SUM sau MEAN), astfel: Pentru sum: scor_1+scor_2+scor_3 Pentru medie: (scor_1+scor_2+scor_3)/3 Se va face o distincie clar ntre suma sau media astfel obinute, care se refer la suma sau media valorilor de la mai multe variabile, pentru acelai subiect, i suma sau media pe care am calcula-o pe vertical, la nivelul fiecrei variabile n parte, pe ntreaga distribuie Se pot realiza diverse alte funcii de transformare, utilizndu-se marea varietate de funcii care se gsesc n lista Functions i a cror semnificaie se poate afl din Help-ul casetei Compute. Extragerea anului dintr-o variabil de tip cronologic (date) SPSS ofer funcii de transformare cu variabilele de tip cronologic. Dintre acestea, vom exemplifica cu realizarea unei variabile care s conin anul naterii, s zicem, scos dintr-o variabil care conine data naterii. Imaginea de mai jos este extras din baza de date Employee data.sav

Observm c variabila bdate, care conine data naterii. Pentru a avea vrsta, trebuie s calculm diferena dintre anul curent (s zicem, 2000) i anul naterii: Pentru

- 21 -

aceasta trebuie s facem diferena dintre anul curent (2000) i anul naterii, care se afl n cmpul bdate. Pentru a avea variabila ce urmeaz a fi creat n apropierea variabilei bdate, vom insera o variabil (denumind-o virsta, de tip numeric, cu doi ntregi). Apoi utilizm procedura Compute din meniul Transform:

n cmpul Target variable introducem numele noii variabile (virsta). n zona Numeric Expression vom scrie expresia de transformare, care se bazeaz pe funcia XDATE.YEAR(). Aceast funcie are ca rezultat extragerea valorii care reprezint anul dintr-o variabil de tip dat calendaristic. n cazul nostru, XDATE.YEAR(bdate)=anul naterii Ca urmare, putem scrie expresia astfel: 2000-XDATE.YEAR(bdate) Mai jos putem vedea rezultatul procedurii Compute:

Se observ n variabil virsta, valorile rezultate prin transformare (corespunztoare anului 2000).Desigur, transformarea putea fi efectuat i n dou etape. Mai nti prin extragerea anului naterii ntr-o variabil separat i, apoi, prin efectuarea unei noi transformri realizarea diferenei dintre anul curent i anul naterii. Am preferat o soluie ntr-o singur etap pentru c este mai operativ. Posibilitile de transformare a variabilelor oferite de SPSS permit crearea unor noi variabile pe baza celor existente, n funcie de necesitile de prelucrare pe care le avem. n toate cazurile, ns, nu se va alege soluia modificrii valorilor

- 22 -

dintr-o variabil primar peste valorile deja existente. Cu alte cuvinte, este recomandabil s crem prin transformare variabile noi, i nu s modificm valorile existente din variabilele primare a cror pierdere ar necesita reintroducerea lor, n caz de necesitate. Recodificarea variabilelor Recodificarea unei variabile nseamn convertirea valorilor acesteia, cu scopul obinerii unei distribuii bazat pe frecvene cumulate. Procesul este similar cu crearea unei tabele de frecvene grupate i ne reamintim c poate fi derulat n maniera descris mai jos: Pai pentru gruprii de frecvene: Se face diferena dintre valoarea cea mai mare i valoarea cea mai mic a unei distribuii Se mparte valoarea obinut la mrimea posibil (estimat) a intervalului Se selecteaz mrimea intervalului care conduce la un numr de clase cuprins ntre 5 i 15 Se determin limita inferioar a primului interval (trebuie s fie un multiplu al mrimii intervalului) Se determin limita superioar a primului interval Se construiesc intervalele de clas pentru fiecare interval, fiind ateni s avem clase suprapuse sau intervale neacoperite n principiu, dei este recomandabil obinerea unei grupri de frecvene pe 5-15 clase, se poate opta pentru un numr de clase care servete cel mai bine interesul de cercetare. De exemplu, n cazul unei distribuii de vrst exprimat n ani, este preferabil s se opteze pentru clase cincinale sau decade, acestea avnd i o anumit semnificaie psihologic. n urma transformrii de mai sus, am obinut variabila virsta. Utilizarea ei ca atare n analize statistice este improprie, de aceea ar fi foarte util obinerea unei variabile care s asocieze anumite valori convenionale pentru categorii de virsta. Pentru aceasta putem efectua recodificarea variabilei virsta pentru a obine o distribuie grupat de frecvene, astfel: Se lanseaz procedura Recode - Into Defferent Variables din meniul Transform:

- 23 -

Atenie, se poate alege i opiune Into Same Variables, dar nu este recomandabil deoarece, n cazul unei erori, nu mai avem la dispoziie variabila iniial pentru o nou recodificare.

Pai de efectuat la apariia casetei Recode into Defferent Variable: se trece variabila virsta n zona Numeric Variable Output Variable. Semnul ntrebrii arat c se ateapt numele variabilei ce urmeaz s fie creat prin recodificare. Acest nume se scrie n zona: Name, dup care se apas butonul Change. Am ales, absolut convenional, ca nume al variabilei recodificate, v_clase. Urmeaz acum s descriem limitele claselor de recodificare. Pentru aceasta, se acioneaz butonul Old and New Values

Dei relativ complicat, caseta de declarare a noilor valori n funcie de cele vechi este uor de neles.

n zona Old value, se alege una dintre variantele de definire a valorilor de la care se pleac. S zicem c am ales soluia s recodificm anii pe intervale de zece ani, primul interval fiind 29-39, al doilea 40-49, .a.m.d. Pentru aceasta activm opiunea Range i scriem valorile limite al intervalului dorit. Dup aceasta, n zona New value oValue, scriem care este valoarea pe care o asignm acestei clase. n fine, acionm butonul Add pentru a definitiva operaiunea i trecem la definirea urmtoarei clase, pn terminm. n zona OldNew se poate observa lista recodificrilor definite. Se acioneaz butonul Continue i, la revenirea n caseta anterioar, butonul OK. Rezultatul operaiuni se vede mai jos:

- 24 -

Se observ corespondena dintre valoarea din variabila virsta, cu valoarea din variabila v_clase. Pentru valoarea 71, avem missing value n variabila v_clase, deoarece nu am definit un interval care s cuprind aceast vrst. (De regul, aceast situaie este determinat de o eroare de definire a intervalelor de clas. Pentru a o repara, ar trebui s intrm din nou n procedura Recode i s redefinim clasele).
relua.

Transformarea operat pe variabila vrst nu este de loc inutil. Dac am fi dorit s vedem n ce msur este o relaie ntre nivelul salariului i vrst, ar fi fost oarecum impropriu (fr a fi propriu-zis o greeal ) s utilizm o statistic parametric (corelaia). n analizele statistice pe vrste este recomandabil, totui, s operm cu grupe de vrst. Ordonarea dup rang a valorilor unei variabile Aa cum am spus n cuprinsul primei pri a acestui volum, este posibil s ne confruntm cu o variabil cantitativ ale crei valori nu respect condiiile unei statistici parametrice (vezi figura din stnga, unde valoarea 250 este excesiv). ntr-o situaie de acest gen, una din soluiile posibile este transformarea de rang, cu procedura Transform-Rank cases (caseta din dreapta):

- 25 -

Variabila vizat (scor) este trecut n lista Variable(s), se seteaz modul de ordonare (am ales atribuirea rangului 1 valorii celei mai mari) iar apoi am acionat butonul OK. Procedura permite fixarea unor parametri de transformare cu ajutorul butoanelor Rank i Ties, asupra crora nu insistm aici.

Organizarea datelor pentru analiz


SPSS permite efectuarea unor operaii de organizare a datelor care prezint un interes aparte pentru faza de analiz. Acestea sunt: sortarea, mprirea fiierului n subgrupuri, selectarea unor seturi de date, combinarea fisierelor (adugarea de cazuri, adugarea de variabile). Le vom trece n revist, pe rnd. Sortarea bazei de date Sortarea este operaia de aranjare a bazei de date n funcie de ordinea cresctoare/descresctoare a valorilor unei variabile. Ea este util mai ales pentru inspectarea direct a valorilor de la extrema unei distribuii sau pentru listarea ordonat a bazei de date. Procedura utilizat este: Data-Sort. Baza de date nesortat Caseta Sort Cases

Imaginea din caset descrie sortarea bazei de date, cresctor (Ascending), dup valorile variabilei scor (rezultatul se vede n imaginea de mai jos).

Se poate efectua sortarea simultan dup mai multe variabile, fiecare n sensul dorit, de exemplu: grup(Ascending) i scor(Descending). - 26 -

mprirea bazei de date n subgrupuri Baza de date SPSS poate fi mprit n subgrupuri, pentru analiz distinct. Atunci cnd datele sunt astfel organizate, orice procedur de analiz se va efectua distinct pentru fiecare subgrup. Procedura este: Data-Split File iar caseta de dialog este cea de mai jos:

Opiunile sunt: Analyze all cases, do not create groups (pentru analiza integral a datelor) Compare groups (rezultatele vor fi afiate astfel nct s poat fi uor comparate) Organize output by groups (rezultatele vor fi afiate n Viewer, separat pe grupuri) Operaia nu produce nici o modificare vizibil asupra bazei de date. Singurul efect se vede n zona de afiare a rezultatelor, unde toate procedurile de analiz vor fi afiate pentru fiecare subgrup n parte. Pentru a se reveni la analiza intergral a datelor, se va reveni n procedura Split File i se va seta opiunea Analyze all cases....

Selectarea unor seturi de date Selectarea unui set de date permite aplicarea procedurilor de analiz numai pe cazurile selectate. Dac nu se opteaz pentru tergerea datelor neselectate, ele vor fi pstrate i vor putea fi reintroduse n analiz. Procedura este Data-Select Cases.... Pentru exemplificare, s ne propunem selectarea din baza de date din imaginea de mai sus a cazurilor aparinnd grupului 1. Imaginea prezint: n partea stng, baza de date La mijloc, caseta principal Select Cases care are: o Zona listei de variabile o Zona fixare a condiiilor de selectare Select, unde:

- 27 -

o o o o

All cases este setarea implicit i nseamn c toate datele intr n analiz If condition is satisfied, se bifeaz atunci cnd se dorete declararea unei condiii de selectare bazat pe o funcie IF este butonul de deschidere a casetei pentru declararea condiiei, care deschide caseta Select Cases: if. n cazul nostru, am trecut variabila grup n zona de editare a functie i am declarat-o egal cu 1. Astfel, toate cazurile din baza de date care au grup=1 vor fi analizate, celelalte fiind ignorate. Exemplul se bazeaz pe o selecie simpl, dar sunt permise selecii bazate pe funcii mai complicate sau care pot s includ combinaii de variabile. Random sample of cases, permite selectarea unui set aleator de cayuri din baya de date Based on time por case range, permite selectarea cazurilor n funcie de poziia din baza de date. Use filter variable, selecteaz pe baza valorile unei variabile filtru Unselected cases Are, permite opiunea de filtrare a cazurilor neselctate (Filtered) sau de eliminare a lor (Deleted). n acest din urma caz, cazurile neselectate vor fi terse, dar baza de date, dar actualizarea fiierului de pe hard disk se va face numai dup prima comanda Save.

Dup finalizarea operaiei de selectare de mai sus, baza de date se prezint n felul urmtor:

- 28 -

Marcarea cu o diagonal a capului de linie corespunztor cazurilor neselectate Apariia unei variabile de sistem filter_$ care conine valoarea 0 pentru cazurile
neselectate i valoarea 1 pentru cazurile selectate. Aceast variabil poate fi ulterior utilizat n procedurile de analiz, ca variabil independent (caz n care se va anula situaia de selectare, prin bifarea opiunii All cases). Selectarea este utilizat n mod obinuit, pentru alegerea temporar a unui set de date. Adesea se uit anularea unei selectri existente, atunci cnd se dorete revenirea al analiza tuturor cazurilor. Efectul este obinerea unor rezultate pe date pariale. Alte operaii de organizare a datelor pentru analiz Opiunile SPSS pentru organizarea datelor sunt mult mai numeroase dect cele descrise mai sus. Fr a le trata n amnunt, ne vom mulumi s le prezentm sumar: Agregarea cazurilor, atunci cnd exist nregistrri multiple pentru fiecare subiect i se dorete pstrarea uneia singure (Data-Agregate) Adugarea unor cazuri din alt baz de date SPSS (Data-Merge Files-Add cases...) Adugarea unor variabile din alt baz de date SPSS (Data-Merge Files-Add variables...) Inversarea liniilor cu coloanele (Data-Transpose...)

Se observ:

- 29 -

Calcularea indicatorilor statistici descriptivi


Reamintim faptul c statistica descriptiv are ca obiectiv analiza caracteristicilor variabilelor. Principalele elemente de statistic descriptiv sunt: reprezentarea ntregii distribuii, pe cale: o numeric (analiza de frecvene) o grafic (bar, histogram, box-plot, stem and leaf) valorile tendinei centrale o mod o medie o median valorile mprtierii o amplitudine o abatere standard valorile formei distribuiei o indice de simetrie (skewness) o indice de boltire (kurtosis) SPSS ofer posibiliti variate de reprezentare i de calcul a acestor indicatori. n acest sens exist, pe de o parte, proceduri specializate i, pe de alt parte, opiuni care pot fi accesate din interiorul altor proceduri. Fie i acest aspect numai, ar trebui s sugereze c analiza statistic descriptiv, n ciuda caracterului ei elementar, este o component indispensabil a analizei statistice. n ceea ce privete procedurile specializate, ele se lanseaz din meniul StatisticsSummarize (sau Analyze-Descriptive statistics, pentru versiunile mai noi de SPSS) i sunt grupate n trei proceduri: Frequencies, Descriptives i Explore. Aceste proceduri ofer prelucrri distincte dar conin i rezultate comune. Alegerea uneia sau alteia dintre ele depinde de necesitile de analiz.

Procedura Frequencies Este singura care permite analiza de frecvene. La apariia casetei Frequencies, variabila pe care dorim s o supunem analizei va fi trecut n lista de calcul Variable(s), prin selectarea ei i acionarea butonului de

- 30 -

transfer (). Pot fi incluse mai multe variabile n aceast list, rezultatele fiind afiate distinct, pentru fiecare n parte.

Se va observa pe caseta de mai sus bifarea opiunii pentru tabela de frecvene, care este funcia specific a acestei proceduri. n plus, prin acionarea butoanelor din partea de jos a casetei se pot seta alte analize, astfel: Butonul Statistics Butonul Chart Butonul Format Se aleg indicatorii statistici Se alege tipul de Se aleg diverse moduri de descriptivi dorii grafic dorit prezentare a rezultatelor

Rezultatele sunt afiate n SPSS Viewer n forma de mai jos (dar unele sub altele, nu alturat, aa cum sunt aranjai aici): Indicatorii statistici descriptivi Tabelul de frecvene Histograma

Procedura Descriptives

- 31 -

Aceast procedur vizeaz doar indicatorii statistici descriptivi. La lansare, Satistics-Descriptives, se deschide caseta principal Descriptives. Se trec variabilele vizate n lista Variable(s) (dac dorim calcularea scorurilor z, se Se aleg indicatorii dorii din Options bifeaz opiunea din stnga-jos a casetei )

Rezultatul analizei, din Viewer

Imaginea bazei de date, n care se vede apariia variabilei zscor (denumit automat de progarm) cu valorile transformate n scoruri z.

Procedura Explore Procedura Explore este cea mai complex dintre toate procedurile statisticii descriptive i se poate utiliza atunci cnd se dorete o analiz exhaustiv a variabilei (sau variabilelor). Caseta principal Explore

n Dependent List se includ variabilele de analizat n Factor List se includ eventualele variabile categoriale, n funcie de care se dorete analiza variabilei analizate Label cases by, permite etichetarea cazurilor la afiare (rar utilizat) - 32 -

Display, permite alegerea opiunilor de afiare a rezultatelor numerice (Statistics), grafice (Plots) sau ambele categorii (Both) Butonul Statistics deschide caseta pentru alegerea unor indicatori (dar procedura analizeaz, implicit toi indicatorii statistici descriptivi, de baz) Butonul Plots, permite alegerea reprezentrilor grafice dorite:

Butonul Options, permite setarea modului de tratare a valorilor lips

Rezultatele analizei Explore, definit mai sus, se prezint astfel: Indicatorii statistici Reprezentarea stem-and-leaf Reprezentarea Box plot

- 33 -

Teste parametrice
Testul z (t) pentru media unui singur eantion Utilizare Testul z pentru un singur eantion este utilizat pentru se testa diferena dintre media unui eantion fa de media cunoscut a populaiei din care face parte. Atunci cnd volumul eantionului este mic (N<30) este utilizat o variant denumit testul t pentru un singur eantion. Utilizarea acestui test statistic este condiionat de cunoaterea mediei populaiei. Dac populaia are o extindere mare, acest lucru este dificil de realizat (n afara cazurilor n care exist studii speciale, cum sunt cele antropometrice, de exemplu). Dintre variabilele psihologice ale crei medii pentru populaie este cunoscut, este inteligena, exprimat n uniti QI (=100). Testul poate fi utilizat, ns, atunci cnd populaia are o extindere mai redus. De exemplu, dac a fost evaluat nivelul de satisfacie ntr-o organizaie, se poate testa diferena dintre nivelul de satisfacie la nivelul unei secii fa de media satisfaciei la nivelul ntregii organizaii (populaie). Condiii de aplicare Condiia teoretic de baz este normalitatea distribuiei de eantionare. n temeiul teoremei limitei centrale, cu ct volumul eantionului este mai mare, cu att normalitatea distribuiei de eantionare este mai sigur. Aranjarea datelor Datele supuse testrii trebuie s fie incluse ntr-o variabil SPSS de tip numeric. Procedura: Statistics-Compare Means-One Sample T Test Caseta Options permite alegerea pragului de semnificaie. Confidence Interval 95% este echivalent cu p=0.05 i este implicit pentru toate testele statistice

Variabila testat

Caseta principal Variabila testat este trecut n lista Test Variable(s) n zona Test Value se nscrie media populaiei (100 n cazul nostru)

- 34 -

Rezultate

Primul tabel include statistica descriptiv a variabilei testate (N, media, ab.std, eroarea standard a mediei) Al doilea tabel include rezultatele testului statistic: t=6.254, df=4, p=0.03, diferena fa de media populaiei (22.6) i limitele inferioar (12.57) i superioar (32.63) ale intervalului de ncredere pentru media populaiei estimat de eantionul de cercetare. Concluzia testului: media eantionului de cercetare difer semnificativ de QI=100, ca medie a populaiei.

- 35 -

Testul t pentru eantioane independente Utilizare Testul t pentru eantioane independente este utilizat pentru testarea diferenei dintre mediile aceleiai variabile dependente msurate pe dou grupuri, formate din subieci diferii. Exemplu: testarea diferenei dintre media scorului la o scal de sociabilitate aplicat unor copii crescui n familie i unor copii crescui n instituii de ocrotire. n acest caz, scorul la sociabilitate este variabila dependent, msurat pe scal cantitativ (interval/raport) iar mediul de educare este variabila independent, exprimat pe scal nominal dihotomic (familie/instituie de ocrotire) Condiii Teoretic, testul t poate fi utilizat pentru eantioane orict de mici, dac distribuia de eantionare pentru cele dou grupuri este normal i dac variana valorilor n cele dou grupuri nu difer semnificativ. n ce privete condiia egalitii varianei, ea este testat cu un teste specifice. Unul dintre acestea este testul Levene, iar n funcie dac rezultatul su programul calculeaz testul t pe dou ci, aa cum vom vedea mai jos. Dac variabila dependent nu ntrunete condiiile pentru testul t, se poate apela la teste neparametrice, astfel: Testul z pentru proporii (compararea procentului de sociabili din cele dou grupuri) Testul Mann-Whitney U, dac se transform valorile variabilei sociabilitate n valori de rang Aranjarea datelor Tabela de date SPSS va conine variabila dependent, de tip numeric, i variabila independent, de tip nominal, cu dou valori, n funcie de apartenena la un grup sau altul. Variabila independent poate fi de tip string (codificnd cele dou grupuri cu valori de genul A i B) sau de tip numeric (cu codificarea convenional 1 i 2). Din principiu, ns, recomandm cea de a doua variant.

Procedura: Statistics-Compare means-Indpendent Samples T Test

- 36 -

n caseta principal se trece variabila dependent (soc) n lista Test Variable(s) (pot fi testate mai multe variabile simultan) iar variabila independent (grup), n zona Grouping Variable. n acest moment, programul ataeaz variabilei dependente dou semne de ntrebare, sugernd introducerea valorilor care definesc cele dou grupuri. Concomitent, se activeaz butonul Define Groups a crui acionare deschide caseta secundar Define Groups, unde se introduc valorile care definesc cele dou grupuri comparate (ordinea lor nu este relevant). Dup acionarea butonului Continue, caseta principal devine complet i se poate aciona OK pentru efectuarea testului.

Rezultate

- 37 -

n primul tabel (Group Statistics) avem statistica descriptiv a celor dou grupuri. Se va observa c programul descrie grupurile prin intermediul etichetelor valorilor. Dac acestea nu ar fi fost definite, n loc de institutie i familie ar fi aprut 1, respectiv, 2. Al doilea tabel are dou linii: Pe prima avem rezultatele testului t pentru cazul asumrii omogenitii varianei (Levenes Test for Equality of Variances). n cazul nostru, ele sunt egale (Sig.=0.666, ceea ce se traduce ca o valoare p=0.666, deci mai mare de 0.05 pentru distribuia F a testului Levene, pe care nu o discutm aici). Ca urmare, vom citi pe aceast linie rezultatul testului: t=-2.42, df=12, Sig.=0.045. Pe a doua linie avem rezultatele testului t pentru cazul n care nu s-ar ntruni condiia de omogenitate a varianei pentru cele dou grupuri. Dac semnificaia testului Levene ar fi fost mai mic sau egal cu 0.05, rezultatului testului t s-ar fi citit pe aceast linie. Pentru exemplul nostru, rezultatul testului t permite acceptarea ipotezei cercetrii, conform creia copiii crescui n mediu familial sunt mai sociabili (m=22.00) dect cei crescui n mediu instituional (m=17.71).

- 38 -

Testul t pentru eantioane dependente (perechi) Utilizare Testul t al diferenei mediilor a dou eantioane dependente permite evaluarea semnificaiei variaiei unei anumite caracteristici la aceeai indivizi n dou situaii diferite (de exemplu, nainte i dup aciunea unei anumite condiii, ori n dou contexte diferite, indiferent de momentul manifestrii acestora). Avantajul major al acestui model statistic este acela c surprinde variaia numit intrasubiect, prin faptul c baza de calcul este diferena dintre cele dou valori ale fiecrui subiect n parte. Exemplu: Un grup de subieci efectueaz operaii aritmetice n condiii de linite i, ulterior, n condiii de zgomot puternic. Ipoteza cercetrii este c zgomotul determin o reducere a capacitii de calcul numeric. Condiii Condiia teoretic a testului este normalitatea distribuiei de eantionare a distribuiei de diferene. Ca i n celelalte cazuri, teorema limitei centrale determin normalizarea distribuiei de eantionare pe msur ce volumul eantionului crete. n situaia n care condiia nu se ndeplinete, se pot utiliza teste neparametrice echivalente: testul semnului (pentru date nominale) sau testul Wilcoxon (pentru date ordinale). Aranjarea datelor Vor fi create dou variabile distincte, ambele cantitative, msurate pe scal de tip I/R, care primesc cte o valoare pentru fiecare subiect.

- 39 -

Procedura: Statistics-Compare Means-Paired Sample T Test... Se selecteaz cu un clic de mouse, pe rnd, fiecare dintre cele dou variabile. Astfel se constituie perechea de variabile n zona Curent selection. O dat constituit, perechea de variabile se trece n lista Paired Variables cu butonul de transfer (). Pot fi create mai multe perechi de variabile i prelucrate simultan.

Caseta Options permite alegerea pragului de semnificaie (implicit 0.05). Rezultate

Primul tabel conine statistica descriptiv pentru cele dou variabile. Al doilea tabel conine testul de corelaie Pearson (r) dintre cele dou variabile. Evaluarea intensitatea asocierii liniare dintre cele dou variabile este legitim n acest context, dar ofer o informaie diferit de testul diferenei dintre medii. Alegerea testului de corelaie sau al testului t se decide n funcie de obiectivul cercetrii.

- 40 -

n fine, ultimul tabel prezint rezultatul testului: t=5.076, df=9, p=0.001. Acesta permite respingerea ipotezei de nul i acceptarea ipotezei cercetrii, zgomotul afecteaz capacitatea de calcul aritmetic. Coeficientul de corelaie liniar Pearson (r) Utilizare Corelaia Pearson (r) msoar gradul de asociere dintre variabile. Aceasta se refer la gradul i sensul de variaie concomitent a valorilor unei variabile n raport cu cealalt, dup un model de tip liniar. Domeniul de variaie a coeficientului de corelaie Pearson (r) este ntre r=-1 (corelaie perfect negativ) i r=+1 (corelaie perfect pozitiv). Absena oricrei legaturi (corelaii) dintre variabile se traduce prin r=0. Exemplu: Testul de corelaie implic dou variabile dar, adesea, ntr-o cercetare psihologic numrul variabilelor supuse corelaiei este mai mare de dou. Acest fapt conduce la ceea ce se numete o matrice de corelaii care este un tabel ale cror celule cuprind corelaiile dintre perechile de variabile. Pentru exemplificare, s lum n considerare situaia n care se urmrete evidenierea legturii (asocierii) dintre anxietate i agresivitate, pe de o parte, i preferina pentru risc pe de alt parte. Condiii Condiia principal pentru calcularea coeficientului de corelaie liniar Pearson este ca variabilele implicate s fie msurate pe scal de interval/raport (alturi de existena unei forme a distribuiei care nu se abate sever de la curba normal). Testele neparametrice alternative, pentru cazul n care condiiile pentru utilizarea testului Pearson nu se ndeplinesc, sunt: testul chi-ptrat (pentru date nominale) sau coeficienii de corelaie Spearman sau Kendall (pentru date ordinale). Aranjarea datelor Se creeaz variabile distincte pentru fiecare caracteristic supus testrii.

Procedura: Statistics-Corelate-Bivariate Variabilele supuse corelaiei vor fi trecute n lista Variables: - 41 -

Testul implicit, din zona Correlation Coefficients, este Pearson, dar se poate bifa un altul (Kendall sau Spearman), dac datele sunt neparametrice. Tipul implicit de testare a ipotezei este bilateral (Two-tailed), dar se poate alege unilateral (dac exist o justificare solid). Flag significant correlations, determin marcarea cu un asterisc a coeficienilor semnificativi la p=0.05 i cu dou asteriscuri a celor semnificativi la p=0.01. Acest lucru este util atunci cnd matricea de corelaie este mare, pentru a scoate n eviden valorile semnificative ale lui r.

Rezultate

Tabelul rezultatelor cuprinde matricea de corelaii a variabilelor analizate. El este redundant, deoarece prezint aceleai corelaii de dou ori, odat deasupra diagonalei, odat sub diagonal. Corelaiile variabilelor cu ele nsele sunt perfect pozitive (r=1) i nu prezint, desigur, nici un interes. Fiecare celul include urmtoarele informaii: valoarea lui r nivelul p numrul de subieci (N)

- 42 -

n cazul nostru, consemnm corelaii negative dar nesemnificative ntre anxietate i agresivitate (r=-0.38, p=0.26), pe de o parte, i ntre anxietate i preferina pentru risc, pe de alt parte (r=-0.40, p=0.24). n acelai timp, se constat o corelaie semnificativ (r=0.96, p<0.001) ntre agresivitate i preferina pentru risc. Precizm faptul c raportarea coeficienilor de corelaie se face cu dou zecimale, chiar dac programele i calculeaz cu trei zecimale. Dezavantajul acestui tip de tabel const n faptul c avem de fapt o dubl prezentare a corelaiilor, deasupra diagonalei i sub diagonal. Pentru corelaii implicnd multe variabile tabelul se va cit cu relativ dificultate. S presupunem c suntem interesai de corelaiile dintre anxietate i agresivitate cu variabila preferin pentru risc, nu i de corelaia dintre anxietate i agresivitate. n acest caz, n caseta principala, Bivariate Correlations, prezentat mai sus, variabilele vor fi introduse astfel nct variabila preferina pentru risc sa fie ultima din list. Apoi se apas butonul Paste, al crui efect este deschiderea domeniului Syntax, ca o fereastr distinct, n care se afl sintaxa procedurii de corelaie. Acolo, pe linia /VARIABLES=anx agresiv risc, se insereaz cuvntul WITH, avnd grij s existe spaiu att n sting ct i n dreapta sa.

inserai WITH

Mai departe, se selecteaz ntreaga procedur (cu ajutorul mouse-ului) i se apas pe butonul Run () de pe bara de comenzi a ferestrei Rezultatul din Viewer va arta ca mai jos:

Este evident c aceast modalitate se poate aplica pentru orict variabile, dac avem grij s le aezm separat n list i s includem clauza WITH ntre cele dou categorii de variabile. Nu pot fi incluse mai multe clauze WITH n aceeai procedur.

- 43 -

Ulterior, putem reveni n fereastra Syntax pentru a o nchide (cu File-Close), salvnd sau nu procedura astfel modificat. Expresia grafica a corelaiei (Scatterplot) Caracterul i intensitatea corelaiei dintre dou variabile se evideniaz extrem de sugestiv cu ajutorul unei proceduri grafice specifice, numit scatterplot. Aceasta se lanseaz din meniul principal Graphs-Scatter... care deschide urmtoarea caset de dialog:

n cazul nostru, s presupunem c dorim reprezentarea grafic a corelaiei dintre agresivitate i preferina pentru risc, singura semnificativ. n acest scop, selectm pe caseta Scatterplot opiunea Simple i apsm Define.

Trecem variabila Agresivitate pe axa Y i variabila Preferina pentru risc pe axa Z (se poate la fel de bine i invers). Se apas OK i se obine graficul din imaginea urmtoare, care sugereaz foarte clar existena unei asocieri de tip liniar ntre cele dou variabile.

- 44 -

Reprezentarea grafic este surs de informaii cu privire la natura relaiei dintre variabile, motiv pentru care este recomandabil utilizarea frecvent a acesteia. Mai mult, ea este necesar n special atunci cnd valoarea corelaiei este redus, sau nesemnificativ, deoarece graficul poate scoate n eviden o legtura de alt tip dect liniar. O corelaie r=0.92, ca cea obinut mai sus, ntre agresivitate i preferin pentu risc, este improbabil s se ntlneasc ntr-un studiu real. De fapt, dac s-ar ntmpla s apar, ar trebui s concluzionm mai degrab c cele dou variabile se confund, dect c sunt distincte.

- 45 -

Regresia liniar simpl Utilizare Analiza de regresie este o aplicaie a corelaiei, utilizat n scopuri de predicie. Dac evalum agresivitatea ca trstur de personalitate i preferina pentru risc ca expresie a numrului de incidente n trafic, la conductorii auto, se poate estima pe baza agresivitii riscul de accident nc nainte de dobndirea carnetului de ofer. Acest tip de regresie, n care exist o singur variabil predictor (agresivitatea) i o variabil criteriu (tendina spre risc) se numete regresie liniar simpl. Mai frecvent utilizat este regresia multipl, care efectueaz predicii bazate pe mai multe variabile predictor asupra unei variabile criteriu. Vom prezenta mai jos regresia liniar simpl, ca o form de introducere n analiza de regresie, mai uor de neles. Exemplu: Predicia rezultatului statistic pe baza cunotinelor de matematic, evaluate anterior nceperii cursului de statistic. Condiii Din punct de vedere statistic, condiiile variabilelor care sunt supuse analizei de regresie sunt aceleai ca n cazul corelaiei, deoarece regresia liniar este o aplicaie a acesteia. Din punct de vedere metodologic, predicia presupune, de regul, evaluarea variabilei predictor anterior variabilei criteriu. Acest fapt poate sugera o relaie de tip cauzal ntre variabile, dar numai dac sunt ntrunite i alte condiii (cum ar fi izolarea efectelor altor variabile). Aranjarea datelor Structura de variabile este similar analizei de corelaie.

- 46 -

Procedura: n principiu, analiza de regresie ncepe cu coeficientul de corelaie dintre variabile i vizualizarea imaginii scatterplot. n cazul nostru, urmnd procedura prezentat mai sus, am obinut o corelaie r=0.74 (p=0.002). Aceste valori confirm existena unei legturi pozitive semnificative, ntre cunotinele de matematic i performana la statistic. O idee mai exact ne ofer coeficientul de determinare r2=0,5476. Acesta ne spune c 54% din variaia performanei la statistic este explicat de variaia valorilor la variabila cunotine de matematic. Deducem c restul de 46% din performana la statistic este explicat de alte variabile, necunoscute n aceast faz1. Pe baza acestor concluzii se poate trece la analiza de regresie a crei finalitate este aceea de obinere a coeficienilor a (termenul liber, sau originea dreptei de regresie) i b (panta dreptei de regresie), cu ajutorul crora se poate estima n viitor performana la statistic pe baza rezultatului la un test de cunotine matematice aplicat n prima zi de coal. Nendoielnic, o astfel de procedur s-ar justifica mai ales pentru identificarea studenilor cu poteniale dificulti i care, tocmai fiind avertizai n legtur cu aceste dificulti vor putea s acorde statisticii o atenie sporit, n vederea obinerii unui rezultat peste nivelul celui prezis. Lansarea procedurii: Statistics-Regression-Linear...

n caseta principal Linear Regression, se trece variabila criteriu n zona Dependent iar variabila criteriu n zona Independent(s). n caseta Regression Save, bifm Predicted Values-Unstandardized i ResidualsUnstandardized, care vor avea ca efect n caseta Statistics, bifm Estimates pentru crearea de variabile distincte n baza de obinerea coeficienilor de regresie (opiune date. implicit) Prediction interval (individual) va calcula limitele de ncredere pentru valorile prezise.
1

Facem precizarea c valorile i aprecierile nu se bazeaz pe un studiu reale.

- 47 -

Valorile prezise sunt valorile rezultate pe baza modelului de predicie. Valorile reziduale se calculeaz ca diferen ntre valorile variabilei criteriu si cele prezise pe baza modelului de regresie. Analiza rezultatelor

Tabelul Model Summary ofer valoarea coeficientului de regresie, notat cu R, care este identic cu coeficientul de corelaie dintre cele dou variabile. Dac modelul de regresie ar fi avut mai multe variabile predictor, R ar fi fost coeficientul de corelaie multipl dintre predictori i criteriu. Interpretarea este similar coeficientului de corelaie simpl, la fel ca i pentru R2, care este coeficientul de determinare al lui R. Valoarea lui ne spune c 55% din variaia performanei la statistic este explicat de variaia variabilei cunotine de matematic. Adjusted R Square este o corecie a lui R2 n funcie de numrul de predictori i numrul de subieci.

Tabelul Coefficients conine coeficienii B (nestandardizai) i coeficientul beta (standardizat), care pot fi utilizai, la alegere, n ecuaia de predicie. Astfel, de exemplu, dac un student realizeaz un scor de 30 la testul de cunotine de matematic, se poate estima performan final la statistic cu ajutorul relaiei:

- 48 -

stat _ fin = a + b * mat _ in = 3.406 + 0.854 * 30 = 29.02


unde 3.406 este originea iar 0.854 este panta dreptei de regresie. Sau, dac predicia se face pe baza unui scor standardizat z al variabilei mat_in (s zicem, 0.93), atunci:

stat _ fin = beta * mat _ in = 0.742 * 0.93 = 0.69

n acest caz termenul liber are valoarea 0, deoarece originea dreptei pentru scoruri standardizate se afl n 0. Desigur, scorurile astfel prezise sunt estimri, atta timp ct corelaia dintre variabile nu este perfect. Iar estimrile conin cu att mai mult eroare cu ct corelaia dintre variabile este mai mic (punctele graficului de corelaie fiind mai ndeprtate de dreapta de regresie). La finalul procedurii analizei de regresie, cu setrile de mai sus, n baza de date apar cteva variabile noi, aa cum se vede n imaginea de mai jos.

Variabila pre_1, conine valorile prezise pe baza modelului de regresie.

Variabila res_1, conine diferena dintre valoarea real i valoarea prezis Variabilele lici_1 i lici_2, conin limitele inferioar i superioar ale intervalului de ncredere pentru fiecare valoare n parte. Pentru a nelege mai bine problema limitelor, s privim prima valoare prezis de pe coloana pre_1 (25.598). Cu un nivel de ncredere de 95% (echivalent cu o probabilitate de eroare de 0.05), putem spune c valoarea adevrat pentru stat_fin prezis pe baza valorii mat_in=26, s-ar afla n intervalul 21.77 i 29.41. n fine, rezultatele conin i imaginea scatterplot a relaiei dintre valorile mat_in i scorurile z ale variabilei pre_1.

- 49 -

Imaginea este identic cu ceea ce am prezentat n cazul corelaiei. Singura deosebire este dat de trasarea dreptei. Aceasta se face de ctre operator, n felul urmtor: - se acioneaz dublu clic de mouse pe imaginea graficului din Viewer. prin care... - graficul este trecut deschis ntr-o fereastr individual de editare, n care... - se execut procedura Chart-Options-Fit Line- Fit Options. La captul acestei serii de aciuni apare caseta de mai jos unde se marcheaz Linear regression.

Facem precizarea c acest procedeu de trasare a liniei n interiorul scatterplotului este utilizabil i n cazul corelaiei. Dac se alege alt model dect cel liniar (de exemplu, Quadratic regression) se va obine linia de regresie sub form curbilinie, punnd n eviden abaterile de la modelul liniar. Acest lucru este cu deosebire util atunci cnd corelaia este mic, fapt care se poate datora faptului c relaia dintre variabile nu urmeaz un model liniar (vezi exemplul din prima seciune a manualului, bazat pe corelaia dintre scorurile z i probabilitile de sub curba normal). Ce utilizm, corelaia sau regresia? Corelaia i regresia liniar sunt similare i, de aceea, uor de confundat. n unele situaii pot fi utilizate ambele proceduri.

- 50 -

Se calculeaz corelaia liniar: atunci cnd exist dou variabile msurate pe aceiai subieci i se dorete evaluarea gradului de asociere ntre variabile atunci cnd distribuiile de eantionare ale celor dou variabile sunt normale (atunci cnd cel puin una dintre variabile este manipulat, nu se calculeaz corelaia Pearson) Se calculeaz regresia liniar: atunci cnd una dintre variabile precede i poate fi cauza celeilalte variabile atunci cnd una dintre variabile este manipulat, se calculeaz regresia atenie, calculele regresiei nu sunt simetrice, ca urmare, inversnd variabilele n ecuaia de regresie se va obine o linie de regresie diferit, n timp ce dac se inverseaz ordinea variabilelor n calcularea corelaiei, se obine acelai coeficient r.

- 51 -

Teste neparametrice nominale


Testul z al proporiei pentru un singur eantion Utilizare Testul z pentru proporii pentru un eantion, este utilizat n cazul variabilelor dihotomice pentru a testa diferena dintre proporiile valorilor n eantion prin comparaie cu proporia la nivelul populaiei. Exemplu: La ntrebarea cine se uit la telenovele? rspund DA 7 subieci, dintre care 5 femei i 2 brbai. ntrebarea cercetrii este dac femeile se uit ntr-o proporie mai mare dect brbaii la telenovele. Condiii Cunoaterea proporiei la nivelul populaiei pentru valorile variabilei testate. n cazul nostru, raportul femei/brbai este cunoscut din studiile demografice (51%/49%) Aranjarea datelor Se creeaz variabila dihotomic cu valori numerice. Variabilele de tip string nu sunt acceptate de procedura SPSS. n cazul nostru, valorile sunt 1 pentru feminin i 2 pentru masculin.

Procedura: Statistics-Non Patametric Tests-Binomial...

Variabila testat este trecut n lista Test Variable List:

- 52 -

n zona Define Dichotomy se alege Get from data, dac variabila este dihotomic, sau Cut point, dac variabila este continu, prin fixarea unei valori care mparte distribuia n dou categorii. n zona Test proportion se introduce proporia primei categorii. Butonul Options permite solicitarea statisticii descriptive pentru variabila testat.

Rezultate

Rezultatul n cazul exemplului dat cuprinde frecvena pe categorii, procentul i semnificaia testului n raport cu proporia la nivelul populaiei (p=0.243). n acest caz, se accept ipoteza de nul i se respinge ipoteza cercetrii. Proporia femeilor care se uit la telenovele nu difer semnificativ de proporia brbailor, prin raportare la proporia lor n populaie.

- 53 -

Testul semnelor Utilizare Testul semnelor este utilizat pentru a testa diferena dintre valori, utilizndu-se semnul diferenei i nu valoarea acesteia, atunci cnd ambele valori sunt msurate pentru aceiai subieci . Dac nu ar exista nici o diferen ntre valorile perechi, atunci numrul diferenelor pozitive ar trebui s fie egal cu cel al diferenelor negative. Cu ct numrul diferenelor de un anumit semn este mai mare comparativ cu cel al diferenelor de semn opus, cu att crete posibilitatea ca diferena dintre variabile s fie statistic semnificativ. Exemplu: ntr-un experiment cu privire la efectul motivrii asupra memorrii, subiecilor li se cere s memoreze cuvinte dintr-o list, nainte si dup introducerea unui factor motivant. Dat fiind faptul c numrul subiecilor este prea mic pentru asumarea normalitii distribuiei de eantionare, se alege testul semnului, n locul testului t pentru eantioane dependente. Condiii Variabilele vor fi de tip numeric, iar valorile exprimate n aceeai unitate de msur, pentru a se putea face diferena lor. Aranjarea datelor Imaginea de mai jos conine variabilele inainte i dupa, care vor fi analizate.

Variabila dif conine rezultatul diferenei dupa-inainte. Variabila semn, conine semnul diferenei. Ambele sunt prezentate numai pentru a face mai evident baza de calcul a testului deoarece, n fapt, nu sunt relevante sub aspectul procedurii SPSS. 2. Dac nu se dispune de valorile variabilelor ci numai de semnul diferenei, testul semnului va fi calculat manual, pe baza formulei 4.7. Procedura: Statisstics-Nonparametric Tests-2 Related Samples...

n prima faz, cele dou variabile sunt selectate, pe rnd, prin clic de mouse pe fiecare, constituindu-se n pereche. Acest fapt se observ n partea de jos a casetei, n

Apoi, perechea de variabile este trecut n lista Test Pair(s) List: prin acionarea butonului . Dac este necesar, se pot testa simultan mai

- 54 -

zona Current Selections. Se bifeaz Sign n zona Test Type.

multe perechi de variabile.

Rezultate

Tabelul Sign Test cuprinde numrul diferenelor pozitive, respectiv negative, pentru cazurile din baza de date. n cazul nostru, exist 7 diferene pozitive i nici o diferen negativ.

Tabelul Test Statistics, prezint semnificaia testului (p=0.016). Ipoteza de nul se respinge dac valoarea lui p este mai mic dect pragul fixat i care, implicit, este 0.05. n exemplul dat, ipoteza de nul se respinge, acceptndu-se ipoteza cercetrii (motivarea stimuleaz memorarea).

- 55 -

Testul Chi-ptrat al asocierii (independeei) Utilizare Testul chi-ptrat este utilizat pentru evidenierea gradului de asociere ntre dou variabile categoriale. Exemplu: S presupunem c am evaluat numrul femeilor i al brbailor diagnosticai cu sindrom de stres postraumatic (PTSD) dintr-un mic ora, afectat de un cutremur de pmnt, iar datele sunt cele din urmtorul tabel de coresponden: PTSD Non-PTSD sex. Condiii
Cele dou variabile nu trebuie s se intersecteze (s nu existe subieci care s fie inclui n mai mult de o celul de tabel). Este recomandabil ca frecvena ateptat s nu ia valori mai mici de 5 (sau, cel puin, n nu mai mult de 20% din celule). Nici o celul nu trebuie s aib frecvena ateptat 0..

Femei 20 30

Brbai 10 40

Problema cercetrii este dac incidena PTSD este n legtur cu caracteristica de

Aranjarea datelor Datele pot fi incluse n Data Editor n dou moduri: a. Sub forma unor nregistrri distincte pentru fiecare caz

Acest mod poate fi extrem de dezavantajos atunci cnd sunt multe cazuri sau cnd exist deja o statistic global a fenomenului PTSD n raport cu sexul. b. Sub forma unor nregistrri distincte pentru valorile caracteristicii de sex:

- 56 -

n aceast situaie, se introduc frecvenele PTSD pentru toate combinaiile valorilor celor dou variabile analizate i frecvenele asociate fiecreia. Pentru a se realiza corespondena dintre variabilele sex i PTSD cu variabila frecv, se apeleaz la procedura Data-Wheight Cases...:

Facem precizarea c n tabelele de date din imaginile de mai sus variabilele au fost codificate numeric cu 1 respectiv 2, att pentru sex ct i pentru PTSD, valorile fiind etichetate. Faptul c n celule apar etichetele i nu valorile, se obine prin setarea DataValue Labels. Procedura Chi-ptrat accept i variabile de tip caracter (string) dar reamintim recomandarea de principiu ca toate variabilele s fie declarate de tip numeric. Procedura: Statistics-Summarize-Crosstabs... Casetele de configurare sunt urmtoarele:

n caseta principal Crosstabs se trec variabilele analizate n lista Row(s), respectiv Columns(s). Pot fi analizate mai multe perechi de variabile simultan. Rezultatul analizei nu depinde de modul de plasare a variabilelor pe linie sau pe coloan. Dac de dorete crearea unui grafic al corespondenei dintre variabile, se va bifa i Display clustered bar charts. n caseta Statistics se bifeaz Chi-Square. n caseta Cell Display se bifeaz Counts-Observed; Percentages-Row, Column, Total i Residuals-Unstandardized (bifarea opiunilor este n funcie de informaiile pe care le dorete analistul). - 57 -

Rezultate

Imaginea prezint tabelul de coresponden, avnd pe linii valorile caracteristicii de sex iar pe coloane valorile aferente variabilei PTSD. n celulele tabelului se afl valorile solicitate prin configurarea casetelor. Vom exemplifica pentru celula feminin/da: Count 20 indic numrul femeilor cu PTSD %within Sex 40.0% indic procentul femeilor care au manifestat PTSD din totalul femeilor %within PTSD indic procentul femeilor cu PTSD din totalul celor care au manifestat PTSD % of Total indic procentul femeilor cu PTSD din totalul subiecilor Residual indic diferena dintre numrul de femei cu PTSD (frecvena observat) i frecvena ateptat (n cazul nostru, +10)

n tabelul Chi-Square Tests citim valoarea testului Pearson Chi-Square (16.66) i, n special, pragul de semnificaie al acestuia (p=0.000 care va fi citit ca p<0.001). n cazul particular al acestui exemplu, unde tabelul de coresponden este format din dou linii i dou coloane, valoarea lui chi-ptrat poate fi luat de pe linia Continuitiy Correction (15.04) cu valoarea aferent a pragului de semnificaie: p<0.001. Valoarea testului chi-ptrat fiind mai mic dect nivelul alfa 0.05, se respinge ipoteza de nul i se confirm ipoteza cercetrii: exist o inciden mai mare a reaciei de stres postraumatic la femei dect la brbai. n raportarea statisticii chi-ptrat va fi inclus valoarea gradelor de libertate (df) i numrul cazurilor

- 58 -

Valoarea lui chi-ptrat se raporteaz cu dou zecimale

Graficul de tip bar permite vizualizarea relaiei dintre variabile.

Testul Chi-ptrat pentru coresponden (goodness of fit) Utilizare Testul chi-ptrat pentru gradul de coresponden se utilizeaz atunci cnd dorim s comparm frecvenele observate unei singure variabile categoriale cu frecvenele ateptate, dinainte cunoscute. Exemplul 1: Avem evaluarea nivelului de inteligen pe cinci categorii valorice, de la foarte slab, la foarte bun i dorim s tim dac distribuia acestor calificative se supune curbei normale, procentele aferente pe curba normal fiind cunoscute (2.5%, 14%, 67%, 14%, 2.5%). Exemplul 2: Am solicitat unui grup de tineri s i exprime genul muzical preferat i am obinut frecvene diferite pentru mai multe genuri de muzic. Problema este dac diferenele dintre aceste frecvene sunt semnificative, presupunnd c, dac nu ar fi semnificative proporiile preferinelor pentru genurilor muzicale, ar trebui s fie identice (adic, dac ar fi trei genuri, fiecare ar trebui s ntruneasc un procent de 33.33%). Aranjarea datelor Vom exemplifica pe o situaie corespunztoare celui de-al doilea exemplu. Baza de date se poate constitui fie prin nregistrarea fiecrui caz n parte (avnd o variabil pentru genul muzical i o alta pentru exprimarea preferinei fa de acesta), fie, ca n exemplul anterior, prin nregistrarea rezultatelor sintetice i ponderarea variabilei gen_muz cu variabila frecv prin operaia Data-Weight cases...:

- 59 -

Procedura: Statstics-NonParametric-Tests-Chi-Square...

n caseta Chi-Square Test se trece variabila analizat n zona Test Variable List. Se bifeaz All categories equal, acesta fiind modelul n raport cu care dorim s testm frecvenele variabilei analizate Dac am fi dorit s le testm n raport cu alte frecvene cunoscute, am fi bifat Values i, apoi, am fi introdus pe rnd acele frecvene (scriindu-le n dreptul lui Values i nregistrndu-le prin butonul Add)

Rezultate

Cele dou tabele cu rezultate din Viewer prezint: Frecvenele observate, frecvenele ateptate i valorile reziduale (diferena dintre frecvene) pentru cele trei genuri muzicale Valoarea testului Chi-ptrat al corespondenei (12.17), df(2) i p=0.002 Acest rezultat justific respingerea ipotezei de nul i acceptarea concluziei c subiecii diferenele dintre preferinele pentru cele trei genuri muzicale sunt semnificative i nu se datoreaz variaiei ntmpltoare de eantionare.

- 60 -

Vous aimerez peut-être aussi