Vous êtes sur la page 1sur 94

Arvuti kasutamine uurimists

Informaatika valikaine e-pik gmnaasiumile


Mart Laanpere, Katrin Niglas, Kairi Osula, Kai Pata Tallinna likool 2013

ppekomplekti rahastas ESF TeaMe programm Eesti Teadusagentuuri vahendusel

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

SISUKORD

1. Uurimist: misted, protsess, alustamine!


1.1. Uurimist olemus 1.2. Arvuti roll uurimists 1.3. T allikatega ja infootsing 1.4. Viitamine 1.5*. Allikakriitiline lhenemine

4
4 8 11 14 17

2. Andmete kogumine ja analsiks ettevalmistamine!


2.1. Andmete kogumise erinevad viisid 2.2. Ksimustiku koostamise ABC 2.3. Veebiphise ksimustiku koostamine 2.4. Andmeanalsi phimisted 2.5*. Valim ja ldkogum 2.6. Struktureeritud andmestik ja andmetabeli koostamine 2.7. Andmete korrastamine

19
19 22 23 26 28 31 34

3. levaade andmetest!
3.1. Andmete analsimise phisammud 3.2. Sagedustabel 3.3. Analsi tulemuste esitlemisest 3.4. Tulpdiagramm 3.5. Sektordiagramm 3.6. Histogramm 3.7*. Valimi phjal saadud tulemuste ldistamine ldkogumile 3.8*. Vahemikhinnang valitud grupi osakaalu kirjeldamiseks ldkogumis 3.9. Keskmised 3.10. Vrtuste hajuvust kirjeldavad arvnitajad 3.11*. ldkogumi keskvrtuse vahemikhinnang

36
36 38 40 43 46 48 51 54 55 59 62

4. Erinevuste, trendide ja seoste uurimine !


2

64

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile 4.1. Erinevuste uurimine kasutades keskvrtusi 4.2. Erinevuste uurimine kasutades sagedusi ja protsente 4.3. Erinevuste illustreerimine protsentuaalseid jaotusi vrdleva diagrammina 4.4.* Keskvrtuste vahelise erinevuse ldistamine: t-test 4.5. Trendide e ajas toimuvate muutuste uurimine 4.6. Seoste uurimine 4.7. Kvalitatiivne sisuanals 64 67 69 71 75 77 81

5. Uurimistulemuste esitlemine !
5.1. Uurimisaruande vormistamine 5.2. Tabelid, diagrammid ja joonised 5.3. Siseviited, pealdis, indeks. 5.4. Uurimistulemuste ettekandmine

88
88 90 91 92

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

1. Uurimist: misted, protsess, alustamine


Kesolevas peatkis keskendume jrgmistele ksimustele: Mis on teaduslik uurimist? Kuidas erineb see teistest uurimist liikidest? Kuidas on arusaamad uurimist olemusest aja jooksul muutunud? Kuidas kasutatakse arvutit uurimist erinevates etappides? Kust ja kuidas leida kirjalikke allikaid varasemate uuringute kohta? Milliste vahendite abil saab lihtsustada allikaviidete ja viitekirjete haldamist? Miks on allikakriitiline lhenemine uurimists oluline? 1.1. Uurimist olemus Uurimist ehk uurimus on kirjalik kokkuvte uurimisprotsessist ja selle tulemustest. Uurimisprotsess ehk uuring on tegevus, mille kigus otsitakse teseid teadmisi, fakte vi uut informatsiooni mingi nhtuse kohta looduses, hiskonnas, kultuuris vi mujal. Tavaliselt sisaldab uurimus jrgmisi osi: teema valiku phjendus (miks uuriti?) probleemipstitus ja uurimisksimused (mida teada taheti?) uurimismeetod (kuidas andmeid koguti?) tulemuste anals ja jreldused (mis selgus?)

Uuringutega tegelevad mitmete erialade esindajad. Niteks vib uuriv ajakirjanik koguda ja analsida infokilde, tendamaks parteijuhi mjutatavust naaberriigi poolt. Kriminalist vib DNA-uuringu tulemusel lkata mber prokurri poolt esitatud mrvasdistuse. Brsianaltik vib varasemate aastate andmete phjal ennustada Luna-Ameerika suvise pua mju kohvirma aktsia hinnale. Kigi kolme eeltoodud nite puhul on kahtlemata tegemist uurimistegevusega, kuid mitte teadusuuringutega. Teadusuuring on uurimistegevuse eriline liik, mida eristab teistest: teostaja, kes on teiste teadlaste poolt tunnustatud teadlane suhestumine varasemate teadustdega (kas neile toetumine vi kritiseerimine) meetod, mis on teiste teadlaste poolt tunnustatud kui teaduslik korratavus teiste teadlaste poolt ldistus, mis phineb rangel jrelduste tegemise viisil publitseerimine teadusajakirjas vi konverentsil
4

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Riiklik ppekava eeldab, et iga gmnaasiumilpetaja on vhemalt korra osalenud uuringu ettevalmistamises ja lbiviimises (kui ta just loomingulise t esitamise kasuks ei otsusta). pilasuurimus kavandatakse, koostatakse ja kaitstakse sarnaselt teadusliku uurimistga, ainult viksemas mahus ja mitte niivrd rangeid hindamiskriteeriumeid jrgides. Sajandite jooksul on suuresti muutunud arusaam sellest, millist uuringut viks lugeda teaduslikuks ja millist mitte. Antiik-Kreeka tuntuimaks teadlaseks vib pidada Aristotelest, kes luges teaduslike teadmiste hulka ainult selliseid viteid, mille tesust oli vimalik jreldada sllogismi abil. Sllogism koosneb kolmest lausest: suur eeldus, vike eeldus ja jreldus. Sllogismi nide: Suur eeldus: Kik inimesed on surelikud Vike eeldus: Kik kreeklased on inimesed Jreldus: Kik kreeklased on surelikud Aristoteles 384-322 e.Kr. Inglise losoof Francis Bacon ja prantsuse matemaatik Rene Descartes algatasid 17. sajandi algul revolutsiooni teadusmaailmas, kuulutades teaduslikeks teadmisteks ksnes korduvate vaatluste ja eksperimentide kaudu kinnitust leidnud phjus-tagajrg seosed ja hoiatades tde moonutavate iidolite kummardamise eest. Tde hmastavad iidolid, mille mju teline teadlane peab vltima: himuiidolid - kalduvus nha reegleid ja korrapra seal, kus neid pole koopaiidolid - subjektiivsete eelistuste ja emotsioonide mju turuplatsi-iidolid - knekeelsete snade ja teadusterminite segiajamine teatri-iidolid - akadeemiliste dogmade (nt. Aristotelese teooria) mju

Francis Bacon 1561 - 1626

20.sajandi esimesel poolel pakkus teaduslikkuse mdupuu vlja Austria losoof Karl Popper: teaduslikuks teadmiseks saavat lugeda ainult sellist videt, mis on kll phimtteliselt mberlkatav (e. falsitseeritav), kuid kellelgi pole seni seda mber lkata nnestunud. Ainus teliselt teaduslik uurimismeetod oli Popperi jaoks teooria phjal tehtud ennustuse testimine. Kui ennustus osutus teseks ka paljukordsel testimisel erinevate teadlaste poolt (kelle eesmrgiks oli see teooria mber lkata), vis teooria teseks lugeda vastasel juhul tuli teooria krvale heita. Niteks Sigmund
5

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Feudi pshhoanaltilisi unengude seletusi ei nustunud Popper teaduslikeks lugema, kuna neid polnud phimtteliselt vimalik mber lkata. Popperi ngemusega teaduse olemusest ei olnud paljud teadlased nus, teiste seas kritiseeris seda Thomas Kuhn oma 1962. aastal ilmunud raamatus Teadusrevolutsioonide lesehitus. Kuhni arvates on teadus see, millega tegelevad teadlased oma ajastu tekspidamistest ja teiste teadlaste eeskujust (e. paradigmast) lhtudes. Samas vivad tnased tekspidamised teaduse olemusest muutuda, kui leiab aset teadusrevolutsioon ja senikehtinud paradigma asendub uuega. Niteks kosmoloogias leidis aset paradgima vahetus 16.sajandil, kui teadlased loobusid Koperniku avastuse mjul senikehtinud Ptolemaiose geotsentrilisest maailmapildist, mille kohaselt kik taevakehad tiirlevad mber Maa. Kui 17.sajandil oli meldi teaduse (inglise keeles: science) all ldist loodusteadust, siis 20.sajandiks oli vlja kujunenud hulgaliselt erinevaid teadusvaldkondi, millest igahes tekkisid oma traditsioonid, paradigmad ja uurimismeetodid. Meetodid, mida hes valdkonnas aktsepteeritakse kui teaduslikke, ei pruugi teise valdkonna teadlased sellisena tunnustada. Niteks kasvatusteadustes on levinud uurimismeetodiks tegevusuuring, mille puhul rhm petajaid rakendab oma ts uudseid ppemeetodeid, ise oma tegevust ja pilaste pitulemusi pidevalt analsides. Paljudes teistes teadusvaldkondades peetaks teadlase taolist osalemist enese poolt uuritavas protsessis subjektiivseks ja mitteteaduslikuks. Eesti teaduse infossteem ETIS jagab teadusvaldkonnad neljaks suureks rhmaks: bio- ja keskkonnateadused: biokeemia, mikrobioloogia, geneetika jne. hiskonna- ja kultuuriteadused: keeleteadus, igusteadus, pshholoogia, sotsioloogia jne. terviseteadused: biomeditsiin, farmaatsia, sporditeadus jne. loodus- ja tehnikateadused: matemaatika, arvutiteadused, fsika jne. Tnapeval on teadusuuringud ha sagedamini valdkondadevahelised e. interdistsiplinaarsed, hlmates teadmisi, teadlasi ja uurimismeetodeid korraga mitmest erinevast valdkonnast. Niteks arvutilingvistika hendab keeleteaduse meetodid arvutiteaduste omadega, biokeemia puhul on hendatud bioloogia ja keemia traditsioonid ja teadmised. Erinevate teadusvaldkondade kombineerimine on tnapeval viljakaks kasvulavaks uutele teadmistele. Erinevates valdkondades vib uurimistegevus olla vga erinevalt les ehitatud. Niteks Higgsi bosoni olemasolu tendavat eksperimenti kavandavad kmned tippfsikud CERNi keskuses aastaid, kusjuures eksperiment ise kestab sekundeid ja selle kigus kogutud andmete phjal kirjutatakse paari jrgmise aasta jooksul sadu teadusartikleid. Seevastu humanitaarteadustes, niteks ajaloos, on eksperimendi korraldamine tihtilugu praktiliselt vimatu. Ajaloolased uurivad juba ammu juhtunud sndmuste jlgi, pdes leida uudseid tlgendusi, mis lkkaks mber varem kehtinud teooriad. Niteks on Magnus Ilmjrv analsinud sadu ajaloolisi dokumente, leidmaks kinnitusi oma
6

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

vitele, mille kohaselt oli Konstantinil Ptsil oluline roll Eesti Vabariigi iseseisvuse kaotamisel. Arvutiteadustes on uurimisprotsess tihtilugu seotud uue tark- vi riistvaralahenduse tsklilise arendamisega. Sel puhul koostatakse esimesel etapil uue lahenduse kohta phjalik teoreetiline mudel, teisel programmeeritakse mudelist lhtuv tarkvaralahenduse prototp (osaliselt toimiv, ilma kujunduseta versioon). Kolmandal etapil testitakse prototbi tulemuslikkust, thusust, stabiilsust vi judlust ja neljandal etapil tehakse testide tulemuste phjal prototbis vajalikud muudatused. Kesolevas pikus vtame aluseks pilasuurimuse jaoks soovituslikud uurimisprotsessi etapid, mis peaksid sobima erinevate uurimisvaldkondade jaoks: Probleem: probleemipstitus, uurimisksimuste vi hpoteesi snastamine Teooria: t allikatega, levaade varasematest uuringutest, teoreetiline baas, konkureerivate teooriate/paradigmade kaardistamine Meetod: uurimismeetodi valik, uuringudisain, valim, instrument Andmed: andmete kogumine ja korrastamine, andmettlus ja -anals Arutlus: andmete tlgendamine, jrelduste snastamine Aruanne: uurimisaruande vormistamine, visualiseerimine Avaldamine: tulemuste esitlemine, ettekanne, kaitsmine, levitamine Heas uurimists on igale etapile piisavalt thelepanu phendatud, sest kett on tpselt nii tugev nagu selle kige nrgem lli.

lesanded 1.Koosta sllogism, mille jrelduseks on: toonekured lendavad talveks Eestist ra lunamaale. 2.Otsi internetist selgitused Baconi iidolite thenduste kohta! Milliseks iidoliks tuleks Baconi kohaselt pidada Ptolemaiost, kelle geotsentrilise mudeli mberlkkamiseks kulus sajandeid: kas himu-, turuplatsi- vi teatri-iidoliks? Miks? 3.Uuri interneti abil, kes on skeptikud. Miks ei saa skeptikute arvates parapshholoogiat pidada teaduseks? Miks ei saa parapshholoogiat teaduseks pidada Popperi arvates? 4.Uuri interneti abil, mis on Venni diagramm. Koosta Venni diagramm teemal Mis eristab teaduslikku uurimistd mitteteaduslikust?

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

1.2. Arvuti roll uurimists Arvutite arengule andis 1930-40ndatel aastatel hoogu II Maailmasda. Esimesed elektroonilised arvutid sndisid vajadusest arvutada rakettrelvade lennutrajektoore vi analsida vaenlase kodeeritud snumeid. Jrgmistel aastakmnetel on arvutite ja interneti arengus olulist rolli mnginud ka teadlaste vajadused. Niteks sndis tna interneti snonmiks kujunenud veeb (WWW, World Wide Web) 1991. aastal CERNi uurimiskeskuses ttavate fsikute omavahelise infovahetuse keskkonnana. Tnapeval on vhe eluvaldkondi, kus arvuteid ei kasutata. Ka teaduslikku uurimistd on tna raske ette kujutada ilma arvutiteta, isegi sellistes pealtnha arvutikaugetes uurimisvaldkondades nagu muusikateadus, folkloristika, jrvesetete uurimine vi pshholoogia. Mned nited arvutite kasutamise kohta erinevate teadusharude uurimistdes: Inimgenoomi projekt (Human Genome Project) kestis 1990-2003 ja selle tulemuseks oli inimese geenide kaardistamine, aga ka geeniuuringute infotehnoloogilised vahendid ja eetilised phimtted. Projekti tulemusena muudeti interneti vahendusel kigile kttesaadavaks nii andmed kui tarkvara, mis ti kaasa geenitehnoloogia kiire arengu. Tnaseks on prilike haiguste tuvastamisest isikliku geenikaardi phjal saanud mitmemiljardilise kibega rivaldkond. Eesti emotsionaalse kne korpus on Eesti Keele Instituudis valminud andmebaas, mis sisaldab audiosalvestusi viha-, rmu- ja kurbuselausete ning neutraalsete lausetega (kokku 1700 lauset). Sellise andmebaasi abil on tulevikus vimalik petada arvutit analsima eestikeelses tekstis ja knes avalduvaid emotsioone. Veebirakendus Birdmap vimaldab igal huvilisel jlgida ja analsida GPSjlitusseadmega varustatud lindude rnnet. Kuna andmed on kttesaadavad kogu maailma teadlastele, siis loob see vimaluse rahvusvahelisteks vrdlusuuringuteks. On tekkinud ka spetsiaalselt infotehnoloogia arendamise ja uurimisega tegelevad teadusvaldkonnad, heks neist on informaatika. Informaatika on arvutiteaduse haru, mis ksitleb info struktuuri, loomist, hankimist, ttlemist, tlgendamist, edastamist ja esitamist. Kesolev informaatika pik vaatleb info leidmise, ttlemise, tlgendamise ja esitlemise meetodeid hes kitsas kontekstis gmnaasiumi uurimist lbiviimisel. Kui olete need meetodid uurimist kontekstis selgeks ppinud, siis oskate neid loodetavasti rakendada ka mujal. Vaatleme nd lhemalt, milline on info- ja kommunikatsioonitehnoloogia roll uurimuse igal etapil. Probleemipstituse faasis on arvutist abi mtete korrastamisel, niteks ideekaardi meetodit kasutades (vt joonis 1). Kuigi ideekaarti saab kahtlemata ka pliiatsi ja paberi abil joonistada, on arvuti abil koostatud kaardil mitmeid eeliseid: seda saab teistega jagada, koosts kaaslastega muuta, teha mitmeid versioone jne. Arvutitest ja internetist on probleemipstituse faasis kindlasti abi ka enda kurssiviimisel varasemate uuringutega, mille lpuosas on tavaliselt toodud soovitused edasisteks uuringuteks. Viimasel ajal on ka teadlaste ja lipilaste seas ha populaarsemaks muutumas oma kimasolevast vi kavandatavast teadustst blogimine, mis vimaldab jlgida teadlaste internetikogukondades kuumadeks peetavaid teemasid.
8

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Joonis 1. Ideekaart ppimise kohta tiskasvanueas. T allikatega toimub tnapeval suuresti elektrooniliste andmebaaside abil. Praktiliselt kik teadusajakirjad ja konverentsiettekannete teesid on kttesaadavad interneti vahendusel, tuleb vaid osata otsida. Samas on elektrooniliste kataloogide abil oluliselt kergem leida ka raamatukogudes hoiustatud raamatuid ja uurimistid. Uurimismeetodi valikul on samuti abi internetis leiduvatest juhenditest, soovitustest ja nidetest. Andmete kogumine kib tnapeval ldjuhul arvuti abil on siis tegu veebiphise ksimustiku, arvuti klge hendatud andurite, Kui uurimistegevuse kigus kogutakse andmeid intervjuu vi vaatluse teel, siis on abi digitaalsest diktofonist ja videokaamerast, mille abil salvestatud materjal prast arvutisse kopeeritakse ja seal siis juba tdeldakse. Audio- vi videofailidena salvestatud intervjuud muudetakse tekstiks ehk transkribeeritakse spetsiaalse tarkvara abil (nt. Transcriva vi InqScribe). Andmettlust ei tee ilmselt kski teadlane enam ilma arvuti abita. Kesoleval kursusel tugineme me andmete analsimisel ksnes MS Excel ja LibeOfce kontoritarkvarale, kuid teadusmaailmas kasutatakse siinkohal ldjuhul spetsiaalselt uurimusliku andmettluse tarvis loodud tarkvara (nt. SPSS, Matlab, Minitab, Stata, PSPP, R, NVivo). Andmete tlgendamine jb seni kll peamiselt inimese tks, kuid ka siin on arvutist palju abi. Niteks vimaldab arvuti visualiseerida andmetes tekkivaid mustreid.

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Uurimisaruande vormistamist ei kujuta vist enam keegi ilma arvuti abita ette. Tekstittlustarkvara (nt. MS Word vi LibreOfce) oskuslik kasutamine vimaldab muuta teksti kergemini loetavaks tnu teksti liigendusele, olulise esiletstmise, jooniste jms. Uurimistulemuste avaldamine toimub tnapeval ldjuhul elektrooniliste kanalite vahendusel. Uurimisaruande esitlemiselgi on esitlustarkvarast palju kasu. Kesolev pik keskendub eelkige andmete kogumisele, ttlemise ja analsimisele arvuti abil.

lesanded. 5.Vrdle kahte enda poolt valitud pilasuurimust ajakirja Akadeemiake vrskeimast vljaandest (www.akadeemiake.ee), otsides neist sarnasusi ja erinevusi seoses arvuti kasutamisega uurimist erinevates etappides. 6.Koosta ideekaart teemal Mida on mul tarvis ppida AKU kursusel ja kus mul seda vaja viks minna?

10

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

1.3. T allikatega ja infootsing Teaduslik uurimist on alati dialoogis varasemate uurimustega, kas siis toetudes neile vi ritades senikehtinud teooriaid mber lkata. Teadlase jaoks on oluline mitte ritada uuesti jalgratast leiutada, ehk siis mitte taasavastada seda, mis on juba teada. Dialoogiline lhenemine eeldab varasemate uuringutega kursis olemist, mis vtab suure osa teadlase igapevasest tajast. Teadlasi vrreldakse seetttu juba alates 12. sajandist kujundlikult kbustega, kes seisavad hiiglaste lgadel (ladina keeles: Nanos gigantium humeris insidentes). Niteks aastal 1676 tunnistas inglise fsik Isaac Newton oma optika-alastest saavutustest kirjutades: Kui ma ngingi pisut kaugemale kui teised, siis ksnes tnu sellele, et seisin hiiglaste lgadel. Selle tlusega tegi Newton kummarduse prantsuse teadlase Renee Descartesi ja briti kolleegi Robert Hookei poole, kelle varasemale teadustle tuginedes oli tal nnestunud oma optika ksitlus uuele tasemele viia. Ka pilasuurimuse puhul on oluline viia ennast esmalt kurssi varasemate uurimistulemustega ja uurimist teemat puudutavate peamiste teooriatega. Alustada tuleks allikate otsingust kohaliku raamatukogu elektronkataloogis. Paljudes kooliraamatukogudes on kasutusel RIKSWEB infossteem, kohaliku kla- vi linnaraamatukogu kataloogile saab ldjuhul veebi kaudu ligi URRAM teenuse abil. RIKSWEB otsingut saab harjutada demo-veebilehel, otsides nii mrksnade, pealkirja, autori nime kui vaba teksti abil (joonis 2).

Joonis 2. Allika otsing pealkirja jrgi RIKSWEB demoportaalis.


11

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Veebiphine raamatukogude kataloog URRAM vimaldab otsida allikaid kas hest konkreetsest raamatukogust (niteks lhimast kla- vi linnaraamatukogust) vi terve maakonna raamatukogudest korraga. Eesti suurim akadeemiliste teavikute elektronkataloog on ESTER. ESTERi avalehelt saab teha lihtotsingu, mispuhul otsisna leitakse nii autori, pealkirja, mrksna, mrkuste kui ka ilmumisandmete vljadelt. Lisaks vimaldab ESTER kasutada: fraasiotsingut, nt. eesti lipilaste selts (pole vaja ei jutumrke ega suurthti) otsisna katkestamist: nt. haridusp* (leiab vasted otsisnadele hariduspoliitika, haridusparadigma kui ka haridusplatvorm) otsisnade kombineerimiseks operaatoreid AND, OR, AND NOT, NEAR, WITHIN, niteks a=kross AND t=mardileib (leiab kik raamatud, mille autor on Kross ja pealkirjas (title) sisaldub sna mardileib. ESTERi liitotsing vimaldab otsida juba keerukamate kombinatsioonide abil, mis tuleb kasuks niteks levinud nimega autorite teoseid otsides (nt. Smith). Uurimist algfaasis on kindlasti kasu ka infootsingust ldkasutatavate interneti otsingumootorite (nt Google) abil. Google vimaldab lisaks lihtotsingule he vi mitme mrksna abil ka keerukamaid otsinguid: fraasiotsing (jutumrkidega): arvuti kasutamine uurimists kohustulik otsisna (plussmrgiga): +arvuti kasutamine +uurimist vlditav sna (miinusmrgiga): arvuti kasutamine uurimists mng facebook Google pakub uurimist tegijatele loodud teenust Scholar (scholar.google.com), mille abil on vimalik otsida ingliskeelseid teadusartikleid. Vrtuslikuks allikaks uurimistga tegelejale on veebiphised teadusajakirjad, mida leidub kigis valdkondades. Kuigi enamus veebiphistest teadusajakirjadest on piiratud juurdepsuga ja ingliskeelsed, leidub ka eestikeelseid ja juurdepsupiiranguteta ajakirju, niteks: Akadeemia (www.akadeemia.ee), Arvutustehnika ja Andmettlus (www.ttu.ee/aa), Metagused (www.folklore.ee/ tagused), Akadeemiake (akadeemiake.ee), Horisont (horisont.ee), Ajalooline ajakiri (kleio.ee). Mnikord on mistlik alustada allika otsingut hoopis konkreetse teadlase otsingust. Eestis on kik teadlased kantud teaduse infossteemi ETIS (etis.ee), kust on kerge leida iga teadlase elulookirjeldus koos tema publikatsioonide nimekirjaga. lipilaste lputid vib internetis leida Tartu likooli andmebaasist dspace.utlib.ee ja Tallinna likooli E-aidast e-ait.tlulib.ee. Agar allikate otsija kogub juba mne esimese pevaga sadu huvitavaid veebilehtede aadresse, mis vib kiiresti muutuda kaootiliseks kogumiks juhul kui selles korda ei looda. Lihtsaimaks tehniliseks abivahendiks veebiviidete kogumisel on hisjrjehoidja teenus, niteks Del.icio.us, Diigo, Zotero vi SpringBoard. Sellised teenused eeldavad vikese lisamooduli paigaldamist veebibrauseri klge ja
12

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

kasutajakonto loomist teenusepakkuja serveril. Iga kord kui leiad uurimist jaoks olulise veebilehe, tuleb lihtsalt klpsata brauseri triistaribal oleval jrjehoidjateenuse nupul, lisada jrjehoidja pealkiri ning mrksnad.

lesanded 7.Internetijaht: otsige vidu internetist vastuseid etteantud ksimusele: millisest koolist on tulnud kige enam pilaste teadustde konkursi vitjaid viimase 5 a jooksul? Vastus postitage kokkulepitud foorumisse vi blogisse, see peab sisaldama: vimalikult tpset vastust pstitatud ksimusele, veebiaadresse, kust vastus leiti ja infootsingu vtteid ja arutlusloogikat, mille abil vastuseni juti. 8.Snasta oma blogipostituses uurimisprobleem, mille vastu huvi tunned ja koosta selle kohta mistekaart. Kes ei suuda oma uurimisprobleemiga vlja tulla, vib valida he alljrgnevatest: kas Postimehe koolide edetabel on usaldusvrne? kas pilaste arvutihuvi on seotud lugemishuviga? kuidas nnestus Stenbockidel Kolga mis tagasi saada 1993? millisel lambatul on Eestis perspektiivi? kuidas on muutunud Viljandi elanike sotsiaalmajanduslik staatus 1993-2003? millised on peamised erinevused phja- ja luna-Eesti kosmoloogilises rahvaprimuses?

13

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

1.4. Viitamine Kuna uurimistd kirjutades astutakse alati dialoogi varasemate uurimistde ja teiste autoritega, siis ei pse kski uurimist tegija vraste tekstide kasutamisest oma kirjutises. Teiselt autorilt laenatud tekst (ideed, vited, faktid) esitatakse oma ts kas snasnalise laenu ehk tstitaadina vi lhemas mbersnastuses ehk refereeringuna. Mlemal juhul tuleb algallikale viidata. Viitamiseks nimetatakse oma kirjalikus ts teistelt autoritelt laenatud teksti ramrkimist kahes kohas: vahetult laenatud tekstiligu jrel viitena ja uurimist lpus kasutatud kirjanduse loetelus ratoodud detailse viitekirje kujul. Viitamine on helt poolt vajalik tekstis kasutatud ideede, videte, andmete jms autorite tunnustamiseks, teisalt annab viitamine lugejale vimaluse prduda vajadusel (nt kahtluse puhul kontrollimiseks) viidatud idee vi vite algallika juurde. Heas uurimisaruandes on viiteid alati "parajal mral" nagu maitseaineid kogenud koka tehtud supis: kurjast on nii viitamise vltimine ja viidetega "le pingutamine". Kui tekstis ei leidu htegi viidet, siis on tenoliselt tegemist laenatud ideede varjamisega, ilukirjandusliku heietusega ja/vi sihiliku dialoogi vltimisega antud valdkonna asjatundjatega. Viidete liklluse all kannatav tekst aga muutub raskesti loetavaks ja autori oma mtted jvad esile toomata. Kuigi viitamine on kombeks ka teistes valdkondades (nt. kohtuasjad, pikud), jrgitakse viitamise reegleid kige rangemalt just teadustekstides. Enamasti mravad teadusajakirja toimetajad vi konverentsi korraldajad ka selle, millise enamlevinud standardi jrgi viited vormistada tuleb. Ka pilasuurimuste puhul nutakse korrektset viitamist. Osa koole on sel eesmrgil koostanud eraldi juhendid pilaste uurimistde koostamise ja vormistamise kohta. Viitamist kohtame ka vljapool akadeemilist maailma. Niteks ajaveebides on levinud tava viidata teise inimese ajaveebile, kelle poolt kirjutatu andis autorile phjuse omapoolse sissekande tegemiseks. Siinkohal pole vaja jrgida mingeid viitamisreegleid, sest klpsamisest veebiaadressi piisab, et lugeja algallika juurde pseks. Erinevates valdkondades kehtivad viitamisele erinevad nudmised - niteks trkiajakirjanduses tihtilugu ei vaevuta algallikat mainima. Kik me oleme lugenud uudiseid stiilis "Jaapani teadlased avastasid et...". Enamasti ei sisalda sellised artiklid viiteid esmasele autorile (vt. "Teadlased: eelajalooline hiidhani oli lennukisuurune ") vi parimal juhul sisaldavad viidet allikale, mis omakorda uudist vahendanud on (vt "Teadlased on lhedal tehisnina loomisele "). Gmnaasiumiastme uurimist vib viitamisreeglite ranguse osas paigutada teadusartiklite ja ajakirjanduse vahele: nii ppematerjalide loomisel kui niteks foorumiaruteludel osaledes tuleks pidada heaks tooniks laenatud lausete autorile viitamist, kuid range viidete vormistamine APA stiilis lehekljenumbri tpsusega pole ldjuhul siinkohal rusikareegliks. Viitamisega on lhedalt seotud ka plagiaadi miste, mis thendab teiste autorite loomingu esitamist omaloodu phe. Plagiaadi vltimiseks tuleb kindlasti algallikale ja autorile viidata juhul kui kopeeritakse teise autori tpset snastust, refereeritakse
14

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

(jutustatakse oma snadega kokkuvtvalt mber) teise autori ideid vi kasutatakse teise autori poolt esitatud fakte, statistikat, tabeleid, jooniseid, diagramme jne. Kolm rusikareeglit, millest viitamisel tuleks lhtuda: algallikale peate viitama iga kord kui parafraseerite, jutustate kokkuvtlikult mber, tsiteerite vi kopeerite teise autori loomingut - kspuha, kas tegemist on tekstilise, graalise vi audiovisuaalse materjaliga viide esineb tavaliselt kahes kohas erineva detailsuse astmega: teksti sees ja teksti lpul kasutatud kirjanduse loetelus. Neist esimene viide peab olema piisavalt tpne, et selle abil viks heselt mrata, millise detailse viitega kasutatud kirjanduse loetelus tegemist hes tekstis (uurimisaruandes, essees, referaadis) tuleks kasutada lbivalt hte konkreetset viitamise stiili (nendest stiilidest ja seonduvatet formaatidest tuleb kesoleva kursuse jrgmistes osades phjalikumalt juttu) Teadustekstides kasutatakse mitmeid erinevaid viitamisssteeme, mida vib kokkuvtvalt jagada kolme gruppi: joonealune viide, niteks: Tallinna likooli koduleht 1 nimi-aasta viide, niteks: (Laanpere ja Pldoja, 2009) numbriviide, niteks: [1]. Sel juhul on viitekirjed uurimist lpul toodud nummerdatuna, kas uurimists mainimise jrjekorras vi thestikuliselt. Joonealust viitamist paljudes teadusvaldkondades vlditakse, aga niteks ajaloo ja losooa alastes uurimustes on need siiski ldlevinud. pilasuurimuste puhul on joonealuseid viiteid soovitatav kasutada ksnes mitteakadeemilistele veebiallikatele viitamiseks (nt. toote, rma, ametiasutuse vi ajakirja koduleht). Nimi-aasta viitamisssteemide korral on viited t tekstis marsulgudes. Viide algab autori perekonnanimega, millele jrgneb ilmumisaasta ja leheklje number. Kasutatud kirjanduse loetelus on viitekirjed jrjestatud autorite perekonnanimede jrgi. Numbriviitamisssteemide puhul tuleb kasutatud kirjanduse loetelu koostada sellises jrjekorras, nagu allikaid tekstis esinevad. Tekstis viidatakse kasutatud allikatele jrjekorranumbri ja lehekljenumbriga. Tuntumad rahvusvahelised viitamisssteemid on Ameerika Pshholoogide Assotsiatsiooni APA juhis (ingliskeelne2 ja eestikeelne3 lhikokkuvte), humanitaarteadustes kasutatakse sagedamini MLA4 ja Chicago5 viitamisjuhiseid, kuid erinevaid viitamissteeme on palju enam. Viitamisssteemide stiilijuhendid on avaldatud spetsiaalsete raamatutena ning tasuta neid internetist alla laadida ei saa. Paljud likoolid ja raamatukogud on koostanud

1 http://www.tlu.ee 2 http://owl.english.purdue.edu/owl/resource/560/01/ 3 http://www.hanspoldoja.net/apa6/apa6_lyhikokkuvote.pdf 4 http://owl.english.purdue.edu/owl/resource/747/01/ 5 http://owl.english.purdue.edu/owl/resource/717/01/

15

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

viitamisssteemide juhenditest lhikokkuvtteid. Viitamisssteemi kokkuvtte juures tuleb thelepanu prata ka sellele, millise versiooni kohta see kib. Niteks APA viitamisssteemist ilmus hiljuti uus 6. versioon, mis sisaldab vrreldes eelmise versiooniga terve hulga uusi allika tpe (mh. erinevaid veebiallikad). Kuna viidete ja viitekirjete vormistamisega tegeleme phjalikumalt alles kesoleva piku viimastes peatkkides, siis siinkohal sellele rohkem ruumi ei kuluta. Allikatega ttamise faasis on oluline iga leitud allika kohta detailne viitekirje silitada. Internetis leidub mitmeid abivahendeid allikaviidete haldamiseks, niteks Bibsonomy ja Mendeley, mis vimaldavad hiljem viitekirjeid erinevatele viitamisssteemidele vastavaks konverenteerida.

lesanne 9.Registreeru Bibsonomy.org kasutajaks. Leia vhemalt 5 allikat eelmisel tunnil valitud uurimisprobleemi teemal ja koosta nende kohta viitekirjed Bibsonomy abil. Allikad peavad sisaldama vhemalt hte eestikeelset ja hte ingliskeelset teadusartiklit, hte raamatut, soovitavalt ka hte bakalaureuse- vi magistritd. Kindlasti tuleb Bibsonomys lisada igale allikale vhemalt 3 mrksna (tag).

16

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

1.5*. Allikakriitiline lhenemine Ka tnapeval pole kusagile kadunud Baconi koopa-, himu ja teatri-iidolite mju uurmist objektiivsusele ja usalduvrsusele. Gmnaasiumi uurimistde kvaliteeti kahjustab tihtilugu just ebasobivate kirjalike allikate kasutamine, mille vastu aitaks allikakriitiline lhenemine. Allikakriitika on meetod kirjalike allikate kasutamiseks uurimists, mille kigus hinnatakse allika usaldusvrsust ja sobilikkust. Vikipeedia toob Skandinaavia ajaloolaste Olden-Jrgenseni ja Thurni phjal vlja jrgmised allikakriitilise lhenemise phimtted: Inimeste poolt loodud allikad vivad olla reliktid e. jnukid (niteks srmejlg) vi narratiivid e. jutustused (niteks kiri). Reliktid on usaldusvrsemad allikad kui narratiivid. Allikas vib olla vltsitud vi rikutud, kindlad tendid allika originaalsuse kohta tstavad selle usaldusvrsust. Mida lhemal on allikas sndmusele, mida selle abil kirjeldada soovitakse, seda enam vib allikat usaldada. Esmased allikad, mis phinevad originaalinfol, on usaldusvrsemad kui teisesed allikad, mis phinevad algallikatel. Teisesed allikad on omakorda usaldusvrsemad kui kolmandased allikad jne. Kui mitmed teineteisest sltumatud allikad sisaldavad sama infot, tstab see info usaldusvrsust. Allika tendentslikkus on selle motivatsioon pakkuda kallutatud infot. Tendentslike allikate kasutamist tuleb vltida vi tasandada ka teisele poolele kallutatud allikate kasutamisega. Kui on vimalik testada, et intervjueeritaval vi kirjaliku allika autoril puudub motivatsioon tendentsliku info edastamiseks, tstab see allika usaldusvrsust. Allikakriitilise lhenemise vljakujunemises on olulist osa mnginud ajalooteadused ja arheoloogia, kus oli selge vajadus allikate ja leidude usaldusvrsust hinnata. Teaduse arenguga laienes allikakriitline lhenemine ka teistesse teadusvaldkondadesse. Tnapeval on allikakriitiline lhenemine oluliseks oskuseks igale meediatarbijale. Internet loob vimaluse igahel kskik millist infot avaldada, seega tuleb ajaveebide ja muu kasutajate poolt loodud sisu allikakriitilisust enne nende kasutamist hinnata. Allikakriitilise lhenemise aluseks on veendumus, et iga teksti autoril vib olla oma (varjatud vi avalik) eesmrk lugeja mjutamiseks. Teksti kallutatus, heklgsus, erapoolikus jne muudavad selle ebausaldusvrseks allikaks ja seda eriti uurimist puhul. Ideoloogilise erapoolikuse krval on tnapeval levinuimaks riline kallutatus: he konkreetse rma rihuvidest lhtuvaid reklaamtekste ei saa tsiseltvetava ppematerjalina kasutada. Niteks informaatika-alastes uurimistdes on mnikord raske vltida brndi- vi platvormieelistustega tekstide kasutamist, kuid seejuures on alati vimalik kommentaaridega ja teiste rmade poolt pakutavate nidetega asja tasakaalustada. Just informaatika on traditsiooniliselt olnud veel he kallutatuse liigi kasvupinnaks: teatud arvutiplatvormi evangelistid toetavad emotsionaalselt ksnes oma lemmiktarkvara ja ritavad demoniseerida konkureerivaid lahendusi (nt. Linux vs. Microsoft, Mac vs PC, Android vs. IOS). Samas leidub evangeliste ka paljudes teistes valdkondades. Sotsiaalteadustes tuleb aga teadvustada tekstide koolkondlikku
17

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

kallutatust tavaliselt on igas valdkonnas isiksusepshholoogiast majandusteooriani rida omavahel konkureerivaid teooriaid, mis paljudes asjades on vastandlikel seisukohtadel. Uurimist peaks ritama koolkondade suhtes neutraalset seisukohta vtta, tuua esile ka teiste koolkondade ngemused. Kigi tekstide kallutatuse hindamisel on oluline uurida autori ja tema tausta. Ilma autori nimeta tekstide puhul (mis niteks reklaamtekstide puhul on ldlevinud) tuleks vaikimisi eeldada kallutatust ja sedalaadi tekstide kasutamist uurimist allikana tuleks vltida. Kui autor on teada, siis tuleks uurida autori tausta, vlistamaks tema vimalikku kallutatust nt. koolkonna, partei, religiooni vi rma rihuvide suunas. Eraldi tuleb siinkohal kstileda Vikipeedia ja teiste teatmeteoste kasutamist uurimist allikana. Tihtilugu soovitatakse vtida Vikipeediat selle madala usaldusvrsuse tttu, kuna Vikipeedia artikleid saab ju igaks muuta ja nende kvaliteedikontroll phineb vabatahtlike tl. Tegelikult on Vikipeedia kvaliteet aastatega oluliselt paranenud ja selle populaarse teatmeteose kasutamine uurimists on problemaatiline hoopis teistel phjustel: Vikipeedia on kogukonnaphiselt loodud materjal ning seetttu on kasutamisel konkreetsele autorile viitamine sageli vimatu. Vikipeedia artiklid on pidevalt muutuses, mistttu korrektne oleks viidata soovitud artikli konkreetse kuupevaga dateeritud versioonile - see tekitab segadust. Tegelikult ei loeta ei Vikipeedia ega teiste entsklopeediate tsiteerimist teadusts heaks stiiliks. Vikipeedia tsiteerimist lipilastdes on kritiseerinud Vikipeedia looja Jimmy Wales isiklikult: "For gods sake you're in college; don't cite the encyclopedia". Teatmeteoses on esitatud siiski vaid pinnapealne lhikokkuvte asjast, phjalikumaid selgitusi tuleks otsida muudest allikatest. Tavaliselt leiduvad Vikipeedia artikli lpus korrektsed viited autoriteetsetele publikatsioonidele, kus antud teema kohta phjalikumat infot leiab ja millele juba ka viidata sobib. Samas ei tohiks Vikipeedia tsiteerimist pilaste uurimistdes kategooriliselt vltida - kui ikka mingi uudse miste ainus vi parim eestikeelne denitsioon leidub ksnes Vikipeedias, siis vib seda ka julgelt kasutada ja korrektselt allikale viidata. Uurimist nrkust ja autori pealiskaudsust nitab tihti see, et suurem osa allikaviidetest prineb samast allikast. Seejuures pole vahet, kas selleks domineerivaks allikaks on Vikipeedia vi mingi muu kirjutis. lesanded 10.Arutlege klassikaaslastega, milliseid allikaid oleks mistlik vltida ja milliseid nende asemel eelistada, kui tahetakse uurida pronksi kajastusi meedias? 11.Uurige paaris mne varasema uurimist kasutatud kirjanduse nimekirja ning tooge vlja mned allikad, mille puhul vib kahtlustada kallutatust, mitteteaduslikkust vi mingit muud allikakriitikaga seonduvat probleemi.

18

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

2. Andmete kogumine ja analsiks ettevalmistamine


Kesolevas peatkis keskendume jrgmistele ksimustele: Kuidas andmeid koguda, et uurimist tulemused oleksid usaldusvrsed? Mida peaks ksimustiku koostamisel silmas pidama, mida vltima? Kas ka andmekogumist saab korraldada veebiphiselt? Kas andmeid tuleb koguda kigi kohta, keda/mida uurimist jreldused hlmama peaksid? Kuidas sisestada andmed arvutisse nii, et neid oleks vimalik mugavalt analsida? Kuidas veenduda, et andmete sisestamisel pole tekkinud vigu? 2.1. Andmete kogumise erinevad viisid NIDE 1 Malle soovib oma uurimists rkida oma kla inimeste mlestustest, mis seonduvad julukommetega nende lapseplvekodus. Jukul on plaanis lhemalt uurida ilmastiku muutumist kodukandis. Kalle tahaks teada saada, kuidas on inimesed harjunud euro kasutamisega. Sassi aga huvitab, milliseid veebilehti tema eakaaslased kige enam klastavad ja milliseid nad kige petlikemaks peavad.

Et oma ksimustele vastused saada, on neil kigil vaja koguda andmeid. Aga mil viisil on mistlik ja vimalik andmeid koguda, et uurimist tulemused oleksid usaldusvrsed? Andmete saamiseks vib lbi viia otseseid mtmisi vi kasutada andureid (mta vib nt temperatuuri, inimese pikkust, jooksu aega vms), kasutada olemasolevaid allikaid (arhiivimaterjalid, inimeste veebipostitused vi blogid, meediatekstid, fotod ja pildid, logid vms), korraldada vaatlusi, ksitlusi vi testimist. Seega, lhtuvalt sellest, mida me uurida tahame, vib andmetena kasutada vga erinevaid allikaid, kuid silmas tuleb pidada, et ei mindaks vastuollu eetikaga ning et uurimist lbiviija tunneks hsti vastavat tpi andmete analsimiseks sobivaid meetodeid. Andmete edasise ttlemise ja analsimise seisukohast ei ole tihti mrav, kas andmed on kogutud kirjalikult, suuliselt vi visuaalse vaatluse teel, vaid hoopis see,
19

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

kuivrd uurija mrab kindlaks vi jtab avatuks selle, millisel kujul peavad kogutavad andmed olema (konkreetsed arvud, valikud etteantud variantide hulgast, vaba tekst jms). Uurimismeetodite kontekstis rgitakse siinkohal tihti kvantitatiivsetest ja kvalitatiivsetest meetoditest. Kuna need snad on uurimistde lbiviimise juures vga mitmethenduslikud, viks andmete kogumisest rkides eelistada sisult konkreetsemaid misteid: struktureeritud ja struktureerimata andmekogumise viisid ja andmed. STRUKTUREERITUD andmekogumise meetodi tpilise nitena vib ette kujutada ht tavaprast ankeeti, kus vastajale on ette antud nii ksimused kui ka vimalikud vastuste variandid, mille hulgast ta vastavalt juhendile sobiva(d) vlja peab valima. STRUKTUREERIMATA andmekogumise tpilise nitena vib ette kujutada avatud intervjuud, mis sarnaneb vabale vestlusele, kus intervjueerija ei esita konkreetseid lhivastust eeldavaid ksimusi, vaid suunab intervjueeritavat teatud teemadest rkima, esitab kuuldu phjal tpsustavaid ksimusi ning julgustab teda oma mtteid phjalikult lahti seletama ja phjendama.

Loomulikult vib ette kujutada ka vahepealset varianti, kus vastajale esitatakse kas kirjalikult vi suuliselt vastamiseks avatud st ilma vastusevariantideta, kuid kllalt konkreetseid ksimusi, millele eeldatakse vastaja oma tlgendusest lhtuvat, kuid siiski sna lhidat vastust. Sellisel juhul viks rkida poolstruktureeritud andmekogumise meetodist. Levinumad andmekogumismeetodid on: loendamine ja mtmine (nt Sea-TV toitmiskohta klastavate loomade ja lindude arv) vaatluse dokumenteerimine mrkmetena (nt pilaste kitumine sgivahetunnil) struktureeritud vi struktureerimata intervjuud e suulised ksitlused struktureeritud vi struktureerimata kirjalikud ksimustikud (nt veebiphine ankeet) standarditud vimekus- ja sooritustestid (nt IQ test, PISA test) pshholoogilisi ja sotsiaalseid nhtusi (nt hinnangud, hoiakud) mtvad testid struktureerimata andmete (nt tekstide, videote, fotode) kodeerimine

20

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

lesanne 12.Meenuta koos kaaslastega, mil viisil olete ise andmeid kogunud (vi ninud kogutavat) ja tida jrgmine tabel rhmatna.
Andmekogumise viisid Millisel eesmrgil oled seda kasutanud? Millliste uurimisteemade vi ppeainetega see seondub?

Andmete andurilt

lugemine

Kirjalikest otsimine

allikatest

Vaatlus

Ksitlus

Testimine

21

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

2.2. Ksimustiku koostamise ABC NIDE 2 Liise soovib uurida, millised on tema klassikaaslaste plaanid prast keskhariduse omandamist. Ta alustas teemade vlja selgitamisest, mille kohta ta tahaks rohkem teada saada. Millised on klassikaaslaste keskhariduse omandamise jrgsed plaanid edasippimiseks vi ttamiseks? Missugune on edasippimise puhul esimene eelistus? Kuhu/kellena soovivad kaaspilased tle minna? Mis on tehtavate valikute phjused? Liise otsustas, et parim viis nende teemade kohta andmeid koguda on ksitlus lbi viia. Seega peab ta nd oma laiematest ksimustest vormistama ankeedi ksimused. Liise oli pisut kimbatuses, sest ta polnud varem ankeeti koostanud ega teadnud, mida ta peab selle koostamise juures silmas pidama. Tihti meldakse, et kuna oleme ise vastanud paljudele ksimustikele ning erinevaid ksimusi esitavad kik inimesed iga pev, siis on ksimustikku vga lihtne koostada. Uurimistde lbiviimise juures tuleb aga tihti ette, et uurijale nii selgena nivad ksimused ei ole vastaja jaoks hsti arusaadavad, mistttu jvad uurijal vastused saamata vi siis on saadud vastuste e andmete kvaliteet vga madal. Silmas tuleb aga pidada, et andmete kvaliteet on kogu uuringu kvaliteedi alus sellest ksi ei piisa heade ja usaldusvrsete tulemuste saamiseks, kuid kui andmete kvaliteet on kehv, siis ei aita kski andmete analsimise meetod saada hid tulemusi! Seeprast ole ksimustiku koostamise juures eriti hoolas, ksi petaja vi kellegi kogenuma abi ning pa jrgida alljrgnevaid juhiseid. HEA KSIMUSTIK ON: selge snastusega, kergesti ja heselt mistetavate ksimustega, kompaktne ja kiiresti vastatav, vormistuselt korrektne, koostatud nii, et vastajate ja andmete ttlejate potentsiaalselt tehtavate vigade hulk oleks minimeeritud. HOIDUDA TULEKS: suunavatest ksimustest, teaduslikult tpse, kuid pika ja keeruka snastusega ksimustest, mitmeti mistetavatest ksimustest, rritavatest ksimustest (sh ksimusega mittesobivatest vastusevariantidest)

Ksimuste kavandamisel mtle sellele ja otsi infot jrgneva kohta: Kas uuritavat nhtust saab mta otse vi indikaatori(te) kaudu? Kas nhtust on eelnevates uuringutes mdetud ning kas leiduvad usaldusvrsed ja sobivad ksimustikud, mida saaksid aluseks vi eeskujuks vtta? Kas saab juba olemasolevaid mdikuid kohandada vi tuleb vlja ttada uued mdikud/ksimused? (Pra thelepanu kultuurilistele ja kontekstuaalsetele erinevustele, vrreldavusele eelnevate uuringute tulemustega jne.)
22

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Kas peaks kasutama kellegi kogenuma abi? Kas peaks tegema katseksimise ning jrelkontrolli?

lesanded 13. Too niteid ksimustest, mis on: suunavad mitmeti mistetavad ksimused, millel on sobimatud vi vastajat piiravad vastusevariandid 14. Arutle, kuidas muuta eelmises lesandes esitatud ksimuste snastust nii, et need oleksid koosklas hea ksimustiku reeglitega. 15. Arutlege grupis, miks kirjalikes (eriti posti teel korraldatud) ksitlustes pole tavaliselt soovitav esitada avatud ksimusi. 16. Arutle, mis on avatud ja struktureeritud ksimuste eelised ja puudused vi piirangud.

2.3. Veebiphise ksimustiku koostamine NIDE 3 Kuna Kirsti on usin arvutikasutaja ning teab, kuivrd palju lihtsamaks vib infotehnoloogia kasutamine muuta t tegemise ja spradega suhtlemise, otsustas ta ka andmete kogumisel kasutada interneti vimalusi ning koostas veebiphise ksimustiku kasutades selleks programmi Google Forms. Valmis ksimustiku aadressi edastas Kirsti oma spradele e-posti teel, postitas foorumisse ning Facebooki. Esimesel peval laekus 23 vastust, teisel 11 ning jrgmistel pevadel vastuseid enam ei tulnud.

Veebiphisel andmekogumisel on oma tugevused: aja ja raha kulu suure hulga vastajateni judmiseks ja andmete kogumiseks on minimaalsed ning uuritavad saavad valida vastamiseks nendele sobiva aja. Siiski juhtub praktikas tihti, et veebiphiselt saadetud ksitlusele ei saada soovitud hulgal vastuseid, sest igapevases informatsioonitulvas jb saadetud ksitlus mrkamata vi seda lihtsalt ignoreeritakse, kuna vastamise palve saanutel puudub huvi teema vastu ja seetttu ka motivatsioon oma aega panustada. Vastajate motivatsiooni vib vhendada ka see, kui prdumine ja ksitlus on lohakalt, oskamatult vi vigaselt vormistatud, sisaldades kirjavigu, ebakorrektset keelekasutust, ebasobivat vi vastamist segavat kujundust vms. Arvestada tuleb ka sellega, et kik sihtgrupid ei
23

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

pruugi olla aktiivsed ja vilunud arvutikasutajad, mistttu sellisel teel saadetud ksitlus ei jua nendeni vi jb vastamine toppama vhese arvutikasutusoskuse tttu. Suurema osaluse tagamiseks peaks vastajate poole prdumine olema motiveeriv ning vajadusel informeeritakse neid uuringu toimumisest eelnevalt niteks telefoni teel. Veebiphiseid ksitluste koostamise ja lbiviimise programme on mitu. Alljrgnevas on vrdlevalt kirjeldatud mnda neist. Pane thele, et osa programmidest on sna piiratud vimalustega, kuid algajale kasutajale lihtsamad, teised jlle on vga professionaalset lhenemist lubavad, aga seelbi ka keerulisemad kasutada. Valida tuleb see, mis vastab parimal viisil sinu eesmrkidele ja oskustele. petused Google Formi ja LimeSurvey kasutamiseks leiad AKU kursuse kodulehelt aku.opetaja.ee/abi. Google Form on lihtne veebiphine ksitluste koostamise vahend, sisaldades seitset philist ksimuse tpi: lhike tekst, pikem tekstiala, valikvastusega ksimus (nii he kui ka mitme vastusevariandi valimise vimalused), hinnanguskaala ning tabeli tpi ksimus. Ksitluse tausta kujundamiseks pakutakse le 90 nidisphja. Valmis ksitluse saab saata programmist otse e-postile, lisada veebilehele, kopeerida ksitluse aadress foorumisse vms. Ksitluse tulemused salvestatakse andmetabelina ning neid on vimalik alla laadida .xls failivormingus. Tulemuste graalist kokkuvtet on vimalik vaadata Google Docsi keskkonnas. Connect.ee on eestikeelne ksitluste koostamise vahend, mis sisaldab kmmet ksimuse tpi ning pakub kasutamiseks erinevaid uuringumalle. Eeldab kasutajaks registreerumist Connect.ee keskkonnas. Tasuta vahend sisaldab 3-kuulist kasutusaega, kuni 3 ksitlust (igas maksimaalselt 10 ksimust) ning kuni 50 vastaja tulemusi he ksitluse kohta. Ksitluse aadressi saab saata e-posti teel vi kopeerida otselingina. Tulemused on koondatud graakutesse ning neid on vimalik edasiseks ttlemiseks Exceli-formaadis alla laadida. eFormular on lihtne eestikeelne vahend, mis sisaldab phjalikku abiinfossteemi. Formularide koostamine ja ksitluste lbiviimine on tasuta, tasuliseks muutub vastuste (alates 10. vastajast) vaatamine ja allalaadimine vastavalt hinnakirjale (11...100 vastajat 7 ). Eraldi hinnad kehtivad ldhariduskoolidele ning kutsehariduskeskustele. LimeSurvey on vabavaraline ksitluse loomise tarkvara, mille kasutamine eeldab tarkvara installeerimist oma serverile. Vimaldab koostada viite tpi (kuni 28 alatpi) ksimusi. Eesti koolidel on vimalik kasutada LimeSurvey teenust Havikese paketi sees, vt. havike.eenet.ee. SurveyMonkey on tasuline veebiphiste ksitluste teenus, mille piirtaud vimalustega pakett on tasuta ja tiewsti piisav lihtsamate ksimustike koostamiseks.

24

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

lesanded 17. Too niteid teemadest ja sihtrhmadest, mille/kelle uurimisel sobiks kasutada veebiphiseid andmekogumisvahendeid ja mille/kelle puhul mitte. 18. Koosta vastajaid motiveeriv prdumine (kaaskiri) palumaks neil osaleda ptk 2.2. nites ksitletud uuringus (teemaks tegurid, mis mjutavad klassikaaslaste valikuid prast keskhariduse omandamist). 19. Arutle, mis visid olla phjused, et Kirsti (vt. nide 3 eespool) sai loodetud mitmesaja vastuse asemel ainult pisut le kolmekmne vastuse. 20. Arutle, mida tuleks jrgnevas ksitluse kaaskirjas muuta. Tere! Viin lbi ht vikset uuringut, mis aitaks mul enda lputd kirjutada. Kellel aega ja tahtmist viksid vastata alljrgnevatele ksimustele... 21. Koosta vastajaid motiveeriv prdumine (kaaskiri) palumaks neil osaleda lesandes ksitletud uuringus. 22. Vta aluseks enda varem koostatud ksimustik ning paranda/snasta mber ebasobivad ksimused.

25

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

2.4. Andmeanalsi phimisted NIDE 4 Ats oli kogunud suure hulga andmeid ja neid juba ka analsinud, kuid kui ta tulemusi petajale nitas, tles viimane, et analsiks valitud meetodid ei ole andmetele kohased ja uuris, miks Ats oli valinud just sellised ksimused ja valikvastused, kui ta oma ksimustikku koostas. Ats ei osanud midagi kosta ja ksis, kas ta siis ei saagi kogutud andmeid analsida. petaja rahustas Atsi, et mingi analsi saab ka tema kogutud andmete phjal lbi viia, kuid samas mainis, et jrgmine kord tasub analsi vimaluste peale melda juba enne andmete kogumist ja selleks on vaja teada pisut teooriat!

Niisiis, enne kui (jrgmisel korral) otsustad, mil viisil ja milliste konkreetsete vahendite vi meetoditega oma uurimists andmeid koguma hakata, pime selgeks neli andmeanalsi juures mdapsmatut terminit: objekt, tunnus, vrtus ja skaala ning rgime pisut erinevatest struktureeritud andmete tpidest. hest kljest aitab nende terminite teadmine paremini vastavatest teemadest rkida ja aru saada, teisest kljest aitavad laiemad teadmised andmete olemusest saada paremaid ja usaldusvrsemaid analsitulemusi. Tuletame meelde, et vastavalt sellele, mida me uurida tahame, kogume me andmeid kas inimeste, koolide, valgete hiirte, kalendrikuude, kartulipldude vms kohta. Kiki selliseid indiviide vi ksusi, kelle/mille kest vi kohta me andmeid kogume, nimetatakse statistilises andmeanalsis objektideks. Andmeid koguma asudes oleme valmis melnud mingid neid objekte iseloomustavad omadused, mis meid huvitavad, niteks: vrvus, vanus, hind, kaal, arvamus millegi suhtes jne selliseid omadusi nimetatakse muutujateks. Omadusi, mida saab mta nii (vi mis on juba kokku vetud nii), et iga objekti jaoks saadakse ainult ks vastus ehk ks hik infot, nimetatakse tunnusteks. Objektid ja tunnused peavad olema valitud enne andmete kogumist ning andmete kogumise kigus pame saada tulemuse vi vastuse iga objekti kohta kigi meid huvitavate tunnuste likes statistika terminoloogiast lhtudes on need vrtused. Nii vivad tunnuse haridus vimalikud vrtused olla niteks algharidus, phiharidus, keskharidus ja krgharidus, aga tunnuse vanus vrtused niteks arvud 12, 27, 6 jne. Neme, et andmed ehk vrtused vivad olla nii arvud kui ka snad. Kik tunnuste vimalikud vrtused kokku moodustavad skaala. Niteks inimese pikkust mtes vtame kasutusele harjumusprase arvskaala, mida neme mdulindil, ksimustikku koostades peame aga tihti ksimustele vastusevariandid vlja mtlema ehk vastavate tunnuste jaoks skaala ise konstrueerima. Vimalikest vrtustest e skaalast sltub, mis tpi tunnusega on tegu ja sellest omakorda, milliseid analsi meetodeid vastava tunnuse analsimiseks saab kasutada. igeks analsimeetodi valikuks tuleb osata teha vahet vhemalt kolmel tunnuste phitbil: nimitunnused, jrjestustunnused ja
26

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

intervalltunnused. Praktilise andmeanalsi seisukohast on intervalltunnusel olulised alamtbid, mistttu saame alljrgneva jaotuse, kus tpe eristavateks vtmeksimusteks on see, kas vastuseid e vrtusi saab heselt jrjestada vi mitte?, kas vastustest/vrtustest moodustatud skaalal tekkivad vahemikud on vrdsed vi mitte? kas vimalikke erinevaid vastuseid e vrtusi on vhe vi palju? Selgitame tunnuste tpide vahelisi erinevusi nidete ja kitsenduste abil: Nimitunnused (nt rahvus: eestlane, venelane, soomlane ...). NB! Nimitunnusel ei ole vrtused heselt jrjestatavad, jrjestustunnusel on! Jrjestustunnused (nt haridustase: algharidus, phiharidus, keskharidus, ...). NB! Jrjestustunnusel ei ole vrtuste vahemikud vrdsed, intervalltunnusel on! Intervalltunnused, sh arvtunnused (nt vanus: 27 a, 32 a, 51 a ...) NB! Intervalltunnused vheste erinevate vrtustega (nt neljapalline rahuloluskaala: rahul, pigem rahul, pigem mitte rahul, mitte rahul). Intervalltunnused paljude erinevate vrtustega (nt palk: 926 eurot, 1003 eurot, 1442 eurot ...) On endastmistetav, et andmeid analsides pole niteks vastanute keskmist rahvust arvutada mtet, sest sellel tulemusel puuduks sisuline thendus. Selline piirang kehtib ka kigi teiste nimitunnuste jaoks. Analsi kigus tuleb aga ette mitu palju keerukamat olukorda, kus pead teadma, milline meetod millist tpi andmete jaoks sisuliselt sobib ja milline mitte. Pane siis edaspidi andmete analsimise meetoditega tutvudes alati thele ja mtle kaasa, millist tpi andmete jaoks ks vi teine kirjeldatav meetod hsti sobib ja millist tpi andmete puhul ei ole asjakohane vi korrektne seda meetodit kasutada. Oluline on, et saaksid vale meetodi kasutamisega kaasnevatest probleemidest sisuliselt aru, selle asemel, et pda reegleid phe ppida!

lesanne 23.Vaadake alltoodud ksimusi ja kujutledes, et selliseid andmeid saaksite koguda nt saja kooli kohta, otsustage, mis tpi tunnuse moodustavad iga ksimuse phjal saadavad andmed. Mis tpi kooliga on tegu? (algkool, 9-klassiline kool, 12-klassiline kool) Kui kaugel on kool kesklinnast? Milline on kooli maine? (vga hea, hea, rahuldav, halb, vga halb) Millised huviringid koolis tegutsevad? (laulukoor, korvpallitrenn, kunstiring jne) Mitu paralleelklassi avatakse? Kui suured on selles koolis klassid? (vikesed, keskmised, suured) Mis on petajate keskmine vanus selles koolis?
27

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

2.5*. Valim ja ldkogum NIDE 5 Malle soovib oma uurimists rkida oma kla inimeste mlestustest, mis seonduvad julukommetega nende lapseplvekodus. Kalle tahaks vrrelda huvitegevuse vimalusi maa ja linnakoolides. Sassi aga huvitab, milliseid veebilehti tema eakaaslased kige enam klastavad ja milliseid nad kige petlikemaks peavad.

Et oma ksimustele vastused saada, on neil kigil vaja koguda andmeid. Aga kuidas otsustada, kellelt andmeid koguda? Kui me loeme hoolikalt nites 5 toodud uurimist eesmrkide snastusi, siis neme, et need mravad kll ra sihtrhma, kellelt vi mille kohta andmeid koguda, kuid ei piiritle seda vga tpselt. Niteks Malle puhul on selleks oma kla inimesed, Kalle puhul maa- ja linnakoolid ning Sassi puhul tema eakaaslased. On selge, et tegelikus elus ei ole tihti vimalik vaadelda, mta, loendada vi ksitleda kiki objekte, keda meie esialgsed uurimiseesmrgid sihtrhmana kirjeldavad. Olukorra lahendamise ks vimalus on piiritleda sihtrhm kitsamalt, arvestades sellega, kelle kest vi milliste objektide kohta me tegelikult suudame andmeid koguda, ning teha oma jreldused ka ainult selle grupi kohta, mille kohta on meil andmed olemas. Algajatel uurijatel, kelle on veel vhe oskusi ning uurimist lbiviimiseks napib ka aega ning raha, on tihti mistlik just selline tagasihoidlik strateegia valida. Tsisemate uuringute eesmrk on aga tihti ka ldistusi teha, st kirjeldada mingit laiemat objektide hulka, mille kiki objekte ei ole uuringu kigus reaalselt vimalik (ega ka mttekas) vaadelda. Niteks pshholoog, kes uurib valgete hiirte ppimisvimet, loodab, et saavutatud tulemused ning seega ka jreldused kehtivad kigi valgete hiirte puhul mitte ainult praeguste, vaid ka veel sndimata hiirte puhul, ning ta vib isegi loota, et tema tulemusi vib sedavrd ldistada, et need selgitaks inimese ppimist. ldistavate jrelduste alus vib olla teoreetiline teadmine objektide sarnasuse kohta, uuritud objektide tpilisus vi statistiline tenosus. Viimasel juhul rgitakse andmete kogumisel valimist, mille phjal saab teha jreldusi ldkogumi kohta. ldkogumi (ehk populatsiooni) all meldakse kiki juhtumeid vi situatsioone, mille kohta uurijad soovivad, et nende saadud jreldused vi prognoosid kehtiksid. Niteks vivad eri valdkondade esindajad tahta uurida (kigi) Tallinna koolilaste pimotivatsiooni; ra arvata erinevatel eksamitel lbipsevate pilaste (ld)arvu; ennustada viljasaaki (kigil) uue vetisega vetatavatel pldudel jne. ldkogumist uurimiseks valitud (sna vikest) objektide gruppi nimetatakse valimiks. Selleks, et valimi phjal ldkogumi kohta statistiliste meetodite abil ldistatud jreldusi teha, tuleb valimi liikmed valida juhuslikult. Juhuslikult ei ole selles kontekstis sugugi
28

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

snonm suvalisele; juhuslikkus statistikas thendab, et igal ldkogumi liikmel peab olema vrdne vimalus valimisse valitud saada. Kahest valimist peetakse paremaks seda, mis on esindamisvimelisem ehk ennustab tpsemalt ldkogumi omadusi. Selleks, et tagada valimi esindamisvime, on mitu vimalust. ks vimalus on valimit suurendada, aga palju sltub ka valimi moodustamise viisist. Allpool olevas tabelis on valimite liigid esitatud valimi tugevuse kahanemise jrjekorras. Kikne valim Juhuvalim Olukord, kus ldkogumi suuruse vi eripra tttu kaasatakse uuringusse kik ldkogumi objektid e. ldkogum = valim. Kui meil on kasutada ldkogumi liikmete nimekiri: kigepealt tuleb ksikud liikmed nummerdada, mrata valimi maht e valimisse valitavate objektide arv, juhuslike arvude tabeli vi arvuti juhuslike arvude generaatori abil leida vastav hulk arve, mis mravad valimisse valitavate ldkogumi liikmete jrjekorranumbrid. Sstemaatiline Kui meil ei ole ldkogumi liikmete nimekirja. Niteks valim tnavaksitlusel ei tea, kes teile jrgmisena vastu tuleb ning loomulikult ei saa te neid vastutulijaid eelnevalt nummerdada. Nimekirja puudumisel tuleks toimida nii: eelnevalt tuleb otsustada, et te ksitlete prast iga eelmise intervjuu lppemist niteks tpselt viiendat vastutulijat vi siis inimest, kes tuleb teile vastu tpselt 1 (vi 2, vi 3 vi jne) minutit prast eelmise intervjuu lppu. Kihtvalim Mnel juhul, kui on ette teada, et ldkogum koosneb erinevatest osadest (niteks gmnaasiumis pib 700 naissoost ja 300 meessoost pilast) ning meil on phjust arvata, et need osad omavahel mne tunnuse osas erinevad, siis on mistlik kasutada kihtvalimit, kus eelnevalt otsustatakse, kui palju liikmeid valitakse valimisse igast ldkogumi erinevast osast. Tavaliselt tehakse seda proportsionaalselt ldkogumi tegeliku jaotusega. Seega, kui me tahame saada sajaliikmelist valimit, mis oleks proportsionaalne eelnevas nites toodud ldkogumiga, siis peaksime vlja valima 70 naist ja 30 meest, kusjuures naiste ja meeste hulgast tuleb valimi liikmed valida eespool toodud nudeid arvestades, st juhuslikult.

M u g a v u s - Moodustub inimestest, kellelt on ksitlejal mugav vastused ktte valim saada: niteks oma klassikaaslased, sugulased-tuttavad vi Facebooki-kontaktid. See on kige nrgem valimitp ja selle phjal ei saa ldkogumi kohta hinnanguid anda. Tabel 1. Valimite tbid
29

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

NIDE 6

Juss sai lesandeks uurida kiki oma kooli pilasi. Uuringu teema oli rahulolu kooli toiduga. Kuna Juss ja tema sbrad olid koolitoiduga vga rahul, ei pidanud ta vajalikuks ksitleda kedagi peale oma sprade. Kikide kooli pilaste ksitlemine oleks niikuinii liiga kaua aega vtnud.

lesanded 24. Arutle, kas Malle, Kalle ja Sass suudaksid koguda andmeid kigi sihtrhma liikmete e objektide kest/kohta. 25. Too nide olukorrast, kus terve ldkogumi uurimine ei ole praktiliselt vimalik. 26. Too nide ldkogumist, mille kiki objekte oleks vimalik uurida, kuid see oleks vga ressursikulukas. 27. Vasta jrgmistele ksimustele nite 6 phjal: Kes moodustasid selles nites ldkogumi? Kas Jussi arvamus, et ta kiki kooli pilasi ksitleda ei jua, oli phjendatud? Kas Jussi sprade arvamus annab levaate sellest, mida arvavad kik tema kooli pilased? Phjenda vastust. 28. Millist tpi valimi soovitaksid sina Jussil (vt nide 6 eespool) moodustada, et see oleks juhuslik ning annaks levaate kikide kooli pilaste arvamusest? 29. Sstemaatilist valimit saab koostada ka nimekirja olemasolu korral. Too nide. 30. Arutle oma pinginaabriga, millisel viisil viks moodustada valimi Eesti avaliku arvamuse ksitluste lbiviimisel. 31. Kui ldjuhul kaasatakse Eestis avaliku arvamuse ksitlustesse umbes tuhat inimest, siis kui suur on tenosus, et sina satud juhuvaliku tulemusena valimisse?

30

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

2.6. Struktureeritud andmestik ja andmetabeli koostamine NIDE 7 Malle oli lbi viinud ankeetksitluse, milles kokku 26 ksimust. Ta hakkas hinal paberil olevaid andmeid analsima, lapates ksitluslehti ja lugedes kokku hte moodi vastuseid. sna varsti Malle tdis sellest tegevusest ja otsustas, et andmete analsimine on ks tlikas ja igav t.

Enne arvulisel vi struktureeritud kujul olevate andmete analsima asumist on mistlik andmed sisestada andmetabelisse, kasutades selleks mnd ruudulise tlehega arvutiprogrammi (nt MS Excel, LibreOfce/OpenOfce.org Calc, Statistica, SPSS jne) ning kasutada hiljem andmete analsimisel arvuti abi. Viimane pstab meid korduvast ja aeganudvast andmete loendamisest ning vimaldab kiiresti ja mugavalt kasutada samu andmeid uute sisuliste analsiksimuste vastamiseks. Algandmetest andmetabelit koostades tuleb eelkige meeles pidada, et ige andmetabel peab olema askeetlik st hsti lihtsa ja alati samasuguse phistruktuuriga: iga objekt saab endale tabelis he rea, iga tunnus omale he veeru ning iga vrtus he lahtri. Toome kaks nidet andmetabelitest, mis on mlemad korrektse lesehitusega, kuigi esimese puhul on tegu koolipilaste ning teisel puhul professionaalide koostatud tabeliga.
Keskmine hinne 48 53 60 53 55 54 56 57 76 4,31 3,26 3,67 4,38 5 4,31 4,44 4,75 3,38 Kassid Smine

Sugu N N M M N N N N M

Snniaeg 3.04.1981 14.11.1979 18.02.1980 24.01.1980 23.08.1980 23.04.1980 19.08.1980 21.05.1980 4.08.1980

Pikkus 160 162 169 162 165 169 168 169 179

Kaal

Hobi sport Muusika Ujumine Magamine Muusika sport

Thtkuju Jr Skorpion Veevalaja Veevalaja Neitsi Snn Lvi Snn Lvi

Tabel 2. pilase koostatud andmetabel.

31

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

ID 1 2 3 4 5 6 7 8 9

A05 6 6 6 6 6 6 6 6 6

C0100 21 26 30 31 33 34 37 46 47

C0200 1 1 1 1 1 1 1 1 1

C0400 4 2 2 2 2 2 2 2 6

C3200 560 482 700 3000 2400 504 6000 1000 3800

D02 9 9 1 3 3 9 3 4 1

E03 4 3 3 3 2 3 2 3 3

E05 4 4 2 3 2 3 2 3 3

Tabel 3. Professionaali koostatud andmetabel kodeeritud andmetega Mugava ja paindliku analsi tagamiseks tuleb andmetabeli koostamisel arvestada veel mitme reegliga, millest olulisemad on jrgmised: Igale tunnusele/veerule antakse nimi, mis peab olema unikaalne, st teistest erinev, ning sna lhike, sest pikkade nimede puhul vtab igete tunnuste otsimine analsi kigus vga palju aega; ei kasutata mitut veergu hendavaid pealkirju jms! Igas lahtris tohib olla ainult ks vrtus e ks hik infot, st mitut vastust hte lahtrisse sisestada ei tohi! Seega, kui he ankeedi ksimuse puhul on vastajal lubatud valida mitu vastusevarianti, annab iga variant andmetabelis eraldi tunnuse/veeru. Professionaalid vldivad andmete sisestamist tekstidena ning kasutavad selle asemel vastusevariantide kodeerimist, sest nii hoitakse kokku aega, vlditakse sisestusvigu ning hiljem on vimalik andmeid paindlikumalt analsida. (PS! Ilma kodeerimiseeskirja teadmata ei ole sellist andmestikku sisuliselt vimalik analsida, professionaalsed statistikapaketid lubavad kodeerimiseeskirja sisestada koos andmetega ja oskavad seal olevaid kirjeldusi ka kasutada!) hes veerus tohivad olla ainult ht tpi andmed, st kui on otsustatud tunnuse snaliste vrtuste asemel kasutada arvulisi koode, siis arvude vahele muid smboleid ei sisestata; puuduva vastuse/vrtuse jaoks meldakse vlja sobiv arvuline kood vi jetakse vastav lahter lihtsalt thjaks.

lesanded 32.Arutle, kas Mallel (vt nide 5 eespool) on mistlik analsi sellisel viisil lbi viia? Kui Malle ind poleks raugenud, kas ja kuivrd oleksid tema analsi tulemused olnud piiratud? Kuidas andmete analsimise juures tmahtu vhendada ja analsitulemuste usaldusvrsust tsta?
32

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

33.Lisaks uurimuse teemaga seonduvatele ksimustele kogutakse vastajate kohta selleks, et vrrelda tulemusi niteks soo, vanuse, hariduse, elukoha vi mne muu huvipakkuva tunnuse likes ka vastavaid sotsiaal-demograalisi andmeid. Koosta ksimustiku alltoodud taustatunnuste osa kohta andmetabel ja sisesta sinna enda kohta kivad andmed.

1. Sugu: mees naine 2. Vanus: ________ aastat 3. Leibkonna liikmete arv: ___________ 4. Elukoht: Tallinn maakonnakeskus, suurem linn vikelinn maa-asula, kla 5. Krgem omandatud haridustase: algharidus phiharidus kutseharidus (ilma keskhariduseta) keskharidus kutseharidus + keskharidus rakenduslik krgharidus likooliharidus, kraadiharidus

6. Tegevusala: (mrgi kik sobivad vastused) kin tl lipilane, pilane pensionr kodune ttu

Kigi uuringus osalejate vahel loositakse vlja 20 x 10 kinkekaarti. Loosimises osalemiseks palun kirjutage oma e-posti aadress: ____________________________________

Tname koost eest!

33

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

2.7. Andmete korrastamine NIDE 8 Anne oli juba tkk aega andmeid analsinud, kui talle hakkasid tulemused kahtlased tunduma kui nd keskmiseks hindeks tuli grupil arvutuste kohaselt 5,72, oli selge, et seda ei saa teseks pidada, sest isegi ksikud hinded ei saa ju le 5 olla! Anne oli kimbatuses ega osanud vea phjust leida.

Andmete sisestamisel andmetabelisse peab olema vga hoolikas, et vltida sisestusvigu, sest tihti pole hiljem vimalik neid vigu leida. Samas peaks enne andmete sisulist analsi siiski veenduma, et andmete sisestamisel pole tekkinud tpilisi ja kergesti tuvastatavaid npuvigu. Niteks on tpilised vead sellised, kus arvude sisestamisel on koma jnud panemata vi on see sattunud valesse kohta; kodeeritud andmete puhul on koodi 2 asemel sisestatud 22 vi koodi 5 asemel 55; tekstina sisestatavate andmete puhul on sama vrtuse jaoks kasutatud erinevaid snu (nt Harjumaa ja Harju maakond) vi on tekkinud kirjaviga (nt Tallinn asemel on sisestatud Talliin) vms. Selliste vigade leidmiseks vib kasutada erinevaid tarkvaravimalusi, kuid Exceli puhul on ks vga nutikas lahendus kasutada ltreerimist. Valides Data/Sort&Filter/ Filter, lisatakse kigi tunnuste/veergude pisele valikunupp, millel klpsides kuvatakse rippmens kik veerust leitud erinevad vrtused. Kui nende hulgas on selliseid, mis antud tunnuse puhul pole lubatud, siis saab need sama ltreerimise vimalust kasutades les leida ning vastavalt parandada (vajadusel tuleb ige vrtuse teadasaamiseks otsida les vastava objekti mtmistulemuste leht vi ksimustik!). Harjutus. Kontrollime andmestiku ess.xlsx (Euroopa sotsiaaluuringu andmestiku phjal) sisestusvigade suhtes ltreerimise teel. Valime Data menst Sort&Filter alt Filter Meie andmestiku veerupistesse ilmusid ltri valiku nupud. Avades tunnuse Regioon ltri, neme rippmens valikuid erinevatest tunnuse vrtustest. Andmesisestusel on mnel korral eksitud vrtuse Phjaeesti sisestamisel, selle asemel peaks olema Phja-Eesti. Eemaldame selekteeringu (Select All) ning valime ainult vrtuse, mida soovime muuta (antud nites: Phjaeesti). Valikut kinnitades (OK) neme andmetabelis vaid neid objekte, kellel on regiooni vrtuseks Phjaeesti. Teeme parandused ning eemaldame ltris mratud tingimuse (Clear Filter form Regioon) Lisaks vrtuste loendile pakub treerimine ka andmetabeli jrjestamist valitud tunnuse vrtuste phjal (Sort). Andmete jrjestamine vrvi jrgi (Sort by Color) eeldab, et andmete sisestamisel on kasutatud erinevaid vrve (Font Color). Snalise tunnuse korral saame kasutada teksti ltreid (Text Filters), mis pakuvad laiemaid vimalusi andmete ltreerimiseks. Niteks saab mrata, kas mingi fraas sisaldub (vi ei sisaldu) ltreeritavates kirjetes. Samuti saab mrata, millise the/
34

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

fraasiga algavad vi lpevad ltreeritavad kirjed. Samaaegselt saab mrata mitu tingimust. Numbrilise tunnuse ltreerimisel pakub numbrilter (Number Filters) veelgi enam tingimuste mramise valikuid (suurem/viksem teatavast vrtusest, vrtuste vahel asetsev, keskvrtusest viksem/suurem jne). Pane thele, et ltri kasutamise tagajrjel kuvatavatel kirjetel on algne rea numer ning objektid, mis ei vasta mratud tingimusele, on peidetud (mitte kustutatud). Andmestiku all on ra toodud objektide arv, kui palju vastavale tingimusele vastavaid objekte leiti.

lesanded 34. Mtle ja arutle, mis vivad olla Anne (nide 8) puhul valede analsitulemuste phjused? 35. Arutle, miks peab olema ettevaatlik ltreeritud andmestikust niteks kolme jrjestikuse objekti kustutamisel. 36. Vaata andmestikus ess.xlsx tunnuse Tegevus sisestatud vrtusi. Arutle, milliseid vrtuseid viks koondada heks vrtuseks ja vii see koodamine lbi? 37. Paranda andmestikus ess.xlsx esinevad sisestusvead (Leibkonna suuruseks on sisestatud 50, peaks olema 5; kooliskidud aastate arvu 80 asemel peaks olema 8). Leia lisaks veel hes tunnuses esinev sisestusviga. 38. Selle lesande eelduseks on, et andmestikus on sisestusvead parandatud ning sobivad andmed koondatud. Kasuta ltreid ja leia, kui palju on ksitlusele vastanuid, kes ... on alla 65-aastased pensionrid on magistrikraadiga ttud elavad Kirde-Eestis ning kelle kodune keel on eesti keel on le 40- ja alla 50-aastased mehed ning kivad tasustatud tl

35

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

3. levaade andmetest
Kesolevas peatkis keskendume jrgmistele ksimustele: Millise meetodiga saab kige lihtsamalt levaate andmetest? Millal ja kuidas on statistiliselt korrektne oma uuringu tulemusi ldistada? Kas mnikord on ainult tekst tulemuste esitamiseks parim viis? Mis on diagrammide eesmrk ja kuidas seda saavutada? Miks ei piisa mnikord ainult keskvrtuse arvutamisest? Milleks on vaja mediaani, moodi ja standardhlvet?

3.1. Andmete analsimise phisammud Eeldame nd, et oleme andmete kogumise, sisestamise ja korrastamise etapid lbinud ja saame alustada andmete analsimist. Kuidas aga otsustada, millist meetodit oma andmete analsimiseks kasutama peaksid? Anals algab ksimuse snastamisest andmete kohta. Niteks: Kui suurel osal ksitlusele vastanutest on Facebooki konto?, Kuidas jagunevad spordipeval saadud jooksutulemused?, Kas ja kui palju hommikul ja htul mdetud hutemperatuurid erinevad?, Kas kitumise hinne on seotud hindega klassijuhataja petatud aines? jne. Pane thele, et need andmete analsi suunavad ksimused erinevad nii uurimisksimustest, mis suunavad uurimistd tervikuna, kui ka ksimustikus vastajatele esitatud ksimustest! Analsi tuleks alustada lihtsamate hte tunnust korraga puudutavate ksimustega, mis annavad andmetest esialgse ldise levaate. Prast andmetest esialgsete kokkuvtete ja levaadete tegemist on vimalik asuda uurima ka erinevusi ja seoseid. Sammud andmete analsi lbiviimisel: Snastan konkreetsetest andmetest lhtuva ksimuse, millele tahan vastust saada. Valin pstitatud ksimusest lhtudes kasutada olevate andmete jaoks sobiva analsimeetodi. Tulemuste esitlemiseks valin andmete olemust ja tulemuste sisu parimal viisil vlja toova ning sihtrhmale arusaadava ja esitluse kohale sobiva esitlusviisi ning kujunduse.

36

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

NIDE 9

10. klasside pilaste seas viidi lbi internetikasutuse uuring . Muuhulgas ksiti ka seda, kui sageli pilased klastavad Facebooki portaali, kusjuures vastamiseks anti viis vastusevarianti: mitu korda pevas; tavaliselt kord pevas; kllalt regulaarselt, aga mitte iga pev; sna harva, ebaregulaarselt; ei kasuta ldse. Esmased andmete analsi suunavad ksimused viks olla nt sellised: Kui suur osa pilasi kasutab Facebooki iga pev? Kas ja kui palju leidub neid pilasi, kes Facebooki ldse ei kasuta? Mis on kige tpilisem kasutussagedus ehk millise vastusevariantidest on valinud kige suurem osa pilastest?

Kik nites 9 toodud ksimused eeldavad vastamist kahte tpi ksimustele: Kui palju? Kui suur osa? Vastuse saamiseks seda tpi ksimustele tuleb loendamise teel leida erinevate vastusevariantide e vrtuste esinemissagedused. Arvuti abil vastavat analsi lbi viies tuleb tunda nii tavapraste statistiliste meetodite nimesid kui ka kasutada oleva tarkvara vimalusi.

lesanne 39. Koosta nites 9 toodud teema kohta veel ks sama laadi ksimus.

37

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

3.2. Sagedustabel Isegi kui esmane ksimus eeldab ainult he vastusevariandi e vrtuse esinemissageduse leidmist, koostatakse arvuti abil analsi lbi viies mugavuse ja analsi kompaktsuse tttu ldjuhul vastava tunnuse kiki vrtusi kokkuvttev sagedustabel, mis viks eelpool toodud nite 9 puhul vlja nha selline:
Vastajate arv Mitu korda pevas Tavaliselt kord pevas Kllalt regulaarselt, aga mitte iga pev sna harva, ebaregulaarselt Ei kasuta ldse KOKKU 347 209 24 25 35 640 Osakaal 54,2% 32,7% 3,7% 3,9% 5,5% 100%

Tabel 4. Facebooki klastuste sagedus. Tabelis 4 on lisaks sagedustele (vastajate arv) vlja toodud ka iga vrtuse esinemise osakaal protsentides, mis lihtsustab andmetest levaate saamist. Tulemusi uurimist raportis kirjalikult esitledes tuleb arvestada, et igale lisatud tabelile, diagrammile ja joonisele tuleb tekstiosas viidata ning tabelis vi diagrammil olev sisu seletatakse tekstiosas lahti. Lahtiseletuseks ei sobi tabelis vi diagrammil oleva arvulise info kshene tekstina leskirjutamine. Nii ei sobi tabelis 4 toodud tulemuste lahtiseletamiseks niteks jrgmine tekst: 47 pilast ei kasuta Facebooki portaali ldse, 184 pilast kasutab kllaltki regulaarselt, kuid mitte iga pev. 84 pilast kasutab portaali mitu korda pevas, 101 kasutab tavaliselt kord pevas ja 224 pilast kasutab Facebooki sna harva. Tabelis vi diagrammil olevate arvuliste tulemuste lahtiseletamisel uurimist tekstis tuleks vlja tuua ldised tendentsid (nt le poolte vastanutest kasutavad portaali mitu korda pevas vi ligikaudu 85% vastanutest kasutab portaali vhemalt ks kord pevas) ning see, mis on t sisulises kontekstis selle tulemi korral oluline ja mida tahetakse esile tsta. Allpool vaatame internetikasutuse osakaalusid 2008. aastal erinevates riikides 617aastaste laste seas. Tulemuste esitamiseks on koostatud kaks sisuliselt sama, kuid andmete jrjestuse poolest erinevat tabelit.

38

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Juhul kui tabelis toodud kategooriad ei ole sisuliselt thenduslikus jrjekorras, siis tuleks tabeli read sageduste/osakaalude jrgi mber jrjestada (parempoolne tabel). Jta meelde: Sagedustabel loendab tunnuse vrtuste esinemissagedused. Tunnuse vrtuste jaotumisest levaatlikuma pildi saamiseks lisatakse tabelisse ka protsendid. Kui tunnuse vrtustel on sisuline jrjestus, siis tabeli ridu sageduste jrgi ei jrjestata. Excelis kasutatakse sagedustabeli loomiseks vahendit Pivot Table (liigendtabel).

lesanded 40. Koosta andmestiku pilased.xls phjal sagedustabel (tabel 1) pilaste Facebooki portaali klastuste sageduste esitamiseks. 41. Pstita andmestiku pilased.xls kohta kaks esmast andmeanalsi ksimust. Koosta pstitatud ksimuste kohta sagedustabelid ning kirjuta loodud tabelitele jreldused. 42. Anna levaade andmestiku pilased.xls tunnuse Kuidas oled ppinud arvutit kasutama? vrtustest. Kujunda tabel ning otsusta, kas selle tunnuse vrtuseid oleks korrektne suuruse jrjekorda paigutada vi mitte.

39

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

3.3. Analsi tulemuste esitlemisest NIDE 10 Maril on analsi tulemusena koostatud sagedustabel, kuid ta on kuulnud, et analsi tulemusi peaks alati esitama diagrammina. Mari khkleb, sest ta on ka tabelina esitatud tulemusi ninud ega oska seetttu otsustada, mil moel oma analsi tulemust teistele esitlema peaks. Statistilisi andmeid ja statistilise andmeanalsi arvulisi tulemusi saab esitada: teksti sees toodud arvudena tabelina arvjoonise e diagrammina Tulemuste esitlusviisi valik sltub mitmest tegurist: nt, kas tulemusi esitatakse paberil vi suulises ettekandes, kes on sihtrhm ja mis on nende eeldatavad teadmised uurimuse teemavaldkonnas ning statistiliste meetodite alal jms, kuid esmathtis on, et esitlusviis toetaks parimal viisil tulemuste sisust kiiret ja iget arusaamist ning oleks kompaktne. ldjuhul vali esitluseks: diagramm, kui soovid eelkige anda kiiret levaadet ldtendentsi(de)st ja suundumus(t)est tabel, kui on vajalik anda edasi tpset arvulist infot vi kui vrreldavate arvnitajate suurusjrgud on vga erinevad tekst, kui korraga on vaja esitada vaid ks-kaks arvulist nitajat Nites 10 esitas Mari oma ksitluse tulemused Google Formi abil nii:

Joonis 3. Google Form poolt automaatselt genereeritud aruanne ksitlustulemuste kohta

40

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Nagu Mari tulemustest selgub, klastavad kik 20 ksitlusele vastanut eKooli igapevaselt, seega ei ole antud juhul otstarbekas tulemusi esitada tabeli ega ka diagrammina, sest lihtne lause aitab kogu tulemuse kenasti ja arusaadavalt edasi anda. NIDE 11 Moonika viis oma klassis lbi lhiuuringu sellest, kui paljud tema klassikaaslased on kokku puutunud heategevusega. Kokku osales uuringus 26 pilast. Tulemuste esitamisel kaalus Moonika kahe variandi vahel, kas esitada tulemused: A. sagedustena: Kokku vastas 26 pilast, kellest 8 on heategevusega kokku puutunud vi B. protsentuaalselt: Kokku vastas 26 pilast, kellest 31% on heategevusega kokku puutunud Vikeste valimite korral on mistlik tulemused esitada sagedustena. Protsentide kasutamine vib lugejatele edastada kallutatud pildi andmetest e tekitada ettekujutuse, nagu oleks uuritud isikute hulgas tegelikust rohkem vastajaid. Niteks esitades uuringu tulemusi sellisel kujul: uuringus osales 17 inimest, kellest 23,5% olid teinud rahalisi annetusi eelmise aasta jooksul, on 23,5% taga tegelikult vaid 4 inimest. Seega, korrektsem viis tulemuste esitamiseks oleks jrgmine: uuringus osales 17 inimest, kellest 4 olid eelmise aasta jooksul teinud rahalisi annetusi. Soovi korral vib levaatlikkuse tstmiseks sagedusele sulgudes lisada osakaalu: uuringus osales 17 inimest, kellest 4 (23%) olid eelmise aasta jooksul teinud rahalisi annetusi. Suurte valimite korral (kui vastajaid on rohkem kui 100), vib tulemuste esitamisel kasutada ka ainult protsente. Niteks: Uuringus osales 350 pilast, kellest 12% olid annetanud oma mnguasjad heategevuslikuks otstarbeks. Jta meelde: he vi kahe arvulise nitaja esitamiseks kasuta teksti, mitte tabelit ega diagrammi. Kui vastajaid on alla saja, kasuta tulemuste esitamisel sagedusi. Kui vastajaid on le saja, kasuta protsente. Ksitluste lbiviimise tarkvara koostatud analsi suhtu ettevaatlikkusega ning mtle lbi, kas automaatselt genereeritud tulem on alati parim viis andmeid esitada.

lesanded
41

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

43. Arutle, millal viks oma tulemusi esitleda tabelina ning millal diagrammina ning kas on veel mni esitlemise vimalus. 44. 2008. a TNS Emori lbiviidud heategevusliku kitumise uuringu tulemuste esitamiseks on all toodud kaks vimalust (A sektordiagramm ja B tekst). Kaalu mlema variandi tugevusi ja nrkuseid ning otsusta, milline nendest on parem viis andmete esitamiseks suulises ettekandes ja uurimist kirjalikus raportis.

45. Ksi oma klassi pilastelt, kui sageli nemad Facebooki portaali klastavad. Soovi korral kasuta nites 8 toodud skaalat. Koosta vastustest sagedustabel. Kirjuta tekst, mis sobib saadud sagedustabeli lahtiseletuseks. 46. Millise variandi valiksid sina Monika olukorras (nide 11) ja miks? 47. Too niteid tunnustest, mille tulemuste esitamiseks on sobivaim viis kasutada ainult teksti. 48.Too niteid tunnustest, mille puhul tulemuste esitamiseks tuleks tekstile lisaks esitada ka tabel vi diagramm.

42

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

3.4. Tulpdiagramm NIDE 12 TNS Emori andmetel vaatasid Eesti elanikud novembris 2011 televiisorit keskmiselt 4 tundi pevas. Meie kasutuses olevas andmestikus pilased.xlsx on olemas tunnus Aeg teleri vi video vaatamiseks pevas, mille vrtused on esitatud allpool tabelis 5.

! Tabel 5. Sagedustabel tunnuse Teleri vaatamise aeg pevas kohta Vastuste jagunemise kirjeldamiseks saame koostada sagedustabeli, kuid kuna tunnusel on vimalikke vrtusi rohkem kui paar tkki (kokku 5), siis vime tulemuste esitamiseks kaaluda ka diagrammi koostamist. Joonisel 4 on tulpdiagramm, mis on koostatud tabeli 5 tulemuste visualiseerimiseks ja milles iga tulba krgus on proportsionaalne vastavasse kategooriasse kuuluvate pilaste arvuga.

Joonis 4. Tulpdiagramm

43

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

NIDE 13 Martin koostas eesti keele tunniks uuringu kaaspilaste lugemisharjumustest ning ksis muuhulgas ka seda, mis anrist oli tema kooli 10. klasside pilaste viimati loetud raamat. Tulemused koondas Martin alljrgnevasse tabelisse 6.
M i s a n r i s t r a a m a t u t v i i m a t i pilaste arv lugesid? Kriminaalromaanid, pnevus Teatmeteosed Ajaloolised ja eluloolised romaanid Matka- ja reisiraamatud KOKKU 26 26 24 27 103

Tabel 6. Nites 12 koostatud sagedustabel loetud raamatute anrilise jaotuse kohta Kui tulpasid kirjedavad tekstid on pikad, siis paigutub tekst tavaliselt automaatselt nii, et seda on ebamugav lugeda, nt kaldu, ksteise alla (joonis 5). Et parem lugeda oleks, tuleks tulpdiagrammi teljed ra vahetada.

Joonis 5. Vaikimisi kujundusega, raskesti loetav tulpdiagramm Tulpade jrjestamiseks kahanevasse jrjekorda jrjestame read sagedustabelis vastavalt sageduste kahanemise jrjekorda. ldjuhul peaks ige visuaalse levaate saamiseks skaala teljel algama 0-st. Skaala jaotushikud moodustatakse automaatselt meie sisestatud vikseima ja suurima teljel kuvatava vrtuse jrgi. Soovi korral saab neid ka muuta. Lisades veel diagrammile pealkirja, x-telje kirjelduse ning kustutades legend, saame jrgneva diagrammi, millel on toodud 10. klasside pilaste viimase kuu lugemuse levaade.

44

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

! Joonis 6. Korrektselt vormindatud tulpdiagramm

lesanded 49. Koosta andmestikku pilased.xlsx kasutades tunnuse Aeg teleri vi video vaatamiseks pevas phjal sagedustabel ja tulpdiagramm. 50. Arutle, kas antud tulemustest saab kiirema ja parema levaate sagedustabelist vi tulpdiagrammilt ning phjenda, millise valiku teeksid sina antud tulemuste esitlemiseks. 51. Koosta andmestiku pilased.xlsx tunnuse Keskmine hinne vrtuste jagunemise kirjeldamiseks tulpdiagramm. Vrtuste loendamisel selgub, et thjasid lahtreid, st puuduvaid vastuseid on 26. Kas need oleks mttekas diagrammilt vlja jtta vi sinna kaasata? Kujunda diagramm esitluseks sobivale kujule. 52. Sisesta Martini kogutud andmed (tabel 6) andmettlusprogrammi tlehele ja koosta nende phjal tulpdiagramm. Vaata kriitilise pilguga programmis MS Excel vaikimisi loodavat diagrammi (joonis 5) ja krvalda puudused diagrammi kujunduses. 53. Koosta tulpdiagramm andmestiku pilased.xlsx tunnuse Aeg ppimiseks kirjeldamiseks. 54. Koosta tulpdiagramm tunnuse Arvuti samastub kige enam kirjeldamiseks. Kujunda saadud tulem ning kirjuta sellele uurimuse tekstis toodav lahtiseletus.

45

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

3.5. Sektordiagramm NIDE 14 Anna luges looduspetuse pikust lauset Kige suurem maailmajagu maailmas on Aasia, mis moodustab kogu maismaa pinnast 30% ja tal tekkis tahmine saada kompaktset levaadet, kui suure osa maismaast hlmavad teised maailmajaod. Terviku jaotumist osadeks kirjeldatakse tihti sektordiagrammi abil, milles kik kategooriad kokku moodustavad 100% ning mis toob selgelt vlja iga kategooria osa tervikust. Eeltoodud nites 14 annab Anna soovitud levaate jrgmine sektordiagramm (joonis 7).

Joonis 7. Sektordiagramm nite 14 kohta Sektordiagrammi koostamisel tasub meelde jtta jrgmised nuanded: ra kasuta kujundusviisi, kus kik sektorid on ksteisest lahti ligatud, sest see vhendab diagrammi levaatlikkust! Sektori vljatstmist kasutatakse siis, kui ks sektoritest on tulemuste kontekstis teistest olulisem vi kesksem ning seda soovitakse seeprast rhutada ning esile tsta. ldjuhul ei tsteta siis vlja kige suuremat sektorit. Soovituslikult viks hel sektordiagrammil olla 39 sektorit. Liiga paljude sektorite esitamine hel diagrammil vhendab levaatlikkust. Vajadusel henda viksemad sektorid hiseks sektoriks Muu, mis paigutatakse diagrammil viimaseks. Kolmemtmelisus loob olukorra, kus eespool asetsevad sektorid tunduvad visuaalselt suuremad kui tagumised, mistttu on mistlik seda kujundusviisi vltida. ldjuhul ei esitata hel graakul korraga sagedusi ja protsente, sest liigne numbrite rohkus vib segada andmetest kiire ja levaatliku ettekujutuse saamist. Sektorite vrvi muutmiseks vali sektorid he kaupa (vali sektorid ning seejrel klpsa konkreetse sektori peal) ja muuda nende vrvi.

46

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

lesanded 55. Arutle, kas sama infot maismaa jaotumisest maailmajagude kaupa viks esitada ka tulpdiagrammi abil ning mille poolest erineb saadav visuaalne levaade sektor- ja tulpdiagrammi puhul. 56. Kasutades andmestikku pilased.xlsx koosta sektordiagramm illustreerimaks pilaste arvamusi vite Arvutimngud phjustavad sltuvust kohta. Milline on sinu arvamus selles ksimuses? 57. Arutle, kas alljrgnevad sektordiagrammid esitlevad vastavaid andmeid parimal vimalikul viisil.

47

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

3.6. Histogramm NIDE 15 Liina de Mari on otsustanud paar kilo alla vtta, sest kik tema sbrad langetavat kaalu. Liinal tekkis seepeale huvi teada saada, kuivrd populaarne on kaalu langetamine koolipilaste seas. Ta otsustas koolis lbi viia vikese uuringu, milles ta ksis pilaste kaalu, pikkust, rahuolu oma kehakaaluga ning seda, kas pilased toituvad tervislikult ning mitu korda ndalas nad treeninguga tegelevad. Lisaks eelnevas lesandes vlja toodud jrjestus- ja nimiskaalat kasutavatele tunnustele sisaldas Liina ksimustik ka arvskaalal mdetavaid tunnuseid: pikkus, kaal ja treeninguga tegelemise sagedus ndalas. Lisaks arvutas Liina vlja iga pilase kehamassiindeksi (KMI) ja tahtis selle phjal saada levaadet, kui suur osa pilastest on lekaalulised, kui suur osa normaalkaalus ning kui suur osa on alakaalus. Ta kasutas saadud andmete analsimiseks tuttavat tulpdiagrammi ja sai alljrgneva tulemuse (joonis 8).

! Joonis 8. Tulpdiagramm pilaste KMI vrtustest Tundub, et joonisel 8 toodud tulpdiagramm ei aita pstitatud ksimusele kiiresti ja selgesti vastust saada. Phjuseks on see, et kuna tunnuse KMI vrtused on komakohtadega arvud, siis on sisuliselt iga pilase KMI pisut erinev kigi teiste pilaste KMI-st. Kui sellise paljude erinevate vrtustega arvtunnuse kohta koostada tavaline tulpdiagramm, siis tulemus on tiesti ebalevaatlik, sest tulpadena kannab arvutiprogramm diagrammile tunnuse kik erinevad vrtused hekaupa. laltoodud diagrammilt on nha, et suurem osa KMI-test esineb ks kord (enamik tulpasid on krgusega 1) ning on vaid mni vrtus, mis korduvad kaks vi kolm korda. Seega, tulpdiagramm ei anna levaatlikku pilti sedalaadi andmete jaotusest ning antud olukorras ei ole seda asjakohane kasutada. Jrelikult tuleb leida mni teine andmete analsimise meetod, mis paremini sobiks. Joonisel 9 on samad tulemused esitatud histogrammi kujul, mis aitab pstitatud ksimusele kiiremini ja paremini selge vastuse anda kui joonisel 8 olev tulpdiagramm.
48

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

! Joonis 9. Histogramm pilaste KMI vrtustest Vaatame lhemalt, mille poolest histogramm erineb tulpdiagrammist. Histogrammis on koondatud KMI vrtused vahemikesse (16 - 18.9, 19 - 21.9 jne) ning iga tulp nitab konkreetsesse vahemikku kuuluvate vastajate arvu. Kuna selle histogrammi vahemikud on valitud nii, et nende otspunktid lhevad kokku arstide mratud ala- ja lekaalulisuse piiridega (19 ja 25 punkti), siis nitab histogramm, et alakaalulisi e neid, kelle KMI on alla 19 punkti, on ksitlusele vastanud pilaste seas rohkem (11 pilast) kui lekaalulisi (8 pilast). Histogramm on tulpdiagrammi spetsiiline alamliik, kus telgede thendused on alati heselt mratud. Histogramm sobib ainult arvtunnuste kirjeldamiseks, kuna sellel teljel, millele tulbad toetuvad, on alati arv-vrtustest moodustatud vahemikud. Kuna seal, kus lppeb eelmine vahemik, algab kohe jrgmine, siis on histogrammil sisuliselt sobilik asetada tulbad vahetult ksteise krvale. Tulpade krgus histogrammil kirjeldab alati vahemiku sagedust e seda, mitu tulemust (vi kui suur osa tulemustest) sellesse vahemikku ji. Histogrammi koostamisel tuleks meeles pidada jrgmisi soovitusi: Selleks, et arvtunnuste analsimiseks sobivaid meetodeid valida, tuleb teha vahet, kas tegu on vheste erinevate vrtustega arvtunnusega vi paljude erinevate vrtustega arvtunnusega. Kui arvtunnusel on vhe erinevaid vrtusi, siis saab kasutada nii tavalist sagedustabelit kui ka tulpdiagrammi, sest ksikute arvvrtuste phjal tekkivaid gruppe on vhe ja nad mahuvad kenasti tabelisse vi tulpadeks ja sektoriteks vastavale diagrammile. Nited tunnustest, mille on vhe erinevaid vrtuseid: - Klaasikaaslaste vanus: arvtunnus, millel on vhe erinevaid vrtuseid. Sinu klassikaaslaste vanused ei erine omavahel ilmselt palju rohkem kui 23 aasta vrra. - dede-vendade arv: arvtunnus, millel ka ei ole vga palju vimalikke erinevaid vrtusi, sest enamasti on Eesti peredes 13 last ja seega desid-vendasid hel lapsel 02. Kui aga arvtunnusel on palju erinevaid vrtusi, siis tuleb enne sagedustabeli vi diagrammi tegemist arvvrtused grupeerida e neist vahemikud moodustada nii, et tekkinud vahemikke oleks tabelis vi diagrammil eraldi rea, tulba vi sektorina
49

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

kirjeldamiseks paras hulk. Edaspidi pime ka teisi arvtunnuste analsimiseks sobivaid meetodeid! Nited tunnustest, millel on palju erinevaid vrtuseid: - petajate vanus: arvtunnus, millel on palju erinevaid vrtuseid. Tenoliselt on teie koolis petajaid vga erinevates vanustes nii noori, keskealisi kui ka vanemaid petajaid. - pilase pikkus: arvtunnus, mille vrtused saadakse mtmise teel. Jllegi on tenoline, et sinu klassikaaslased on kik erineva pikkusega.

lesanded 58.Nimeta, millised nites 15 toodud tunnustest on veel arvtunnused, millel on palju erinevaid vrtuseid. 59.Mille poolest erinevad tulpdiagramm ja histogramm? Too vlja nii sisulised kui ka visuaalsed erinevused. 60.Arutle ja phjenda, kas tunnuse dede-vendade arv vrtuste jaotusest levaate saamiseks sobib paremini tulpdiagramm vi histogramm. 61.Koosta andmestiku treening.xlsx tunnuse kaal kohta histogramm ning kujunda saadud tulem. 62.Leia andmestikust pilased.xlsx tunnus, mille vrtuseid oleks sobilik esitada histogrammi abil. Koosta histogramm, kujunda saadud tulem ning kirjuta sellele uurimuse tekstis toodav lahtiseletus. 63.Milliste juba pitud meetoditega saab levaate jrgmiste ksimuste vastustest? a) Kuivrd oled rahul oma praeguse kehakaaluga? (vga rahul, pigem rahul, pigem ei ole rahul, ldse ei ole rahul) b) Kas toitud tervislikult? (jah, ei) 64.Koosta andmestiku pilased.xlsx tunnuse vanus kohta sagedustabel, histogramm ja tulpdiagramm. Arutle, millise nendest valiksid tulemuste esitamiseks ning miks. 65.Mtle, mis tpi on tunnused kaal ja treeningu sagedus. Lisa omalt poolt kaks nidet eri tpi arvtunnuste kohta.

50

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

3.7*. Valimi phjal saadud tulemuste ldistamine ldkogumile NIDE 16 Eelpool toodud nites 9 (ptk 3.1) ja tabelis 4 judsime tulemuseni, et 54,2% ksitlusele vastanutest klastab Facebooki portaali mitu korda pevas. Aga kui me ei sooviks teha jreldusi ainult vastanute, vaid ka kogu ldkogumi (Eesti kigi 10.klasside pilaste) kohta?

Tabel 7. Facebooki klastamise sagedus pilaste seas Seega tahaksime nd ksnes 640 ksitletud pilase vastuste phjal teada: Kui suur osa kigist Eesti 10.klassi pilastest (e uuringu ldkogumist) klastab Facebooki lehte mitu korda pevas? Jrgmisel lehekljel leiad abivahendi, mis aitab samm-sammult mista phjendusi ja loogikat, mille kaudu on vimalik anda valimi baasil kogutud andmete phjal hinnang tervel ldkogumile.

51

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Joonis 10. Statistilise jreldamise e. ldistamise selgitus

52

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Valimilt ldkogumile jrelduste tegemise e ldistamise kigus tekkida viva juhusliku vea arvutamisel tuleb lhtuda vastavatest valemitest, mis on vlja ttatud kigi philiste arvnitajate jaoks (sh alamgrupi osakaal, aritmeetiline keskmine jne). Arvutusvalemiga mratud juhuslikku viga nimetatakse standardveaks ja selle phjal saab ldkogumi vastava arvnitaja vrtusele e parameetrile hinnangu anda vastavalt alltoodud reeglitele: 68% tenosusega asub ldkogumi parameeter vahemikus: valimi arvnitaja vrtus 1 standardviga 95% tenosusega asub ldkogumi parameeter vahemikus: valimi arvnitaja vrtus 2 standardviga 99% tenosusega asub ldkogumi parameeter vahemikus: valimi arvnitaja vrtus 2,5 standardviga

Kel on ldistava statistika vastu sgavam huvi, leiab phjalikumad selgitused, valemid ja matemaatilise tausta jrgmistes allikates: K. Niglas Andmeanalsi loengumaterjalid (lk 3237) K. Hiob Matemaatiline statistika algkursus koolidele (lk 4450)

53

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

3.8*. Vahemikhinnang valitud grupi osakaalu kirjeldamiseks ldkogumis Hindame nites 9 (ptk 3.1) ja tabelis 7 toodud andmete phjal, mitu protsenti ldkogumi liikmetest klastab Facebooki lehte mitu korda pevas.
Mida me teame? Facebooki klastab mitu korda pevas 347 e 54,22% uuringus osalenud pilastest. p=54,22% (vastava vrtuse osakaal valimis) N=640 (valimi suurus) Mida me tahame teada? Kui suur osa ldkogumi liikmetest klastab Facebooki lehte mitu korda pevas?

ldkogumi osakaalu leidmiseks rakendame reeglit: 95% tenosusega asub ldkogumi parameeter vahemikus valimi arvnitaja vrtus 2 st. viga

St. viga%= Asendades valemis thistused konkreetsete vrtustega, saame, et st. viga%=

95% tenosusega jb ldkogumi osakaal vahemikku 54,22% 21,97% e 54,22% 3,94%. Arvutuste phjal saame jreldada, et nende pilaste osakaal kigi Eesti pilaste seas (e ldkogumis), kes klastavad Facebooki lehte mitu korda pevas, jb 95% tenosusega vahemikku 50,3...58,2%.

lesanded 66. Leia nites 9 ja tabelis 7 toodud andmete phjal, kui suur osa Eesti pilastest ei klasta Facebooki lehte ldse. Snasta jreldus ja selgita tulemust oma snadega. 67. Kikidest Eesti koolide abiturientidest moodustatud juhuvalimi uurimisel saadi teada, et likooli soovib edasi ppima minna 46%. Millise hinnangu saab selle phjal anda ldkogumi vastavale osakaalule, kui uuritud valimi suurus oli 1500 pilast? 68. 2006. a lbiviidud uuringus Lapsed ja internet selgus, et uuritud 614aastastest lastest on interneti jututoas vi suhtlusprogrammis kontakti loonud vrastega kohtumas kinud 6% vastanutest. Hinnake, kui suur osa Eesti 614aastastest lastest oli 2006. aasta seisuga vrastega kohtumas kinud, kui on teada, et valimisse kuulus 145 pilast ja 2006. a seisuga oli Eestis 122 985 last vanuses 614 aastat.
54

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

3.9. Keskmised Eelmises peatkis vaatlesime vimalusi, kuidas analsi lbi viia, et leida vastuseid ksimustele Kui palju? ja Kui suur osa?. Andmete analsimise kigus tekib aga varem vi hiljem veel terve hulk teisi lihtsamaid ja keerulisemaid ksimusi. Keerulisemad ksimused puudutavad korraga mitut tunnust, kuid jtkame praegu veel lihtsamate, vaid hte tunnust puudutavate ksimustega, nagu niteks: Mis on kige madalam ja kige krgem saadud tulemus? Mis on mtmiste keskmine tase? Kui sarnased vi erinevad on saadud tulemused? Kigile nendele ksimustele vastuse saamiseks on vlja ttatud matemaatilised algoritmid vi valemid, mis olemasolevaid andmeid hel vi teisel viisil kokku vttes annavad tulemuseks andmete teatud aspekti kirjeldava arvulise tulemuse. Viimaseid nimetatakse andmeanalsi kontekstis arvnitajateks (vahel ka statistikuteks). Suurem osa arvnitajatest on meldud kasutamiseks arvutunnuste korral, kuid leidub ka selliseid, mida saab kasutada jrjestustunnuste vi koguni nimitunnuste puhul. Enim kasutatavad arvnitajad kirjeldavad kas tunnuse keskmisi vrtusi (aritmeetiline keskmine e keskvrtus, mediaan, mood) vi tunnuse vrtuste hajuvust keskmisega vrreldes. NIDE 17 Mia otsustas 11. klassis sooritada keemia riigieksami ning kogus eelnevalt selle eksami kohta informatsiooni 50-lt oma kooli abituriendilt, kes olid keemia riigieksami sooritanud. Mia lootis, et eelmisel aastal koolikaaslaste saadud eksamitulemuste analsimine annab talle parema pildi tema enda vimalustest. Kuna Mia arvas, et tal on keemias teistega vrreldes sna keskmine tase, tahtis ta kohe teada, mis oli eelmisel aastal eksami sooritanute keskmine tulemus, aga pnev oli teada saada ka seda, kas keegi kukkus eksamil lbi vi mis oli ldse kige madalam ja kige krgem saadud tulemus. Mia oli koolikaaslastega vestlemise kigus kik 50 eksamitulemust jrjest paberile kirjutanud, kuid niimoodi lbisegi olevast 50 tulemusest oli vga raske midagi vlja lugeda. Matemaatikapetaja soovitas, et tulemuste jagunemisest parema levaate saamiseks viks tulemused jrjestada kasvamise vi kahanemise jrjekorda, saades niimoodi variatsioonrea. Mia pusis tkk aega, kuid sai tulemused nnelikult kasvamise jrjekorda: 50 pilase eksamitulemused (variatsioonrida)
62 73 78 81 86 64 74 78 81 87 65 74 79 81 87 66 75 79 82 88 68 75 79 82 89 70 76 80 82 90 55 71 77 80 83 90 71 77 80 83 92 72 77 80 85 94 72 78 81 85 96

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Prast tuli Mial phe, et seda jrjestamist saanuks veelgi mugavamalt teha, kui kik 50 tulemust andmettlusprogrammi tlehel hte veergu e tunnusesse sisestada ja siis andmete sorteerimise funktsiooni kasutada! Prast sorteerimist on lihtne nha, mis oli kige madalam ja kige krgem tulemus (ehk statistika terminoloogias kasutades leida minimaalne ja maksimaalne vrtus): need olid vastavalt 62 ja 96 punkti. Sellisest kasvavas jrjekorras antud vaatlustulemuste reast on kerge leida ka jaotuse keskel paiknevat vrtust ehk mediaani. Mediaan on selline vrtus, mis jagab vaatlustulemused kahte ossa nii, et pooled vaatlustulemused on mediaanist viksemad ja pooled suuremad. NIDE 18 Meil on teada seitsme petaja kohta nende keskmine kontrolltde parandamise aeg ndalas (tundides) ning ajad on jrjestatud kasvamise jrjekorda: 0
2
3
4
6
6
10

Me saame elda, et mediaan on 4 (tundi ndalas), sest vrtus 4 asub tulemuste rea keskel. Kui meil on aga paaris arv vaatlustulemusi, siis ei saa me nende hulgast leida hte, millest oleks vrdne arv viksemaid ja suuremaid vrtusi. Seeprast leitakse sel juhul vrtus, mis asub tpselt kahe vrtuse vahel, mis asuvad variatsioonireas keskel. Nites 17 pilaste keemiaeksami tulemuste kohta on variatsioonrea 25. vrtus 79 ning 26. on 80. Et leida tpselt nende vahel paiknevat vrtust, tuleb need vrtused kokku liita (79 + 80) ning jagada kahega. Seega on mediaaniks natud nites 79,5 palli. Viimasest arvnitajast saame teha nd omakorda sisulise tlgenduse ja elda, et poolte pilaste eksamitulemus ji alla 79,5 punkti ja pooltel pilastel oli see le 79,5 punkti. Mediaan on ks statistikas kasutatavaid keskmist tendentsi vljendavaid suurusi. Kuid mrksa sagedamini kasutatakse aritmeetilist keskmist, mida tavaliselt kutsutakse lihtsalt keskmiseks vi siis keskvrtuseks ja mille arvutusalgoritmiga oled tuttav matemaatika kursustest. Tuletame selle algoritmi meelde: aritmeetilise keskmise leidmiseks tuleb kik vaatlustulemused liita ning saadud summa jagada vaatlustulemuste arvuga. Leiame nd nites 18 toodud petajate kontrolltde parandamise aja aritmeetilise keskmise:

x=

0 + 2 + 3 + 4 + 6 + 6 + 10 31 = 4,4 7 7

tundi ndalas.

56

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Kui meil on aga teada, et algandmetena kasutatud arvud ei olnud tpsed, vaid mardatud vi hinnangulised (st petajad ei pruugi kontrolltid parandada tpselt 2 vi 6 tundi, vaid ligikaudu nii palju) siis peame ka arvnitaja phjal jreldust tehes jma algandmete tpsuse tasemele ja tlema, et keskmiselt parandavad petajad kontrolltid 4 kuni 5 tundi ndalas. Eksamitulemuste mediaaniks saime eelnevalt 79,5 ning keskmiseks eksamitulemuseks 79,1 punkti. Vrreldes kahte erinevat keskmist tendentsi vljendavat suurust: mediaani ja aritmeetilist keskmist, neme, et nad on keemiaeksami tulemuste puhul natuke erinevad, kuid siiski kllalt sarnased. Vaatame aga hte teist olukorda, milles on toodud kahe grupi inimeste kuupalgad: I
II
800

700

1000

1100

1400

1300

1700

1600

1900 3900

Mediaanid kahes grupis on kllalt sarnased: I > 1400 , II > 1300 . Arvutades aga vlja keskvrtused saame, et keskvrtus esimeses grupis on 1360 , mis on mediaaniga kllalt sarnane, kuid teises grupis on keskvrtus 1720 , millest on kik peale he vrtuse madalamad. Esimese grupi puhul saame me nii mediaani kui ka keskvrtuse abil ige ettekujutuse grupi liikmete keskmisest palgast. Kuid kumb keskmistest annab parema ettekujutuse tavaprasest palga suurusjrgust teises grupis? Teises grupis tuleks keskmist tendentsi vljendava suurusena (keskvrtusele lisaks) kasutada mediaani, sest keskvrtus on tugevalt mjutatud hest ebatpilisest, teistest vga erinevast vrtusest, mediaani aga sellised ekstreemsed vrtused ei mjuta. Kordame le olulisemad asjad: Kui jrjestame tulemused kasvamise vi kahanemise jrjekorda, saame variatsioonirea. Mediaan on vrtus, mis jagab vaatlustulemused kahte ossa nii, et pooled on mediaanist viksemad ja pooled suuremad. Aritmeetilise keskmise (keskmise v keskvrtuse) leidmiseks tuleb kik vaatlustulemused kokku liita ning saadud summa jagada vaatlustulemuste arvuga. Aritmeetilist keskmist on korrektne arvutada ainult intervalltunnuste (sh arvtunnuste) puhul. Kige enamkasutatav keskmist tendentsi vljendav suurus on keskvrtus. Kui keskvrtus ja mediaan on vga erinevad, tuleks keskmist tendentsi vljendava suurusena (keskvrtusele lisaks) kasutada mediaani, sest keskvrtus vib olla mjutatud hest/mitmest ebatpilisest, teistest vga erinevatest vrtustest, mediaani aga sellised ekstreemsed vrtused ei mjuta.

57

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

lesanded 69.Kasuta Mia kogutud andmeid (keemia.xlsx) ning arvuta eksamitulemuste mediaan. 70.Kasuta taas Mia kogutud andmeid (keemia.xlsx) ning arvutame eksamitulemuste keskvrtuse. 71.Tiina grupikaaslaste testitulemused olid jrgmised: 45 12 21 93 36 31 28. 72.Leia testitulemuste mediaan ning selgita selle thendust. Leia ka keskvrtus. 73.Andrese grupikaaslaste eksamihinded olid jrgmised: 1 2 2 3 3 5. Kumb vide on ige? a) eksamihinnete mediaan on 2,5 b) eksamihinnete mediaanid on 2 ja 3 74. Millised vited on korrektsed? a) Mediaan on alati reaalne vrtus uuritud valimi vrtuste hulgast b) Mediaan vib olla ka selline vrtus, mida reaalsete vastuste hulgas ei esine c) Keskvrtus on alati reaalne vrtus uuritud valimi vrtuste hulgast d) Keskvrtus vib olla ka selline vrtus, mida reaalsete vastuste hulgas ei esine 75.Too niteid andmetest, mille keskmise taseme kirjeldamiseks peaks lisaks keskvrtusele kasutama ka mediaani. 76.Tida jrgmine tabel, kirjutades igasse lahtrisse, kas seda arvnitajat on antud tunnuse korral korrektne arvutada ja vimalik sisuliselt tlgendada vi mitte.
Tunnus Sugu Vanus Sissetulek (0199 , 200399 , 400599 , 600799 , 800 ja rohkem) Kui thtis on riiete ostmisel kaubamrk? (vga oluline, oluline, vhe oluline, ldse ei ole oluline) Lemmik kaubamrk Mediaan Keskvrtus

77. Kasuta andmestiku treening.xlsx andmeid ning leidke pilaste pikkuse ja kaalu keskvrtus ja mediaan. Otsusta, milliseid arvnitajaid te antud tunnuste korral keskmise taseme kirjeldamiseks kasutaksite. Phjenda oma vastust.

58

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

3.10. Vrtuste hajuvust kirjeldavad arvnitajad Kuigi keskmised on kige tuntumad ja enamkasutatavad arvnitajad, ei anna ainult keskmise teadmine meile andmete kohta tit pilti. Seetttu tuleb osata ksida ja analsida ka seda, kuivrd erinevad vi sarnased on tulemused/vrtused. NIDE 19 Esimese klassi lapsevanematel paluti seitsme palli ssteemis hinnata, kuivrd thtsaks nad peavad seda, et kool arendaks lastes jrgmisi vrtusi: kohuse- ja vastutustunne (viie lapsevanema vastused: 3 5 )
4 4 4

aktiivsus, ettevtlikkus (viie lapsevanema vastused: 1 2 3 7 7 ) Nites 19 saadi mlemal juhul keskmiseks thtsuse hinnanguks 4 palli, kuid ometi neme selgelt, et lapsevanemate arvamused nende kahe aspekti arendamise thtsuse osas ei ole tpselt hesugused: kohuse- ja vastutustunde arendamise osas on lapsevanemad olnud sna ksmeelselt arvamusel, et see on keskmise thtsusega, kuid aktiivsuse ja ettevtlikkuse arendamist on osa lapsevanematest pidanud vga thtsaks, teised jlle ldse mitte thtsaks, st vastajate arvamused on olnud vga erinevad. Sellist vrtuste omavahelise erinevuse mra nimetatakse statistikas hajuvuseks. Hajuvus ongi keskmise krval teine oluline andmete jaotust iseloomustav suurus. Kui vrrelda kahte jrgnevat punktdiagrammi, kus on kujutatud kahe pilasterhma testitulemusi (grupp A ja grupp B), siis nende vahel on mrgata selget erinevust. Grupp A: 50 pilase testitulemused

Grupp B: 50 pilase testitulemused

Joonis 11. Kahe rhma testitulemused. Diagrammidele peale vaadates vime kohe nha, et esimene jaotus on rohkem vlja venitatud st testitulemused grupis A on rohkem hajunud kui grupis B. Jaotuse
59

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

hajuvust saame kige lihtsamini vljendada arvutades jaotuse ulatuse (suurima ja vhima vrtuse vahe). Meie nites: grupis A on ulatus = 96 62 = 34 punkti grupis B on ulatus = 88 70 = 18 punkti Seega saaksime ulatuse phjal ka siis, kui meil andmetest diagrammi tehtud ei ole, teha jrelduse, et grupis B on tulemuste omavahelised erinevused e hajuvus palju viksem kui grupis A. Ulatus on kige ldisem ja lihtsamini leitav hajuvuse nitaja, kuid tema suur puudus on selles, et ta sltub ainult jaotuse kahest kige rmisest vrtusest, mis vivad aga mingil phjusel olla teistest vga erinevad nn ekstreemsed vrtused (tuletage meelde nidet palkadest!). Seeprast on selle nitaja usaldatavus grupi kui terviku iseloomustamisel vike ning teda kasutatakse vaid jaotusest kige ldisema pildi saamiseks. Kige sagedamini kasutatav hajuvuse nitaja on aga standardhlve. Nagu aritmeetiline keskmine, nii vtab ka standardhlve arvesse kik vaatlustulemused. Kui meie vaatlustulemused on kik hesugused (nt kik lapsevanemad hindasid mtlemisoskuse arendamist koolis vga thtsaks, st valisid seitsme palli skaalal vastuseks 7), siis andmetes hajuvust ei ole ning mistahes hajuvuse nitaja peaks andma vastuseks 0. Tavaliselt on aga vaatlustulemused hajuvad ning ksikud tulemused erinevad (hlbivad) keskvrtusest enamal vi vhemal mral. Standardhlve ongi selline arvkarakteristik, mis vimaldab meil elda, kui palju ksikud tulemused grupi aritmeetilisest keskmisest (keskmiselt) erinevad. Mida suurem on hajuvus, seda suuremad on erinevused ning seda suurem on ka standardhlve. Vaatame eespool toodud nidet 19 lapsevanemate hinnangutest. Kumma jaotuse puhul viks standardhlve suurem olla? kohuse- ja vastutustunne (viie lapsevanema vastused: 3 4 4 4 5 )
aktiivsus, ettevtlikkus (viie lapsevanema vastused: 1 2 3 7 7 )
Vrtused teises reas on rohkem hajunud (st nad erinevad ehk hlbivad keskvrtusest rohkem) kui esimeses reas. Seega vime arvata, et standardhlve on suurem teises reas olevate andmete puhul. Arutluse kontrollimiseks sisestame hinnangud andmetabelisse ning arvutame mlema jaotuse standardhlbed. Nagu nha, on esimese jaotuse standardhlve palju viksem kui teise jaotuse puhul ning jb alla he palli, sest le he palli ei erinenud selle jaotuse puhul grupi keskmisest ju kellegi arvamus! Kui meil oleks tegu suurema hulga andmetega (nt 68 lapsevanema arvamused), siis andmetele peale vaatamine (nagu selles vikeses nites) meile head levaadet vastuste hajuvusest ei annaks, kuid olles vlja arvutanud, et vastuste standardhlve aktiivsuse ja ettevtlikkuse thtsuse hinnangute puhul on s = 2,8 palli ning kohuse- ja vastutustunde thtsuse hinnangute puhul ainult s = 0,7 palli, saaksime kohe andmete kohta teha jrelduse, et aktiivsuse ja ettevtlikkuse
60

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

arendamise thtsuse osas lksid lapsevanemate arvamused omavahel lahku e anti vga erinevaid hinnanguid, aga kohuse- ja vastutustunde thtsust hindasid lapsevanemad vga sarnaselt. Pane thele, et hajuvuse nitaja phjal ei saa teha jreldust selle kohta, kumba hinnati thtsamaks; selleks on vaja teada ka keskmist! Jta meelde: Ulatus on kige lihtsamini leitav hajuvuse nitaja, kuid tema suur puudus on selles, et ta sltub ainult jaotuse kahest kige rmisest vrtusest, mis vivad aga mingil phjusel olla teistest vga erinevad. Standardhlve on kige sagedamini kasutatav hajuvuse nitaja. Mida suuremad on vrtuste omavahelised erinevused, seda suurem on ka standardhlve. Kui kik tulemused on hesugused, on standardhlbe vrtus 0. lesanded 78. Kogutud andmete phjal arvutati meeste vanuse standardhlbe vrtuseks 12 ja naiste vanuse standardhlbe vrtuseks 7. Milline vide on ige? a) Mehed on vanemad b) Naised on vanemad c) Meeste vanused on rohkem koondunud mber oma grupi keskmise vanuse d) Naiste vanused on rohkem koondunud mber oma grupi keskmise vanuse 79. Kasutades andmestikku treening.xlsx tida jrgmises tabelis thjad lahtrid.
Arvnitaja Maksimaalne vrtus Minimaalne vrtus Ulatus Keskvrtus Mediaan Standardhlve 64 Pikkus 198 154 51 Kaal

80. Vasta andmestiku treening.xlsx ning eelnevalt tidetud tabeli (lesanne 75) phjal jrgmistele ksimustele. Kokku osales uuringus ___ pilast. pilaste keskmine kaal oli 64,3 kg ning mediaan 64 kg. Kuna mediaan ja keskvrtus on vga _______________, vime jreldada, et jaotusel ei ole ___________________ vrtuseid. Pooled pilastest olid lhemad ja pooled pikemad kui ___ cm. Pikkuste jaotuse ulatus oli ____cm. See thendab, et __________________________________________________________________ . Kige lhem pilane kaalus ____ kg ja kige pikem ____ kg. Uuritud pilaste pikkuste standardhlve oli ____ cm ning kaalude standardhlve ____ kg. Kirjeldades jaotuste standardhlbeid saame elda, et ___________________________.
61

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

3.11*. ldkogumi keskvrtuse vahemikhinnang Vaatame taas nites 15 (ptk 3.6.) ksitletud Liina uuringut kaalu langetamisest koolipilaste seas. Uuritud pilaste pikkuse ja kaalu suhtest arvutati vlja KMI (kehamassiindeks) ning selle keskvrtus valimis oli 21,55. Kas ja millise hinnangu saame selle valimi tulemuse phjal anda kigi Eesti pilaste KMI kohta? Soovides saadud keskmise phjal teha statistilist ldistust ldkogumile e kikidele Eesti pilastele, peame silmas pidama, et see on korrektne ainult juhul, kui valim on esinduslik, st on koostatud juhuslikkuse phimttel, mis tagab, et igal Eesti kooli pilasel on olnud vrdne tenosus valimisse sattuda. Kui see tingimus on tidetud, kasutame ldkogumi keskvrtuse hindamiseks ptk 3.7. esitatud mttekiku ning reegleid: 68% tenosusega asub ldkogumi parameeter vahemikus: valimi arvnitaja vrtus 1 standardviga 95% tenosusega asub ldkogumi parameeter vahemikus: valimi arvnitaja vrtus 2 standardviga 99% tenosusega asub ldkogumi parameeter vahemikus: valimi arvnitaja vrtus 2,5 standardviga Keskvrtuse standardviga arvutatakse valimi standardhlbe ja valimi suuruse phjal jrgmiselt: =
Mida me teame? Kui suur on valimi KMI keskvrtus. N=114 (valimi suurus) =21,55 (valimi keskvrtus) s=2,24 (valimi standardhlve) Mida me tahame teada? Millisesse vahemikku jb ldkogumi e kigi pilaste keskmine KMI?

Lahenduse leidmiseks rakendame reeglit: 95% tenosusega asub ldkogumi parameeter vahemikus: valimi parameeter 2 standardviga. Asendades standardvea arvutamise valemis thistused konkreetsete vrtustega (vi leides standardvea tabelarvutustarkvara abil), leiame, et standardvea vrtus on 0,21. 95% tenosusega jb ldkogumi keskmine vahemikku: valimi keskmine pluss/ miinus kaks standardviga, e 21,55 +/- 0,42. Seega, 95% tenosusega jb ldkogumi keskmine vahemikku: 21,13 ... 21,97 Seega, oleme vastanud ksimusele, millisesse vahemikku jb ldkogumi keskmine KMI, ning vime elda, et see keskmine asub 95%-lise tenosusega vahemikus 21,13 ... 21,97 ehk mardatult saame elda, et Eesti pilaste KMI jb 21 ja 22 vahele.

62

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Jta meelde: ldkogumi all meldakse kiki juhtumeid vi situatsioone, mille kohta uurijad soovivad, et nende saadud jreldused, oletused vi prognoosid kehtiksid. Uurimiseks valitud (sna vikest) objektide gruppi nimetatakse valimiks. Selleks, et valim annaks ldkogumi kohta objektiivset ja usaldatavat informatsiooni, tuleb valimi liikmed valida juhuslikult: igal ldkogumi liikmel peab olema vrdne vimalus valimisse valitud saada. Selleks, et tagada valimi juhuslikkus, on mitu vimalust. Niteks juhuvalim, sstemaatiline valim, kihtvalim. Valimi phjal arvutatud arvnitajad (niteks aritmeetiline keskmine, mediaan jne) on vastavate ldkogumi parameetrite hinnangu alus, kuid arvestada tuleb ka statistilist viga. Hinnangute andmist ldkogumi parameetrite kohta nimetatakse statistiliseks jreldamiseks e ldistamiseks. Statistilise ldistamise kigus tekkida vivat juhuslikku viga ei suuda krvaldada kski valem ega statistiline meetod. Kll aga vimaldavad viimased meil seda viga hinnata mta.

lesanded 81. Arutle, mis juhtub vahemikuga, kuhu jb teatava tenosusega ldkogumi parameeter juhul, kui me suurendame valimi suurust. Kas see vahemik muutub laiemaks vi kitsamaks? 82. 10. klasside pilastest koostatud juhuvalimi keskmine matemaatika aastahinne oli 3,86. Hinnete standardhlve oli 0,4 ja valimi suurus 2500. Arvuta, millisesse vahemikku jb kikide Eesti 10. klassi pilaste keskmine matemaatika aastahinne. 83. Kasuta andmestikku treening.xlsx ning arvuta, millisesse vahemikku jb ldkogumi keskmine treeninguga tegelemise arv ndalas. 84. Kasuta andmestikku pilased.xlsx ning leia, millisesse vahemikku jb ldkogumi e kikide pilaste keskmine arvutikasutusaeg ndalas.

63

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

4. Erinevuste, trendide ja seoste uurimine


Kesolevas peatkis keskendume jrgmistele ksimustele: Kuidas vrrelda erinevate gruppide tulemusi? Kuidas sltub erinevuste uurimiseks kasutatav meetod tunnusetbist? Milliseid graalisi vimalusi on otstarbekas kasutada gruppidevaheliste erinevuste uurimisel? Kuidas lahendada olukord, kui vrreldavate gruppide suurused ei ole vrdsed? Millisel juhul saab valimi keskmiste vahel olevat erinevust ldkogumile ldistada? 4.1. Erinevuste uurimine kasutades keskvrtusi NIDE 20 Maria uurimist teema on Mobiiltelefoni roll pilase elus. T raames viis ta lbi lhiuuringu, mis sisaldas kuut ksimust (vt joonist 12 allpool). Uuringu tulemused on andmefailis telefon.xlsx.

Ksitlus. 1. Millise firma mobiiltelefoni sa kasutad? ______________________________________ 2. Miks valisid just selle mobiiltelefoni? ______________________________________ 3. Kui rahul oled oma praeguse telefoniga? ! vga rahul ! pigem rahul ! pigem ei ole rahul ! ldse ei ole rahul 4. Kui suur oli sinu eelmise kuu telefoniarve? ______________________________________ 5. Oled: !poiss !tdruk 6. Klass: ! 10 ! 11 ! 12

! Joonis 12. Maria koostatud ksimustik nites 20.


64

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Prast andmetest esmase kokkuvtte koostamist tekkis Marial terve hulk uusi pnevaid ksimusi. Niteks, kas vanemate klasside pilased kulutavad telefoni kasutamisele rohkem raha vi kas poiste ja tdrukute eelistused telefonide osas on erinevad. petaja andis Mariale vihje, et selliseid vrdlusi saab teha samade juba pitud meetodite abil, ainult, et andmed tuleb kokku vtta eraldi iga grupi jaoks ja siis neid vrrelda. Arvnitajatest kasutatakse vrdluste lbiviimiseks kige sagedamini aritmeetilist keskmist, kui seda pole praegu huvipakkuvate andmete kokkuvtmiseks korrektne kasutada, siis saab teha vrdleva sagedustabeli. Tulemuste esitamiseks vib aga kasutada niteks vrdlevat tulpdiagrammi (joonis 13) vi joondiagrammi. Maria mtles natuke ja arvas, et telefoniarvete suuruse vrdlemiseks eri klasside pilastel on kige mistlikum arvutada ja vaadata, kas ja kui palju erinevad erinevate klasside pilaste keskmised telefoniarved. petaja kiitis Maria meetodi valiku heaks, kuid palus tal phjendada, mille alusel saab otsustada, kas keskvrtust tohib vi ei tohi antud andmete analsimisel kasutada. Olles veendunud, et tunnus, mille osas me soovime gruppe vrrelda, on intervalltunnus, mille puhul tohib keskvrtusi kasutada, saab erinevuste analsimisel kasutada jrgmisi ldistatud ksimusi: Kas vrreldavate gruppide keskvrtused on erinevad? Millise grupi tulemuste keskvrtus on kige suurem/viksem? Kui palju erinevad vrreldavate gruppide keskmised tulemused ksteisest?

Tabel 8. Erinevate klasside pilaste mobiiltelefoniarvete phjal arvutatud arvnitajad. Gruppide vahelisi erinevusi saab illustreerida keskvrtusi vrdleva diagrammina. Tihti annab diagramm erinevustest parema ja kiirema levaate. Joonisel 13 allpool on esitatud andmed tabelist 8 palju levaatlikumal moel.

65

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Joonis 13. pilaste keskmine telefoniarve suurus eelmisel kuul.

lesanded 85.Arutle, milliste tunnuste korral nites 20 (lisaks telefoniarve suurusele) saaks veel vrrelda erinevate klasside tulemusi kirjeldavate arvnitajate kaudu. 86.Aita Marial (nide 20) otsustada, millist pitud meetodit (sagedustabel, tulpdiagramm, sektordiagramm, histogramm, joondiagramm, kirjeldavad arvnitajad vms) kasutada andmete kokkuvtmiseks ja millist tulemuste esitamiseks. Mrgi enda valikud allolevasse tabelisse.
Ksimuse nr Meetod, mida kasutad andmete esmaseks kokkuvtmiseks ning esitamiseks 1. 2.* 3. 4.** 5.*** 6.

* Telefoni valiku phjuseid on ksitud avatud ksimusena. Arutle, mil viisil saaks teha esmase kokkuvtte selle ksimuse vastustest ja kas ksimuse snastamise lihtsus kaalub siin les ajamahuka andmete tagantjrgi kategoriseerimise vi oleks ksitluse loomisel kohe olnud mistlik koostada valikvastustega ksimus. ** Andmete kokkuvtmise meetodi valimisel arvesta sellega, et telefoniarve suuruse pidid vastajad maha kirjutama oma eelmise kuu arvelt, mistttu on saadud vastused pea kikidel vastajatel erinevad arvud. *** Meenuta, mil viisil on ldjuhul otstarbekas tulemusi esitleda, kui korraga on vaja esitada vaid ks-kaks arvulist nitajat.
66

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

87.Kasuta andmetabelit telefon.xlsx ning anna esmane levaade Maria koostatud ksimustele saadud vastustest. Rakenda selleks eelmises lesandes valitud ning eelnevalt pitud meetodeid. 88.Kasuta andmetabelit telefon.xlsx ning arvuta erinevate klasside (10. kl, 11. kl, 12. kl) telefoniarvete keskvrtused, minimaalsed ja maksimaalsed vrtused ning standardhlbed. 89.Selgita, mida saad eelmises lesandes leitud tulemuste phjal jreldada vrreldes erinevaid klasse telefoniarvete... ... keskvrtuste phjal ... maksimaalsete, minimaalsete vrtuste ning standardhlvete phjal 90.Arutle, kas erinevate gruppide keskvrtuste esitamiseks oleks sisuliselt sobilik kasutada sektordiagrammi. Phjenda vastust. 91.Vrdle omavahel graaliselt poiste-tdrukute keskmiseid telefoniarvete suuruseid. Kirjuta tulemuste sisulist thendust avav selgitus. Hinda kriitiliselt loodud diagrammi vajalikkust vastavate tulemuste esitamiseks ning phjenda, kas esitaksid tulemused tekstina, tabelina vi diagrammina. 4.2. Erinevuste uurimine kasutades sagedusi ja protsente Jtkame Maria ksitluse tulemuste analsimist (nide 20 eelmises peatkis) ning vaatame, kuidas vrrelda poiste ja tdrukute eelistusi erinevate rmade poolt toodetud telefonide osas. On sna ilmne, et mobiiltelefonide valmistajarmade osas keskvrtust me arvutada ei saa, kuid viksime ksida niteks, millise rma telefone on poiste hulgas kige enam ja kas see langeb kokku tdrukute hulgas kige enamlevinud telefoni tootjaga. Selline ksimusepstitus suunab meid leidma sagedusi ja nendest lhtuvaid protsente vrreldavate gruppide likes. Tuletame meelde, et tunnuse vrtuste jaotumise sageduste ning protsentuaalsete osakaalude leidmiseks on kige otstarbekam kasutada sagedustabelit. Kuna nd ei taha me saada levaadet kogu valimist korraga, vaid tdrukutest ja poistest eraldi, siis on meil vaja sagedustabelit, milles oleks sagedused tdrukute ja poiste kohta eraldi vlja toodud. Sellist tabelit nimetatakse vrdlevaks sagedustabeliks vi risttabeliks.
!
poiss tdruk Samsung Nokia Sony Ericsson Muu KOKKU 25 10 4 2 41 29 22 5 5 61 KOKKU 54 32 9 7 102 Tabelist neme, et poisse osales uuringus vhem (41) kui tdrukuid (61), mistttu on sageduste phjal gruppide vrdlemine raskendatud.

Tabel 8. Poiste ja tdrukute kasutuses olevate mobiiltelefonide tootjad


67

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Lisame tabelisse 8 protsendid ja vaatame, kas vrdlemine muutub lihtsamaks.


poiss Samsung Nokia Sony Ericsson Muu KOKKU arv 25 10 4 2 41 % 61,0% 24,4% 9,8% 4,9% 100,0% arv 29 22 5 5 61 tdruk % 47,5% 36,1% 8,2% 8,2% 100,0% arv 54 32 9 7 102 KOKKU % 52,9% 31,4% 8,8% 6,9% 100,0%

Tabel 9. Poiste ja tdrukute kasutuses olevate mobiiltelefonide tootjad protsentuaalselt Erinevalt tabelist 8 on tabelis 9 vrreldavad grupid paigutatud veergudesse ning tabelisse on lisatud protsent nii, et poiste ja tdrukute vastused on eraldi tervikud (eraldi 100%), mistttu saame vrrelda ja elda niteks, et Samsungi telefonid on uuringus osalenud poiste seas enam levinud kui osalenud tdrukute seas, sest poistest kasutab Samsungi telefoni 61% ning tdrukutest 47,5%. Samas on Nokia telefonid osalenud tdrukute seas populaarsemad kui poiste seas, sest Nokia telefoni kasutab ligikaudu 36% tdrukutest ja 24% poistest. Jta meelde: kui vrreldavate gruppide suurused ei ole vrdsed, siis tuleb gruppide vrdlemisel ja jrelduste tegemisel kasutada protsentuaalset jaotust. Protsent peab olema arvutatud nii, et iga vrreldav grupp on omaette 100% kui vrreldavad grupid (nt poisid ja tdrukud) on ridades, siis on vaja rea protsenti ning kui veergudes, siis veeru protsenti. lesanded 92.Anna vrdlev levaade sellest, milliste rmade mobiiltelefone kasutavad erinevate klasside pilased. Kirjuta tekst, mis sobib saadud risttabeli lahtiseletuseks. 93.Arutle, kuidas on korrektne tlgendada jrgmistes tabelites olevaid protsente ning phjenda, miks nii arvutatud protsente ei ole otstarbekas antud andmete kontekstis vrdluse aluseks vtta.
poiss Samsung Nokia Sony Ericsson Muu KOKKU arv 25 10 4 2 41 % 46,3% 31,3% 44,4% 28,6% 40,2% arv 29 22 5 5 61 tdruk % 53,7% 68,8% 55,6% 71,4% 59,8% arv 54 32 9 7 102 KOKKU % 100,0% 100,0% 100,0% 100,0% 100,0%

68

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

4.3. Erinevuste illustreerimine protsentuaalseid jaotusi vrdleva diagrammina Protsentidena vljendatud erinevuste illustreerimiseks sobib vrdlev tulpdiagramm. Korrektses vrdlevas tulpdiagrammis moodustavad iga ksiku vrreldava grupi vrtused kokku 100%. Antud juhul moodustavad 100% nii poiste kasutatavad telefonid kokku kui ka tdrukute kasutatavad telefonid kokku.

Joonis 14. Poiste ja tdrukute kasutuses olevate mobiiltelefonide tootjad Vga levinud, kuid sisuliselt mittesobiv viis on koostada vrdlev tulpdiagramm vrreldavate gruppide tegelikest sagedustest, mitte protsentuaalsest jaotusest. Samamoodi nagu ei ole ainult sagedustega tabeli phjal vimalik vrrelda kahe erineva suurusega grupi tegelikke erinevusi, ei aita ka sagedusi kasutav tulpdiagramm gruppide vrdlemisel erinevustest tpset pilti saada. Joonisel 15 vime nha, et kik tdrukute vastuseid esitavad tulbad on poiste omadest krgemad see on tingitud sellest, et ttarlapsi osales uuringus rohkem.

! Joonis 15. Poiste ja tdrukute arv ning nende kasutuses olevad mobiiltelefonid

69

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Uurime jrgnevalt erinevates Eesti piirkondades elavate vastajate jagunemist tegevusalade jrgi. Koostame vrdleva tulpdiagrammi.

Joonis 16. Vrdlev tulpdiagramm vastanute jaotusest tegevusala jrgi Kui vrreldavaid gruppe on rohkem kui kaks, lheb tavaline vrdlev tulpdiagramm sna kirjuks ja seega raskesti arusaadavaks. Lahenduseks on kasutada kihtdiagrammi. Kihtdiagrammis (ingliskeelses tarkvaras: 100% Stacked Bar) esitatakse iga vrreldava grupi kohta ks tulp, mis on jagatud vrdluse aluseks oleva tunnuse vrtuste protsentuaalse osakaalu jrgi kihtideks, mis kokku moodustavad 100%.

Joonis 17. Kihtdiagramm samade andmete phjal

70

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

lesanded 94.Kasuta andmestiku telefon.xls andmeid ning koosta vrdlev tulpdiagramm poiste ja tdrukute telefonitootjate eelistuste illustreerimiseks. 95.Kasuta andmestikku ess.xls ning koosta kihtdiagramm erinevate Eesti piirkondade tegevusalade vrdlemiseks.

4.4.* Keskvrtuste vahelise erinevuse ldistamine: t-test Meenutame peatkis 2.5 rgitu phjal, et professionaalsetes uuringutes soovitakse ja suudetakse tihti uuring les ehitada nii, et kogutud andmete phjal saab teha jreldusi ka nende kohta, kellele otseselt andmeid kogutud ei ole. Sellisel puhul tuleb uuringu alguses deneerida ldkogum ning andmete kogumiseks moodustada juhuslik ja esindav valim. Kuigi koolipilased ise oma uuringutes selliseid valimeid ilmselt moodustada ei saa, on olemas mitu suuremahulist uuringut, mille andmed on avalikult kigile kttesadavad. Vaatleme allpool hte neist. Euroopa sotsiaaluuring (ESS) on sotsiaalteaduslik uuring, mille eesmrk on uurida hiskondade arengu seadusprasusi. Andmed vimaldavad analsida hoiakute, institutsioonide arengu ja inimeste kitumise vahelist seost ning mitmeid muid hiskonnaprotsesse. Uuringuga on liitunud umbes 30 riiki ning andmeid kogutakse rangete, omavahelist vrdlust ning ldistamist lubavate standardite jrgi. ldjuhul iga kahe aasta tagant lbiviidavas uuringus kasutatakse hte ja sama phimoodulit, mis tagab andmete ajalise vrreldavuse. Isikuandmetest vabad andmefailid on vabaks allalaadimiseks ning kasutamiseks avatud kikidele. Jrgnevas kasutame vljavtet ESS 2008. a andmetest, mis kajastavad Eestit (ess.xlsx). NIDE 21 Pikkade koolipevade eel unistas 10. klassi pilane Mikk sellest ajast, millal ta saaks juba tle minna. Tlkimisega kaasnes Miku arvates ks vga suur eelis koduseid lesandeid ei anta ning prast tpeva oled vaba! Sellele, et on olemas erinevaid ameteid, millest osadega kaasneb ka koduse t jtkumine, Mikk ei melnud. Ta arvas, et pingutest ja sellega kaasnevatest kodustest lesannetest psemine oleks piisav phjus olla oma eluga oluliselt rohkem rahul. Kasutame ESS andmeid ning uurime esmalt, kas tasustatud tl kivad vastajad on rohkem oma eluga rahul kui need, kelle philine tegevus on ppimine. Eluga rahulolu mdeti uuringus 10 palli skaalal, kusjuures 10 palli thendas kige suuremat rahulolu.

71

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile Philine tegevus viimase 7 peva jooksul Tasustatud t Pensionil pingud Ttu Kodune, hoolitseb laste vi kellegi teise eest Muu tegevus KOKKU Vastajate arv Keskmine rahulolu eluga 881 6,30 391 5,99 148 7,34 87 4,78 73 6,52 65 5,08 1645 6,20

Tabel 10. Erinevate elanikkonnagruppide keskmine rahulolu eluga. Neme, et uuringus osalenud ppurite keskmine rahulolu eluga oli 7,34 palli, kuid osalenud ttajate keskmine rahulolu 6,3 palli. Seega nitavad tulemused vastupidist tendentsi sellele, mida uskus Mikk ttajate rahulolu oli madalam kui ppurite oma (lihtsa lahutamise tehte abil neme, et erinevuse suurus oli ligikaudu 1 pall). Samas, kuna selles uuringus oli tegu Eestit esindava juhusliku valimiga, viks siinkohal pstitada uue ksimuse: kas valimis ilmnenud tendents, et ppurite rahulolu on suurem kui ttajate oma, kehtib ka kogu ldkogumi ehk Eesti 2008. aasta elanikkonna kohta vi on vimalik, et selline hepalline erinevus keskmiste vahel vinuks tekkida valimi iserasusest tekkinud juhusliku vea tttu ka siis, kui valim oleks moodustatud ldkogumist, kus erinevusi pole vi on lausa vastupidised? Viimasel juhul jks seega lahtiseks, kas ja milline erinevus ldkogumis on ning seega ldistavaid jreldusi teha ei tohiks. Tuletame meelde, et valimilt ldkogumile jrelduste tegemise e ldistamise kigus tekkida viva juhusliku vea hindamiseks on olemas vastavad statistilised meetodid. Peatkis 3 vaatlesime juba vahemikhinnangute e usaldusintervallide koostamist. Siin tuleks meil kasutada aga statistilist olulisustesti. Olulisusteste on mitu ning sobiva olulisustesti valik sltub, nagu muudegi statistiliste meetodite valik, ksimuse ning andmete tbist. laltoodud nites vrdlesime kahte gruppi (ppureid ja ttajaid) keskvrtuste abil, kuna rahulolu oli mdetud intervalltunnusega sellises olukorras sobib olulisustestiks t-test.

72

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Statistilise olulisustesti phisammud t-testi nitel (tulemused on parempoolses veerus):


Eelsamm I: Ngime, et ttajate keskmine rahulolu oli Analsisin olemasolevaid andmeid kirjeldava ligikaudu 1-palli vrra madalam kui ppurite statistika meetodite abil ning leidsin midagi oma. Valimite keskvrtused: huvitavat (nt. erinevuse vi seose, vms) ttajad 6,3 ppurid 7,34 Eelsamm II : Kuna tegemist oli Eestit esindava juhusliku valimiga, pstitame ksimuse: Tekkis ksimus: Kas vib ldistada? ldkogum Valim ldkogum tpi uuringud Kas valimis ilmnenud tendents, et ppurite (ehk valikuuringud) vi eksperimentaalne rahulolu on krgem kui ttajate oma kehtib ka kogu ldkogumi ehk Eesti 2008. aasta uuringudisain elanikkonna kohta? I. ige olulisustesti valik Kui valimis on vrreldud kahte gruppi keskvrtuste abil (eelduseks (lhtuvalt ksimusest ja andmetbist) Kasuta abiks tabelit Milline analsimeetod intervalltunnus), siis sobib olulisustestiks t-test. valida? II. Valitud olulisustesti eelduste kontroll: t-testi puhul tuleb kontrollida, kas vrreldavate gruppide hajuvused (seda nitab standardhlve ja dispersioon) on sarnased vi erinevad ning vastavalt valida sobiv t-testi variant. III. Hpoteeside snastamine: H1: 12 sisukas hpotees H1: vidab, et ldkogumis on 2008.a. oli Eesti ppurite ja ttajate erinevus/seos (tuleb tpsustada vastavalt testile!) keskmine rahulolu eluga erinev nullhpotees H0: vidab, et ldkogumis ei ole H0: 1=2 erinevust/seost 2008.a. oli Eesti ppurite ja ttajate Valin ka olulisuse nivoo keskmine rahulolu eluga hesugune ( nitab kui vike peab olema H0 kehtimise Tavaprased olulisuse nivoo vrtused: tenosus, et me viks ilma suurema riskita ta =0,05 (ehk 5%) mittekehtivaks tunnistada?) =0,01 (ehk 1%) IV. Arvutused Kasutan vastavat tarkvara arvutuste eesmrgiks hinnata H0 kehtimise tenosust p, lbiviimiseks. mida nimetatakse olulisuse tenosuseks (p nitab kui suur on tenosus, et olukorras, kus H0 kehtib, tekkis valmis olnud erinevus vi seos juhuse tttu?) V. Otsus tulemuse kohta: Leian arvuti poolt genereeritud tulemuste tabelist mind huvitava nitaja p p > H0 jb kehtima, kuid pole testatud - erinevus/seos statistiliselt mitte oluline (ei Exceli puhul: P(T<=t) two-tail ldista) p=1,36126E-08=0,0000000136 (ehk 0%) p H0 vib mber lkata ja H1 testatuks p (0,000 0,05) lkkan H0 mber ja loen H1 testatuks pidada - erinevus/seos statistiliselt oluline (vib ldistada) VI. Jrelduse snastamine ESS uuringu tulemuste phjal vin vita, et 2008.a. oli Eesti ppurite ja ttajate keskmine rahulolu eluga erinev, kusjuures ppurite rahulolu oli krgem kui ttajatel.

73

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

lesanne 96.Kasutades ESS-i andmete phjal saadud arvutusi ja allpool olevat tabelit, uuri, kas meeste ja naiste keskmine rahulolu eluga on ldiselt erinev.
Eelsamm I:

Mida saad jreldada valimi tulemuste kohta tehtud arvutuste

A n a l s i s i n o l e m a s o l e v a i d phjal? andmeid kirjeldava statistika meetodite abil ning leidsin midagi huvitavat (nt. erinevuse vi seose, vms)

Eelsamm II : Kas vib ldistada? ldkogum Valim ldkogum tpi uuringud

Kas on tegemist Eestit esindava juhusliku valimiga?

vi eksperimentaalne uuringudisain I. ige olulisustesti valik Mitme grupi keskvrtuseid me vrdleme? (lhtuvalt ksimusest ja andmetbist) Kasuta abiks tabelit Milline analsimeetod valida? III. Hpoteeside snastamine: H1: ldkogumis on erinevus/seos

Kas uuritav tunnus on intervalltunnus? Millise testi me valima peaksime?

Snasta hpoteesid ning vali olulisuse nivoo. H1:

H0: ldkogumis ei ole erinevust/ H0: seost : IV. Arvutused

V. Otsus tulemuse kohta:

Otsusta olulisuse tenosuse vrtuse phjal, kas * jb kehtima Ho, kuid see ei ole testatud

VI. Jrelduse snastamine

* vime Ho mber lkata ja pidada testatuks H1 Snasta jreldus.

74

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

4.5. Trendide e ajas toimuvate muutuste uurimine NIDE 22 Eesti Meteoroloogia ja Hdroloogia Instituudi (EMHI) koostatud ilmaprognoosidega oleme kik vhemal vi rohkemal mral kokku puutunud. Alates vlistemperatuuri jlgimisest, mis niteks klmal talvepeval viks pilasel (teatavatel lisatingimustel) lubada koolist puududa ning klmaphi pidada, lpetades sellega, milline on sademete hulk ning vastavalt sellele kas vihmavari kaasa vtta vi mitte. Vaatleme jrgnevalt EMHI Tallinna mtmisjaama kogutud jaanuarikuu andmeid lbi 12 aasta (20002011).
Sademete Aasta 2011 2010 2009 2008 2007 2006 2005 2004 2003 2002 2001 2000 summa (mm) 51,4 27,7 40,4 79,5 106,7 12,1 81,3 22,8 47,3 42,4 48,4 71,4

Tabel 11. Sademete koguhulk (mm) jaanuaris. levaatlikuma pildi saamiseks tabelis esitatud andmetest koostame sademete hulga muutust kirjeldava joondiagrammi, mis kujutab jaanuarikuu sademete koguhulga (mm) muutumise trendi toodud aastate likes (joonis 18).

Joonis 18. Jaanuarikuu sademete koguhulga muutumine aastate likes.


75

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Aastatel 19982007 kolmes etapis lbi viidud uuringus pilase elu-olu ilmnes, et pilaste jaoks on kooliskimine pigem oluline kui meeldiv tegevus. Niteks pidas kokkuvttes koolis kimist oluliseks 86% ning meeldivaks 62% kikidest pilastest. Kuna tegu on pikaajalise uuringuga, kus samu andmeid on kogutud erinevatel aastatel, saab uurida, kas pilaste hoiakud on aastatega muutunud. Kiki pilasi koos uurides selgus, et muutused on kllalt vikesed. Samas tdrukute ja poiste vastuseid eraldi vrreldes tuli vlja, et muutused on olnud erisuunalised: tdrukute hinnang kooli meeldivuse kohta on aastatega tusnud, samas poiste hinnang aga langenud. Tulemuste illustreerimiseks oli uuringu raportis toodud alljrgnevad diagrammid.

Joonis 19. Vljavte uuringu pilase elu-olu tulemustest, vaskpoolsel diagrammil ! noormeeste ja parempoolsel ttarlaste tulemused lesanded 97.Vaatle joonist 18 ning kirjelda sademete hulgas toimunud muutuste iseloomu. 98.Kasutades Globei andmestikku leia keskmised temperatuurid aastate likes ning koosta trendi illustreeriv joondiagramm. 99.Vaatle joonisel 19 esitatud tulemusi ja arutle, kas ja kuidas on aastate likes muutunud poiste-tdrukute hinnangud kooli olulisuse kohta. 100.Arutlege grupis, milliseid tunnuseid on kasutatud joonisel 19 olevate diagrammide koostamisel ning mis on toodud protsentide taustal olevaks 100%-ks. Mitu erinevat tervikut (100%) on joonisel kajastatud?

76

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

4.6. Seoste uurimine NIDE 23 Vaatleme jrgnevalt EMHI jaanuarikuu andmete phjal tuule kiiruse ning sademete koguhulga hist kitumist aastate likes.

Tuule kiirus (m/s) Sademete summa (mm) 3,0 51,4 2,3 27,7 3,2 40,4 4,7 79,5 4,0 106,7 3,4 12,1 4,1 81,3 3,1 22,8 3,8 47,3 3,9 42,4 3,1 48,4 4,3 71,4

Tabel 12. EMHI ilmavaatluse andmed jaanuari kohta aastate likes Vastastikust seost kahe intervalltunnuse vahel nimetatakse korrelatsiooniks ja seda seost saab illustreerida korrelatsioonivlja kujul. Visuaalse levaate saamiseks tabelis 12 olevatest andmetest koostame korrelatsioonivlja diagrammi (joonis 20). Koostatud diagrammi vaadeldes paistab silma sna selge suundumus e punktivli on koondunud tusvas joones. Neme, et viksemale tuulekiiruse vrtusele vastab viksem sademete koguhulk. Mida suuremaks muutub tuule kiirus, seda suuremaid vrtuseid omandab konkreetse vrtuse sademete kogusumma.

Joonis 20. Sademete kogusumma ja tuule kiiruse korrelatsioonivli Kui korrelatsioonivlja punktide pilv on selgelt koondunud kas tusvas vi langevas joones, vime elda, et tegu on vastavalt kas positiivse vi negatiivse seosega.
77

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Seose suund loetakse positiivseks, kui he tunnuse vrtuste kasvades kasvavad ka teise tunnuse vrtused, ning negatiivseks, kui he tunnuse vrtuste kasvades teise tunnuse vrtused kahanevad.

Tugev positiivne korrelatsioon

Korrelatsioon puudub

Tugev negatiivne korrelatsioon

Joonis 21. Positiivne ja negatiivne korrelatsioon Mida rohkem on punktid koondunud lapiku punktipilvena, seda tugevam on seos kahe tunnuse vahel. Kahe tunnuse vahelise seose tpsemaks kirjeldamiseks arvutatakse korrelatsioonikordaja r, mille vrtus jb 1 ja +1 vahele. Korrelatsioonikordaja mrk nitab seda, kas tegu on positiivse vi negatiivse seosega. Lisaks seose suunale kirjeldab korrelatsioonikordaja ka seose tugevust. Seose tugevuse tlgendamine sltub sellest, mis nhtuste kohta andmed kivad, kuid tavapraselt tlgendatakse seosekordaja absoluutvrtust jrgmiselt: 0 < I r I < 0,30 olematu, vga nrk seos 30 < I r I < 0,70 keskmise tugevusega seos 70 < I r I > 1 tugev seos Vastavalt sellele, milline on korrelatsioonikordaja vrtus, saame arvteljel olevaid soovituslikke tlgendusi arvesse vttes teha jrelduse tunnustevahelise seose tugevuse ja suuna kohta. Niteks kui kahe tunnuse vahelise seose kordaja vrtus on arvutuste jrgi 0,76, on tegu negatiivse tugeva seosega. Tuleme tagasi nite 23 juurde ning arvutame tabelttlustarkvara funktsiooni CORREL abil kahe tunnuse vahelise seose korrelatsioonikordaja. Tulemuseks on tabel 13, milles on korrelatsioonikordaja vrtuseks saadud 0,68.

Tabel 13. Korrelatsioonikordaja leidmine Korrelatsioonikordaja absoluutvrtuse phjal saame elda, et tegu on keskmise tugevusega seosega. Kuna kordaja on positiivse vrtusega (st plussmrgiga, mida tavapraselt vlja ei kirjutata), on tegu positiivse seosega e mida tugevam on aastate likes jaanuaris olnud tuul, seda suurem on olnud sademete kogusumma, ning vastupidi, mida tuulevaiksem on olnud, seda vhem on olnud ka sademeid.
78

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

NIDE 23 Mahukamate uuringute puhul arvutatakse korrelatsioonikordajad korraga mitme tunnuse hiskitumise kirjeldamiseks. Kasutame ESS-i andmestikku ess.xlsx ning leiame korrelatsioonikordajad kolme jrgmise tunnuse jaoks: koolis kidud aastad ldine rahulolu eluga (0 ldse ei ole rahul ... 10 vga rahul) ldine rahulolu riigi majandusliku olukorraga (0 ldse ei ole rahul ... 10 vga rahul) Tulemuseks saime tabeli, milles on kirjeldatud kikide uuritud tunnuste omavahelised korrelatsioonid.
Koolis kidud aastad Koolis kidud aastad ldine rahulolu eluga ldine rahulolu riigi majandusliku olukorraga 1 0,019739 0,052934 ldine rahulolu ldine rahulolu riigi majandusliku eluga olukorraga 1 0,455284 1

Tabel 14. Kolme tunnuse vahelised korrelatsioonikordajad Tabelist 14 neme, et kooliskidud aastate arv ei ole seotud rahulolu ksimustega, vastavad korrelatsioonikordajad on 0,02 ning 0,05. Kll on aga seotud rahulolu eluga ning rahulolu riigi majandusliku olukorraga. Selliste ksimuste korral, kus vastused/vrtused on seotud mingi kirjeldusega, tuleb jrelduste kokkukirjutamisel arvestada vrtuste kirjeldustega. Meie nites on mlemad tunnused mdetud samasugusel skaalal: ldine rahulolu eluga (0 ldse ei ole rahul ... 10 vga rahul) ldine rahulolu riigi maj. olukorraga (0 ldse pole rahul ... 10 vga rahul) Seega saame tabeli 14 phjal teha jrgmise jrelduse: mida rohkem on vastaja ldiselt rahul oma eluga, seda rohkem on ta ka rahul riigi majandusliku olukorraga ning vastupidi, mida vhem on vastaja ldiselt rahul eluga, seda vhem on ta ka rahul riigi majandusliku olukorraga. Lisaks korrelatsioonikordaja arvutamisele (vi selle asemel) saab kahe intervalltunnuse vahelist seost uurida ka lineaarse regressiooni meetodil, mis annab vljundiks lineaarfunktsiooni Y=a0 + a1*X ja selle graaku. Niteks on failis vererohk.xlsx toodud diagrammina 30 inimese vanuse ja vererhu vaheline seos, mis on tugevalt positiivne. Lineaarne regressioon erineb korrelatsioonist selle poolest, et ks tunnustest on vajadusel eksperimendi kigus manipuleeritav ning analsi tulemusel saadud lineaarfunktsiooni kasutatakse ldjuhul tulevikkuvaatavalt, s.t. mingite protsesside tulemuse ennustamiseks. Regressioonanalsi teostamiseks saab MS Exceli puhul kasutada Analysis ToolPak alla kuuluvat protseduuri Regression.

79

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

lesanded 101.Jrgmises tabelis on kuus vanarahvatarkust, mille phjal vanasti ilma ennustati. Kik need viitavad mingitele seostele. Mtle, kuidas ja millistes hikutes saaks mta kirjeldatud nhtusi ning otsusta, millist suunda ennustab vanarahvatarkus kirjeldatud seostele (positiivne vi negatiivne seos). Aruta paarilisega, kui tugevad viksid teie kogemustele tuginedes olla antud seosed. Phjendage vastust.
Vanarahvatarkus Mida krgemad on juluajal lumahanged, seda pikem vili suvel kasvab. Kuiv kevad - vihmane suvi. Mida rohkem on pihlakatel marju, seda rohkem sajab sgisel vihma. Kuidas temperatuur juulis - nnda ka jaanuaris. Kui kevadel on palju udu, siis tuleb suvel palju vihma. Mida soojem on oktoober, seda klmem veebruar. S e o s e Seose arvatav suund tugevus

102.Kasuta andmestikku emhi.xlsx ning koosta tunnuste sademete koguhulk ning keskmine hutemperatuur vahelise seose kirjeldamiseks korrelatsioonivli. Seose tpsemaks kirjeldamiseks arvuta ka korrelatsioonikordaja. Arutle saadud tulemuste sisulise tausta le ning mtle, kas samasuguse suuna ja tugevusega seos viks kirjeldada ka niteks juulikuu andmeid. 103.Selgita jrgmiste uuringutulemuste sisu oma snadega. Uuringud nitasid, et korrelatsioon vlistemperatuuri ja meeleolu vahel on praktiliselt null. Antarktika liustikuj anals nitas tihedat positiivset seost temperatuuride ja ssihappegaasisisalduse vahel. TIMSS 2003 uuring nitas, et matemaatika kui ppeaine meeldivus oli enamike riikide likes negatiivses korrelatsioonis pilaste edukusega matemaatikas. 104.Too niteid oodatavatest seostest erinevate inimest kirjeldavate tunnuste vahel. 105.Too niteid seostest erinevate kultuuri- ja/vi sotsiaalsete nhtuste vahel. 106.Kasuta andmestikku ess.xlsx ning koosta kahe vabalt valitud tunnuse kirjeldamiseks korrelatsioonivli. Arvuta korrelatsioonikordaja ning tlgenda selle vrtust. Lisaks teosta ka regressioonanals samade tunnuste kohta.

80

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

107.Snasta tabelis olevate tunnuste korrelatsioonikordajate phjal jreldused.


Tunnused * Vanus * Milliseks Te hindate oma arvutikasutusoskusi?

ning

nende

korral

arvutatud

A r v u t a t u d Jreldus korrelatsioonikordaja 0,72

(1-vga head ... 9-vga kehvad, ma ei oska ldse arvutit kasutada). * Kui tihti vtad sna foorumites sinujaoks olulistel teemadel? (0-mitte kunagi ... 5-alati) * Koolis kidud aastate arv * Mitu korda oled sellel ppeaastal kooli hilinenud? * Mitu peva oled sellel ppeaastal koolist puudunud? * Kui suurt thelepanu prad oma vlimusele? (0-ldse mitte .. 5-vga palju) * Vanus

-0,25

0,00 -0,48

4.7. Kvalitatiivne sisuanals Kui uurija ei tea uuringu alguses, mida ta vib avastada ning millised seadusprasused uuritavas nhtuses vivad esineda, siis on tegu kvalitatiivse lhenemisega. Uurija tegevused kvalitatiivses uuringus on jrgmised: Uurija kogub struktureerimata andmeid nhtuste vi olukordade kohta, esitades ksimusi, tehes vaatlusi vi kogudes asjassepuutuvaid tekste, helisalvestusi, pilte vi objekte. Et andmeid paremini mista, otsib uurija andmetest korduvaid elemente ehk andmeid iseloomustavaid kategooriaid (induktiivne sisuanals) vi loob varasematest teooriatest lhtudes kategooriad informatsiooni vhendamiseks andmetes (deduktiivne sisuanals). Et leida seadusprasusi ja mustreid nhtustes ja olukordades, kogub uurija seejrel infot kategooriate esinemise sageduse ja viisi kohta andmetes. Lpuks arendab uurija vlja oma teooria leitud seadusprasusi arvestades vi vrdleb avastatud seadusprasusi varasemate teooriatega. Kust tulevad kvalitatiivse uuringu andmed? Meid mbritsev maailm hlmab endas teatud korrapra. Paljud nhtused (nt mn, kuuvarjutus) ilmnevad teatud regulaarsusega, mingid asjad juhtuvad vaid teatud eeltingimuste kehtimisel (nt vikerkaar), mned nhtused esinevad sageli ksnes ksikes teisega. Selliste korraprasuste vi mustrite teaduslikuks avastamiseks on vaja uuritavat nhtust vi olukorda dokumenteerida. Niteks paneb uurija loodusvaatluse vi eksperimendi kigus vi situatsiooni kohta kirja vi dokumenteerib video vi foto vahendusel thelepanekud, mis sel korral selles esinesid. Hiljem on uurijal vimalik sndmuse kohta kogutud struktureerimata andmeid sstematiseerida, neid rhmadesse jaotades e
81

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

kategoriseerides. Ei ole olemas hte ainuiget kategoriseerimise vimalust, vaid kategooriate ssteem sltub uurija eesmrgist. NIDE 24 Allpool olevas tabelis 15 on vaatluse kigus tehtud fotod kategoriseeritud kahte erinevat uurimisprobleemi silmas pidades. Variant A: kas prgi taaskasutusvimalus on loodud? Variant B: kas elanikel on keskkonnahooliv kitumine?
Dokumenteeritud situatsioon Uurija thelepanekud Kategooria Prgi jrelsorteerimine prgifirmas, et Variant A: seda taaskasutada. taaskasutus Prgi on eelnevalt sorteerimata. Variant B: ei hooli keskkonnast

Pakendiprgi tekib vhem, sest on Variant A: l o o d u d m u g a v t a a r a r i n g l u s e taaskasutus ssteem. Variant B: Elanikud ei viska taarat prgisse vaid hoolib viivad pakendite kogumispunkti. keskkonnast

Prgi eelsorteerimise vimalus on Variant A: loodud, aga see ei toimi. taaskasutus ei toimi Elanikud toovad kll prgi konteineri juurde, aga ei sorteeri seda. Variant B: ei hooli keskkonnast Prgi eelsorteerimine elanike poolt, Variant A: et vimaldada taaskasutust. taaskasutus Elanikud sorteerivad oma prgi. Variant B: hoolib keskkonnast

Tabel 15. Vaatlusfotode kategoriseerimine kahe erineva variandi alusel

82

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

NIDE 25 Keskkonnaalaste teadmiste uuringus paluti pilastel vastata ksimusele: Phjenda, miks me ei tohiks Suure Muname ja teiste Luna-Eesti kuplite nlvu metsast paljaks raiuda? pilaste vastused kategoriseeriti esmalt eri tpi vastusevariantideks: nt huga seotud seletused, erosiooniga seotud seletused jne. Need moodustasid lemkategooriad. Iga kategooria sees esines samuti eri tpi pilaste vastuseid, mis omakorda kategoriseeriti: niteks Puud toodavad hapnikku, Vrske hk, husaastus, Kliimamuutus. Nites on vlja toodud osalised uuringu tulemused: uuringust selgus, et lisaks igetele teadmistele esineb pilastel hulk vrarusaamu, mida uuring aitas tpsustada.
pilaste esitatud phjendused Puid on vaja muidu ei saa hingata, hapnik saab otsa. vrsket hku vhemaks. Sest puud toodavad hapnikku. Sest igal pool peavad kasvama puud ja need puud 1.2. Puud toodavad annavad hku. Selleprast, et mets on loodusvara ja puhastab hku. Kui see kik maha raiuda,siis saastub hk palju rohkem, kuna kokku on seda metsa vga palju. Krgemal on hk hre.Puud toodavad hapnikku ja kui 1.3. hu tiheduse puid ei ole siis ei ole ka hapnikku seal. Kuna krgemal on hk hre ja puud toodavad hku. Inimesed ei saaks enam kia. Pealegi on seal tuuline puud varjavad tuult. Sealt saame vrsket hku. Seal on kaunis loodus. Kui need maha raiuda, jks vrsket hku vhemaks. hk lheks umbseks Vrske hu puudus vib tulla mgi vib kokku variseda Sest et hk ei saastuks rohkem. 1.5. husaastus Kuna puud puhastavad hku ja valmistavad hapniku. Kliima muutub, tuulte ja vihma mju tugenveb Mgi vib kokku variseda 1.6. Kliimamuutus 2.1. Erosioon 2. Pinnasega seotud phjendused 1.4. Vrske hk muutus kuplitel hku Alamkategooria Kategooria phjendused

1.1. Puud toodavad 1. huga seotud

Puud toodavad hapnikku. Kui need maha raiuda, jks hapnikku

Tabel 16. pilaste phjendused kategoriseerituna Kui palju tuleks andmeid koguda? Nhtustes vi olukordades peituvad seadusprasused ei ilmne iga kord, vaid teatud elemendid vivad niteks koos esineda aeg-ajalt. Seetttu on vaja koguda andmeid teatud pikema perioodi jooksul vi teha vaatlusi korrapraste ajavahemike tagant, mnikord ka mitme erineva inimese poolt. Niisugusel moel tagatakse see, et tegelikkuses esinevad aspektid on olemas ka kogutud uurimisandmetes. Kui uuritakse inimeste teadmisi, arvamusi vi hoiakuid, tahab uurija eelkige teada, milliseid igeid vi valesid teadmisi/arvamusi/hoiakuid
83

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

inimestel on. Seetttu ksitletakse uusi inimesi vimaluse korral nii kaua kuni uusi vastusevariante enam vastustes esile ei tule. Kui uurija analsib dokumente, tekste, pilte, objekte vi situatsioone, tuleks koguda esmalt kogu kttesaadav info. Jrgmiseks oluliseks sammuks on andmete vhendamine. Kvalitatiivse uuringuga kogutud struktureerimata andmete analsimine on aeganudev ja seetttu ei kasutata ldjuhul sellistes uuringutes juhuvalimit, kuna see oleks liiga tmahukas. Andmehulka saab vhendada, valides sgavamaks analsiks vaid need juhtumid, mis toetuvad sobivatele, uurija poolt eeldusena mratud kriteeriumitele. Uurija vib andmehulka vhendada ka uuringu jrgnevates etappides. Niteks esimeses etapis kodeerib uurija kogu andmehulga ja teises etapis moodustab ta seejrel valimi vaid hte kategooriasse kuuluvatest juhtumitest, mida seejrel detailsemat uuritakse (tabel 16: uurija valis pilaste huga seotud kirjeldused ja kategoriseeris need omakorda tpsemalt). Kuidas andmeid korrastada ja hoida? Vaatluste ja ksitluste tulemused tuleb jrgneva analsi jaoks mber kirjutada audiosalvestistelt vi saab uurija kasutada andmetena teksti vi visuaalset infot. Uuringu andmestiku korrastab uurija arvutis kasutades niteks andmetabeleid vi kaustu. Juba andmete korrastamisel peaks uurija arvestama, et oleks vimalikult lihtne andmeid sorteerida ja leida mitme tingimuse (niteks aeg, kogumiskoht) alusel. Lisaks tuleks tagada, et uurija saaks andmetele lisada kommentaare ja kategooriaid. Andmetabelites on soovitav paigutusviis selline, et originaalandmed oleksid seotud uurijapoolsete kommentaaridega ja tema lisatud kategooriatega (nide 25). See on vajalik, et leida kiiresti he kategooria alla kuuluvaid niteid, vi et vrrelda, kas teine uurija seletab situatsiooni sarnaselt ning omistab sellele sama kategooria. Andmed ei pea tingimata asuma uurija arvutis, vaid neid vib silitada ka avalikes andmebaasides. Sellisel juhul on aga uurija endale loonud ssteemi andmete taasleidmiseks (niteks kasutades jrjehoidjaid, mrksnu) ja kategoriseerimiseks. NIDE 26 Delicious.com teenuse abil mrksnastatud jrjehoidjaid Nord Streami gaasijuhtme kohta saab otsida erinevate mrksnadega, niteks geograaline kategooria: eest, balti, vene, saksa; poliitiline kategooria: partei Isamaa ja Res Publica liit.

84

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Joonis 22. Mrksnastatud jrjehoidjad Delicious.com keskkonnas Segmenteerimine on andmete jaotamine thenduslikeks ksusteks. Segmenteerimisel arvestatakse, millised on andmed, mida tkeldatakse, kas teksti tkkide suurus on vastavuses ksimustele, mida uurija ksib ning millal on otstarbekas segmenteerimata jtmine. Andmete puhul on segmendiks kas vited, laused, ideed, arutluskik, lik, teema vahetus, vestlus dialoogis, episood (sndmus vi kindel tegevus). Kuidas leida andmetest seadusprasusi? Sisuanals on metoodika erinevat tpi kvalitatiivsetes andmetes seoste tuvastamiseks. Sisuanalsi saab teha kahel erineval moel: induktiivselt ja deduktiivselt. Induktiivse sisuanalsi puhul leitakse kategooriad ja nendevahelised seosed andmestikku korduvalt lugedes. Deduktiivset sisuanalsi teostades kasutab uurija andmete kategoriseerimisel juba varem teadaolevat, mingil teoorial phinevat kategooriate ssteemi. Kategooriate loomine: uurija vaatab lbi kogu uurimismaterjali ja loob esmase kategoriseerimise kigus uurimuses kasutatavate kategooriate phinimekirja. Kategoriseerimisel tuleb luua vastastikku vlistavad kategooriad st sama nhtus saab kuuluda vaid hte kategooriasse. Kategooriad peavad olema phjalikud st nendega peab saama klassitseerida kik olulised juhtumid. See, millised kategooriaid otsitakse, oleneb uurija teoreetilistest teadmistest, sellest, milliseid hpoteese pstitati, milliseid ksimusi ksiti. Kategooriate nimedeks vivad olla: snad, fraasid, lhendid vi smbolid. Kategooriad esitatakse tabelina (tabel 17), milles peaks olema kategooriat thistav kood, millele jrgneb kategooria nimi ja kategooria lhike kirjeldus vi denitsioon ja viimaks selle nide. Kategooria koodiks vib olla ka vrv.
Kategooria kood Kategooria nimetus Kategooria kirjeldus Kategooria nide Lhend, mis kiirendab heselt mistetav kategoriseerimist nimetus Kategooria kirjeldus vi Siia kirjuta kategooriat definitsioon. iseloomustav nide oma andmetest.

Tabel 17. Kategooriate tabeli vorm


85

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Kuna andmeid vivad kodeerida erinevad inimesed erinevalt, siis tuleb meeles pidada, et tuleb saavutada kodeerijasisene usaldatavus st. iga individuaalne kodeerija oleks jrjekindel koodide kasutamisel, ja kodeerijate vaheline usaldatavus, st et erinevad kodeerijad sildistaks koodide kasutamisel hesuguselt. Koodide tbid: Koodid, mis kehtivad kogu juhtumi kohta. Ka nt aeg, koht jne. Induktiivsed koodid leitakse kodeerimisprotsessi esimesel etapil otse andmetest. Tavaliselt on need selged kirjelduslikud snad, millega enamik inimesi ligu iseloomustamisel nustuks. Eelnevalt mratletud e deduktiivsed koodid luuakse uurimuse eelselt vi selle alguses. Koosleiduvad koodid on koodide komplektid (kaks vi enam koodi), mis osaliselt vi tielikult esinevad samaaegselt (vt nide 24). Koodid vivad moodustada tpoloogia vi hierarhilise ssteemi e taksonoomia. Tpoloogia on klassikatsioonissteem, kus kategooriad ei sltu ksteisest: ainult sildistamine, klassitseerimine (antakse mingi nimi, nt taaskasutatav/ hekordne) kategooriaid ei saa loogiliselt jrjestada kui tunnused kodeeritakse arvulisteks, siis vastavad nad nimi- e nominaalskaalale, millega saab leida vaid esinemissagedusi Taksonoomias on kategooriad organiseeritud erinevateks tasemeteks, milles on loogiline uurija mratletav jrgnevus. Hierarhilised alamkategooriaid vivad kuuluda mingi ldkategooria alla ja see omakorda veelgi krgemaastmelise kategooria alla. nii sildistamine kui ka jrjekorrastamine kategooriatel on sstemaatiline (nide 25: huga seotud kategooriad (vrske hk, hu tihedus jne)) vi ksteisega jrjestikune suhe ehk paremusjrjestus (nide 1: keskkonnahoolimatu 1 / keskkonnahooliv 2) kui tunnused kodeeritakse arvulisteks, siis saadakse jrjestusskaala e astmeline skaala, mille intervallid skaalajaotuste vahel pole hesugused ja seetttu ei tohiks leida aritmeetilist keskmist, kuid vib leida moodi, mediaani Mustrite ja seoste otsimiseks andmetes jrgneb teises kategoriseerimise etapis kogu andmehulga vi andmete phjal tehtud valimi kodeerimine ehk segmentide sildistamine (vt nide 26). Kui andmed on kodeeritud kategooriatesse, on mustreid kerge nha, kui andmed paigutada graakutesse ja tabelitesse. Statistilised analsid vivad siis meie hpoteese kas kinnitada vi mber lkata.

86

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

lesanne 108.Uuri Postimehe veebivljaandest, milline on Nord Streami gaasijuhtme kuvand Eesti meedias ja loo kategooriate ssteem ajaleheartiklite kategoriseerimiseks. Selleks: leia Postimehe arhiivist Nord Streami uuringuid puudutavad artiklid lisa artiklile jrjehoidja Deliciousi programmis. Mrksnasta artikkel klassi poolt kokku lepitud hise mrksnaga. NB! kontrolli eelnevalt klassi hise mrksnaga Deliciousis otsides, et sama artiklit pole keegi klassikaaslastest juba valinud loe oma valitud artikkel lbi ja leia, milliseid positiivseid ja negatiivseid aspekte see Nord Streami kohta sisaldab lisa artiklile oma mrksnad, mis iseloomustavad positiivseid vi negatiivseid aspekte. 109.Jrgnevalt analsige hiselt, milliseid positiivseid ja negatiivseid aspekte artiklites leidus. Selleks tutvustab iga pilane oma artiklist leitud positiivseid ja negatiivseid aspekte klassikaaslastele. Klassikaaslased vivad teha soovitusi, kuhu nimetatud aspekt paigutada. Seelbi kehtestatakse leitud kategooriate paigutus. petaja loob samaaegselt arutelu phjal tahvlile vi arvutis ekraanile kuvades skeemi, kus uued (varem nimetamata) kategooriad paigutatakse kas positiivse/ negatiivse (vi mlema) alla. Selle tegevuse lpuks moodustub tahvlil (ekraanil) positiivsete ja negatiivsete aspektide kogum. 110.Moodustage nelja-viieliikmelised rhmad. Rhma eesmrk on luua klassi arutelul valminud skeemi alusel kategooriate tabel (vt tabel 17). T sooritamiseks kasutage Google Spreadsheeti keskkonda. T tulemust jagage klassi blogis. Iga rhm snastab klassi blogi kommentaarides he uurimisksimuse, mida viks loodud kategooriate ssteemiga edasi uurida.

87

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

5. Uurimistulemuste esitlemine
Kesolevas peatkis keskendume jrgmistele ksimustele: Kuidas uurimisaruannet korrektselt vormistada? Kuidas kasutada uurimisaruande vormistamisel mistlikult jooniseid, tabeleid ja diagramme? Milliseid vimalusi pakuvad uurimsiaruande vormistamisel siseviited, pealdised ja indeks? Kuidas esitleda ja kaitsta oma uurimist tulemusi?

5.1. Uurimisaruande vormistamine Uuringu tulemused esitatakse uurimisaruande ehk uurimist kujul, mis sisaldab ldjuhul jrgmisi osi: Sissejuhatus: phjendatakse uurimisteema valikut; snastatakse uurimisprobleem, eesmrgid, uurimisksimused vi hpoteesid, lesanded; kirjeldatakse t lesehitust; Teoreetiline osa: esitatakse erialase ja/vi teaduskirjanduse anals uurimisprobleemiga seonduvate teemade kohta Meetodid: phjendatakse uurimismeetodite valikut, kirjeldatakse andmete kogumise ja analsi meetodeid, valimit, kasutatud vahendeid (nt. ksimustikku vi mtevahendeid) Uurimistulemused: kirjeldatakse ja analsitakse uuringu kigus kogutud andmeid Arutlus: eelnevas peatkis esitatud uurimistulemuste analsi ja eelpool toodud erialakirjanduse analsi phjal arutletakse vimalike jrelduste le, esitatakse erinevaid seletused ja neid toetavad argumendid, lkatakse krvale mittesobivad seletused, jutakse lplike jreldusteni ja esitatakse argumendid nende jrelduste kaitseks Kokkuvte: korratakse lhidalt le uuringu eesmrgid, kirjeldatakse uurimisprotsessi ja meetodeid, esitatakse phitulemused ja jreldused ning lisatakse soovitused edasiste uuringute korraldamiseks. Kasutatud kirjandus: ts kasutatud allikate loetelu, mis on vormistatud vastavalt juhisele. Lisad: ts kasutatud ksimustik, dokumendid, tarkvarakoodi nited, fotod vms materjal, mis on liiga mahukad uurimist peatkkide sisse paiguatmiseks. Annotatsioon: lhike (1 lk) kokkuvte uurimist kohta, mis sisaldab olulisemaid andmeid kataloogi vi andmebaasi sisestamiseks. Eelneva loetelu phjal vib elda, et tavaliselt on uurimisaruandes 6 10 peatkki. ldjuhul pole sissejuhatusel ja kokkuvttel alampeatkke, nagu seda on teistel
88

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

peatkkidel. Peatkkide liigendus vib minna kuni 3-astmeliseks, nagu nha alltoodud joonisel 23.

Joonis 23. Uurimist liigendus alampeatkkideks. Uurimist vormistamiseks on mitmeid erinevaid formaate, mis erinevad ksteisest nii mahu, lesehituse kui ksitluse stiili poolest. Tabel 17 allpool vrdleb olulisemaid uurimisaruande formaate mahu, kite ja stiili osas. Gmnaasiumi uurimist maht vib kikuda 15 ja 30 leheklje vahel, sltuvalt valdkonnast. Tihtilugu on tppisteaduste ja tehnika valdkondades viksema leheklgede arvuga uurimistd, samas humanitaarteaduste puhul (nt. ajalugu, kirjandus, losooa) vib ka gmnaasiumi uurimist maht tihti letada 50 lk. Maht Kide (keskm.) 15-30 lk ksnes digitaalne vi kiirkitja vahel 25-50 lk Liim-, spiraal- vi kammkide 100-200 lk Raamat Ksitluse stiil Nide

Gmnaasiumi uurimist Diplomit Doktorit

Teadusartikkel

10-30 lk

Peatkk teadusajakirjas

Konverentsiteesid 1-2 lk

Populaar3-5 lk teaduslik artikkel

Tekstilik andmebaasis vi veebilehel Artikkel mitteteadus- Mistetav ka likus vljaandes vhikule, pnev

Vitlev, levaatlik, SG 2009 mistetav vhikule levaatlik, Haapsalu rakenduslik Kolled 2007 Kitsas valdkonnas T 2011 svitiminev, vga phjalik Lakooniline, Metagused tpne, 2011 argumenteeriv, kitsalt erialane ksnes olulisim ESAK 2007 vlja toodud Sirp 2004

Tabel 17. Uurimistde formaatide vrdlus. Nuded gmnaasiumi uurimist (uurimisaruande) vormistusele kehtestab iga kool ise, ldjuhul leiab need nuded kooli kodulehelt. Toome siinkohal ra ksnes olulisemad nuded, mis sisalduvad ldjuhul iga kooli uurimist vormistamise juhendis:

89

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Uurimist vormindamisel tuleb kasutada lbivalt sama fonti ja reavahet, erandiks vivad olla vaid spetsiaalselt teise fondiga esiletstetavad ligud (nt. pikemad otselaenud teisest allikast), peatkkide pealkirjades ja joonistel olev tekst Peatkkide pealkirjad peavad olema vormindatud korrektset pealkirja-laadi kasutades, sest see vimaldab automaatselt sisukorda luua Uurimistl peab olema automaatselt loodud sisukord Uurimist pisesse vi jalusesse peab olema lehekljenumbri vli, mis nummerdab lehekljed automaatselt Viited tuleb lbi terve t vormindada htses stiilis. Loomulikult tuleb uurimist vormindusele viimast lihvi andes kontrollida, et tekstis ei esineks igekirjavigu (kogu tekst tuleks spelleriga le kia), tekstis ei esineks tpilisi vormindusvigu: mitu thikut jrjest, thik kirjavahemrgi ees, thiku puudumine kirjavahemrgi jrel, reavahetus rea lpus (tohib olla vaid ligu lpus)

lesanded 111.Ava fail uurimistoo_naide1.doc ja vorminda selle pealkirjad oma kooli uurimist juhendile vastavalt, kasutades korrektseid pealkirja-laade. Lpuks lisa uurimist teisele lehekljele automaatselt genereeritav sisukord. 112.Lisa eelmises lesandes vormindatud uurimistle pis ja jalus (alates teisest lehekljest). Pisesse lisa enda nimi ja t pealkiri, jalusesse lisa keskele automaatne lehekljenumber. 113.Kujunda AKU-template.dot phjal enda uurimist jaoks dokumendimall ja vorminda lesandes 1 tdeldud uurimist mber seda dokumendimalli kasutades.

5.2. Tabelid, diagrammid ja joonised Tabelid ja joonised (s.h. diagrammid, skeemid, pildid) teevad ige kasutamise puhul uurimist kergemini loetavaks ja arusaadavaks. Kui lihtsama tabeli vi skeemina teostatud joonise saab tekitada otse tekstittlusprogrammi (MS Word, LibreOfce Write) sees leiduvaid triistu kasutades, siis diagrammid ja pildid tuleb ldjuhul mne teise tarkvaralahenduse abil eelnevalt valmis teha ning alles seejrel tekstidokumenti importida. Tabelid varustatakse pealkirjadega (vt tabel 17 eelmises peatkis) ja joonised allkirjadega (vt joonis 23 eelmises peatkis), mis vormindatakse soovitavalt spetsiaalset tabeli- vi joonise laadi kasutades. Tabeli pis ja vajadusel ka esimene veerg on soovitatav kujundada erinevalt lejnud tabelist: niteks vib pise-rea tausta muuta halliks vi fondi rasvaseks.
90

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

lesanded 114.Lisa eelmisel tunnil vormindatud uurimistsse tabel, vttes andmed ja kujunduse failist Ylekaalulisus_jupp.pdf. Tabel paiguta tekstis igesse kohta, prast liku Jrgnevalt vaatleme erineva vanuseastmega inimeste liikumisvajadusi tabeli abil (Rakvere linna terviseliikumise strateegia, 2007):. Vorminda korrektselt tabeli pealkiri koos allikaviitega. 115.Lisa eelmises lesandes kasutatud uurimist tekstidokumenti sobivasse kohta foto lekaalulisest koolinoorest. Leia sobiv foto Flickr.com fotolaost, otsides ksnes Creative Commons litsentsiga varustatud fotode seast. Paiguta foto teksti sisse sellisel moel, et tekst jookseks tihedalt vasakult ja alt mber foto (analoogselt Aristotelese bsti fotoga Joonisel 1 kesolevas pikus). 116.Lisa eelmises lesandes kasutatud uurimist teksti ka kolm diagrammi, mille koostad ise failis ylekaalulisus.xls leiduva andmestiku baasil. Diagrammid peavad olema kujundatud sarnaselt joonistega 3, 4 ja 5 failis ylekaalulisus_jupp.pdf

5.3. Siseviited, pealdis, indeks. Uurimistd ei kirjutata tavaliselt valmis he jutiga algusest lpuni. Pigem tuleb pidevalt juba olemasolevat teksti vastavalt juhendaja mrkustele tiendada ning uusi tekstilike, jooniseid ja allikaviiteid juba olemasoleva teksti sisse lisada. Uue joonise lisamine muudab kigi olemasolevate jooniste numeratsiooni ja neile joonistele osutavad viited tekstis, pikema tekstiligu lisamine muudab valeks hest peatkist teise osutavad siseviite lehekljenumbri. Selleks, et jooniste numeratsiooni, siseviiteid (nt vaata tabel 17: Uurimistde formaatide vrdlus) ja ka joonealuste viidete jrjekorranumbrite muutudes ei peaks hakkama kike ksitsi mber tegema, tuleb algusest peale kasutada nende puhul pealdist (ing.: caption) ja dnaamilisi siseviiteid (ing.: cross-reference). Joonealuseid viiteid kasutatakse ldjuhul veebiaadressile viitamiseks vi lhikommentaari lisamiseks. Dnaamilisi siseviited saab lisada lihtsalt: joonealune viide: Insert > Footnote viide tabelile vi joonisele: loo tabeli pealkirja vi joonise allkirja ette caption, seejrel saad luua tekstis sobivasse kohta siseviide (Insert > Cross-reference) viide peatki pealkirjale vi muule olemasolevale mrgendile: Insert > Crossreference.

91

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

Pealdistest saab koostada ka eraldi indeksi (Insert > Index and tables), niteks vajadusel lisada t algusesse eraldi nimekiri kigist joonistest, kuid gmnaasiumi uurimists seda ldjuhul ei tehta.

lesanded 117.Vorminda eelmise peatki lesannetes 1 loodud tabeli pealkiri ja lesandes 3 loodud jooniste allkirjad captioni abil ning muuda neile viitavad siseviited tekstis dnaamiliseks. 118.Lisa eelmises peatkis l. 2 paigutatud foto allkirjale ka allikaviide foto veebiaadressi ja autori nimega Flickris joonealusena. 119.Lisa allikaviited ja viitekirjed

5.4. Uurimistulemuste ettekandmine Traditsiooniliselt lpeb uurimist protsess avaliku ettekande ja kaitsmisprotseduuriga. Gmnaasiumi uurimist kaitsmisprotseduur jrgib ldjuhul hte alljrgnevatest stsenaariumidest: avalik kaitsekne, mis toimub magistrit kaitsmise eeskujul ja sisaldab slaidiesitlust, poster- ehk stendiettekanne, mille puhul paljud pilased samaaegselt oma postrit stendil demonstreerivad, ise selle krval seistes ja vajadusel komisjoni ksimustele vastates. Esimese stsenaariumi puhul tuleks uurimist autoril valmistada ette lhike ja informatiivne slaididesitlus (nt. PowerPoint, LibreOfce Impress vi Google Docs abil). Tavaliselt sisaldab kaitsekne esitlus 5-8 slaidi: tiitelslaid, t eesmrgid ja uurimisprobleem, 1-2 slaidi teoreetiliste lhtekohtadega, uurimismeetodite kirjeldus, 2-3 slaidi uurimistulemustega, diskussioon, jreldused ja kokkuvte. Slaidiesitlusse ei tohiks kopeerida pikki tekstilike uurimistst, pigem tuleks vljenduda lhidalt: mrksnade, loetelude ja skeemide abil. Teise stsenaariumi puhul tuleb uurimist autoril valmistada ette poster: A1 vi A0 mdus plakat, mis annab skemaatilise levaate uurimist eesmrgipstituset, uurimisprotessist ja olulisematest tulemustest. Postri puhul tuleks vltida vikest fonti (alla 40 punkti) ning ritada teksti asemel kasutada visuaalset keelt (skeemid, graalised mudelid, diagrammid).

92

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

lesanded 120.Arutage paaris, millised puudused on etteantud slaidiesitlusel ja postril? 121.Koosta peatki 8.1 lesandes 1 vormindatud uurimuse phjal kaitsekne slaidiesitlus, milles on vhemalt 6 slaidi. Esitlus peab sisaldama diagramme, tabeleid, pilte, loetelusid ning andma nende kaudu edasi uurimist kige olulisemad aspektid. 122.Koosta peatki 8.1 lesandes 1 vormindatud uurimuse phjal A1 suurusega poster. Juhtnrid leiad LeMill.net portaalist (http://lemill.net/lemill-server/methods/ posterettekanne) ja otsi ise Google abil nidiseid eeskujuks (nt. http:// betterposters.blogspot.com/2009_04_01_archive.html).

93

AKU: Arvuti kasutamine uurimists. Informaatika valikaine e-pik gmnaasiumile

See pik on avaldatud Creative Commons Autorile viitamine + Mitteriline eesmrk + Jagamine samadel tingimustel v. 3.0 Eesti litsentsi alusel. pikus kasutatud fotod (Creative Commons litsentsi alusel): Kaanepilt http://www.ickr.com/photos/mrpetersononline/1478041510/ Francis Bacon: http://www.ickr.com/photos/oxfordshire_church_photos/3258743416/

94

Vous aimerez peut-être aussi