Tällä kurssilla pääsin taas kivojen aiheiden pariin.
Ensimmäisellä opetusviikolla kerrattiin joitain olennaisia asioita tilastollisista menetelmistä, mikä osoittautui tarpeelliseksi. Vaikka asiat eivät olleet minulle sinänsä uusia, törmäsin yksityiskohtien kautta moneen asiaan, jota en ole tullut aiemmin miettineeksi tai edes ymmärtäneeksi.
Toisella opetusviikolla pääsin tutustumaan aiheeseen, joka oli minulle juuri sitä, minkä vuoksi tulin tälle kurssille. Faktorianalyysi on kiinnostanut minua jo pitkään, mutta en ole “ehtinyt” perehtyä siihen itsenäisesti. Menetelmä soveltuu esimerkiksi mittarien rakentamiseen ja niiden toimivuuden testaamiseen. Aihe kiehtoi minua, ja pohdiskelin sitä syvällisesti monelta eri kannalta.
Kolmannella opetusviikolla aiheena oli lineaarinen regressioanalyysi, mutta pohdiskelin enemmän demotehtävien dokumentointia. Vaikka läpikäydyissä asioissa on paljon tuttua eivätkä ne sinänsä ole vaikeita ymmärtää, demokysymyksiä joutuu silti miettimään, koska asioiden yhdistely ei onnistu ihan automaattisesti. Dokumentointi tukee tähän harjaantumista, vaikka viekin paljon aikaa. Koen sen kuitenkin tukevan oppimistani paljon. On tärkeää tehdä itse asioita ja pistää samalla muistiin, miten minkäkin asian teki. Tarkoitan tällä tulosteiden ja kuvioiden kopioimista kuvina SPSS-ohjelmasta demotehtävädokumenttiin. Asiat eivät jää kerralla mieleen, ja myöhemmin on helpompi palauttaa mieleen, mitä tehtävässä teki ja miksi, kun voi katsoa omien vastausten perusteita niiden viereen tallennetuista kuvista.
Neljännellä opetusviikolla perehdyimme monimuuttujaiseen varianssianalyysiin eli MANOVAAN. Huomasin luennolla, etten oikeastaan ymmärrä kunnolla, miksi johonkin analyysimenetelmään liittyy tietynlainen jakauma. Normaalijakauman olen oppinut yhdistämään luonnollisesti muodostuvien populaatioiden ominaisuuksiin, joissa evoluutio tms. luonnollinen mekanismi kasaannuttaa ominaisuuksien arvot niiden keskiarvon paikkeille. Sen sijaan esimerkiksi F-jakaumaa en ilmiönä ole ymmärtänyt. Nyt asiaa pohdittuani yhdistän sen luonnollisesti muodostuneiden jakaumien keskiarvojen ”populaatioihin”. Varmaankin on todennäköistä, että poikkeamat keskiarvosta ovat näissä enimmäkseen varsin pieniä, jolloin on luonnollista, että F-jakaumassa pienet arvot ovat painottuneita.
Ilmiön ymmärtämisen merkitys nousi esiin myös demoissa. Kun tehtävää tekee vain vaiheesta toiseen etenevänä prosessina, ilmiön puutteellinen ymmärtäminen näkyy kompasteluna. Sitä vain törmää seinään, eikä osaa ryhtyä ajattelemaan asiaa syvällisemmin. Tässä näkyy se, ettei kunnollista oppimista tapahdu vain harjoittelemalla analyysin teknistä toteuttamista. Luulen, että tämä on merkittävässä roolissa siinä, miksi monet opiskelijat kokevat tilastomenetelmien opiskelun hankalaksi. Todellisuudessa jatkuva ”pään iskeminen seinään” lienee vain merkki siitä, ettei ole ymmärtänyt kohteena olevaa ilmiötä kunnolla.
Viidennellä opetusviikolla käsittelimme toistomittausten varianssianalyysia, jossa minua erityisesti pohditutti päävaikutuksen ja yhdysvaikutuksen välinen käsitteellinen ero. Luennolla ne käytiin läpi esimerkkien avulla, mutta halusin etsiä netistä tarkempaa sanallista selitystä. Vieläpä niin, että eräälle olennaisesti saman kysymyksen esittäjälle annettiin aika ilkeääkin ryöpytystä siitä, ettei tämä ollut ”viitsinyt selvittää peruskäsitteitä itselleen”. Esitettyyn kysymykseen olisi asiaa tunteva voinut vastata varsin lyhyesti ja ytimekkäästi, mutta kysymyksen saama reaktio sai miettimään, osaavatko menetelmäosaajatkaan aina ilmaista sanallisesti omia itsestään selviä peruskäsitteitään.
Mutta millainen kuva minulle muodostui näistä käsitteistä? Päävaikutus tarkoittaa ilmeisestikin tietyn tekijän A omavaikutusta ilmiöön X eli siinä katsotaan, minkä osuuden kokonaisvaikutuksesta tekijä A selittää muista tarkasteltavista tekijöistä riippumattomasti. Esimerkiksi jos ajalla on päävaikutusta, se tarkoittaa, että mittauskertojen välillä on tapahtunut tilastollisesti merkitsevää muutosta, ja jos ryhmällä on päävaikutusta, ryhmien mitatut tasot eroavat toisistaan tilastollisesti merkitsevästi. Jos tekijä A kuitenkin korreloi voimakkaasti toisen tekijän B kanssa, tekijän A omavaikutus ja tekijän B omavaikutus eivät erillisinä kerro riittävästi siitä, millainen vaikutus näillä tekijöillä on ilmiöön X. Tällöin on välttämätöntä tutkia tekijöiden A ja B välistä yhdysvaikutusta. Yhdysvaikutus siis ilmeisestikin tarkoittaa tekijöiden A ja B multikollineaarisuuden vaikutusta ilmiöön X. Esimerkiksi jos vain yhdessä ryhmässä on tapahtunut mittauskertojen välillä muutosta, aika ja ryhmä eivät erillisinä riitä selittämään muutosta, vaan on selvitettävä, millainen vaikutus ajan ja ryhmän korreloinnilla on muutokseen.
Luennoilla rupesin pohtimaan sitä, millainen oppimisstrategia olisi tehokkain tilastomenetelmien opiskeluun. Siis itselleni tai kaltaisilleni oppijoille. Tilastotieteessä näyttää olevan iso ero teoreettisen tiedon ja käytännöllisen osaamisen välillä: teoreettinen edellyttää (ainakin alkuun) hankalilta tuntuvien vieraiden käsitteiden ja mallien omaksumista, kun taas käytäntö on pitkälti hiljaista oppimista esimerkkien avulla. Näillä ei ole suoraa yhtymäpintaa, vaan oppiminen tapahtuu perinteisesti eräänlaisena tiedollisena ”kuroutumisena” käytännöstä kohti teoreettista. Tämä tarkoittaa, että tarkastelun kohteena oleva ilmiö ymmärretään käytännöstä käsin. Aavistan kuitenkin, että teoreettista voisi kuroa kohti käytäntöä hyvinkin tehokkaasti tilastomenetelmien opetuksessa, mutta hiljaisen tiedon suuri osuus osaamisessa hankaloittaa sitä.
Viimeisellä opetusviikolla ei ollut luentoja, mutta kävimme demoissa läpi analyysimenetelmien raportointia. Mitään ihmeellisiä ahaa-elämyksiä en tällä kertaa saanut.
Palautteena oppimispäiväkirjaani sain ehdotuksen, että voisin kiinnostukseni vuoksi osallistua tilastotieteen kursseille, joissa voisin tarkemmin perehtyä käsitteiden ja analyysimenetelmien taustalla oleviin matemaattisiin ilmiöihin ja ajatteluun. Se kyllä kiinnostaisi, joten katsotaan…