Tekoälyn peruskurssi kasvattaa mediakriittisiä kansalaisia

”Välillä huomaa, ettei toimittajalla ole ymmärrystä tekoälyteemasta”, kommentoi kotimaisia uutisjuttuja Reaktorin Ville Valtonen.

Tekoälyn perusteet -kurssin voi suorittaa ilmaiseksi etänä. Kurssi antaa hyvät pohjatiedot tekoälystä käytäviin keskusteluihin.

Vastasit oikein.

Kyllä! Oikea vastaus on 40:95. Ratkaisin juuri Bayesin kaavaa ja uskottavuusosamäärää käyttäen rintasyövän posteriorikertoimen samalla, kun odottelin lastani harrastuksestaan Lepsämän Teboililla.

Suoritan Helsingin yliopiston ja Reaktorin suosittua Tekoälyn perusteet -verkkokurssia aina sopivan tilaisuuden tullen. Hyvä sana on kiirinyt, sillä ilmaiselle kurssille on minun lisäkseni kirjautunut jo noin 150 000 opiskelijaa, joista noin kymmenen prosenttia on suorittanut kurssin loppuun.

Vuoden aikana yli 250 yritystä on vastannut Helsingin yliopiston ja Reaktorin tekoälyhaasteeseen ja sitoutunut kouluttamaan henkilökuntansa tekoälyn perusteisiin joko tällä kurssilla tai muuten. Mukana ovat muun muassa Stora Enso, Nokia, Finnair, Alma Media ja verohallinto.

Median kuluttajan mutta myös toimittajan kannalta kurssista tekee mielenkiintoisen sen mediakriittinen ote, joka ohjaa vaatimaan tekoälyuutisilta enemmän kuin pelkkien stereotypioiden toistelua. Koska suuri osa suomalaisista ymmärtää kurssin käytyään, ettei Skynet ole aktivoitumassa eikä Terminator odottele oven takana, pitää toimittajienkin pystyä parempaan.

Kiinalaisia huoneita ja naiiveja luokittimia

Edellä mainitulla Bayesin kaavalla punnitaan ristiriitaista informaatiota lääketieteessä, oikeussalissa ja monilla muilla tieteenaloilla. Yksi hyödyllisimmistä Bayesin kaavan tekoälysovelluksista on niin sanottu naiivi Bayesin luokitin, jota käytetään muun muassa sähköpostin roskapostisuodattimissa.

Saattaa kuulostaa monimutkaiselta, mutta onkin yllättävän helppoa. Hämmästytin itseänikin ratkaisemalla Bayes-tehtävän oikein.

Kurssi antaa hyvät yleistiedot tekoälyyn liittyvistä peruskäsitteistä, kuten koneoppimisesta, syväoppimisesta, datatieteestä ja neuroverkoista. Lisäksi tutustutaan muun muassa kiinalaisen huoneen argumenttiin, Turingin testiin, lähimmän naapurin luokittimeen, regressioon ja konvoluutioneuroverkkoihin. Tehtävät eivät ole ylivoimaisen vaikeita, vaikka lukion matematiikan tunneista olisi vierähtänyt jo jonkin aikaa. Laskutaitoja enemmän vaaditaan loogista päättelykykyä.

Eräs tuttavani kommentoi Facebookissa, että hän suoritti helpon kurssin yhdessä illassa.

Enpä usko.

Tai ehkä se onnistuu, jos on nero tai harppoo tehtävien ja lisätietoa tuovien taustatekstien yli. Ajatuksen kanssa kurssin suorittamiseen menee normi-ihmiseltä 15–20 tuntia.

Ensimmäinen tekoälykurssi maallikoille

Alun perin Tekoälyn perusteet oli normaali yliopistokurssi, jota oli vuosia koekäytetty tietojenkäsittelytieteen opiskelijoilla. Kun kurssi päätettiin viedä verkkoon, tehtiin kilpailijakartoitusta tekoälykursseista.

”Kaikki kurssit oli tehty henkilöille, jotka osaavat koodata ja ovat it-alalla. Tämän kurssin kohderyhmä vaihtui maallikoiksi, jolloin yli puolet kurssista piti kirjoittaa uudestaan”, kertoo Reaktorin viestintä- ja markkinointijohtaja Ville Valtonen.

Valtosen mukaan kurssin toteutuksessa on ollut mukana yli kymmenen henkilöä. Yliopistolta on ollut teknisiä henkilöitä ja kurssin vastuuopettaja, apulaisprofessori Teemu Roos. Reaktor on työllistänyt projektissa datatieteilijöitä, käyttöliittymäsuunnittelijoita ja projektipäälliköitä.

Reaktor tuli yrityksenä mukaan kuvioon puolitoista vuotta sitten, kun Helsingin yliopisto oli jo päättänyt, että kurssi viedään verkkoon. Valtosen mukaan kurssi ei ole saanut julkista rahoitusta.

”Tämä lähti liikkeelle markkinointiprojektina. Me olemme maksaneet oman työmme ja yliopisto omat kulunsa. Nyt olemme myymässä kurssia ulkomaille, ja näyttää lupaavasti siltä, että saisimme kulut katettua.”

Vain Pohjois-Koreassa ei olla kuultu suomalaisten kurssista

Elements of AI -kurssi tehtiin ensin englanniksi ja puoli vuotta myöhemmin suomeksi. Tänä keväänä julkaistiin ruotsinkielinen versio ja tekoälyhaastekampanja Ruotsissa. Muidenkin maiden kanssa neuvotellaan.

”Kurssin osallistujista vajaa puolet on nyt Suomesta. Läpipäässeitä opiskelijoita on yli 110 maasta. Sivustolla on käyty kaikista maista Pohjois-Koreaa lukuun ottamatta”, Ville Valtonen luettelee.

Suosio tuli kuitenkin yllätyksenä, vaikka tekoäly on esiintynyt julkisissa puheissa jo pitkään. Valtosen mukaan kurssin ajoituksessa oli tuuriakin, sillä pääministeri Juha Sipilä piti samoihin aikoihin puheen, jossa hän halusi Suomen kouluttavan kymmenen vuoden kuluessa miljoona tekoälyä ymmärtävää henkilöä.

”Suomi on edelläkävijä tekoälyssä. Meillä mietitään valtiotasolla, miten tekoälyä pitäisi hyödyntää, ja muut Euroopan maat ottavat mallia Suomesta”, Valtonen sanoo.

Kurssilla selviää, mihin tekoälyn koneoppiminen perustuu ja mitä kone ei voi oppia.

Myös tänä keväänä ilmestynyt toimittaja Timo Siukosen ja tietotekniikan professori Pekka Neittaanmäen tietokirja Mitä tulisi tietää tekoälystä (Docendo) ratsastaa tekoälytrendin harjalla. Yleistajuisesti kirjoitettu kirja mainitsee Tekoälyn perusteet -kurssin osana tekoälyverkkokurssien jatkumoa.

Esimerkiksi vuonna 2011 Stanfordin yliopiston professorit järjestivät ilmaisen tekoälyn johdantokurssin verkossa. Kurssille ilmoittautui 160 000 henkilöä liki 200 maasta, ja se kesti kymmenen viikkoa. Tämä oli huikea saavutus, mutta Siukosen ja Neittaanmäen mukaan kriittinen tiedeyhteisö kuitenkin kysyi, ”sortuuko yliopistojen arvovalta ja pääsevätkö monialayhtiöt ohjaamaan, globalisoimaan ja tasa-arvoistamaan akateemista koulutusta”.

Toimittajat tarvitsevat koulutusta tekoälyssä

”Välillä huomaa, ettei toimittajalla ole ymmärrystä tekoälyteemasta. Hän ottaa aiheen ilman kritiikkiä jostain ulkomaisesta mediasta ja laittaa lehteensä. Se on aika vastuutonta”, pohtii Ville Valtonen kotimaista tekoälyuutisointia.

Yhtenä esimerkkinä liioittelusta Valtonen mainitsee revittelyn ”tekoälyllä, joka vie meidän työpaikkamme”. Kurssimateriaalissa esiin nousevat tekoälyyn liittyvät epärealistiset tulevaisuudennäkymät ja uhkakuvat, joita media lietsoo. ”Se, että superälykäs, itsestään tietoinen tekoäly syntyisi vahingossa uusien menetelmien kehityksen tuloksena, on naiivi ajatus”, tekijät toteavat.

Kurssilla kiinnitetään huomiota myös tekoälyn määrittelyn epämääräisyyteen mediassa. Kurssin käynyt tietää, että mikä tahansa datan käsittely ei edellytä tekoälyä. Oikeata tekoälyä on esimerkiksi itseohjautuvissa autoissa, uutisten suosittelujärjestelmissä ja kasvojentunnistuksessa.

Jos tarkkoja ollaan, tekoälystä ei pitäisi puhua laskettavana substantiivina, koska tekoäly on tieteenala, kuten vaikkapa matematiikka tai biologia. Esimerkiksi otsikko ”Puettavien laitteiden data auttoi opettamaan tekoälyn, joka tunnistaa diabeteksen merkkejä” on epätarkasti ilmaistu. Kurssin tekijöiden mukaan kauhistuttavinta olisi otsikoida ”Googlen tekoäly rakensi tekoälyn, joka päihittää ihmisten tekemät tekoälyt”.

Soutuvenetehtävässä etsitään optimaalisinta reittiä, jolla jyväpussi, kana ja kettu saadaan vastarannalle toisiaan syömättä. Samantyyppistä päättelyä kone käyttää reittioppaissa.

Kurssin tekijät muistuttavat tekoälyn etenevän muiden tieteenalojen tavoin aaltoliikkeenä, johon kuuluvat läpimurroista syntyvät ”intoilusyklit”. Optimismi lisää tutkimuspanostuksia ja tekoälytutkimuksen rahoituksen piiriin pyrkiviä tutkijoita ja yrityksiä.

Myös yleisön innostus tekoälyä kohtaan saattaa olla rajallista. Eräs tuttu toimittaja suuresta lehdestä kertoi, että heidän havaintojensa mukaan tekoäly on yksi niistä sanoista, jotka ovat omiaan karkottamaan lukijoita. Tekoäly ei jostain syystä kerää klikkauksia kyseisen toimittajan yleismediassa.

Tekoälyintoilua oli neuroverkkojen kanssa jo 1950–60-luvuilla ja logiikkapohjaisiin asiantuntijajärjestelmiin liittyen 1980-luvulla. Nämä hypet loppuivat kuitenkin nolosti. Läpimurtoja ei saavutettu ja tutkimusrahoitus tyrehtyi – seurasi niin sanottu tekoälytalvi.

Seuraava tekoälytalvi saattaa olla täällä ennemmin kuin huomaammekaan.

Jatkokursseja on luvassa

Tekoälykurssin kuuden pääluvun läpisinnittely ei ole vallan mahdoton urakka, mutta vaatii 25 monivalintatehtävän ja sanallisten tehtävien suorittamista. Osa kysymyksistä ei ratkea ilman perinteistä kynää ja paperia. Sanallisia vastauksia arvostelevat hymynaamoin nimettömät vertaisarvioijat eli muut satunnaisesti valitut kurssilaiset.

Loppupuolella kurssia huomaan osan porukasta jo väsähtäneen. Saan nimittäin eteeni arvosteltavaksi sanallisia kurssivastauksia, joissa vastauksena on pelkkä viiva tai kommentti ”En todellakaan jaksa vastata sanallisiin tehtäviin”.

Mutta voi sitä onnenpäivää, kun saan kurssin viimein loppuun ja todistukseksi oikein virallisen sertifikaatin! Olen saanut oikein 79 prosenttia vastauksista, ja vanha hikipinko sisälläni harmittelee keskittymiskykyni herpaantumista muutaman tehtävän kohdalla.

Sanallisia vastauksia arvioivat hymynaama-asteikolla muut kurssilaiset anonyymisti.

Tekoälyn perusteet -kurssista saa kaksi opintopistettä Helsingin yliopiston tai avoimen yliopiston opiskelijana. Kieltämättä kiinnostun myös jatko-opintojen mahdollisuudesta.

Reaktorin Ville Valtosen mukaan suunnitteilla on kaksi erilaista verkkojatkokurssia, joista toinen menee syvemmälle tekoälyn koodaukseen ja toinen keskittyy tekoälyn etiikkaan.

Myös Helsingin yliopiston ensimmäisen vuoden tietojenkäsittelytieteen opinnot ovat avoinna kaikille.

Jutun kuvituksena on käytetty kuvakaappauksia kurssin materiaalista.

Kriittisyyttä myyntipuheisiin

Jos tutkijat eivät onnistu toistamaan toistensa kokeita, tutkimustulosten luotettavuus osoittautuu kyseenalaiseksi. Juuri niin viime vuosina on käynyt.
Mitä tieteen toistettavuuskysymykset tarkoittavat tiedeviestinnälle? Kysyimme neuvoa vaikean keskustelun keskeiseltä nimeltä, professori Hal Pashlerilta.

”Tämä on yksinkertaisesti pelottavaa”, sosiaalisen neurotieteen professori Michael Inzlicht Toronton yliopistosta kirjoitti blogissaan 2016, kun oli osoittautunut, että merkittävää joukkoa julkaistuista psykologisista tutkimustuloksista ei pystytty toistamaan.

”Saattaa olla, että jopa rehelliset ja kaikkein suoraselkäisimmätkin tutkijat tekevät virheellisiä johtopäätöksiä hälyttävään tahtiin. Ongelma ei ole pieni eikä tule ratkeamaan pienellä hienosäädöllä. Ongelma koskee koko järjestelmää ja tutkimuskäytäntöjemme ydintä”, Inzlicht kirjoitti.

Miten tiedetoimittajan tulisi suhtautua toistettavuuskysymyksiin, jotka saavat alan professoritkin tolaltaan?

Psykologian professori Hal Pashlerin mielestä tiedetoimittajilla olisi opittavaa omilta kollegoiltaan – muiden alojen ammattijournalisteilta.

”Jos tiedetoimittaja kuvittelee tekevänsä olennaisesti toisenlaista työtä kuin muut journalistit, hän tulee johdetuksi harhaan”, Pashler sanoo.

”Keskeistä on, että toimittajalla tulisi olla kauttaaltaan kyyninen suhde kaikkiin väitteisiin ja tiivistelmiin, joita akateemiset tutkijat esittävät työstään. Eikä tämä kovin erikoinen lähtökohta journalismille ole. Näinhän minkä tahansa pikkukaupungin lehden toimitus suhtautuu soittaessaan kunnallispoliitikolle.”

Neuvo saattaa yllättää tiedetoimittajan. Moni on ehkä ajatellut, että kun yliopistolta tulee lehdistötiedote julkaistusta tutkimuksesta, tulokset ovat lähtökohtaisesti luotettavia.

”Vieläkin? Oikeasti?” Pashlerin ääni kohoaa epäuskosta. Hetken mietittyään hän sanoo:
”No, onhan se tietysti kätevämpi lähtökohta. Ajattelenko tiedetoimittajana, että työssäni kaikki on tehty minulle jo etukäteen valmiiksi. Vai ajattelenko, että minulla todella haastava työ, joka vasta alkaa lehdistötiedotteesta. Toimittajat ehkä myös olettavat, että vertaisarviointi toimii.”

Toimittajan rooli on Pashlerin mielestä olennainen tieteen yleisen luottamuksen kannalta. Pashleria huolestuttaa se, että samalla kun toimittajat ovat suhtautuneet tutkimustuloksiin liian sinisilmäisesti, suuri yleisö on muuttunut jatkuvasti yhä skeptisemmäksi.

”Ehkä he ovat pian jo siinä pisteessä etteivät usko enää mihinkään. Kun ihmisille kertoo toistuvasti riittävän monesta ristiriitaisesta tuloksesta, heitä lakkaa kiinnostamasta.”

Tutkija ei vähättele työtään – toisin kuin toimittaja kuvittelee

Mitä tiedetoimittaja voisi siis tehdä luotettavan journalismin eteen haastavassa tilanteessa?

Ensinnäkin korjata oletuksiaan, Hal Pashler sanoo. Pashlerin mukaan toistettavuuskriisi tuo näkyviin ongelman, joka tiedetoimittajilla on yleisessä asennoitumisessaan.

”Tiedetoimittajat kuvittelevat, että tutkijat ovat nörttejä, jotka vähättelevät tuloksiaan. Eivät ole. Tutkijat ovat usein enemmänkin myyntimiehiä, jotka siistivät ongelmat tutkimusjulkaisujensa tiivistelmiin ja toivovat, että kukaan ei tule katsoneeksi konepellin alle.”

”Tiedetoimittajan tulisi pitää mielessään, että jokaisella on tiedeyhteisössäkin omat pyrkimyksensä ja oma uransa, joita he yrittävät tekemisillään edistää. On väärä asenne kuvitella, että minä ja nämä suurenmoiset tutkijat emme kuuluisi samaan maailmaan kuin muutkin, jossa me kaikki myymme omaa osaamistamme ja itseämme”, Pashler sanoo.

Pashlerin kollega, aivotutkija Edward Vul kehottaa hänkin tiedetoimittajia kriittisyyteen.

”Yleisesti ottaen harjoittaisin toimittajana hiukan enemmän skeptisyyttä kaikkien tieteellisten tutkimustulosten suhteen”, Vul sanoi Scientific American -lehdelle. Vul ja Pashler herättivät kollegoineen kohun vuonna 2008 analyysillaan, jonka mukaan sosiaalisessa neurotieteessä suuressa joukossa tutkimuksia löydettiin niin korkeita korrelaatioita, että ne eivät yksinkertaisesti voineet olla totta.

”Luulen että toimittajat yleisesti yrittävät kirjoittaa johtopäätöksistä hiukan räväkämmin kuin tutkijat. Toimittajat eivät ehkä huomaa, että tutkijat ovat jo itsekin hiukan suurennelleet tulostensa merkitystä. Kun nämä asiat yhdistetään, voi saada todella yliampuvia juttuja”, Vul sanoi.

”Me tutkijat puhumme myymistämme autoista niin kauniisti kuin osaamme”, Pashler sanoo. ”Toinen tutkija tajuaa vilkaista ainakin vähän myös konepellin alle, mutta toimittaja saattaa kuvitella paitsi että myyntipuheet ovat totta, jopa että niitä on tarpeen entisestään parannella.”

Miten toimittaja siis erottaa hyvän tutkimuksen huonosta?

Asetelma jää toimittajalta ehkä tiedeviestinnässä helpommin huomaamatta, koska tutkija ei edistä uraansa median kautta kuten poliitikot. Tutkija myy tuloksiaan julkaisusarjojen päätoimittajille, rahoittajille ja toisille tutkijoille. Tiedetoimittajan riski on olla hyväuskoinen, tilannetta sivusta seuraava hölmö joka kuvittelee, että myyntipuheet ovat kirjaimellisesti totta – ja joka samalla välittää väärinkäsityksensä suurelle yleisölle, vieläpä paisutellussa muodossa.

”Aivokuvantaminen tuntuu menevän toimittajilta kaikkein helpoiten läpi kaikkien rimojen ali”, Pashler sanoo.

Tilanne on toimittajalle haastava, koska kriittisyyden pitäisi osua kohteeseensa. Toimittaja tuskin voi kuitenkaan penkoa tutkijan aineistoa juttujaan varten tiukemmin kriteerein kuin tieteelliset vertaisarvioijat selvittääkseen johtopäätösten heikot kohdat.

Miten toimittaja siis erottaa hyvän tutkimuksen huonosta?

”Toimittaja on helvetillisessä välikädessä”, Pashler myöntää.

Auttaisiko keskittyä laajempiin kokonaisuuksiin?

Psykologian professori Steven Pinker on ehdottanut, että toimittajien tulisi kirjoittaa vain meta-analyyseista. Meta-analyysit ovat yhteenvetoja, joissa kaikki julkaistut tutkimukset kootaan ensin yhteen ja tehdään päätelmiä koko tutkimuskirjallisuuden perusteella. Kannattaisiko toimittajan kirjoittaa yksittäisten tutkimusten sijaan suurista linjoista?

Pashleria ehdotus ei vakuuta. ”Ongelma on, että julkaisuharhan vuoksi meta-analyysitkaan eivät ole luotettavia.”

Julkaisuharhalla tarkoitetaan nollatulosten jäämistä pimentoon. Tutkimuskirjallisuus vinoutuu, koska merkittävä osa tuloksista jää tutkijoiden pöytälaatikkoon – erityisesti ne, joissa toivottua ilmiötä ei saatu näkyviin. Tieteelliset sarjat ovat usein haluttomia julkaisemaan nollatuloksia, ja tutkijan on vaikea edistää niillä uraansa. Niiden jääminen pöytälaatikkoon hämärtää kuitenkin yhteisön kokonaiskuvaa siitä, mikä on totta.

Meta-analyysit itsessään eivät myöskään pysty korjaamaan viime vuosina keskustelua herättäneitä toistettavuusongelmia. Pashler muistuttaa, että myös yliaistillisesta havaitsemisesta kiinnostuneet tekevät meta-analyyseja, joissa parapsykologisille ilmiöille löydetään tukea.

”En usko että saamme hienoimmillakaan tilastollisilla välineillämme muutettua julkaistua roskaa todeksi”, Pashler sanoo.

Varo ongelmatrioa

Koska ongelmat ovat mutkikkaita myös tutkijoille, yksi apukeino toimittajalle voi olla seurata, kuinka tieteelliset julkaisusarjat suhtautuvat tilanteeseen. Osa tieteellisistä sarjoista on viime vuosina uudistanut käytäntöjään karsiakseen aiempia erehdyksiään.

Psychological Science -lehden päätoimittaja Stephen Lindsay kertoo lehden nykyisin varovan esimerkiksi tutkimuksia, joissa esiintyy ongelmatrioksi kutsuttu yhdistelmä. Tällä tarkoitetaan tutkimuksia, joissa tilastollinen voima on heikko, tulos on yllättävä ja tilastollinen p-arvo on lähellä 0,05:n merkitsevyysrajaa. Nyrkkisääntö ei ole idioottivarma, mutta voi olla parempi kirjoittaa tutkimuksista, joissa tämä kolmikko ei esiinny.

Toimittajan kannattaa ehkä myös kysyä tutkijalta, oliko hänen tutkimuksensa esirekisteröity. Esirekisteröinti on nousemassa keskeiseksi menetelmäksi käytäntöjen parantamisessa. Siinä tutkija tekee hiukan kuten biljardinpelaaja, joka kertoo julkisesti etukäteen, minkä pallon aikoo lyödä ja mihin pussiin sen sijaan, että vain näyttäisi onnistuneen lyönnin jälkikäteen. Sattuman mahdollisuus pienenee, jos kysymykset ja menetelmät on määritelty julkisesti etukäteen.

Toimittajan voi olla hyödyllistä seurata myös tutkijoiden pohdintoja. Toistettavuuskysymyksistä keskustellaan jatkuvasti esimerkiksi Center for Open Science -keskuksen ja aiheesta keskustelua herättäneiden tutkijoiden kuten Uri Simonsohnin, Leif Nelsonin, Joseph Simmonsin ja Andrew Gelmanin blogeissa.

Terveydestä tai lääketieteestä kirjoittavalle rautaisannoksen tervettä skeptisyyttä tarjoaa myös Gary Schwitzerin perustama HealthNewsReview.org -sivusto, joka ehti kolmentoista vuoden aikana arvioida yli kuusituhatta terveysaiheista mediajuttua journalistisin laatukriteerein.

Etsi vahva vastapuoli

Hal Pashlerilla on toimittajalle myös konkreettinen ehdotus, joka on mutkikkaista ongelmista huolimatta varsin klassinen.

”Perinteinen journalistin ohje ei minusta edelleenkään ole huono”, Pashler sanoo. ”Etsi ihminen, joka on eri mieltä ja kysy mitä hän ajattelee.”

Ohje on haastavampi kuin voisi luulla, koska mikä tahansa eriävä näkemys ei tee jutusta hyvää. Vastapuolella tulisi olla painavia ja perusteltuja argumentteja, jotka lukijan todella kannattaa kuulla. Jutun taso riippuu pitkälti osapuolten valinnasta, koska punnittu kokonaiskuva syntyy vasta kiinnostavimpien väitteiden ja perustelluimpien vastaväitteiden summasta.

Kiinnostavien tutkimustulosten ja vahvimpien vasta-argumenttien yhdistelmiä ei välttämättä ole helppo löytää. Mutta siitä jos jostakin olisi lukijoille hyötyä.

Toistettavuuskriisi pähkinänkuoressa – 10 ohjetta toimittajalle

1) Suhtaudu kaikkiin väitteisiin skeptisesti. Julkaistu tutkimus tai merkitsevä p-arvo ei tarkoita, että tulokset ovat totta.
2) Perehdy toistettavuuskeskusteluun. Yritä hahmottaa, millaiset tutkimukset ovat toistuneet ja mitkä eivät.
3) Ymmärrä tiedeyhteisön sisäiset vaikuttimet. Tutkija myy tuloksiaan kilpaillakseen rahoituksesta, työpaikoista ja palkinnoista. Opettele huomaamaan, miten se voi näkyä heidän työssään, vaikka kukaan ei harjoittaisi vilppiä.
4) Muista, että toistettavuusongelmat koskevat esitettyjä väitteitä – eivät tiedettä itseään. Tieteellinen menetelmä ei ole paljastunut ongelmalliseksi, vaan osa käytännöistä, joilla tutkimusta on yritetty tehdä. Luotettavan tutkimuksen tekeminen on haastavaa.
5) Kun käsittelet yksittäistä tutkimusta, selvitä tutkijoiden taloudelliset sidonnaisuudet ja rahoittajien pyrkimykset.
6) Perehdy käytettyihin menetelmiin huolellisesti ja varmista että ymmärrät, millaisiin oletuksiin tulosten tulkinta perustuu. Tulosten luotettavuutta ei erota takapuolituntumalla.
7) Tunne tilastomatematiikan perusteet. Empiirisillä aloilla määrällisten tulosten luotettavuus riippuu osin siitä, missä määrin matemaattiset oletukset kestävät tarkastelun.
8) Jos et ymmärrä tutkimusta ja sen menetelmiä perusteellisesti, pyydä apua sen ruotimiseen tutkimusmenetelmien asiantuntijoilta, jotka johtavat keskustelua tieteellisten käytäntöjen kehittämisestä. Heillä on sisältöasiantuntijoita vähemmän syitä joutua vaistomaisesti puolustuskannalle, jos väitetty ilmiö kyseenalaistetaan.
9) Etsi esitetyille väitteille vahvimmat mahdolliset vasta-argumentit.
10) Muista, että yksikään tutkimustulos ei ole varma, mikään kysymys yksiselitteinen, eikä yksikään tutkimus arvovapaa.

LUE LISÄÄ tieteen toistettavuusongelmasta: Jussi Valtonen: Tiedeyhteisön ankarat kasvukivut

Blogeja:

Center for Open Science
Simonsohn, Nelson & Simmons
Andrew Gelman
Health News Review

Tiedeyhteisön ankarat kasvukivut

Kun yleisistä tutkimuskäytännöistä paljastuu ongelmia, tiedeyhteisö joutuu välillä korjaamaan kurssiaan.
Tuoreimmasta tieteellisestä herätyksestä on kiittäminen yliaistilliseen havaitsemiseen uskovia parapsykologeja. Ja tutkijoita, jotka sinnikkäästi epäonnistuivat kokeissaan, vaikka niin ei saanut tiedeyhteisössä tehdä.
Ja ehkä jopa muutamaa huijaria.

Tällä tarinalla on monta alkua. Yksi niistä on kahdeksan vuoden takaa.

Tammikuun viimeisenä päivänä 2011 sosiaalipsykologit ympäri maailmaa saivat aamukahvinsa väärään kurkkuun, kun alan arvostetuin tieteellinen sarja The Journal of Personality and Social Psychology julkaisi yhdeksän kokeen kokonaisuuden, joka näytti rikkovan fysiikan lakeja. Amerikkalainen sosiaalipsykologi Daryl J. Bem arvostetusta Cornellin yliopistosta näytti ryhmineen todistaneen, että tulevat tapahtumat olivat vaikuttaneet koehenkilöiden käsityksiin – siis etukäteen. Bem kollegoineen tulkitsi ”Feel the future” -otsikoidun koesarjan osoittavan, että koehenkilöillä oli kyky nähdä tulevaisuuteen.

Tämäntyyppisiä käsityksiä esitetään toki jatkuvasti – mutta ei vertaisarviointikäytäntöä noudattavissa tieteellisissä sarjoissa. Tutkimuksen julkaisemisesta päättäneet päätoimittajat Charles Judd ja Bertram Gawronski kirjoittivatkin ratkaisusta varsin poikkeuksellisen pääkirjoituksen, jossa he kertoivat empineensä päätöstä.

”Raportoidut tulokset ovat ristiriidassa omien syysuhteita koskevien uskomustemme kanssa ja pidämme tuloksia äärimmäisen hämmentävinä”, he tunnustivat.

Rajojen rikkomista ja yllättäviä tuloksia arvostetaan tiedeyhteisössä. Periaatteessa tutkijan kannalta on sitä parempi, mitä hätkähdyttävämpiä tulokset ovat, koska silloin ne herättävät myös kollegojen huomion. Bemin järjestämä yllätys herätti alalla kuitenkin ennennäkemättömän myrskyn. Rajaa tieteen ja parapsykologian välillä ei koetella kokeellisessa psykologiassa joka päivä – monen mielestä hyvästä syystä.

Tarinan toinen alku on aurinkoisessa San Diegossa.

Samoihin aikoihin kun Daryl Bem ryhmineen valmisteli parapsykologista artikkelikäsikirjoitustaan, joka saisi tiedeyhteisön pian raivon valtaan, Kalifornian yliopiston professori Hal Pashler seisoskeli vesiautomaatilla työpaikallaan San Diegon kampuksen psykologian laitoksella ja selaili Psychological Science -sarjan tuoreinta numeroa. Pashler mietti samaa kuin monesti aiemminkin neljän viiden viime vuoden aikana: osaa tutkimuksista tuntui vaikealta uskoa todeksi.

Pashler ei tiennyt yliaistillista havaitsemista koskevasta kohusta, joka olisi vasta tulossa. Häntä ihmetyttivät paljon tavanomaisemmat tulokset – sellaiset, joita Psychological Science julkaisi miltei joka numerossa. Lehti on amerikkalaisten psykologien tieteellisen yhdistyksen, Association for Psychological Sciencen lippulaivasarja, kenties arvostetuin uusia tutkimustuloksia julkaiseva yleispsykologinen tieteellinen sarja. Sarja noudattaa tiukkaa vertaisarviointiprosessia, jonka tarkoitus on karsia epäluotettavat tulokset julkaistavien joukosta. Psychological Sciencessa julkaisemista pidetään erityisenä ansiona – sellaisena, joka saattaa auttaa voittamaan kollegat apurahoista ja professuureista kilpailtaessa.

Pashleria mietityttivät kokeet, joita kutsutaan kattotermillä sosiaalinen priming. Niitä oli julkaistu viime vuosikymmenen aikana useita.

Priming tarkoittaa laajaa ilmiöjoukkoa, jossa yhdelle ärsykkeelle altistuminen vaikuttaa tavalla tai toisella seuraavien käsittelyyn. Esimerkiksi jos koehenkilöiden täytyy etsiä vaikkapa vihreä kohde näkökentästään, he löytävät sen keskimäärin muutaman millisata sekuntia nopeammin, jos myös edellinen kohde on ollut samanvärinen. Havaintopsykologiassa priming-ilmiöitä on tutkittu pitkään, ja monet erityisesti näköjärjestelmään liittyvät priming-ilmiöt tunnetaan varsin perusteellisesti.

Sosiaaliset priming -kokeet, jotka vaivasivat Hal Pashleria, ovat kuitenkin luonteeltaan toisenlaisia. Niissä yhteys ärsykkeen ja sen vaikutusten välillä on selvästi monimutkaisempi – ja siksi joidenkin mielestä myös kiinnostavampi.

John Barghin klassikkotutkimuksessa vuodelta 1996 koehenkilöille esitettiin vanhuuteen liittyviä sanoja, mutta ovelasti, niin että heidän huomionsa ei kiinnittynyt sanojen yhtäläisyyksiin. Koehenkilöitä pyydettiin tekemään sanoihin liittyvä hämäystehtävä, jolla ei todellisuudessa ollut merkitystä, mutta jolla varmistettiin, että he joutuivat pohtimaan jokaista sanaa. Tutkijoita kiinnosti se, mitä tapahtui vasta hämäystehtävän jälkeen: koehenkilöiden tietämättä tutkijat mittasivat heidän kävelynopeutensa, kun he poistuivat tutkimustiloista tehtävän jälkeen. Tulokset olivat jännittävät: niiden mukaan vanhuuteen liittyville käsitteille altistuminen hidasti ihmisten kävelynopeutta, kun sitä verrattiin verrokkiryhmään, jossa hämäystehtävän sanat eivät liittyneet ikään.

Hal Pashlerin huomio kiinnittyi tutkimusten aikaperspektiiviin. Pashler tunsi havaintopsykologisia priming-ilmiöitä hyvin. Niissä kyse oli aina hyvin nopeista, alle sekunnin tai korkeintaankin muutaman sekunnin mittaisista efekteistä. Nyt sosiaalipsykologit kirjoittivat kuitenkin omissa priming-kokeissaan ilmiöistä, joiden vaikutus näkyi kenties vasta viidentoista sekunnin kuluttua altistamisesta.

Tämä ällistytti Pashleria. Hän päätti kokeilla – silkkaa uteliaisuuttaan – saisiko hänkin aivan samanlaiset tulokset, jos kokeilisi täsmälleen samaa kuin John Bargh alkuperäisissä kokeissaan.

Hän otti yhteyttä Barghiin kokeillakseen mitä tapahtuisi, jos hän toistaisi kokeen täsmälleen samalla tavalla. Ratkaisu voi kuulostaa lukijasta luontevalta, mutta useimmilla tieteenaloilla näin ei ole ollut tapana toimia. Tutkijat palkitaan urallaan uusista tuloksista, joista muut eivät ole aiemmin kertoneet. Aiempien tutkimusten toistamista ei ole pidetty mielekkäänä. Pashler kertookin Barghin ihmetelleen, miksi kukaan kajoaisi vanhoihin tutkimuksiin; nehän olivat museotavaraa.

”Bargh oli ystävällinen mutta vaikutti todella hämmentyneeltä”, Pashler kertoo. ”Hän yritti kaikin keinoin auttaa minua keksimällä uusia koeideoita. Hänen oli mahdoton uskoa, että halusin todella tehdä täsmälleen saman kuin hän vuosia sitten.”

Barghin hämmennys johtui siitä, että toisten kokeita ei ole ollut tapana toistaa. Seuraavina vuosina koko alalle alkoi valjeta, että olisi ehkä ollut syytä.

Toisten kokeita ei ole ollut tapana toistaa. Seuraavina vuosina koko alalle alkoi valjeta, että olisi ehkä ollut syytä.


Darryl Bemin yliaistillisen havaitsemisen kokeet olivat hetkessä kaikissa valtalehdissä.

Parapsykologia kiinnosti mediaa valtavasti, koska sitä oli nyt julkaistu psykologien laatusarjassa. Koomikko Stephen Colbert kutsui Bemin tv-ohjelmaansa, jossa yleensä vierailevat vain superjulkkikset. (”Kiitos että tulet olemaan keskustellut kanssani”, Colbert sanoi. ”Tulet olemaan ollut loistava vieras.”)

”Tämä on sulaa hulluutta. En käsitä miksi merkittävä julkaisusarja sallii tällaisen tutkimuksen julkaisemisen. Päätös on häpeäksi koko alalle”, sanoi psykologian emeritusprofessori Ray Hyman New York Timesille.

Ei kestänyt kauan ennen kuin joukko psykologeja päätti pelastaa alan maineen toistamalla Bemin kokeet. Moni oli valmis lyömään vetoa, että tulokset eivät toistuisi.

Tulosten toistettavuutta pidetään yhtenä tieteen kulmakivistä: jos tulokset eivät toistu, ilmiötä ei voi pitää luotettavina. Esimerkiksi tieteenfilosofi Karl Popper määritteli tieteellisen ilmiön vuonna 1959 sellaiseksi, ”jonka pystyy toistamaan säännönmukaisesti kuka tahansa, joka tekee asianmukaisen kokeen määritellyllä tavalla”.

Tämä kuulostaa ehkä siltä, että tutkijat toistavat toistensa kokeita päivittäin. Mutta professori Chris French kollegoineen, joka yritti toistaa Bemin epäilyttäviltä kuulostaneet tulokset – eikä onnistunut – kohtasi pian uuden shokin: tieteelliset lehdet eivät suostuneet julkaisemaan toistoyrityksen tuloksia. French oli tehnyt Bemin kokeet uudelleen – kolmesti – eikä saanut yliaistilliselle havaitsemiselle tukea. Mutta niin sarja jossa Bemin alkuperäiset tulokset oli julkaistu kuin kaksi muutakin kieltäytyi julkaisemasta toistoyritysten tuloksia. Lehdet eivät julkaisseet replikaatioita.

Ne kertoivat julkaisevansa ainoastaan uusia tutkimustuloksia.

Tutkijoille alkoi valjeta, kuinka harvinaista yhdenkään tutkimuksen toistaminen tieteessä oli, toistettavuuden tunnustetusta merkityksestä huolimatta. Bemin oli ollut mahdollista julkaista kummallinen, todennäköisesti epäluotettava tuloksensa sosiaalipsykologien arvostetuimmassa lehdessä, mutta jos halusi näyttää, että Bemin tulokset eivät todellisuudessa olleet luotettavia, sitä tiedeyhteisö ei sallinut.

”Vaikka aina sanotaan, että toistaminen on tieteen kulmakivi, totuus on että arvostetuimmat julkaisut eivät yksinkertaisesti ole kiinnostuneita kokeiden suorista toistoyrityksistä – varsinkaan sellaisista joissa tulosten toistaminen epäonnistuu. Ne haluavat julkaista vain uusia ja onnistuneita tuloksia”, French kirjoitti Guardianissa.

Yksi tieteellinen sarja suostui lopulta lähettämään Frenchin toistokokeiden tulokset vertaisarvioitavaksi – mutta kaikista maailman tutkijoista Bemille itselleen. Ilmeisesti siksi, että häntä pidettiin nyt yliaistillisen havaitsemisen kokeellisen tutkimuksen johtavana asiantuntijana. Bem suositteli lehden päätoimittajalle, että toistokokeen tuloksia ei julkaistaisi. Lehti teki kuten Bem neuvoi. French ja hänen kollegansa pöyristyivät. Heidän mielestään oli selvää, että Daryl Bem ei ollut puolueeton arvioimaan toistoyrityksen tieteellisiä ansioita.

Lehtien käytännöt toisin sanoen varmistivat, että Bemin parapsykologiset tutkimustulokset jäisivät tunnustetuksi osaksi tieteellistä tutkimuskirjallisuutta, kun taas kolme uusintakoetta, joissa ilmiötä ei saatu näkyviin, jäisivät ikuisesti tutkijoiden pöytälaatikkoon. Jokainen seuraava tutkijasukupolvi, joka etsisi tietoa tästä aiheesta, löytäisi vain Bemin tulokset. Ilmiö näyttäisi todelliselta, vaikka tutkijat, jotka olivat yrittäneet toistaa kokeen, tiesivät että se ei sitä ollut.

Bemin tarinalla oli lopulta onnellinen loppu. French onnistui viimein saamaan toistokokeensa julkaistua PLoS ONE -lehdessä, ja toinenkin tutkimusryhmä hiukan myöhemmin Journal of Personality and Social Psychology -sarjassa. Yli kolmentuhannen koehenkilön voimalla tehdyissä toistokokeissa ei saatu näyttöä yliaistillisesta havaitsemisesta. Sitä harva oli toki odottanutkaan, kenties Bemiä lukuun ottamatta.

Joidenkin mielestä asia oli loppuun käsitelty. Ja tavallaan olikin, Bemin tulosten osalta. Mutta samaan aikaan muualla oli herännyt kysymyksiä, jotka saattoivat olla vakavampia. Eikä niistä voinut syyttää Daryl Bemiä tai parapsykologeja.

Hal Pashler, joka oli samoihin aikoihin yrittänyt toistaa John Barghin sosiaalisia priming-kokeita, huomasi että hänen oli vaikea saada julkaisuissa raportoituja koetuloksia onnistumaan. Yliaistillisen havaitsemisen epäonnistuminen ei lopulta hämmästyttänyt ketään, mutta psykologisten perustutkimusten piti olla eri asia.

Pashlerin tietämättä kaksi muutakin kognitiivisen psykologian ryhmää oli samoihin aikoihin alkanut ihmetellä sosiaalisia priming-kokeita, osin eri syistä, ja Pashlerista riippumatta myös muut yrittivät toistaa niitä. Replikaatioyrityksiä julkaistiin seuraavina vuosina useita – toisin kuin alalla oli koskaan ollut tapana – eivätkä ne näyttäneet hyvältä.

Pashler julkaisi kollegoineen tulokset vuosina 2012 ja 2013 yrityksistä toistaa neljä Barghin ryhmän alkuperäistä koetta. Tulokset eivät toistuneet, ja välillä jopa itse efekti kääntyi päinvastaiseksi kuin alkuperäisessä julkaisussa. Samaan aikaan toiset tutkijat Brysselin ja Cambridgen yliopistoissa julkaisivat yrityksensä toistaa Barghin vanhuutta ja kävelynopeutta koskevan klassikkokokeen kaksi kertaa alkuperäistä suuremmalla koehenkilöjoukolla. Tutkimus julkaistiin PLoS ONE -sarjassa 2012.

Kuten Pashler oli vesiautomaatilla epäillyt, vanhuuteen liittyvillä sanoilla ei ollut mitään vaikutusta koehenkilöiden kävelynopeuteen, päinvastoin kuin Bargh oli raportoinut.

Tämä oli sosiaalipsykologeille järkyttävä tieto, koska Barghin alkuperäinen tutkimus oli herättänyt paljon huomiota ja oli inspiroinut seuraavina vuosina valtavan määrän jatkotutkimusta. Bargh oli eliittiyliopisto Yalen arvostettu professori ja yksi alan tunnetuimmista nimistä. Tutkimukseen viitataan edelleen lukuisissa psykologian perusoppikirjoissa, ja opiskelijat törmäävät tulokseen varsin todennäköisesti yliopistojen johdantoluennoilla.

Ja nyt näytti yhä todennäköisemmältä, että koko ilmiötä ei ollut koskaan ollut olemassakaan.

Sosiaalisesta primingista tuli nopeasti nyrkkeilysäkki, jota jokainen alaa seuraava käväisi vuorotellen pamauttamassa. Tilanteesta huolestui muiden muassa taloustieteen Nobelilla palkittu psykologi Daniel Kahneman, joka oli hänkin seurannut tilannetta.

John Barghes puolestaan suuttui koetuloksiinsa kohdistuvista epäluuloista ja julkaisi kiukkuisen kirjeen, jossa hän syytti kollegojaan siitä, että he olivat toistaneet hänen kokeensa väärin. Tutkijayhteisö alkoi vähitellen huomata, kuinka harvinaisen kova pala kollegoille oli nähdä omien tulostensa häviävän savuna ilmaan. Tähän ei ollut alalla totuttu, ja joidenkin välit tulehtuivat. Joidenkin mielestä aiemmin kollegiaalisena tunnettu tutkijayhteisö oli muuttunut vihamieliseksi.

Mutta osalla tutkijoista oli jo herännyt tätäkin vakavampi kysymys: entä jos ongelma oli vielä tätäkin laajempi? Entä jos kyse ei ollut vain sosiaalisesta primingista?

Osalla tutkijoista oli jo herännyt tätäkin vakavampi kysymys: entä jos ongelma oli vielä tätäkin laajempi?

Epäilyksiä ruokki samoihin aikoihin paljastunut hollantilaisen sosiaalipsykologi Diederik Stapelin tapaus, joka voisi olla tämän tarinan kolmas alku. Stapel, jota pidettiin yhtenä alan johtavista eurooppalaisista tutkijoista, jäi skandaalimaisesti kiinni vilpistä. Paljastui, että hän oli vuosikausia väärentänyt suuren osan tuloksistaan. Vilpin uskotaan olevan tieteessä harvinaista, mutta alalla tyrmistyttiin sitä, kuinka helposti väärennetyt tulokset olivat toistuvasti vuosien ajan läpäisseet vertaisarvioinnin jopa alan arvostetuimmissa lehdissä. Ja kun Stapelin töitä alettiin nyt käydä läpi täikammalla, huomattiin että menetelmät vaikuttivat arveluttavilta niissäkin, joissa itse aineistoa ei ollut väärennetty.

Alalla jouduttiin pohtimaan, oliko tieteellinen tutkimuskirjallisuus laajemminkaan sitä mitä oli luultu.

Tutkijan kenties tärkein tehtävä on erottaa yleistettävät tutkimustulokset havainnoista, jotka näyttävät oikeilta mutta johtuvat todellisuudessa sattumasta. Jälkimmäisiä kutsutaan vääriksi positiivisiksi havainnoiksi.

”Alkoi näyttää siltä, että kokonaiset tutkimuskirjallisuudet saattoivat koostua vääristä positiivisista tuloksista”, psykologian professori Joseph Simmons kiteytti tilanteen New York Timesille.

”Kun juttelen ulkopuolisten kanssa, ihmiset ovat ihmeissään. Kuinka te olette voineet antaa tämän tapahtua? Kuinka te olette voineet olla näin naiiveja?” Hal Pashler kertoo aamiaispöydässä San Diegossa. ”Sanon että olen ihan samaa mieltä. Sitä onkin vaikea uskoa”, Pashler sanoo ja nauraa makeasti.

”Minulla oli ollut joitakin epäilyksiä, mutta minullakaan ei ollut ollut aavistustakaan, kuinka huono tilanne todellisuudessa oli. Ajattelin että kyse on ehkä viidestä prosentista. Minulle ei tullut mieleenkään, että ehkä jopa puolet voisi olla väärin.”

Pashler on vaalea sinisilmäinen mies, jonka tukassa ja parrassa on harmaata. Niin hyväntuulista otetta elämään kuin Pashlerilla ei välttämättä odottaisi ihmiseltä, joka edustaa tieteenalan ankaraa sisäistä itsekritiikkiä. Pashler toimi vierailevana päätoimittajana Amsterdamin yliopiston professori Eric-Jan Wagenmakersin kanssa tieteellisen Perspectives in Psychological Science -sarjan erikoisnumerossa, joka käsitteli toistettavuuskriisiä psykologiassa. Molemmat ovat olleet keskeisiä hahmoja alan sisäisen keskustelun käynnistämisessä.

”Julkaistuihin tutkimuksiin on suhtauduttu vähän kuin urheilutapahtumiin”, Hal Pashler sanoo. ”Kun joku on voittanut, tulokseen ei enää palata. Mutta tutkimuksessa tehdään väitteitä maailmasta. Niitä voi ja pitääkin palata tarkistamaan.”

Julkaistujen tutkimustulosten toistettavuudesta on keskustelu tiedeyhteisössä kiivaasti pian kymmenisen vuotta. Parapsykologiasta, sosiaalisesta primingista ja Stapelin huijauksista käynnistyneet epäilyt tarkentuivat neljä vuotta sitten, kun Virginian yliopiston professori Brian Nosekin johtaman Open Science Foundationin suuren replikaatiohankkeen tulokset julkaistiin Sciencessa. Hankkeessa yritettiin toistaa sata arvostetuissa julkaisusarjoissa julkaistua psykologista tutkimusta pilkulleen kuten alkuperäisissä kokeissa. Projektiin osallistui 270 tutkijaa ympäri maailmaa.

Tuloksista toistui vain kolmasosa – tai kaksi, riippuen siitä, miten tuloksen onnistunut toistuminen määritellään. Tulos oli kaikkien mielestä huolestuttavan heikko. Se asetti kyseenalaiseksi, missä määrin tieteellisissä sarjoissa julkaistut tutkimustulokset täyttivät tieteellisen tiedon kriteerit.

”Tieteessä on meneillään kriisi: yllättävän suurta osaa julkaistuista tutkimuksista ei onnistuta toistamaan”, Connecticutin yliopiston professori Eric Loken tiivisti tilanteen kirjoituksessaan huhtikuussa The Conversation -verkkolehdessä.

”Erikoista on, että kesti näin kauan että ongelma paljastui”, Hal Pashler sanoo. ”Kaikki mitä sen havaitsemiseksi tarvittiin oli ollut tiedossa jo kauan.”

Nature-lehden kyselyn mukaan 52 prosenttia eri alojen tutkijoista oli sitä mieltä, että tieteessä on meneillään ”merkittävä toistettavuuskriisi”. Vaikka toistettavuuskriisistä on keskusteltu paljon psykologiassa, ongelmat koskettavat kaikkia empiirisiä tieteenaloja. Niin lääketieteessä, geenitutkimuksessa kuin taloustieteessäkin keskustellaan nyt siitä, kuinka yleisesti julkaistut tutkimustulokset ovat toistettavissa.

Näyttöön perustuvan lääketieteen johtavat nimet Paul Glasziou ja John Ioannidis Bondin ja Stanfordin yliopistoista arvioivat kollegoineen tutkimussarjassaan The Lancetissa 2014, että jopa 85 prosenttia biolääketieteellisestä tutkimuksesta jää joko julkaisematta tai sisältää niin merkittäviä menetelmällisiä ongelmia, että tulokset ovat epäluotettavia. Ioannidis oli arvioinut jo 2005 poikkeuksellisen luetussa, räväkästi otsikoidussa artikkelissaan ”Why most published research findings are false”, että yleisten analyysi- ja julkaisukäytäntöjen vuoksi on todennäköistä, että vain alle puolet tieteellisissä sarjoissa julkaistuista tuloksista on luotettavia.

Ongelma näkyy biolääketieteissä joka alalla, totesi Johns Hopkinsin yliopiston mikrobiologian ja immunologian professori Arturo Casadevall maaliskuussa New Yorkissa järjestetyssä konferenssissa, joka käsitteli keinoja toistettavuuden parantamiseksi.

Nature-lehti kertoi vuonna 2012 yrityksestä toistaa 53 poikkeuksellisen merkittävää julkaistua syöpätutkimusta. Tulokset onnistuttiin toistamaan vain 11 prosentissa. ”Tulos on shokeeraava, jopa prekliinisen tutkimuksen rajoitukset tuntien”, Teksasin yliopiston ja bioteknologiayritys Amgenin syöpätutkijat C. Glenn Begley ja Lee M. Ellis kirjoittivat.

Tiedeyhteisössä on yleisesti oletettu, että vaikka yksityiskohdissa saattaa olla hiottavaa, julkaistujen tutkimusten suuriin linjoihin voi pääosin luottaa. ”Tämä ei valitettavasti aina ole totta”, Begley ja Ellis toteavat.

”On käynyt ilmi – ja minä ja monet muut olemme tajunneet tämän vasta aivan viime vuosina – että suuri osa julkaistuista tutkimusartikkeleista on yksinkertaisesti toivottomia”, Columbian yliopiston kovapintaisena tunnettu tilastotieteilijä Andrew Gelman totesi Business Insider -lehdelle 2016. Gelman on hänkin ollut keskeinen nimi replikaatiokriisiä koskevassa keskustelussa.

”Ei vain puuttuva muuttuja siellä tai väärin laskettu t-arvo täällä vaan paljon perustavampi ongelma, suuri joukko tutkimuksia, joilla ei ole mitään mahdollisuuksia vastata omiin kysymyksiinsä.”

Taloustieteen puolella Kalifornian Teknillisen Instituutin tutkijat julkaisivat 2016 Sciencessa replikaatiotutkimuksen, jossa yritettiin toistaa 18 julkaistua taloustieteellistä laboratoriotulosta. Alkuperäiset tulokset onnistuttiin toistamaan kahdessa tapauksessa kolmesta.

Mistä toistettavuusongelmat siis johtuvat?

Jos tutkimusta ei pystytä toistamaan, siihen voi olla lukemattomia syitä. Toistamisyrityksen epäonnistuminen ei välttämättä merkitse sitä, että alkuperäinen tutkimus olisi virheellinen. Yksittäisen tutkimuksen toistettavuuteen vaikuttaa lukematon joukko tekijöitä, ja juuri niistä tiedeyhteisö nyt keskustelee.

Yhtenä tekijänä ongelmien taustalla pidetään silti tapaa, jolla tilastollisia menetelmiä on yleisesti käytetty.

”Yhä yleisemmin tiedostetaan, että tilastollisesti merkitsevät väitteet tieteellisissä julkaisuissa ovat rutiinisti virheellisiä”, Gelman ja Loken kirjoittivat American Scientist -lehdessä 2014.

Tutkijat ovat monilla tieteenaloilla usein suosineet lähestymistapaa, joka tunnetaan nollahypoteesintestauksena. Sen sinänsä järkevä tarkoitus on arvioida matemaattisesti, kuinka todennäköisesti samankaltaisia tuloksia voitaisiin saada sattumalta. Hypoteesintestauksen matemaattiset oletukset eivät kuitenkaan ole sopineet kaikkiin tilanteisiin, joihin sitä on sovellettu.

Gelman sanoo, että tilastotieteeseen suhtaudutaan usein kuin ”epävarmuuspesuna, alkemiana joka muuntaa satunnaisuuden varmuudeksi” – mitä se ei ole. Gelmanin mukaan tiedeyhteisön tulisi alkaa suhtautua epävarmuuteen hyväksyvämmin ja luopua kuvitelmasta, jonka mukaan monimutkaisia väitteitä voisi todentaa yksinkertaisilla tilastollisilla testeillä.

Psykologiassa myös otoskoot ovat olleet usein pieniä. Varoituksia siihen liittyvistä riskeistä on esitetty ainakin 1960-luvulta saakka.

”Ajatus siitä, että liian pieniin otoskokoihin ei pidä luottaa, on esitetty toistuvasti kautta tieteen historian, mutta vasta nyt meille alkaa valjeta, mitä tämä todellisuudessa tarkoittaa”, Daniel Lakens Eindhovenin teknillisestä yliopistosta sanoi BBC:n Newshour Extra -radio-ohjelmassa, joka käsitteli toistettavuuskriisiä. ”Uskon että tulemme näkemään lähivuosina merkittävän parannuksen tässä suhteessa.”

Useimpien mielestä toistettavuusongelmissa on kyse kuitenkin kokonaisesta kulttuurista tiedeyhteisössä.

”Tilastotieteellisiä menetelmiä käytetään paljon väärin”, Brian Nosek sanoi esitelmässään maaliskuussa Columbian yliopiston konferenssissa, jonka pääpuhuja hän oli. ”Mutta itse ydinongelmat eivät ratkea ellemme onnistu muuttamaan koko kulttuuria.”

”Tieteen normit ovat epätahdissa palkitsemisjärjestelmien kanssa”, mikrobiologi Casadevall sanoi.

Samoilla linjoilla on myös aivotutkija Kirstie Whitaker Cambridgen yliopistosta. ”Vaikuttimet ja rahoitusjärjestelmän rakenne ovat tiedeyhteisössä pielessä”, Whitaker sanoi BBC:lle.

Whitakerin mukaan tieteessä ei ole mitään vikaa, eikä ole koskaan ollutkaan. Mutta tutkija palkitaan, ainakin toistaiseksi, julkaisujen määrästä ja näennäisestä laadusta. Varsinkin nuoriin kohdistuu yhä kovempi paine saada mahdollisimman nopeasti mahdollisimman räväköitä tuloksia, jotka ylittäisivät julkaisukynnyksen kovatasoisimmissa tieteellisissä sarjoissa. Siksi tutkijat kilpailevat niiden lukumäärästä kiivaasti keskenään eivätkä siitä, keiden väitteet osoittautuvat kestävimmiksi – vaikka juuri kestävän tiedon tavoittelun tulisi olla tiedeyhteisön yhteinen tavoite.

”Perustavanlaatuisten asioiden täytyy muuttua”, sanoi Shai Silberberg Columbian yliopiston konferenssissa. Silberberg työskentelee neurologisen NINDS-keskuksen tutkimuksen laadusta vastaavana johtajana Yhdysvaltain terveysinstituutissa NIH:ssa.

”Meidän tulee keskittyä vähemmän siihen mikä kiiltää ja enemmän siihen, mikä kestää tiukan tarkastelun”, Silberberg sanoi.

Mutta miten toistettavuuskriisi siis tulisi ratkaista?

Muutospaineita kohdistuu niin julkaisusarjojen päätoimittajiin ja vertaisarvioijiin, tutkimusrahoittajiin kuin yksittäisiin tutkijoihinkin. ”Muutos vaatii toimia kaikilta osapuolilta”, Silberberg sanoo.

Samaa mieltä ovat psykologian ja lääketieteen uudistusliikkeen keskeisimmät nimet. Nosek, Wagenmakers ja Ioannidis kirjoittivat kollegoineen Nature Human Behavior -sarjassa 2017, että ongelmiin puututaan tehokkaimmin uudistamalla käytäntöjä ja vaikuttimia kaikilla tieteen eri osa-alueilla.

Käytännöt ovatkin kuluneiden seitsemän vuoden aikana monen mielestä parantuneet ratkaisevasti, ainakin psykologiassa. Tämä johtuu siitä, että toisin kuin vielä kymmenen vuotta sitten, tiedeyhteisössä vallitsee jo varsin laaja yksimielisyys siitä, että monet alan käytännöistä ovat olleet kipeästi korjaamisen tarpeessa. Otoskoot ovat kasvaneet, ja replikaatiotutkimuksia julkaistaan nyt jatkuvasti. Tutkimusmenetelmiä kehittämään perustettu Open Science Foundation -keskus on tehnyt pioneerityötä jo useita vuosia, ja nuori tutkijapolvi on perustanut oman yhdistyksensä, Society for the Improvement of Psychological Science, joka sekin tähtää parempien käytäntöjen kehittämiseen. Association for Psychological Science -yhdistys on perustanut uuden julkaisusarjan, joka keskittyy tutkimusmenetelmien kehittämiseen.

”On ollut rohkaisevaa nähdä, kuinka nuoret tutkijat ovat heränneet miettimään tilannetta”, sanoo Hal Pashler.

”Jos joukko psykologitutkijoita heräisi nyt seitsemän vuoden talviunesta, he eivät tunnistaisi alaa enää samaksi”, Simmons kollegoineen kirjoittaa Annual Review of Psychology -lehdessä.

”On ollut rohkaisevaa nähdä, kuinka nuoret tutkijat ovat heränneet miettimään tilannetta”, sanoo myös Hal Pashler.

Esimerkiksi tutkimusten esirekisteröinnistä on nopeasti kehittymässä alan uusi standardi. Esirekisteröinnillä tarkoitetaan sitä, että tutkija lyö lukkoon kaikki tutkimus- ja analyysimenetelmänsä etukäteen ja ilmoittaa ne kaikille julkisesti. Sattumanvaraiset löydökset vähenevät, jos keinoista valitaan parhaat etukäteen ja myös pitäydytään niissä – silloinkin kun tulokset eivät miellytä. Esirekisteröinti on joissakin sarjoissa jo julkaisemisen edellytys.

Tutkimusrahoittajia on vaadittu kriisin myötä suuntaamaan resursseja pois tutkimuslinjoista, jotka ovat osoittautuneet epäluotettaviksi. Esimerkiksi Hollannissa julkista rahoitusta on kriisin myötä suunnattu tutkimusten toistamiseen.

Hal Pashlerin mielestä tilanteen paranemisesta on kiittäminen muun muassa parapsykologien ennaltahavaitsemiskokeita. Ne auttoivat tuomaan päivänvaloon, kuinka perustavanlaatuisia ongelmia vertaisarviointi- ja julkaisukäytännöissä oli ollut.

”Yliaistilliseen havaitsemiseen uskova yhteisö on tavattoman hyödyllinen meille skeptikoille, jotka lähtökohtaisesti uskomme, että tällaista ilmiötä ei todellisuudessa ole”, Pashler sanoo. ”He osoittavat meille toistuvasti ja äärimmäisen hyödyllisillä tavoilla, miten näillä meidän menetelmillämme voi luoda tuloksia tyhjästä.”

Bemin yliaistillisen havaitsemisen kokeissa ei esimerkiksi Teksasin yliopiston professori Tal Yarkonin mukaan ollut suurta yksittäistä virhettä. ”Se on monessa mielessä ihan kiva artikkeli. Sen sijaan siinä on monta pientä ongelmaa, jotka yhdessä tuottavat epäluotettavan lopputuloksen”, Yarkoni kirjoittaa blogissaan.

Pashlerin mielestä avainasemassa ovat vaikutusvaltaisia katsauksia julkaisevien sarjojen päätoimittajat. He voisivat vaatia, että tutkijat siteeraisivat vain huolellisesti tehtyjä, riittävän suurella otoskoolla toistettuja tutkimuksia.

Mihin käytännöt tulevaisuudessa vakiintuvatkin, on selvää että keskustelu ongelmasta ja sen ratkaisuista tulee lähivuosina jatkumaan.

Entä mitä kriisi tarkoittaa tieteen uskottavuudelle?

Replikaatiokriisi on saanut osan tutkijoista huolestumaan tiedeyhteisön julkisesta kuvasta. Aikana, jolloin tieteen ja asiantuntijoiden arvostusta horjutetaan yhä useammasta suunnasta, joidenkin huoli on, että toistettavuusongelmasta puhuminen ruokkii esimerkiksi ilmastoskeptikoiden perustelemattomia käsityksiä. Siksi osa tutkijoista toivoo, että toistettavuusongelmista puhuttaisiin maltillisesti julkisesti – jos lainkaan.

”Liioitelluilla väitteillä voi olla vakavia seurauksia tutkimusrahoituksen ja yleisen luottamuksen suhteen”, Jeff Leek, kansanterveyden tutkimuksen professori Johns Hopkinsin yliopistosta sanoi BBC:lle. Leekin mielestä osa kriisiin liittyvistä väitteistä on yliampuvia ja suurentelee tutkimustulosten epäluotettavuutta.

Hal Pashler on eri linjoilla. ”Minusta ongelmaa ei voi liioitella. Opiskelija maksaa kurssikirjastaan 275 dollaria, mutta sen väitteistä ehkä vain 40 prosenttia on totta – emmekä edes tiedä mitkä.”

Brian Nosek pitää itsekriittisyyttä elinehtona tieteelle. ”Tieteen suurin vahvuus on tutkijoiden omien väitteiden pohjan jatkuvassa epäilemisessä, koska siten väitteiden uskottavuus varmistetaan pitkällä tähtäimellä”, Nosek sanoi BBC:lle.

Eric Lokenin mielestä replikaatiokriisi tekee tieteelle hyvää, vaikka se onkin kiusallinen monelle tutkijalle, joiden työn uskottavuus on romahtanut.

”Toistamishankkeet ovat esimerkki hyvästä tutkimuksesta ja tieteestä, joka toimii kuten pitääkin”, Loken kirjoittaa.

Mutta olisiko silti paras ratkoa asiat tiedeyhteisön kesken kaikessa hiljaisuudessa? Ja olla pesemättä tutkijoiden likapyykkiä julkisesti?

”Se on tie helvettiin”, Hal Pashler sanoo. ”Niin ei yksinkertaisesti voi ajatella”.

Pashleria huolestuttaa se, että ihmiset menettävät luottamuksensa tiedeyhteisöön, jos ongelmista vaietaan tai niihin ei reagoida nopeasti, tehokkaasti ja läpinäkyvästi. Toimittajien ja suuren yleisön suhde on Pashlerin mielestä Yhdysvalloissa muuttunut happamaksi: hän kertoo näkevänsä lehtien kommenttipalstoilla ihmisten suhtautuvan psykologiaan yhä useammin kyynisesti, koska moni on ongelmista jossain määrin tietoinen. Kaikki tutkimus ei kuitenkaan missään tapauksessa ole ollut virheellistä, ja esimerkiksi kognitiivisessa psykologiassa tulokset toistuivat selvästi useammin kuin sosiaalipsykologiassa.

”Tärkeää olisi saavuttaa täydellinen rehellisyys suuren yleisön silmissä sen suhteen, kuinka huono tilanne on. Voi tietysti kysyä, eikö tämä tekisi imago-ongelmasta yhä hankalamman. Mutta nyt tarvittaisiin lisää suoria toistoyrityksiä aiemmista tutkimuksista suurilla otoksilla, koska tämä johtaisi ryöppyyn onnistuneita replikaatioita. On edelleen vaikka kuinka monia asioita, joissa olemme oikeassa”, Pashler sanoo. ”Mitä ankarampi itseruoskinnan moraalikoodisto olisi, sitä varmemmin se vaatisi tutkijoita koettelemaan myös niitä tuloksia, joista alalla ollaan edelleen varmoja.”

Samaa mieltä oli myös nobelisti Kahneman, joka suositteli sosiaalipsykologeja kohtaamaan kaikki toistettavuutta koskevat epäilykset, koska niiden kiistäminen kääntyisi itseään vastaan.

”Kaiken täytyy olla täysin läpinäkyvää. Kriitikoita tulee aina olemaan, ja jos heillä on omia eturistiriitojaan, ne voi osoittaa”, Pashler sanoo. ”Mutta keskustelua ei voi jättää käymättä ja vain sanoa, että mehän tässä olemme ne hyvikset. Koska silloin emme enää olisikaan.”

 

LUE MYÖS vinkkejä tiedetoimittajille: Jussi Valtonen: Kriittisyyttä myyntipuheisiin

Portto vai silpputyöläinen? Tutkijalta termit toimittajan suuhun

”Jos historiantutkija nimittelee tutkimiaan naisia portoiksi ja huoriksi, niin tekee myös media”, totesi Turun yliopiston Suomen historian professori Kirsi Vainio-Korhonen.

Hän on itse yrittänyt varoa ilmaisemasta käsitystä seksityöntekijöistä ”huonoina naisina” tai ajatusta seksityöstä aina tekijäänsä vaurioittavana asiana. Hän onkin puhunut entisajan silpputyöläisistä, joille seksin myyminen oli yksi ansaitsemistapa vaikkapa pyykkäämisen ja kievarin piian työn rinnalla.

Kirsi Vainio-Korhonen kertoi tutkijan ja mediajulkisuuden suhteesta Tiedetoimittajain liiton Tieteen päivien seminaarissa tämän vuoden tammikuussa. Hänen viisaan puheenvuoronsa jälkeen olen itsekin jäänyt entistä herkemmällä korvalla kuuntelemaan tutkijoiden sanavalintoja. Puhutaanko rokotuskriittisyydestä vai rokotusvastaisuudesta. Puhutaanko vihapuheesta vai häiritsevästä palautteesta. Viljelläänkö populistien suosimaa vastakkainasettelua käyttäen termejä valtamedia ja vastamedia.

Meillä on verbaalisesti hyvin taitavia poliitikkoja, joiden jytkyt ja vatuloinnit jäävät elämään. Mutta eivät tässä sanapelissä häviä tieteentekijätkään. Myös huolimaton ilmaisu voi herättää turhaa pelkoa tai turhaa toivoa. Lääketieteilijän on esimerkiksi ilmaistava tarkasti, onko tulosten välinen ero merkittävä vai merkitsevä. Ilmastonmuutoskeskustelussa ero pelottelun ja aiheellisen huolen herättämisen välillä voi olla hiuksenhieno.

”Tutkimus pitää kirjoittaa MYÖS mediajulkisuus mielessä”, neuvoi Kirsi Vainio-Korhonen. Hän painotti, että jos historiantutkija kielenkäytössään ns. roiskii ja maalailee kuvatessaan menneisyydessä eläneiden ihmisten kurjia kohtaloita, samoin tekee myös media.

Tutkija ikään kuin antaa luvan liian suoriin ja räikeisiin tulkintoihin. Vaikka ihminen olisi elänyt kauan sitten, hän on silti ollut oikea elävä ihminen, joka ansaitsee tulla kohdelluksi kunnioittavasti.

Kun Vainio-Korhosen kirja Musta-Maija ja Kirppu-Kaisa. Seksityöläiset 1800-luvun alun Suomessa (SKS 2018) ilmestyi, tutkija oli miettinyt sanavalintojaan ja laati huolellisesti lehdistötiedotteen. Kirjan julkistamistilaisuus järjestettiin Turun Luostarinmäen Käsityöläismuseolla, ja toimittajille tarjottiin värikkäitä tarinoita, mutta muistutettiin tutkimuksen kohteiden inhimillisyydestä.

Jutuista tulikin maltillisia – otsikoista myöten:
YLE Uutiset 22.8.2018: Seksityö ei ollut pahasti leimaavaa 1800-luvun Suomessa – uutuuskirja kertoo tarinoita turkulaisista prostituoiduista, joille seksityö oli ”yksi elinkeino silpputöiden joukossa”.

Ilta-Sanomat 25.8.2018: Kirsi Vainio-Korhonen sanoo, että seksityöläisten arjesta saadut tiedot opettavat, että naiset olivat paljon muutakin kuin seksin myyjiä. He ovat äitejä, tyttäriä ja elättäjiä.

On tärkeää saada tiedotusvälineet kiinnostumaan tutkimuksesta, jossa ei luvata uusia paljastuksia historian suurmiehistä tai Suomen ”kohtalonhetkistä”. Tutkijan onkin hyvä miettiä etukäteen aiheelleen viestintästrategia, ja vaikeista asioista puhumista kannattaa harjoitella. Julkisuus ei etsi viimeisen päälle sliipattuja mediapersoonia, vaan asiantuntijoita, joilla on syvää tietoa, vakaumusta ja eettisesti harkittua sanottavaa.

Musta-Maija ja Kirppu-Kaisa-kirjan julkistamistilaisuus järjestettiin Turun Luostarinmäen Käsityöläismuseolla kesällä 2018. (Kuva: Mikael Korhonen)

Saunamatka Vienaan

”Vastoja laiteltiin iivananpäivästä petrunpäivään.” Rosa Remsu jaksaa valistaa hyväntuulisena vieraitaan, vaikka kylään on tultu varoittamatta. Pihaan mentiin, kun nähtiin mies kunnostamassa saunaa. Vanhan emännän vävyksi hän osoittautuu, käyttää rakennustarpeina muun muassa vanhaa sähkötolppaa. ”Täällä ei pysty valikoimaan.”

Rosa Karhu

Vienaan lähdettiin kirjahankkeen kenttätöihin. Saunaopusta varten piti saada jututtaa ihmisiä, joilla on pitkä kokemus tästä kulttuurimuodosta jossain Suomen ulkopuolella. Ja tarkastella sitä tarkoitusta varten rakennettuja tiloja.

Remsun toisessa pihasaunassa Vuokkiniemellä lauteina ovat metsäkämpän mäntyiset kattolaudat. Kiukaan mustia kiviä tukee vielä valkeana hohtava takavuosikymmenten valurautainen lämpöpatteri. ”Se on otettava mitä saa”, toteaa vävy ja kertoo viidellä eri tiilellä muuratusta uunistaan. ”Se on käytetty mitä on.”

Päähavainto vienankarjalaisten saunasuhteesta painottuu sen koruttomuuteen. Kyly ei ole niinkään puolimystistä yhteyttä muinaisuuksiin tai tie löylymäisesti erittelyään pakenevaan henkimaailmaan. Se on paremminkin mutkattomuutta vaikeaselkoisessa todellisuudessa. Toisen iäkkään vuokkiniemeläisen, mustikoita tupansa ikkunalla kuivattavan Rosa Karhun, sanoin valkie kyly piippuineen on mieluisampi kuin savusauna eli musta kyly, koska se on kätevämpi.

Saunapuheen yli- ja alimäärä

Lauteilla hikoilun tyyssijasta on kirjoitettu varsin runsaasti. Ja rupattelu omasta ja toisten löylypaikoista kuuluu suomalaisten mieliharrastuksiin. Silti saunasta keskustellaan melko vähän verrattuna saunomisen paljouteen.

Rakennusteknisen lähestymistavan, terveyskeskeisen kiinnostuksen ja puhtaasti esittelevän otteen jyllätessä saunapuhe on vaarassa kaventua ja yhdenmukaistua. Tämä ei tee sille oikeutta ajattelun ja sananvaihdonkin paikkana. Saunaan on syvennyttävä perehtymällä yhtä antaumuksellisesti sitä koskevaan kirjallisuuteen kuin siellä käymisen erilaisiin yhä eläviin muotoihin.

Kiuas

”Kun saunaan illaksi ehti, vähätpähän muusta”, tiivistää Maria Jotuni (1880–1943) erään novellihenkilön mietteet teoksessaan Kun on tunteet (1913). Tästä voisi uuttaa koeteltavan oletuksen: sauna on kaikki kaikessa ja viittä vaille lakkauttaa kaiken muun merkityksellisyyden, mutta kenties liian harvoin tutkaillaan, millä erityisillä tavoilla se sisältää, kertaa, mitätöi tai tihentää kaiken muun.

Saunomiskuvausten epätyydyttävyyttä ei tarvitse liikaa ihmetellä. Onhan aiheesta vaikea puhua hyvin. Kuten H. J. Viherjuuri (1889–1949) Saunakirjassaan (1940) toteaa, löylyttely on ”suomalaisille yhtä vaistomaisen tarpeen tyydyttäminen kuin syöminen silloin kun on nälkä ja juominen silloin kun on jano, niin ettei [tarkempiin] kysymyksiin [sen piirteistä tai laadusta] tule kiinnittäneeksi huomiota”.

Tästä havainnosta on monta kertaa kiirehditty tähdentämään jonkinlaista kieletöntä auvoa saunan ytimenä. Siitä on tullut yksilön hiljentymisriitti. Siksi tuntuukin hienolta, että Samuli Paulaharju (1875–1944) korostaa teoksessaan Matkakertomuksia Karjalan kankahilta (1908) kokemista ja käsittämistä yhdessä tekemisenä ja jakamisena:

”Kun savu ja kitsku on haihtunut, mennään saunaan, pistetään ikkunaan sammaltype ja heittäydytään pehmeälle sillalle pitkäkseen, ja nautitaan suloisesta lämpimästä sekä kaskutah i pagistah. […] Koko kylän väki kun on niityllä, jo niillä siellä on hupaista, ja iltasin saunassa kaskut köytenään juoksevat.”

Santeri Lesosen musta kyly

Vienalaisilla lauteilla

”Niin huonoa talonpöksää ei löydy, ettei saunaa sen vieressä näkisi, ja ’kyly’ oli tavallisesti ensimmäinen, johon käskettiin, kun iltasilla tulimme taloon.”

Näin kirjoitti A. V. Ervasti (1845–1900) raportissaan Muistelmia matkalta Venäjän Karjalassa kesällä 1879 (1891). Muiden muassa hänen jalanjäljissään kävimme tutustumassa lähimmän sukulaiskansan tapoihin ja rakennelmiin. Kulkuvälineemme hajosi jo ensimmäisenä matkapäivänä, mutta ystävällisten paikallisten ihmisten avulla saimme liikutuksi eri puolilla tätä Murmanskin ja Aunuksen alueiden väliin jäävää tienoota.

Kuulimme monia tarinoita vanhoista ja uusista saunomisista. Kävi selväksi, että sauna on lujassa yhteydessä vieraanvaraisuuteen ja kestiystävyyteen.

Vienan-kävijöistä I. K. Inhan (1865–1930) teokseen Kalevalan laulumailta (1921) sisältyvä merkintä paikallisten ”käytännöllisestä luonnonlaadusta” vastaa hyvin nykytilannettakin. Tämän päivän vienalainen kyly on kompakti hirsirakennus, jossa on ahdas eteinen ja matala pieni löylyhuone. Laude on kapea, siinä missä sekakivillä täytetty ja usein löytö- tai ylijäämäaineksista toteutettu jatkuvalämmitteinen kiuas on kookas. Jos seinää aukottaa ikkuna, se voi olla suurikin.

Saunaa ei ympäröi järin paksu kaunopuhe tai uskomuspiiri. Valkie kyly miellyttää helppoudellaan, ja savusauna on menettänyt asemansa 80-luvun jälkeen. Kylissä näkee kyllä ikäkuluja mustia kylyjä, joista yhden emäntä kertoo toimivan sekä kesäisenä hikimajana että lihapalvaamona. Savusaunalle ominainen suuri kiuas on pitänyt pintansa myös uudemmissa hormisaunoissa. Rahkasammalta kerätään edelleen salvostilkkeeksi, mutta sitä tapaa rinnan niin pellavariveen kuin teollisen mineraalivillan kanssa.

Vuokkiniemellä moni muistaa yleisen saunan Ylä-Kuittijärven rannassa. Nyt kylyn seurallisuus riippuu perheiden tavoista, mutta keskustelu turistienkin kanssa laajentaa sitä.

Venehjärvellä on enää kaksi asukasta mutta kaksitoista saunaa. Inhan majapaikkana toimineen, 1813 rakennetun Hökkälän hirsitalon museoksi puuhanneen Santeri Lesosen oma huopakattoinen savusauna on tehty vuosituhannen vaihteessa suomalaisten matkailijoiden iloksi. Suloinen onkin sen hönkäys. Löylyjen jälkeen todistamme, kuinka kylän uusimpaan kylyyn hitsataan tulisijaa kuorma-auton vanteista.

Vuokkiniemi

”Pienoisia ovat saunat ja useat huononnäköisiä”, Paulaharju kirjoitti. Löylytilojen mataluuden takia lauteelle pääsi ilman jakkaraa ”ja sittenkin tahtoo pää kattoon kopsia”. Vieras otti kuitenkin pääasian pääasiana: ”Mutta hyvän löylyn ne antavat.” Myös Inha kehui ”täydellistä ja hyvää” kylyä: ”Löyly oli raikasta kuin lähdevesi.”

Vähiin jää täsmällisyys näissä kauniissa luonnehdinnoissa. Saunapuhetta on varaa tarkentaa huomattavasti tarvitsematta pelätä sen jotenkin haalentavan kokemusta. Löylyissä istuminen on kenties hyvinkin tekemisissä kokemisen ja kielen ulkorajojen kanssa, mutta sen harvasanainen sivuuttaminen taitaa johtua enemmän omasta ”niin hyvää ettei sanotuksi saa” -ajatusmallistamme kuin itse ilmiöstä.

Vienassa oli nautinnollista saunoa ja puhua saunomisesta. Niin, ja se vastojen tekemisen paras aika olisi kuulemma 7.–12. heinäkuuta. Raudusta olla pitää, Rosa Remsu muistuttaa, ”liukas hikikoivu ei käy.”

Vienalainen kyly

Kirjoittajat saivat kesällä 2018 toteutettuun aineistonkeruumatkaan Suomen tiedetoimittajain liiton apurahan. Jukka Mikkonen on filosofian tutkija Tampereen yliopiston yhteiskunta- ja kulttuuritieteiden yksikössä. Jarkko S. Tuusvuori NTAMO:n kustantaja, vapaa tutkija ja kirjoittaja.