Lähteiden merkitsemisestä populaareissa tietoteksteissä on käyty nyt ennennäkemättömän avointa keskustelua Maria Petterssonin Suomen historian jännät naiset -kirjan kirvoittamana.
Keskustelua seuratessa en ole voinut välttyä vertaamasta sitä pohdintaan, jota parhaillaan käydään mediataloissa, yliopistoissa ja oppilaitoksissa tekoälyllä tuotetun materiaalin etiikasta. Tekoälyn tuottama sisältö perustuu viime kädessä toisten tekemän henkisen työn lainaamiseen tai ryöstämiseen, näkökulman jyrkkyydestä riippuen. Mutta eroaako tämä lopulta siitä, mitä me tiedettä yleistajuistavat toimittajat teemme?
Suollan jatkuvasti juttuja aiheista, joista en tiedä entuudestaan mitään. Silloin toimin kuin kuka tahansa meistä: avaan hakukoneen ja alan kahlata läpi taustatietoa. Samaan tapaan työskentelevät Chat GPT ja muut vastaavat kielimallit, kun niitä pyytää keräämään tietoja ja esittämään ne toivomansa kaltaisessa muodossa – vaikkapa yleistajuisen uutisen formaatissa.
Emme voi tietää, mitä kaikkea tekoäly on tekstin tuottaakseen “lukenut”, mutta samaa voi sanoa toimittajan kirjoittamasta tekstistä. Journalistisessa kirjoitusperinteessä lähteitä ei merkitä välttämättä lainkaan. Toimittaja kirjoittaa hankkimansa tiedot faktana ja omissa nimissään, oli lähteenä sitten Wikipedia, haastattelu tai vertaisarvioitu tutkimus. Tiedejournalismissa tässä ollaan vähän tarkempia, mutta tieteellisen kirjoittamisen käytäntöjä ei silti edes yritetä seurata. Itsekin merkitsen lähdeteosten sivunumerot ja linkit vain omaksi tiedokseni juttuni taustamuistioon, mutta valmiissa lehtijutussa mainitsen usein vain yhden tai kaksi lähdettä, oli valmista tekstiä sitten palstan tai neljä aukeaman verran.
Miksi moinen leväperäisyys ja lähteiden pimitys? Miten tämä on yleisön luottamukseen perustuvassa ammatissa edes mahdollista?
Journalistiset lähteytyskäytännöt syntyivät palvelemaan yleisöä tyystin toisenlaisessa mediaympäristössä kuin missä nyt elämme. Painetuissa lehdissä sen paremmin kuin televisiossa tai radiossakaan ei ole aikaa tai tilaa luetella jokaista jutun lähdettä – palstamillit ja sekunnit pyhitetään sisällölle.
Nykyään verkkojutuissa voisi lähteyttää halutessaan vaikka joka sanan. Se ei silti ole muuttanut kulttuuria, jossa toimittajan roolina on kerätä, arvottaa ja yhdistellä tietoa oman yleisön tarpeisiin – ja jossa suurinta osaa yleisöstä ei juuri kiinnosta, mistä väitteet ovat peräisin ja miten ne on hankittu. Usein ainoa henkilö, joka kysyy lähteideni perään, on juttuni verkkoversiota käsittelevä tuottaja, joka haluaisi lisätä tekstiin linkkejä. Klikkaako niitä lopulta kukaan, en tiedä, sillä oli linkkejä tai ei, yleisöltä tulee aiheesta yhteydenottoja ehkä kerran vuodessa.
Tätä vasten keskustelu tekoälyn polkemista tekijänoikeuksista vaikuttaa ainakin journalistisessa kehyksessä vähän tekopyhältä. Ovatko toimittajien tuottamat tekstit tältä osin sen eettisempiä? Ja onko sillä yleisölle edes merkitystä?
Epäilen, että ei. Yhdysvaltalaislehti Sports Illustrated jäi hiljattain kiinni tekoälyllä kirjoitetuista jutuista, jotka oli naamioitu olemattoman toimittajan tekemiksi. Tapaus olisi kohahduttanut tuskin lainkaan, jos jutut olisi alunperinkin nimetty tekoälyn tuottamiksi – eihän ketään kiinnosta sekään, että tekoäly kirjoittaa nykyään Hesarin juttuihin tiivistelmiä.
Nyt kun Petterssonin kirjasta syntynyt kohu on saatu päätökseen, meidän tiedetoimittajien on paikallaan siirtyä pohtimaan sitä, millaisten sisältöjen tuottamiseen tiedetoimittajia jatkossa tarvitaan. Lukea ja tiivistää osaa konekin.