Tekoälyn käytön etiikka opiskelussa ja tutkimuksessa

ChatGPT:n ja Bardin kaltaiset generatiiviset tekoälyt ovat käteviä moneen työhön. Ne pystyvät tuottamaan pohjia esseevastauksiin, Powerpoint-esityksiä, ohjelmakoodia ja melkein mitä tahansa merkkimuodossa esitettävää.

Mutta ei niin paljon hyvää, ettei jotain pahaakin. Tekoäly tuo uusia mahdollisuuksia tuottaa tekstiä, jonka alkuperä ja luotettavuus on epäselvä.

Generatiivisen tekoälyn taustalla olevat vuorovaikutteiset kielimallit on koulutettu internetin aineistolla, jossa paljon puhutut kielet korostuvat. Pienet kielialueet yrittävät pitää itsensä mukana kehityksessä rakentamalla omia malleja. Sellainen on esimerkiksi suomalainen FinGPT3.

Kielimalli-sana saattaa tuoda ensin mieleen kielenhuollon työkalut, kuten kieliopin ja oikeinkirjoituksen tarkistuksen. Vaikka ’kielimalli’ viittaa varsinaisesti ChatGPT:n, Google Bardin tai Microsoft Copilotin kaltaisiin tekstin tai muun informaation tuottamisen työkaluihin, myös muun muassa tavutus, kieliopin ja oikeinkirjoituksen tarkistus sekä erilaiset käännösohjelmat, parafraasi- ja tiivistelmätyökalut toimivat tekoälyn avulla.

Kielimalli on siis tietokoneohjelma, kuten ChatGPT, Bard tai Copilot, joka on opetettu ymmärtämään ja tuottamaan ihmiskieltä. Tällaisia ohjelmia kutsutaan myös boteiksi. Botti tarkoittaa määrätehtävää suorittavaa tietokoneohjelmaa, joka korvaa vaivalloista tai yksitoikkoista ihmistyötä. Botti on siis eräänlainen tietokoneohjelmien robotti, ihmistyötä korvaava automaatti.

Automaatteja ovat myös käännösohjelmat, kuten DeepL Translate ja Google Translate. Kääntämisen ohella niitä voidaan käyttää suorien lainausten häivyttämiseen. Siihen tarkoitukseen on myös useita englanninkielisiä täsmätyökaluja, kuten QuillBot ja ProWritingAid.

Tekstinkäsittelyohjelman avulla tapahtuvaan kieliopin ja oikeinkirjoituksen tarkistukseen ei juuri liity eettisiä ongelmia. Kielikurssin opettaja voi haluta pedagogisista syistä kieltää opiskelijoiltaan tekstinkäsittelyohjelman oikolukutoiminnon käytön kirjoitustehtävän yhteydessä. Automaattisen tavutuksen eettiset ongelmat ovat olemattomat. Suhteellisen ongelmattomana pidetään myös tekoälyavusteista tiedonhankintaa, googlaamista, kunhan se ei johda verkkoaineistojen plagiointiin tai lähdekritiikin unohtamiseen.

Eettisiä kysymyksiä herää, kun aletaan puhua uuden tekstin tuottamisesta tai olemassa olevan tekstin muokkaamisesta tekoälyn avulla. Kieliopin ja oikeinkirjoituksen tarkistusta pidetään mekaanisena työnä, jossa inhimillinen toimijuus ja luovuus eivät ole ratkaisevassa roolissa. Sen sijaan uuden tekstin tuottaminen ja parafraasien tekeminen vaativat ihmiseltä luovaa ajattelua.

Kirjoitustyötä voi merkittävästi vauhdittaa tekoälyn avulla. Aivoja eli ihmisen luovaa panosta ei kuitenkaan voi jättää narikkaan tekoälyä käytettäessä. Valaisevien kysymysten keksiminen ja muokkaaminen tekoälyn vastattaviksi vaatii käytännöllistä järkeä ja asiantuntemusta. Ihmistä tarvitaan myös tekoälyn antamien vastausten arviointiin ja tarkistamiseen sekä tekstin viimeistelyyn.

Tekoälyn käytön eettisen arvioinnin kannalta tärkeä kysymys on tarkasteltavan toiminnan mekaanisuus tai luovuus. Mekaanisen toiminnan ja luovan panoksen välinen ero ei aina ole suuren suuri.

Tekoälyn käytöstä mekaanisiin tehtäviin, kuten kieliopin tai oikeinkirjoituksen tarkistukseen, ei tarvitse ilmoittaa opinnäytetöissä tai tutkimusjulkaisuissa. Sen sijaan uuden tekstin tuottamisesta tekoälyn avulla pitäisi kertoa. Uuden tekstin tuottamisena voidaan pitää myös parafraasien tekemistä.

Parafraasityökaluja käytetään ainakin kahteen tarkoitukseen. Ne auttavat parantamaan tekstin luettavuutta, ja niiden avulla voi välttää suorien lainausten esittämistä. Suorat lainaukset voivat olla peräisin toisen tekijän tekstistä tai kirjoittajan omasta julkaisusta. Parafraasityökalun avulla tekstiä voi muokata niin, että plagiaatintunnistus ei hälytä. Samaan tarkoitukseen voidaan käyttää myös käännösohjelmia.

Opinnäytetöissä ja tutkimustekstin tuottamisessa tekoälyn käytön laajuus, luonne ja merkittävyys voivat vaihdella suuresti alkaen vaikkapa siitä, että tekoälyä käytetään kirjallisuuden etsimiseen tai tutkimusaiheen ideointiin ja kartoitukseen, ja päätyen siihen, että yksittäinen kappale tai laajempi tekstijakso on kokonaisuudessaan tekoälyn kynästä. Kun ajaa esimerkiksi ChatGPT:n luoman tekstin QuillBotin läpi, syntyy kieliopillisesti virheetöntä, ellei jopa sujuvaa, englanninkielistä tekstiä, jota ei ole plagioitu mistään julkaisusta mutta joka ei kuitenkaan ole tekijän omaa sanan vahvimmassa ja luovimmassa merkityksessä.

Suomalaiset yliopistot ovat kansainväliseen tapaan julkaisseet omia suosituksiaan tekoälyn käytöstä. Tekoälyn käyttöä ei kielletä, vaan käytöstä ohjataan kertomaan avoimesti. Kuten todettu, tekoälyä käytetään moniin sellaisiinkin tehtäviin, joista ei tarvitse ilmoittaa, kuten vaikkapa googlaamiseen tai kieliopin ja oikeinkirjoituksen tarkistukseen. Yliopistojen suosituksissa viitataan erityisesti ChatGPT:n ja Bardin kaltaisten bottien käyttöön.

Bottien käytön eettiset ongelmat kiertyvät informaation luotettavuuteen liittyvien kysymysten lisäksi erityisesti tekijyyden ja plagiaatin käsitteiden ympärille. Plagiointi tarkoittaa toisen tekijän tekstin, musiikin tai muun taiteelliseen tai tieteellisen tuotannon esittämistä omanaan. Herää kysymys, onko tekoälyä kohdeltava toisena tekijänä samaan tapaan kuin toista ihmistä. Suomalaisten yliopistojen ohjeet näyttäisivät viittaavan siihen: tekoäly on toinen tekijä, ja siksi tekoälyn käytöstä tulisi kertoa. Kuulostaa suhteellisen selkeältä. Silti kysymyksiä herää ohjeen tulkinnasta.

Ensinnäkään tekoälyä ei saa nimetä tekstin tai muun kirjallisen tuotoksen kirjoittajaksi, sillä tekoäly ei voi ottaa vastuuta tekstin sisällöstä. Kaiken kirjallisen materiaalin kielellisestä ja sisällöllisestä oikeellisuudesta kantavat vastuun ihmiset.

Esimerkiksi Helsingin yliopiston ja Vaasan yliopiston ohjeiden mukaan tekoälyä saa käyttää kirjoittamisen tukena ja tekstinhuollossa. Opiskelijan tulee kuitenkin ilmoittaa kirjallisesti, mikäli tekoälyä on käytetty opintosuorituksessa, kuten opinnäytteessä. Ilmoituksesta tulee käydä ilmi, mitä kielimallia eli bottia on käytetty ja millä tavalla.

Tätä kirjoittaessa tiedossani ei ole, että tieteelliset aikakausjulkaisut vaatisivat artikkelien kirjoittajilta tekoälynkäyttöilmoituksia. On kuitenkin mahdollista, että sellaisia aikakausjulkaisuja on jo olemassa.

Yliopistojen ohjeiden perusteella olennaista on, että bottia on käytetty kirjoittamiseen. Jos ChatGPT:tä käyttää kirjallisuuden etsimiseen, se on rinnastettavissa googlaamiseen. Esimerkiksi gradussa ei tarvitse kertoa, että on googlannut tai tarkistanut kieliopin Wordin kirjoitinavustajalla, vaikka nekin toimivat tekoälyn avulla.

Lähdekritiikki on välttämätöntä, kun käyttää ChatGPT:tä tai muita botteja. Ne keksivät säännöllisesti kuvitteellisia tai virheellisiä lähdeviittauksia vastatessaan tutkimuskysymyksiin. Tätä kutsutaan tekoälyjen hallusinoinniksi. Kielimallien ongelmat eivät kuitenkaan liity pelkästään faktuaalisiin virheisiin tai puutteelliseen tietoon vaan myös siihen, että ne eivät ymmärrä maailmaa, saati ihmisten elämää.

Bottien hallusinaatiot johtuvat pohjimmiltaan siitä, että kielimalli on todennäköisyysfunktio, joka muodostaa lauseita valitusta aihepiiristä internetin tekstiaiheistoihin sisältyvien sanojen todennäköisyysjakauman perusteella. Sanojen valintaperuste ei siis ole niistä muodostuvien lauseiden totuus, vaan sanojen todennäköisyysjakauma. Tästä syystä tekoälyjen hallusinointi ei välttämättä ole nykytekniikoilla ratkaistavissa.

Oman kokemukseni mukaan botit ovat luotettavampia tehdessään käsiteanalyysejä kuin esittäessään faktuaalista informaatiota. Osuva nimi on annettu Googlella, jonka Bard-botti eli bardi tarkoittaa muinaiskelttiläistä runoilijaa ja laulajaa.

Entäpä QuillBotin parafraasityökalun käyttö? Pitäisikö siitä ilmoittaa opintosuorituksessa tai tutkimustekstissä? Ensinnäkin parafraasien käyttö voi olla taitavaa tai kömpelöä. Vaatii luovuutta ja kielitajua valita sopiva parafraasi. Edellä totesin alustavasti, että parafraasien tekeminen voidaan rinnastaa uuden tekstin kirjoittamiseen. Jos niin on, parafraasityökalun käytöstä pitäisi ilmoittaa – erityisesti, jos sitä käytetään suorien lainausten häivyttämiseen.

Käytännössä tällainen ilmoitus voi tarkoittaa, että kirjoittaja pyrkii parafraasin avulla välttämään plagiaatintunnistuksen tekemän hälytyksen. Parafraasityökalun käyttöä koskeva ilmoitus voi siis olla epäsuora tunnustus, että plagiointia on peitelty. Tällainen tunnustus taitaa jäädä useimmilta kirjoittajilta tekemättä.

Suhtautumista asiaan voi mutkistaa se, että suorien lainausten häivyttämistä tapahtuu myös ilman parafraasityökalujen apua. Toisen viestimän asian sanominen omin sanoin on akateemisessa kirjoittamisessa hyväksyttyä ja jopa suotavaa edellyttäen, että kirjoittaja viittaa käyttämäänsä lähteeseen.

Eräs tekoälyn käyttöä koskevaan eettiseen herkkyyteen eli opiskelijan tai tutkijan omaantuntoon vaikuttava seikka on käytön yleisyys. Jos monet, elleivät useimmat, opiskelijat ja tutkijat käyttävät tekoälyä myös uuden tekstin tuottamiseen, mutta kovin moni ei ilmoita siitä, tekoälyn käyttöä koskeva ilmoitusvelvollisuus jää kuolleeksi kirjaimeksi.

Riski tähän on suuri, sillä tekoäly voi suuresti helpottaa ja nopeuttaa kirjoitustyötä, mutta sen käytöstä ilmoittamista saatetaan pitää nolona ja alentavana. Huonon omantunnon lääkitsemiseksi saatetaan alkaa uskotella itselle ja muille, että botin tai parafraasityökalun käyttö on eettisesti yhtä ongelmatonta kuin kielenhuolto – etenkin jos ei käytä botin kirjoittamaa tekstiä sellaisenaan, vaan muokkaa siitä oman näköistä.

Tätä voi verrata ruuanlaittoon. Valmiskastike nopeuttaa ruuanvalmistusta ja hieman tuunattuna kastike voi maistua kuin itse tehdyltä. Kokki ei välttämättä halua paljastaa valmiskastikkeen käyttöä ruokailijoille.

Oma kysymyksensä on, millainen tekoälynkäyttöilmoituksen pitäisi olla. Riittääkö yleisluonteinen ja määrämuotoinen, rasti ruutuun -tyyppinen ilmoitus, että tekoälyä on käytetty uuden tekstin tuottamiseen, kääntämiseen tai parafraasien ja tiivistelmien tekemiseen? Vai pitäisikö tekoälyn avulla tuotetut, käännetyt tai muokatut osuudet merkitä esimerkiksi alaviitteellä? Ja pitäisikö suoria lainauksia muokkaavien parafraasien yhteydessä ilmoittaa myös alkuperäinen teksti? Entä pitäisikö sopia prosentuaalinen yläraja sille, kuinka suuri osa tutkimustekstistä saa olla botin kynästä?

Erityisesti kolmeen viimeiseen kysymykseen voi olla houkutus vastata ’ei’ – muuten voidaan päätyä kömpelöihin ja väkinäisiin ratkaisuihin.

Suomessa Tutkimuseettinen neuvottelukunta (TENK) ei välttämättä haluaisi antaa yksityiskohtaisia eettisiä ohjeita tekoälyn käytöstä. Se on ymmärrettävää, koska tekninen kehitys etenee niin nopeasti, että tänään annettu ohje saattaa huomenna näyttää vanhentuneelta.