Japanilainen muumifani kysyi, mitä tarkoitetaan, kun sanotaan, että jollain ei ole kaikki muumit laaksossa. Vastaajan mukaan ilmaisu vihjaa leikkisästi, että puheena oleva henkilö on hieman kaheli. Kysyjä jäi kuitenkin ihmettelemään, miksi on hullua, että kaikki muumit eivät ole laaksossa.
Käännöskoneet ovat ymmärtäneet suomen kieltä melko huonosti, mutta kehitys kehittyy tälläkin saralla. CSC:n datakeskuksessa Kajaanissa on viime syksynä otettu käyttöön maailman nopeimpiin kuuluva supertietokone ja syväoppiva neuroverkko LUMI. Sen avulla kehitettävä käännösohjelma ei tarvo umpihangessa, vaan hyödyntää valtavaa määrää valmiiksi tallattuja polkuja eli olemassa olevia käännösaineistoja.
Yksi käännösohjelmien, myös LUMI:lla kehitettävän, koetinkivi on eri kielten idiomit ja kielikuvat. Niiden merkitys ei käy selvästi ilmi ilmaukseen kuuluvien sanojen kirjaimellisesta merkityksestä.
Ajatellaanpa vaikka lausetta ”hänellä ei ole kaikki muumit laaksossa”. Lause viittaa oletettuihin puutteisiin puheena olevan henkilön henkisissä ja älyllisissä kyvyissä. Samaan viitataan sanomalla, että ”hänellä ei ole kaikki inkkarit kanootissa”. Tilanteissa, joissa näitä lauseita käytetään, voitaisiin myös todeta, että puuttuu älliä ja että ymmärrys hoi, älä jätä!
Edellisten sijaan voitaisiin sanoa myös, että ”hän ei ole laatikon terävin veitsi” tai ”penaalin terävin kynä”. Nämäkin viittaavat älyn ja järjen puutteeseen – siihen, että järki ei leikkaa tai hahmota selkeästi.
Tällaiset lauseet ovat pähkinä purtavaksi ammattikääntäjillekin. Vaikeus liittyy paitsi eri kielten idiomien tilanne- ja käyttäjäsidonnaisuuteen, myös idiomien kulttuurisen taustan rikkauteen ja vajavaiseen vastaavuuteen suomalaisten idiomien kanssa. Tämä on iso haaste käännösohjelmille.
Otetaanpa esimerkiksi kuvitteellinen ilmaus, joka on periaatteessa saman tyyppinen kuin edellä mainitut, oikeasti käytetyt ilmaukset: ”Hänellä ei ole kaikki vaunut tallissa.” Sekin voisi viitata puutteisiin henkisissä, eettisissä tai älyllisissä kyvyissä, tiedoissa tai taidoissa. Tarkoitettaisiin, että puheena olevalta henkilöltä puuttuvat kyvyt ja välineet käsitellä jotain asiaa.
Saman tyyppinen keinotekoinen ilmaus olisi ”hänellä on operaatioissa viivettä”. Lause voisi viitata järjenjuoksun hitauteen – siihen, että ei sytytä eikä snaijaa. (Snaijata saattaa olla lainaa venäjältä: ja znaju, minä tiedän.)
Nämä kuvitteelliset esimerkit voitaisiin ymmärtää samantapaisten, oikeasti käytössä olevien ilmausten pohjalta – sellaisten kuin ”hänellä ei ole kaikki muumit laaksossa” ja ”ruuvit ovat löysällä”.
Tekoäly voisi generoida keinotekoisia idiomeja mielin määrin. Jos niitä on vaikea ymmärtää, se johtunee ensisijaisesti siitä, että keinotekoiset idiomit eivät ole tuttuja eivätkä yleisessä käytössä.
Silti keinotekoinenkin idiomi voi olla ymmärrettävä, jos se on suhteellisen helposti tulkittavissa asiayhteyden ja tunnetun, yleisesti käytetyn idiomin pohjalta. Uusia idiomeja ja kielikuvia syntyy eri kieliin jatkuvasti.
Idiomin sanatarkka kääntäminen voi olla helppoa kuin heinänteko. Onnistuu Google Translateltakin. Käännöksen ymmärrettävyys voi kuitenkin vaatia joko selitystä tai vastaavanlaisen (= lähelle tulevan) idiomin tunnistamista kohdekielessä.
Käännösohjelman tapauksessa idiomiymmärrys voi vaatia paljon käyttö- ja käännösesimerkkejä. Se voi vaatia myös sitä, että käännösohjelma kykenee tunnistamaan ajatusyhteyksiä ja -malleja, vivahteita sekä historiallisia ja kulttuurisia ilmiöitä (kuten muumit ja inkkarit). Lisäksi tarvitaan lähdekielen ja kohdekielen kulttuuritaustassa olevien erojen ja yhtäläisyyksien tunnistamista. Sitä voisi ilmentää tekoälyn kyky generoida uskottavia keinotekoisia idiomeja, jotka käännöksinäkin säilyttävät katu-uskottavuutensa.
Edelleen voi kuitenkin ihmetyttää, miksi on hullua, että kaikki muumit eivät ole laaksossa. Muumithan kyllä rakastavat laaksoaan, mutta tykkäävät seikkailla myös muualla. Tässä tapauksessa hillokellarin avain taitaa piillä siinä, että jotain hyvää ja tärkeää on poissa, puuttui siten muumeja tai järkeä. Sarkasmi on ihmisellekin vaikea laji, saati sitten tekoälylle.