Helppo automaattinen litterointi – Näin teet nauhoitteesta litteraatin Microsoft Word Onlinessä

Yleinen

Microsoft Wordin verkkoversiossa on mahdollista litteroida valmiiksi nauhoitettuja teksteijä konelitteroinnin avulla. Wordin verkkoversio on käytössä niin Vaasan yliopistossa kuin useissa muissa suomalaisissa korkeakouluissa osana koululle hankittua Office365-tilausta. Käytännössä, mikäli koulun tai työpaikkasi sähköpostipalveluna on Outlook, on todennäköisesti myös Wordin verkkoversio käytössä.

Word Onlinen litterointi toimii varsin hyvin, ja olen huomannut sen litteroivan myös suomenkieliset haastattelutekstit suhteellisen valmiiksi litteraateiksi, joissa myös eri puhujien osuudet on valmiiksi eritelty. Kuten aina, nauhoitustilanteen äänenlaatuun on hyvä kiinnittää huomiota, koska hälinä, taustamelu ja muuten huono äänenlaatu huonontavat todennäköisesti myös litteraatin laatua. Äänentunnistusohjelma ei välttämättä kuule huonolaatuisen nauhoitteen sanoja oikein.

Kannattaa myös muistaa, että Word Onlinen tuottama litteraatti on äänentunnistusohjelman tekemä litteraatti, eikä siten välttämättä sataprosenttisen tarkka kuvaus nauhoitteen sisällöstä. Mikäli sinun tutkimuksellesi on tärkeää, että litteraatti kuvaa äänitettä mahdollisimman tarkasti, suosittelen, että litteraatin käy vielä itse läpi samalla alkuperäistä äänitettä kuunnellen ja litteraattia äänitteen mukaiseksi korjaten.

Word Onlinen litteraattipalvelussa on aikarajoite ainakin Vaasan yliopistolla käytössä olevassa versiossa: yhden kuukauden aikana on mahdollista litteroida enintään 300 minuutin verran äänitteitä. Jos kerralla litteroitavia nauhoitteita on siis yli 5 tuntia, Word Online ei ole välttämättä oikea työkalu.

Word Onlinen tukemia tiedostomuotoja ovat .wav, .mp4, .m4a ja .mp3, joten yleisimpien äänitiedostojen ja esim. Zoomilla, Teamsilla tai iPhonella nauhoitettujen haastattelujen litteroinnin tulisi onnistua suoraan tiedostoista.

Word Online siirtää äänitiedoston Microsoftin palvelimelle litterointia varten. Tämän vuoksi Word Onlinen litterointiominaisuutta käyttäessä tulee muistaa informoida haastatteluun osallistuvia henkilöitä henkilötietojen ja nauhoitteen siirtämisestä palveluun. Informointi koskee toki myös minkä tahansa muiden ulkopuolisten litterointipalvelujen käyttöä, oli kyseessä sitten äänentunnistusohjelman tai jonkin ihmisen tekemä litterointi. Microsoftin mukaan äänitiedosto siirretään vain litterointia varten eikä litteraattia tai äänitettä säilötä palvelimille muuten. Noudata informoinnissa ja tutkimuksen tietosuoja-asioissa ohjaajasi ja yliopiston ohjeistuksia.

Kannattaa tiedostaa, että kaikki nauhoitteella mainitut asiat siirtyvät myös ulkopuolisille palvelimille. Itse vähintäänkin informoisin haastateltavaa tästä ennen haastattelua sekä leikkaisin nauhoitteesta pois kaiken epäolennaisen (esim. mahdolliset jutustelut ennen ja jälkeen varsinaista haastattelua) ennen nauhoitteen lataamista Word Onlineen.

Kuvaan seuraavassa tiiviisti 4 askeleen kautta, kuinka tekstin litterointi onnistuu Word Onlinessä.

1. Lataa nauhoite tietokoneelle

Jotta nauhoitteen siirtäminen litteroitavaksi Wordissa onnistuu, tulee se siirtää ensin tietokoneelle. Siirrä nauhoite siis sopivaan kansioon tietokoneella laitteesta, jolla olet nauhoittanut haastattelun.

Muista myös varmuuskopioida alkuperäinen nauhoite, jotta se säilyy tallessa ja jotta tarvittaessa voit myös myöhemmin tarkistaa, että litteraatti vastaa äänitettä.

2. Luo uusi tiedosto Word Onlinessä.

Olen huomannut, että Wordin verkkoversioon on usein helpointa päästä Outlookin kautta, koska sähköpostia tulee käytettyä usein ja Outlookiin on usein myös valmiiksi kirjautunut.

Pääset Word Onlineen helposti vasemman yläkulman neliönmuotoisesta valikosta:

Toinen vaihtoehto on siirtyä Wordiin osoitteen portal.office.com kautta.

Luo seuraavaksi Word Onlinessä uusi tyhjä tiedosto (Blank document).

3. Lataa litteroitava äänitiedosto Word Onlineen

Seuraavaksi on aika ladata tietokoneelle siirretty äänitiedosto Word Onlineen.

Klikkaa uuden tyhjän tiedoston avauduttua yläreunan Koti (Home) -välilehdeltä löytyvän mikrofonikuvakkeen vieressä olevaa pientä nuolta ja valitse aukeavasta valikosta Litteroi (Transcribe).

Tämän jälkeen ikkunan oikeaan reunaan avautuu litterointivalikko. Valitse pudotusvalikosta kieleksi nauhoitteesi kieli – englannin lisäksi myös molemmat kotimaiset ja monet muut kielet löytyvät valikoimasta.

Klikkaa tämän jälkeen Lataa äänitiedosto (Upload audio) -painikeesta ja valitse tietokoneelta löytyvä äänitiedosto, jonka haluat litteroida.

Tämän jälkeen Word lataa tiedoston Microsoftin palvelimille ja luo litteraatin. Äänitteen litteroinnissa voi mennä useampikin minuutti äänitteen pituudesta riippuen.

Äänite tallentuu myös tiliisi liitettyyn OneDrive-pilvipalveluun Transcribed Files -kansioon. Näin siis ainakin Vaasan yliopistolla.

4. Tarkista litteraatti ja lisää se tyhjään tiedostoon

Kun litteraatti on valmis, se ilmestyy puhuja- ja aikakoodeineen oikean reunan litterointivalikkoon.

Litterointivalikon näkymästä on helppo tarkistaa litteraatin paikkansapitävyys. Klikkaamalla play-painiketta Word toistaa nauhoitteen ja korostaa nauhoitteessa esiintyvän kohdan litteroidun osan.

Klikkaamalla litteroitujen pätkien kohdalla olevaa kynää on kutakin litteroitua pätkää mahdollista muokata. Tämä on kätevä esimerkiksi mikäli äänentunnistusohjelman väärin tunnistamien kohtien korjauksessa. Lisäksi puhujien nimet on mahdollista muuttaa kuvaavammiksi.

Litterointivalikon alareunan Lisää dokumenttiin (Add to document) -painikkeesta on mahdollista siirtää litteroitu teksti tyhjään dokumenttiin. Voit valita, tahdotko siirtää pelkän litteroidun tekstin, litteroidun tekstin ja puhujatiedot, litteroidun tekstin ja aikaleimat, vai nämä kaikki kerralla.

Litteraattia on mahdollista sitten muokata ja siistiä esimerkiksi Wordin ehdottamien pisteiden ja välimerkkien osalta myös itse dokumentissa.

Tässä alla esimerkki Word Onlinen tuottamasta muokkaamattomasta litteraatista:

“Tämä on esimerkki nauhoite esimerkki litterraattia varten. Ja kokeilen tällä. Word onlinen. Litteraatio ominaisuuden toimivuutta. Aion ladata tämän äänitiedoston tietokoneelle ominaisuuden testaamista varten. “

Ja tässä versio, josta on korjattu kirjoitusvirheitä, yhdyssanoja sekä pisteiden paikkoja:

“Tämä on esimerkkinauhoite esimerkkilitteraattia varten, ja kokeilen tällä Word Onlinen litteraatio-ominaisuuden toimivuutta. Aion ladata tämän äänitiedoston tietokoneelle ominaisuuden testaamista varten.”

Yhteenveto

Esimerkkinauhoitteen kohdalla lopputulos oli varsin hyvä ja litteraatti vastasi nauhoitetta oikeastaan täydellisesti. Parhaimmillaan tutkijan tehtäväksi jääkin vain litteraatin ja nauhoitteen vastaavuuden tarkistus sekä pienten luettavuutta helpottavien korjausten tekeminen, mikä nopeuttaa litterointia huomattavasti suhteessa täysin käsin tehtyyn litterointiin.

Word Online ei huomioi litteraateissa kuitenkaan taukoja, äänenpainoja, äänensävyjä ja/tai muita äännähdyksiä. Mikäli on tarve tällaiselle tarkemmalle litteraatille, Word Onlinen litterointiominaisuus ei ole oikea työkalu.

Viiden tunnin kuukausittainen aikaraja asettaa myös rajoitteita Word Onlinen käyttämiselle. Mikäli suunnittelet Word Onlinen käyttöä, kannattaakin litteroida äänitteet mahdollisimman pian äänityksen jälkeen, jotta aikaraja ei täyty kerralla ja ehtii parhaimmillaan uusiutua useamman kerran tutkimusprojektin aikana.

Ville-Pekka Niskanen

Ville-Pekka Niskanen - Toteutus & teksti