Kansainvälistä viestintää käännöstoimiston silmin

Miten käännösmuistit toimivat?

Kirjoittaja Translatum Oy | 27.8.2014

Koneella kääntämisen juuret 1950-luvulla

Tietokoneita on pyritty valjastamaan kielenkääntämisen tehtäviin jo varhain – ensiyritykset tapahtuivat 1950-luvulla, jolloin motivaattorina toimivat kylmä sota ja maanpuolustustarpeet. Tuolloin tavoitteena oli kehittää konekäännösjärjestelmä, joka kääntäisi automaattisesti vastapuolen viestit omalle kielelle.

Sittemmin keskityttiin pitkään kehittämään automaattikääntämisen sijaan tietokoneavusteista kääntämistä. Siinä kääntäjä hyödyntää työssään erityisesti kääntämisen tehostamiseen suunniteltuja tietoteknisiä työkaluja, kuten käännösmuisti- ja terminhallintatyökaluja. Käännösmuistiohjelmat eivät siis tuota käännöksiä automaattisesti vaan luovat ehdotuksia aiempien käännösten perusteella etsimällä teksteistä virke- ja lausetason vastaavuuksia.

Ensimmäiset kaupalliset käännösmuistisovellukset ilmestyivät 1980-luvulla, ja 1990-luvulta lähtien käännösmuistiohjelmia on käytetty laajalti muun muassa ammattimaisissa käännösorganisaatioissa sekä muissa paljon käännöksiä tuottavissa organisaatioissa, yhtenä esimerkkinä Euroopan unioni.

Käännösmuisti toimii kääntäjän lisämuistina

Käännösmuistiohjelma jäsentää käännettävän tekstin lause- tai virketason yksiköiksi, joita kutsutaan segmenteiksi. Kun kääntäjä sitten ryhtyy kääntämään tekstiä, ohjelma tarjoaa tekstikatkelmia käännettäväksi segmentti kerrallaan. Aina kun kääntäjä siirtyy segmentistä seuraavaan käännettyään edellisen, ohjelma tallentaa tekstin ja sen käännöksen tietokantaansa. Kun sama tai samankaltainen tekstisegmentti tulee seuraavan kerran vastaan, ohjelma osaa ehdottaa jo kertaalleen luotua käännöstä.

Se, miten paljon hyötyä käännösmuistista on, riippuu täysin käännettävän tekstin luonteesta: se on sitä käyttökelpoisempi, mitä enemmän toistoa tekstin sisällä on tai mitä samankaltaisempia käännettävät tekstit kerrasta toiseen ovat. Käännösmuistin ehdotuksista on paljon hyötyä esimerkiksi käännettäessä jonkin tietyn tuotevalmistajan käyttöohjeita tai tuoteluetteloja. Kaunokirjallisuuden kääntäjät taas eivät perinteisesti käännösmuistiohjelmia juuri käytä.

Käännösmuistien käyttämisestä on etuja niin kääntäjälle kuin käännösten tilaajallekin. Käännösten kustannukset ovat sitä edullisempi, mitä enemmän käännösmuistia voidaan hyödyntää. Muistityökalun käyttäminen myös varmistaa, että käännöksestä tulee sisäisesti johdonmukainen ja että siinä käytetään samoja termejä ja käsitteitä kuin aiemmissa käännöksissä.

Käännösmuistillakin on rajansa

Perinteinen käännösmuisti vaatii aina pohjakseen aiemman käännöksen voidakseen tuottaa minkäänlaisen käännösehdotuksen. Kun käännösmuistiohjelma otetaan käyttöön uudelle asiakkaalle tai projektille, se on aluksi tyhjä – muistin rakentaminen alkaa puhtaalta pöydältä. Aivan alkuvaiheessa kääntäjälle ei siis muistityökalusta juuri apua ole, vaan hyödyt ilmenevät vasta käännöstyössä pidemmälle päästäessä.

Joskus käännösmuisti voidaan kuitenkin luoda sellaisestakin aiemmasta käännöksestä, jota ei alun perin ole käännetty muistityökalua käyttäen. Jos käytettävissä on sähköisesti muokattavassa muodossa saman tekstin alkuperäisversio ja sen käännös, alkuperäistekstin ja käännöksen segmentit voidaan kohdentaa manuaalisesti. Tässä on kuitenkin huomioitava kustannukset, koska käsityönä tehtävä kohdentaminen on aikaa vievää.

Lisäksi käännösmuistiakin täytyy hoitaa. Periaatteessa mitä laajempi käännösmuisti on, sitä paremmin sitä voidaan hyödyntää. Isojen muistien hallinta vaatii kuitenkin tiettyä järjestelmällisyyttä.

Jos samaa muistia käytetään eriaiheisten tekstin kääntämiseen, voi käydä niin, että sama termi saa erilaisen käännöksen yhteydestä riippuen. Kun muistiin pääsee erilaisia käännöksiä, joista kaikki ovat yhteydestä riippuen oikein, sekaannuksen riski on suuri, ainakin jollei käännöksen yhteyteen ole tallennettu tietoa sen oikeasta kontekstista. Myös mahdolliset epätäsmälliset käännökset on hyvä kitkeä muistista pois mahdollisimman alkuvaiheessa, jotta ne eivät pääse kertautumaan.

Käännösteknologian seuraava askel: muistista älyyn

Perinteisten käännösmuistiohjelmien rajoitteena on se, että ne käsittelevät kieltä vain pintatasolla. Ne eivät ymmärrä mitään kielen rakenteesta eivätkä osaa soveltaa aiempien käännösten sisältämää kieliopillista tietoa. Uuden tekstin on siis vastattava aiempaa tekstiä melkoisen tarkkaan, jotta käännösmuistiohjelma osaa ehdottaa käännöstä.

Näihin haasteisiin pyritään vastaamaan kehittelemällä uudenlaisia käännössovelluksia, joissa hyödynnetään käännösälyä.

Käännösälyyn perustuva konekäännösohjelma on oppimiskykyinen: se osaa soveltaa käännöstietokantaan kertynyttä tietoa ja tehdä päätelmiä lähde- ja kohdekielen rakenteiden vastaavuuksista. Ja siinä missä käännösmuisti on alkuun tyhjä, käännösälysovellukset käyttävät lähtökohtaisesti valmista yleistietokantaa. Ne käsittelevät lyhyehköjä, neljän viiden sanan mittaisia yksiköitä, joten vastaavuuksien löytyminen on todennäköisempää kuin kokonaisia virkkeitä tai lauseita verrattaessa. Lyhyemmät yksiköt ovat myös riippumattomampia tekstilajista kuin pidemmät. Konekäännösohjelma osaakin poikkeuksetta luoda ainakin jonkinlaisen käännösehdotuksen.

Vaikka ammattikääntäjien pääasiallisena työkaluna toistaiseksi toimivat perinteisemmät käännösmuistisovellukset, käännösten automatisoinnissa piilee paljon potentiaalia. Lue tästä tarkemmin aiemmasta blogiartikkelistamme Kone kääntäjänä – mihin se soveltuu?

Tutustu blogiimme!

Translatumin blogissa jaamme näkemyksiämme käännösalan, kansainvälisyyden ja kielen ajankohtaisista ilmiöistä.

Tilaa blogiartikkelit sähköpostiisi