Konekääntämisen teknologinen tausta

Konekääntämisen teknologia yhdistää kaksi eri näkemystä: (1) lingvistinen näkemys kuvaa kahden kielen kieliopillisia rakenteita ja niiden välisiä merkityksen säilyttäviä muunnoksia; (2) tietotekninen näkemys kuvaa sitä, kuinka lingvistisiä tietorakenteita ja muunnoksia käytetään virkkeitä käännettäessä.

Sattumanvarainen konekäännin: lingvistinen ja tietotekninen "spagetti"

Yksinkertainen konekäännin ei kiinnitä huomiota lingvistisen ja tietoteknisen näkemyksen väliseen eroon. Ohjelmoija saattaa suoraan kirjoittaa ohjelmakoodia, jossa lingvistiset rakenteet ja ohjelmaa suorittava koodi ovat sekaisin keskenään.

Tällaisen menetelmän avulla syntynyttä käännintä on vaikea kehittää ja ylläpitää eikä sen kääntämisen "teoria" ole siirrettävissä muille kielipareille.

Sundan teknologia: lingvistinen näkemys ja tietotekninen näkemys selvästi erilliset

Sundan teknologia erottaa selvästi toisistaan lingvistisen ja tietoteknisen näkemyksen. Kielellinen kehittäjä "näkee" vain lingvistisiä rakenteita ja ilmiöitä; tietotekninen näkemys on häneltä piilossa. Kielellinen kehitystyö on puhtaasti lingvististä.

Kieliriippumaton tietotekninen näkemys on toteutettu geneerisessä kääntimessä.

Konekäännin: geneerinen käännin + kielelliset säännöstöt

Kielellisen kehittäjän kirjoittamat säännöt käännetään konekieliseen muotoon ja assosioidaan automaattisesti geneerisen kääntimen kanssa. Kun kehittäjä aktivoi kääntimen, hän näkee välittömästi kirjoittamiensa sääntöjen vaikutuksen kääntämiseen. Käännin näyttää myös käännösvaiheiden jäljen.

Lingvistiset sääntötyypit

Lingvistiset säännöt jaetaan Sundan teknologiassa kolmeen perustyyppiin:

  • Yksinkertaiset leksikkosäännöt
  • Kontekstuaaliset leksikaaliset säännöt
  • Kielioppisäännöt

Englanti-suomi-kääntimessä on tällä hetkellä noin 200 000 yksinkertaista leksikkosääntöä, yli 100 000 kontekstuaalista leksikaalista sääntöä ja noin 3 000 kielioppisääntöä.

Kielellinen kehitysryhmä

Edellä mainitut säännöstöt on edelleen luokiteltu aliluokkiin. Jaotuksen avulla kehitystyön jakaminen ryhmälle tapahtuu luontevasti. Uuden kääntimen kehitysryhmän tulisi koostua vähintään kolmesta kielellisestä kehittäjästä.