Termien poiminnan opas


Sisällysluettelo

1. Yleistä
2. Termien poiminnan suorittaminen
3. Termitiedosto
4. Asetukset
5. Tukipalvelut

1. Yleistä

Sundan termien poiminta -työkalulla voit suorittaa termien poimintaa englanninkielisistä asiakirjoista. Tuloksena syntyvässä termitiedostossa on englanninkielisen termikandidaatin lisäksi kääntimen antama suomenkielinen käännösehdostus sekä termiin liittyviä kielellisiä attribuutteja. Voit muokata termitiedostoa esim. MS Excel-ohjelmalla. Lisäksi voit ladata termitiedoston Sundan sanastoeditoriin omaksi käyttäjäsanastoksi ja hyödyntää sitä näin englanti-suomi-kääntimessä.

Termien poiminta voidaan suorittaa samoista tiedostoformaateista, joita käännin tukee:

  • tekstitiedosto (.txt)
  • RTF-tiedosto (.rtf)
  • Word (.doc .docx)
  • PowerPoint (.ppt .pptx)
  • Excel (.xls .xlsx)
  • OpenDocument (.odt .odp .ods)
  • PDF (.pdf)
  • HTML (.html)

Termien poiminta -työkalu on käytettävissä Sunda Tool- ja Sunda Doc-ohjelmissa. Toiminnon käyttäminen edellyttää, että sinulla on Pro-, Workstation- tai yrityslisenssi englanti-suomi-kääntimeen. Workstation-versiossa termien poimintaa ei voi suorittaa vanhoista Office-formaateista (.doc .ppt .xls).

2. Termien poiminnan suorittaminen

Alla olevassa kuvassa on termien poiminta -työkalun pääikkuna. Työkalun saa avattua Sunda Tool-ohjelmassa valitsemalla ohjelman ylävalikosta kohta "Toiminnot->Termien poiminta".

Termien poiminta

Suorittaaksesi termien poiminnan toimi seuraavasti:

1. Valitse lähdetiedostot. Napsauttamalla oikean yläkulman Selaa-nappia voit valita kansion, josta lähdetiedostot haetaan. Vaihtoehtoisesti voit määrittää lähdetiedostot yksitellen. Tällöin ruksaa ensin kohta "Valitse lähdetiedostot yksitellen" ja lisää sen jälkeen lähdetiedostot napsauttamalla Lisää tiedosto-nappia.

2. Asetuksien valinta. Jos haluat muuttaa termien poiminnan asetuksia, avaa asetuksien valintaikkuna napsauttamalla Asetukset-nappia. Voit esimerkiksi valita, miten termit järjestetään termitiedostossa ja mitä termiin liittyviä kielellisiä ominaisuuksia näytetään. Asetukset esitellään tarkemmin kappaleessa 4.

3. Käynnistä poiminta. Käynnistä termien poiminta napsauttamalla Poimi termit-nappia. Kun prosessi on suoritettu onnistuneesti, avautuu termitiedosto ulkoiseen ohjelmaan (esim. Exceliin). Suoritetun termien poiminnan lokitiedosto avautuu Näytä loki-napista.

3. Termitiedosto

Löydetyt termikandidaat palautetaan käyttäjälle termitiedostona, joka on asetuksista riippuen joko Excel-tiedosto tai tekstimuotoinen CSV-tiedosto. Alla on kuva termien poiminnan tuloksena syntyneestä Excel-tiedosta.

Termitiedosto käyttää samaa formaattia kuin ulkoiseen tiedostoon tallennettu kääntimen käyttäjäsanasto. Voit täten tuoda termitiedoston kääntimeen omaksi käyttäjäsanastoksi valitsemalla sanastoeditorin ylävalikosta "Tiedosto->Tuo sanasto tiedostosta" ja valitsemalla termitiedoston kovalevyltä. Sanastoeditori on käytettävissä Sunda Tool-, Doc- ja Web-ohjelmissa sekä käännöspalvelun www-käyttöliittymässä.

Termitiedosto

Alla on kuvattu termitiedoston kentät. Työkalun asetuksista voi säätää, mitä kenttiä tiedostossa näytetään.

[Termi]: Englannin kielen termi.

[Käännös]: Termin suomenkielinen käännösehdotus (englanti-suomi-kääntimen tuottama).

[Sanaluokka]: Termin sanaluokka (substantiivi tai erisnimi)

[Semanttinen toimija]: Tieto siitä, kuvaako termi aktiivista toimijaa, kuten ihmistä tai eläintä. Mikäli sarake on tyhjä, kyseessä on "eloton" ei-aktiivinen toimija.

[Alikategoria]: Jos kentän arvona on Nimike, termi toimii ammattinimikkeiden tai arvonimien tavoin etuattribuuttina termiä seuraavalle erisnimelle. Kyseinen tieto auttaa käännintä tuottamaan oikeaa käännöstä. Esimerkkinä tästä on termi "chief executive officer / toimitusjohtaja", jota voi seurata tekstissä henkilönimi, jolle termi toimii etuattribuuttina.

[Taivutus]: Suomenkielisen käännöksen taivutusluokka, jota englanti-suomi-käännin käyttää tuottaakseen sanalle oikean taivutuksen. Jos kenttä on tyhjä, sanalla on normaali taivutus. Taivutuksen arvojoukko on esitelty sivulla "Kielelliset attribuutit".

[Astevaihtelu]: Tieto suomenkielisen käännöksen astevaihtelusta, jota englanti-suomi-käännin käyttää tuottaakseen sujuvaa käännöstä. Jos kenttä on tyhjä, sanalla on normaali astevaihtelu. Arvojoukko on esitelty sivulla "Kielelliset attribuutit".

[Frekvenssi]: Luku kertoo, kuinka monta kertaa termi on esiintynyt annetuissa lähdeasiakirjoissa. Tätä tietoa voidaan käyttää termikandidaattien karsimiseen ja järjestämiseen.

[Löytyi sanastossa]: Mikäli kentässä on ruksi, kyseinen termi ja sen käännös ovat löytyneet suoraan englanti-suomi-kääntimen sanastosta. Muutoin käännin on tuottanut termikandidaatin käännösehdotuksen produktiivisesti.

[Tuo termi]: Mikäli tämä sarake on lisätty termitiedostoon, voit määrittää ruksaamalla, mitkä termit tuodaan käyttäjäsanastoon, kun lataat termitiedoston kääntimeen sanastoeditorissa. Jos kenttään ei ole laitettu ruksia, kyseistä termiä ei tuoda käyttäjäsanastoon.

4. Asetukset

Alla on kuva termien poimintaan liittyvien asetuksien valintaikkunasta. Se aukeaa työkalun pääikkunnan Asetukset-napista.

Termien poiminnan asetukset

Säädettävät asetukset on esitelty alla.

Termien karsiminen ja järjestys:

Minimifrekvenssi. Voit määrittää, montako kertaa termin pitää vähintään esiintyä lähdeasiakirjoissa, jotta se poimitaan termitiedostoon. Jos luku on 0, kaikki löydetyt termikandidaatit hyväksytään.

Järjestys. Termit voidaan järjestää termitiedostoon joko ensiintymismäärän mukaan, aakkosjärjestyksessä tai termin pääsanan mukaan aakkosjärjestyksessä.

Näytettävät kielelliset ominaisuudet:

Sanaluokka. Jos valittuna, termitiedostossa näytetään termin sanaluokka (substantiivi tai erisnimi).

Taivutus. Jos valittuna, termitiedostossa näytetään termin suomenkielisen käännöksen taivutusluokka.

Astevaihtelu. Jos valittuna, termitiedostossa näytetään termin suomenkielisen käännöksen astevaihtelu.

Semanttinen toimija. Jos valittuna, termitiedostossa näytetään, kuvaako termi aktiivista toimijaa kuten ihmistä tai eläintä.

Alikategoria. Jos valittuna, termitiedostossa näytetään termin alikategoria.

Huom! Kielellisten ominaisuuksien lisääminen termitiedostoon on suositeltavaa, jos aiot tuoda termejä kääntimeen käyttäjäsanastoksi.

Tiedostoasetukset:

Termitiedoston tyyppi. Valitse palautettavan termitiedoston formaatti: Excel (.xlsx) tai CSV (.csv).

Tiedoston kieli. Valitse kieli, jolla termitiedoston otsikkokentät ja termeihin liittyvät ominaisuudet esitetään: suomi tai englanti.

5. Tukipalvelut

Sunda Systems Oy:n tukipalvelu auttaa osoitteessa www.sunda.fi/tuki.html tai tuki@sunda.fi.



Copyright © 2017 Sunda Systems Oy