UIT The arctic university of Norway > Giellatekno
 

Paralleltexts

Genereret jorgalusaid

Mis lea skriptat mainna mii sáhttit buohtastahttit cealkagiid mielde:

  • sme, smX ja MT-jorgalusa (parallellateavsttaid)
  • dahje dušše sme ja MT-jorgalusa (jus ii leat juo jorgaluvvon manuálalaččat).

Mis leat dákkár teaksta-máhpat:

  1. texts: fiillat dábálaš txt-formáhtas. _sme.txt ja _smX.txt
  2. tmx_data: sihke sme ja smX seammá fiillas, okta cealkka háválassii. tmx-formáhtain lea vejolaš genereret html-fiilla.
  3. fi.samediggi: sihke sme ja smn seammá fiillas, okta cealkka háválassii. tmx-formáhtain lea vejolaš genereret html-fiilla.
  4. pseudo_tmx_data: dušše sme, okta cealkka háválassii. tmx-formáhtain lea vejolaš genereret html-fiilla.
  5. otpt_dir/: output-directory mas leat fiillat mat leat genererejuvvon python-skriptain.

Testenbargu:python skriptat

  • python-skripta ovttagielat teavsttaide: check_mt-otpt.py
  • python-skripta guovttegielat teavsttiade, ja mas lea WER: wercheck_mt-otpt.py

Jorgalit paralleallateavsttaid, ja buohtastahttit jorgalusaid:

Jorgalit dihto fiilla, ja rahpat bohtosa:

  1. python wercheck_mt-otpt.py -f tmx_data/100writers_sme2smn.tmx
  2. open otpt_dir/ - de rahpasa finder-láse. Vállje fiilla maid háliidat rahpat.

Jorgalit olles máhpa, ja rahpat bohtosa:

  1. python wercheck_mt-otpt.py -d tmx_data/
  2. open otpt_dir/ - de rahpasa finder-láse. Vállje fiilla maid háliidat rahpat.

Dahje don sáhtát bidjat buot fiillaid ovtta fiilii ja rahpat buot oktanaga oktan html-fiilan:

  1. cat otpt_dir/* > buotfiillat.html
  2. open buotfiillat.html (åpnes i Safari)

Jorgalit teavstta mii ii leat jorgaluvvon ovdal:

Jorgalit dihto fiilla, ja rahpat bohtosa:

  1. python check_mt-otpt.py -f mappe/file
  2. open otpt_dir/ - de rahpasa finder-láse. Vállje fiilla maid háliidat rahpat.

Jorgalit olles máhpa, ja rahpat bohtosa:

  1. python check_mt-otpt.py -d tmx_data/
  2. open otpt_dir/ - de rahpasa finder-láse. Vállje fiilla maid háliidat rahpat.

Dahje don sáhtát bidjat buot fiillaid ovtta fiilii ja rahpat buot oktanaga oktan html-fiilan:

  1. cat otpt_dir/* > buotfiillat.html
  2. open buotfiillat.html (åpnes i Safari)