UIT The arctic university of Norway > Giellatekno
 

160104

Čoahkkin 04.01.2016

Erika (mielde MT-oasis), Lene, Marja-Liisa, Trond

Áššelistu

  1. Válljet teavstta evalueremii.
  2. Min bargu ovddos guvlui, ovdal evaluerema.
    1. MT
    2. Neeta ja Miina bargu
    3. FST
      1. yaml-teasttat
      2. derivašuvnnat
  3. Konferánsaposter

Válljet teavstta evalueremii

Áigemearri álgit evalueremii: 19.1

  • Domeana jagi 2016 perspektiivvas: servodatoahppogirjjit?
  • Evalueremii:
    • su. davvisámegiel 300 sáni
    • vejolaččat 2 teavstta, Suoma ja Norgga bealde čállon
    • sámi politihkka, vuoigatvuođat...
    • 3 jorgaleaddji livčče buorre
      • IM, SM, T, MM, ML
  • Váruhusreive jorgaleddjiide. Lene čállá odne.

Reive mii sáddejuvvui lullisámeprošeavtta oktavuođas:

Vedlagt er to tekster, hver på 300 ord, som skal oversettes til sørsamisk. Til den ene teksten får du en "sørsamisk" kladd som er lagd ved hjelp av et oversettingsprogram. Programmet er en mulig begynnelse på noe, men det er veldig uferdig. Uansett hvor mye vi ville kunne arbeide med et slikt program, vil det likevel aldri kunne bli noe mer enn en hjelp for oversettere, men forhåpentligvis vil det kunne bli bedre enn det er nå.

Hensikten med dette er å finne ut hvor nyttig et oversettingsprogram vil være for sørsamiske oversettere. Vi lurer f.eks. på om det går raskere å rette en slik kladd, enn å oversette fra blanke ark. Og om en maskinoversatt tekst ellers kan nyttig for oversetteren.

Vi ber deg ta tiden du bruker på oversettingene. Det er interessant for oss å sammenlikne tiden den samme oversetteren bruker på de to tekstene, ikke å sammenlikne oversettere (dette sendt til 4-5 oversettere). Vi ber deg også å svare på noen spørsmål etter at du har gjort oversettingene.

Vi vil i foredrag og artikler refere til hva oversettere synes, men vi vil ikke i noen sammenheng refere til hvem oversetterne er. De sørsamiske tekstene som dere oversetter, vil vi bruke til arbeid med å forbedre programmet, hvis vi bestemmer oss for å arbeide videre med dette. Det er avhengig av finansiering og prioriteringer.

Takk for hjelpa! Gæjhtoe viehkien åvteste!

Hilsen Lene Antonsen og Trond Trosterud

Spørsmål:

  1. Sammenlikne tiden du brukte på oversettingene:
    1. _ Jeg brukte lenger tid på tekst A enn på tekst B: Anslå forskjellen, f.eks. 2 ganger mer, 1,5 mer osv., eller du kan oppgi antall timer du brukte på tekst A og på tekst B:
    2. _ Jeg brukte omtrent like lang tid på tekst A og tekst B:
    3. _ Jeg brukte lenger tid på tekst B enn på tekst A: Anslå forskjellen, f.eks. 2 ganger mer, 1,5 mer osv., eller du kan oppgi antall timer du brukte på tekst A og på tekst B:
  2. Hvordan vurderer du den maskinoversatte teksten?
    1. - den var veldig nyttig
    2. - den var litt nyttig
    3. - den var ikke nyttig
  3. Hvordan brukte du den maskinoversatte teksten?
    1. _ Jeg tok utgangspunkt i den maskinoversatte teksten og rettet den
    2. _ Jeg skrev den sørsamiske oversettelsen fra bunnen av, men brukte den maskinoversatte teksten som støtte / for å finne termer
    3. _ Den sørsamiske teksten var så dårlig / misvisende at jeg fant det bedre å se helt bort fra den
  4. Hvordan vurderer du den maskinoversatte teksten når det gjelder terminologi:
    1. - den inneholdt mer nyttige termer, enn dårlige termer
    2. - den inneholdt omtrent like mange nyttige termer, som dårlige termer
    3. - den inneholdt flere dårlige termer enn nyttige termer
  5. Gi eksempler på nyttige termer i den maskinoversatte teksten:
  6. Gi eksempler på dårlig termer i den maskinoversatte teksten:
  7. Grammatikken - kom gjerne med kommentarer:
  8. Vil et slikt oversettingsprogram være nyttig for oversettere?
    1. – ja, til og med et så pass dårlig program kan være nyttig
    2. – ja, men bare hvis det er en god del bedre enn dette programmet
    3. – ja, men bare hvis det gir nesten perfekt oversettelse
    4. – nei, dette tror jeg ikke vil være nyttig. Hvorfor?

Min bargu ovddos guvlui, ovdal evaluerema:

MT

Bargat missinglisttuin stuorit materiálas (ML)

cat dev/missinglist.txt |rev |cut -d ' ' -f1 |rev |usme |less
Gč. muđui: BidixWork

  • jorgalit davvisámegiel sáni anársámegillii
  • lasihit ođđa pára bidixii

Paralleallateavsttaiguin bargat (Erika)

  • leat boahtán ođđa teavsttat, vuoruhit
    • PresidentNiinisto_Newyearspeech_sme.txt
    • Giellagas_homepages.txt (sme)

Lonuhit dokumeantta nama:

svn mv Giellagas_homepages.txt Giellagas_homepages_sme.txt
svn ci -m "dsfdf "

Árvvoštallat pending tests (ML)

http://wiki.apertium.org/wiki/North_Saami_and_Inari_Saami/Pending_tests

./t/pending-tests

Transfer- ja lex-selection njuolggadusat

Trond ja Lene

FST

Bargoprinsihpat:

  • Vuorut barggu mii guoská yaml-fiillaide, main lea FAIL (ulbmil: 0 FAIL)
  • Ovdalgo šekke sisa barggu mii lea dahkkon FST: s
    • yaml-fiila galgá addit PASS (jus it fidne PASS, de sáhtát jearrat veahki, dahje kommenteret eret hámiid mat eai doaimma)
    • galggat testet OLLES yaml- ja lemma-check (make check dahje test/yaml-check.sh pluss test/lemma-check.sh), ja boađus ii oaččo hedjonit
  • Jus yaml-fiila ii atte rivttes gova
    • attes eanet hámiid yaml-fiilii, omd.
 njälmi+N+Pl+Com:   njalmijguin
    njälmi+N+Pl+Abe:   njalmijttáá
    njälmi+N+Sg+Ill+PxSg3:   njálmásis

FST-vuoruheapmi

yaml-teasttat - otná boađus

YAML test 130: generator-gt-norm.xfst + gt-norm-yamls/V-3lex_putestid_gt-norm.gen.yaml - 153/21/174 FAIL


YAML test 14: generator-gt-norm.xfst + gt-norm-yamls/A-3lex_vaanis_gt-norm.gen.yaml - 48/2/50 FAIL
[27/49][FAIL] #väänis+A+Comp+Pl+Acc => Missing results: vánásuboid vánásuboid
[27/49][FAIL] väänis+A+Comp+Pl+Acc => Unexpected results: vánásubboid
[28/49][PASS] väänis+A+Comp+Pl+Ill => vánásubboid
[29/49][FAIL] #väänis+A+Comp+Pl+Loc => Missing results: vánásuboin
[29/49][FAIL] väänis+A+Comp+Pl+Loc => Unexpected results: vánásubboin

vánásub attr.


NJUORAS - njuorâsuboi, njuorâsuboid, njuorâsubboid


Kommando:
egrep '(NJUORAS|UAMIS|HAANIS|TIMES|HAAITIS|HEEITUG|VAANIS)' src/morphology/stems/adjectives.lexc|cut -d":" -f1|sed 's/$/+A+Comp+Pl+Acc/g;'|dsmn

káálgus+A+Comp+Pl+Acc	kálgusubboid

miälgus+A+Comp+Pl+Acc	miälgusubboid

šiälgus+A+Comp+Pl+Acc	šiälgusubboid

muájus+A+Comp+Pl+Acc	muájusubboid

...


LEXICON VAANIS !!= __@CODE@__ directing to  X_PAAVIR, attr. väni
+A+Attr:väni K ; ! 
+A+Attr:vanâ K ; ! 
+A:váánnás%^ÁI X_PAAVIR	  ;
+A:váánnás%^ÁI%^CSH%>u COMPo ;  <====
+A:váánnás%^ÁI%^CSH%>u MOS ;
+A+Cmp/Attr:väni%> R ;



YAML test 181: generator-gt-norm.xfst + gt-norm-yamls/V-lex_vuossatDerPass_gt-norm.gen.yaml - 55/1/56 FAIL
[49/55][PASS] vuoššâđ+V+Der/Pass+V+PrsPrc => vuáššojijjee vyeššee
[49/55][FAIL] vuoššâđ+V+Der/Pass+V+PrsPrc => Unexpected results: vuáššojeijee
PrsPrc ii galgga leat mielde Pass-leksikonas
-vuššâđ - 

vuoššuđ 
YAML test 146: generator-gt-norm.xfst + gt-norm-yamls/V-lex_compl_ud_gt-norm.gen.yaml - 134/21/155 FAIL
[1/9][PASS] láámmuđ+V+Inf => láámmuđ      mm
[2/9][PASS] láámmuđ+V+Ind+Prs+Sg1 => láámum
[3/9][FAIL] láámmuđ+V+Ind+Prs+Sg3 => Missing results: láámu  m
[3/9][FAIL] láámmuđ+V+Ind+Prs+Sg3 => Unexpected results: láámmu
[4/9][PASS] láámmuđ+V+Ind+Prs+Du1 => lámmoon
[5/9][PASS] láámmuđ+V+Ind+Prs+Pl3 => láámmuh mm - m
[6/9][PASS] láámmuđ+V+Ind+Prs+ConNeg => láámu
[7/9][PASS] láámmuđ+V+Ind+Prt+Sg1 => laammum
[8/9][PASS] láámmuđ+V+Ind+Prt+Sg3 => láámui
[9/9][PASS] láámmuđ+V+Ind+Prt+Pl3 => lammuu


YAML test 148: generator-gt-norm.xfst + gt-norm-yamls/V-lex_diph_ud_gt-norm.gen.yaml - 1833/14/1847 FAIL
liäđđuđ+V+Ind+Prs+Pl3: liäđuh #corpusis more freq: liäđđuh - liäđuh  Err/Orth: CSH


Parkeret dáid?:
YAML test 185: generator-gt-norm.xfst + gt-norm-yamls/V-list_3st_id_gt-norm.gen.yaml - 1462/156/1618 FAIL
YAML test 195: generator-gt-norm.xfst + gt-norm-yamls/V-list_ed_gt-norm.gen.yaml - 135/14/149 FAIL
YAML test 196: generator-gt-norm.xfst + gt-norm-yamls/V-list_id_gt-norm.gen.yaml - 517/1/518 FAIL
YAML test 198: generator-gt-norm.xfst + gt-norm-yamls/V-list_long_id_gt-norm.gen.yaml - 46/2/48 FAIL
YAML test 199: generator-gt-norm.xfst + gt-norm-yamls/V-list_od_gt-norm.gen.yaml - 185/9/194 FAIL
YAML test 200: generator-gt-norm.xfst + gt-norm-yamls/V-list_ud_gt-norm.gen.yaml - 489/24/513 FAIL

SUMMARY for the generating gt-norm fst(s): PASSES: 25943 / FAILS: 265 / TOTAL: 26208

Derivašuvnnat

Mii doallat sierra čoahkkima boahtte vuossárgga.

Miina ja Neeta barggut

  • Add words to bidix, also bŧ translation on web
  • Check word pairs in bidix

Trond bagada sudno. neahttaveršuvdna ođasmuvvo juohki iija:

-rw-r--r-- 1 root root 398590 jan. 3 04: 13 /usr/share/apertium/apertium-sme-smn/sme-smn.autobil.bin

SUMMARY for the generating gt-norm fst(s): PASSES: 20745 / FAILS: 59 / TOTAL: 20804

Konferánsa-poster

open ~/main/art/2016/iwclul/smnpaper/poster/smnposter.pdf svn up main/2016iwclul/smnpaper/poster/

Posters galgá leat sullii válmmaš 11.1, dalle mii dušše geahččat detáljjaid.

Next meeting

Vuossárgga dii. 10: derivašuvnnat ja posters

Notáhtat

sh devtools/verb_minip.sh PUTESTID

kobdediđ+V+Inf	kobdediđ

kobdediđ+V+Ind+Prs+Sg1	kobdedâm

kobdediđ+V+Ind+Prs+Sg3	kobdeed

kobdediđ+V+Ind+Prs+Du1	kobdedeen

kobdediđ+V+Ind+Prs+Pl3	kobdedeh

kobdediđ+V+Ind+Prs+ConNeg	kobded

kobdediđ+V+Ind+Prt+Sg1	kobdedim

kobdediđ+V+Ind+Prt+Sg3	kobdedij

kobdediđ+V+Ind+Prt+Pl3	kobdedii

[46/57][FAIL] lasettiđ+V+Ind+Prs+ConNeg => Missing results: lasseet
[46/57][FAIL] lasettiđ+V+Ind+Prs+ConNeg => Unexpected results: laaseet
kobdediđ:kobde%^SVd 3_PUTESTID ; 
lasettiđ:las%^RCe%^SVtt 3_PUTESTID ; ! !YAML