UIT The arctic university of Norway > Giellatekno
 

160602

Barggut MT-prošeavtta oktavuođas

Čoahkkimis: Ciprian, Marja-Liisa, Trond, Lene

Sátnegirji

sátnegirjji lanseren čakčamánu 26-30 b.?

(ML boahtá Romsii 15.6)

Plána:

  • xml-fiillaid čorgen
    • vuos automáhtalaš čorgen (Cip)
      • unifisere alle string&pos automatisk
      • definerere hvordan de forskjellige feltene skal behandles (til senere)
    • de manuálalaš čorgen - vej. Sámmol, Miina, Taarna, Erika veahkkin?
  • testet lemmaid ja sojahanhámiid mat leat sátnegirjjiis => errorlistu
    • divvut FST
    • sáddet sátnegirjji divvunlisttu sámedikki bargiide?
  • geahččat geavahanlavtta, paradigmaformáhta jnv

Brukarstatistikk, pr. mnd.

   3131 2016-02
   5411 2016-03
  11282 2016-04
   9964 2016-05
    391 2016-06

Eksempel: http://giellatekno.uit.no/ped/sma-oahpa.html Lenkje: Lingvistisk innhald: Adj / Verb / Subst

Fire ordbøker:

  • smnfin 20929
  • finsmn 13298
  • smnsme 180
  • smesmn 267

Nøkkelformer, t.d.

  • NomSg GenSg IllSg Ess NomPl
  • NomSg GenSg IllSg Ess NomPl Attr Comp Sup
  • Inf PrsSg1 PrsSg3 In

Tidsplan fram til Enare i neste veke:

Ciprian genererer og legg online:

  1. Paradigmeliste for N, V, A etter mønster ovafor
  2. Liste over manglande samsvar mellom FST og former i lc-feiltet i ordboka
    1. "Desse lemma har ei Sg1-form som ikkje er lik Sg1 i automaten"
  3. Liste over lemma - trans1 - trans2 ...

Døme på informasjon i ordboka, som kan verifiserast med automaten:

cat smnfin/inc/2015/Saami-suoma_ERRATA_03072015.csv |cut -f1|grep 'đ '|grep '  '|l
ahevâššâđ  ahevâšâm     
ahevâššâđ  ahevâšâm     
ahevuššâđ  ahevušâm     
ahevuššâđ  ahevušâm     
a'ibâšiđ  aaibâš     
a'ibâšiđ  aaibâš     
aiccâđ  aaicâm áiccá     
aiccâđ  aaicâm áiccá 

MT-evalueren čakčat

intern deadline 1.9

  • Dette er en delmålsevaluering (1. milepæl) - med fokus på oversetting av sametingstekster

divvunprográmma evalueren

omd:

  • vuosttaš evalueren skábmamánus: ulbmil lea gávdnat stuorimus ráiggiid, sihke FST: s ja evttohanvuogádagas
  • divvut/buoridit áššiid maid sáhttá divvut oanehis áiggis
  • nubbi evalueren juovlamánus: ulbmil lea raporta
  • čállit raportta das man dásis divvunprográmma lea, ja mii ferte dahkkojuvvot
  • árvvoštallat livččiigo buorre lanseret geahččalan-veršuvnna
  • ovttasbargat Sjuriin

Feaillat: smn/test/data/typos.txt

Vejolaš studeantabargu: evalueret divvunprográmma ja evttohit buoridemiid

Sámi Giellagáldu

Rutiinnat:

  • tearbmalisttuid njuolgga sátnegirjái
    • ja FST: i (Giellatekno sáhttá lasihit "álkes" sániid)
  • normerenáššit (čatnat daid divvun-prográmmii)