UIT The arctic university of Norway > Giellatekno
 

150225

gt-møte 25.2. 2015

Til stades: Ciprian, Lene, Marja-Liisa, Trond

Saksliste

  • NRK
  • Korpus
  • Strukturering av arbeidet
  • Ordbøker

NRK

Kommer folk fra NRK Sápmi kl 10. De har snakka med Sjur. De ønsker et bredt bilde av hva vi holder på med, men formatet er uklart.

  • grammatikkontrollen
  • satni.org hører sammen med Divvun-programmet (normering)
  • NDS (inneholder mer språkteknologi, både morfologi og lenker til korpus)
    • 2000 oppslag pr dag smenob-nobsme, ca 300 finsme-smefin

Korpus

Innsamlingsarbeid

  • hvem sitt arbeid å legge inn filer i korpus?
    • Oss alle + innleigd hjelp
  • lage inc-mapper i bound og free for nye filer
  • iflg kontrakter er det ikke lov til å laste ned bound på egen maskin noe som gjør det vanskelig å arbeide - hva kan gjøres med dette?
  • lage liste på internett over hva som finnes i korpus (hvem??)
  • rutiner for
    • analyse
    • hvilke analyserte versjoner som skal tas vare på og hvor lenge
    • grep-korpus på Divvun
    • legge inn i Korp

Enkeltfiler

  • Lovfilene er forbetra, manuelt parallellisert (Ciprians sak)
  • Samiske tall forteller: manuelt delt opp i enkeltdokumenter (sendes til Trond)
  • SDA-2006: ny versjon kommet fra Jussi fordi den opprinnelige versjonen ikke var konverterbar (sendes til Trond)
  • Trond forklarer Jaska biggies

Lagring av filer på divvun-serveren

  1. månedsvise referanseversjonar som grepkorpus i analyzed
  2. tre dagar
    1. Sjekkerutine: bit-mengde skal vere omtrent like stor, aldri slett filer viss nye filer er drastisk mindre enn eldre
  3. Det skal aldri vere slik at repositorium er tomt

Ciprian gjer dette.

Strukturering av arbeidet

Ordbøker

Lene har lagt geo inn i NDS smenob. Dette er et foreløpig arbeid fordi det er bare gjort for sme og definerer alle språk sme2x som sme2nob.

Ciprian snur fila til nobsme. Dette gjelder bare denne fila: smenob/src/N_Propgeo_smenob.xml. Den inneholder bare navn som ikke er med i N_Prop_smenob.xml. smenob/src/N_Propgeo_smenob.xml snues til nobsme/src/N_Propgeo_nobsme.xml.