UIT The arctic university of Norway > Giellatekno
 

Meeting2017-03-29

Divvun-møte 29.3.2017:

Til stades: alle

Saker:

Sidan sist

Børre

  • CorpusTools
    • Parallellisering:
      • brukt hfst-tokenise i setningsdeling (r149924)
      • lage et nytt skript, realign
  • arbeider med å flytte termwikien til satni.uit.no, ferdig til i morgon (forhåpentligvis)
  • koden til Niklas Laxström ser lovande ut men er ikkje heilt på plass enno

GJERA:

  • dokumentera forbetringane som kom med å byta ut preprocess + lookup med hfst-tokenise i parallelliseringa, senda e-post til alle i DV og GT om dette

Duommá

  • han har jobbat med testkorpus

Linda

  • tegnsettingsreglar
  • syntaktiske reglar
  • ADDRELATION og løsninger for feilmarkeringar som går over flere ord + flere forslag for samme feil

Døme:

  • feil: dego lávvomuorran
    • -> - Ess (- lávvomuorran)
    • -> dego Nom (dego lávvomuorra)
  • mon álggán bárgogoahtit
    • forslag1: - bárgogoađán
    • forslag2: álggán bárgut

Maja

  • fokus på sms-tagging og sem-tagging
    • spørsmål: korleis skal ein tagga adjektiv som har både topografi, hum og instrument?
    • svar: vi taggar ikkje adjektiv med mindre dei òg kan brukast som substantiv

Generelt: semtaggar med fleire verdiar har alle verdiar etter alfabetisk kvarandre med golvstrek mellom: Sem/Hum_Plc

Døme:

  • gejhkie+Sem/Hum: gejhk ie_IE_EVEN1 ; ! dyr,mnsk og instr.
  • son lea nu goikkis, diet olmmos, goike- goike-, goikebiergu

Avgjerd: => vent med semantisk tagging, berre samansetjingstagging no

Hattfjelldalen:

  • blir tredje forvaltningskommune i det sørsamiske området
  • må ta grep om revitaliseringa - det som har vorte gjort til no fungerer ikkje
  • verkty som folk etterlyste:
    • elektroniske ordbøker som appar
    • mobiltastatur med stavekontroll
    • verkty for fjernundervising (kva betyr det i praksis?)

Sjur

  • Hattfjelldalen (sjå over)
  • laga skript for å testa regresjonar i analysene

Tomi

  • OmegaT hfst tokenizer
  • satni.org bugzilla

Årsrapport til KMD

Linda:

  • «vi er avhengige av eit fungerande samarbeid med Giellagáldu for å normera nordsamisk på setningsnivå»
  • må nemna at Linda ikkje har jobba 100%

Tomi, Maja, Duommá, Børre:

  • ingen eigentlege kommentarar - ser bra ut

Neste Divvun-samling

24.-28.4.

Skitur? Topptur? Annan aktivitet? - Forslag: Tverrfjellet