UIT The arctic university of Norway > Giellatekno
 

Meeting2017-09-25

Divvun-møte 25.9.2017

Til stades: alle

Saker:

Sidan sist

Børre

  • jobba med analyseproblem
  • tatt kontakt med systemleverandøren til Ávvir, jobbar med nettbasert stavekontroll for dei
  • sms-analyse
  • satni.org var nede (Tomi var sjuk)
  • hadde besøk av Jon Erling Utsi, laga instruksjonsvideo til GG
  • har jobba med å få Voikko-Enchant til å fungera som han skal, burde vera ferdig no
  • korpus-konvertering og -analyse - løyste problem
  • jobba med bugzilla #2405 (Problemer i samband med parallellisering)
  • python-skript for lexc-sortering
  • forbedret dokumentasjon om hvordan man setter variabler (spesielt i pdf-konvertering) for å forbedre output av konvertering
  • sjekke Android-tastatur
  • TermWiki
    • forbedre former
    • undervise Giellagáldu i hvordan man fletter artikler

Duommá

  • jobbar fortsatt med Graham Shacker:
  • jobbar med testkorpuset
  • legger til tagger i leksikonet
  • samler falske positiver av kommaregler til Linda
  • testar hur reglerna funkar
  • tweakar lexikons och compound-tags i henhold till for exempel real word errors
  • legger till ord i listor før grammarcheckern
  • ser hur reglerna kan utvecklas, och om dom i det hela tatt er relevanta

Linda

  • kongruensregler mellom subjekt og verbal
  • laga spesifike regler for kongruens mellom "mii" (Rel 3Sg vs. Pers Pl1) og verbal, dette er viktig fordi disambiguering ikke helt funker når kongruensen mellom mii og verbalet er feil (her ser man igjen kor essensielt det er å tilpasse disambiguator)
  • rydda opp i taggane
  • diehtit (vs. diehttit) real word error regler: verb-substantiv konfusjonspar kan skape problemer for syntaktiske regler
  • fiksa noen komma-regler
  • gikk gjennom bugzilla
  • prøvde å ordne opp en del ting på webdemoen, og snakka med Kevin om det, men den kan ikke aktualiseres for tida fordi den personen som jobber med det er borte
  • laga Instagram-konto for Divvun og begynte å poste litt: https://www.instagram.com/divvunnuvvid/?hl=en
  • var på avskjedsfeiring til Mikael S.

Maja

  • Legger til lemma
  • cmp - dåakter(e)-siebrie: Hasselbrink er klar: ellision av final (e) - men dette følger Bergsland delvis opp, og denne ellision av (e) f.eks voelem(e)-gaaroeh. Muntlig i hvertfall (majavatn) faller denne final e bort. GG følger ikke dette opp. Ulike tagger for dette?
  moraale+Use/DNorm:moraal NIEJTE ;
  moraale+Use/NotDNorm:moral NIEJTE ;
  • propernoun med Siri / Gïelegaaltije
    • Når det gjelder propernoun, prøver jeg å sammenligne sma, smj og sme.
    • mangefull propernoun-analyse
    • må gjøre: cmp - egen tagg for GG, tagg for Bergsland, tagg for "folket"
    • mangelfull adj-analyse - Lexc-modus i subethaedit - opprydding i lexicon.
    • passive verb - trenger å analysere for å se på passive verb i sørsamisk - korte passiver, sovvedh, -lgidh, sidh etc. - prøve å få en helhetlig analyse på dette.
    • Normeringene går i forskjellige retninger også på ordnivå: jïllemes-reakta =GG bijjemesreakta. Dette er normering av termer - viktig for Termwikien og ordbøkene, men analysatoren vil analysere begge, og stavekontrollen vil akseptere begge.
    • ord som er riktig stavet får rød strek (false positive), og omvendt: de som er feil stavet får ikke rød strek (false negative). - Bug. konfusjonspar.

Sjur

  • Brendan i Helsingfors, møte med hfst-gjengen.
  • Grammatikkontrollmøte
  • Android-tastatur
    • Fleste kjente feil løst
    • Lagt til bibliotek (sentry) som forteller om feil ved kræsj.
    • nye Android-tastaturer ute - bør annonseres
  • Irsk – bl.a. stavekontroll -> Forbedringer i infrastrukturen
  • Nytt i SEE sin lexc-modus. Sortering av leksikon.
  • KMD-møte.
    • Vi behøver en lingvist til, med ansvar for grammatikkontroll, etc.
    • Avtale med Sametinget og UiT -> oppklaring av opphavsrett. Firma lager utkast.
  • Ávvir- og Enchant-stavekontroll
  • UiT <-> Brendan: Kontrakt klar om oppdateringsprogram for våre program.
  • Jaska - Komi
  • Estland: Konferanse om SamEst
    • Oahpa - Võro
      • Võro-tastatur
    • Finsk-estisk, finsk-nordsamisk maskinoversettelse
    • Estarane har jobbet med fst-teknologi i mange år uavhengig av oss, nyttig input fra dem.

Tomi

  • var sykemeldt førrer veka
  • oppdatera termwiki-konvertering
    • har fått e-post frå Børre om endringane i wiki-formatet

Maja vil gjerne ha termwiki-missing-liste frå Tomi igjen : )

Divvun-samling

Neste veke. Saker:

  • smj-lingvist startar => opplæring
  • grammatikkontrollmøte
  • Divvun-møte
  • SEE-modus-oppdatering (sortering)
  • Fleire taggar for samansetjingsanalyse i sma
  • NetSam-planlegging
  • tastatur for smj og sma

Arbeid framover

Børre

  • lexc-sortering
  • Ávvir-stavekontroll
  • Linux-tastatur
  • pdf-konvertering
  • Avtale evt. møte m NetSam

Duommá

  • det same som førre veka

Linda

  • fortsette med kongruensregler

Maja

  • samansetjingsanalyse
  • missing
  • lexc-rydding
  • yaml-testene, jf false positives og negatives i stavekontrollen, + lexc-rydding

Sjur

  • arbeida i lag med Børre om Ávvir-stavekontrollen
  • førelesing tysdag og torsdag denne veka ved Helsingfors universitet (i lag med Jaska)
  • reiser til Tromsø torsdag kveld
  • grammatikkontrollmøte på onsdag

Tomi

  • det same som førre veka
  • turn on script for e-mailing analyses from termwiki

Ymse

  • NetSam-samling (NetSam = samiske lærarar i grunnskulen og vidaregåande) i Tromsø 23-24 oktober. Børre er invitert til å holde info om divvun-/giellatekno-greier. De spurte om sør- og lulesamisk foreleser, også.

Maja borte 10.-11.10.