UIT The arctic university of Norway > Giellatekno
 

Meeting_2017-10-10

T&S 10.10.2017

Saker:

  • møterommet
  • tastatur
  • GG-møte
  • Neste divvunveke
  • Korpusinnsamling
  • Grammatikkontrollen
  • TTS
  • Skoltesamisk og Kela
  • nye kontorplassar

møterommet

Sjur har laga ei skisse. Det som evt. manglar er argument for korfor vi vil ha skjerm i begge endar (grunngjevinga er at vi vil ha fleksibilitet, t.d. ved presentasjonar: skjermen foran er for føredragshaldaren, skjermen bak er for deltakarane som ikkje er i Tromsø).

Trond og Gt ser på den og Trond sender vidare til Frode Lien, Eystein Dahl og Kyrre Soleng.

tastatur

win 7- vs 8+

Ikkje alt for mykje ekstra arbeid, så vi prøver.

smn for mac og windows

Trond har testa og det fungerer, for Mac og for Win10. Trond held kontakten med Teija.

smn og den finske eksamensnemnda

TL;DR Sources for DigabiOS, a Live-Linux system, created by The Matriculation Examination Board of Finland (In Finnish: Ylioppilastutkintolautakunta).

Dei vil ha tastatur på datamaskinene til studenteksamen til våren. To saker:

  • tastaturutforming
    • plasseringa av Đ - spørsmålet ute hjå enaresamane
  • teknisk implementering
    • berre linux? ser slik ut - debian 8
    • blir generert no (og fungerer): tastaturoppsett med redundante definisjonar
    • betre/burde vera: bruk import for mesteparten, definer berre diffen

GG-møte

Opne spørsmål:

  • tolking (simultan, konsekutiv, skriftleg?) - alle frå GG deltek
  • Møterom til 20+ personar + tolkeboksar? (8.-9.11.)
  • tema / saksliste:
    • Samarbeidsformer
    • ortografisk normering for språk X
    • syntaktisk normering (grammatikkontrollsaker)
    • termwiki-spørsmål/-trening
    • Seksjon for språkspesifikke diskusjonar med språk X for GG og Gt/D? Ja, helst
    • Eigen bolk for GG

Neste divvunveke

Veke 45 / 6.-10.11.

FinUgReVita må bli i januar-februar. IWCLUL er 8.-9. januar, vi inviterer ungararane frå 22.1. og framover, når det passar dei. Så justerer vi Divvun-veka etter det. Brev sendt.

Korpusinnsamling

Oppfølgjing av ../../corpus/Meeting_2017-10-05.html.

  • Automatisk innsamla: I dag NRK, vi vil ha alle.
    • Børre følgjer det opp
  • Pølen:
    • .. er ei yaml-fil i freecorpus.
    • Det ligg ei liste å hente nye frå i ling/SaamiTextOnline.html som Børre skal endre til ei maskinlesbar fil (hugs å endre SaamiTextOnline.html).
  • Divvun arbeider med å få tilsett ein innsamlar, oppfølgjing av Sametinget går inn i det.
  • Direkte tilgang til tekstar frå sentraladministrasjonen: Sjur diskuterte det i førre møte i Oslo, og følgjer opp det.

Grammatikkontrollen

No er stavekontrollen integrert i grammatikkontrollen, men ikkje her: http://gtweb.uit.no/gc/ (enno), eller i det nye scriptet på kommandolinja, men det fungerer som pipeline. Spellerdelen (som kjem før grammatikkontroll) er:

cat text > tokeniser > valens > mwe > stavekontroll ...

Utsnitt av output, der skrivefeil får forslag, ordna etter vekt, og der dei fire taggane til høgre for grammatikktaggane er:

  • totalvekt W (leksikonvekt + vekting frå feilmodell)
  • leksikonvekt WA (grammatisk og leksikalsk vekt)
  • ein tagg <spelled>
  • og sjølve rettingsforslaget (her: "<diehtit>)
"<dieehttit>"
	"dieehttit" ?
	"diehtit" V Ind Prs Pl1 <W:15.8486> <WA:8.84863> <spelled> "<diehtit>"
	"diehtit" V Inf <W:15.8486> <WA:8.84863> <spelled> "<diehtit>"
	"diehtit" V Imprt Pl2 <W:23.2031> <WA:13.2031> <spelled> "<diehttit>"
	"diehtti" N NomAg Pl Nom <W:23.2031> <WA:13.2031> <spelled> "<diehttit>"
	"diehtit" V Der/NomAg N Pl Nom <W:23.2031> <WA:15.2031> <spelled> "<diehttit>"
	"diehtit" V Imprt Du2 <W:35.3018> <WA:15.3018> <spelled> "<diehtti>"
	...
	"ihtit" V Der/NomAg N Pl Nom <W:20049.3> <WA:20029.3> <spelled> "<die-ihttit>"
		"die" Adv Cmp/Cit Cmp/Hyph Cmp

Merk siste linje, som har langt høgare vekt enn dei andre. Med dette oppsettet kan vi bruke CG-reglar til å fjerne (høgt vekta) framlegg vi rett og slett aldri vil vise, heller ikkje der dei ville ha kome på topp-5.

Dokumentasjon

... kjem snart.

Integrering

  • På nettsida vår: Snart
  • I LibreOffice: Ingenting der enno, men vi er no i ein posisjon der vi skal prioritere det
  • macOS (i dei fleste macprogram): bør vere overkommeleg etter LibreOffice
  • Nettlesarar: tja, og variabelt frå lesar til lesar
  • MS Office - skal lysast ut (prosessen er i gang)

TTS

For sluttbrukarar

Jf Bugzilla.

For utvikling på huset

  • NDS først i køa
  • opplesing av heimesidene våre

No skal vi setje opp ein servar. Kva skal vi gjere og kva skal Acapela gjere. Kontakten går mellom Chiara/Ciprian og Acapela, med kopi til Sjur.

Skoltesamisk og Kela

Spørsmål frå Kela om skoltesamiske program: Det er brevveksling, saka går framover, vi ventar på svar.

Nye kontorplassar

Både Trond og Sjur ber om kvar sin kontorplass for midlertidige stillingar. Kvar pâ vâr kant treng vi no og dâ dette, slik at eit smidig system med ein-to ledig(e) plass(ar) vil vere ein fordel.