UIT The arctic university of Norway > Giellatekno
 

Meeting2016-09-22

Divvun-møte 22.9.2016

Til stades:

Duomma og Tomi er sjuke.

Saksliste:

presentasjonar

Linda

Jobba med i det siste:

  • regler for adjektivkomparasjon
  • regler for sammensatte ord i mwe-split.cg3 (i lag med Duomma)
  • fikse testrutinger
  • tatt i bruk facebook for normative spørsmål:
    • ka er mot normen: syntaktiske spørsmål
    • kosjn skal dem rettes
  • nye feiltagger: Err/Orth-a/á, Err/Orth-nom/gen (+ Duomma)
  • samle inn korpus for kausative verb (fra bok av Pekka)
    • feil bruk av kausative verb, manglende akkusativer etc.
    • jorahit->jorrat: Jos ekologalaš doarjagiid sáhtášii eanet njuolga máksit , de sáhtášii jorahit ain eanet ekologalaš buvttadeami guvlui , ja almmá daid čavga gáibádusaid haga mat Norgga eiseválddiin dál leat ekologalaš eanandoalu meroštallamii.
  • samle in korpus for mwe-verb
    • valensfeil av type: váldit vára + Loc
      • "Seainni čađa manná goččarufe ja baikkaid bidje ihkkona čađa olggos, ja maŋŋil válde vára daid."
    • real-feil av type: váldit vara (ta blod) vs. váldit vára (ta vare)

Døme på FB-diskusjon etter spørsmål frå oss:

Divvun Nuvvid
15. september kl. 14:06

Hei! Divvun lea ráhkadeame grammatihkkadivvunprográmma ja dan oktavuođas
badjánit ollu norbmajearaldagat. Dát sáhtálii arena gos viežžat oaiviliid
geavaheddjiin. Vuosttas jearaldat:

"áidna" lea dušše attribuhttahápmi norpma mielde
omd:
"Sis-Romssa áidna dálveguohtumat leat Bihppásis Álddesjávrris."
"Dát lei áidna guovlu mii ásahuvvui gaskaboddosášvuođa namas ."
Muhto dat geavahuvvo maid oalle ollu predikatiivan:
"Áidna maid Heaika smiehttá lea ahte vuot de bisánit su čállinbarggut ."
"Áidna mas olmmoš dárbbaša ballat lea balus ."
"Kárášjoga gymnásas lei sámegielfága skuvlla « gálvomearkan » , ja álggu rájes
measta áidna mii earuhii skuvlla eará gymnásain."
Lea go dákkár dadjanmálle dohkálaš čállingielas? Jos ii leat dohkálaš, got
čáláleiddet?

Karen Inga Eira:
Manne bat dat ii galggaše leat maiddái čállagis leat dohkálaš predikatiivan? Lea
oba dábálaš nie geavahit goit oarjjabealde. Ferte goit beassat čállit nu ahte
nuppit ipmirdit maid oaivvilda.

Kirsi Paltto:
Amma diet lea hállangillii dábálaš vuohki ahte "joavdelas" sátni guđđojuvvo
eret, rievtti mieldehan "áidna mii earuhii" lea "áidna ÁŠŠI mii earuhii". Mu
mielas maid ferte dohkkehit dieid dáhpáhusaid čállingielas

Pekka Sammallahti:
Vaikko sáhttá dávjá jurddašit ellipssa, de analyserenprográmma dáfus dáidá leat
vuohkkaseamos atnit predikatiivan omd. dán dáhpáhusas: "Na dat lei áidna."
Seamma jurddašanvuogi mielde maid earenoamážit ivdneadjektiivvaid attr.hámiid
sáhtášii atnit predikatiivan omd. dákkár cealkagis. "Mus lea alit biila ja
Bieras lea rukses."

Divvun Nuvvid:
Eatnat giitu go gillebehtet vástidit! Dadjanmálle lea nu amas min bealde, ahte
in leat oppa jurddahan ge dan ellipsan, muhte norvagisman - mii dadjat diekkár
cealkagiid dákkár málle mielde:

"Heaika ii smiehta eará go ahte vuot de bisánit su čállinbarggut ."
"Olmmoš ii dárbbaš ballat eará go balus ."

Muhte mus dáidá vearrut dalle dien norvagismma hárrái? 

Duommá

Vi lagrar diskusjonane i sme/tools/grammarchecker/.

Jobba med dei neste vekene

  • fortsette å samle inn mwe verb og samle inn real-feil og kasus-feil
    • evtl. begynne å fikse
  • avslutte kausative verb (korpusanalyse og feil i sammenheng med dette)
  • fortsette å legge ut normative spørsmål på facebook og lagre samtaler
  • ellipser:
    • Keskitolo čilge vuođđojurdagin leat ahte guovddáš sáhtášii čohkket, váldit vára, gaskkustit ja ovddidit dieđuid Álttá-Guovdageainnu ášši birra.
    • fixed: Keskitolo čilge vuođđojurdagin leat ahte guovddáš sáhtášii čohkket, gaskkustit, ovddidit dieđuid Álttá-Guovdageainnu ášši birra ja váldit vára dain.
    • Headjaskeaŋkkaid logahaladettiin čatnasa hálddiid guovlu Sámi čohkaide, vuvddiide, jávrriide, jogaide, guolbaniidda, vuonaide, geđggiide, savvoniidda ee. Sámi namat muitalit ahte min eamiosku lea ain cahkamin jos min buolva áddešii vára ja vuhtii váldit dan.
    • fixed: Headjaskeaŋkkaid logahaladettiin čatnasa hálddiid guovlu Sámi čohkaide, vuvddiide, jávrriide, jogaide, guolbaniidda, vuonaide, geđggiide, savvoniidda ee. Sámi namat muitalit ahte min eamiosku lea ain cahkamin jos min buolva áddešii vára váldit dasja vuhtii váldit dan.

Liste med ting som ein vil ha hjelp med eller diskutera med andre:

  • rutine for nye feiltagger
  • kor skal facebook-samtalene lagres => sjå over.
  • skript for testrutiner
  • redusere spellrelax

Sandra

i det siste:

  • mykje MT-arbeid
    • transfer-reglar
    • forberedt evaluering

fremover:

  • MT
    • evaluering: analysere resultater og planlegge artikkel
    • jobbe med #-listen, dvs. ordformer som ikke får rett analyse i MT
  • FST
    • pronomener: hardkode fokuspartikler

Maja

  • mykje det same som Sandra
  • mange talestett og uttrykk i sme som er vanskelege å få over til god sma

framover:

  • meir MT
  • fst-forbetring
    • samansetjingar

Børre

  • har jobba med CorpusTools
    • verktykasse for å bearbeida, konvertera og analysera korpus
    • har lagt tl støtte for ePub-formatet, slik at vi nå kan ta i mot verk frå Davvi Girji - 14 (av mottekne 16) bøker ligg alt inne
  • stavekontroll på nettet (i lag med Sjur)
  • har hjelpt Trond med å få ordbøkene opp på nett igjen
  • sátni.org har innehalde ord som ikkje er godkjent - det er retta no (av Tomi)
  • andre korpusrelaterte småfeil

Sjur:

  • arbeid med å få hfst til å kompilera raskare - no 2-3x raskare enn default
    • krev aller nyaste hfst
    • konfigurer med --with-backend-format=foma
  • administrasjon
  • speller-demo

Planane for i år - og kor vi står

  • oftare oppdateringar av stavekontrollar
    • 4.0.1 i mars
    • nattlege bygg for MS Office/Win
    • ... men ikkje for andre versjonar enno
    • => vi er ikkje der enno
  • NRK-stavekontroll:
    • vi er på veg, men ikkje i mål
    • jf demosida vår
  • tastaturappane:
    • ingen oppdatering av eksisterande
    • grunnarbeidet for innebygd stavekontroll er ferdig
    • ... men ingen betaversjon enno
  • TTS:
    • oppdateringa burde finnast på nett no, men har ikkje høyrt noko frå Acapela
  • sma- og smj-terminologi
    • i samarbeid med GT
    • sma: Risten-Bijre (i januar)
    • smj: Sandra sidan sist i fjor og utover våren (mindre og mindre)
  • mobilstavekontroll
    • grunnarbeid ferdig
  • grammatikkontroll
    • gått mykje framover:
      • på den lingvistiske sida
      • ... og på den tekniske sida
  • termwikien
    • skal utviklast vidare i lag med Giellagáldu
    • Børre har laga temasider, som automatisk viser alle ord som høyrer til eit tema
    • laga det etter diskusjon med Máret Laila Antti (frå GG)
    • fleire andre ting på venteliste
    • seminar i lag med dei?
      • termwikikurs
      • normeringsdiskusjonar
      • satni.org og andre publiseringsverkty
  • Kintel-ordboka
    • ingen ting har hendt, vi ventar på Kintel (og Sametinget)
  • Korpus
    • eigen korpusinfra mykje meir utvikla
    • har fått ein del materiale få Davvi Girji
    • vil samla inn meir tekst
  • infrastruktur
    • kontinuerleg framdrift
  • MT
    • mykje gjort

kort diskusjon om det som skal skje framover

  • neste Divvun-samling: 10.-14.10.
  • Sandra i praksis dei to siste i oktober eller dei to fyrste i november?
  • mobiltastatur med stavekontroll
  • nye stavekontrollar før jul (kanskje tidlegare)
  • Børre på kurs- og korpusinnsamlingstur til Kautokeino?
  • Børre og Sandra på opplærings- og demotur i smj-land (Sverige? Jokkmokk?)
    • slutten av november?
  • måndagsmøte

Divvun-videostraum

Vi prøver med ein Divvun-hangout - finst på https://hangouts.google.com/hangouts/_/k5utgjnl45hstgiqfwmylj5tpie. Bør gå på ein separat skjerm, slik at vindauga alltid er synleg utan å vera i vegen for arbeidet.

For:

  • meir og lettare kontakt med kvarandre
  • større kjensle av arbeidsfellesskap

Mot:

  • kan vera forstyrrande

Fleksiskjemagjennomgang

Maja-skjema over på onedrive, Sjur hjelper. Alle sender lenke til Sjur.