UIT The arctic university of Norway > Giellatekno
 

Meeting_2011-03-14

Meeting setup

  • Date: 14.03.2011
  • Time: 09.30 Norw. time
  • Place: Internet
  • Tools: SubEthaEdit, iChat

Agenda

Opening, agenda review, participants

  • Opened at 09: 45
  • Present: Berit Merete, Biret-Anne, Børre, Ciprian, Lene, Sjur, Thomas, Tomi
  • Absent: Maja, Trond

Project review

  • kort oppsummering frå kvart prosjekt, der ein legg fram:
    • status (kva er ferdig, kva ligg etter skjema, kva kjem no)
    • særlege punkt som treng meir merksemd -> separat møte (men punkta bør nemnast for alle, slik at vi kan sjå avhengigheiter som elles blir oversedde)

Det blir altså ein litt annan struktur enn tidlegare - meir prosjektorientert. Vi prøver det ut, og ser korleis det funkar.

Prosjekta er (rapportør i parentes):

  • Divvun 2.1:
    • installerarane (Børre)
    • buggar (Tomi)
  • smekorpus (Børre)
  • smakorpus (Børre)
  • VD-ÅD-lansering Mac/Win/iPxd (Ciprian)
  • Forvaltningsordbok (Berit Merete)
  • nu-oahpa (Biret Ánne)
  • dis-abstract til Riga (Lene)
  • Infrastruktur (Sjur)
  • sma-oahpa (Lene)

Andre prosjekt, ikkje med på møtet:

  • Divvun-omorganisering (Sjur)
  • Kunnskapsforlaget -- sme-ordbok (Trond)
  • MT-170 (Trond)
  • TTS (Biret Ánne)
  • smenob (Berit Merete)
  • smefin (Gt+Kotus)
  • smanob
  • Testbenkprosjektet (Sjur)
  • Barentsprosjektet (Trond)
  • korpusgrensesnitt

Dis-abstract til Riga (Lene)

Ferdig, vart sendt inn på fredag. Vi laga få cg-reglar, men dei får likevel til mykje. Berre 106 reglar, men bra lemmatisering, sjølv med nesten 9 % missing.

Sma-korpus dårleg:

  • dårleg språkgjenkjenning
  • bibelen låg to gonger der (no fjerna)
  • bibelen dårleg formattert
  • berre 10 korrekte dokumentpar for parallellkorpuset

smekorpus (Børre)

Eng. bibel kræsjar konverteringa fordi dei er så store (kræsjar XML: : Twig). Fann nokre andre filer som skapar problem, laga testar og fiksa konverteringa for desse.

smakorpus (Børre)

Språkgjenkjenning: truleg er språkmodellen for sma for dårleg, vart laga lenge før vi byrja arbeidet med sma.

TODO:

  • laga betre LM for sma (Børre)

Forvaltningsordbok (Berit Merete)

  • begynte i forrige uke
  • stor feil i materialet med stor forbokstav for samansette ord som førte til at same ordet gjekk igjen på ulike plassar -> omarbeid
  • har gått gjennom ca 4000 liner
  • kunnskapsoverføring til resten av gruppa -> vi må læra av dette nye prosjektet
  • bør ha møte om omsetjinga av ord som har MWE på samisk
  • se på mulighet for terskel for automatisk fjerning av irrelevante linjer

TODO:

  • møte for å gå gjennom omsetjingsproblem - avtale tidspunkt etter Komi-møtet - kl 11 (Lene har undervisning fra kl 12.) ( Berit Merete, Ciprian, Lene, Trond)
    • (NB! vi har Komi-møte 9.30 (og Trond er i anna møte 8.45-9.30)

nu-oahpa (Biret Ánne)

  • legger til lærestoff på Fronter og lenking til lesestoff på nettet
  • grammatikken på nettet er kanskje for liten -> legge til fra Fronter? Vi må bestemme oss for hvor omfattende grammatikkene skal være -> diskusjon om helskapen
  • Aajege har fått tilgang til Fronter -> sørsamisk versjon etterhvert??

Infrastruktur (Sjur)

Kurs i Ungarn, begynt å teste hfst hfst3 snart klar til å bli "released", med støtte for xfst og twolc

sma-oahpa (Lene)

Denne veka skal adjektiva på plass. Dette krev at alle sma-oahpa-adjektiva ligg i fst-en og har fungerande paradigme, f.eks. ikke overgenering av Comp/Superl. Trond har generert tabellar over adjektiva og leksikona deira, og dei formene som blir generert. Ta ein titt!

"rev" er med endringer i fst, fst-endringene er foreløpig ikke sjekka inn:

Kan de sjå på det, og kommentere, evt. samanlikne med status quo:

Divvun 2.1:

installerarane (Børre)

Kort møte på fredag, 3 av 4 tilbakemeldingar var positive, den fjerde skal vi sjekka.

Lene har testa på Mac med gamal Office (Office 2008). Alt ok.

buggar (Tomi)

Dei fleste buggane fjerna i fredagsversjonen. Ny versjon til i morgon med dei siste halvstore feila retta.

VD-ÅD-lansering Mac/Win/iPxd (Ciprian)

Sma er generert på nytt, og vil bli generert ein gong til. Meir testing.

Cip ønsker forklaringer til grammatikkord => neste versjon

Merknader frå Lene:

  • vi treng fleire testarar
  • skrivefeil-liste i Bugzilla
  • 2-3 tvetydige eksempler
  • endringar i miniparadigma (jf e-post)
  • måedtie i fst:
måedtie	måedtie+Pron+Indef+Pl+Nom  <===== bort?? moadda
moadda	moadda+Num+Sg+Nom
moadda	moadda+Num+Sg+Acc

Pl kan gott tas bort
moadda tt (ackusativ = nominativ) många,
åtskilliga; flera, några, ett par; moatte bále många gånger; moadda jage åtskilliga år, i åratal; måttijt jagijt under åtskilliga, många år; moattet guovlos från flera hål  greitt - jeg fikser det :-)
måedtie	måedtie+Pron+Indef+Sg+Nom

Lanseringskoordingering

Lanseringa blir onsdag ca kl. 12.

  • laga e-postliste (Sjur)
  • skriva Divvun-tekst (Sjur)
  • skriva ordbokstekst (Lene)
  • samla Divvun og ordbokstekstane (Sjur)
  • oppdatera heimesidene & lenkene (Børre)
  • omsetjingar til andre språk (Biret Á, Thomas, Maja, Tomi, Ciprian)
    • språk: sme, smj, sma, sv, fi, en, ty
  • oppdater bileta (Sjur)
    • send passande oppslagsord til Sjur + lenke til biletsida (Lene)