UIT The arctic university of Norway > Giellatekno
 

Meeting2014-03-13

Saker:

nytt frå Sjur

Situasjonsorientering

statusrapport frå alle

Børre

  • korpuskonvertering
  • kodekonvertering

Det meste er under kontroll, dei aller fleste dokumenta er korrekte no. Ulike problem med titlar, forfattarfelt og dokumenttekst.

Usynlege orddelingsteikn og andre teikn deler orda i det konverterte materialet.

Merk: Orddeling bør konverterast til <hyph/>

Har ikkje sett på termwikien enno. Må prioriterast framover, frå neste veke.

Inga

Har jobba med missing-lista, 16 020 ord. Grupper med ord (lista etter frekvens):

  • typos
  • namn
  • samansette ord (av typen "førsteklassing", o.a. talord)
  • nordsamiske(?) låneord skrivne med smj-ortografi (frå tekstar frå svensk side)
  • norske ord
  • ulikestava låneord - mykje uklårt i systemet vårt

Vanlege typos bør leggjast inn i leksikonet med +Err/Sub.

Maja

Tilbakemeldingar frå brukarane:

  • saknar ord frå godkjente lister - Maja har lagt inn (òg i digibaakoe)

Har arbeidd med:

  • saknar MT-delen, dvs Apertium - vil leggja inn ordpar der
  • vil arbeida med resiproke pronomen, jf med nordsamisk
  • må arbeida med twol, treng hjelp -> Børre, Sjur
  • det trengst arbeid med ord som går til R (direkte eller indirekte)
  • added loan-lemma
  • + missinglist
  • properpronouns

- kan man sette Attr Lexicon til R-lexicon? når det gjelder firstcomp. er jeg litt usikker/ambivalent på om det bare er å paste inn fra Bergsland, fordi systemet "spriker". Samtidig er det dette som er normen...drøfte dette.

Sjur

Har arbeidd mykje med hfst-stavekontrollar og bygginga av slike i det siste, + oxt for LibreOffice / OpenOffice.

Framover:

  • Hunspell, PLX inn i ny infra

Tomi

  • jobba med feil på sátni.org - funkar ikkje på maskina til Tomi
    • ordboklista doesn't come up when clicking button
    • Sjur prøver på eiga maskin
  • det har kome nokre feilmeldingar, frå SD og NN
  • skript for å importera frå termwikien
    • funkar, men ikkje sikker på om alt er med
      • lag unit-testar!

Neste: skriv dokumentasjon for sátni.org-koden og korleis han kan testast.

Arbeid framover

Hovudprosjekt utover våren:

  • oppdaterte og nye stavekontrollar
    • missing for alle språk
    • plx og hunspell inn i ny infra
    • testa og utvikla hfst-stavekontrollane
    • forslaga frå hfst-stavekontrollane
  • termwikien (børre)
  • ENG og CLDR/mobiltastatur m.m.
  • grammatikkontroll
  • tekst-til-tale
  • stavekontrolltesting -> slutt
  • sátni.org
  • gielese.no

Neste møte

Måndag 17.3. kl 9.30