UIT The arctic university of Norway > Giellatekno
 

Meeting_2013-11-13

Trond og sjur, 13-19.11. 2013

Saksliste

  • Oppsummering etter Göteborg - del 2 (Tommi-presentasjon)
  • .oxt og LO-stavekontroll
  • Grammatikkontroll
  • MS-lobby for små språk og korrekturverkty
  • møte med sjur og lene om nyinfra
  • korpus, FAD i framtida
  • karp/korp-arbeid no i november
  • Eng
  • EU-søknad om MT

Oppsummering etter Göteborg - del 2 (Tommi-presentasjon)

  • NUUG
    • kjelde til finansiering / dugnadsarbeid -> pakking og distribusjon
  • Hunspell->fst
    • viktig for å auka språkdekningsgraden for Voikko-stavekontrollane
    • Tommi har skript, men dei er gamle
  • frå forskingsbord til ferdig produkt - kven og kor(leis)?
  • Klingon som brekkstong for betre språkteknologi i Linux:
    • vi dumpar inn eit leksikon
    • vi inviterer andre til å gjera morfologien (og dermed stavekontrollen) ferdig
    • kan gje større motivasjon for å gjera ferdig Voikko-integreringa så mange stader som mogleg

.oxt og LO-stavekontroll

Hinderet for å få ein portabel .oxt er problemet med å bygge hfst-ospell på Windows

Problemet er slik:

  1. hfst er uråd å kompilera på Windows pga alle dependensane til libxml++
  2. ingen Windows før hfst funkar der
  3. ingen hfst default på før Windows funkar
  • Svar: byt ut libxml++ med noko liknande utan dependensar
  • Aksjon: få Tommi til å gjera det. Sjur har gjort det (i går)

Vi held pusten.

Grammatikkontroll

Alfaversjon

Alfaversjon fungerer for Francis, no er det Sjur sin tur. Det vil gå ein del tid til det.

Tokenisering

For å ha grammatikkontroll trengst tokenisering. Fran bruker den for finsk. Det går sjølvsagt ikkje, men kva skal vi ha?

  1. lt-proc / hfst-proc?
    Problem her: Mykje er hardkoda.
  2. Ny versjon:
    1. hfst-proc utan komma og punktum (berre med mellomrom)
    2. CG-analyse av input med eigne boundary symbols <.> <?> <: >

TILTAK: Arbeid med tok.txt og tilsvarande fst-preprosessering

MS-lobby for små språk og korrekturverkty

tjada.

møte med sjur og lene om nyinfra

Tysdag. Gjennomført.

korpus, FAD i framtida

Har fått meir pengar for vidare arbeid. No er det sma og smj som gjeld. Vi har moglege kandidatar (personar) for sma og smj. Det som trengst: Fleire tekstar.

karp/korp-arbeid no i november

To personar 2.-4.12.

Eng

T&S jobba med grunnlagsdokument. Held fram: Sjur skriv utkast til Eng-lista.

EU-søknad om MT

Laura?