UIT The arctic university of Norway > Giellatekno
 

Meeting_2015-10-06

T&S-møte

Korpus

Trond vil dobla det nordsamiske korpuset.

Innsammlingsarbeidet stoppar opp på ulike stader:

  • Sametinget, og Sjur tek det opp med dei.
  • Den samiske forleggarforeininga
  • Kva er status for materialet der Sametinget har fått forleggarar til å kontraktfeste overlevering til språkteknologi?
  • Forlag
  • Forfattarar

Børre var på runde i mai. Det var positivt, men treng oppfølgjing.

Plan: Kombinere stavekontrollinstalleringsrundreise med møte med forfattarar og forlag.

Andre kjelder: Nasjonalbibliotek, offentleg, andre. Utsett til neste møte.

Kva er status for automatisk korpushausting? Får vi med oss alt?

stavekontrollstatus

hfst

Ei lus knytta til feilmodellhandteringa: klarar ikkje å retta feil der ukjende teikn skal bli ståande: 9-1ágasj -> 9-lagasj funkar ikkje.

sma/sme/smj

Rett forslag i topp-5 for stavekontrolltesting, feilkorpus=typoslista:

  • smj: 73,5 %
  • sme: 81 %
  • sma: 76,6 %

Polderland er betre, (mellom 80% og 90%), men skilnaden blir mindre.

Ting som står att før lansering:

  • retta hfst-feilen (hfst)
  • +CmpN/-implementering på plass (Divvun)
  • Windows- og Mac-pakker på plass, inkl installeringsprogram (Tino+Divvun)
    • Windows går bra !!
    • Mac Word går bra, men det er berre mogleg å bruke ein stavekontroll

Bugzilla

Seinare.