UIT The arctic university of Norway > Giellatekno
 

161207

Møte 7.12.2016

Trond, Ciprian, Lene

Saksliste

Lydkorpuset

Ciprian vil gå gjennom ELAN-pipeline, og vil sjå på Arnstein sin pipeline samtidig.

  • Vi ser på output
  • Deretter gjev Ciprian Arnstein og Oslo attendemelding med analysert materiale i ELAN.

TODO-lista [/doc/admin/giellatekno/TODO.html]

Det dokumentet må vere oppdatert.

NDS

Lokalisering:

Trond har repetert bugen, gått gjennom, og får ikkje generert. Brev til Ryan.

Ciprian ser på dette.

GEO

No kan Ciprian snu xml.

TILTAK

  • Ciprian snur xml.
  • Etter at dette er gjort: Kontakte Statens kartverk for nye lister + vedtak

FAD-ord i smenob

Dette er antakeleg gjort.

Døme på filer i smenob/inc/

  • 1551 smenob/inc/readytogo (alle i csv-format), 1341 av dei 1551 er ukjent for smenob
  • 4634 smenob/inc/placenames/inc-placenames.txt 4

Ord i inc/ som allereie er i src/ skal ut av inc

Tiltak

  • Ciprian skal se på dataene i src_fad2merge
  • Lage oppdaterte readme-filer i inc (Lene, Trond)
  • Sjå på "sine eigne" filer i dei ulike inc-katalogane og oppdatere (alle)
  • Trond gå gjennom readytogo og fjern dei som er inne
  • Diskutere satni.org med Sjur, legge ord derifrå inn i NDS (Trond)
  • Lene ser på readytogo-mappa
    • Deretter skal Ciprian legge readytogo-dataene inn i gtdicts.

WebDict

Trond har oppdatert sme- og sma-ordbøkene, og lagt til smn-fin. Ordboka for smn-fin er lagt til men fungerer framleis ikkje

Tiltak

  • Oppdatere fleire par (Trond)
  • Skrive i om-filene (Trond)
  • Debugge smnfin (Ciprian)
  • Debugge Geo som webdict (Ciprian)

StarDict

StarDict har tekniske problem, vi kan ikkje hjelpe brukarar her. Vi bør fjerne den ordboka.

Vi kan derimot vurdere andre ordbøker, utan morfologisk analyse, som t.d. http://goldendict.org, evt. WebDict ApertiumDict. Fordelen med det siste er at vi får bruke same innhald til ulike språk.

Eit neste steg er å bruke Divvun sine kontoar i AppStore og GooglePlay for å gjere desse tilgjengeleg som ferdigpakka tenester.

TILTAK

  • Fjerne StarDict-referanse på heimesidene (Trond)
  • Ciprian følgjer opp ideen med goldendict (etterkvart, vi vil gje det til folk i god tid før eksamen i mai, t.d. lenge før påske)

Forrest

Layout: Trond diskuterer med infoavd.

Vi tar dei andre sakene seinare.

Heimeside

Alle bør oppdatere innhaldet, t.d. publikasjonane sine.

Webteneste

Paradigmegenerering

Dette ser vi på seinare.

Tagglokalisering

Dette arbeider vi kontinuerleg med.

On-the-fly-generering

Dette er ikkje så lett, vi stryk den frå TODO-lista.

Korpus

Samiske tall: Vi har 2009, men vil ha alle 9 årgangene.

TILTAK

  • Trond tar opp dette på korpusmøtet.

Møterommet

Trond tar dette vidare.

MT

Evaluering:

  • vi har fått alle evalueringer, bortsett fra en for sme-smj
  • sme-smn: WER/PER ok, pluss svar på spørreskjema
  • sme-smj: WER/PER ok, pluss svar på spørreskjema
  • sme-sma: Maja jobber med denne

Ikke alle har svart på spørreskjema, men det kan følges opp med telefon.

Analyse av analysene (møte først med hver enkelt, deretter med alle tre)

Arbeid

Arbeid med hashlister og bidix-sanity

Omsetje heile sme-korpus

MT bør inn i rutinene våre på stallo. Trond diskuterer dette med Divvun. Børre og Francis skal diskutere dette.

Rutiner:

  • Kvar natt: tmx omsett: wercheck_mt-otpt.py utan verdiar, og deretter over til ei html-fil
    • Rutine: Gjer det kun ved endringar i apertium-svn
  • Kvar natt: pseudotmx: check_mt-otpt.py, og deretter over til ei html-fil
  • Kvar veke: MT av heile freecorpus

NRK

Møte her på UiT onsdag kl 13-15 (også med Sjur)

2017

På fredag ettermidag.