UIT The arctic university of Norway > Giellatekno
 

121210p

Møte 10.11.12

Til stades: Heli, Ryan, Lene, Trond

Saksliste

  • Omorganisering av projektsida
  • PX i Morfa
  • Oahpa2
  • Multiartikkelen
  • Dict javascript-plugin
  • View (teaksta)
  • Bugs
  • Neste møte

Omorganisering av projektsida

Lene har prøvd å gjøre projektsida  mer oversiktlig

PX i Morfa

Px i MorfaS

TILTAK

  • betydningar mangler, oversetting må skrives inn i n_px-fila. Fila flyttes over i src-katalogen (Lene)
  • lokalisering, kjøre skript, oversette (Trond, Lene)
  • Lage Morfa-C oppgaver (Lene)

Oahpa2

Det er søkt om 50.000 fra utdanningsfondet til programmerer for russisk oahpa.

Multiartikkelen

Ryan har fått kontakt med en som har brukt Rosetta Stone for Navajo: dårlig på grammatikk og kostbart

Betalingskurs i ojibwe, med demo

Sitat fra dokumentasjon om kurset: Grammar Information at Your Fingertips Quickly and easily access grammar information on any word you come across. Expand your knowledge of how a word is used in context. Find out the part of speech, how a word is inflected, or read a grammar tutorial.

The declarative memory system learns and remembers vocabulary words, phrases and even short sentences. The procedural memory system learns the skills of applying grammar and producing language.

http: //mokennon2.albion.edu/ohelp.htm http: //ojibwe.lib.umn.edu/ http: //ojibwe.lib.umn.edu/main-entry/nisidotaadiwag-vai

Dict javascript-plugin

smenob med gt-fst, nobsme med OBT. Det fungerer, men treng arbeid med stylesheets.

http: //i.imgur.com/5sRFr.jpg

Muligheter:

  1. implementere i kursa
  2. url-basert – man trenger ikke å installere (testa i x, x og x)
  3. plugin for forskjellige nettlesere, må installeres
    1. wordlink - krever at vår dict gjøres om til en url-basert: http: //url/til/ordform -> http: //testing.oahpa.no/kursadict/detail/sme/nob/orrut.html
  4. hva skal være med i API, hva kan vi bidra?

Språkpar:

  • sme<->nob
  • sme<->fin
  • sma<->nob (NB: eigen FST til sma-ordboka)
  • sme<->eng (må lages først i apertiumformat)
  • kom<->eng/fin/rus (words/dicts/kom2X/src + analysator: langs/kpv/
  • myv<->fin

http: //testing.oahpa.no/plugin/kursadict.plugin.html#

TILTAK

  • Legge ut kotus sme-eng på dict (Trond)
  • Ta kontakt med amerikanske samer om forbedring av ordboka (Lene)
  • Finne oversetter for sme-eng Oahpa (Lene)
  • Inkludere testing.oahpa.no/kursadict i wordlink (Trond kontaktar Skottland)
  • URL nederst på detaljert sida tilbake til GT/divvun (Ryan)
  • Bestemme på kva slags output det vert på detaljert sida når det gjeld ordform som er generert av sme-norm (Trond)

View (teaksta)

Heli har begynt å utforske koden. Det finnes flere utviklingsgrener

  • core er best dokumentert
  • cg3 passer kanskje best for oss
Hernandez lrec2012 UIMA 
EnhanceXMLAnnotator</node>
        <node>GenericRelevanceAnnotator</node>
        <node>OpenNlpTokenizer</node>
        <node>OpenNlpSentenceDetector</node>

Disse filene skal brukes i pipeline:

  • /opt/smi/sme/bin/abbr.txt
  • /opt/smi/sme/bin/sme.fst
  • /opt/smi/sme/bin/sme-dis.rle eller
  • /opt/smi/sme/bin/sme-dis.bin

Lingivister: Hugs å logge endringar i fst i priv/admin/README-admin-smi.txt.

cat text | preprocess --abbr=abbr.txt | \
lookup -flags mbTT -utf8 /opt/smi/sme/bin/sme.fst | \
lookup2cg | vislcg3 -g sme-dis.rle

For testing

  • http: //avvir.no
  • http: //www.lapinkansa.fi/Sagat

Vår dokumentasjonsside om Teaksta

Bugs

Vi har ingen åpne bugger for smeOahpa og vi kan lukke de alle (?) smaOahpa-bugger (Lene)

Neste møte

28.12.12 kl 8.30