UIT The arctic university of Norway > Giellatekno
 

160808

Enaresamisk

Saksliste

  • Ordbok
  • MT
  • FST

Relevante dokument:

Ordbok

Sommaren

  • smn-fin: Unifisert ok
  • fin-smn: Unifisert ok

Unifiseringa er gjort på <mg>-mivå. Cip har henta PoS fra FSTen, der hvor det mangler.

Ord frå ordboka er lagt til FST-en

Trond arbeider med å korrigere PoS i ordboka.

Arbeid å gjere

  • FST: Rette verb som ikkje er verb (i underkant av 400)
  • Sjekke via script for bøyningsforsinfo om FST-en er korrekt (i forhold til lemmaet).
  • FST: Sjekke om ordbok og FST har same POS
    • Ciprian: lage liste over mismatch
    • Enare: gå gjennom og vurdere kva som er korrekt
    • Enare: rydde i automatisk unifisering i ordboka
  • rest-elementet
    • Gå gjennom med Ciprian og vurdere automatisk retting
    • Gjennomføre automatisk retting
    • Rette manuelt

Samanlikne FST-generert Gen, Attr, Sg1/Sg3 med ordboka:

  • Feil i FST
  • Feil i ordboka
  • Begge er rett, det er parallelle former

Ordboka er no unifisert på t-nivå, ikkje på mg-nivå.

  • Rydd opp i det
  • ... og ta vare på 399 POS-endringar i V_smnfin.xml-fila

Arbeidsmåte:

  • Ciprian kan lage tabseparerte lister for alle entryer med meir enn ein mg.
  • Merk kor det skal bli slått saman eller splitta
    • Lene ser på relevante møtereferat frå smenob
  • FST-feil, ordboksfeil, parallelle
    • format: lemma, ordboksform, fst-form
    • oppgåve: v (venstre) = ordboksform er rett, o (høyre) = fst-form= rett, m (begge) = begge er rett
  • rest-felta
  • parantesene i t-feltet

Innhald i fad2merge:

00_readme.txt check_fad-vs-sna/ check_fad-vs-src/xml_data/auto/total/ total match men mer/annen info i fad, x = extra check_fad-vs-src/xml_data/manual/ de med 'm', skal redigeres manuelt fad-sna2merge/ inc/ full match, men mer informasjon, lagt fad2merge/check_fad-vs-src/xmldata, og er merka med x="fad"

Ciprian finn fram 00_readme.txt

Arbeidsplan

Unifisering:

  1. Rette t/mg-unifisering (Cip)
  2. Lage oppsett for manuell evaluering
    1. Evt. starte med Adv, Po, Pr
  3. Evaluere (Enare, Neeta?)
    1. Eksempler på sánit.oahpa.no: áigut, beaivi, oahppat, mielde, diibmu

POS-retting i verb

  1. Vente på t/mg-retting
  2. Halde fram med arbeidet i V_smnfin.xml (Enare)

FST/ordbok-retting av Attr/Gen/Sg17Sg3

  1. Lage tabell for manuell gjennomgang
  2. Gå gjennom manuelt

Oppdatere fst på nett

  1. Dagens er frå 7.7. Trond oppdaterer

MT

Transfer og leksikalsk seleksjon

Nordsamiske tekstar skrive i Finland er gode. Bør vi kanskje også teste (generelle) tekstar skrive i Noreg (evt. Sverige)?

Bidix

Neeta lese gjennom bidix?

Omega-T

Trond tar opp tråden. <== prioriteres, etter at arbeidet i Inari er satt igang

Evaluering

Intern deadline 1.9.

Ilmari, Petter, Miina, Sammol

  • Sende nordsamisk tekst + evaluere sme-smn MT
  • Sende finsk tekst + evaluere sme-smn MT
  • Sende begge tekstane + evaluere sme-smn MT

Arbeidsplan

Evaluering av pan-samiske tekstar

  1. Finne tekst, korrekturlese, MT-omsetje
  2. Lage instruksjonar og gje til Enare
  3. Manuell evaluering
  4. Arbeid med MT

Omega-T

  1. Ta opp tråden med Kevin
  2. Gå vidare på Apertium-lista eller til andre

Selve evalueriga

  1. finne evaluerere til eval 1 og 2:
  2. evaluering 1
    1. fra nordsamisk til enaresamisk (mål: sammenlikne med forrige evaluering)
  3. evaluering 2
    1. fra finsk til enaresamisk (mål: evaluere fin-sme-smn-MT med sme som rele-språk)

Evaluering 1

  1. Finne tekstar (Lene, Trond)
    1. to tekstar, til saman 600 ord
  2. Finne evaluerarar (Ilmari, Miina, Petter, Matti M)
  3. sjekke tekstane frå siste gang (ML)
    1. Deadline 1 veke frå tysdag
  4. Følgje opp
Mappe:
main/techdoc/mt/smesmn/evalueren/1-2015/

Filer:
evalreive2.docx (brev sendt til evaluerere med spørreskjema og tekst)
evalreive2_smn.docx
evalreive1.docx (kladd til forhåndsinfo)

FST

  • Px
  • Diminutiivvat
  • Passiiva
  • Eará derivašuvnnas
  • Leksikona
    • Dábálaš čállinfeaillat
    • Adjektiivvaid advearbbahámit

Oppsummering, förste steg

  • Ciprian: teknisk til ordboka
  • Trond: Enare-ordbok
  • Lene: Tekstar
  • ML: Evaluerarane