UIT The arctic university of Norway > Giellatekno
 

Meeting_2011-03-07

Meeting setup

  • Date: 07.03.2011
  • Time: 09.30 Norw. time
  • Place: Internet
  • Tools: SubEthaEdit, iChat

Agenda

Opening, agenda review, participants

  • Opened at 09: 45
  • Present: Berit Merete, Biret-Anne, Børre, Ciprian, Lene, Maja, Sjur, Thomas, Tomi, Trond

Project review

  • kort oppsummering frå kvart prosjekt, der ein legg fram:
    • status (kva er ferdig, kva ligg etter skjema, kva kjem no)
    • særlege punkt som treng meir merksemd -> separat møte (men punkta bør nemnast for alle, slik at vi kan sjå avhengigheiter som elles blir oversedde)

Det blir altså ein litt annan struktur enn tidlegare - meir prosjektorientert. Vi prøver det ut, og ser korleis det funkar.

Prosjekta er (rapportør i parentes):

  • Divvun 2.1:
    • installerarane (Børre)
    • buggar (Tomi)
  • TTS (Biret Ánne)
  • Divvun-omorganisering (Sjur)
  • Testbenkprosjektet (Sjur)
  • smekorpus (Børre)
  • smakorpus (Børre)
  • smenob (Berit Merete)
  • VD-ÅD-lansering Mac/Win/iPxd (Ciprian)
  • Forvaltningsordbok (Ciprian)
  • Kunnskapsforlaget -- sme-ordbok (Trond)
  • MT-170 (Trond)
  • sma-oahpa (Lene)
  • nu-oahpa (Biret Ánne)
  • Barentsprosjektet (Trond)
  • dis-abstract til Riga (Lene)

Andre, kvilande prosjekt (inga rapportering - lista er ikkje komplett)

  • smefin (Gt+Kotus)
  • smanob
  • korpusgrensesnitt

Divvun 2.1:

installerarane

Børre:

Vi har ferske sme-, sma- og smj W7, O2010, Samisk høgskole-folk har installert.

Problem: Sørsamisk på nye Windowsmaskiner.

Ta kontakt med folk som skal teste:

  • sma: Trond (gjort)
  • smj: Børre

buggar

Tomi:

  • hard-hyphen bug seems to be fixed
  • sme should not have hard-coded clitics
  • missing words are fixed (?? "isit" still out)

Divvun 2.1 meeting Friday 10 AM: Børre, Sjur, Thomas, Tomi

  • Wednesday at 16: 00: deadline for lexical changes before compilation

TTS

Biret Ánne:

  • Klare til å gjere opptak med mannleg røyst, når han har tid.
  • Beraren av den kvinnelege røysta er sjukemeldt, det tar vi etterpå.
  • opptaksrom på konservatoriet - betre akkustikk / mindre støy der

Divvun-omorganisering (Sjur)

Ingenting har skjedd. Sametinget og Universtietet ventar på departementet.

Testbenkprosjektet (Sjur)

Ingenting har skjedd pga. sjukemelding, men prosjektet må bli ferdig.

smekorpus (Børre)

Ciprian har parallellisert det. Francis har sendt ein del attendemeldingar om konverteringsfeil.

Det er framleis ting som skjer i konverteringa ("." = ok, "|" = feil):

convert2xml.pl --shallow orig
Processing files
|||||||||||||||||||||..||||.||||..|.|||||make: *** [all] Error 1

smakorpus (Børre)

Det ligg tekstar der, men vi har ikkje oversikt over kva som er parallelt og kva som ikkje er det.

Parallellisering av sma:

  1. Tekstar må identifiserast som parallelle - det er gjort
  2. Deretter må anchor.txt vere ferdig (status quo: ca 300/1100 open)
  3. Så kan vi setningsparallellisere

TODO:

  1. Samle inn tekstar (Børre) - gjort
  2. Leggja inn metadata om parallelle tekstar (Børre) - gjort
  3. Dokumenter parallelliseringsskript (Ciprian)
  4. Legg inn buggmeldingar om problem med å køyra Ciprian-skripta (Børre)
  5. Gjer ferdig anchor.txt (Maja)
  6. Parallelliser (Ciprian, evt. Børre) (modulo java)

smenob (Berit Merete)

  • har lært å bruka programma
  • identifisert problem kring re- og te-elementa

VD-ÅD-lansering Mac/Win/iPxd (Ciprian)

  • now, both VD and ÅD are updated
  • VD-pipeline now updated along the ÅD, i.e., more general wrt. features comming from the fst
  • slightly improved layout for entries both for mac and for stardict
  • planned: some version for mobile OS non-iPx
  • http://www.androidzoom.com/android_applications/stardict

TODO:

  • Samle e-postliste for agitprop (Sjur; Maja, Børre)
  • Sende info om nye ordbøker + ny Divvun-versjon samtidig neste veke (XXX)
  • SGM om stedsnavn i sma

Forvaltningsordbok (Ciprian)

  • ad, on the GT&DIVVUN side the pipeline works
  • actually, we can try to prove to make the word alignment too
  • problems:
    • input form tca02-sentence aligner: it does not accept anything that it is "detected" as sentence from our preprocessing step (at the moment, manual correction)
    • Francis detected some coding errors which we should check, especially, Børre, so that we can improve our corpus/processing routines
  • Berit Merete har starta

TODO

  • Finne terskelnivå på kandidatar (0.1, 0.x, …)
  • Nytt møte og evaluere, sjå korleis det går
    • Møte omtrent 14.3. (BM, Cip, Francis, Lene, Trond)

Kunnskapsforlaget -- sme-ordbok (Trond)

Trond orienterte.

MT-170 (Trond)

Trond orienterte.

sma-oahpa (Lene)

Kritiske tekniske ting ser ut til å bli på plass denne veka.

Neste lingvistiske utfordring er adjektiv, for å få dei på plass i Morfa-S. I midten av april skal alt av eigenskapar vere ferdig, deretter er det debugging.

nu-oahpa (Biret Ánne)

Oppdaga litt rot med den infoen kurslærar får (frå aktivitetsloggen), det skal det ryddast opp i. Oppdaga buggar i morfa-C.

Barentsprosjektet (Trond)

Møte i dag for å få i gang søknadsskrivinga.

dis-abstract til Riga (Lene)

  • To lange tekstar.
  • tekstene og missinglistene og tilhørende typos-lister er her:
    • private/gt/sma/testcorp/
    • bruk typoslista i denne mappa

To ting er aktuelt:

  • Vi har ei lang missing-liste (både subformer og manglande leksem)
  • Sublemma med standardlemma som oppslagsform, slik:
    • standardlemma:sublemma contlex ;

TODO

  • Lingvistisk møte for å samkøyre sme, sma
    • Saker:
      • ordavleiing
      • taggar
    • Tidspunkt: tysdag kl. 0900
    • Kven: Biret Merete, Lene, Maja, Thomas, Trond

Eventuelt

Ingenting.

Neste veke:

  • Møte til vanleg tid.
  • Divvun 2.1. + VD/ÅD-lansering