UIT The arctic university of Norway > Giellatekno
 

141029

Giellateknomøte 29.10.14

Ciprian, Lene, Trond; Sjur, Sandra

Saker

  • smenob / nobsme (utsett til neste møte)
  • Clarin oppdateringer
  • diverse:
    • Korp-oppdatering,
    • corpus-data oppdatering, etc.
  • Divvunrelevant
    • smjnob-ordbok
    • Korpusdata

Clarin

Nederland

Ciprian refererte

Metadata: Cip ventar på eit verkty som blir laga i Praha, for å konvertere frå ulike format til CMDI2.

Oddrun Pauline Ohren frå Nasjonalbiblioteket arbeider med formatet.

Viss vi skal vere lagringssenter må vi tilby permanent url. Alternativt kan vi tilby Trolling. Trolling på UB vil vere eit Clarino B-senter. Krav: Server, PID, metadata.

Slike sentra blir sannsynlegvis:

  • Nasjonalbiblioteket + IFI
  • Bergen
  • Trolling

Clarino-møte 1.-2. desember

  • Alle tingar hotell sjølv
  • Nokon frå UB må vere på det møtet (Trond sjekkar det)
  • Clarino vil ha samarbeid, og vise at verktya blir brukt

Opplegg frå Bergen (som UB ordnar på førehand):

  • møterom med prosjektør, lerret og brukbare akustiske forhold;
  • kaffe, te og vann under møtet;
  • 2 lunsjer;
  • 1 middag;
  • antall deltagere er ca. 30;
  • samlet faktura sendes til CLARINO ved UiB.

Korpus

Korp-verktya

Utviklar er i Paris, men Cip har fått kjeldekoden til ny Korp. Cip lagar no ny versjon av Korp med gammel data og ny Korp, og undersøker det. Deretter ser han på ny data.

Deretter bug #1713.

Korp-data (tekstar)

  • Finsk og svensk sameting.
  • Finske dialekttekstar?
  • Avisene

Ordbøker

Kintel

Diskusjon om dette.

Konklusjonar:

  • Vi kan publisere Kintel2 som html i to spalter (eksport frå Filemaker)
  • Deretter kan vi prøve å køyre diff av ein tekstversjon av dette mot ein tekstversjon av dagens html, og vurdere resultatet
  • Vi vil ikkje gjere om det halve årsverket vi la ned i første versjon.

smenob / nobsme

Utsett til neste møte