UIT The arctic university of Norway > Giellatekno
 

Meeting_2011-11-07

Møte 7.10 2011.

Sjur, Trond

Korpus

På plass:

  • orig-til-xml for .html og .doc
  • teiknsettkonvertering
  • ccat (for parallellføring, m.m.)

Krev testing:

  • språkattkjenning

Ope:

  • orig-til-xml for .pdf
  • automatisk test for parallellføringa

Deadline:

  • Vi må ha eit korpus klart til parallellisering i løpet av oktober.
  • Det skal vere så stort som mogleg -- dvs. omfatte alle paralleliserbare tekstane vi har.