Jeg foreslår at vi legger alle lemmaer bare i stems-filer, og ikke i affix- og compoundsfiler. Dette gjelder alle språk, men det er mest i sme vi har det i dag. Grunner: 1) det er vanskeligere å korrigere og debugge stier fordi man forventer at lemmaene skal være i stems-filer 2) det er vanskeligere (umulig?) å lage sjekk-tagg-skript som omfatter alle tagger, også dem som er skrevet uten +, selv om de skulle hatt det, se behovet i innsjekkinger rev 157226 og 157224 Konkrete forslag: I affixes/adjectives.lexc: NomActVEARA flyttes til stems/adjectives.lexc: I affixes/nouns.lexc: ALLGUOVT flyttes til stems/nouns.lexc % dihte legges i stems/adverbs.lexc men med sti fra leksikonet hvor de er nå I compounding.lexc: LEXICON Prefixes flyttes til stems/nouns.lexc eller evt til et nytt stems/prefixes.lexc
seems good
I try
sme $ svn ci -m "moved around things, bug2424" src Sending src/morphology/affixes/adjectives.lexc Sending src/morphology/affixes/nouns.lexc Sending src/morphology/compounding.lexc Sending src/morphology/stems/adjectives.lexc Sending src/morphology/stems/adverbs.lexc Sending src/morphology/stems/nouns.lexc Transmitting file data ...... Committed revision 157414.
i had to revert this thingy, yaml-tests failed, dont know why
(In reply to Thomas Omma from comment #4) > i had to revert this thingy, yaml-tests failed, dont know why Kan du spesifisera kva som feila, så kan vi diskutera kva som er problemet, og korleis det kan løysast?
i dont remember a thing of this
Jeg følger opp denne. Mye er gjort, men enda gjenstår det: i smj har vi src/fst/prefixes.lexc, src/fst/clitics.lexc i sma har vi src/fst/clitics.lexc pluss LEXICON Prefixes i src/fst/compounding.lexc i sme har vi src/fst/clitics.lexc pluss LEXICON Prefixes i src/fst/compounding.lexc i smn har vi src/fst/clitics.lexc Jeg mener at alle disse bør flyttes over i stem, og at vi ser på tagginga. Når har vi f.eks. Davvi+Cmp#Sápmi+N+Prop+Sem/Plc+Sg+Nom dvs at første del mangler PoS osv. Dette lager problemer i MT, vi bør ha lik tagging for all Cmp