Vi får nå slik analyse: usmedis S85948 S85948 S+Dyn85948+Num+Arab+Sg+Loc+Attr S85948 S+Dyn85948+Num+Arab+Sg+Ill+Attr S85948 S+Dyn85948+Num+Arab+Sg+Nom S85948 S+Dyn85948+Num+Arab+Sg+Gen S85948 S+Dyn85948+Num+Arab+Sg+Acc Dette er ikke bra, men hva vil vi ha? er +Dyn taggen viktig her, eller kan vi bare fjerne den, slik at lemmaet blir S85948 ? (men en annen tagg enn +Num+Arab) Dette er viktig å avgjøre raskt pga Korp. LEXICON SCND !!= * __@CODE@__ second part of loop B THRD ; C THRD ; Č THRD ; D THRD ; Đ THRD ; F THRD ; G THRD ; H THRD ; J THRD ; K THRD ; L THRD ; M THRD ; N THRD ; Ŋ THRD ; P THRD ; Q THRD ; R THRD ; S THRD ; Š THRD ; T THRD ; Ŧ THRD ; V THRD ; W THRD ; X THRD ; Z THRD ; Ž THRD ; A THRD ; Á THRD ; E THRD ; I THRD ; O THRD ; U THRD ; Æ THRD ; Ø THRD ; Y THRD ; Ä THRD ; Ö THRD ; Å THRD ; +Dyn%-:%- ARABIC ; ! N-9520 Kárášjohka +Dyn+Use/-Spell: ARABIC ;
Vi trenger å skille S85948 ja 85948 fordi S85948 ikke kvantifiserer. Dette har ikke minst betydning for MT, men sikkert for grammatikkontrollen også. Har vi en høvelig tagg for dette, så kan jeg ommøblere i lexc, dvs få +Dyn til slutt sammen med denne taggen. Eller vil vi si at +Dyn er nok til å fortelle at dette ikke er et vanlig tall? dvs at +Dyn sier at dette er en sammensetning av bokstaver og muligens tall? FG FG+N+Prop+Sem/Org+ACR+Dyn+Sg+Nom S85948 S85948+Num+Dyn+Sg+Nom <== jeg har her fjerna +Arab 85948 85948+Num+Arab+Sg+Nom
Hva med +ACR istedenfor +Num? S85948 S85948+ACR+Dyn+Sg+Nom
(In reply to Lene Antonsen from comment #2) > Hva med +ACR istedenfor +Num? > > S85948 S85948+ACR+Dyn+Sg+Nom Jeg mener +ID for identifier (en slags proper noun) er bedre egnet som tag.
Vi vil ikkje ha Num. Num bør vere ein tagg for alt som tar komplement i Sg Gen (som norsk 1234 bøker, vs. *2B34 bøker"). Skilnaden mellom +ACR og +ID er eg usikker på om vi klarer å oppretthalde, det er lettare å skilje mellom kva ting er enn kva ting blir brukt som. Evt. kanskje ein under-tagg +ID, men la oss gå for ACR, er mitt syn.