Bug 2512 - Analyse for dynamiske sammensetninger bokstav + tall
Summary: Analyse for dynamiske sammensetninger bokstav + tall
Status: ASSIGNED
Alias: None
Product: sme lexicon
Classification: Unclassified
Component: Continuation lexica (show other bugs)
Version: unspecified
Hardware: Macintosh Other
: P2 - As soon as possible major
Assignee: Thomas Omma
URL:
Keywords:
Depends on:
Blocks:
 
Reported: 2018-09-26 23:28 CEST by Lene Antonsen
Modified: 2018-10-16 12:19 CEST (History)
5 users (show)

See Also:


Attachments

Note You need to log in before you can comment on or make changes to this bug.
Description Lene Antonsen 2018-09-26 23:28:16 CEST
Vi får nå slik analyse:

usmedis
S85948
S85948	S+Dyn85948+Num+Arab+Sg+Loc+Attr
S85948	S+Dyn85948+Num+Arab+Sg+Ill+Attr
S85948	S+Dyn85948+Num+Arab+Sg+Nom
S85948	S+Dyn85948+Num+Arab+Sg+Gen
S85948	S+Dyn85948+Num+Arab+Sg+Acc

Dette er ikke bra, men hva vil vi ha? er +Dyn taggen viktig her, eller kan vi bare fjerne den, slik at lemmaet blir S85948 ? (men en annen tagg enn +Num+Arab)

Dette er viktig å avgjøre raskt pga Korp.

LEXICON SCND													   !!= * __@CODE@__ second part of loop
 B THRD ; C THRD ; Č THRD ; D THRD ; Đ THRD ; F THRD ; G THRD ;	
 H THRD ; J THRD ; K THRD ; L THRD ; M THRD ; N THRD ; Ŋ THRD ;	
 P THRD ; Q THRD ; R THRD ; S THRD ; Š THRD ; T THRD ; Ŧ THRD ; V THRD ;
 W THRD ; X THRD ; Z THRD ; Ž THRD ; 							
 A THRD ; Á THRD ; E THRD ; I THRD ; O THRD ; U THRD ; 			
 Æ THRD ; Ø THRD ; Y THRD ; Ä THRD ; Ö THRD ; Å THRD ; 			
 +Dyn%-:%- ARABIC ; 											           ! N-9520 Kárášjohka
 +Dyn+Use/-Spell: ARABIC ;
Comment 1 Lene Antonsen 2018-09-27 10:39:24 CEST
Vi trenger å skille S85948 ja 85948 fordi S85948 ikke kvantifiserer. Dette har ikke minst betydning for MT, men sikkert for grammatikkontrollen også. Har vi en høvelig tagg for dette, så kan jeg ommøblere i lexc, dvs få +Dyn til slutt sammen med denne taggen. Eller vil vi si at +Dyn er nok til å fortelle at dette ikke er et vanlig tall? dvs at +Dyn sier at dette er en sammensetning av bokstaver og muligens tall?

FG	FG+N+Prop+Sem/Org+ACR+Dyn+Sg+Nom
S85948	S85948+Num+Dyn+Sg+Nom <== jeg har her  fjerna +Arab
85948	85948+Num+Arab+Sg+Nom
Comment 2 Lene Antonsen 2018-09-27 10:41:23 CEST
Hva med +ACR istedenfor +Num?

S85948	S85948+ACR+Dyn+Sg+Nom
Comment 3 Ciprian Gerstenberger 2018-09-27 11:08:39 CEST
(In reply to Lene Antonsen from comment #2)
> Hva med +ACR istedenfor +Num?
> 
> S85948	S85948+ACR+Dyn+Sg+Nom

Jeg mener +ID for identifier (en slags proper noun) er bedre egnet som tag.
Comment 4 Trond Trosterud 2018-09-27 12:52:18 CEST
Vi vil ikkje ha Num. Num bør vere ein tagg for alt som tar komplement i Sg Gen (som norsk 1234 bøker, vs. *2B34 bøker"). Skilnaden mellom +ACR og +ID er eg usikker på om vi klarer å oppretthalde, det er lettare å skilje mellom kva ting er enn kva ting blir brukt som. Evt. kanskje ein under-tagg +ID, men la oss gå for ACR, er mitt syn.