Bug 2410 - Samansetjing med bindestrek tillet ureduserte former
Summary: Samansetjing med bindestrek tillet ureduserte former
Status: ASSIGNED
Alias: None
Product: sme lexicon
Classification: Unclassified
Component: Continuation lexica (show other bugs)
Version: unspecified
Hardware: Macintosh Other
: P5 - Later enhancement
Assignee: Thomas Omma
URL:
Keywords:
Depends on:
Blocks:
 
Reported: 2017-07-12 11:13 CEST by Trond Trosterud
Modified: 2017-09-06 22:28 CEST (History)
4 users (show)

See Also:


Attachments

Note You need to log in before you can comment on or make changes to this bug.
Description Trond Trosterud 2017-07-12 11:13:06 CEST
I dag blokkerer sme-fst-en samansetjing utan redusert vokal i>e, men ikkje viss samansetjinga har bindestrek:

Trond-MacBook-Air:mns trond$ husmeNorm

sátne-ortnet
sátne-ortnet	sátni+N+Cmp/Hyph+Cmp#ortnet+N+Sg+Nom	0,000000
sátne-ortnet	sátni+N+Cmp/Hyph+Cmp#ortnet+N+Sg+Nom	0,000000

sátni-ortnet
sátni-ortnet	sátni+N+Cmp/Hyph+Cmp#ortnet+N+Sg+Nom	0,000000

sátneortnet
sátneortnet	sátneortnet+N+Sg+Nom	0,000000
sátneortnet	sátni+N+Cmp#ortnet+N+Sg+Nom	0,000000

sátniortnet
sátniortnet	sátniortnet+?	inf

Eg veit ikkje om dette er meininga, viss det er det er sjølvsagt alt i orden, bortsett frå at vi får dobbelgenerering, slik at den eine stien evt. kunne få ein Use/NG.
Comment 1 Lene Antonsen 2017-07-12 13:28:55 CEST
Jeg tok opp denne saka i epost (med TT som CC), fordi det skapte problemer for MT. Løsninga er vekter.

Sjurs kommentar i eposten:
"Det er problematisk å gje dette ein tagg, fordi forma med bindestrek berre blir generert på ordformssida av fst-en - det finst ingen informasjon på analysesida som vi kan ta tak i. Det er mogleg å leggja til det, men det krev igjen bruk av flaggdiakritika og funksjonen med å spegla flaggdiakritika på begge sider som vi veit får Xerox til å kræsja."

Min analyse gir vekting slik:

sme$ husmeNorm 
sátne-ortnet
sátne-ortnet	sátni+N+Cmp/Hyph+Cmp#ortnet+N+Sg+Nom	10,000000
sátne-ortnet	sátni+N+Cmp/Hyph+Cmp#ortnet+N+Sg+Nom	10,000000

sátni-ortnet
sátni-ortnet	sátni+N+Cmp/Hyph+Cmp#ortnet+N+Sg+Nom	10,000000

sátneortnet
sátneortnet	sátneortnet+N+Sg+Nom	0,000000
sátneortnet	sátni+N+Cmp#ortnet+N+Sg+Nom	10,000000
Comment 2 Trond Trosterud 2017-07-12 19:29:57 CEST
Takk for påminninga. Vektene er med andre ord ikkje implementert (dette var sma-sme), eller er det eg som har kompilert utan å slå dei på?
Comment 3 Sjur Nørstebø Moshagen 2017-09-06 22:28:17 CEST
Attåt det som er skrive om vekter, vil eg leggja til:

Slike sitatformssamansetjingar er både moglege og korrekte så lenge ein bruker bindestrek. Tidlegare har vi ikkje godteke dei, og vi har fått kritikk for at stavekontrollen ikkje godtek korrekte samansetjingar.

Men det burde vera mogleg å tagga sitatsamansetjingae. Derimot er det vanskeleg å tagga vanlege samansetjingar med bindestrek - der er det vekter som er løysinga.