Bug 2281 - PlGen#gaskasaš sammensetninger
Summary: PlGen#gaskasaš sammensetninger
Status: ASSIGNED
Alias: None
Product: sme lexicon
Classification: Unclassified
Component: Continuation lexica (show other bugs)
Version: unspecified
Hardware: Macintosh Other
: P5 - Later enhancement
Assignee: Thomas Omma
URL:
Keywords:
Depends on:
Blocks:
 
Reported: 2016-11-30 19:53 CET by Lene Antonsen
Modified: 2016-12-01 09:48 CET (History)
5 users (show)

See Also:


Attachments

Note You need to log in before you can comment on or make changes to this bug.
Description Lene Antonsen 2016-11-30 19:53:42 CET
Jeg har sett på PlGen#gaskasaš sammensetninger i korpus, se lista under her.
Ingen av dem får dynamisk #gaskasaš analyse, istedenfor får de #gaskkas+N+Der/Dimin+N

f.eks. 
ilmmiidgaskasaš	  ilbmi+N+Cmp/PlGen+Cmp#gaskkas+N+Der/Dimin+N+Sg+Nom

Noen feilstavinger blir godtatt fordi de blir analysert som sammensetning med #gaskkas uten Der/Dimin:

ilmmiidgaskasa	ilbmi+N+Cmp/PlGen+Cmp#gaskkas+N+Sg+Gen

Forslag:
Legge til Cmp gaskasaš til +Cmp/PlGen+Cmp# stien, og samtidig legge tagger til for å hindre sisteledd sammensetning med gaskkas.agiidgaskasaš
albmogiidgaskasaš
bohccuidgaskasaš
buolvvaid-gaskasaš
buolvvaidgaskasašortnegat
davviriikkaidgaskasaš
diehtagiidgaskasaš
eatnamiidgaskasaš
fitnodagaidgaskasaš
fylkkagielddaidgaskasaš
fylkkaidgaskasaš
fágadepartementtaidgaskasaš
fágaidgaskasašvuohta
gielaidgaskasašguovlu
gielddaidgaskasašlávdegoddi
giliidgaskasaš
guovlluidgaskasaš
hálddašandásiidgaskasaš
ilmmiidgaskasaš
joavkkuidgaskasaččat
museaidgaskasaš
máilmmesođiidgaskasaš
nuoraidgaskasaš
ohppiidgaskasaš
regiovnnaidgaskasaš
riikkagaskasaš
ráđđehusaidgaskasaš
sektuvrraidgaskasaš
skuvllaidgaskasaš
sohkabeliidgaskasaš
stáhtaid-gaskasaš
suohkaniidgaskasaš
surggiidgaskasaš
tuvrraidgaskasaš
vuoigatvuođaidgaskasaš
álbmogiidgaskasašbeaivin
álgoálbmogiidgaskasaš
álgoálbmotriikkaidgaskasaš
čearddaidgaskasaš
čoagganemiidgaskasaš
Comment 1 Thomas Omma 2016-12-01 09:30:23 CET
maybe that is good idea

I put in the compounds:

sme $ svn ci -m "compounds bug2281" src
Sending    src/morphology/stems/adjectives.lexc
Sending    src/morphology/stems/nouns.lexc
Transmitting file data ..
Committed revision 144691.
Comment 2 Lene Antonsen 2016-12-01 09:48:13 CET
(In reply to Thomas Omma from comment #1)
> maybe that is good idea
> 
> I put in the compounds:
> 
> sme $ svn ci -m "compounds bug2281" src
> Sending    src/morphology/stems/adjectives.lexc
> Sending    src/morphology/stems/nouns.lexc
> Transmitting file data ..
> Committed revision 144691.

Denne kommentaren er veldig kryptisk. Det hadde vært fint om Thomas kunne kommentere her i bz hva han har gjort. 


Det er to strategier her:
1) leskikalisere alle -gaskasaš som dukker opp i korpus
2) legge inn sti til gaskasaš i +Cmp/PlGen+Cmp# stien

Jeg ser i innsjekkinga at Thomas følger strategi 1) og ikke nummer 2) 

Fra Giellateknos ståsted så ønsker vi strategi 2 fordi strategi 1 ikke er produktiv, og fordi vi ikke får informasjon om Cmp i analysen. En slik sti vil ikke lage flere Cmp enn vi allerede har pga av at substantivet gaskkas inngår i Cmp. Men Divvun kan også legge inn Use/-Spell-tagg eller liknende hvis ønskelig.

Jeg ber om kommentar til dette.