Bug 1463

Summary: stoere + orre
Product: sma lexicon Reporter: Maja Lisa Kappfjell <maja.l.kappfjell>
Component: Continuation lexicaAssignee: Maja Lisa Kappfjell <maja.l.kappfjell>
Status: RESOLVED FIXED    
Severity: enhancement CC: berit.a.baal, berit.nystad.eskonsipo, lene.antonsen, ritva.nystad, sjur.n.moshagen, thomas.omma, trond.trosterud
Priority: P5 - Later    
Version: unspecified   
Hardware: Macintosh   
OS: Other   

Description Maja Lisa Kappfjell 2012-10-09 10:27:39 CEST
Dåankah stoere.
Jeg tenker å subbe stoere-stoerebe-stoeremes, men jeg forstår ikke hva galt jeg gjør.

LEXICON STOERE
+Use/Sub:stoer e_E_EVEN ;
+Use/NG:stoerr e_E_EVENNOCOMP ;
+Use/Sub:stuerre EVENCOMPONLY ;
+Use/Sub:stoerre EVENCOMPONLY ;
 STOERE_COMP ;

kan noe se på dette?

+ dåankah
Comment 1 Maja Lisa Kappfjell 2012-10-09 10:36:29 CEST
Det var ette leksikonet jeg skulle lime inn:

LEXICON ORRE
+Use/NG:urre EVENCOMPONLY ;
+Use/NG:urre EVENCOMP ;
+Use/NG:urre DIMCOMP ; 
    +Use/Sub:orr e_ES_ODDEVEN ; !comment from Aajege, MLK: bør subbes. orresistie?
Comment 2 Lene Antonsen 2012-10-09 11:17:23 CEST
Siden du tar opp stoere-stoerebe-stoeremes, så kommenterer jeg det første leksikonet som du limer inn.

Man kan ikke ha Use/Sub og Use/NG på alle stiene, da forsvinner ordet fra Oahpa.

I stems/adjectives.lexc er 'stoere' oppført som lemma. Hvis 'stoere' skal være sub, så må dette endres til 'stoerre'
Comment 3 Lene Antonsen 2012-10-09 11:44:58 CEST
(In reply to comment #1)

> LEXICON ORRE
> +Use/NG:urre EVENCOMPONLY ;
> +Use/NG:urre EVENCOMP ;
> +Use/NG:urre DIMCOMP ; 
>    +Use/Sub:orr e_ES_ODDEVEN ; !comment from Aajege, MLK: bør subbes.
> orresistie?

Når det gjelder dette leksikonet:
også her er alle stiene enten Use/NG ellerUse/Sub

Den eneste stien som gir A Attr og A Sg Nom har Sub. dvs at man bare får komparasjon med urre- ut som norm, ingenting anna.
Comment 4 Thomas Omma 2012-10-09 11:50:42 CEST
huh?
subbe stoere-stoerebe-stoeremes i LEXICON ORRE?
Comment 5 Lene Antonsen 2012-10-09 11:57:07 CEST
(In reply to comment #4)
> huh?
> subbe stoere-stoerebe-stoeremes i LEXICON ORRE?

Jeg oppfatter det slik at det er snakk om adjektivene 'stoerre' og 'orre' - det er ihvertfall problemer i begge leksikonene
Comment 6 Lene Antonsen 2012-10-09 12:05:15 CEST
Ang. dåankah.

dsma:
dåankah+A+Sg+Nom	dåenkah
dåankah+A+Sg+Nom	tjåenkah
dåankah+A+Attr	dåenkah
dåankah+A+Attr	tjåenkah


Problemet er %^DISIMP

LEXICON ah_AH_ODD  !XXX mangler CASE - hva er riktig - kanskje EVEN?
 ah_AH_ODDNOCOMP ;
:ahk ODDCOMP ; ! Wait: gaastoe - oe-NOUN 
 

LEXICON ah_AH_ODDNOCOMP 
:%^DISIMPa   ATTR_H ;  <======= 
:%^DISIMPa   PRED_H ;  <======= 
   aCASEOBL ;
Comment 7 Lene Antonsen 2012-10-11 08:14:12 CEST
> LEXICON ah_AH_ODDNOCOMP 
> :%^DISIMPa   ATTR_H ;  <======= 
> :%^DISIMPa   PRED_H ;  <======= 
>   aCASEOBL ;

Jeg ser fra loggen at det er Trond har endra twol og lagt til DISIMP i leksikonet:

Author: trond
Date: 2012-06-29 12:57:12 +0200 (bear, 29 geas 2012)
New Revision: 59903

Modified:
 trunk/gt/sma/src/adj-sma-lex.txt
 trunk/gt/sma/src/sma-lex.txt
Log:
-a- som rotvokal i trestava som har -a-, og DISIMP for å gjere det til -e-, jf. dagens twol-endring

Generering av adjektivene i dette leksikonet gir feil resultat, så Trond bør rette opp i dette:

båljoeh+A+Attr	beljah
båljoeh+A+Attr	båljoeh

dearkoes+A+Attr	dearkoes
dearkoes+A+Attr	dearkoeh
dearkoes+A+Attr	dearkas
dearkoes+A+Attr	deerkah

dåankah+A+Attr	dåenkah
dåankah+A+Attr	tjåenkah

dåankah+A+Attr	dåenkah
dåankah+A+Attr	tjåenkah

gaarroeh+A+Attr	gaarroeh
gaarroeh+A+Attr	gaerrah

gaastoeh+A+Attr	gaaste
gaastoeh+A+Attr	gaastoeh
gaastoeh+A+Attr	gaestah

galhpah+A+Attr	galhpah

gavsoeh+A+Attr	gavsoeh
gavsoeh+A+Attr	gevsah

gåarhmah+A+Attr	gåarhmah

gæhtjah+A+Attr	gyhtjehke
gæhtjah+A+Attr	gæhtjah

habroeh+A+Attr	habroeh
habroeh+A+Attr	hebrah

hamhpah+A+Attr	hamhpah

hartjah+A+Attr	hartjah

jåabpoeh+A+Attr	jåabpoeh
jåabpoeh+A+Attr	jåebpah

jåalhkoes+A+Attr	jåalhkoes
jåalhkoes+A+Attr	jåalhkas
jåalhkoes+A+Attr	jåalhkoeh
jåalhkoes+A+Attr	jåalhkah

jåarhtjah+A+Attr	jåarhtjah

klåadtoeh+A+Attr	klåadtoeh
klåadtoeh+A+Attr	klåedtah

klåtnjah+A+Attr	klytnjehke
klåtnjah+A+Attr	klåtnjah

krahtjoeh+A+Attr	krahtjoeh
krahtjoeh+A+Attr	krehtjah

kråabjoeh+A+Attr	kråabjoeh
kråabjoeh+A+Attr	kråebjah

kråavhkoeh+A+Attr	kråavhkah
kråavhkoeh+A+Attr	kråavhkoeh

låasmoeh+A+Attr	låasmoeh
låasmoeh+A+Attr	låesmah

længhkah+A+Attr	længhkah

namhpah+A+Attr	namhpah

namhtah+A+Attr	namhtah

naskoeh+A+Attr	naskoeh
naskoeh+A+Attr	neskah

njuajjah+A+Attr	njuajjah

råadtsah+A+Attr	råadtsah

råatjkah+A+Attr	råatjkah

rårhvah+A+Attr	rårhvah

sahpoeh+A+Attr	sahpoeh
sahpoeh+A+Attr	sehpah

sjalhkah+A+Attr	sjalhkah

skaanjkah+A+Attr	skaanjkah

skearmoeh+A+Attr	skearmoeh
skearmoeh+A+Attr	skeermah

skåavroeh+A+Attr	skåavroeh
skåavroeh+A+Attr	skåevrah

slaabroeh+A+Attr	slaabroeh
slaabroeh+A+Attr	slaebrah

snjatjkah+A+Attr	snjatjkah

svalkoeh+A+Attr	svalkoeh
svalkoeh+A+Attr	svelkah

sveartoeh+A+Attr	sveartoeh
sveartoeh+A+Attr	sveertah

tjanhkah+A+Attr	tjanhkah

tjåankoeh+A+Attr	tjåankoeh
tjåankoeh+A+Attr	tjåenkah

tråmhpoeh+A+Attr	trempah
tråmhpoeh+A+Attr	tråmhpoeh

åajvah+A+Attr	åajvah
Comment 8 Lene Antonsen 2012-10-11 08:19:08 CEST
> Generering av adjektivene i dette leksikonet gir feil resultat, så Trond bør
> rette opp i dette:

Dagens testskript sjekker bare at lemmaet blir generert. Vi burde også ha en måte å sjekke at vi ikke generer uønska former, det er veldig alvorlig for Divvun. Siden ett lemma kan generere varianter, er dette ikke like enkelt, men vi kunne sammenlikne rotvokal i A+Attr og A+Sg+Nom mot lemmaet. Den vil vel (alltid?) være lik?
Comment 9 Lene Antonsen 2012-10-11 08:26:55 CEST
 Siden ett lemma kan generere varianter, er dette ikke like enkelt, men
> vi kunne sammenlikne rotvokal i A+Attr og A+Sg+Nom mot lemmaet. Den vil vel
> (alltid?) være lik?

Nei, den er av og til ulik, som her

njeerpes+A+Attr	njeerpes
njeerpes+A+Attr	njåårpehke

rööpses+A+Attr	rååpsehke
rööpses+A+Attr	rööpses
rööpses+A+Attr	reepses

I sme er den ofte ulik. Så det går ikke likevel.
Men når man endrer twol, bør man ihvertfall generere mye, slik at man oppdager uønska former.
Comment 10 Lene Antonsen 2012-10-11 09:02:35 CEST
viser ellers til bz 1433, som omhandler nettopp dåankah, og hvor konklusjonen er at dette er en twol-sak.
Comment 11 Trond Trosterud 2012-10-11 10:10:41 CEST
Eg har no fjerna DISIMP frå ah_AH_ODDNOCOMP. Grunnen til at eg la det til var fordi eg såg på trestava adjektiv, men slik DISIMP var plassert her traff det første og ikkje andre stavinga, og vart feil.

Former av denne typen er no borte:

båljoeh+A+Attr  beljah
dearkoes+A+Attr  deerkah
dåankah+A+Attr  dåenkah
dåankah+A+Attr  tjåenkah
dåankah+A+Attr  dåenkah
dåankah+A+Attr  tjåenkah
gaarroeh+A+Attr  gaerrah
gaastoeh+A+Attr  gaestah
gavsoeh+A+Attr  gevsah

Eg limer inn den same genereringa som Lene gjorde, til samanlikning. Merk at det framleis er mange doble, triple og kvadruple former. Desse kjem av at same adjektiv er ført opp to, tre og fire gonger i fila. Men i alle fall er DISIMP-formene no borte.


båljoeh+A+Attr	baljah
båljoeh+A+Attr	båljoeh

dearkoes+A+Attr	dearkoes
dearkoes+A+Attr	dearkoeh
dearkoes+A+Attr	dearkah
dearkoes+A+Attr	dearkas

dåankah+A+Attr	dåankah
dåankah+A+Attr	tjåankah

dåankah+A+Attr	dåankah
dåankah+A+Attr	tjåankah

gaarroeh+A+Attr	gaarroeh
gaarroeh+A+Attr	gaarrah

gaastoeh+A+Attr	gaaste
gaastoeh+A+Attr	gaastah
gaastoeh+A+Attr	gaastoeh

galhpah+A+Attr	galhpah

gavsoeh+A+Attr	gavsoeh
gavsoeh+A+Attr	gavsah

gåarhmah+A+Attr	gåarhmah

gæhtjah+A+Attr	gyhtjehke
gæhtjah+A+Attr	gæhtjah

habroeh+A+Attr	habroeh
habroeh+A+Attr	habrah

hamhpah+A+Attr	hamhpah

hartjah+A+Attr	hartjah

jåabpoeh+A+Attr	jåabpah
jåabpoeh+A+Attr	jåabpoeh

jåalhkoes+A+Attr	jåalhkoes
jåalhkoes+A+Attr	jåalhkas
jåalhkoes+A+Attr	jåalhkoeh
jåalhkoes+A+Attr	jåalhkah

jåarhtjah+A+Attr	jåarhtjah

klåadtoeh+A+Attr	klåadtah
klåadtoeh+A+Attr	klåadtoeh

klåtnjah+A+Attr	klytnjehke
klåtnjah+A+Attr	klåtnjah

krahtjoeh+A+Attr	krahtjoeh
krahtjoeh+A+Attr	krahtjah

kråabjoeh+A+Attr	kråabjah
kråabjoeh+A+Attr	kråabjoeh

kråavhkoeh+A+Attr	kråavhkah
kråavhkoeh+A+Attr	kråavhkoeh

låasmoeh+A+Attr	låasmoeh
låasmoeh+A+Attr	låasmah

længhkah+A+Attr	længhkah

namhpah+A+Attr	namhpah

namhtah+A+Attr	namhtah

naskoeh+A+Attr	naskoeh
naskoeh+A+Attr	naskah

njuajjah+A+Attr	njuajjah

råadtsah+A+Attr	råadtsah

råatjkah+A+Attr	råatjkah

rårhvah+A+Attr	rårhvah

sahpoeh+A+Attr	sahpoeh
sahpoeh+A+Attr	sahpah

sjalhkah+A+Attr	sjalhkah

skaanjkah+A+Attr	skaanjkah

skearmoeh+A+Attr	skearmoeh
skearmoeh+A+Attr	skearmah

skåavroeh+A+Attr	skåavroeh
skåavroeh+A+Attr	skåavrah

slaabroeh+A+Attr	slaabroeh
slaabroeh+A+Attr	slaabrah

snjatjkah+A+Attr	snjatjkah

svalkoeh+A+Attr	svalkoeh
svalkoeh+A+Attr	svalkah

sveartoeh+A+Attr	sveartoeh
sveartoeh+A+Attr	sveartah

tjanhkah+A+Attr	tjanhkah

tjåankoeh+A+Attr	tjåankah
tjåankoeh+A+Attr	tjåankoeh

tråmhpoeh+A+Attr	trampah
tråmhpoeh+A+Attr	tråmhpoeh

åajvah+A+Attr	åajvah
Comment 12 Lene Antonsen 2012-10-18 00:56:27 CEST
*** Bug 1471 has been marked as a duplicate of this bug. ***
Comment 13 Lene Antonsen 2012-10-28 11:39:30 CET
Det er fremdeles problemer med stoere/stoerre og orre.

src$ usmaNorm 
0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100%
stoere
stoere	stoere	+?

stoerre
stoerre	stoere+A+Sg+Nom
stoerre	stoere+A+Attr

orre
orre	årrodh+V+IV+Ind+Prs+Sg3


Årsaken står forklart kommentar 2 og 3.

Denne bugen har fått Thomas som assignee, regner med at det er feil, og endrer til Maja. og så endrer jeg navn på den slik at vi ser hva den handler om.
Comment 14 Maja Lisa Kappfjell 2012-11-02 12:48:37 CET
stoere og noere får nå analyse. Er enda ikke ferdig med denne, da vi må slå sammen flere leksikoner og/elller eventuelt lage twol-regler for omlyd i komparasjonen.
Comment 15 Maja Lisa Kappfjell 2012-11-28 09:56:22 CET
Jeg vet ikke om det er nødvendig å lage tšolregler for omlyd for adjektivene. det er eventuelt for ies (attr) og pred(vokal), men dette er så få adjektiver det er snakk om.
Comment 16 Trond Trosterud 2012-11-28 11:31:06 CET
Eg har også tenkt i same banar som deg når det gjeld omlyd av visse adjektiv, sjølv om eg såg omlyden dukke opp i Kompensasjonsutvalget

I alle fall: For å sjå på dette: Det som trengst for å vurdere twol-omlyd vs. separate leksikon og hardkoding (som vi har det for jf. NOERE_STOERE) i lexc er nettopp eit fullstendig oversyn over dei få adjektiva og formene deira.
Comment 17 Trond Trosterud 2012-11-28 18:34:37 CET
(In reply to comment #16)
> sjølv om eg såg omlyden dukke opp i Kompensasjonsutvalget

Hmm... "Kompensasjonsutvalget"
Det er ikkje alle framlegga retteprogramma kjem med som er like gode. Det eg eigentleg skreiv var knytt til omlyd ved komparativ- og superlativformer...
Comment 18 Maja Lisa Kappfjell 2013-03-12 14:44:10 CET
Anser meg ferdig med denne buggen også, da vi har fullstendig overblikk over all umlaut i adjektivene og det er gjort en organsiering av dem. Dette er derfor en gammel bug. Avslutter herved denne. Maja Lisa

(In reply to comment #17)
> (In reply to comment #16)
> > sjølv om eg såg omlyden dukke opp i Kompensasjonsutvalget
> 
> Hmm... "Kompensasjonsutvalget"
> Det er ikkje alle framlegga retteprogramma kjem med som er like gode. Det eg
> eigentleg skreiv var knytt til omlyd ved komparativ- og superlativformer...