Bug 2133 - doaimmashehttet og andre sammensatte verb
Summary: doaimmashehttet og andre sammensatte verb
Status: REOPENED
Alias: None
Product: sme lexicon
Classification: Unclassified
Component: Stem lexica (show other bugs)
Version: unspecified
Hardware: Macintosh Other
: P4 - Within a month normal
Assignee: Thomas Omma
URL:
Keywords:
Depends on:
Blocks:
 
Reported: 2015-12-14 08:45 CET by Lene Antonsen
Modified: 2016-09-24 12:39 CEST (History)
5 users (show)

See Also:


Attachments

Note You need to log in before you can comment on or make changes to this bug.
Description Lene Antonsen 2015-12-14 08:45:54 CET
Vi har en del sammensatte verb i verb-fila som nok medfører overgenerering fordi de 
står i leksikonet slik at de får fullt paradigme med finitte former osv. selv om slike former ikke er i bruk. Noen av disse burde heller leksikaliseres med de formene som er i bruk? Jeg regner med at denne saka har stor betydning for grammartikkontrollen også.

Eksempler:
doaimmashehttet
http://gtweb.uit.no/korp/#?cqp=%5B%5D&prefix&sort=keyword&page=0&hpp=500&search=word%7Cdoaimmasheht

Bare noen avledete former er i bruk:
doaimmashehttejupmi, doaimmashehtteheapmi, doaimmashehttejuvvon (burde leksikaliseres som adjektiv, ikke som substantiv som no)

grep ':.*#' src/morphology/stems/verbs.lexc | wc -l
   330

Andre eksempler på verb som kanksje ikke brukes i finitt bøyning:
badjelasasváldit, bajásdoallat, buresboahtit

Noen av verbene har Err/Le, f.eks.
álbmotválljet+Err/Lex:álbmot#vállje DOHPPE_TV ; !

Jeg ville foretrekke å heller leksikalsere, fordi en slik oppføring gir mange former som er uheldige i analysen.
Comment 1 Thomas Omma 2015-12-14 08:50:42 CET
great idea
Comment 2 Thomas Omma 2016-02-22 11:40:48 CET
sme $ svn ci -m "moved, added and err/lexed according to bug2133" src/morphology/stems
Sending    src/morphology/stems/adjectives.lexc
Sending    src/morphology/stems/nouns.lexc
Sending    src/morphology/stems/verbs.lexc
Transmitting file data ...
Committed revision 129860.i dont close ŧet, was there anŧmore?
Comment 3 Lene Antonsen 2016-02-22 12:38:06 CET
(In reply to Thomas Omma from comment #2)
> sme $ svn ci -m "moved, added and err/lexed according to bug2133"
> src/morphology/stems
> Sending    src/morphology/stems/adjectives.lexc
> Sending    src/morphology/stems/nouns.lexc
> Sending    src/morphology/stems/verbs.lexc
> Transmitting file data ...
> Committed revision 129860.
> 
> 
> 
> i dont close ŧet, was there anŧmore?

Jeg kan ikke se at Err/Lex er en god løsning. Vi får likevel paradigme og analyser som ikke er reelle, fordi om de ikke går til spelleren. 

t.eks. buresboahtit+Err/Lex:bures#boah'ti BOAHTI_IV ;
Comment 4 Thomas Omma 2016-03-30 12:14:21 CEST
sme $ svn ci -m "commented out compounded verbs with defective paradigms, bug2133" src/morphology/stems/verbs.lexc
Sending    src/morphology/stems/verbs.lexc
Transmitting file data .
Committed revision 131578.
Comment 5 Thomas Omma 2016-04-01 09:57:55 CEST
i tink this to is worth closing
Comment 6 Lene Antonsen 2016-09-24 12:19:34 CEST
Jeg reåpner denne. 

Jeg mener at denne buggen omhandler flere verb enn de fem verbene som blei utkommentert før buggen blei lukka. Vi har fremdeles 343 sammensatte verb med finitte paradigmer. Blant disse er ruovttoluottamáksit og atnuiváldit, som jeg har problemer med å skulle tenke mæ brukt finitt. Her er søk i Korp på disse to verbene:

http://gtweb.uit.no/korp/#?cqp=%5B%5D&prefix&page=0&hpp=500&sort=keyword&search=word%7Catnuiváld

http://gtweb.uit.no/korp/#?cqp=%5B%5D&prefix&page=0&hpp=500&sort=keyword&search=word%7Cruovttoluottamá

Disse to verbene er eksempler, man bør vurdere alle 343 verb.

Men denne kommandoen får man en oversikt:
grep '#' src/morphology/stems/verbs.lexc |egrep '(TV|IV)' | grep -v '^\!' |less
Comment 7 Lene Antonsen 2016-09-24 12:39:32 CEST
Kommentar til atnuiváldit. Jeg ser at i korpus finnes det en setning med finitt bøyning, sannsynligvis fra veiledning til selvangivelse:

Vuoito- ja massinkontui galgá čállit vuoittu ja massima go boahtojagis realisere dahje atnuiváldá doallobiergasiid ...

Er denne bruken ok for dette verbet? Skal man beholde den finitte bøyinga hvis man finner ett eksempel i korpus? Er det skrevet noe bruken om slike sammensatte verb i litteraturen?