Vi har en del sammensatte verb i verb-fila som nok medfører overgenerering fordi de står i leksikonet slik at de får fullt paradigme med finitte former osv. selv om slike former ikke er i bruk. Noen av disse burde heller leksikaliseres med de formene som er i bruk? Jeg regner med at denne saka har stor betydning for grammartikkontrollen også. Eksempler: doaimmashehttet http://gtweb.uit.no/korp/#?cqp=%5B%5D&prefix&sort=keyword&page=0&hpp=500&search=word%7Cdoaimmasheht Bare noen avledete former er i bruk: doaimmashehttejupmi, doaimmashehtteheapmi, doaimmashehttejuvvon (burde leksikaliseres som adjektiv, ikke som substantiv som no) grep ':.*#' src/morphology/stems/verbs.lexc | wc -l 330 Andre eksempler på verb som kanksje ikke brukes i finitt bøyning: badjelasasváldit, bajásdoallat, buresboahtit Noen av verbene har Err/Le, f.eks. álbmotválljet+Err/Lex:álbmot#vállje DOHPPE_TV ; ! Jeg ville foretrekke å heller leksikalsere, fordi en slik oppføring gir mange former som er uheldige i analysen.
great idea
sme $ svn ci -m "moved, added and err/lexed according to bug2133" src/morphology/stems Sending src/morphology/stems/adjectives.lexc Sending src/morphology/stems/nouns.lexc Sending src/morphology/stems/verbs.lexc Transmitting file data ... Committed revision 129860. i dont close ŧet, was there anŧmore?
(In reply to Thomas Omma from comment #2) > sme $ svn ci -m "moved, added and err/lexed according to bug2133" > src/morphology/stems > Sending src/morphology/stems/adjectives.lexc > Sending src/morphology/stems/nouns.lexc > Sending src/morphology/stems/verbs.lexc > Transmitting file data ... > Committed revision 129860. > > > > i dont close ŧet, was there anŧmore? Jeg kan ikke se at Err/Lex er en god løsning. Vi får likevel paradigme og analyser som ikke er reelle, fordi om de ikke går til spelleren. t.eks. buresboahtit+Err/Lex:bures#boah'ti BOAHTI_IV ;
sme $ svn ci -m "commented out compounded verbs with defective paradigms, bug2133" src/morphology/stems/verbs.lexc Sending src/morphology/stems/verbs.lexc Transmitting file data . Committed revision 131578.
i tink this to is worth closing
Jeg reåpner denne. Jeg mener at denne buggen omhandler flere verb enn de fem verbene som blei utkommentert før buggen blei lukka. Vi har fremdeles 343 sammensatte verb med finitte paradigmer. Blant disse er ruovttoluottamáksit og atnuiváldit, som jeg har problemer med å skulle tenke mæ brukt finitt. Her er søk i Korp på disse to verbene: http://gtweb.uit.no/korp/#?cqp=%5B%5D&prefix&page=0&hpp=500&sort=keyword&search=word%7Catnuiváld http://gtweb.uit.no/korp/#?cqp=%5B%5D&prefix&page=0&hpp=500&sort=keyword&search=word%7Cruovttoluottamá Disse to verbene er eksempler, man bør vurdere alle 343 verb. Men denne kommandoen får man en oversikt: grep '#' src/morphology/stems/verbs.lexc |egrep '(TV|IV)' | grep -v '^\!' |less
Kommentar til atnuiváldit. Jeg ser at i korpus finnes det en setning med finitt bøyning, sannsynligvis fra veiledning til selvangivelse: Vuoito- ja massinkontui galgá čállit vuoittu ja massima go boahtojagis realisere dahje atnuiváldá doallobiergasiid ... Er denne bruken ok for dette verbet? Skal man beholde den finitte bøyinga hvis man finner ett eksempel i korpus? Er det skrevet noe bruken om slike sammensatte verb i litteraturen?