Bug 2317 - need a solution for suggestions on words-with-subreadings in grammar checker
Summary: need a solution for suggestions on words-with-subreadings in grammar checker
Status: RESOLVED FIXED
Alias: None
Product: Grammar checkers
Classification: Unclassified
Component: Core infrastructure (show other bugs)
Version: unspecified
Hardware: All Android
: P4 - Within a month normal
Assignee: Kevin Brubeck Unhammer
URL:
Keywords:
Depends on:
Blocks:
 
Reported: 2017-01-07 11:59 CET by Kevin Brubeck Unhammer
Modified: 2017-09-20 13:26 CEST (History)
4 users (show)

See Also:


Attachments

Note You need to log in before you can comment on or make changes to this bug.
Description Kevin Brubeck Unhammer 2017-01-07 11:59:34 CET
(Should probably get a bugzilla category for Grammar checking?)

Linda Wiechetek <linda.wiechetek@uit.no> čálii:

> Vi klarer ennå ikkje generere sammensatte ord der vi forandrer på bare en
> subreading

t.d. gir regelen 

COPY:compound-vallji-or-valljás ("valljái" A Attr &SUGGEST) EXCEPT ("vallji" N Sg Nom &compound-vallji-or-valljás) OR (N Sg Nom &compound-vallji-or-valljás) TARGET (&compound-vallji-or-valljás) ;

dette:

"<Eallámušvallji>"
    "vallji" N Sem/State Sg Nom <W:10> @SUBJ> MAP:17285 &compound-vallji-or-valljás ADD:4520:compound-vallji-or-valljás ADD:4520:compound-vallji-or-valljás
compound-vallji-or-valljás
        "eallit" VV IV Der/muš N Cmp/SgGen Cmp <W:10>
    "vallji" N Sem/State Sg Nom <W:10> @SUBJ> MAP:17285 &compound-vallji-or-valljás ADD:4520:compound-vallji-or-valljás ADD:4520:compound-vallji-or-valljás
compound-vallji-or-valljás
        "eallit" VV IV Der/muš N Cmp/SgNom Cmp <W:10>
    "vallji" N Sem/State Sg Nom <W:10> @SUBJ> MAP:17285 &compound-vallji-or-valljás ADD:4520:compound-vallji-or-valljás ADD:4520:compound-vallji-or-valljás
compound-vallji-or-valljás
        "eallámuš" N Sem/Dummytag Cmp/SgGen Cmp <W:10>
    "vallji" N Sem/State Sg Nom <W:10> @SUBJ> MAP:17285 &compound-vallji-or-valljás ADD:4520:compound-vallji-or-valljás ADD:4520:compound-vallji-or-valljás
compound-vallji-or-valljás
        "eallámuš" N Sem/Dummytag Cmp/SgNom Cmp <W:10>
    "vallji" N Sem/State Sg Nom <W:10> @SUBJ> MAP:17285 &compound-vallji-or-valljás ADD:4520:compound-vallji-or-valljás ADD:4520:compound-vallji-or-valljás
compound-vallji-or-valljás
        "eallát" VV IV Der/muš N Cmp/SgGen Cmp <W:10>
    "vallji" N Sem/State Sg Nom <W:10> @SUBJ> MAP:17285 &compound-vallji-or-valljás ADD:4520:compound-vallji-or-valljás ADD:4520:compound-vallji-or-valljás
compound-vallji-or-valljás
        "eallát" VV IV Der/muš N Cmp/SgNom Cmp <W:10>
    "valljái" Sem/State <W:10> @SUBJ> MAP:17285 A Attr &SUGGEST COPY:4522:compound-vallji-or-valljás


kor divvun-suggest produserer formen «valljás» frå «valljái+A+Attr».


Moglege løysingar:

- få vislcg3 til å kopiera heile treet i COPY
- legga til ein markør-tagg i cg3-en som divvun-suggest forstår som eit signal om å gjera noko tilsvarande
Comment 1 Trond Trosterud 2017-01-07 13:15:43 CET
(In reply to Kevin Brubeck Unhammer from comment #0)
> (Should probably get a bugzilla category for Grammar checking?)

Vi har no ein eigen komponent for akkurat det, med fire underkomponentar:
- lingvistikk
- generell infra
- infra relatert til webgrensesnittet
- infra relatert til LO
Comment 2 Kevin Brubeck Unhammer 2017-01-07 19:42:55 CET
(In reply to Trond Trosterud from comment #1)
> (In reply to Kevin Brubeck Unhammer from comment #0)
> > (Should probably get a bugzilla category for Grammar checking?)
> 
> Vi har no ein eigen komponent for akkurat det, med fire underkomponentar:
> - lingvistikk
> - generell infra
> - infra relatert til webgrensesnittet
> - infra relatert til LO

Så bra :) (Var den der heile tida?)
Comment 3 Trond Trosterud 2017-01-07 19:57:08 CET
(In reply to Kevin Brubeck Unhammer from comment #2)
> (In reply to Trond Trosterud from comment #1)
> > Vi har no ein eigen komponent for akkurat det, med fire underkomponentar:
> Så bra :) (Var den der heile tida?)

Nei, stikkordet her er "no". Eg laga den pga Linda sin kommentar.
Comment 4 Sjur Nørstebø Moshagen 2017-01-08 21:47:42 CET
(In reply to Kevin Brubeck Unhammer from comment #0)
> > Vi klarer ennå ikkje generere sammensatte ord der vi forandrer på bare en
> > subreading
> 
> t.d. gir regelen 
[...]
> dette:
[...]
>     "valljái" Sem/State <W:10> @SUBJ> MAP:17285 A Attr &SUGGEST
> COPY:4522:compound-vallji-or-valljás
> 
> 
> kor divvun-suggest produserer formen «valljás» frå «valljái+A+Attr».
> 
> 
> Moglege løysingar:
> 
> - få vislcg3 til å kopiera heile treet i COPY

Dette er den løysinga som verkar mest generell for meg. Men ein må sikra seg at det ikkje skapar tull for eksisterande cg-reglar.
Comment 5 Linda Wiechetek 2017-03-08 11:51:20 CET
Her har vi et eksempel for å teste:

Eallámušvallji eanan šaddá go gehppesmolláneaddji báktešlájat , ábaida kálkavallji šlájat , váikkuhuvvojit ja nu háddjanit ( golladuvvojit ) .
Comment 6 Sjur Nørstebø Moshagen 2017-09-08 12:50:35 CEST
Kva er status for denne lusmeldinga?
Comment 7 Kevin Brubeck Unhammer 2017-09-08 15:03:14 CEST
Enno uløyst; eg pratar med Tino.

Spørsmål til Linda: Må du nokon gong endra taggar på *underlesinga* for slike reglar? (På norsk ville det vel omtrent aldri skjedd, men kanskje det på samisk av og til skal rettast frå t.d. Cmp/Nom til Cmp/Gen eller noko slikt …)
Comment 8 Linda Wiechetek 2017-09-13 15:17:33 CEST
Til Kevin:
Det kunne jo tenkes at første delen i et sammensatt ord er feil og hele lemmaet må erstattes, eller at det er en realword error i første delen av det sammensatte ordet som fører til at tagkombinasjonen må forandres.

For eksempel kunne det tenkes at noen skriv:

várraiskkus (forsiktihetsprøve) istedenfor varraiskkus (blodprøve).
várraiskkus	várra+N+Cmp/SgNom+Cmp#iskkus+N+Sg+Nom


varraiskkus	varra+N+Cmp/SgNom+Cmp#iskkus+N+Sg+Nom
varraiskkus	varraiskkus+N+Sg+Nom


Nå sjekka æ korp og fant følgende eksempler:


Várraiskosa 	váldán Flåten lohká nuppis sudnos ii lean vuodjinkoarta , muhto ii loga sihkarin leat go nuppis váldán vuodjinkoartta go dat ii boađe politiijaraporttas ovdan .
Doavttir válddii sus 	várraiskosa 	ja dieđihii ahte Astris lei menddo olu sohkar varas , eambbo go galggai .
Sus váldui 	várraiskkus 	.


Enda et eksempel:

Giitu ollu visot nuorat Jåhkåmåhkes geat serve leairras , ja giitu go mii beasaime leat ovttas dinguin daid guokte leairabeivviid !


"<leairabeivviid>"
    "beaivi" N Sem/Time Err/Orth Pl Gen <W:10.0000000000> @Num< SELECT:10609:r2002 MAP:16402:r253 IFF:18075 IFF:18075 IFF:18075 &syn-sg-not-pl-after-num #20->19 SETPARENT:9246 SETPARENT:9246 ADD:11335:syn-sg-not-pl-after-num
syn-sg-not-pl-after-num
        "leaira" N Sem/Plc Cmp/SgNom Cmp <W:10.0000000000> #20->19
    "beaivi" N Sem/Time Pl Gen <W:10.0000000000> @Num< SELECT:10609:r2002 MAP:16402:r253 IFF:18075 IFF:18075 IFF:18075 &syn-sg-not-pl-after-num #20->19 ADD:11335:syn-sg-not-pl-after-num
syn-sg-not-pl-after-num
        "leaira" N Sem/Plc Cmp/SgNom Cmp <W:10.0000000000> #20->19
    "beaivi" N Sem/Time Gen <W:10.0000000000> @Num< SELECT:10609:r2002 MAP:16402:r253 IFF:18075 IFF:18075 IFF:18075 Sg &SUGGEST #20->19 COPY:11336:syn-sg-not-pl-after-num
beaivi+N+Gen+Sg ?
;    "beaivi" N Sem/Time Err/Orth Pl Acc <W:10.0000000000> SELECT:10609:r2002
;        "leaira" N Sem/Plc Cmp/SgNom Cmp <W:10.0000000000>
;    "beaivi" N Sem/Time Pl Acc <W:10.0000000000> SELECT:10609:r2002
;        "leaira" N Sem/Plc Cmp/SgNom Cmp <W:10.0000000000>
:
Comment 9 Kevin Brubeck Unhammer 2017-09-15 10:18:05 CEST
OK, eg sjekka no, og det ser ut til at det går an å endra underlesingane òg, typ `SUBSTITUTE SUB:1 frå til kontekst;`. Så då er det nok ikkje noko problem med «várraiskkus» osb.


Tino retta manglande kopiering av underlesingar, det var visst ein enkel bug. No kan me gjera slikt som

COPY ("vallji" N Sg Ill &SUGGEST) EXCEPT ("vallji" N Sg Nom &compound-vallji-or-valljás) OR (N Sg Nom &compound-vallji-or-valljás) TARGET ("<Eallámušvallji>") ;
SUBSTITUTE:VV2V SUB:1 (VV) (V) TARGET (*);

og få

"<Eallámušvallji>"
    "vallji" N Sem/State Sg Nom <W:10.0000000000> @HNOUN
        "eallit" V IV Der/muš N Cmp/SgGen Cmp <W:10.0000000000>
    "vallji" N Sem/State Sg Nom <W:10.0000000000> @HNOUN
        "eallit" V IV Der/muš N Cmp/SgNom Cmp <W:10.0000000000>
    "vallji" N Sem/State Sg Nom <W:10.0000000000> @HNOUN
        "eallámuš" N Sem/Dummytag Cmp/SgGen Cmp <W:10.0000000000>
    "vallji" N Sem/State Sg Nom <W:10.0000000000> @HNOUN
        "eallámuš" N Sem/Dummytag Cmp/SgNom Cmp <W:10.0000000000>
    "vallji" N Sem/State Sg Nom <W:10.0000000000> @HNOUN
        "eallát" V IV Der/muš N Cmp/SgGen Cmp <W:10.0000000000>
    "vallji" N Sem/State Sg Nom <W:10.0000000000> @HNOUN
        "eallát" V IV Der/muš N Cmp/SgNom Cmp <W:10.0000000000>
    "vallji" Sem/State <W:10.0000000000> @HNOUN N Sg Ill &SUGGEST
        "eallit" V IV Der/muš N Cmp/SgGen Cmp <W:10.0000000000>
    "vallji" Sem/State <W:10.0000000000> @HNOUN N Sg Ill &SUGGEST
        "eallit" V IV Der/muš N Cmp/SgNom Cmp <W:10.0000000000>
    "vallji" Sem/State <W:10.0000000000> @HNOUN N Sg Ill &SUGGEST
        "eallámuš" N Sem/Dummytag Cmp/SgGen Cmp <W:10.0000000000>
    "vallji" Sem/State <W:10.0000000000> @HNOUN N Sg Ill &SUGGEST
        "eallámuš" N Sem/Dummytag Cmp/SgNom Cmp <W:10.0000000000>
    "vallji" Sem/State <W:10.0000000000> @HNOUN N Sg Ill &SUGGEST
        "eallát" V IV Der/muš N Cmp/SgGen Cmp <W:10.0000000000>
    "vallji" Sem/State <W:10.0000000000> @HNOUN N Sg Ill &SUGGEST
        "eallát" V IV Der/muš N Cmp/SgNom Cmp <W:10.0000000000>


Viss du har nyaste divvun-suggest, skal det genererast rett òg, t.d.

    "vallji" Sem/State <W:10.0000000000> @HNOUN N Sg Ill &SUGGEST
        "eallát" V IV Der/muš N Cmp/SgNom Cmp <W:10.0000000000>
eallát+V+IV+Der/muš+N+Cmp/SgNom+Cmp#vallji+N+Sg+Ill   eallámušvalljái
:\n


Programmet divvun-suggest er no ein del av pakka «divvun-gramcheck». 
For å sjekka ut og kompilera nyaste versjon:

 curl http://apertium.projectjj.com/osx/install-nightly.sh | sudo bash
 test -d ~/src || mkdir ~/src
 cd src
 git clone https://github.com/divvun/divvun-gramcheck
 cd divvun-gramcheck
 scripts/get-pugixml-and-build
 sudo make install
Comment 10 Kevin Brubeck Unhammer 2017-09-15 14:09:23 CEST
(In reply to Kevin Brubeck Unhammer from comment #9)
> Programmet divvun-suggest er no ein del av pakka «divvun-gramcheck». 
> For å sjekka ut og kompilera nyaste versjon:

skulle vore:

 curl http://apertium.projectjj.com/osx/install-nightly.sh | sudo bash
 test -d ~/src || mkdir ~/src
 cd ~/src
 git clone https://github.com/divvun/divvun-gramcheck
 cd divvun-gramcheck
 scripts/get-pugixml-and-build
 sudo make install
Comment 11 Kevin Brubeck Unhammer 2017-09-20 13:26:10 CEST
Det ser ut som denne kan lukkast.