Bug 2401 - Eit nytt teikn for Munchs skrik: (
Summary: Eit nytt teikn for Munchs skrik: (
Status: RESOLVED FIXED
Alias: None
Product: Infrastructure
Classification: Unclassified
Component: Lexicon (show other bugs)
Version: unspecified
Hardware: All All
: P4 - Within a month normal
Assignee: Trond Trosterud
URL:
Keywords:
Depends on:
Blocks:
 
Reported: 2017-06-12 12:56 CEST by Trond Trosterud
Modified: 2018-08-28 17:14 CEST (History)
5 users (show)

See Also:


Attachments
Skrik - kolon, deretter skrik (8.04 KB, image/png)
2017-06-12 12:56 CEST, Trond Trosterud
Details

Note You need to log in before you can comment on or make changes to this bug.
Description Trond Trosterud 2017-06-12 12:56:51 CEST
Created attachment 206 [details]
Skrik - kolon, deretter skrik

Eg er ikkje så begeistra for  😱 , av fleire grunnar:

- Det er det einaste teiknet vi bruker som ikkje er ein del av Unicodes Basic Multilingual Plane (U+1F631). Det betyr at vi ikkje kan skrive det med noko tastatur (eg bruker Hex-tastaturet til å skrive teikn vi ikkje har på tastaturet, men det fungerer berre for firesifra heksadesimale tal, ikkje for femsifra)

- I fleire samanhengar, viktigast: på kommandolinja, held det ikkje på breidda si. Det inneber at strengen "😱:" blir uleseleg: kolone legg seg under skriket, og blir usynleg (jf. bilete)

- Det er det einaste symbolet vi har som er i fargar, noko som gjer koden vanskeleg å lese (teiknet får for mykje merksemd, det er ikkje slik at koden vår  er delt i to: denne og all anna tekst

- I og med at symbolet er eit bilete prøver lesaren å legge meining inn i biletet: er det eit spøkelse, eit tog, eit skrik? Og: Står det for noko negativt? 

Det vi treng er eit abstrakt symbol, og ikkje eit emotikon. Vi tar ein ting i gongen, så først diskusjon om skriket, deretter kan eg (eventuelt) kome med eit alternativ.

For ref: skriket er brukt til  dynamic compounds,
Comment 1 Lene Antonsen 2017-06-13 16:42:41 CEST
Muhnch skrik fungerer ikke for twolc  i xfst:

+Cmp#:😱#  nounflag


husmn
koškenetti
koškenetti	koškes+A+Cmp/Attr+Cmp#netti+N+Sg+Nom	0,000000

usmn
koškenetti
koškenetti	koškenetti	+?


dsmn
koškes+A+Cmp/Attr+Cmp#netti+N+Sg+Nom
koškes+A+Cmp/Attr+Cmp#netti+N+Sg+Nom	koškánetti

Fordi á ikke blir endra til e i twolc for xfst sjøl om 😱 er med i regelen:
koškes:koškás^ÁE KOSKES

Vx:Vy <=> Cns: _ (%^SV:) (Cns:)  Vz: (%^FCD:) %^WG: (%^CLEN:) ([%^RVSH:|%^RLEN:]) ([%^SVSH:|%^SLEN:])  [.#.| %> [# |😱  |i n | i d| n |d ]]   ;  
       where Vx in ( á    á    a   )
             Vy in ( e    i    e   )
             Vz in ( %^ÁE %^ÁI %^ÁE) 
       matched ;
Comment 2 Sjur Nørstebø Moshagen 2017-06-14 12:55:02 CEST
(In reply to Lene Antonsen from comment #1)
> Muhnch skrik fungerer ikke for twolc  i xfst:
> [...]
> Fordi á ikke blir endra til e i twolc for xfst sjøl om 😱 er med i regelen:
> koškes:koškás^ÁE KOSKES
> 
> Vx:Vy <=> Cns: _ (%^SV:) (Cns:)  Vz: (%^FCD:) %^WG: (%^CLEN:)
> ([%^RVSH:|%^RLEN:]) ([%^SVSH:|%^SLEN:])  [.#.| %> [# |😱  |i n | i d| n |d
> ]]   ;  

Regelen er feil, det burde vera [ 😱 # | i n | ... ]

Men sjølv med denne endringa har eg problem med xfst. Hfst fungerer som berre det.

Eg får tre stjerneåtvaringar frå twolc:

*** Warning: Overlapping => constraints respect to 'č:0'
    within "xyy:xy gradation A"
*** Warning: Overlapping => constraints respect to '^RC:c'
    within "Consonant lengthening after xx:x and xy:zy weak grade with x4 on upper side"
*** Warning: Overlapping => constraints respect to '^RC:c'
    within "Consonant lengthening xy:xyy"

Eg veit ikkje om det har noko med dette å gjera, men tenkte eg skulle nemna det.
Comment 3 Trond Trosterud 2017-06-15 16:48:19 CEST
Eg har lista opp ulempene ved  😱, og tar ikkje dei opp att. 

Her er fire alternativ, som ikkje har dei ulempene eg nemner, eg listar dei opp i prioritert rekkjefølgje.

⎈ = 2388
⏏ = 23CF
⟐ = 27D0
⦾ = 29BE

Eg håpar vi kjem vidare med denne saka.
Comment 4 Lene Antonsen 2017-06-15 17:47:33 CEST
> ⎈ = 2388
Jeg testa med ⎈ og resultatet blei bra (dvs at ⎈ må fjernes med et filter)

 njäälgis+N+Cmp/SgNom+Cmp#sekkâ+N+Sg+Nom => Missing results: njälgissekkâ
[17/26][FAIL] njäälgis+N+Cmp/SgNom+Cmp#sekkâ+N+Sg+Nom => Unexpected results: njälgis⎈sekkâ
[18/26][FAIL] päälgis+N+Cmp/SgNom+Cmp#keđgi+N+Pl+Nom => Missing results: pälgiskeeđgih
[18/26][FAIL] päälgis+N+Cmp/SgNom+Cmp#keđgi+N+Pl+Nom => Unexpected results: pälgis⎈keeđgih
[19/26][FAIL] čyegis+N+Cmp/SgNom+Cmp#puustav+N+Pl+Nom => Missing results: čyegispustaveh
[19/26][FAIL] čyegis+N+Cmp/SgNom+Cmp#puustav+N+Pl+Nom => Unexpected results: čyegis⎈pustaveh
[20/26][FAIL] määlis+N+Cmp/SgNom+Cmp#pastem+N+Sg+Nom => Missing results: mälispastem
[20/26][FAIL] määlis+N+Cmp/SgNom+Cmp#pastem+N+Sg+Nom => Unexpected results: mälis⎈pastem
[21/26][FAIL] käädis+N+Cmp/SgNom+Cmp#ergi+N+Sg+Nom => Missing results: kädisergi
[21/26][FAIL] käädis+N+Cmp/SgNom+Cmp#ergi+N+Sg+Nom => Unexpected results: kädis⎈ergi
Comment 5 Sjur Nørstebø Moshagen 2017-06-15 18:04:27 CEST
(In reply to Lene Antonsen from comment #4)
> > ⎈ = 2388
> Jeg testa med ⎈ og resultatet blei bra (dvs at ⎈ må fjernes med et filter)

I Mail med vanleg tekststorleik er det svært vanskeleg å sjå skilnad på dette teiknet og vanleg stjerne: *. Det er litt betre i SEE, men eg vil uansett rå til noko anna.

PS. Dersom det hastar med denne saka bør ikkje prioritetane vera P5 + enhancement.
Comment 6 Trond Trosterud 2017-06-15 19:39:27 CEST
(In reply to Sjur Nørstebø Moshagen from comment #5)
> I Mail med vanleg tekststorleik er det svært vanskeleg å sjå skilnad på
> dette teiknet og vanleg stjerne: *. Det er litt betre i SEE, men eg vil
> uansett rå til noko anna.
> 
> PS. Dersom det hastar med denne saka bør ikkje prioritetane vera P5 +
> enhancement.

Det er sannsynlegvis avhengig av font. Pussig nok er dei svært ulike når eg skriv dei inn i Mail. På kommandolinja mi (Menlo Regular 11pt) er dei like store, men distinkt ulike, på den svarte terminalen min (Andale Mono) er dei svært ulike , og på Mail er dei av ulik storleik (og form). Her ser dei slik ut, korleis det no blir for dokker: * ⎈. 

Men eg er absolutt open for eit anna symbol, som er:
- mogleg å skrive med hex-tastaturet (= frå BMP, 4-sifra hex)
- i svart-kvitt
- har invariant breidde i alle samanhengar (slik at nabosymbolet ikkje forsvinn under det)
- og (og dette er det vi bør diskutere) er lett (eller i det minste mogleg) å skilje frå alle andre teikn vi bruker
- og (sjølv om det er ulikt syn på realiteten attom dette siste synet) det kompilerer i twolc. Men la no dette siste ligge i første omgang, dei fire første punkta er meir enn nok.

Hastar og hastar: Eg såg det ikkje kom andre innlegg og tenkte at alle var samd men ikjke syntes det gjorde noko frå eller til. Eg, som har mine grunnar (ovafor) tenkte at ok, då tar eg saka vidare ved konkret å føreslå 4 teikn.
Comment 7 Trond Trosterud 2017-06-15 19:59:29 CEST
Dette (grafiske) er ikkje lett. Eg ser no at i ein del andre terminalfontar (Andale Mono), Courier, monaco, courier new, er ⎈ problematisk (i courier new er til og med ⏏ på kanten).

For Menlo Regular (som er Mac-terminalen sin standardfont) fungerer alle desse fire utan problem. Sjølv bruker eg standardfonten og la dermed ikkje merke til problemet. Andre moglege teikn er:

₻₸ = 20B8 = Tenge sign
⬮ = 2B2E = Black vertical ellipse (kanskje min favoritt)
ⵡ = 2D61 = Tifinagh letter yaw
Comment 8 Sjur Nørstebø Moshagen 2017-09-15 13:05:18 CEST
Motforslag:

Gresk omega: Ω

Argument:
* er lett å skriva (alt-w på norsk tastatur)
* tek like stor/liten plass som andre teikn
* er tilstrekkelet ulik andre teikn til at ein lett kan skilja det frå andre
* er usannsynleg som teikn i samiske tekstar
Comment 9 Trond Trosterud 2017-10-22 07:31:56 CEST
...c/morphology/stems/nouns.lexc |head -3
...singSpace:Álttá😱#dulvad EAPMI_default_sem ;
...du:alit😱#oahppu AIGI ;
...m/Amount:goalmmát😱#oassi AIGI ;
...c/morphology/stems/nouns.lexc |tr '😱' 'Ω' |head -3
...singSpace:ÁlttáΩ#dulvad EAPMI_default_sem ;
...du:alitΩ#oahppu AIGI ;
...m/Amount:goalmmátΩ#oassi AIGI ;
...c/morphology/stems/nouns.lexc |tr '😱' '⎈' |head -3
...singSpace:Álttá⎈#dulvad EAPMI_default_sem ;
...du:alit⎈#oahppu AIGI ;
...m/Amount:goalmmát⎈#oassi AIGI ;
...c/morphology/stems/nouns.lexc |tr '😱' '⏏' |head -3
...singSpace:Álttá⏏#dulvad EAPMI_default_sem ;
...du:alit⏏#oahppu AIGI ;
...m/Amount:goalmmát⏏#oassi AIGI ;
...c/morphology/stems/nouns.lexc |tr '😱' '⟐' |head -3
...singSpace:Álttá⟐#dulvad EAPMI_default_sem ;
...du:alit⟐#oahppu AIGI ;
...m/Amount:goalmmát⟐#oassi AIGI ;
...c/morphology/stems/nouns.lexc |tr '😱' '⦾' |head -3
...singSpace:Álttá⦾#dulvad EAPMI_default_sem ;
...du:alit⦾#oahppu AIGI ;
...m/Amount:goalmmát⦾#oassi AIGI ;

Synspunkt?
Comment 10 Lene Antonsen 2017-11-14 13:47:46 CET
> Synspunkt?

⏏ er lettest å se, men på den andre siden, så skal vi jo se alle tegenene, så omega er greit for meg.
Comment 11 Trond Trosterud 2018-05-25 21:03:23 CEST
∑ vart resultatet, og glade er vi.
Comment 12 Sjur Nørstebø Moshagen 2018-08-28 17:14:35 CEST
Ein siste kommentar, sjølv om originalproblemet er løyst:

Er det no ok å leggja inn att symbolet for dynamisk samansetjing (som vart ∑) i smn igjen? Pr no så skil smn seg frå dei andre samiske språka ved at slike samansetjingar ikkje er merkte på overflatesida, og dermed ikkje tilgjengeleg for å skilja dynamiske frå leksikaliserte samansetjingar, t.d. i grammatikkontrollen.