Bug 2524

Summary: Common (all_langs) numbers and punctuation analysis
Product: Infrastructure Reporter: Sjur Nørstebø Moshagen <sjur.n.moshagen>
Component: LexiconAssignee: Sjur Nørstebø Moshagen <sjur.n.moshagen>
Status: ASSIGNED ---    
Severity: normal CC: borre.gaup, ciprian.gerstenberger, trond.trosterud
Priority: P4 - Within a month    
Version: unspecified   
Hardware: All   
OS: All   
Bug Depends on: 2527, 2475, 2528    
Bug Blocks:    

Description Sjur Nørstebø Moshagen 2018-11-05 08:57:31 CET
Dette skreiv Lene som innleiing på bug #2475:

> Vi har snakket om dette på møte, men jeg lager bz fordi jeg regner med at det blir en del testing og diskusjon om løsninger. Ikke minst så må vi nok for de forskjellig språkene tilpasse fortsettelsesleksikonene for numeraler.
> 
> Jeg har sjekket inn i all_langs/src/morphology/stems : arabic_roman_digits.lexc og punctuation.lexc
> 
> Disse skal legges inn i bygginga for de samiske språkene (alle språk?):
> 
> punctuation.lexc istedenfor lokal punctuation.lexc
> arabic_roman_digits.lexc i tillegg til numerals.lexc
> 
> Arabiske og romertall må så fjernes fra lokale numerals.lexc (ikke kasus-leksikoner). 
> 
> Det er en bra om dette arbeidet kan bli gjort nokså snart, fordi vi arbeider med syntaktisk analyse for sma, og numerals.lexc for sma mangler mye av det vi har bygd opp i sme. Burde vi kopiere fra sme til sma som en foreløpig løsning?

Den lusmeldinga har i praksis handla berre om PUNCT, så eg lagar ei felles, overordna lusmelding som dekkjer beggje delar, med dependensar til eksisterande og nye lusmeldingar.

Det finst fleire andre kandidatar til felles lexc, lusmeldingar om dei bør òg lagast som avhengigheiter til denne meldinga.