Bug 2524 - Common (all_langs) numbers and punctuation analysis
Summary: Common (all_langs) numbers and punctuation analysis
Status: ASSIGNED
Alias: None
Product: Infrastructure
Classification: Unclassified
Component: Lexicon (show other bugs)
Version: unspecified
Hardware: All All
: P4 - Within a month normal
Assignee: Sjur Nørstebø Moshagen
URL:
Keywords:
Depends on: 2527 2475 2528
Blocks:
  Show dependency treegraph
 
Reported: 2018-11-05 08:57 CET by Sjur Nørstebø Moshagen
Modified: 2019-03-13 22:40 CET (History)
3 users (show)

See Also:


Attachments

Note You need to log in before you can comment on or make changes to this bug.
Description Sjur Nørstebø Moshagen 2018-11-05 08:57:31 CET
Dette skreiv Lene som innleiing på bug #2475:

> Vi har snakket om dette på møte, men jeg lager bz fordi jeg regner med at det blir en del testing og diskusjon om løsninger. Ikke minst så må vi nok for de forskjellig språkene tilpasse fortsettelsesleksikonene for numeraler.
> 
> Jeg har sjekket inn i all_langs/src/morphology/stems : arabic_roman_digits.lexc og punctuation.lexc
> 
> Disse skal legges inn i bygginga for de samiske språkene (alle språk?):
> 
> punctuation.lexc istedenfor lokal punctuation.lexc
> arabic_roman_digits.lexc i tillegg til numerals.lexc
> 
> Arabiske og romertall må så fjernes fra lokale numerals.lexc (ikke kasus-leksikoner). 
> 
> Det er en bra om dette arbeidet kan bli gjort nokså snart, fordi vi arbeider med syntaktisk analyse for sma, og numerals.lexc for sma mangler mye av det vi har bygd opp i sme. Burde vi kopiere fra sme til sma som en foreløpig løsning?

Den lusmeldinga har i praksis handla berre om PUNCT, så eg lagar ei felles, overordna lusmelding som dekkjer beggje delar, med dependensar til eksisterande og nye lusmeldingar.

Det finst fleire andre kandidatar til felles lexc, lusmeldingar om dei bør òg lagast som avhengigheiter til denne meldinga.