UIT The arctic university of Norway > Giellatekno
 

sjangertest

Šáŋŋertest

Mii leat jorgalan teavsttaid main lea su 6100 sáni. Dán tabealla logut muitalit man ollu leat missing-sánit. Oassi teavsttain leat čállojuvvon Norgga bealde, oassi leat čállojuvvon Suoma bealde.

  • Sámed. = Norgga Sámedikki beavdegirjjit
  • dieđahus = Norgga Sámedikki dieđáhus sámegielaid birra
  • Vars ja Saara = nuoraid geahppalohkangirjjit
  • IMA = mánáidgirji
  • Vest = rávesolbmuid romána
  • filosofi = Filosofiija ja etihka oahpaheaddjirávagirji
  • Historjá = Suoma joatkkaskuvla oahppogirji
  • uno info = Ruoŧa stáhta dieđáhus nuoraide givssideami ja sohkabeali birra
  • Tanapioner = Skuvlahistorjá, Deanu skuvlahistorjjá birra
  • matematihkka = Multi 1 ja 2 - mánáidskuvlla várás
Teaksta Riika sme-smn pros list sme-sma pros list sme-smj pros list
Sámediggi Norggas 124 2 % (76) 188 3 % (102) 282 5 % (138)
Dieđahus Norggas 158 3 % (109) 91 1 % (77) 211 3 % (148)
Vars Norggas 235 4 % (188) 406 7 % (300) 588 10 % (388)
Saara Norggas 245 4 % (185) 500 8 % (351) 685 11 % (449)
IMA Suomas 654 11 % (386) 1079 18 % (646) 1193 20 % (724)
Vest Suomas 379 6 % (327) 719 12 % (585) 972 16 % (734)
filosofi Norggas 263 4 % (240) 436 7 % (387) 567 7 % (476)
Historjá Suomas 442 7 % (364) 836 14 % (674) 899 16 % (720)
uno info Ruoŧas 550 9 % (383) 914 15 % (609) 960 16 % (608)
Tanapioner Norggas 263 4 % (399) 555 9 % (478) 664 10 % (539)
matematihkka Norggas 612 10 % (180) 1243 20 % (341) 1118 18 % (325)

Juohke teavstta dábáleamos missing-sánit:

sme-smn

==> dev/Sámed.txt <== 76 sáni
   5 *eanedit (eanet A)
   4 *vuoruhuvvo
   4 *hállansyntesa
   4 *eahpeoiddolaš
   3 *majoritehta
   2 *čalmmustahttit
   2 *čalmmustahttimis
   2 *áin
   2 *válljenmunni
   2 *tearpmat
   2 *rávnnjáldagat
   2 *rekrutteremiin
   2 *registreren
   2 *registrerema
   2 *registrerejuvvon
   2 *ovttaskasaid
   2 *ovttaskasa
   2 *ovttaidlogus
   2 *ovddasguvlui
   2 *oaivadit

==> dev/dieđahus.txt <==
   5 *mielddisbuktá
   4 *tearpmaid
   4 *oktiiheiveheami
   4 *mandáhta
   3 *čalmmustahttin
   3 *čalmmustahttima
   3 *nubbegiellan
   3 *mielddisbuktet
   3 *lagat
   3 *lagasbirrasis
   3 *guovttesuorat
   2 *čalmmustahttit
   2 *váste
   2 *vuoruhuvvot
   2 *tearpmat
   2 *tearbmaráhkadeapmi
   2 *sámástit
   2 *rekrutterema
   2 *oktiiheivehit
   2 *oktiiheiveheamis

==> dev/Vars.txt <==
  17 *Busi
   4 *analyseret
   3 *šluvggii
   3 *njávkkai
   3 *lulás
   3 *gaikkihii
   3 *dálle
   3 *bláđegođii
   2 *susttašii
   2 *stávet
   2 *oktovuođa
   2 *láidii
   2 *lihkastagaid
   2 *jurdilii
   2 *heahpat
   2 *fanahalai
   2 *duollet
   2 *dievá
   2 *algebra
   2 *Njáv

==> dev/Saara.txt <==
  11 *tuneallas
   6 *tunellii
   6 *tunealla
   5 *mahkáš
   4 *tunnealla
   4 *iđđedis
   4 *biffan
   3 *sihkkelastit
   3 *huošši (ii leat smeFST:s)
   3 *gillára
   3 *Hm
   2 -*Gea
   2 *čurvejin
   2 *čierru☹ (☹ ii leat smeFST:s)
   2 *very (ii leat smeFST:s)
   2 *vampyra (ii leat smeFST:s)
   2 *tuneallanjálmmis
   2 *termosa
   2 *skurdnjasat
   2 *savkkástalle

==> dev/IMA.txt <== 386 sáni
  48 *Aurelia (ii leat smeFST:s)
  47 *Čárrá (ii leat smeFST:s)
  31 *Čárá (ii leat smeFST:s)
  14 *goittot
  10 *ah’ (ii leat smeFST:s)
   7 *čárre (ii leat smeFST:s)
   6 *ču (ii leat smeFST:s)
   6 *allelii
   5 *vuoktaráidalasa
   5 *njeaigga
   5 *Gea
   4 *ruive
   4 *mohtičázi (ii leat smeFST:s)
   4 *luŋka
   4 *biškkanas
   4 *Ráidalas
   4 *Máttaráhkká
   4 *Biškkanas
   3 *Čárás
   3 *váiddui

==> dev/Vest.txt <==
   5 *guovllos (ii leat smeFST:s, = guovllus)
   4 *čoakkalmasaide
   4 *moanaid
   4 *gávastalai
   3 *čoakkalmasat
   3 *oktovuođa
   3 *margarin (ii leat smeFST:s)
   3 *luoddanit
   3 *goittot
   3 *gitára
   3 *geasehii
   2 *čájetmat (ii leat smeFST:s)
   2 *čoakkalmasain
   2 *čivttii
   2 *stovus (ii leat smeFST:s)
   2 *sreaŋggaid
   2 *sorrás (ii leat smeFST:s)
   2 *rásken
   2 *rándahis
   2 *ruvtto

==> historia <==
  18 *goittot
   9 *OKr
   6 *ladni
   5 *gávnnus
   5 *gávdnosis
   4 *čuohte
   4 *váinniid
   4 *omiid
   4 *cm
   4 *bázahusat
   4 *Ammal
   3 *saddjon
   3 *oaivámučča
   3 *gurat
   3 *goardagis
   3 *davásguvlui
   3 *bázahusaid
   2 *čorpmamahtosaš
   2 *čehpet
   2 *Ötzi
   
==> filosofiija <==
   8 *guottuid
   6 *morála
   3 *ekologalaš
   3 *OEE
   3 *Antirasisttalaš
   2 *áiccut
   2 *sekuleara
   2 *oktagaslaš
   2 *norbma
   2 *lihkulašvuođadovddu
   2 *filosofat
   2 *etnisitehta
   2 *Parmenides
   2 *ML06S?
   2 *ML06S
   1 *šáŋŋer
   1 *čuozahussátni
   1 *čuozahussániin
   1 *čuoldit
   1 *čanastagat
   
==> uno.se <==
  16 *p-pillara
  13 *geavtit
  13 *fáhkkatlaš
   8 *kondoma
   8 *Fáhkkatlaš
   7 *anašeami
   6 *vardá
   6 *p-pillar
   6 *ovttaskasas
   6 *ovttaskasa
   6 *nala
   6 *Kondoma
   5 *leaboheapmin
   5 *cummástallá
   5 *apotehkas
   4 *ng
   4 *losesmielas
   4 *gárremiin
   4 *geavtá
   4 *geardu
   
==> Tanapioner <==
   8 *internáhta
   6 *og
   6 *Heimen
   4 *til
   4 *samiske
   4 *oarbinaččas
   4 *med
   4 *internáhtas
   4 *fra
   3 *Čiestti
   3 *ánsomedáljja
   3 *skuvlastivrrárin
   3 *lulás
   3 *for
   3 *evakuerejuvvui
   3 *eksámena
   3 *b
   3 *Soffa
   3 *Ravne
   3 *Lile

==> apertium-sme-smn/dev/matematihkka.txt <== 180 sáni
  32 *govvosiid
  28 *logežiidda
  25 *ruvttu
  25 *logežiid
  21 *ruvttuid
  21 *rieggá
  21 *logeža
  19 *govvosa
  18 *ruvttuide
  16 *lohkolinnjái
  12 *ruvttus
  11 *kr
  11 *govvosis
   8 *guovttesiffar
   8 *govvosii
   7 *symmetralaččat
   7 *speadjalaston
   6 *sirkeliidda
   6 *sirkeliid
   6 *sihkoniin

   

sme-sma

==> dev/Sámed.txt <==
   9 *geatnegahttojuvvon
   5 *eanedit (eanet A)
   4 *ulbmillaš
   4 *máhtolašvuohta
   4 *muddui
   4 *hállansyntesa
   4 *gielddalaš
   4 *eahpeoiddolaš
   4 *deattasta
   4 *dakko
   3 *ulbmilolahusa
   3 *makkárge
   3 *majoritehta
   3 *eanemus
   2 *áin
   2 *Ággan
   2 *váttásmahttá
   2 *válljenmunni
   2 *váldesuorggis
   2 *ulbmileamos

==> dev/dieđahus.txt <==
   3 *čovdosat
   3 *makkárge
   3 *guovttesuorat
   2 *čavga
   2 *gustovaš
   2 *govttolaš
   2 *giellalávgun
   2 *dárkilis
   2 *bálvalusfálu
   2 *buoremuddui
   2 *beaktilis
   1 *čovdosiid
   1 *čiekŋudit
   1 *árvvolaš
   1 *válljejupmin
   1 *válljejupmi
   1 *válljejumiid
   1 *vuođđoelemeanttain
   1 *vuolláičállán
   1 *vuollelis

==> dev/Vars.txt <==
  12 *Na
  10 *gillen
   7 *šuohkehii
   6 *gille
   5 *Vuoi
   4 *litna
   4 *jávohaga
   4 *dievva
   4 *diekkár
   3 *šluvggii
   3 *suoli
   3 *njávkkai
   3 *láiki
   3 *lulás
   3 *jur
   3 *juohkelágan
   3 *jitnosit
   3 *gaikkihii
   3 *feara
   3 *dakkaviđe

==> dev/Saara.txt <==
  17 *han
  11 *tuneallas
  10 *sihkkela
   7 *Mánnodaga
   6 *tunellii
   6 *tunealla
   6 *bat
   5 *mahkáš
   5 *feara
   4 *váivvida
   4 *tunnealla
   4 *ribahin
   4 *iđđedis
   4 *fáhkka
   4 *biffan
   4 *Buoska
   3 *vulos
   3 *ulda
   3 *njávgá
   3 *huošši (ii leat smeFST:s)

==> dev/IMA.txt <==
  48 *Aurelia (ii leat smeFST:s)
  47 *Čárrá (ii leat smeFST:s)
  31 *Čárá (ii leat smeFST:s)
  23 *Na
  15 *jo
  14 *goittot
  10 *ah’ (ii leat smeFST:s)
   9 *Viimmat
   8 *čáhcerávgga
   8 *illá
   7 *čárre (ii leat smeFST:s)
   7 *masá
   6 *ču (ii leat smeFST:s)
   6 *Čirre
   6 *vulos
   6 *trampoliinna
   6 *allelii
   6 *Fáhkka
   5 *Gea
   4 *čáhcerávga

==> dev/Vest.txt <==
 10 *vuot
  10 *Na
   7 *vehá
   5 *vilppastii
   5 *guovllos (ii leat smeFST:s, = guovllus)
   4 *čoakkalmasaide
   4 *čoahkis
   4 *velohallat
   4 *hoahkalii
   4 *gámmárii
   4 *gaskkohagaid
   3 *čoakkalmasat
   3 *olus
   3 *oktovuođa
   3 *maŋit
   3 *margarin (ii leat smeFST:s)
   3 *jámma
   3 *gámmáris
   3 *goittot
   3 *geasehii

==> historia <==
  18 *goittot
   9 *OKr
   8 *áigásaš
   7 *duhát
   7 *dolin
   6 *ladni
   5 *valjis
   5 *ruhkuid
   5 *duháhiid
   4 *čuohte
   4 *váinniid
   4 *suopmelaččat
   4 *ruhkku
   4 *hárvenaš
   4 *guhku
   4 *dávttis
   4 *duohkai
   4 *cm
   4 *bronsaáiggi
   4 *arkeologa
   
==> filosofiija <==
   8 *guottuid
   6 *morála
   5 *filosofalaš
   3 *áinnas
   3 *sorjavaš
   3 *rasisttalaš
   3 *máilmmálaččat
   3 *fámolaš
   3 *ekologalaš
   3 *OEE
   3 *Filosofalaš
   3 *Antirasisttalaš
   2 *áššáskuhttui
   2 *álgoálbmotnuoraid
   2 *áiccut
   2 *vuoluštit
   2 *vuoiŋŋalaš
   2 *servodatlaš
   2 *sekuleara
   2 *seksuála

==> uno.se <==
  16 *p-pillara
  15 *áŧestusa
  14 *iešdovdu
  13 *geavtit
  13 *fáhkkatlaš
  12 *áŧestus
   9 *Áŧestus
   9 *riska
   8 *ládje
   8 *kondoma
   8 *Fáhkkatlaš
   7 *ila
   7 *iešdovddu
   7 *got
   7 *anašeami
   7 *alkohola
   6 *p-pillar
   6 *ovttaskasas
   6 *ovttaskasa
   6 *Kondoma

==> tanapioner <==
   6 *og
   6 *Heimen
   5 *ee
   4 *til
   4 *samiske
   4 *oarbinaččas
   4 *med
   4 *fra
   4 *eatnasat
   3 *Čiestti
   3 *ánsomedáljja
   3 *skuvlastivrrárin
   3 *sadjásaš
   3 *lulás
   3 *goappašagat
   3 *for
   3 *evakuerejuvvui
   3 *Soffa
   3 *Ravne
   3 *Lile   

==> apertium-sme-sma/dev/matematihkka.txt <==
  69 *Tevdne
  38 *supmi
  35 *lohkolinjjás
  33 *ovttežiidda
  32 *govvosiid
  28 *logežiidda
  25 *ruvttu
  25 *logežiid
  24 *oktiibuot
  21 *ruvttuid
  21 *ovttežiid
  21 *logeža
  21 *kruvnna
  19 *govvosa
  18 *ruvttuide
  16 *lohkolinnjái
  15 *ovtteža
  14 *goappáge
  12 *ruvttus
  12 *rehketbihtá

   

sme-smj

==> dev/Sámed.txt <==
 12 *vuođul
   9 *geatnegahttojuvvon
   9 *fuones
   8 *váilot
   6 *olmmošlaš
   5 *stivret
   4 *váilevašvuohta
   4 *vealtameahttun
   4 *oktage
   4 *máinnašuvvo
   4 *hállansyntesa
   4 *gáhttemii
   4 *eahpeoiddolaš
   4 *deattasta
   4 *dakko
   3 *ulbmilolahusa
   3 *ođđaáigásaš
   3 *ollašuhttit
   3 *gosa
   3 *einnostan

==> dev/dieđahus.txt <==
  7 *váilot
   6 *rávisolbmuide
   5 *lihkostuvvan
   4 *rávisolbmot
   4 *oktiiheiveheami
   4 *návccat
   4 *hálddašanmodealla
   4 *hábmet
   4 *dovdomassii
   3 *vuođul
   3 *stivret
   3 *olmmošlaš
   3 *guovttesuorat
   3 *einnostahtti
   2 *váste
   2 *seailut
   2 *ovttastahttit
   2 *ovttagielat
   2 *oktiiheivehit
   2 *oktiiheiveheamis

==> dev/Vars.txt <==
  11 *oktage
  10 *goassege
   9 *čáppa
   7 *ártegis
   7 *ruoktot
   7 *oba
   7 *dal
   6 *folkefiende  (ii leat smeFST:s)
   6 *Stockmann
   6 *En
   5 *rukses
   5 *málet
   5 *measta
   5 *ges
   5 *fitnat
   5 *deike
   4 *álás
   4 *váccii
   4 *sihkkarit
   4 *oanehaš

==> dev/Saara.txt <==
  17 *han
  12 *goit
  12 *deike
  11 *aiddo
  10 *ges
   9 *luhtte
   8 *measta
   7 *ruoktot
   7 *rukses
   7 *issoras
   6 *fitnat
   6 *bat
   5 *ártet
   5 *smiehttan
   5 *mahkáš
   5 *goassige
   5 *fitnan
   5 *Sotnabeaivve
   4 *speadjalis
   4 *oktage

==> dev/IMA.txt <==
  48 *Aurelia  (ii leat smeFST:s)
  47 *Čárrá  (ii leat smeFST:s)
  31 *Čárá  (ii leat smeFST:s)
  15 *jo
  14 *goittot 
  10 *ah’  (ii leat smeFST:s)
   9 *goassige
   9 *Viimmat
   8 *illá
   7 *čárre  (ii leat smeFST:s)
   7 *masá
   7 *dal
   6 *ču  (ii leat smeFST:s)
   6 *čoavjjis
   6 *Čirre
   6 *vulos
   6 *trampoliinna
   6 *oktage
   6 *Fáhkka
   5 *vuoktaráidalasa

==> dev/Vest.txt <==
  10 *vuot
   9 *čáppa
   9 *finai
   7 *vehá
   7 *moadde
   7 *luhtte
   6 *áidna
   6 *aiddo
   5 *vilppastii
   5 *ruoktot
   5 *guovllos (ii leat smeFST:s, = guovllus)
   5 *Hemmo-guoktá
   4 *čoakkalmasaide
   4 *váccii
   4 *velohallat
   4 *rehkenasttii
   4 *máhcai
   4 *moanaid
   4 *láhttestii
   4 *hoahkalii

==> historia <==
  18 *goittot
   9 *OKr
   7 *fierbmi
   6 *hervejuvvon
   6 *fierpmi
   5 *ártegis
   5 *vuođul
   5 *valjis
   5 *ruhkuid
   5 *gávnnus
   5 *gávdnosis
   5 *goas
   5 *Fierbmi
   4 *čuohte
   4 *váinniid
   4 *vearjjut
   4 *sihkkarit
   4 *seilon
   4 *ruhkku
   4 *lagabui
   
==> filosofiija <==
   8 *smiehttat
   7 *olmmošlaš
   7 *heive
   6 *morála
   5 *Váldooassi
   4 *ságastii
   4 *boastut
   3 *áinnas
   3 *ságastit
   3 *ságasteapmi
   3 *ságasteami
   3 *sorjavaš
   3 *rasisttalaš
   3 *rahčet
   3 *oskkoldagaid
   3 *máilmmálaččat
   3 *jápmán
   3 *gillájit
   3 *bissovaš
   3 *OEE
   
==> uno.se <==
  15 *áŧestusa
  14 *iešdovdu
  13 *geavtit
  13 *fáhkkatlaš
  12 *áŧestus
  12 *mot
  11 *áhpeheapmin
  10 *veadjá
   9 *Áŧestus
   9 *riska
   8 *kondoma
   8 *Fáhkkatlaš
   7 *somá
   7 *ráhkástallá
   7 *ilgadis
   7 *ila
   7 *iešdovddu
   7 *got
   6 *veadjit
   6 *vardá

==> tanapioner <==
   7 *váccii
   7 *oktage
   6 *og
   6 *jámii
   6 *Heimen
   5 *goassege
   5 *ee
   4 *áidna
   4 *til
   4 *samiske
   4 *ovdaolmmoš
   4 *oarbinaččas
   4 *moadde
   4 *med
   4 *fra
   4 *Duiskalaččat
   3 *Čiestti
   3 *ásaiduvve
   3 *ánsomedáljja
   3 *vázze

==> apertium-sme-smj/dev/matematihkka.txt <==
  69 *Tevdne
  50 *Rehkenastte
  46 *sárgáid
  35 *Ivdne
  33 *ovttežiidda
  28 *logežiidda
  25 *logežiid
  21 *rieggá
  21 *ovttežiid
  21 *logeža
  19 *sárgá
  18 *guoros
  17 *váilot
  15 *ovtteža
  11 *áinnas
  11 *rehkenastte
  11 *kr
  10 *leaskaloguid
  10 *Speallu
   9 *minstara

   

Jorgalanprográmmaid status

  • bidix = cat apertium-sme-sma.sme-sma.dix |grep '<e>'|grep -v '"np"'|tr '<' '>'|cut -d">" -f7|sort|uniq|wc -l
  • transfer = cat apertium-sme-smj.sme-smj.t?x|grep '^ *<rule'|wc -l
  • lexsel = cat apertium-sme-sma.sme-sma.lrx|grep '^ *<rule'|wc -l
Sisdoallu sme-smn sme-sma sme-smj
Bidix 7897 4384 12208*)
 Transfer 67 69 32
 Lexsel 139 322 9

(*) Stuorra oassi sme-smj-bidixas lea genererejuvvon