Váldofállu

Giellatekno birra

Ovttasbargoguoimmit

Lágideamit

Svonniseminára 2022

Ovddeš lágideamit

Romsa workshop 2017

Ulan-Ude workshop 2015

Constraint grammar workshop 2013

UnivOahpa- workshop 2 2012

UnivOahpa- workshop 1 2012

Constraint grammar workshop 2011

Dependency workshop 2011

South Saami language technology 2010

Samisk leksikografiworkshop 2009

Constraint grammar workshop 2009

Constraint grammar workshop 2007

Dutkansuorggit

Lingvisttalaš modelleren

Empiralaš dutkan

Leksikografiija

Dihtorjorgaleapmi

Divvunproseassa dutkan

Publikašuvnnat

Publikašuvdnalistu

Prošeavttat

Kanada álgoálbmot gielat

Urálalaš vehádatgielaide

Sámi esttegiela ovttasbargu

Davvisámi-anársámi dihtorjorgaleapmi

Máškidis oahppu

Kvena giellateknologiija

Bihtánsámegiella

Loahpahuvvon prošeavttat

Teknihkalaš resurssat

Dokumentašuvdna

Min gáldofiillat

Friddja teavsttat

Siskkáldas

Sámegielat

Buot sámegielat

Davvisámi

Julevsámi

Bihtánsami

Lullisámi

Nuortalašgiela

Anársámi

Gielddasámi

Darjjesámi

Urálalaš gielat

Urálalaš ja eará gielat

Ersagiella

Suomagiella

Várremarigiella

Ižoragiella (ingerašgiella)

Hantigiella

Komigiella

Kvenagiella

Liivigiella

Mansigiella

Niitomarigiella

Mokšagiella

Nenetsagiella

Nganasanagiella

Aunusgárjilgiella

Udmurtagiella

Vepsagiella

Eará gielat

Urálalaš ja eará gielat

Burjátagiella

Kornigiella

Fearagiella

Ruonáeatnangiella

Iñupiaq

Davvihaida

Ojibwe

Plains Cree

Ruoššagiella

Main menu

About Giellatekno

Events

Svonniseminára 2022

Earlier events

Constraint grammar workshop 2013

UnivOahpa- workshop 2 2012

UnivOahpa- workshop 1 2012

Constraint grammar workshop 2011

Dependency workshop 2011

South Saami language technology 2010

Samisk leksikografiworkshop 2009

Constraint grammar workshop 2009

Constraint grammar workshop 2007

Research areas

Linguistic modelling

Empirical investigations

Machine Translation

Proofing research

Publications

Publication list

Supporting data

Projects

Indigenous languages in Canada

Uralic minority languages

Saami Estonian coop.

North Saami-Inari Saami MT

Flexibel education at UiT

Kven language technology

Pite Saami language technology

Earlier projects

Technical resources

Internal

Saami languages

All saami languages

North Saami

Lule Saami

Pite Saami

South Saami

Skolt Saami

Inari Saami

Kildin Saami

Ter Saami

Uralic languages

Uralic and other languages

Erzya

Finnish

Hill Mari

Ingrian

Khanty

Komi

Kven

Livonian

Mansi

Meadow Mari

Moksha

Nenets

Nganasan

Olonetsian

Udmurt

Veps

Other languages

Uralic and other languages

Buryad

Cornish

Faroese

Greenlandic

Iñupiaq

Northern Haida

Ojibwe

Plains Cree

Russian

Päävalikko

Giellateknosta

Tapahtumat

Svonniseminára 2022

Aikaisemmat tapahtumat

Constraint grammar workshop 2013

UnivOahpa- workshop 2 2012

UnivOahpa- workshop 1 2012

Constraint grammar workshop 2011

Dependency workshop 2011

South Saami language technology 2010

Samisk leksikografiworkshop 2009

Constraint grammar workshop 2009

Constraint grammar workshop 2007

Tutkimusalueet

Kielitieteellinen mallintaminen

Lingvistinen tutkimustyö

Tekstikorjauksen tutkiminen

Julkaisut

Tutkimusten tietokannat

Hankkeet

Kanadan alkuperäiskielet

Uraaliset vähemmistökielet

Saame-viro yhteistyö

Pohjoissaame-inarinsaamen konekäännös

Joustava opetus UiT:ssa

Kveenin kielen kieliteknologia

Piitimensaamen kieliteknologia

Koltansaamen Oahpa

Aikaisemmat hankkeet

Tekniset resursit

Meidän lähdekoodi

Sisäiset sivut

Saamelaiskielet

Kaikki saamelaiskielet

Pohjoissaame

Kaikki työkalut

Luulajansaame

Kaikki työkalut

Piitimensaame

Eteläsaame

Kaikki työkalut

Koltansaame

Kaikki työkalut

Inarinsaame

Kaikki työkalut

Kiltinänsaame

Kaikki työkalut

Turjansaame

Uralilaiset kielet

Uralilaiset ja muut kielet

Ersä

Suomi

Länsimari

Inkeri

Hanti

Komi

Kveeni

Liivi

Mansi

Itämari

Mokša

Nenetsi

Nganasani

Livvi

Udmurtti

Vepsä

Muut kielet

Uralilaiset ja muut kielet

Burjaatti

Korni

Fääri

Grönlanti

Iñupiaq

Pohjoishaida

Ojibwe

Plains Cree

Venäjä

Hovedmeny

Om Giellatekno

Samarbeidspartnere

Arrangement

Svonniseminára 2022

Tidligere arrangement

Constraint grammar workshop 2013

UnivOahpa- workshop 2 2012

UnivOahpa- workshop 1 2012

Constraint grammar workshop 2011

Dependency workshop 2011

South Saami language technology 2010

Samisk leksikografiworkshop 2009

Constraint grammar workshop 2009

Constraint grammar workshop 2007

Forskningsområder

Lingvistisk modellering

Empirisk forskning

Maskinoversetting

Forsking på tekstkorrigering

Publikasjoner

Publikasjonsliste

Prosjekt

Urfolksspråk i Canada

Uralske minoritetsspråk

Samisk-estisk samarbeid

Nordsamisk-inarisamisk MT

Fleksibel utdanning ved UiT

Kvensk språkteknologi

Pitesamisk språkteknologi

Tidligere prosjekt

Tekniske ressurser

Kildefilene våre

Internt

Samiske språk

Alle samiske språk

Nordsamisk

Lulesamisk

Pitesamisk

Sørsamisk

Skoltesamisk

Enaresamisk

Kildinsamisk

Tersamisk

Uralske språk

Uralske og andre språk

Ersja

Finsk

Vestmarisk

Ingrisk

Khantisk

Komi

Kvensk

Livisk

Mansisk

Østmarisk

Moksja

Nenetsisk

Nganasansk

Olonetsisk

Udmurt

Veps

Andre språk

Uralske og andre språk

Burjatisk

Cornish

Faroese

Grønlandsk

Iñupiaq

Nordhaida

Ojibwe

Plains Cree

Russisk

Главное меню

Сотрудники

Партнеры

Актуальные мероприятия

Svonniseminára 2022

Ранние мероприятия

Constraint grammar workshop 2013

UnivOahpa- workshop 2 2012

UnivOahpa- workshop 1 2012

Constraint grammar workshop 2011

Dependency workshop 2011

South Saami language technology 2010

Samisk leksikografiworkshop 2009

Constraint grammar workshop 2009

Constraint grammar workshop 2007

Области исследований

Лингвистическое моделирование

Эмпирические исследования

Лексикография

Машинный перевод

Исследование правописания

Публикации

Список публикаций

Научные данные

Актуальные проекты

Indigenous languages in Canada

Uralic minority languages

Saami Estonian coop.

North Saami-Inari Saami MT

Flexibel education at UiT

Kven language technology

Pite Saami language technology

Ранние проекты

Технические ресурсы

Technical documentation

Исходные файлы

Саамские языки

Все саамские языки

Ссеверосаамский

Все программы

Луле-саамский

Все программы

пите-саамский

Все программы

Южносаамский

Все программы

Колтта-саамский

Все программы

Инари-саамский

Все программы

Кильдинский саамский

Все программы

Терско-саамский

Уральсие яаыки

Уральсие яаыки

Эрзянский

Все программы

Финский

Все программы

Горномарийский

Все программы

Ижорский

Все программы

Хантийский

Все программы

Коми

Все программы

Квенский

Все программы

Ливский

Все программы

Мансийский

Все программы

Лугово-восточный марийский

Все программы

Мокшанский

Все программы

Ненецкий

Все программы

Нганасанский

Все программы

Ливвиковский

Все программы

Удмуртский

Все программы

Вепсский

Все программы

Другие языки

Уральсие/Другие яаыки

Бурятский

Все программы

Корнский

Все программы

Фарерский

Все программы

Гренландский

Все программы

Инупиак

Все программы

Северохайдский

Все программы

Оджибве

Все программы

Равнинный кри

Все программы

Русский

Все программы

Northern Saami interactive text corpus

Text search

Here you may search for text and grammatical functions in a Saami text corpus.

User name = sami, and password, giella

Search the monolingual corpus

Search the bilingual (Northern Saami - Norwegian Bokmål) corpus

The search interface

The first search field is in the box above the text options ». For each word you fill inn, you may or may not specify its grammatical properties (if you don't, but ask for the lemma form, you will get all inflected forms of the word in question. If you have several search words, you may specify the minimum and/or maximum number of words you allow between them. You may also leave the text field empty, and search for, say, any verb in the past tense indicative followed by a locative noun. The search interface makes it possible to search for sentences with specific words, grammatical categories, and (indirectly) grammatical constructions.

In order to use the bilingual corpus, click the button add phrase under the first box. Chose Norwegian for the language of the second box (or vice versa, to display Norwegian as the upper language). Then press Search corpus in the lower right box. You may also restrict the search to the Saami sentences who are matched by specific Norwegian sentences. You may for example either search for all Saami sentences with present tense leat (and leave the Norwegian box empty), or you may want the sentences where leat is matched by some form of Norwegian å ha, in witch case you write ha in the Norwegian search field and tick lemma form under options.

When the sentences are displayed, the grammatical analysis of each word is given by pointing at it with the mouse. Cf. the explanations of the abbreviations for the morphological and syntactical tags. The monolingual Saami corpus gives a full grammatical and syntactic analysis, whereas the parallel corpus for technical reasons only displays part of speech information.

The texts

The corpus contains the following encoded texts

Text	Genre	Words
Saami Parliament protocols, 1998-2005	admin	496437

About the corpus

More texts, and texts from more genres, will be included in the corpus in the future.

The Saami text corpus is automatically analysed with the help of the parsing tools developed at the Saami language technology project. The analysis has not been manually checked. The Norwegian texts are automatically analysed with the Oslo-Bergen Tagger

The search interface is developed at Tekstlaboratoriet in Oslo, a development of the Stuttgart corpus workbench.

The text corpus is under construction. If you notice errors of any kind, please report them to The Saami language technology project..