For å gjenta: 1) cd $GTBIG/prooftesting/sme/voikko 2) svn up .. 3) make Då får eg meldinga: $ make /Users/smo036/langtech/main/gtcore/scripts/speller-testres.pl \ --engine=vk \ --lang=sme \ --input=../all-gs-sme.txt \ --output=goldstandard.spout.txt \ --document=all-gs-sme.txt \ --date=20160120-1503 \ --version="se-4.0-20151217" \ --toolversion="`cat sp-version.txt`" \ --corpusversion="`cat ../corpusrevisions.txt`" \ --memoryuse="`cat spellermemusage.txt`" \ --timeuse="`cat spellertimeusage.txt`" \ --corrsugg \ --xml=corpus-gs-results.xml Reading typos from ../all-gs-sme.txt /Users/smo036/langtech/main/gtcore/scripts/speller-testres.pl: Reading Voikko output from goldstandard.spout.txt Use of uninitialized value in string eq at /Users/smo036/langtech/main/gtcore/scripts/speller-testres.pl line 606, <FH> line 131026. Use of uninitialized value in concatenation (.) or string at /Users/smo036/langtech/main/gtcore/scripts/speller-testres.pl line 607, <FH> line 131026. These suggestions do not seem to belong here Current orig: čáđa: Index: 99323 Original word at this index: Suggestions: čađa cára cába c-áđa čađat Data som krevst for å få fram feilen blir sjekka inn snart.
Gjentakingsdata sjekka inn i r3413 ($GTBIG).
Linje 7809-47 i filene ../all-gs-sme.txt og goldstandard.spin.txt begynner med #. Disse filene er på 99331 linjer. Disse linjene ble sendt inn i spelleren og lager output. Når man leser inn ../all-gs-sme.txt inn i arrayet originals i funksjonen read_typos, blir disse linjene fjernet. Lengden på originals blir da 99331 - antallet linjer som starter på #. Deretter blir resultatet fra 99331 input-linjer lest inn i funksjonen read_voikko, og lengden på orig har da blitt 99331. Input og output har da kommet ut av sync. Dette er forhåpentligvis fikset i langtech r128603, der fjerningen av disse linjene blir flyttet fra read_typos i speller-testres.pl til spell-preprocess.pl. Da jeg kjørte hfst-mso-testen, var input/output i xml-filen synkront.
Ble denne fikset, eller?
ping
Med dei instruksjonane for reproduksjon som er ført opp her, så er eg ikkje i stand til å reprodusera, så for meg ser det bra ut. Du kan lata att.