{"id":442,"date":"2024-05-31T13:31:02","date_gmt":"2024-05-31T11:31:02","guid":{"rendered":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/?p=442"},"modified":"2024-08-16T14:39:44","modified_gmt":"2024-08-16T12:39:44","slug":"kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille","status":"publish","type":"post","link":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/2024\/05\/31\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\/","title":{"rendered":"K\u00e4sinkirjoitetun tekstin koneellinen tunnistaminen Kansallisarkistossa: Opetusaineistoa supermallille"},"content":{"rendered":"\n<h5 class=\"wp-block-heading\">Sanna Joska ja Ilkka Jokipii<\/h5>\n\n\n\n<p>Kansallisarkisto on mukana Kaupungit Ruotsin suurvallan it\u00e4rajalla -projektissa kehitt\u00e4m\u00e4ss\u00e4 1600-luvun k\u00e4sialamallia yhdess\u00e4 projektissa ty\u00f6skentelevien tutkijoiden kanssa. Yhteisty\u00f6n tuloksena kehitet\u00e4\u00e4n Kansallisarkiston koneellista tekstintunnistusta hy\u00f6dynt\u00e4vi\u00e4 k\u00e4sialamalleja lukemaan paremmin 1600-luvulla kirjoitettua k\u00e4sialaa. Kansallisarkisto vastaa hankkeessa l\u00e4hdeaineistojen, 1600-luvun tuomiokirjojen, koneellisesta tekstintunnistuksesta. Tekstintunnistuksen avulla saadaan tuhannet k\u00e4sin kirjoitetut tuomiokirjasivut s\u00e4hk\u00f6iseen muotoon, jolloin niiden k\u00e4ytt\u00f6 tutkimuksen l\u00e4hdeaineistona helpottuu olennaisesti.<\/p>\n\n\n\n<p>Kansallisarkistossa on hy\u00f6dynnetty HTR-teknologiaa (handwritten text recognition) jo muutaman vuoden ajan. Olemme mm. prosessoineet yli 3 miljoonaa kuvaa 1800-luvun tuomiokirjoja yhteisty\u00f6ss\u00e4 READ-COOP-osuuskunnan kanssa. Viimeisen vuoden aikana Kansallisarkistossa on keskitytty omien k\u00e4sialamallien kehitt\u00e4miseen. Tavoitteena on luoda k\u00e4sialamallit, jotka osaavat lukea k\u00e4sinkirjoitettua aineistoa aina 1500-luvulta 1900-luvulle ja sit\u00e4 kautta parantaa arkistoaineistojen saatavuutta ja k\u00e4ytett\u00e4vyytt\u00e4. K\u00e4sialamallien kehitt\u00e4minen vaatii paitsi koneoppimisosaamista, my\u00f6s vanhoja k\u00e4sialoja lukemaan kykenevien historiantutkijoiden taitoja. Kansallisarkiston n\u00e4k\u00f6kulmasta projektin parissa teht\u00e4v\u00e4 yhteisty\u00f6 onkin malliesimerkki siit\u00e4, miten voidaan yhdist\u00e4\u00e4 tutkijoiden asiantuntemus Kansallisarkiston koneoppimis- ja aineisto-osaamiseen ja saada paitsi molempia tahoja, my\u00f6s tutkimuskentt\u00e4\u00e4 yleisemmin hy\u00f6dynt\u00e4vi\u00e4 tuloksia.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Kaikki alkaa digitaalisista kuvista<\/h4>\n\n\n\n<p>Kansallisarkiston n\u00e4k\u00f6kulmasta k\u00e4sialamallin kehitt\u00e4mist\u00e4 varten aineistosta on oltava laadukkaat digitaaliset kuvat. Projektin l\u00e4hdeaineistona olevia 1600-luvun raastuvan- ja k\u00e4mnerinoikeuksien renovoituja tuomiokirjoja s\u00e4ilytet\u00e4\u00e4n keskusarkistossa Mikkeliss\u00e4. Aineistot on aikoinaan kuvattu mikrofilmille, jonka kuvat oli sittemmin digitoitu. Mikrofilmikuvien digitointi tuottaa mustavalkoisia kuvia, jotka vaihtelevat laadultaan tutkijalle kohtuullisen lukukelpoisista lukukelvottomiin. Koneellista tekstintunnistusta ajatellen mikrofilmilt\u00e4 digitoidut kuvat ovat usein aivan liian tummia, eik\u00e4 teksti erotu taustasta tarpeeksi varsinkaan niiss\u00e4 tapauksissa, joissa sivun k\u00e4\u00e4nt\u00f6puolelta kuultaa mustetta l\u00e4pi tai alkuper\u00e4inen sivu on muuten historian saatossa v\u00e4rj\u00e4ytynyt. Ensimm\u00e4inen askel oli siis varmistaa, ett\u00e4 l\u00e4hteen\u00e4 k\u00e4ytett\u00e4vist\u00e4 tuomiokirjoista on saatavilla uudet, nykyaikaisilla laitteilla kuvatut digikuvat. Tuomiokirjat digitoitiin uudelleen keskusarkistossa. Uudet kuvat ovat hankkeen tutkijoiden k\u00e4yt\u00f6ss\u00e4 ja vapaasti n\u00e4ht\u00e4viss\u00e4 Kansallisarkiston <a href=\"https:\/\/astia.narc.fi\/uusiastia\/kortti_aineisto.html?id=2317506285\" target=\"_blank\" rel=\"noreferrer noopener\">Astia-verkkopalvelussa<\/a>.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"825\" src=\"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-1-Raahe-vs-Brahea-1024x825.jpg\" alt=\"\" class=\"wp-image-445\" srcset=\"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-1-Raahe-vs-Brahea-1024x825.jpg 1024w, https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-1-Raahe-vs-Brahea-300x242.jpg 300w, https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-1-Raahe-vs-Brahea-768x619.jpg 768w, https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-1-Raahe-vs-Brahea-1536x1237.jpg 1536w, https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-1-Raahe-vs-Brahea-2048x1650.jpg 2048w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>Vasemmalla mikrofilmikuvasta digitoitu sivu Raahen raastuvanoikeuden renovoiduista tuomiokirjoista vuodelta 1684. Oikealla moderni digikuva Brahean raastuvanoikeuden renovoiduista tuomiokirjoista vuodelta 1662.<\/em><\/figcaption><\/figure>\n\n\n\n<h4 class=\"wp-block-heading\">Opetusaineiston tuottaminen<\/h4>\n\n\n\n<p>Toinen askel k\u00e4sialamallin kehitt\u00e4misess\u00e4 on opetusaineistojen tuottaminen. K\u00e4sialamalleja kehitet\u00e4\u00e4n opettamalla konetta lukemaan erilaisia k\u00e4sialoja ja t\u00e4t\u00e4 varten tarvitaan puhtaaksikirjoitettua opetusaineistoa. Mit\u00e4 enemm\u00e4n puhtaaksikirjoitettuja sanoja, sit\u00e4 parempi malli ja tekstintunnistustulos. K\u00e4sialamallin ohella aineistolle on kehitett\u00e4v\u00e4 my\u00f6s segmentointi- eli tekstialuemalli, jonka avulla kone tunnistaa, miss\u00e4 kohdassa kuvaa teksti\u00e4 esiintyy. Sek\u00e4 tekstialueiden korjaaminen ett\u00e4 tekstin puhtaaksikirjoittaminen ovat varsin ty\u00f6l\u00e4it\u00e4 ty\u00f6vaiheita, jotka vaativat paitsi aikaa ja huolellisuutta, my\u00f6s historiallisten aineistojen lukutaitoa.<\/p>\n\n\n\n<p>Tekstintunnistukseen liittyvien opetusaineistojen tekemiseen Kansallisarkistossa k\u00e4ytet\u00e4\u00e4n p\u00e4\u00e4asiassa Transkribus-ty\u00f6kalua. Kyseess\u00e4 on READ-COOP-osuuskunnan, jonka j\u00e4sen Kansallisarkisto on, kehitt\u00e4m\u00e4 tekstintunnistusohjelma, joka on vapaasti k\u00e4ytett\u00e4viss\u00e4 <a href=\"https:\/\/www.transkribus.org\/\" target=\"_blank\" rel=\"noreferrer noopener\">netiss\u00e4<\/a>.<\/p>\n\n\n\n<p>Opetusaineiston tekeminen alkaa lataamalla digitoidut kuvat Transkribukseen, jossa niille ajetaan tekstialueiden ja rivien tunnistus. Transkribuksen layout-tunnistus on varsin hyv\u00e4, mutta ohjelma tekee edelleen virheit\u00e4, jotka tulee korjata k\u00e4sin, ennen kuin teksti\u00e4 voi alkaa puhtaaksikirjoittaa.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"960\" height=\"355\" src=\"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-2-Sortavala-ro-rivit.jpg\" alt=\"\" class=\"wp-image-448\" srcset=\"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-2-Sortavala-ro-rivit.jpg 960w, https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-2-Sortavala-ro-rivit-300x111.jpg 300w, https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-2-Sortavala-ro-rivit-768x284.jpg 768w\" sizes=\"auto, (max-width: 960px) 100vw, 960px\" \/><figcaption class=\"wp-element-caption\"><em>Huonosti tunnistuneita rivej\u00e4 Transkribuksessa. Sortavalan raastuvanoikeuden renovoidut tuomiokirjat v. 1673\u20131694.<\/em><\/figcaption><\/figure>\n\n\n\n<p>Transkribus merkitsee tunnistamansa rivit vaaleansinisin\u00e4 laatikkoina (line polygons) ja tummansinisin\u00e4 viivoina (baseline). Esimerkkikuvassa kaikki rivit eiv\u00e4t ole tunnistuneet kokonaisina, vaan osa riveist\u00e4 on liian lyhyit\u00e4 ja osa riveist\u00e4 on katkennut kesken. Vasemmassa yl\u00e4kulmassa on lis\u00e4ksi pari virheellist\u00e4 rivi\u00e4 alta kuultavan tekstin takia. Virheelliset rivit poistetaan, katkenneet rivit yhdistet\u00e4\u00e4n ja liian lyhyen\u00e4 tunnistuneet rivit pidennet\u00e4\u00e4n kattamaan koko teksti.<\/p>\n\n\n\n<p>Tekstialueiden korjaamisen j\u00e4lkeen voidaan kirjoittaa sivuilla olevat tekstit puhtaaksi. Viimeist\u00e4\u00e4n t\u00e4ss\u00e4 vaiheessa ty\u00f6t\u00e4 paleografinen osaaminen on v\u00e4ltt\u00e4m\u00e4t\u00f6nt\u00e4. Kansallisarkisto sai puhtaaksikirjoitetut opetusaineistot hankkeelta, joten teht\u00e4v\u00e4ksemme j\u00e4i kopioida puhtaaksikirjoitettu teksti riveitt\u00e4in Transkribukseen. 1600-luvun oikeusjuttujen mielenkiintoiseen sis\u00e4lt\u00f6\u00f6n ei kopioidessa valitettavasti ehdi sen suuremmin paneutumaan, paitsi tarkastaakseen, ett\u00e4 rivit ovat oikeassa j\u00e4rjestyksess\u00e4.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"460\" src=\"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-3-Sortavala-ro-teksti-1024x460.jpg\" alt=\"\" class=\"wp-image-451\" srcset=\"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-3-Sortavala-ro-teksti-1024x460.jpg 1024w, https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-3-Sortavala-ro-teksti-300x135.jpg 300w, https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-3-Sortavala-ro-teksti-768x345.jpg 768w, https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-3-Sortavala-ro-teksti-1536x690.jpg 1536w, https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-3-Sortavala-ro-teksti.jpg 1921w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>Puhtaaksikirjoitettua teksti\u00e4 Sortavalan raastuvanoikeuden renovoiduista tuomiokirjoista vuodelta 1680. Ks. aiheesta <a href=\"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/2024\/04\/08\/koulutusaineistoa-supermallille\/\" target=\"_blank\" rel=\"noreferrer noopener\">Kimmo Katajalan blogiteksti<\/a>.<\/em><\/figcaption><\/figure>\n\n\n\n<p>Kun tekstialueet ja rivit on tarkistettu ja puhtaaksikirjoitetut tekstit kopioitu Transkribukseen, voidaan ty\u00f6 tallentaa tilaan \u201dGT\u201d eli Ground Truth. Termi\u00e4 k\u00e4ytet\u00e4\u00e4n kuvaamaan valmista opetusaineistoa. Valmista tuli, ja aineistoa voidaan nyt k\u00e4ytt\u00e4\u00e4 kouluttamaan k\u00e4sialamallia!<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">K\u00e4sialamallin kouluttaminen<\/h4>\n\n\n\n<p>Transkribuksessa on mahdollista kouluttaa niin tekstialue- kuin k\u00e4sialamalleja ja prosessoida aineistoja, mutta palveluiden k\u00e4ytt\u00f6 on maksullista. Etenkin isojen, tuhansia (tai jopa miljoonia!) sivuja sis\u00e4lt\u00e4vien aineistokokonaisuuksien prosessoinnin hinta nousee korkeaksi, joten Kansallisarkisto on siirtynyt kouluttamaan k\u00e4sialamallinsa ja prosessoimaan aineistonsa itsen\u00e4isesti.&nbsp; Alkuvuodesta 2024 Kansallisarkisto p\u00e4\u00e4si Tieteen tietotekniikan keskus oy:n eli CSC:n akateemisen k\u00e4yt\u00f6n piiriin ja aineistojen prosessointi tapahtuu jatkossa heid\u00e4n palvelimillaan.&nbsp;<\/p>\n\n\n\n<p>Kansallisarkiston omien k\u00e4sialamallien koulutuksen prosessia varten kuvat ja transkriptiot sis\u00e4lt\u00e4v\u00e4t xml-tiedostot ladataan ulos Transkribuksesta. Xml-tiedostojen avulla kuvista irrotetaan rivikuvat ja niihin liitet\u00e4\u00e4n transkriptiot. N\u00e4iden rivikuvien pohjalta aloitetaan k\u00e4sialamallin koulutus, joka kest\u00e4\u00e4 laskentakapasiteetista ja aineistom\u00e4\u00e4r\u00e4st\u00e4 riippuen muutamista tunneista pariin viikkoon.<\/p>\n\n\n\n<p>Omien mallien avulla on mahdollista p\u00e4\u00e4st\u00e4 todella hyviin tuloksiin, ja Kansallisarkiston viimeksi kouluttama supermalli-ty\u00f6nimell\u00e4 kulkeva k\u00e4sialamalli saavuttaa jopa 3,7 virheprosentin k\u00e4sialoista 1600-luvulta aina 1900-luvun alkupuolelle asti. Tutkimushankkeen aikana teht\u00e4vien opetusaineistojen avulla parannetaan t\u00e4t\u00e4 mallia 1600-luvun aineistojen osalta.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Sanna Joska ja Ilkka Jokipii Kansallisarkisto on mukana Kaupungit Ruotsin suurvallan it\u00e4rajalla -projektissa kehitt\u00e4m\u00e4ss\u00e4 1600-luvun k\u00e4sialamallia yhdess\u00e4 projektissa ty\u00f6skentelevien tutkijoiden kanssa. Yhteisty\u00f6n tuloksena kehitet\u00e4\u00e4n Kansallisarkiston koneellista tekstintunnistusta hy\u00f6dynt\u00e4vi\u00e4 k\u00e4sialamalleja lukemaan paremmin 1600-luvulla kirjoitettua k\u00e4sialaa. Kansallisarkisto vastaa hankkeessa l\u00e4hdeaineistojen, 1600-luvun tuomiokirjojen, koneellisesta tekstintunnistuksesta. Tekstintunnistuksen avulla saadaan tuhannet k\u00e4sin kirjoitetut tuomiokirjasivut s\u00e4hk\u00f6iseen muotoon, jolloin niiden k\u00e4ytt\u00f6 tutkimuksen [&hellip;]<\/p>\n","protected":false},"author":668,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[1],"tags":[32,29],"class_list":["post-442","post","type-post","status-publish","format-standard","hentry","category-uncategorized","tag-htr","tag-transkribus"],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.3 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>K\u00e4sinkirjoitetun tekstin koneellinen tunnistaminen Kansallisarkistossa: Opetusaineistoa supermallille - Kaupungit Ruotsin suurvallan it\u00e4rajalla -blogi<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/2024\/05\/31\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\/\" \/>\n<meta property=\"og:locale\" content=\"fi_FI\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"K\u00e4sinkirjoitetun tekstin koneellinen tunnistaminen Kansallisarkistossa: Opetusaineistoa supermallille - Kaupungit Ruotsin suurvallan it\u00e4rajalla -blogi\" \/>\n<meta property=\"og:description\" content=\"Sanna Joska ja Ilkka Jokipii Kansallisarkisto on mukana Kaupungit Ruotsin suurvallan it\u00e4rajalla -projektissa kehitt\u00e4m\u00e4ss\u00e4 1600-luvun k\u00e4sialamallia yhdess\u00e4 projektissa ty\u00f6skentelevien tutkijoiden kanssa. Yhteisty\u00f6n tuloksena kehitet\u00e4\u00e4n Kansallisarkiston koneellista tekstintunnistusta hy\u00f6dynt\u00e4vi\u00e4 k\u00e4sialamalleja lukemaan paremmin 1600-luvulla kirjoitettua k\u00e4sialaa. Kansallisarkisto vastaa hankkeessa l\u00e4hdeaineistojen, 1600-luvun tuomiokirjojen, koneellisesta tekstintunnistuksesta. Tekstintunnistuksen avulla saadaan tuhannet k\u00e4sin kirjoitetut tuomiokirjasivut s\u00e4hk\u00f6iseen muotoon, jolloin niiden k\u00e4ytt\u00f6 tutkimuksen [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/2024\/05\/31\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\/\" \/>\n<meta property=\"og:site_name\" content=\"Kaupungit Ruotsin suurvallan it\u00e4rajalla -blogi\" \/>\n<meta property=\"article:published_time\" content=\"2024-05-31T11:31:02+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2024-08-16T12:39:44+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-1-Raahe-vs-Brahea-1024x825.jpg\" \/>\n<meta name=\"author\" content=\"jmerovuo\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Kirjoittanut\" \/>\n\t<meta name=\"twitter:data1\" content=\"jmerovuo\" \/>\n\t<meta name=\"twitter:label2\" content=\"Arvioitu lukuaika\" \/>\n\t<meta name=\"twitter:data2\" content=\"5 minuuttia\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/2024\\\/05\\\/31\\\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/2024\\\/05\\\/31\\\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\\\/\"},\"author\":{\"name\":\"jmerovuo\",\"@id\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/#\\\/schema\\\/person\\\/936bd9e247602a91764b49cc4a647d0d\"},\"headline\":\"K\u00e4sinkirjoitetun tekstin koneellinen tunnistaminen Kansallisarkistossa: Opetusaineistoa supermallille\",\"datePublished\":\"2024-05-31T11:31:02+00:00\",\"dateModified\":\"2024-08-16T12:39:44+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/2024\\\/05\\\/31\\\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\\\/\"},\"wordCount\":840,\"commentCount\":0,\"image\":{\"@id\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/2024\\\/05\\\/31\\\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/wp-content\\\/uploads\\\/sites\\\/209\\\/2024\\\/05\\\/KA-Kuva-1-Raahe-vs-Brahea-1024x825.jpg\",\"keywords\":[\"HTR\",\"Transkribus\"],\"articleSection\":[\"Uncategorized\"],\"inLanguage\":\"fi\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/2024\\\/05\\\/31\\\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\\\/#respond\"]}]},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/2024\\\/05\\\/31\\\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\\\/\",\"url\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/2024\\\/05\\\/31\\\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\\\/\",\"name\":\"K\u00e4sinkirjoitetun tekstin koneellinen tunnistaminen Kansallisarkistossa: Opetusaineistoa supermallille - Kaupungit Ruotsin suurvallan it\u00e4rajalla -blogi\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/2024\\\/05\\\/31\\\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/2024\\\/05\\\/31\\\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/wp-content\\\/uploads\\\/sites\\\/209\\\/2024\\\/05\\\/KA-Kuva-1-Raahe-vs-Brahea-1024x825.jpg\",\"datePublished\":\"2024-05-31T11:31:02+00:00\",\"dateModified\":\"2024-08-16T12:39:44+00:00\",\"author\":{\"@id\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/#\\\/schema\\\/person\\\/936bd9e247602a91764b49cc4a647d0d\"},\"breadcrumb\":{\"@id\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/2024\\\/05\\\/31\\\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\\\/#breadcrumb\"},\"inLanguage\":\"fi\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/2024\\\/05\\\/31\\\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"fi\",\"@id\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/2024\\\/05\\\/31\\\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\\\/#primaryimage\",\"url\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/wp-content\\\/uploads\\\/sites\\\/209\\\/2024\\\/05\\\/KA-Kuva-1-Raahe-vs-Brahea-scaled.jpg\",\"contentUrl\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/wp-content\\\/uploads\\\/sites\\\/209\\\/2024\\\/05\\\/KA-Kuva-1-Raahe-vs-Brahea-scaled.jpg\",\"width\":2560,\"height\":2062},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/2024\\\/05\\\/31\\\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"K\u00e4sinkirjoitetun tekstin koneellinen tunnistaminen Kansallisarkistossa: Opetusaineistoa supermallille\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/#website\",\"url\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/\",\"name\":\"Kaupungit Ruotsin suurvallan it\u00e4rajalla -blogi\",\"description\":\"kaupungit; varhainen uusi aika; Ruotsin suurvalta-aika; 1600-luku, verkostot\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"fi\"},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/#\\\/schema\\\/person\\\/936bd9e247602a91764b49cc4a647d0d\",\"name\":\"jmerovuo\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"fi\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/af8893f65675616dda8580df06b53d7ccf22ec8d940729602fc286053e0ee0ac?s=96&d=mm&r=g\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/af8893f65675616dda8580df06b53d7ccf22ec8d940729602fc286053e0ee0ac?s=96&d=mm&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/af8893f65675616dda8580df06b53d7ccf22ec8d940729602fc286053e0ee0ac?s=96&d=mm&r=g\",\"caption\":\"jmerovuo\"},\"url\":\"https:\\\/\\\/blogs.uef.fi\\\/kaupungit-ruotsin-suurvallan-itarajalla\\\/author\\\/jmerovuo\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"K\u00e4sinkirjoitetun tekstin koneellinen tunnistaminen Kansallisarkistossa: Opetusaineistoa supermallille - Kaupungit Ruotsin suurvallan it\u00e4rajalla -blogi","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/2024\/05\/31\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\/","og_locale":"fi_FI","og_type":"article","og_title":"K\u00e4sinkirjoitetun tekstin koneellinen tunnistaminen Kansallisarkistossa: Opetusaineistoa supermallille - Kaupungit Ruotsin suurvallan it\u00e4rajalla -blogi","og_description":"Sanna Joska ja Ilkka Jokipii Kansallisarkisto on mukana Kaupungit Ruotsin suurvallan it\u00e4rajalla -projektissa kehitt\u00e4m\u00e4ss\u00e4 1600-luvun k\u00e4sialamallia yhdess\u00e4 projektissa ty\u00f6skentelevien tutkijoiden kanssa. Yhteisty\u00f6n tuloksena kehitet\u00e4\u00e4n Kansallisarkiston koneellista tekstintunnistusta hy\u00f6dynt\u00e4vi\u00e4 k\u00e4sialamalleja lukemaan paremmin 1600-luvulla kirjoitettua k\u00e4sialaa. Kansallisarkisto vastaa hankkeessa l\u00e4hdeaineistojen, 1600-luvun tuomiokirjojen, koneellisesta tekstintunnistuksesta. Tekstintunnistuksen avulla saadaan tuhannet k\u00e4sin kirjoitetut tuomiokirjasivut s\u00e4hk\u00f6iseen muotoon, jolloin niiden k\u00e4ytt\u00f6 tutkimuksen [&hellip;]","og_url":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/2024\/05\/31\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\/","og_site_name":"Kaupungit Ruotsin suurvallan it\u00e4rajalla -blogi","article_published_time":"2024-05-31T11:31:02+00:00","article_modified_time":"2024-08-16T12:39:44+00:00","og_image":[{"url":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-1-Raahe-vs-Brahea-1024x825.jpg","type":"","width":"","height":""}],"author":"jmerovuo","twitter_card":"summary_large_image","twitter_misc":{"Kirjoittanut":"jmerovuo","Arvioitu lukuaika":"5 minuuttia"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/2024\/05\/31\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\/#article","isPartOf":{"@id":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/2024\/05\/31\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\/"},"author":{"name":"jmerovuo","@id":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/#\/schema\/person\/936bd9e247602a91764b49cc4a647d0d"},"headline":"K\u00e4sinkirjoitetun tekstin koneellinen tunnistaminen Kansallisarkistossa: Opetusaineistoa supermallille","datePublished":"2024-05-31T11:31:02+00:00","dateModified":"2024-08-16T12:39:44+00:00","mainEntityOfPage":{"@id":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/2024\/05\/31\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\/"},"wordCount":840,"commentCount":0,"image":{"@id":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/2024\/05\/31\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\/#primaryimage"},"thumbnailUrl":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-1-Raahe-vs-Brahea-1024x825.jpg","keywords":["HTR","Transkribus"],"articleSection":["Uncategorized"],"inLanguage":"fi","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/2024\/05\/31\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/2024\/05\/31\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\/","url":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/2024\/05\/31\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\/","name":"K\u00e4sinkirjoitetun tekstin koneellinen tunnistaminen Kansallisarkistossa: Opetusaineistoa supermallille - Kaupungit Ruotsin suurvallan it\u00e4rajalla -blogi","isPartOf":{"@id":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/#website"},"primaryImageOfPage":{"@id":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/2024\/05\/31\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\/#primaryimage"},"image":{"@id":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/2024\/05\/31\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\/#primaryimage"},"thumbnailUrl":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-1-Raahe-vs-Brahea-1024x825.jpg","datePublished":"2024-05-31T11:31:02+00:00","dateModified":"2024-08-16T12:39:44+00:00","author":{"@id":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/#\/schema\/person\/936bd9e247602a91764b49cc4a647d0d"},"breadcrumb":{"@id":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/2024\/05\/31\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\/#breadcrumb"},"inLanguage":"fi","potentialAction":[{"@type":"ReadAction","target":["https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/2024\/05\/31\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\/"]}]},{"@type":"ImageObject","inLanguage":"fi","@id":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/2024\/05\/31\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\/#primaryimage","url":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-1-Raahe-vs-Brahea-scaled.jpg","contentUrl":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-content\/uploads\/sites\/209\/2024\/05\/KA-Kuva-1-Raahe-vs-Brahea-scaled.jpg","width":2560,"height":2062},{"@type":"BreadcrumbList","@id":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/2024\/05\/31\/kasinkirjoitetun-tekstin-koneellinen-tunnistaminen-kansallisarkistossa-opetusaineistoa-supermallille\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/"},{"@type":"ListItem","position":2,"name":"K\u00e4sinkirjoitetun tekstin koneellinen tunnistaminen Kansallisarkistossa: Opetusaineistoa supermallille"}]},{"@type":"WebSite","@id":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/#website","url":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/","name":"Kaupungit Ruotsin suurvallan it\u00e4rajalla -blogi","description":"kaupungit; varhainen uusi aika; Ruotsin suurvalta-aika; 1600-luku, verkostot","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"fi"},{"@type":"Person","@id":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/#\/schema\/person\/936bd9e247602a91764b49cc4a647d0d","name":"jmerovuo","image":{"@type":"ImageObject","inLanguage":"fi","@id":"https:\/\/secure.gravatar.com\/avatar\/af8893f65675616dda8580df06b53d7ccf22ec8d940729602fc286053e0ee0ac?s=96&d=mm&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/af8893f65675616dda8580df06b53d7ccf22ec8d940729602fc286053e0ee0ac?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/af8893f65675616dda8580df06b53d7ccf22ec8d940729602fc286053e0ee0ac?s=96&d=mm&r=g","caption":"jmerovuo"},"url":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/author\/jmerovuo\/"}]}},"_links":{"self":[{"href":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-json\/wp\/v2\/posts\/442","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-json\/wp\/v2\/users\/668"}],"replies":[{"embeddable":true,"href":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-json\/wp\/v2\/comments?post=442"}],"version-history":[{"count":1,"href":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-json\/wp\/v2\/posts\/442\/revisions"}],"predecessor-version":[{"id":460,"href":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-json\/wp\/v2\/posts\/442\/revisions\/460"}],"wp:attachment":[{"href":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-json\/wp\/v2\/media?parent=442"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-json\/wp\/v2\/categories?post=442"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blogs.uef.fi\/kaupungit-ruotsin-suurvallan-itarajalla\/wp-json\/wp\/v2\/tags?post=442"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}