Demoilla ja digitaalisella lähdekritiikillä kohti havaintomatriiseja

Jenni Merovuo

Käkisalmen raastuvanoikeus 1682

Vuonna 1682 Käkisalmen kaupungissa istuttiin 47 raastupapäivää. Näistä päivistä syntyi 87 sivua puhtaaksikirjoitettuja pöytäkirjoja, joilla esiintyy 248 eri ihmistä. Ihmisten välisiä yhteyksiä löytyi kaikkiaan 640. Naisia henkilöistä on 11 %.

Tapauksia käsiteltiin vuoden kuluessa 105, joista 28 liittyi velkoihin. Tämän lisäksi raha- tai nautinta-asioita käsiteltiin perintö-, riita- ja maankäyttö- sekä omistusasioissa. Kunnianloukkaukset olivat yleisempiä kuin fyysinen väkivalta, mutta molempia esiintyi. Oikeudessa käsiteltiin riita- ja rikostapausten lisäksi hallinnollisia asioita.

Todistajia kutsuttiin oikeuden eteen 78 kertaa. He olivat silminnäkijöitä, osallisia, vertaisia tai sukulaisia. Valojen vannominen oli tavallista. Yksi uusi raatimies vannoi valan ryhtyessään tehtävään, kuusi miestä vannoi sitoutuvansa kunnialliseen ja asetustenmukaiseen krouvaamiseen ja 36 miestä vannoi porvarivalan. Takaajana (kautionist) esiintyi 24 eri miestä yhteensä 97 kertaa. Tosin välillä kirjuri on ollut sen verran suurpiirteinen, ettei lähteestä voi selvittää luotettavasti oliko joku vain yhden porvarin vai useamman takaaja.

Tiedän tämän, koska kategorisoin jokaisen ihmisten välisen yhteyden Käkisalmesta yhden vuoden ajalta ryhtyessämme rakentamaan periaatteita havaintomatriisien kokoamiseksi. Aineistoa ei voi tietenkään käydä läpi tällä tavalla kokonaan. Jotta voimme rakentaa tavoiteltuja kysymyksenasetteluja näin suureen aineistoon, on turvauduttava digihumanistisiin menetelmiin. Demon tehtävänä olikin nostaa esiin mahdollisia kompastuskiviä sekä ratkaisuja jatkoa ajatellen.

Varsinaiset oikeustapaukset eivät kuitenkaan ole tarkastelumme polttopisteessä. Meitä kiinnostavat niistä löytyvät vihjeet vallasta, omistuksesta, verkostoista ja segregaatiosta.

Mitä lähdeaineistosta tulee etsiä verkostojen tutkimista varten? Miten kaikki oleellinen tieto löydetään tekstidatasta ja edelleen alkuperäislähteestä lähilukua varten? Miten toimiva matriisi tulisi rakentaa? Mitä jätetään pois ja miten tässä vaiheessa tehdyt valinnat vaikuttavat lopputulokseen? Vastaukset näihin isoihin kysymyksiin sekä uudet tärkeät kysymykset löytyvät huolellisen suunnittelun, mutta joskus myös yrityksen ja erehdyksen kautta. Siksi on ollut hyödyllistä edetä iteratiivisesti ja tehdä ensin pienempiä kokeita.

Cornelis de Manin maalaus Kirjurin muotokuva 1600-luvulta. Sinebrychoffin taidemuseo.
Kirjurin muotokuva. Cornelis de Man, 1600-luku. Kansallisgalleria, Sinebrychoffin taidemuseo.

Perinteinen ja digitaalinen lähdekritiikki

Lähdekritiikki on historiantutkimuksessa perustavanlaatuinen tutkimustyökalu. Tuomiokirjat ovat melko yhtenäinen ja runsas lähde aikakauden Käkisalmesta, mutta tutkija tietää jo työhön ryhtyessään, ettei tätä lähdeainestoa ole tehty hänen tarpeisiinsa eikä se ole neutraali tai kattava kuvaus menneisyydestä. Oikeustapaukset eivät kerro normienmukaisesta rauhallisesta arjesta vaan poikkeuksista tavalliseen. Ne eivät kerro koko tarinaa vaan vain sen, mikä katsottiin oikeuden toiminnan näkökulmasta tarpeelliseksi tai pystyttiin sillä hetkellä selvittämään. Lisäksi raastuvanoikeus ei ollut ainoa käkisalmelaisiin vaikuttava oikeudellinen toimija. Sotilaiden asioita selvitettiin omassa oikeusistuimessa.

Digitaalinen lähdekritiikki punoutuu perinteiseen lähdekritiikkiin datan tuotanto- ja käsittelyketjujen kautta. Miten lähdeaineiston muuttaminen digitaaliseksi, datan valikointi ja järjestäminen digitaalisin menetelmin, kategorisointi sekä visualisointi vaikuttavat siihen, minkälainen kuva menneisyyden kaupunkien valtarakenteista ja kaupallisista kontakteista muodostuu? Tutkijan on huomioitava kaikkien digitoinnin vaiheiden vaikutukset siitä lähtien, kun lähde irrotetaan sen alkuperäisestä olomuodosta esimerkiksi valokuvaamalla. Tämä ei tietenkään vielä ole mitään uutta, sillä tuomiokirjoja on tutkittu mikrofilmeiltä ja tietokoneilta jo kauan.

Etääntyminen alkuperäislähteestä ei tarkoita, että tutkimuksen laatu heikkenisi ketjun pidentyessä. Päinvastoin huolellisesti toteutettuna digitaalisen humanismin menetelmät nostavat esiin kysymyksenasetteluja ja yhteyksiä, jotka jäisivät pimentoon pelkällä perinteisellä lähiluvulla. Mahdolliset virheet saattavat olla jopa paremmin löydettävissä ja korjattavissa tietokoneavusteisesti.

Hyödyllisiä periaatteita

Kristina Zittmanin ja Maria Johansdotterin välinen sanaharkka kunnianloukkauksineen oli vuoden ensimmäinen käsiteltävä oikeustapaus, jota selvitettiin koko tammikuun ajan. Tapauksesta selviävät molempien naisten aviomiehet ja muita sukulaisia sekä tuttavia. Siinä paljastuu myös yhteyksiä porvareihin, jotka eivät liittyneet tapaukseen suoraan. Demot ja aikaisempi tutkimus ovatkin opettaneet, että moniputkaisia ja -ulotteisia verkostoja voi olla vaikeaa sovittaa yksinkertaisiin taulukoihin. Alusta lähtien onkin ollut tarkoitus nojata mikrohistoriaan ja lähilukuun analyysin edetessä.

Matriisiluonnokset ja niiden tarkastelu yhdessä ovat osoittaneet tallentamisen puutteita ja auttaneet kehittämään menetelmää edelleen.

Vaihtelevuus nimien, ammattinimikkeiden ja kotipaikkojen kirjaamisessa on tavallista 1600-luvun aineistoissa ja se on otettava huomioon esimerkiksi hakuja tehdessä. Elisabethista saatettiin käyttää nimitystä Liskin, Catharinasta Kirstin. Raatimies Berend Kaasosen sukunimi voitiin kirjoittaa ainakin seitsemällä eri tavalla. Kaasoin, Casalain, Casa… Paleografisen tuntemuksen lisäksi täytyy hahmottaa HTR-mallin virheprosentti ja tyypillisimmät väärinluvut. Historiantutkija esimerkiksi pystyy erottamaan ij-kirjainyhdistelmän y-kirjaimesta kontekstin avulla, mutta koneella voi olla vaikeuksia ymmärtää, onko raatimiehen sukunimi kirjoitettu Kiika vai Kyka.  

Jotta erilaiset variaatiot voidaan säilyttää mukana, vaikka data systematisoidaan, jokaiselle henkilölle annetaan oma tunnusnumero, jolla toimijoiden henkilödata yhdistetään dynaamisiin tietoihin (yhteyksiin). Myös kaupungeilla, pitäjillä ja muilla maantieteellisillä paikoilla sekä oikeustapauksilla on tunnukset. Tämä vähentää käsityötä sekä päällekkäistä informaatiota matriiseja koottaessa. Kaikkea tietoa ei samasta syystä myöskään koota yhteen tiedostoon vaan dataa voi yhdistellä eri Excel-tiedostoista analyysityökaluissa.

Hakusanoja kaavaillessa alkuperäislähteen tuntemus ovat ensiarvoisen tärkeitä. Esimerkiksi velkatapauksissa ei aina mainita, että kyseessä on velka (skuld, gäld). Joskus vastaaja on yksinkertaisesti velallinen (skyldig), mutta toisinaan on kirjattu vain, että vastaaja maksaa (betala) kantajalle tietyn summan.

Kaikki löydökset kategorisoidaan. Ensi vaiheessa on hyvä sallia kategorisoinnille riittävästi monipuolisuutta, sillä oikeustapaukset eivät useinkaan ole yksinkertaisia. Demoa tehdessä huomio kiinnittyi lähteiden monipuolisuuteen ja siitä johtuvaan teemoittelun haasteisiin. Oikeuskäsittelyn edetessä voi paljastua yllättäviä asioita ja riita-asia saattaa sisältää velka-asian ja kunnianloukkaus vihjeitä henkilöiden välisestä hierarkiasta. Iteratiivisessa prosessissa variaatioita voi kuitenkin systematisoida tai tarkentaa analyysin seuraavassa vaiheessa, jos tarve vaatii.

Seuraavaksi tutkimusryhmä valmistelee kaikista havaintomatriiseihin liittyvistä periaatteista koodikirjan, joka toimii jokaisen yksilöllisen työn perusteena. Kun matriisit on rakennettu samalla tavalla, niitä voidaan tarkastella ristiin ja yhdistää.