Suojärven Pitäjäseuran Paavo Harakan lehtikirjoituskorpus
Tältä sivulta löydät Suojärven Pitäjäseuran kokoaman Paavo Harakan lehtikirjoituskorpuksen pdf-version.
Tekstit on ladattu sivulle pdf-muodossa. Pdf-muotoisen tiedoston voi ladata omalle tietokoneelle tai tulostaa opetus- tai opiskelukäyttöön. Tiedostossa on sisällysluettelo, jonka otsikoita klikkaamalla voi nopeasti siirtyä eri kohtiin tiedostossa. Jokainen kirjoitus alkaa omalta sivultaan, ja kunkin kirjoituksen kohdalla on annettu siihen liittyvä karjala-suomi-sanasto.
Projektipäällikkö Matti Tuomisto kuvaa korpuksen taustoja ja tekoprosessia seuraavanlaisesti:
”Kunnallisneuvos Paavo Harakka on kirjoittanut karjalankielisiä tekstejä moniin eri lehtiin yli kuuden vuosikymmenen ajan. Kun hän ryhtyi kirjoittamaan karjalaksi, ortografista normistoa ei ollut käytettävissä vaan karjalaksi kirjoittavat omaksuivat käytäntöjä toisiltaan. Paavo Harakka on maininnut omiksi esikuvikseen etenkin Paul Tulehmon, Kosti Pamilon ja rovasti Vilho Hokkisen. Kun Karjalan kielen sanakirja (osa 1, murresanakirja, päätoimittaja Pertti Virtaranta) ilmestyi 1968, siitä löytyi paljon tarkentavaa mallia karjalan kielen kirjoittamisen avuksi.
Paavo Harakan tekstit ovat monen luonteisia: hän pystyy iskemään tarinaa ja huumoria eloisalla murteella aidon kansanmiehen tapaan mutta osaa kirjoittaa myös tarkkanäköistä ja painavaa asiaproosaa kulloinkin ajankohtaisista yhteiskunnallisista aiheista. Punaisena lankana kulkee rakkaus karjalan kieleen ja kulttuuriin.
Suojärven Pitäjäseuran hanke Paavo Harakan lehtikirjoitusten tekstikorpus valitsi kohteekseen kaikki Oma Suojärvi -lehdessä vuosina 1994–2009 julkaistut Paavo Harakan pakinat. Korpukseen valitut 60 pakinaa edustavat peruslinjaltaan murrekirjoittamista. Hankkeen tavoitteeksi valittiin Suojärvelle (ja Harakan kohdalla tarkemmin Varpakylälle) tyypillisen karjalan kielen murreasun tarkentaminen, samalla kuitenkin kunnioittaen kirjoittajan omia kirjallisia valintoja.
Tutkijana tekstikorpushankkeessa toimi FT Miikul Pahomov. Paavo Harakan tekstikorpushankkeessa haluttiin testata muokattavien tekstien digitaalista lukemista pohja-aineistoksi. ITC-asiantuntija Seppo Mitrusen toteuttama ORC-skannaus tuotti riittävän hyvän tuloksen, joskin erityisesti karjalankielisen tekstin erikoismerkkien tunnistaminen tuotti ongelmia. Itä-Suomen yliopiston karjalan kielen opiskelija Elena Rapa korjasi skannauksessa syntyneitä virheitä alustavasti ennen koko aineiston siirtämistä tutkija Pahomoville, joka kävi koko aineiston sana sanalta ja lause lauseelta lävitse, tarvittaessa yhteistyössä Paavo Harakan kanssa.”