Kuvaus teknisestä toteutuksesta – Kulkine.net


H:3 Kuvaus teknisestä toteutuksesta

H.3.1 Johdanto

"Tutkimus voi myös olla ns. digitaalinen, jolla tarkoitetaan, että se voi sisältää metatekstirakenteita ja muita multimedian keinoja. Tällöin väitöstilaisuuden yleisöllä tulee olla mahdollisuus tarkastella työn digitaalista toteutusta väitöstilaisuudessa, mutta myös ennen itse väitöstä, esim. etukäteen ilmoitetussa verkko-osoitteessa. Tämän lisäksi tutkimuksesta ja sen teknisestä toteutuksesta tulee olla paperimuotoinen yhteenveto." (Jatko-opiskelijan opas, JY, Humanistinen tiedekunta.)

Kuten edeltävästä sitaatista käy ilmi, sähköiseltä väitöskirjalta, kuten Kulkine.netiltä, edellytetään siis selvitystä teknisestä toteutuksesta. Kyseinen tekninen selvitys eli tämä luku julkaistaan myös verkossa, sillä myös sähköisen version lukija saattaa olla kiinnostunut sähköisen väitöskirjan teknisestä toteutuksesta. Koska sähköisiä tämäntyyppisiä tieteellisiä väitöskirjoja ei juuri ole olemassa Suomessa, tästä katsauksesta voi myös saada vinkkejä tulevien väitöskirjojen toteuttamiseen.

H:3.2 Tausta: Miten sähköisyyteen päädyttiin

Tämän väitöskirjan syntyyn tähtäävä tutkimusprosessi sai alkunsa 2000-luvun puolimaissa pro gradu -tutkielman aloittamisen muodossa. Tuolloin ajatus väitöskirjasta, saati sähköisestä väitöskirjasta, ei kuitenkaan vielä ollut syntynyt. Jos näin olisi ollut, suunnittelu ja toteuttaminen olisi ehkä saattanut olla helpompaa. Loppuvuodesta 2009 lisensiaatintutkielman valmistumisen ollessa varmaa ryhdyimme ohjaajani Jouko Koiviston kanssa käymään keskustelua väitöskirjan tekemisestä; olihan kulkineennimistö uutuutena hyvä väitöskirjatasoisen tutkimuksen kohde. Vastustin aluksi väitöskirjahanketta, koska katsoin jo sanoneeni kulkineennimistöstä sen, mitä olin siitä saanut selville – joka oli jo paljon. Toisaalta olin saanut – ironista kyllä – huonoa palautetta tutkimukseni laajuudesta ja lisensiaatintutkielmani paksuudesta joiltakin tahoilta. Muutamat akateemiset lukijat pitivät teosta raskaana ja toisaalta tyylittömänä, toisaalta taas muutamilta maallikoilta tuli hyvääkin palautetta. Erään kustannusyhtiön kanssa käytiin myös keskusteluja siitä, että kirjoittaisin yleistajuisen kirjan kulkineennimistöstä. Lisensiaatintutkielman julkaiseminen johti myös moniin haastattelupyyntöihin. Monet maallikot olivatkin olleet tutkimuksesta kiinnostuneita koko prosessin ajan.

Lähdin siitä ajatuksesta, että jos väitöskirja on tehtävä, sen on jollakin tavalla oltava merkittävästi parempi kuin lisensiaatintutkielmani. Näkemykseni mukaan tämä parannus ei voinut syntyä sisällön pohjalta, sillä kulkineennimistön keskeiset ilmiöt olivat jo tulleet kuvatuiksi. Väitöskirjalla toteutettavia parannustoiveita oli oikeastaan kaksi: Ensiksikin opinnäytteillä on tapana hautautua yliopiston hyllyihin, mikä ei ollut hyvä, sillä aihe todella kiinnosti kansaa monia akateemisia tutkielmia enemmän. Erityisen kiinnostuneita maallikot olivat tietysti yksittäisistä nimistä ja niihin liittyvistä tarinoista ja etymologioista, mutta toki eri merkkien ja mallien saamat nimet kiinnostivat laajemminkin. Toiseksi taas tutkielman raskautta valitelleet akateemiset lukijat eivät olleet kiinnostuneita yksittäisistä nimistä, vaan halusivat teoreettisempaa otetta, kapeampaa aineistoa, vähemmän tutkittavia asioita ja vähemmän yksityiskohtia. Ymmmärrettävästi nämä kaksi sinänsä mielekästä toivetta olivat keskenään pahasti ristiriidassa. Lisäksi olin itsekin runsaiden yksityiskohtien säilyttämisen kannalla, sillä kulkineennimistöstä ei ollut juuri olemassa yksityiskohtaistakaan tietoa eikä arkistoituja valmiita aineistokokoelmia. Näkemykseni mukaan esimerkiksi paikannimiä on tutkittu Suomessa jo siinä määrin, että linjakkaan ja yleisellä tasolla etenevän paikannimiaiheisen tutkimuksen tekeminen on mahdollista: Paikannimiä on tutkittu toistasataa vuotta. Paikannimitutkimukset ovat yleisesti kohtalaisen tunnettuja ja käsitteistö vakiintunutta. Yleiskuva paikannimistä on jo syntynyt tutkimuksessa. Kotuksen hallussa on laajat paljon käytetyt aineskokoelmat. Kulkineennimistön tila ei kuitenkaan ollut lainkaan sama.

Näistä lähtökohdista päädyin siihen, että sähköinen muoto hyperteksteineen oli ainoa mahdollinen tapa toteuttaa sellainen väitöskirja, jota pystyisi lukemaan sekä tiiviisti että yksityiskohdat säilyttäen. Sähköinen muoto siis mahdollistaa perinteistä kirjamuotoa paremmin erilaiset lukutavat. Koska päädyin siihen, että itse tietokanta sen sisältämine nimineen ja analyyseineen on tosiasiassa maallikoita ja tieteilijöitäkin kovasti kiinnostavaa materiaalia, päädyin suunnittelemaan tämän tutkielman sellaiseksi, että tutkimusaineisto on osa sitä ja että tutkimusaineisto on avoimesti käytettävissä hakutoimintojen kautta. Näin koko tutkimusaineisto ja sen analyysit ovat käytettävissä, mutta samaan aikaan ne eivät kuormita juoksevaa tekstiä. Toinen olennainen parannus on se, että nyt tämä maallikkoja kiinnostavasta aiheesta tehty väitöskirja on verkossa kenen tahansa saatavissa ja selattavissa. Kolmas asia on tutkimuksen jäsentelyn kehittäminen sähköistämällä. Lisensiaatintutkimukseni tutkimusasetelma ei nimittäin ollut sen kaltainen, kuin mitä akateemisilta jatko-opinnäytteiltä tänä päivänä odotetaan: ei ollut selvää valmista taustateoriaa, ei selvästi rajattua kompaktia ja homogeenista tutkimusaineistoa eikä pientä joukkoa ennalta-arvattavia tuloksia. Olisin toki voinut rajata tutkimukseni tiukemmin eli tutkia vain osaa kulkineennimistä ja käyttää jotain pinnalla olevaa teoriaa ja menetelmää: olisin voinut vaikkapa tutkia kulkineitten merkkinimien ilmenemistä autolehtien diskursseissa Tuulilasi-lehden vuosikerran 2010 perusteella. Olin kuitenkin sitä mieltä (ja olen edelleen), että kulkineennimistö ansaitsi yleisesityksen, jossa kulkineennimistöä katsotaan useista eri näkökulmista. Tällaisen yleisesityksen rakentaminen tuntui kuitenkin kirjoittamisen ja jäsentelyn kannalta hankalalta, sillä lopulta kaikki tuntui liittyvän kaikkeen ja toisaalta kulkineennimistöllä oli yhtymäkohtia moniin eri asioihin kielessä ja kulttuurissa. Lopullisen oivalluksen syntymisestä minulla on kiittäminen akateemista puheviestintää ja kirjoittamista Åbo Akademissa opettanutta lehtori Sonja Vidjeskogia, joka totesi luennollaan: "Tanken är hierarkisk, men texten är linearisk." Ymmärsin, että jäsentelyongelmani olivat loppujen lopulta seurausta siitä, että monihaaraista kokonaisuutta (tai verkkomaista todellisuutta) ei voinut pakottaa alusta loppuun juoksevaksi tekstiksi eikä se välttämättä ollut tarkoituksenmukaistakaan. Käsitin, että tutkimuksen osien tai osatutkimusten suhde ja erinäiset yhteydet eri suuntiin olivat parhaiten esitettävissä nimenomaan hyperlinkkien avulla. Olimme ohjaajani kanssa yhtä mieltä siitä, että ratkaisu olisi hyvä. Kun vielä Suomen kulttuurirahaston Hämeen rahasto myönsi minulle kokovuotisen apurahan, edellytykset sähköisen väitöskirjan luomiseksi olivat syntyneet. Ilman Fennosol Oy:n panosta työ ei olisi kuitenkaan vieläkään valmis.

H:3.3 Kulkine.netin perusainekset

Kulkine.net on puolidynaaminen verkkosivusto, jonka taustalla on MySQL-tietokanta. Sivusto on sijoitettu yliopiston palvelimen sijasta Webholder.fi-verkkohotelliin, joka oli edullisesti ja helposti saatavilla ja joka mahdollistaa sivuston edelleen kehittämisen myös opinto-oikeuden päättymisen jälkeen. Kulkine.net-sivuston tekstiosuus koostuu hiukan yli 150 yksittäisestä sivusta, jotka sisältävät valtaosin html-merkkauksen perusteella jäsentyvää tekstiä. Sivuston ulkoasu on muotoiltu css-kielellä. Mitään valmista julkaisujärjestelmää ei ole käytetty, millä on pyritty lähinnä vapauteen tehdä kaikenlaisia ratkaisuja eteen tulevien tilanteiden niin vaatiessa. Esikuvia tai valmiita ratkaisuja sähköiselle väitöskirjalle ei nimittäin juuri ollut. Tietokantaan on tallennettu koko aineiston epäviralliset kulkineennimet sekä näihin nimiin liittyvää tietoa, ja verkkosivusto noutaa tarpeen mukaan tietokannasta tietoa verkkosivuston osaksi (vaikkapa tietyt ehdot täyttävien esimerkkinimien listan). Lisäksi sivuston käyttäjällä on mahdollisuus tehdä hakuja tietokannasta seitsemällä erilaisella hakulomakkeella, joista kaksi on perushaun alla ja viisi tieteellisen haun alla.

Tietokantaan on tallennettu myös kuvia ja ääninäytteitä, jotka selventävät nimeämisperusteita. Suuren osan kuvista on ottanut valokuvaaja ja kuvankäsittelijä Jarkko Heikkinen, joka on myös poiminut kuvamateriaalia muista lähteistä annettujen ohjeiden mukaisesti. Heikkinen on myös hoitanut kaikki kuvankäsittelytyöt (mm. metaforia havainnollistavat "vertauskuvat"). Huomattava osa kuvista on kuvattu Automuseo Mobilian varastotiloissa Kangasalla, ja olemme myös saaneet käyttää heidän sähköistä kuvapankkiaan. Lisäksi kuvia on otettu Kovelan traktorimuseossa Nummi-Pusulassa, kaduilla Tampereella ja Oulussa sekä poimittu internetistä. Kuvien lähteet ilmenevät lähdeluettelon kohdasta Nimianalyyseja täydentävien kuvanäytteiden lähteet. Suurimman osan ääninäytteistä taas on kiertänyt nauhoittamassa pitkin Etelä-Suomea Karri Koistinen. Muutamia ääniä on kuitenkin poimittu myös verkosta, ks. lähdeluettelon kohtaa Nimianalyyseja täydentävien ääninäytteiden lähteet. Täydentävä kuvien ja äänien poimiminen verkosta on ollut välttämätöntä, sillä kaikkien kulkineitten tavoittaminen itse kuvattavaksi ja äänitettäväksi ei olisi ollut mitenkään mahdollista. Koska väitöskirjalta edellytetään tiettyä pysyvyyttä, kuvat on tullut tallentaa tietokantaan sen sijasta, että niihin olisi viitattu sivuston ulkopuolelle johtavin linkein. Verkossa olevalle aineistolle on tyypillistä vaihtuvuus ja näin ollen linkit olisivat todennäköisesti muutamien vuosien kuluessa vanhentuneet. Kaikki sivustolla olevat havainnepiirrokset on sitä vastoin piirtänyt tutkija itse (suunnistus)karttojen valmistukseen tarkoitetulla OCAD-ohjelmalla, lis. nro 2662.

Tiedon säilyttämiseen tarkoitetun tietokannan ja tiedon esittämiseen tarkoitetun verkkosivuston yhdistäminen on ollut erittäin hyvä ratkaisu sekä tutkimuksenteon prosessin että tutkimusaiheen ja sivuston myöhemmän kehittämisen kannalta. Näin tutkimustieto on helposti saavutettavissa: verkkosivujen selaaminen lienee useimmille tutumpaa kuin hakukyselyjen teko tietokantaohjelmissa. Toisaalta taas tietokannan ja sivuston välinen riippuvuussuhde mahdollistaa sen, että tietokantaan voidaan lisätä myöhemmin uusia nimiä, jolloin sivustolla olevat numerotiedot vastaavasti muuttuvat automaattisesti. Näin tietokannan ja sivuston rakennetta muuttamatta voidaan varautua siihen lisäaineistoon, jota sivuston julkistamisen myötä väistämättä alkaa kertyä. Tulevaisuudessa Kulkine.net-sivustosta tuleekin olemaan kaksi versiota: jäädytetty virallinen väitöskirjaversio ja kehittyvä Kulkine.net, joka toimii kulkineennimistä kiinnostuneitten kohtauspaikkana. Lisäksi sivustoa on helppo täydentää: esimerkiksi maallikoille sopiva "lyhennetty laitos" ilman liikaa kielitiedettä on helppo rakentaa samaa tietokantaa ja samoja tilastoaineistoja käyttäen.

H:3.4 Tietokanta

Suunnittelu ja rakentaminen

Kuten luvussa A:2.4 todettiin, alkuperäinen tutkimusaineisto oli keruuvaiheessa vihkoissa ja tekstitiedostoissa, sitten analysoituna Excel-taulukoissa. Tämä ei tietenkään mahdollistanut kovinkaan monimutkaista tilastollista analyysiä. Kun vielä tutkimusraportin muodoksi valikoitui edellä kuvatulla tavalla sähköisyys, tuli ilmeiseksi, että "oikea" tietokanta olisi tehtävä. Kaikissa tietokantaan liittyvissä asioissa (ja muissakin teknisissä asioissa) tukenani on ollut Fennosol Oy:n toimitusjohtaja TkT Otso Kassinen. Yhteistyössä hänen kanssaan kielitieteelliset monimutkaiset ilmiöt ovat selkiytyneet tietokannan rakenteeksi. Sujuvasta ongelmanratkaisusta on kiittäminen erityisesti Kassisen kykyä viestiä hankalistakin teknisistä asioista yksinkertaisesti: tekniikka on hänelle vain väline, ei itsetarkoitus.

Tietokanta toteutettiin palvelimella olevana MySQL-tietokantana, jossa käytettiin InnoDB-tietokantamoottoria (storage engine). InnoDB valittiin MyISAM-tietokantamoottorin sijasta, koska InnoDB-moottorissa on mm. tuki tietokantataulujen välisten suhteiden oikeellisuuden varmistamiseen (foreign keys, data integrity). Tietokannan taulurakenne suunniteltiin yhteistyöpalaverissa siten, että tutkija toi esille, mitä kaikkea tutkittavaa ja tallennettavaa nimiin liittyy ja konsultti kysyi tarkentavia kysymyksiä. Tietokantasuunnittelussa on pyritty kautta linjan johdonmukaisesti välttämään redundanssia. Rakenteen suunnittelussa huomioitiin jo valmiiksi myös se, minkätyyppisiä kyselyitä tietokannasta tultaisiin tekemään. Perusrakenteen selvittyä konsultti ryhtyi luomaan tietokantaa tutkijan samanaikaisesti luodessa selkokielisiä listoja siitä, mitkä arvot eri taulujen eri sarakkeissa olisivat mahdollisia (esimerkiksi nimen viittaustaso saattoi olla "laji", "alalaji", "merkki", "malli" tai "yksilö"). Kaikissa näissä nimeämisissä pyrittiin johdonmukaisesti kutsumaan asioita mahdollisimman tarkoin niiden oikeilla nimillä, mikä paitsi helpotti muistamista ohjelmointityössä myös palveli nimien syöttämistä tietokantaan. Loogiset nimet auttavat myös nimien hakukyselyiden kirjoittamista. Esimerkiksi nimeämisperustetta kutsutaan tietokannassa yksinkertaisesti nimellä "nimeamisperuste".

Tietokantarakenteessa oli kaksi erityisen pohdinnan aihetta. Ensimmäinen näistä oli nimen ja nimenosan ominaisuudet. Nimen ja nimenosan käsittelystä ongelmallista teki se, että osa nimen ominaisuuksiksi äkkiseltään miellettävistä asioista oli tosiasiassa nimenosan ominaisuuksia (mm. primääriys/sekundääriys, muodostusmenetelmät, nimeämisperuste), osa taas aidosti kokonaiseen nimeen liittyviä asioita (esimerkiksi tarkoitteen merkki ja malli). Yksiosaisen nimen kohdalla tällä ei olisi ollutkaan merkitystä, mutta kaksiosaisen nimen kohdalla kyllä. Nimet ja nimenosat yhdistettiin toisiinsa tietokannassa siten, että nimenosa-tauluun tallennettiin tieto, mihin nimeen kukin nimenosa liittyy ja missä kohdassa nimeä se sijaitsee (alku, loppu, koko). Useimmiten hakutilanteissa kuitenkin tarvittiin tietoa kokonaisesta nimestä, jonka jollakin nimenosalla jokin kysytty ominaisuus oli. Niinpä hakuja vastaavat tietokantakyselyt kohdistuvat usein nimenosien ominaisuuksiin.

Toinen pohdinnan aihe oli se, miten rakentaa nimeämisperusteiden luokittelua ja toisaalta sekundäärinimissä käytettyjä muodostuskeinoja vastaavat hierarkkiset rakenteet. Esimerkiksi nimeämisperuste "koko ja muoto" sisältää alapuolellaan erilaisia alaluokkia, esimerkiksi "pyöreämuotoisuus". Pyöreämuotoisuuden alla taas on omat alaluokkansa, kuten "kirppu", "kupla" ja "lahna". Kaikki nimenosat, joiden nimeämisperuste on "lahna"(maisuus) ovat tietysti samanaikaisesti myös pyöreämuotoisuutta ilmentäviä ja kuvaavat kokoa ja/tai muotoa. Hierarkkisen datan tallennusmenetelmäksi valittiin adjacency list model -tietorakenne muunnoksena, jossa hierarkian jokainen taso on eriytetty omaan tauluunsa. Muita toteutusvaihtoehtoja olisivat olleet nested set model ja closure tables. Valittu tekniikka oli yksinkertaisin toteuttaa ja se oli mahdollinen, sillä hierarkioiden maksimisyvyydet olivat ennalta tiedossa ja tietokantaan tallennetut käsitteiden väliset hierarkiat (esimerkiksi nimeämisperusteiden väliset suhteet) ovat käytännössä muuttumattomia, joten adjacency list model -toteutustavan mahdollisesti aiheuttama monimutkaisten muutoskyselyjen tarve vältettiin. Jos tietokannan olisi tarvinnut tukea mielivaltaisen syvyisiä hierarkioita tai usein muuttuvaa hierarkiarakennetta, olisivat hienostuneemmat toteutusmallit olleet välttämättömiä. Nyt käytetyssä hierarkkisen datan tallennusmenetelmässä (adjacency list model) tietoalkioihin on yhdistetty tieto hierarkiassa välittömästi niiden yläpuolella olevasta jäsenestä. Tilanteessa, jossa halutaan saada tietoa tietyn yläportaan alla olevista hierarkiatasoista, tasot täytyy selvittää kyselyillä, jotka hakevat alempien hierarkiatasojen tauluista halutun yläportaan tunnisteella varustetut rivit. Tällaiset moniportaiset rakenteet muodostettiin nimeämisperusteille, msd-analyysille (harhalekseemien ryhmittely) ja sd-analyysille (käytetyt muodostuskeinot, esim. ellipsi, muottiin valaminen).

Taulujen liitoksia (join) kyselyissä käyttäen nimenosat yhdistettiin nimiin, tarkoitteet nimiin, informantit nimiin, nimeämisperusteet nimenosiin, msd-analyysit nimenosiin, sd-analyysit nimenosiin ja niin edelleen. Kaiken kaikkian tietokanta tuli sisältämään yhteensä 21 sql-taulua, joissa on useita sarakkeita ja satoja tai tuhansia rivejä tietoa.

Tiedon syöttäminen tietokantaan

Tieto syötettiin tietokantaan tähän tarkoitukseen erityisesti valmistetulla sähköisellä lomakkeella. Lomakkeen html-rakenteen toteutti pääasiassa tutkija itse konsultin hoitaessa php-ohjelmoinnin, jolla lomake tarkisti tietokantaan syötettävän datan muodollisen oikeellisuuden ja tallensi sen oikeisiin paikkoihin. Tarkoituksenmukainen lomake helpotti syöttämistä huomattavasti. Lomake näytti tältä:


Vanhan (lisensiaatintutkielmavaiheen) tutkimusaineiston syöttämiseen tietokantaan osallistui tutkimusavustajana myös Sini Aartomaa. Yhteensä tämä vaihe vei noin 25 miestyöpäivää, kun syöttämisen yhteydessä nimien etymologioita tarkistettiin ja nimien taustoja paremmin avaavaa tekstiä lisättiin ikäänkuin sanakirja-artikkeliksi monien nimien yhteyteen. Tällä pyrittiin palvelemaan erityisesti maallikkolukijoita.

Kun keväällä 2012 verkkolomakkeella kerätyn lisäaineiston analysoinnin ja tietokantaan siirtämisen aika tuli, syöttölomaketta muokattiin. Mainittu keväinen lisäaineisto ja muuta lisäaineistoa oli väliaikaisesti tallennettuna pienessä erillisessä aineistotietokannassa kesän 2012 yli. Uusittu lomake haki yhden tietueen pienestä aineistotietokannasta lomakkeelle, lomakkeella tietoja muokattiin ja tämän jälkeen tietue tallennettiin lomakkeelta edelleen isoon koko aineiston käsittävään tietokantaan.

Lisäksi viimeisessä vaiheessa nimeämisperuste-analyysejä tukevat kuvat ja nimet siirrettiin tietokantaan tähän tarkoitukseen valmistetulla syöttölomakkeella, jossa linkki kuvaan yhdistetään aina sellaiseen nimeen, joka selvennykseen kuvaa kaipaa, ja vastaavasti on toimittu ääninäytteiden kanssa.

H:3.5 Sivuston näkökulma

Sivuston rakenne ja rakentaminen

Kulkine.net-sivuston tekstiosuus rakentuu siis hiukan yli 150 yksittäisestä sivusta, jotka sisältävät valtaosin html-merkkauksen perusteella jäsentyvää tekstiä. Olen parhaani mukaan yrittänyt noudattaa web-tekniikoiden käytössä hyviä käytänteitä, missä ohjenuoranani ovat toimineet Jukka K. Korpelan kirjoittamat oppaat ja html- ja php-standardien sivustot. Erityisesti olemme panostaneet nimeämiskäytäntöön, joka ilmenee sekä php:n sisällä muuttujanimissä ja funktioitten nimissä sekä html-merkkauksessa eri ilmiöiden nimissä. Sivuilla olevat valikot ja ylä- ja alapalkit on kytketty kuhunkin sivuun include-komennoin, jotta niitä voidaan muuttaa siten, että mahdolliset muutokset näkyvät kaikilla kyseistä sivunosaa käyttävillä sivuilla. Kaikille sivuille yhteisiin tietoihin kuuluvat myös käytettävien aputiedostojen linkitykset (mm. css ja js) ja yhdistäminen tietokantaan. Kaikkien yksittäisten sivujen tiedostonimet ovat muotoa osio-luku-alaluku, esimerkiksi A52.php viittaa osion A sisälle kuuluvan viidennen luvun toiseen alalukuun. Näin erilliset sivut järjestäytyvät tiedostokansioissa aakkos- ja numerojärjestykseen, mikä vastaa myös sivujen järjestystä tutkielmassa. Sivut on kirjoitettu avoimen lähdekoodin gedit- ja Notepad++-tekstieditoreilla, jotka on erityisesti suunniteltu koodaamiseen.

Vironkielisille nimille on tehty erikoinen ratkaisu. Vironkielisten nimien poistoa tutkimuksestani on toivottu sen keventämiseksi. Koska vironkieliset nimet ovat kuitenkin jo analysoituja ja siinä mielessä tutkittuja, niitä ei ole ollut mielekästä jättää kokonaan poiskaan. Ongelma on ratkaistu siten, että käyttäjä voi itse valita, onko hän kiinnostunut vironkielisistä nimistä vai ei. Mikäli käyttäjä ei halua nähdä virolaisia nimiä, sivusto käyttää toista tietokantaa, josta vironkieliset nimet puuttuvat. Näin vironkieliset nimet katoavat tilastoista ja nimilaatikoista. Samalla vironkielisiä nimiä käsittelevä teksti (päätäntöä lukuun ottamatta) katoaa html-merkkaukseen tehdyn class-merkinnän avulla.

Tietokantakyselyt ja tietokannan käyttö osana sivustoa

Sivusto käyttää siis tietokantaa useisiin eri tarkoituksiin. Tietokannan perusteella sivustolle generoituu yksittäisiä numerotietoja, taulukoita, kuutisenkymmentä nimilaatikkoa ja niin ikään kuutisenkymmentä erilaista graafia. Pelkästään graafien tuottamiseen tarvitaan lähemmäs sata erilaista sql-kyselyä ja yhteensä sivusto käyttää noin kahtasataa sql-kyselyä tietokannan datan yhdistämiseen näille sivuille. Osa MySQL-kyselyistä on varsin yksinkertaisia, osa taas monimutkaisia, lyhyestikin kirjoitettuna puolen sivun pituisia. Kyselyjen monipolvisuus on väistämätöntä seurausta siitä, että monia tauluja joudutaan yhdistelemään kyselyissä. Kyselyt ovat vaatineet paljon suunnittelua ja testausta, mikä on sujunut hyvässä yhteistyössä Fennosol Oy:n kanssa. Muodollisesti aivan virheetönkin kysely voi nimittäin noutaa vääränlaista dataa tai vain osan halutusta datasta. Kyselyiden virheettömyyden arvioinnissa lisensiaatintutkielman tutkimustulokset ovatkin olleet avuksi.

Kyselyitä käyttävät graafit on toteutettu JpGraph-nimisellä php-kirjastolla. Erilaisia tietokannasta generoituvia graafeja, lähinnä pylväiköitä ja piirakoita, on sivustolla yli 60. Kuten jo aiemmin perusteltu, graafien generoituminen tietokannan perusteella on siksi merkittävää, että tietokantaa voidaan jälkeenpäin täydentää ja korjata niin, että tutkimustulokset päivittyvät tällöin automaattisesti. Graafit nimittäin generoidaan tietokannan sisältämän datan pohjalta aina kunkin sivulatauksen yhteydessä.

Esimerkkinimiä tuottavat nimilaatikot perustuvat Fennosol Oy:n Kassisen toteuttamaan php-funktioon, joka muotoilee halutun sql-kyselyn noutaman datan esimerkkilaatikon muotoon. Kussakin nimilaatikossa on sellaiset nimet, joissa jokin nimenosa täyttää halutun hakuehdon. Hakuehdon täyttävä nimenosa lihavoidaan. Nimen lisäksi nimilaatikkoon tuodaan tieto nimen tarkoitteesta sekä tarvittaessa nimianalyysiä täsmentävä sanakirja-artikkelimainen tieto tietokannasta sekä linkki mahdollisiin kuva- tai ääninäytteisiin.

Tietokannasta generoituvaa numerotietoa käytetään myös erilaisissa sivustolla esitettävissä taulukoissa sekä yksittäisissäkin numerotiedoissa. Kun siis esimerkiksi lukujen lopuissa on kokoavia numerotietoja luvussa esiintyvistä nimimääristä tai jonkin ominaisuuden yleisyydestä prosentteina, myös nämä syntyvät tietokannan pohjalta. Näin numerotietoja ei joudu muuttamaan erikseen tietokannassa olevan aineiston kasvaessa.

Keskeisin tietokannan käyttömuoto ovat kuitenkin hakutoiminnot, joihin on linkit Kulkine.net-pääsivun ylälaidassa. Sivuston käyttäjä voi valita perushaun ja tieteellisen haun välillä; nämä hakutoiminnot on suunnattu siis maallikkokäyttäjälle ja kielitieteelliselle käyttäjälle. Perushaussa käyttäjä voi hakea tietokannasta joko virallisella (Toyota) tai epävirallisella nimellä (Tyrätäristin). Lisävalintana käyttäjä voi perushaussa valita tarkoitteen lajin. Näin maallikkokäyttäjä voi hakea esimerkiksi traktoreitten nimiä tai vaikkapa Ford-merkkisten kuorma-autojen nimiä. Tieteellisessä haussa lähtökohtana ovat toisenlaisen käyttäjän tarpeet. Käyttäjän tulee valita viidestä hakulomakkeesta se, joka sopii hänen tarpeisiinsa parhaiten. Ensimmäisellä hakulomakkeella haetaan nimiä nimeämisperusteen perusteella, toisella msd-osan sisältäviä nimiä jonkin ominaisuuden perusteella ja kolmannella sd-osan sisältäviä nimiä jonkin ominaisuuden (esim. ellipsi) perusteella. Neljäs hakulomake kohdistuu vain msd-nimiin, joilla on nimeämisperuste, ja viides hakulomake taas nimiin, jotka ovat msd- ja sd-nimien rajatapauksia. Lisäksi käyttäjä voi valita nimen viittaustason (esim. yksilönnimi) ja tarkoitteen lajin (esim. traktori) sekä rajata haun nimiin, joista löytyy tietty merkkijono. Sekundäärinimistä käyttäjä voi myös valita, haluaako hän vain virallisesta nimestä muodostettuja "ensimmäisen polven epävirallisia nimiä" vai epävirallisten nimien edelleenkehitelmiä eli "toisen polven epävirallisia nimiä".

Verkkokirjoittamisen ja väitöskirjakirjoittamisen yhdistämisestä

Joissakin suhteissa väitöskirjan ihanteet ja verkkoon kirjoittamisen ihanteet ovat ristiriidassa. Enimmäkseen tavoitteet ovat kuitenkin samankaltaiset. Molemmat edellyttävät kirjoittamiselta selkeyttä, ytimekkyyttä, tekstin hyvää jäsentelyä ja sujuvaa otsikointia. Verkkotekstien ajatellaan usein olevan vain lyhyitä uutisia, ohjeita ja opetusmateriaaleja, ja näytöltä lukemista pidetään yleisesti vaivalloisempana kuin paperilta lukemista. Vastaavasti verkkotekstin ihanteina pidetään äärimmilleen vietyä lyhyyttä, myyvyyttä ja ytimekkyyttä. Samanaikaisesti tieteellistä tekstiä julkaistaan yhä enemmän kirjaa jäljittelevässä pdf-muodossa, mitä pidetään oikeastaan jo tiedeyhteisössä vallitsevana sosiaalisena normina. Kun sekä html-pohjaisia verkkosivuja että pdf-tiedostoja käytännössä luetaan ruudulta tai tarvittaessa tulostetaan, on pdf-tiedostojen nimeen vannominen oikeastaan hullutusta. Html-pohjainen verkkosivusto kun mahdollistaa pdf-tiedostoa paremmin monet tässä tutkielmassa käytetyt tekniset ratkaisut (hyperlinkit, tietokannasta generoituva tieto ym.). Verkkolukemisen haasteet ovat varmasti osittain todellisia. Pitää kuitenkin tiedostaa, että lukeminen helpottuu koko ajan näyttöjen laadun parantuessa. Samoin myös verkkolukutaito kehittyy. Se, etteivät ihmiset osaa lukea pitempiä ja analyyttisiä tekstejä verkosta, ei välttämättä tarkoita, että he lukisivat niitä muualtakaan. Vastaavasti he eivät myöskään voi oppia lukemaan niitä verkosta, jos niitä ei siellä ole. Lisäksi tulee muistaa, että vaikka väitöskirjat ovat analyyttistä pohdintaa sisältäviä kokonaisuuksia, niitä myös usein käytetään selailtavina hakuteoksina. Väitöskirjan käyttäjä ei välttämättä lue väitöskirjaa kannesta kanteen, vaan etsii sieltä vain haluamansa tiedon. Selaimella yksittäisenkin sanan löytäminen tekstistä onnistuu kätevämmin kuin painetun kirjan sivulta.

Olen siis tasapainoillut väitöskirjaformaatin perinteiden ja toisaalta omien näkemysteni välillä. Verkkokirjoittamisen ihanteiden mukaisesti käyttämäni kappaleet ovat lyhyempiä kuin tieteellisessä tekstissä yleensä ja vastaavasti numeroimattomia väliotsikoita on enemmän. Lisäksi tutkielman rakennetta on pyritty selventämään piirroksin ja valikko toki muistuttaa perusrakenteesta joka hetki. Metatekstiä tuskin voi olla liikaa. Asioitten välisiä yhteyksiä olen pyrkinyt osoittamaan hyperlinkein. Lisäksi olen joissakin kohdissa jopa kopioinut omaa tekstiä toisesta kohdasta väitöskirjaa, silloin, kun sama asia on esimerkiksi kuulunut yhtä vahvasti kahteen eri osioon. Tällainen kopioteksti on muotoiltu harmaaksi ja hiukan leipätekstiä pienemmäksi. Ratkaisulla on saavutettu se etu, että jos alkuperäistä tekstiä jostain syystä tarvitsee muuttaa, myös kopioteksti muuttuu automaattisesti. Toisinaan tekstin etenevyyttä on taas autettu erottamalla tekstistä "jatustelevia" eli kehitteleviä osioita ja merkitsemällä nämä toissijaisesti luettavaksi asiaksi kirjasinlajia pienentämällä.

Väitöskirjan perinteistä on säilytetty lukujen numerointi. Lisäksi jokaisen yksittäisen sivun lopussa on linkki seuraavaan sivuun, jolloin teksti on luettavissa myös perinteisen kirjan tapaan alusta loppuun. Lähdeviitteitä on käytetty tieteelliselle tekstille ominaiseen tapaan, mutta jokaisen lähdeviitteen yhteyteen on kirjoitettu hyperlinkki, joka johtaa lähdeluetteloon kyseisen teoksen kohdalle. Näin lukija voi yhdellä klikkauksella tarkistaa, mistä teoksesta lähdeviitteessä on kysymys. Lisäksi muutamiin sähköisiin lähteisiin osoittavat linkit on laitettu osoittamaan suoraan kyseiseen lähteeseen lähdeluettelomerkinnän sijaan. Kun lähteittenkin sähköisyys ajan oloon lisääntyy, tästä voi tulla vallitsevakin tapa. Näin lukija voisi halutessaan tarkastaa viitteet suoraan aidosta lähteestä.

Sivuston ulkoasu

Sivuston ulkoasu on pyritty pitämään yksinkertaisena ja asiallisena, mutta kuitenkin miellyttävänä. Sivustolla on käytetty päätteetöntä kirjasintyyppiä, jollaista pidetään näytöltä lukiessa helppolukuisena. Erilaiset vihreät, keltaiset ja harmaat sävyt tulivat käyttöön oikeastaan sattuman kautta, sillä ne kuuluvat suunnistuskartan väreihin, ja ensimmäiset havainnollistavat OCAD-piirrokset piirrettiin juuri suunnistuskartan väriskaalalla. Sivuston visuaaliseen ilmeeseen on vaikuttanut myös Sanna Keronen. Sivuston ulkoasun eräänlaisena esikuvana erityisesti kaksiosaisen valikkorakenteen suhteen on toiminut Ison suomen kieliopin verkkoversio VISK. Kulkine.netissä käytetty vasemman laidan dynaaminen valikko (collapsing menu) on kuitenkin sikäli edistyksellisempi, että se osaa myös sulkea tarpeettomia alavalikkoja eikä vain avata aktiiviseksi uusia valikkoja VISKin valikon tapaan. Javascript-pohjaisessa monitasoisessa valikossa on siis alitasojen näyttämisen tai piilottamisen mahdollistava rakenne. Valikko käyttää suosittua avoimen lähdekoodin jQuery-kirjastoa.


Janne Seppälän väitöskirja Kulkine.net → tutkimus epävirallisista kulkineennimistä päättyy tähän. Voit halutessasi palata etusivulle.