Tag Archives: tietojenkäsittelytiede

Ihmiset ovat laiskoja – internetissäkin

Noin vuosi sitten aloimme muutaman kollegani kanssa tutkia ihmisten käyttäytymistä Stack Exchange (SE) -verkoston sivustoilla. SE on eräänlainen asiantuntijamarkkina, jossa käyttäjät voivat kysyä kysymyksiä, joihin toiset käyttäjät vastaavat. Parhaita vastauksia antaneet käyttäjät saavat mainetta ja laajempia käyttöoikeuksia. Kaikki SE-verkoston keskustelut ovat avointa dataa, joten käyttäjien välisiä vuorovaikutuksia on helppo tutkia.

Kaikilla sivustoilla on erotettavissa aktiivinen ydinkäyttäjien ryhmä. Nämä käyttäjät vastaavat suurimpaan osaan kysymyksistä ja kommentoivat myös ahkerasti toistensa vastauksia. Alkuperäinen tutkimusajatuksemme oli kehittää menetelmä, joka ennustaisi ydinkäyttäjien määrän muutoksia ajan funktiona. Pian kävi kuitenkin ilmi, ettei ydinkäyttäjien määrää varsinaisesti tarvitse ennustaa, sillä se pysyi vakiona, noin 10–15 prosentissa kaikista käyttäjistä, kaikilla tutkituilla sivustoilla. Tämä siis riippumatta sivuston suosiosta yleisesti tai käyttäjien määrän vaihtelusta sivuston sisällä. Ainoastaan vasta avatuilla sivustoilla nähdään suurempi osuus ydinkäyttäjiä, mutta sekin laskee nopeasti muutaman kuukauden kuluessa sivuston avaamisesta.

Näyttää siis vahvasti siltä, että “Pareton lakina” tunnettu havainto – pieni osa ihmisistä vastaa suurimmasta osasta tuloksia – pätee myös internetin asiantuntijamarkkinoilla. Vaikka tulos lopulta olikin aivan toinen kuin aluksi oletimme, oli yllättävää, kuinka muuttumattomana ydinkäyttäjien osuus pysyy. Analysoimamme datan suuri määrä vahvistaa havaintoa. SE:n lisäksi tutkimme muitakin vastaavia sivustoja, yhteensä noin 6 500 foorumia. Vielä vuosikymmen sitten näin suurten datojen kerääminen tai analysointi olisi ollut mahdotonta.

Tutkimusartikkeli Metzler, Günnemann & Miettinen: Stability and dynamics of communities on online question–answer sites. Soc. Networks 58 (2019) on luettavissa verkossa osoitteessa https://doi.org/10.1016/j.socnet.2018.12.004

Pauli Miettinen

Datatieteen professori

Tietojenkäsittelytieteen laitos